A lo largo de los años mucha gente ha tenido problemas para deletrear mi nombre. Cuando era más joven asumí que no habían escuchado el nombre «Colin». Era bastante inusual donde yo vivía. En los últimos veinte años el nombre se ha hecho más popular, pero los problemas de ortografía no han mejorado. Resulta que hoy en día hay otro problema: una ortografía alternativa. ¿Podría ser «Collin» realmente tan común como «Colin»? No me lo creía.

Por suerte, la Administración de la Seguridad Social lleva un registro de los nombres de pila por fecha de nacimiento y pone estos datos a disposición del público, así que pude responder a esa pregunta.

Resultó que «Collin» experimentó un espectacular salto de popularidad en torno al cambio de siglo, eclipsando momentáneamente al (correcto, por supuesto) «Colin».

El gráfico muestra la popularidad relativa de «Colin» frente a «Collin» para las personas nacidas desde 1940. En 1940, alrededor del 85% de los dos nombres utilizaban una sola «l», lo que persistió hasta finales de los años setenta; la variante con dos «l» despegó rápidamente y superó brevemente a la versión con una sola «l» alrededor de 1999, antes de descender desde entonces.

Muestra el cambio desde 1940, cuando más del 85 por ciento de los colines deletreaban su nombre con una sola

¿Qué significa todo esto? No tengo ni idea. Sean cuales sean las razones, serán diferentes para otros pares de grafías de nombres. Se podría hacer lo mismo con «Eric» frente a «Erik» o con «Rachel» frente a «Rachael» y muchos otros. En realidad, vamos a hacer esos dos:

Estos son simples gráficos de áreas. Para este propósito lo prefiero a un gráfico de áreas apiladas; con sólo dos líneas, donde la suma de los dos valores del eje Y siempre asciende al 100% sólo terminarías con la misma línea inferior y la mitad superior de un color sólido. De esta manera se obtiene una mejor idea del gran cambio en la popularidad de las dos ortografías.

Un gráfico de áreas apiladas sería genial para mostrar las tendencias de más de dos nombres: Por ejemplo, podrías mostrar el cambio en el sexo asociado a los nombres a lo largo del tiempo con un solo nombre utilizando un gráfico como el anterior, pero utilizando una imagen podrías apilar varios nombres y transmitir la misma información:

Datos de la Seguridad Social sobre nombres de bebés

Los datos provienen del sitio web de la SSA, donde ponen a disposición del público los 1000 nombres de bebé más populares para cada año de nacimiento en sus registros. Antes de 1940 los datos son bastante escasos, ya que la administración no se creó hasta los años treinta. Todavía se pueden obtener nombres que se remontan a 1880, pero hay menos, ya que sólo se incluyen las personas que se inscribieron en los años treinta y posteriores.

Obtenga los datos en esta página de la SSA. Viene en un archivo .zip que contiene archivos separados para cada año de nacimiento, y hay una versión de los datos desglosados por estados de EE.UU.

Los datos se ven como

Linda,F,99686Mary,F,71688Patricia,F,51278Barbara,F,48791Sandra,F,34774Carol,F,33538Nancy,F,32442

Esto es de la parte superior del archivo de 1947.

Será conveniente combinar los archivos de un solo año en uno solo y probablemente añadir una columna «Año de nacimiento» (YOB) para facilitar su uso en los gráficos relacionados con el tiempo. Escribí un pequeño script de Ruby para hacer el trabajo.

Para alimentar los datos a un paquete de gráficos probablemente tendrá que masajear los datos un poco más: Necesitas transformar las filas con un solo nombre en filas con columnas para todos los puntos de datos que quieres graficar. Estos pueden estar en un archivo o un archivo por línea en el gráfico (Gnuplot te permite trabajar de esa manera, cargando múltiples archivos en un gráfico). Podrías hacer esto con Ruby o Python. Yo lo hice con SQL y la herramienta «Q Text-as-Data», luego alimenté el resultado a Gnuplot.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.