Im Laufe der Jahre hatten viele Leute Schwierigkeiten, meinen Namen zu schreiben. Als ich jünger war, nahm ich an, sie hätten den Namen „Colin“ noch nie gehört. Dort, wo ich lebte, war er ziemlich ungewöhnlich. In den letzten zwanzig Jahren ist der Name immer beliebter geworden, aber die Probleme mit der Schreibweise haben sich nicht verbessert. Es hat sich herausgestellt, dass es heutzutage ein weiteres Problem gibt: eine alternative Schreibweise. Könnte „Collin“ wirklich so verbreitet sein wie „Colin“? Ich habe es nicht geglaubt.

Glücklicherweise erfasst die Sozialversicherungsanstalt die Vornamen nach Geburtsdatum und stellt diese Daten frei zur Verfügung, so dass ich diese Frage beantworten konnte.

Es stellte sich heraus, dass „Collin“ um die Jahrhundertwende einen dramatischen Popularitätssprung erlebte und kurzzeitig das (natürlich korrekte) „Colin“ in den Schatten stellte.

Das Diagramm zeigt die relative Popularität von „Colin“ gegenüber „Collin“ für Personen, die seit 1940 geboren wurden. Im Jahr 1940 verwendeten etwa 85 % der beiden Namen ein „l“, was sich bis in die späten siebziger Jahre fortsetzte; die Variante mit zwei „l“ nahm schnell Fahrt auf und übertraf um 1999 kurzzeitig die Version mit einem „l“, bevor sie seitdem immer weiter zurückfiel.

Die Veränderung von 1940, als mehr als 85 Prozent der Colins ihren Namen mit einem

Was bedeutet das alles? Ich habe keine Ahnung. Was auch immer die Gründe sind, sie werden bei anderen Paaren von Namensschreibweisen anders sein. Man könnte dasselbe für „Eric“ vs. „Erik“ oder „Rachel“ vs. „Rachael“ und viele andere tun. Nehmen wir diese beiden:

Das sind einfache Flächendiagramme. Für diesen Zweck ziehe ich es einem gestapelten Flächendiagramm vor; mit nur zwei Linien, bei denen die Summe der beiden Y-Achsenwerte immer 100% beträgt, würde man nur die untere Linie und die obere Hälfte in einer Farbe darstellen. Auf diese Weise erhält man eine bessere Vorstellung von den großen Veränderungen in der Beliebtheit der beiden Schreibweisen.

Ein gestapeltes Flächendiagramm eignet sich hervorragend zur Darstellung von Trends bei mehr als zwei Namen: Zum Beispiel könnte man mit einem Diagramm wie dem obigen die Veränderung des Geschlechts in Verbindung mit Namen im Laufe der Zeit mit nur einem Namen zeigen, aber mit einem Bild könnte man mehrere Namen stapeln und die gleiche Information vermitteln:

Social Security Baby Name Data

Die Daten stammen von der SSA-Website, auf der die 1000 beliebtesten Babynamen für jedes Geburtsjahr in ihren Aufzeichnungen öffentlich zugänglich gemacht werden. Vor 1940 sind die Daten ziemlich spärlich, da die Verwaltung erst in den dreißiger Jahren eingerichtet wurde. Sie können immer noch Namen erhalten, die bis 1880 zurückreichen, aber es sind weniger, da nur Personen, die sich in den dreißiger Jahren und später angemeldet haben, eingeschlossen sind.

Die Daten finden Sie auf dieser SSA-Seite. Sie werden in einem .zip-Archiv geliefert, das separate Dateien für jedes Geburtsjahr enthält, und es gibt eine nach US-Bundesstaaten aufgeschlüsselte Version der Daten.

Die Daten sehen wie folgt aus

Linda,F,99686Mary,F,71688Patricia,F,51278Barbara,F,48791Sandra,F,34774Carol,F,33538Nancy,F,32442

Dies ist der Anfang der Datei von 1947.

Sie werden die einzelnen Jahresdateien zu einer einzigen zusammenfassen und wahrscheinlich eine Spalte „Geburtsjahr“ (YOB) hinzufügen, um die Verwendung für zeitbezogene Diagramme zu erleichtern. Ich habe ein kleines Ruby-Skript geschrieben, um diese Aufgabe zu erledigen.

Um die Daten in ein Diagrammpaket einzuspeisen, müssen Sie die Daten wahrscheinlich noch etwas aufbereiten: Sie müssen die Zeilen mit einem einzigen Namen in Zeilen mit Spalten für alle Datenpunkte umwandeln, die Sie grafisch darstellen wollen. Diese können in einer Datei oder in einer Datei pro Zeile im Diagramm enthalten sein (mit Gnuplot können Sie auf diese Weise arbeiten und mehrere Dateien in ein Diagramm laden). Ich habe es mit SQL und dem Tool „Q Text-as-Data“ gemacht und dann das Ergebnis in Gnuplot eingegeben.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.