De-a lungul anilor, o mulțime de oameni au avut probleme în a-mi scrie numele. Când eram mai tânăr, am presupus că nu au auzit de numele „Colin”. Era destul de neobișnuit acolo unde am locuit. În ultimii douăzeci de ani, numele a devenit mai popular, dar problemele de ortografie nu s-au îmbunătățit. Se pare că în aceste zile există o altă problemă: o ortografie alternativă. Ar putea „Collin” să fie într-adevăr la fel de comun ca și „Colin”? Nu-mi venea să cred.

Din fericire, Administrația de Securitate Socială ține evidența prenumelor în funcție de data nașterii și pune aceste date la dispoziție în mod gratuit, așa că am putut răspunde la această întrebare.

Acum s-a dovedit că „Collin” a cunoscut un salt dramatic de popularitate în jurul începutului de secol, eclipsând pe moment „Colin” (corect, desigur).”

Graficul arată popularitatea relativă a lui „Colin” vs. „Collin pentru persoanele născute începând cu 1940. În 1940, aproximativ 85% dintre cele două nume foloseau un singur „l”, care a persistat până la sfârșitul anilor ’70; varianta cu doi „l” a luat rapid avânt și a depășit pentru scurt timp versiunea cu un singur „l” în jurul anului 1999, înainte de a aluneca mai jos de atunci.

Află schimbarea din 1940, când mai mult de 85 la sută dintre colineni își scriau numele cu un singur L, până în anul 2000, când puțin peste 50 la sută dintre oameni îl scriau cu doi L, după care varianta cu doi L a scăzut oarecum

Ce înseamnă toate acestea? Habar nu am. Oricare ar fi motivele, ele vor fi diferite pentru alte perechi de ortografii de nume. Ați putea face același lucru pentru „Eric” vs. „Erik” sau „Rachel” vs. „Rachael” și multe altele. De fapt, haideți să le facem pe acestea două:

Acestea sunt simple diagrame de arii. În acest scop, le prefer unui grafic de arii suprapuse; cu doar două linii, în care suma celor două valori de pe axa Y se ridică întotdeauna la 100%, v-ați trezi doar cu aceeași linie de jos și cu jumătatea de sus de o culoare solidă. În acest fel, vă faceți o idee mai bună despre marea schimbare de popularitate a celor două ortografii.

Un grafic de suprafață stivuit ar fi excelent pentru a arăta tendințele a mai mult de două nume: De exemplu, ați putea arăta schimbarea sexului asociat cu numele de-a lungul timpului cu un singur nume folosind un grafic ca cel de mai sus, dar folosind o singură imagine ați putea suprapune mai multe nume și să transmiteți aceleași informații:

Social Security Baby Name Data

Datele provin de pe site-ul SSA, unde sunt puse la dispoziția publicului primele 1000 cele mai populare nume de copii pentru fiecare an de naștere din registrele lor. Înainte de 1940, datele sunt destul de puține, deoarece administrația a fost înființată abia în anii treizeci. Puteți obține în continuare nume care merg până în 1880, dar sunt mai puține, deoarece sunt incluse doar persoanele care s-au înscris în anii treizeci și mai târziu.

Obțineți datele de pe această pagină SSA. Vine într-o arhivă .zip care conține fișiere separate pentru fiecare an de naștere și există o versiune a datelor defalcate pe state americane.

Datele arată astfel

Linda,F,99686Mary,F,71688Patricia,F,51278Barbara,F,48791Sandra,F,34774Carol,F,33538Nancy,F,32442

Aceasta este din partea de sus a fișierului din 1947.

Vă veți dori să combinați fișierele cu un singur an într-unul singur și probabil să adăugați o coloană „Anul nașterii” (YOB) pentru a facilita utilizarea acestuia pentru realizarea de grafice legate de timp. Am scris un mic script Ruby pentru a face această treabă.

Pentru a alimenta datele către un pachet de grafice, probabil că va trebui să mai masați datele: Trebuie să transformați rândurile cu un singur nume în rânduri cu coloane pentru toate punctele de date pe care doriți să le reprezentați grafic. Acestea ar putea fi într-un singur fișier sau câte un fișier pentru fiecare linie din grafic (Gnuplot vă permite să lucrați în acest mod, încărcând mai multe fișiere într-un singur grafic.) Ați putea face acest lucru cu Ruby sau Python. Eu am făcut-o cu SQL și cu instrumentul „Q Text-as-Data”, apoi am introdus rezultatul în Gnuplot.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.