Eșantioane și secvențiere

Am generat secvențe genomice pentru 10 eșantioane care au fost colectate din trei situri din estul Angliei, în apropiere de Cambridge: Hinxton (cinci eșantioane, Fig. Suplimentară 1), Oakington (patru eșantioane, Fig. Suplimentară 2) și Linton (1 eșantion), care au fost selectate dintr-un total de 23 de eșantioane examinate pe baza conservării ADN-ului (Fig. 1b, Tabelul 1, Tabelul Suplimentar 1, Nota Suplimentară 1). Toate probele secvențiate au fost datate cu radiocarbon (Tabelul suplimentar 2) și se încadrează în trei perioade de timp: proba din Linton și două probe din Hinxton sunt din epoca târzie a fierului (∼100 î.Hr.), cele patru probe din Oakington din perioada anglo-saxonă timpurie (secolele V-VI), iar cele trei probe din Hinxton din perioada anglo-saxonă mijlocie (secolele VII-IX; Fig. 1c). Cele două eșantioane din epoca fierului de la Hinxton sunt de sex masculin, toate celelalte eșantioane sunt de sex feminin, pe baza acoperirii cromozomului Y și în concordanță cu arheologia. Toate probele au fost secvențiate la o acoperire genomică de la 1x la 12x (Tabelul 1). Toate au rate de contaminare sub 2%, așa cum au fost estimate atât din ADN mitocondrial, cât și din ADN nuclear (tabelul suplimentar 3, nota suplimentară 2). Haplogrupurile mitocondriale și ale cromozomului Y din toate eșantioanele se numără printre cele mai frecvente haplogrupuri din Europa de Nord-Vest din zilele noastre (Tabelul 1)11,12 și, în acest caz, nu sunt informative pentru a distinge strămoșii imigranți de cei indigeni.

Tabelul 1 Un rezumat al tuturor eșantioanelor secvențiate în acest studiu.

Am generat un grafic al componentelor principale al celor 10 eșantioane antice împreună cu populațiile europene relevante selectate din datele publicate13,14 (Fig. suplimentară 3). Eșantioanele antice se încadrează în intervalul eșantioanelor englezești și scoțiene moderne, eșantioanele din Epoca Fierului de la Hinxton și Linton fiind mai apropiate de eșantioanele englezești și franceze moderne, în timp ce majoritatea eșantioanelor din epoca anglo-saxonă sunt mai apropiate de eșantioanele scoțiene și norvegiene moderne. În general, totuși, diferențele genetice populaționale între aceste eșantioane la alelele comune sunt mici.

Estimarea componentei anglo-saxone în Marea Britanie modernă

În timp ce analiza componentelor principale poate dezvălui o structură populațională relativ veche, cum ar fi cea generată de modelele de izolare pe termen lung prin distanță15, secvențele de genom integral ne permit să studiem variantele rare pentru a obține informații despre structura mai recentă a populației. Am identificat variante rare cu frecvența alelei de până la 1 % într-un panel de referință de 433 de indivizi europeni din Finlanda, Spania, Italia, Țările de Jos și Danemarca moderne, pentru care sunt disponibile date de secvențiere la nivelul întregului genom16,17,18. Am determinat pentru fiecare eșantion antic numărul de variante rare împărtășite cu fiecare populație de referință (Nota suplimentară 3). Există diferențe izbitoare în modelele de partajare ale eșantioanelor, ilustrate de raportul dintre numărul de alele rare partajate cu indivizii olandezi și numărul celor partajate cu indivizii spanioli (Fig. 2a). Eșantioanele anglo-saxone medii din Hinxton (HS1, HS2 și HS3) împărtășesc relativ mai multe variante rare cu olandezii moderni decât eșantioanele din epoca fierului din Hinxton (HI1 și HI2) și Linton (L). Eșantioanele anglo-saxone timpurii din Oakington sunt mai diverse, O1 și O2 fiind mai apropiate de eșantioanele anglo-saxone medii, O4 prezentând același model ca și eșantioanele din Epoca Fierului, iar O3 prezentând un nivel intermediar de partajare a alelelor, sugerând o ascendență mixtă. Diferențele dintre eșantioane sunt cele mai mari în cazul alelelor cu frecvență scăzută și scad odată cu creșterea frecvenței alelelor. Acest lucru este în concordanță cu faptul că mutațiile cu frecvență mai mică sunt în medie mai tinere, reflectând o ascendență distinctă mai recentă, în comparație cu mutațiile cu frecvență mai mare care reflectă o ascendență comună mai veche.

Figura 2: Împărtășirea relativă a alelelor rare între eșantioanele antice și cele moderne.
figură2

(a) Raportul dintre numărul de alele rare partajate cu eșantioanele moderne olandeze și spaniole în funcție de numărul de alele din setul de eșantioane moderne. Codurile eșantioanelor antice (secțiunile din stânga și din mijloc) sunt definite în tabelul 1. Rezultatele obținute pentru indivizii britanici din zilele noastre (secțiunea din dreapta) sunt mediate pe 10 indivizi din fiecare subpopulație. Rezultatele de la un individ olandez și un individ spaniol sunt prezentate pentru comparație. Barele de eroare sunt calculate din statisticile de numărare brute și utilizând propagarea s.e. (secțiunea Metode). (b) Fracțiunea relativă a alelelor rare împărtășite cu alelele olandeze moderne în comparație cu alelele spaniole, integrate până la numărul de alele cinci în eșantioanele moderne. Eșantioanele din Epoca Fierului și cele anglo-saxone marchează cele două extreme pe această proiecție, în timp ce eșantioanele moderne sunt răspândite între ele, indicând niveluri mixte de ascendență anglo-saxonă, care este, în medie, mai mare în estul Angliei decât în Țara Galilor și Scoția, cu o mare suprapunere. Două eșantioane anglo-saxone timpurii de la Oakington au fost excluse din calculul mediei, indicate prin cercuri goale, deoarece prezintă dovezi că sunt amestecate (O3) sau că au un ascendent neimigrant (O4). O mostră modernă din Scoția este, de asemenea, exclusă, indicată prin cercuri goale, deoarece reprezintă o valoare aberantă clară în raport cu toate celelalte mostre scoțiene. Pentru o mai bună claritate, eșantioanele sunt prezentate cu un decalaj vertical aleatoriu. Barele de eroare (secțiunea Metode) pentru eșantioanele moderne sunt omise aici, dar sunt de același ordin de mărime ca și pentru eșantioanele antice. Datele pentru această figură sunt disponibile ca Date suplimentare 1.

Am examinat, de asemenea, folosind aceeași metodă, 30 de eșantioane moderne din proiectul UK10K19, câte 10 cu locuri de naștere în estul Angliei, Țara Galilor și Scoția. În general, aceste eșantioane sunt mai apropiate de eșantioanele din Epoca Fierului decât de cele din epoca anglo-saxonă (Fig. 2a). Există o diferență mică, dar semnificativă între valorile medii din cele trei grupuri de eșantioane britanice moderne, eșantioanele din estul Angliei împărtășind ceva mai multe alele cu olandezii, iar eșantioanele scoțiene semănând mai mult cu eșantioanele din Epoca Fierului.

Pentru a cuantifica fracțiunile de strămoși, am ajustat eșantioanele britanice moderne cu un model de amestec de componente antice, prin plasarea tuturor eșantioanelor pe o axă liniară a împărțirii relative a alelelor olandeze care integrează datele de la numărul de alele 1-5 (Fig. 2b, Nota suplimentară 3). Prin această măsură, eșantioanele din estul Angliei sunt în concordanță cu 38% de ascendență anglo-saxonă în medie, cu o răspândire mare de la 25 la 50%, iar eșantioanele galeze și scoțiene sunt în concordanță cu 30% de ascendență anglo-saxonă în medie, din nou cu o răspândire mare (Tabelul suplimentar 4). Aceste cifre sunt mai mici, în medie, dacă excludem individul HS3 cu acoperire redusă din grupul anglo-saxon (35 % pentru eșantioanele din estul Angliei). Un rezultat similar se obține atunci când analizăm eșantioanele britanice moderne din Proiectul 1.000 de genomuri, care prezintă o substructură puternică (Nota suplimentară 4, Fig. suplimentară 4). Constatăm că eșantioanele din Kent prezintă o componentă anglo-saxonă similară, de 37%, atunci când sunt comparate cu outgroup-urile finlandez și spaniol, cu o valoare mai mică pentru eșantioanele din Cornwall (Fig. suplimentară 5a, Tabel suplimentar 4).

O abordare alternativă și potențial mai directă pentru a estima aceste fracțiuni este de a măsura partajarea alelelor rare direct între eșantioanele britanice moderne și cele antice. Deși este mult mai zgomotoasă decât analiza care utilizează outgroup-uri olandeze și spaniole, aceasta oferă rezultate consistente (Fig. suplimentară 5b, Nota suplimentară 3). În concluzie, această analiză sugerează că, în medie, 25-40% din strămoșii britanicilor moderni au fost contribuția imigranților anglo-saxoni, cu un număr mai mare în estul Angliei, mai aproape de sursa de imigrare. Diferența dintre grupurile din interiorul Marii Britanii este surprinzător de mică în comparație cu diferențele mari observate în eșantioanele antice. Acest lucru este valabil atât pentru eșantioanele UK10K, cât și pentru eșantioanele britanice din proiectul 1.000 de genomuri, deși observăm că este posibil ca locațiile eșantioanelor UK10K să nu reflecte pe deplin structura geografică istorică a populației din cauza amestecului recent de populații.

Un avertisment al analizei noastre este că folosim cele trei eșantioane din Epoca Fierului din Cambridgeshire ca proxies pentru populația britanică autohtonă, care, fără îndoială, a fost structurată, deși pare rezonabil să le luăm ca reprezentante cel puțin pentru estul Angliei. În plus, orice contribuție genetică continentală din perioada romano-britanică ar fi luată în considerare în componenta anglo-saxonă atribuită, la fel ca și o contribuție scandinavă sau normandă anglo-saxonă târzie. Cu toate acestea, aceste efecte ar fi puternice doar dacă contribuția ar fi mare și puternic înclinată pe axa olandeză-spaniolă.

Construirea unui model de istorie a populației din variante rare

Pentru a obține mai multe informații despre istoria care stă la baza acestor modele de partajare, am dezvoltat o nouă metodă sensibilă, rarecoal, care potrivește un model demografic la distribuția comună a alelelor rare într-un număr mare de eșantioane (Note suplimentare 5 și 6). Strategia noastră este de a construi un model sub forma unei filogenii populaționale a relațiilor dintre populațiile europene moderne, în care putem plasa eșantioanele vechi. Recunoaștem că un model fără amestecuri și fluxuri genetice ulterioare divizării este inadecvat ca o descriere completă a istoriei populației europene. Cu toate acestea, acesta este un model simplificat natural, iar accentul în acest studiu este pus pe înțelegerea relațiilor genetice dintre imigranți și populațiile indigene din Anglia, pentru care acest model de filogenie a populației oferă un eșafodaj rezonabil.

Ideea cheie este de a modela în mod explicit incertitudinea în trecut a distribuției alelelor derivate, dar de a aproxima distribuția corespunzătoare pentru alelele nederivate prin așteptarea sa (Fig. 3a). Deoarece rarecoal modelează în mod explicit mutațiile rare, acesta estimează separările în timpul ceasului de mutații mai degrabă decât în timpul derivei genetice, spre deosebire de metodele bazate pe modificările frecvenței alelelor în variantele comune20. Am testat mai întâi rarecoal pe date simulate și am constatat că a fost capabil să reconstruiască timpii de separare și dimensiunile populației de ramură cu o bună acuratețe (Fig. 3b), potrivindu-se aproape exact cu partajarea alelelor (Fig. Suplimentară 6). De asemenea, am testat robustețea sa cu o dimensiune mai mică a eșantionului într-o singură populație (ca în cazul eșantioanelor daneze studiate aici) și în condiții de amestec (Nota suplimentară 5, Fig. suplimentară 7).

Figura 3: Modelarea istoriei europene cu rarecoal.
figură3

(a) Rarecoal urmărește probabilitățile pentru liniile genealogice ale alelelor rare (roșu) într-un cadru coalescent înapoi în timp și aproximează distribuția alelelor nederivate (albastru închis) prin media sa. (b) Prin optimizarea verosimilității datelor în cadrul modelului, putem estima dimensiunile populației și timpii de divizare. Testate cu date simulate, estimările corespund îndeaproape valorilor reale (în paranteze). (c) Aplicat la sute de indivizi europeni, rarecoal estimează timpii de divizare, așa cum este indicat pe axa timpului, și dimensiunile populației pentru fiecare ramură. (d) La fel ca în c, dar folosind eșantioane din Kent în loc de Cornwall ca proxy pentru populația britanică. Topologia diferită a arborelui între c și d reflectă istoriile diferite ale populației din Cornwall în comparație cu Kent din sudul Angliei.

Am aplicat apoi rarecoal la 524 de eșantioane din șase populații din Europa (Fig. 3c,d) pentru a estima un arbore demografic european în care am putea plasa eșantioanele vechi. Deoarece eșantioanele britanice din Proiectul 1.000 de genomuri se încadrează în trei grupuri distincte, reflectând trei locații ale eșantioanelor (din Kent, Cornwall și Insulele Orkney, ca parte a proiectului Peoples of the British Isles4,21, Nota suplimentară 4)16, am adaptat arbori diferiți la aceste grupuri diferite (Fig. suplimentară 8). Trăsătura comună în toți cei trei arbori este o primă separare între sudul și nordul Europei cu un timp median ∼7.000 de ani în urmă, urmată de alte trei separări apropiate în timp ∼5.000 de ani în urmă între Olanda, Danemarca, Finlanda și Marea Britanie. Interesant este faptul că, atunci când am folosit eșantioanele britanice din Cornwall, am obținut un arbore în care Cornwall formează un outgroup pentru populația olandeză, daneză și finlandeză (Fig. 3c). În schimb, atunci când folosim Kent, acesta formează o cladă cu populația olandeză (Fig. 3d), în concordanță cu o ascendență anglo-saxonă mai mare în sudul Angliei decât în Cornwall. Atunci când folosim populația Orkney ca ramură britanică, găsim o topologie a arborelui similară cu cea pentru Cornwall. Aceste rezultate arată că atât Cornwall, cât și Orkney sunt înrudite mai îndepărtat cu Europa continentală decât Kent. Dimensiunea efectivă a populației din ramura de vârf este cea mai mică în Finlanda (∼12.000), în concordanță cu observațiile anterioare22,23, și cea mai mare în Kent (∼191.000) și în Țările de Jos (∼184.000). Pentru datele europene, potrivirea partajării alelelor este mai slabă decât pentru datele simulate (Fig. suplimentară 9), probabil din cauza ipotezelor simplificatoare ale modelului privind o dimensiune constantă a populației în fiecare ramură și absența migrației.

Stimarea relativ recentă a timpului de separare între Italia și Spania, ∼2.600 de ani în urmă, poate fi o consecință a migrației care a urmat unei separări anterioare; dimensiunea populației strămoșești italo-spaniole a fost estimată ca fiind extrem de mare și nu a putut fi determinată o limită superioară, ceea ce ar putea fi un artefact al substructurii ancestrale sau al amestecului. O altă explicație ar fi o sursă comună de amestec atât în populația spaniolă, cât și în cea italiană, rezultând o ascendență comună relativ recentă. Arătăm în figura suplimentară 7 modul în care amestecul poate modifica estimările rarecoal ale estimărilor dimensiunii efective a populației și ale timpilor de divizare.

Modelarea strămoșilor genomurilor antice folosind rarecoal

În plus față de reconstituirea relației europene mai largi dintr-un set mare de eșantioane, rarecoal poate fi folosit pentru a evalua relația unui singur eșantion antic cu arborele european. Pentru a face acest lucru, presupunem un model în care populația ancestrală a eșantionului unic fuzionează cu arborele european la o anumită ramură, la un anumit moment înainte de data de origine a eșantionului. Putem apoi să folosim rarecoal pentru a evalua probabilitatea datelor comune de partajare a alelelor între eșantionul antic și populațiile moderne în cadrul fiecărui model, specificat prin ramura și momentul fuziunii în arbore (Fig. 4, Nota suplimentară 5). A existat o diferență marcantă între eșantioanele din epoca fierului și cele din epoca anglo-saxonă: eșantioanele din epoca anglo-saxonă au fuzionat în cea mai mare parte pe ramurile olandeză și daneză, în timp ce eșantioanele din epoca fierului au fuzionat în mod preferențial la baza ramurii ancestrale pentru toate eșantioanele moderne din Europa de Nord. Excepția este că O4 anglo-saxon timpuriu prezintă același semnal ca și probele din Epoca Fierului, în concordanță cu analiza de partajare a alelelor rare (Fig. 2). Pentru eșantionul O3, care părea a fi de ascendență mixtă în analiza de partajare a alelelor, găsim cea mai mare probabilitate de fuziune cu ramura daneză. Cu toate acestea, în acest eșantion există, de asemenea, o probabilitate semnificativ mai mare de a fuziona cu același punct de ramificare ancestrală nord-europeană, așa cum s-a observat pentru eșantioanele din epoca fierului. Acest lucru este în concordanță cu faptul că O3 este de origine recent mixtă, autohtonă și anglo-saxonă, deși nu putem exclude scenarii mai complexe care implică o ascendență mixtă anterioară a acestui individ în perioada romano-britanică. Există o oarecare diferențiere între eșantioanele din epoca anglo-saxonă, eșantioanele O1, O2, HS1 și HS3 având cea mai mare probabilitate de a fuziona cu ramura olandeză, în timp ce O3 și HS2 au cea mai mare probabilitate de a fuziona cu ramura daneză, deși, în unele cazuri, diferența de probabilitate între aceste două posibilități este mică. Semnalele de la HS3, HI1 și L sunt mai dispersate din cauza acoperirii scăzute, dar în concordanță cu celelalte rezultate.

Figura 4: Plasarea eșantioanelor antice în arborele european.
figura4

Dat fiind arborele european cu Cornwall ca ramură a populației britanice, cartografiem eșantioanele antice în acest arbore. Colorăm fiecare punct din arbore în funcție de probabilitatea ca ramura ancestrală a eșantionului antic să fuzioneze în acel punct. Punctul de fuziune cu probabilitate maximă este marcat de un cerc negru. Analiza arată că eșantioanele din epoca fierului L, HI1 și HI2 au cea mai mare probabilitate de a fuziona în ramura ancestrală a tuturor populațiilor nord-europene analizate, în timp ce eșantioanele anglo-saxone fuzionează în ramurile olandeză și, respectiv, daneză. Eșantioanele cu acoperire redusă L, HI1 și HS3 au cea mai mare răspândire în ceea ce privește probabilitatea, dar sunt în concordanță cu eșantioanele cu acoperire mai mare.

Cartografierea eșantioanelor antice pe arbore este similară pentru arborele care utilizează Kent ca populație britanică (Fig. Suplimentară 10) și pentru arborele care utilizează Cornwall ca proxy britanic (Fig. 4). În special, eșantioanele din Epoca Fierului se mapează pe ramura ancestrală a populațiilor din Europa de Nord, indiferent dacă se utilizează Kent sau Cornwall ca proxy britanic. Acest lucru sugerează că niciuna dintre populațiile actuale din setul nostru de date, inclusiv populația din Cornwall, nu este la fel de strâns înrudită cu eșantioanele din Epoca Fierului cum sunt Danemarca și Țările de Jos cu eșantioanele anglo-saxone.

Am validat abordarea noastră de cartografiere a eșantioanelor individuale într-un arbore prin plasarea eșantioanelor moderne pe același arbore ca în Fig. 4. Constatăm că toate eșantioanele din populațiile utilizate în construirea arborelui au fost plasate pe vârful ramurii lor respective, așa cum era de așteptat (Fig. suplimentară 11). Atunci când cartografiem eșantioane din grupuri care nu sunt prezente în arbore, cum este cazul eșantioanelor din Kent și Orkney, constatăm că acestea se cartografiază pe aceeași locație ancestrală ca și eșantioanele din Epoca Fierului (Fig. suplimentară 11), confirmând că acestea au o ascendență distinctă față de populația Cornish și alte populații utilizate în construirea arborelui, la fel ca și eșantioanele din Epoca Fierului. După cum se detaliază în Nota suplimentară 5, abordarea noastră de cartografiere depinde în mod esențial de un model adecvat pentru populațiile de referință. Atunci când folosim populația din Kent pentru construirea arborelui (Fig. 3c), constatăm că cartografierea eșantioanelor britanice devine mai proastă (Fig. suplimentară 12), probabil pentru că populația din Kent este mai puțin definită genetic și mai amestecată decât grupul din Cornwall. În astfel de cazuri, trebuie să modelăm filogenii de populație cu amestecuri și fluxuri genetice, iar dezvoltarea în continuare pe rarecoal ne va permite să studiem aceste scenarii mai complexe.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.