Minták és szekvenálás
Elkészítettük 10 minta genomszekvenciáit, amelyeket Cambridge közelében, Kelet-Anglia három helyszínéről gyűjtöttünk: Hinxton (öt minta, 1. kiegészítő ábra), Oakington (négy minta, 2. kiegészítő ábra) és Linton (1 minta), amelyeket a DNS megőrzése alapján választottunk ki az összesen 23 átvizsgált mintából (1b. ábra, 1. táblázat, 1. kiegészítő táblázat, 1. kiegészítő megjegyzés). Minden szekvenált mintát radiokarbonos kormeghatározással kelteztek (2. kiegészítő táblázat), és három időszakba sorolhatók: a lintoni minta és két hinxtoni minta a késő vaskorból (∼ i. e. 100), az oakingtoni négy minta a korai angolszász időszakból (ötödik-hatodik század), a három hinxtoni minta pedig a középső angolszász időszakból (hetedik-kilencedik század; 1c. ábra). A Hinxtonból származó két vaskori minta férfi, az összes többi minta nő, az Y-kromoszóma lefedettség alapján és a régészeti adatokkal összhangban. Minden mintát 1x és 12x közötti genomi lefedettséggel szekvenáltak (1. táblázat). A mitokondriális DNS és a nukleáris DNS alapján becsült kontaminációs arány mindegyiknél 2% alatt van (3. kiegészítő táblázat, 2. kiegészítő megjegyzés). Az összes minta mitokondriális és Y-kromoszóma haplocsoportjai a mai Északnyugat-Európában a leggyakoribb haplocsoportok közé tartoznak (1. táblázat)11,12 , és ebben az esetben nem informatívak a bevándorló és az őslakos származás megkülönböztetése szempontjából.
A 10 ősi mintából a publikált adatokból13,14 kiválasztott releváns európai populációkkal együtt létrehoztuk a főkomponens-diagramot (3. kiegészítő ábra). Az ősi minták a modern angol és skót minták tartományába esnek, a Hinxtonból és Lintonból származó vaskori minták közelebb esnek a modern angol és francia mintákhoz, míg a legtöbb angolszász kori minta közelebb áll a modern skót és norvég mintákhoz. Összességében azonban az e minták közötti populációgenetikai különbségek a közös alléloknál csekélyek.
A modern Britannia angolszász komponensének becslése
Míg a főkomponens-elemzés viszonylag régi populációs struktúrát tárhat fel, mint amilyet például a hosszú távú izoláció-távolság modelljei15 generáltak, a teljes genom szekvenciák segítségével ritka variánsok vizsgálatával betekintést nyerhetünk a populáció újabb kori szerkezetébe. A modern Finnországból, Spanyolországból, Olaszországból, Hollandiából és Dániából származó 433 európai egyedből álló referenciapanelben, amelyre genom-szerte rendelkezésre állnak szekvenciaadatok16,17,18, olyan ritka variánsokat azonosítottunk, amelyek allélfrekvenciája eléri az 1%-ot. Minden egyes ősi minta esetében meghatároztuk az egyes referenciapopulációkkal közös ritka variánsok számát (3. kiegészítő megjegyzés). Szembetűnő különbségek vannak a minták megosztási mintázatában, amit a holland egyénekkel megosztott ritka allélok számának és a spanyol egyénekkel megosztott allélok számának aránya szemléltet (2a. ábra). A hinxtoni középső angolszász minták (HS1, HS2 és HS3) viszonylag több ritka variánst osztanak meg a modern hollandokkal, mint a hinxtoni vaskori minták (HI1 és HI2) és a Linton (L). Az Oakingtonból származó korai angolszász minták változatosabbak, az O1 és O2 közelebb áll a középső angolszász mintákhoz, az O4 a vaskori mintákhoz hasonló mintázatot mutat, az O3 pedig közepes szintű allélmegosztást mutat, ami vegyes származásra utal. A minták közötti különbségek az alacsony gyakoriságú allélok esetében a legnagyobbak, és az allélgyakoriság növekedésével csökkennek. Ez összhangban van azzal, hogy az átlagosan alacsonyabb gyakoriságú mutációk fiatalabbak, ami a közelmúltbeli elkülönült származást tükrözi, míg a magasabb gyakoriságú mutációk régebbi közös származást tükröznek.
Az UK10K projekt19 30 modern mintáját is megvizsgáltuk ugyanezzel a módszerrel, egyenként 10 kelet-angliai, walesi és skóciai születési helyű mintát. Összességében ezek a minták közelebb állnak a vaskori mintákhoz, mint az angolszász kori mintákhoz (2a. ábra). A három modern brit mintacsoport átlagértékei között kicsi, de jelentős különbség van, a kelet-angliai minták valamivel több allélt osztanak meg a hollandokkal, a skót minták pedig jobban hasonlítanak a vaskori mintákra.
A származásrészek számszerűsítéséhez a modern brit mintákat az ősi komponensek keverékmodelljével illesztettük, az összes mintát a relatív holland allélmegosztás lineáris tengelyére helyezve, amely integrálja az allélszámok 1-5 közötti adatait (2b. ábra, 3. kiegészítő megjegyzés). Ezzel a mérőszámmal a kelet-angliai minták átlagosan 38%-os angolszász származásúak, 25 és 50% közötti nagy szórással, a walesi és skót minták pedig átlagosan 30%-os angolszász származásúak, szintén nagy szórással (4. kiegészítő táblázat). Ezek a számok átlagosan alacsonyabbak, ha az angolszász csoportból kizárjuk az alacsony lefedettségű HS3 egyedet (35% a kelet-angol minták esetében). Hasonló eredményt kapunk, ha az 1000 Genom Projektből származó modern brit mintákat elemezzük, amelyek erős szubstruktúrát mutatnak (4. kiegészítő megjegyzés, 4. kiegészítő ábra). Azt találjuk, hogy a Kentből származó minták hasonló, 37%-os angolszász komponenst mutatnak a finn és spanyol outgroupokkal összehasonlítva, a cornwalli minták esetében pedig alacsonyabb értéket (5a. kiegészítő ábra, 4. kiegészítő táblázat).
Egy alternatív és potenciálisan közvetlenebb megközelítés e frakciók becslésére a ritka allélmegosztás közvetlen mérése a modern brit és az ősi minták között. Bár ez sokkal zajosabb, mint a holland és spanyol outgroupokat használó elemzés, mégis konzisztens eredményeket ad (5b. kiegészítő ábra, 3. kiegészítő megjegyzés). Összefoglalva, ez az elemzés azt sugallja, hogy a modern britek származásának átlagosan 25-40%-át angolszász bevándorlók adták, a bevándorlók forrásához közelebb eső Kelet-Angliában ez az arány magasabb. A Nagy-Britannián belüli csoportok közötti különbség meglepően kicsi az ősi mintákban megfigyelhető nagy különbségekhez képest. Ez mind a UK10K mintákra, mind az 1000 Genom projekt brit mintáira igaz, bár megjegyezzük, hogy a UK10K minták helyei a közelmúltbeli népességkeveredés miatt nem feltétlenül tükrözik teljes mértékben a történelmi földrajzi népességszerkezetet.
Elemzésünk egyik fenntartása, hogy a három cambridgeshire-i vaskori mintát az őshonos brit népesség helyettesítőjeként használjuk, amely kétségkívül strukturált volt, bár ésszerűnek tűnik, hogy ezeket legalább Kelet-Anglia esetében reprezentatívnak tekintsük. Továbbá, a római-brit időszakból származó bármilyen kontinentális genetikai hozzájárulás beleszámítana a hozzárendelt angolszász komponensbe, csakúgy, mint a késő angolszász skandináv vagy normann hozzájárulás. Ezek a hatások azonban csak akkor lennének erősek, ha a hozzájárulás nagy és erősen a holland-spanyol tengelyre torzított lenne.
Populációtörténeti modell építése ritka variánsokból
Azért, hogy további betekintést nyerjünk a megosztási minták hátterében álló történelembe, kifejlesztettünk egy érzékeny új módszert, a rarecoal-t, amely demográfiai modellt illeszt a ritka allélok együttes eloszlására nagyszámú mintában (Kiegészítő megjegyzések 5. és 6.). Stratégiánk lényege, hogy a modern európai populációk kapcsolatának populációs filogeniája formájában felépítünk egy modellt, amelybe elhelyezhetjük az ősi mintákat. Elismerjük, hogy a keveredés és a szétválás utáni génáramlás nélküli modell nem alkalmas az európai népességtörténet teljes leírására. Ez azonban egy természetes egyszerűsített modell, és ebben a tanulmányban a hangsúly az angliai bevándorlók és az őshonos populációk genetikai kapcsolatainak megértésén van, amelyhez ez a populációs filogenetikai modell ésszerű állványzatot nyújt.
A fő gondolat az, hogy explicit módon modellezzük a származékallélek eloszlásának múltbeli bizonytalanságát, de a nem származékallélek megfelelő eloszlását annak várakozásával közelítjük (3a. ábra). Mivel a rarecoal explicit módon modellezi a ritka mutációkat, a genetikai sodródási idő helyett a mutációs óraidőben történő elkülönüléseket becsüli, ellentétben a gyakori változatok allélfrekvencia-változásain alapuló módszerekkel20. Először szimulált adatokon teszteltük a rarecoal-t, és azt találtuk, hogy jó pontossággal képes rekonstruálni a szétválási időket és az elágazó populációk méretét (3b. ábra), és szinte pontosan illeszkedik az allélmegosztáshoz (6. kiegészítő ábra). Robusztusságát kisebb mintamérettel, csak egy populációban (mint az itt vizsgált dán mintákban) és keveredés mellett is teszteltük (5. kiegészítő megjegyzés, 7. kiegészítő ábra).
Ezután a rarecoal-t hat európai populáció 524 mintájára alkalmaztuk (3c,d ábra), hogy megbecsüljünk egy európai demográfiai fát, amelybe az ősi mintákat elhelyezhetjük. Mivel az 1000 Genom projekt brit mintái három különböző klaszterbe sorolhatók, amelyek három mintahelyet tükröznek (Kentből, Cornwallból és az Orkney-szigetekről, a Peoples of the British Isles projekt4,21 részeként, 4. kiegészítő megjegyzés)16 , különböző fákat illesztettünk ezekre a különböző csoportokra (8. kiegészítő ábra). Mindhárom fában közös vonás az első szétválás Dél- és Észak-Európa között ∼7000 évvel ezelőtti mediánidővel, amelyet további három, időben közel ∼5000 évvel ezelőtti szétválás követ Hollandia, Dánia, Finnország és Nagy-Britannia között. Érdekes módon, amikor a cornwalli brit mintákat használtuk, olyan fát kaptunk, ahol Cornwall a holland, dán és finn populáció outgroupját képezi (3c. ábra). Ezzel szemben, ha Kentet használjuk, az egy kládot alkot a holland népességgel (3d. ábra), ami összhangban van azzal, hogy Dél-Angliában magasabb az angolszász származás, mint Cornwallban. Ha az Orkney-populációt használjuk brit ágként, hasonló fa topológiát találunk, mint Cornwall esetében. Ezek az eredmények azt mutatják, hogy mind Cornwall, mind Orkney távolabbi rokonságban áll a kontinentális Európával, mint Kent. A csúcság effektív népességmérete Finnországban a legalacsonyabb (∼12 000), ami összhangban van a korábbi megfigyelésekkel22,23 , és Kentben (∼191 000) és Hollandiában (∼184 000) a legmagasabb. Az európai adatok esetében az allélmegosztás illeszkedése rosszabb, mint a szimulált adatok esetében (9. kiegészítő ábra), feltehetően az egyes ágakban állandó populációméretre és a migráció hiányára vonatkozó egyszerűsítő modellfeltevések miatt.
Az Olaszország és Spanyolország közötti szétválás idejére vonatkozó viszonylag friss becslés, ∼2 600 évvel ezelőtt, egy korábbi szétválást követő migráció következménye lehet; az olasz-spanyol őspopuláció populációméretét rendkívül nagyra becsülték, és felső határt nem lehetett meghatározni, ami lehet az ősi szubstruktúra vagy a keveredés műterméke. Egy másik magyarázat szerint a spanyol és az olasz népességbe való beolvadás közös forrásból származik, ami viszonylag friss közös ősökhöz vezetett. A 7. kiegészítő ábrán bemutatjuk, hogy az admixtúra hogyan módosíthatja a rarecoal becsléseit az effektív populációméret becslésére és az osztódási időkre vonatkozóan.
Ősi genomok ősiségének modellezése rarecoal segítségével
A szélesebb európai kapcsolat rekonstruálása mellett egy nagy mintakészletből a rarecoal arra is használható, hogy értékeljük egyetlen ősi minta kapcsolatát az európai fával. Ehhez olyan modellt feltételezünk, amelyben az egyetlen minta őspopulációja egy adott ágon, a minta származási időpontja előtt egy adott időpontban összeolvad az európai fával. Ezután a rarecoal segítségével ki tudjuk értékelni az ősi minta és a modern populációk közötti közös allélmegosztási adatok valószínűségét az egyes modellek szerint, amelyeket az ág és az egyesülés időpontja határoz meg a fán (4. ábra, 5. kiegészítő megjegyzés). A vaskori és az angolszász kori minták között jelentős különbség mutatkozott: az angolszász kori minták többnyire a holland és dán ágakra olvadtak össze, míg a vaskori minták minden modern észak-európai minta esetében inkább az őság tövében olvadtak össze. Kivétel, hogy a korai angolszász O4 ugyanazt a jelet mutatja, mint a vaskori minták, ami összhangban van a ritka allélmegosztás elemzésével (2. ábra). Az O3 minta esetében, amely az allélmegosztási elemzésben vegyes származásúnak tűnt, a legnagyobb valószínűséggel a dán ággal való összeolvadást találjuk. Ebben a mintában azonban a vaskori mintákhoz hasonlóan az észak-európai ősök azonos ági pontjára való beolvadás valószínűsége is jelentősen nagyobb. Ez összhangban van azzal, hogy az O3 nemrégiben vegyes őslakos és angolszász eredetű, bár nem zárhatjuk ki az ennél összetettebb forgatókönyveket sem, amelyek az egyén korábbi, a római-brit időszak alatti vegyes származását foglalják magukban. Az angolszász kori minták között némi különbség van: az O1, O2, HS1 és HS3 minták esetében a legnagyobb a holland ágba való beolvadás valószínűsége, míg az O3 és HS2 minták esetében a dán ágba való beolvadás valószínűsége a legnagyobb, bár néhány esetben a két lehetőség közötti valószínűségbeli különbség kicsi. A HS3, HI1 és L jelzései az alacsony lefedettség miatt jobban szóródnak, de összhangban vannak a többi eredménnyel.
Az ősi minták leképezése a fára hasonló a Kentet brit populációként használó fa (10. kiegészítő ábra) és a Cornwallt brit proxyként használó fa esetében (4. ábra). Különösen a vaskori minták az észak-európai népesség ős ágára illeszkednek, függetlenül attól, hogy Kentet vagy Cornwallt használjuk-e brit proxyként. Ez arra utal, hogy az adathalmazunkban szereplő mai populációk egyike sem, beleértve a cornwalli populációt is, áll olyan szoros rokonságban a vaskori mintákkal, mint Dánia és Hollandia az angolszász mintákkal.
Az egyes minták fába való leképezésére vonatkozó megközelítésünket úgy validáltuk, hogy a modern mintákat ugyanarra a fára helyeztük, mint a 4. ábrán. Úgy találtuk, hogy a fa felépítéséhez használt populációkból származó összes mintát a várakozásoknak megfelelően a megfelelő ág csúcsára helyeztük (11. kiegészítő ábra). Ha a fán nem szereplő csoportokból származó mintákat térképezzük fel, mint például a Kentből és az Orkney-szigetekről származó minták esetében, azt találjuk, hogy ezek ugyanarra az őshelyre kerülnek, mint a vaskori minták (11. kiegészítő ábra), ami megerősíti, hogy a vaskori mintákhoz hasonlóan a cornwalli népességtől és a fa felépítéséhez használt más népességektől eltérő ősökkel rendelkeznek. Amint azt az 5. kiegészítő megjegyzésben részletezzük, a térképezési megközelítésünk döntő mértékben függ a referenciapopulációk megfelelő modelljétől. Ha a fa felépítéséhez a kenti népességet használjuk (3c. ábra), azt tapasztaljuk, hogy a brit minták feltérképezése rosszabbá válik (12. kiegészítő ábra), valószínűleg azért, mert a kenti népesség genetikailag kevésbé meghatározott és jobban keveredik, mint a cornwalli csoport. Ilyen esetekben a populációs filogeniákat keveredéssel és génáramlással együtt kell modelleznünk, és a rarecoal további fejlesztése lehetővé fogja tenni, hogy ezeket az összetettebb forgatókönyveket tanulmányozhassuk.