Näytteet ja sekvensointi
Loimme genomisekvenssit 10 näytteestä, jotka kerättiin kolmesta Itä-Englannin paikasta Cambridgen läheltä: Hinxton (viisi näytettä, Täydentävä kuva 1), Oakington (neljä näytettä, Täydentävä kuva 2) ja Linton (yksi näyte), jotka valittiin yhteensä 23 seulotusta näytteestä DNA:n säilyvyyden perusteella (kuva 1b, taulukko 1, täydentävä taulukko 1, täydentävä huomautus 1). Kaikki sekvensoidut näytteet ajoitettiin radiohiiliajoituksella (lisätaulukko 2), ja ne jakautuvat kolmeen ajanjaksoon: Lintonin näyte ja kaksi Hinxtonin näytettä ovat myöhäiseltä rautakaudelta (∼100 eaa.), Oakingtonin neljä näytettä varhaiselta anglosaksiselta kaudelta (viidennestä kuudennelle vuosisadalle) ja kolme Hinxtonin näytettä keskimmäiseltä anglosaksiselta kaudelta (seitsemännestä yhdeksännelle vuosisadalle; kuva 1c). Hinxtonin kaksi rautakautista näytettä ovat miespuolisia, kaikki muut näytteet ovat naispuolisia, mikä perustuu Y-kromosomipeittävyyteen ja on yhdenmukaista arkeologian kanssa. Kaikki näytteet sekvensoitiin genomin kattavuuteen 1x-12x (taulukko 1). Kaikissa näytteissä on alle 2 prosentin kontaminaatioprosentti, joka on arvioitu sekä mitokondrionaalisen DNA:n että ydin-DNA:n perusteella (täydentävä taulukko 3, täydentävä huomautus 2). Kaikkien näytteiden mitokondriaaliset ja Y-kromosomihaploryhmät ovat yleisimpiä haploryhmiä nykyisessä Luoteis-Euroopassa (taulukko 1)11,12 , eivätkä ne tässä tapauksessa ole informatiivisia maahanmuuttajien ja alkuperäisväestön syntyperän erottamiseksi toisistaan.
Loimme pääkomponenttipiirroksen kymmenestä muinaisnäytteestä yhdessä julkaistusta aineistosta13,14 valittujen asiaankuuluvien eurooppalaisten populaatioiden kanssa (täydentävä kuva 3). Muinaisnäytteet sijoittuvat nykyisten englantilaisten ja skotlantilaisten näytteiden vaihteluvälille, ja Hinxtonin ja Lintonin rautakautiset näytteet sijoittuvat lähemmäksi nykyisiä englantilaisia ja ranskalaisia näytteitä, kun taas useimmat anglosaksisen ajan näytteet ovat lähempänä nykyisiä skotlantilaisia ja norjalaisia näytteitä. Kaiken kaikkiaan näiden näytteiden väliset populaatiogeneettiset erot yhteisillä alleeleilla ovat kuitenkin vähäisiä.
Anglosaksisen komponentin arvioiminen nykyajan Britanniassa
Nykyajan Britannian anglosaksisen komponentin arvioiminen
Vaikka pääkomponenttianalyysi voi paljastaa suhteellisen vanhan populaatiorakenteen, esimerkiksi pitkän aikavälin eristysetäisyysmallien15 perusteella syntyneen populaatiorakenteen, koko geeniperimän perimän sekvensseillä pystytään tutkimaan harvinaisia variantteja, jotta voidaan saada käsitys viimeaikaisemmasta populaation rakenteesta. Tunnistimme harvinaisia variantteja, joiden alleelifrekvenssi on enintään 1 %, vertailupaneelissa, joka koostui 433 eurooppalaisesta henkilöstä nykyajan Suomesta, Espanjasta, Italiasta, Alankomaista ja Tanskasta, joista on saatavilla genomin laajuisia sekvenssitietoja16,17,18. Määritimme kullekin muinaiselle näytteelle niiden harvinaisten varianttien määrän, jotka ovat yhteisiä kunkin vertailupopulaation kanssa (lisähuomautus 3). Näytteiden jakomalleissa on silmiinpistäviä eroja, joita havainnollistaa hollantilaisten kanssa jaettujen harvinaisten alleelien lukumäärän suhde espanjalaisten kanssa jaettujen alleelien lukumäärään (kuva 2a). Hinxtonin keskiaikaiset anglosaksiset näytteet (HS1, HS2 ja HS3) jakavat suhteellisesti enemmän harvinaisia variantteja nykyisten hollantilaisten kanssa kuin Hinxtonin rautakautiset näytteet (HI1 ja HI2) ja Linton (L). Oakingtonin varhaiset anglosaksiset näytteet ovat monimuotoisempia, sillä O1 ja O2 ovat lähempänä keskimmäisiä anglosaksisia näytteitä, O4:ssä on sama kuvio kuin rautakautisissa näytteissä ja O3:ssa alleelien jakautuminen on keskitasoa, mikä viittaa sekamuotoiseen syntyperään. Näytteiden väliset erot ovat suurimmat matalataajuisissa alleeleissa ja pienenevät alleelifrekvenssin kasvaessa. Tämä on sopusoinnussa sen kanssa, että matalamman frekvenssin mutaatiot ovat keskimäärin nuorempia, mikä kuvastaa tuoreempaa erillistä syntyperää, verrattuna korkeamman frekvenssin mutaatioihin, jotka kuvastavat vanhempaa jaettua syntyperää.
Tarkastelimme samalla menetelmällä myös 30 nykyaikaista näytettä UK10K-hankkeesta19 , joista kullakin oli 10 syntymäpaikkaa Itä-Englannissa, Walesissa ja Skotlannissa. Kaiken kaikkiaan nämä näytteet ovat lähempänä rautakautisia näytteitä kuin anglosaksisen ajan näytteitä (kuva 2a). Kolmen modernin brittiläisen näyteryhmän keskiarvojen välillä on pieni mutta merkittävä ero, sillä Itä-Englannin näytteet jakavat hieman enemmän alleeleja hollantilaisten kanssa ja skotlantilaiset näytteet muistuttavat enemmän rautakauden näytteitä.
Esi-isäosuuksien kvantifioimiseksi sovitimme modernit brittiläiset näytteet muinaiskomponenttien sekoitusmallilla sijoittamalla kaikki näytteet lineaariselle hollantilaisen suhteellisen alleelijakaantumisen akselille, joka integroi alleelien lukumääristä 1-5 saadut tiedot yhteen (kuvio 2b, täydentävä huomautus 3). Tällä mittarilla Itä-Englannin näytteet vastaavat keskimäärin 38 prosentin anglosaksista syntyperää, ja hajonta 25-50 prosentin välillä on suuri, ja Walesin ja Skotlannin näytteet vastaavat keskimäärin 30 prosentin anglosaksista syntyperää, ja hajonta on myös suuri (lisätaulukko 4). Nämä luvut ovat keskimäärin alhaisemmat, jos jätämme anglosaksisen ryhmän ulkopuolelle heikosti kattavan yksilön HS3 (35 % Itä-Englannin näytteissä). Samanlainen tulos saadaan, kun analysoidaan 1000 genomin projektin nykyaikaisia brittiläisiä näytteitä, joissa on vahva alusrakenne (täydentävä huomautus 4, täydentävä kuva 4). Huomaamme, että Kentin näytteissä on samanlainen 37 %:n anglosaksinen komponentti, kun niitä verrataan suomalaisiin ja espanjalaisiin ulkoryhmiin, ja Cornwallin näytteissä arvo on alhaisempi (Täydentävä kuva 5a, Täydentävä taulukko 4).
Vaihtoehtoinen ja mahdollisesti suorempi lähestymistapa näiden osuuksien arvioimiseen on mitata harvinaisten alleelien jakoa suoraan nykyajan brittiläisten ja muinaisnäytteiden välillä. Vaikka analyysi on paljon kohinaisempi kuin hollantilaisia ja espanjalaisia ulkoryhmiä käyttävä analyysi, sillä saadaan johdonmukaisia tuloksia (Täydentävä kuva 5b, Täydentävä huomautus 3). Yhteenvetona voidaan todeta, että tämän analyysin perusteella anglosaksisten maahanmuuttajien osuus nykybrittiläisten syntyperästä on keskimäärin 25-40 prosenttia, ja tämä osuus on suurempi Itä-Englannissa lähempänä maahanmuuttajalähdettä. Britannian sisäisten ryhmien välinen ero on yllättävän pieni verrattuna muinaisissa näytteissä havaittuihin suuriin eroihin. Tämä pätee sekä UK10K-näytteisiin että 1000 genomia -hankkeen brittinäytteisiin, vaikka toteammekin, että UK10K-näytteiden sijainnit eivät ehkä täysin heijasta historiallista maantieteellistä väestörakennetta viimeaikaisen väestön sekoittumisen vuoksi.
Yksi varoitus analyysissämme on se, että käytämme kolmea rautakautista Cambridgeshiren näytettä alkuperäisen brittiväestön sijaisnäytteinä, joka epäilemättä oli jäsenneltyä, vaikkakin vaikuttaa kohtuulliselta pitää näitä näytteiden edustajina ainakin Itä-Englannin osalta. Lisäksi roomalais-englantilaiselta kaudelta peräisin oleva mannermainen geneettinen kontribuutio sisällytettäisiin määritettyyn anglosaksiseen komponenttiin, samoin kuin myöhäisanglosaksinen skandinaavinen tai normannien kontribuutio. Nämä vaikutukset olisivat kuitenkin voimakkaita vain, jos kontribuutio olisi suuri ja voimakkaasti vinoutunut hollantilais-espanjalaiseen akseliin.
Populaatiohistoriallisen mallin rakentaminen harvinaisista varianteista
Saadaksemme lisätietoa näiden jakomallien taustalla olevasta historiasta kehitimme uuden herkän menetelmän, rarecoalin, jolla sovitetaan harvinaisten alleelien yhteiseen jakaumaan suuressa määrässä näyteaineistoja demografista mallia (lisähuomautusliitteet 5 ja 6). Strategiamme on rakentaa modernien eurooppalaisten populaatioiden välisestä suhteesta populaatiofylogenian muodossa oleva malli, johon voimme sijoittaa muinaiset näytteet. Myönnämme, että malli ilman sekoittumista ja jakautumisen jälkeistä geenivirtaa on riittämätön Euroopan väestöhistorian täydelliseksi kuvaukseksi. Tämä on kuitenkin luonnollinen yksinkertaistettu malli, ja tässä tutkimuksessa keskitytään ymmärtämään Englannin maahanmuuttajien ja alkuperäisväestöjen geneettisiä suhteita, joille tämä populaatiofylogeniamalli tarjoaa kohtuullisen telineen.
Keskeinen ajatus on mallintaa eksplisiittisesti johdettujen alleelien jakauman epävarmuus menneisyydessä, mutta approksimoida vastaavaa jakaumaa ei-alkuperäisten alleelien osalta sen odotusarvolla (kuva 3a). Koska rarecoal mallintaa eksplisiittisesti harvinaisia mutaatioita, se estimoi erotukset mutaatiokellon ajassa eikä geneettisen ajautumisen ajassa, toisin kuin yleisten varianttien alleelifrekvenssimuutoksiin perustuvat menetelmät20. Testasimme rarecoalia ensin simuloidulla datalla ja havaitsimme, että se pystyi rekonstruoimaan jakautumisajat ja haarapopulaatioiden koot hyvällä tarkkuudella (kuva 3b), ja se vastasi alleelien jakautumista lähes täsmälleen (täydentävä kuva 6). Testasimme myös sen kestävyyttä pienemmällä otoskoolla vain yhdessä populaatiossa (kuten tässä tutkituissa tanskalaisissa näytteissä) ja sekoittumisen vallitessa (lisähuomautus 5, lisäkuva 7).
Seuraavaksi sovelsimme rarecoal-menetelmää 524 näytteeseen kuudesta eurooppalaisesta populaatiosta (kuvat 3c,d) estimoidaksemme eurooppalaisen demografisen puun, johon voisimme sijoittaa muinaiset näytteet. Koska 1000 genomin projektin brittiläiset näytteet jakautuvat kolmeen erilliseen klusteriin, jotka heijastavat kolmea näytteenottopaikkaa (Kentistä, Cornwallista ja Orkneysaarilta osana Peoples of the British Isles -projektia4,21, lisähuomautus 4)16 , sovitimme eri puita näille eri ryhmille (lisäkuva 8). Yhteistä kaikille kolmelle puulle on ensimmäinen jakautuminen Etelä- ja Pohjois-Euroopan välillä, jonka mediaaniaika on ∼7 000 vuotta sitten, ja sen jälkeen vielä kolme ajallisesti lähempänä ∼5 000 vuotta sitten tapahtunutta jakautumista Alankomaiden, Tanskan, Suomen ja Britannian välillä. Mielenkiintoista on, että kun käytimme brittiläisiä näytteitä Cornwallista, saimme puun, jossa Cornwall muodostaa outgroupin hollantilaiselle, tanskalaiselle ja suomalaiselle väestölle (kuva 3c). Sitä vastoin kun käytämme Kentiä, se muodostaa kladin hollantilaisen väestön kanssa (kuva 3d), mikä on johdonmukaista sen kanssa, että Etelä-Englannissa on enemmän anglosaksista syntyperää kuin Cornwallissa. Kun käytämme Orkney-väestöä brittiläisenä haarana, puun topologia on samanlainen kuin Cornwallin tapauksessa. Nämä tulokset osoittavat, että sekä Cornwall että Orkney ovat kauempana Manner-Euroopasta kuin Kent. Kärkihaaran efektiivinen populaatiokoko on pienin Suomessa (∼12 000), mikä vastaa aiempia havaintoja22,23 , ja suurin Kentissä (∼191 000) ja Alankomaissa (∼184 000). Euroopan aineiston osalta alleelien jaon sopivuus on huonompi kuin simuloidun aineiston osalta (täydentävä kuva 9), mikä johtunee mallin yksinkertaistavista oletuksista, joiden mukaan populaatiokoko on vakio kussakin haarassa ja muuttoliikettä ei esiinny.
Suhteellisen tuore arvio Italian ja Espanjan välisestä jakautumisajankohdasta, ∼2 600 vuotta sitten, voi olla seurausta aiempaa erottelua seuranneesta muuttoliikkeestä; italialais-espanjalaisen esipopulaation populaatiokoko arvioitiin erittäin suureksi, eikä ylärajaa voitu määrittää, mikä voi olla esivanhempien alarakenteen tai sekoittumisen aiheuttama artefakti. Toinen selitys olisi se, että sekä espanjalaiseen että italialaiseen väestöön on sekoittunut samoja aineksia, mikä on johtanut suhteellisen tuoreeseen yhteiseen syntyperään. Näytämme täydentävässä kuvassa 7, miten sekoittuminen voi muuttaa rarecoal-estimaatteja tehokkaiden populaatiokokoestimaattien ja jakautumisaikojen osalta.
Modelling ancestry of ancient genomes using rarecoal
Laajemman eurooppalaisen sukulaisuussuhteen rekonstruoimisen lisäksi rarecoal-menetelmää voidaan käyttää myös yksittäisen muinaisnäytteen suhdetta eurooppalaiseen puuhun. Tätä varten oletamme mallin, jossa yksittäisen näytteen esi-isäpopulaatio sulautuu eurooppalaiseen puuhun tietyssä haarassa tiettynä ajankohtana ennen näytteen alkuperäpäivää. Tämän jälkeen voimme käyttää rarecoal-ohjelmaa arvioidaksemme muinaisen näytteen ja nykyisten populaatioiden välisten yhteisten alleelien jakotietojen todennäköisyyttä kussakin mallissa, joka on määritetty puun oksan ja yhdistymisajankohdan mukaan (kuva 4, lisähuomautus 5). Rautakauden ja anglosaksisen ajan näytteiden välillä oli selvä ero: anglosaksisen ajan näytteet yhdistyivät enimmäkseen hollantilaisiin ja tanskalaisiin haaroihin, kun taas rautakauden näytteet yhdistyivät mieluiten kaikkien nykyisten pohjoiseurooppalaisten näytteiden esi-isähaaran juurelle. Poikkeuksena on, että varhaisen anglosaksisen ajan O4-näytteessä on sama signaali kuin rautakautisissa näytteissä, mikä on yhdenmukaista harvinaisten alleelien jakoanalyysin kanssa (kuva 2). Näytteen O3, joka alleelien jakoanalyysissä näytti olevan sekamuotoinen, todennäköisyys sulautua tanskalaiseen haaraan on suurin. Tässä näytteessä on kuitenkin myös huomattavasti suurempi todennäköisyys sulautua samaan pohjoiseurooppalaiseen esi-isien haarautumispisteeseen kuin rautakauden näytteissä. Tämä on sopusoinnussa sen kanssa, että O3 on hiljattain sekoittanut alkuperäiskansojen ja anglosaksisen alkuperän, vaikkakaan emme voi sulkea pois monimutkaisempia skenaarioita, joihin liittyy tämän yksilön aiempi sekoittunut syntyperä roomalais-brittiläisellä kaudella. Anglosaksisen ajan näytteiden välillä on jonkin verran eroja: näytteillä O1, O2, HS1 ja HS3 on suurin todennäköisyys sulautua hollantilaiseen sukuhaaraan, kun taas näytteillä O3 ja HS2 on suurin todennäköisyys sulautua tanskalaiseen sukuhaaraan, vaikkakin joissakin tapauksissa näiden kahden vaihtoehdon välinen todennäköisyysero on pieni. HS3:n, HI1:n ja L:n signaalit ovat hajanaisempia alhaisen kattavuuden vuoksi, mutta johdonmukaisia muiden tulosten kanssa.