Näytteet ja sekvensointi

Loimme genomisekvenssit 10 näytteestä, jotka kerättiin kolmesta Itä-Englannin paikasta Cambridgen läheltä: Hinxton (viisi näytettä, Täydentävä kuva 1), Oakington (neljä näytettä, Täydentävä kuva 2) ja Linton (yksi näyte), jotka valittiin yhteensä 23 seulotusta näytteestä DNA:n säilyvyyden perusteella (kuva 1b, taulukko 1, täydentävä taulukko 1, täydentävä huomautus 1). Kaikki sekvensoidut näytteet ajoitettiin radiohiiliajoituksella (lisätaulukko 2), ja ne jakautuvat kolmeen ajanjaksoon: Lintonin näyte ja kaksi Hinxtonin näytettä ovat myöhäiseltä rautakaudelta (∼100 eaa.), Oakingtonin neljä näytettä varhaiselta anglosaksiselta kaudelta (viidennestä kuudennelle vuosisadalle) ja kolme Hinxtonin näytettä keskimmäiseltä anglosaksiselta kaudelta (seitsemännestä yhdeksännelle vuosisadalle; kuva 1c). Hinxtonin kaksi rautakautista näytettä ovat miespuolisia, kaikki muut näytteet ovat naispuolisia, mikä perustuu Y-kromosomipeittävyyteen ja on yhdenmukaista arkeologian kanssa. Kaikki näytteet sekvensoitiin genomin kattavuuteen 1x-12x (taulukko 1). Kaikissa näytteissä on alle 2 prosentin kontaminaatioprosentti, joka on arvioitu sekä mitokondrionaalisen DNA:n että ydin-DNA:n perusteella (täydentävä taulukko 3, täydentävä huomautus 2). Kaikkien näytteiden mitokondriaaliset ja Y-kromosomihaploryhmät ovat yleisimpiä haploryhmiä nykyisessä Luoteis-Euroopassa (taulukko 1)11,12 , eivätkä ne tässä tapauksessa ole informatiivisia maahanmuuttajien ja alkuperäisväestön syntyperän erottamiseksi toisistaan.

Taulukko 1 Yhteenveto kaikista tässä tutkimuksessa sekvensoiduista näytteistä.

Loimme pääkomponenttipiirroksen kymmenestä muinaisnäytteestä yhdessä julkaistusta aineistosta13,14 valittujen asiaankuuluvien eurooppalaisten populaatioiden kanssa (täydentävä kuva 3). Muinaisnäytteet sijoittuvat nykyisten englantilaisten ja skotlantilaisten näytteiden vaihteluvälille, ja Hinxtonin ja Lintonin rautakautiset näytteet sijoittuvat lähemmäksi nykyisiä englantilaisia ja ranskalaisia näytteitä, kun taas useimmat anglosaksisen ajan näytteet ovat lähempänä nykyisiä skotlantilaisia ja norjalaisia näytteitä. Kaiken kaikkiaan näiden näytteiden väliset populaatiogeneettiset erot yhteisillä alleeleilla ovat kuitenkin vähäisiä.

Anglosaksisen komponentin arvioiminen nykyajan Britanniassa

Nykyajan Britannian anglosaksisen komponentin arvioiminen

Vaikka pääkomponenttianalyysi voi paljastaa suhteellisen vanhan populaatiorakenteen, esimerkiksi pitkän aikavälin eristysetäisyysmallien15 perusteella syntyneen populaatiorakenteen, koko geeniperimän perimän sekvensseillä pystytään tutkimaan harvinaisia variantteja, jotta voidaan saada käsitys viimeaikaisemmasta populaation rakenteesta. Tunnistimme harvinaisia variantteja, joiden alleelifrekvenssi on enintään 1 %, vertailupaneelissa, joka koostui 433 eurooppalaisesta henkilöstä nykyajan Suomesta, Espanjasta, Italiasta, Alankomaista ja Tanskasta, joista on saatavilla genomin laajuisia sekvenssitietoja16,17,18. Määritimme kullekin muinaiselle näytteelle niiden harvinaisten varianttien määrän, jotka ovat yhteisiä kunkin vertailupopulaation kanssa (lisähuomautus 3). Näytteiden jakomalleissa on silmiinpistäviä eroja, joita havainnollistaa hollantilaisten kanssa jaettujen harvinaisten alleelien lukumäärän suhde espanjalaisten kanssa jaettujen alleelien lukumäärään (kuva 2a). Hinxtonin keskiaikaiset anglosaksiset näytteet (HS1, HS2 ja HS3) jakavat suhteellisesti enemmän harvinaisia variantteja nykyisten hollantilaisten kanssa kuin Hinxtonin rautakautiset näytteet (HI1 ja HI2) ja Linton (L). Oakingtonin varhaiset anglosaksiset näytteet ovat monimuotoisempia, sillä O1 ja O2 ovat lähempänä keskimmäisiä anglosaksisia näytteitä, O4:ssä on sama kuvio kuin rautakautisissa näytteissä ja O3:ssa alleelien jakautuminen on keskitasoa, mikä viittaa sekamuotoiseen syntyperään. Näytteiden väliset erot ovat suurimmat matalataajuisissa alleeleissa ja pienenevät alleelifrekvenssin kasvaessa. Tämä on sopusoinnussa sen kanssa, että matalamman frekvenssin mutaatiot ovat keskimäärin nuorempia, mikä kuvastaa tuoreempaa erillistä syntyperää, verrattuna korkeamman frekvenssin mutaatioihin, jotka kuvastavat vanhempaa jaettua syntyperää.

Kuvio 2: Suhteellinen harvinaisten alleelien jakaminen muinaisten ja nykyaikaisten näytteiden välillä.
kuvio2

(a) Nykyaikaisten hollantilaisten ja espanjalaisten näytteiden kanssa jaettujen harvinaisten alleelien lukumäärän suhde nykyaikaisten näytteiden joukon alleelimäärän funktiona. Muinaisten näytteiden koodit (vasen ja keskimmäinen osa) on määritelty taulukossa 1. Nykyaikaisista brittiläisistä yksilöistä saadut tulokset (oikeanpuoleinen osa) on laskettu keskiarvona 10 yksilöstä kustakin osapopulaatiosta. Vertailun vuoksi esitetään hollantilaisen ja espanjalaisen yksilön tulokset. Virhepalkit on laskettu raakalukumäärätilastoista ja käyttämällä s.e.-propagointia (Menetelmät-osio). (b) Nykyaikaisten hollantilaisten kanssa jaettujen harvinaisten alleelien suhteellinen osuus verrattuna espanjalaisten alleeleihin, integroituna alleelilukuun viisi asti nykyaikaisissa näytteissä. Rautakautiset ja anglosaksiset näytteet merkitsevät kahta ääripäätä tässä projektiossa, kun taas nykyaikaiset näytteet sijoittuvat niiden väliin, mikä viittaa anglosaksisen syntyperän sekoittuneeseen tasoon, joka on keskimäärin korkeampi Itä-Englannissa kuin Walesissa ja Skotlannissa, jossa on paljon päällekkäisyyttä. Kaksi varhaisanglosaksista näytettä Oakingtonista on jätetty keskiarvon laskennan ulkopuolelle, ja ne on merkitty tyhjillä ympyröillä, koska niissä on viitteitä sekoittuneisuudesta (O3) tai muusta kuin maahanmuuttajataustasta (O4). Yksi Skotlannista peräisin oleva moderni näyte on myös jätetty pois, ja se on merkitty tyhjällä ympyrällä, koska se on selvä poikkeama kaikkiin muihin skotlantilaisiin näytteisiin nähden. Näytteet on esitetty selkeyden parantamiseksi satunnaisesti pystysuunnassa. Nykyaikaisten näytteiden virhepalkit (jakso ”Menetelmät”) on jätetty tässä pois, mutta ne ovat samaa suuruusluokkaa kuin muinaisnäytteiden virhepalkit. Tämän kuvion tiedot ovat saatavilla Supplementary Data 1:ssä.

Tarkastelimme samalla menetelmällä myös 30 nykyaikaista näytettä UK10K-hankkeesta19 , joista kullakin oli 10 syntymäpaikkaa Itä-Englannissa, Walesissa ja Skotlannissa. Kaiken kaikkiaan nämä näytteet ovat lähempänä rautakautisia näytteitä kuin anglosaksisen ajan näytteitä (kuva 2a). Kolmen modernin brittiläisen näyteryhmän keskiarvojen välillä on pieni mutta merkittävä ero, sillä Itä-Englannin näytteet jakavat hieman enemmän alleeleja hollantilaisten kanssa ja skotlantilaiset näytteet muistuttavat enemmän rautakauden näytteitä.

Esi-isäosuuksien kvantifioimiseksi sovitimme modernit brittiläiset näytteet muinaiskomponenttien sekoitusmallilla sijoittamalla kaikki näytteet lineaariselle hollantilaisen suhteellisen alleelijakaantumisen akselille, joka integroi alleelien lukumääristä 1-5 saadut tiedot yhteen (kuvio 2b, täydentävä huomautus 3). Tällä mittarilla Itä-Englannin näytteet vastaavat keskimäärin 38 prosentin anglosaksista syntyperää, ja hajonta 25-50 prosentin välillä on suuri, ja Walesin ja Skotlannin näytteet vastaavat keskimäärin 30 prosentin anglosaksista syntyperää, ja hajonta on myös suuri (lisätaulukko 4). Nämä luvut ovat keskimäärin alhaisemmat, jos jätämme anglosaksisen ryhmän ulkopuolelle heikosti kattavan yksilön HS3 (35 % Itä-Englannin näytteissä). Samanlainen tulos saadaan, kun analysoidaan 1000 genomin projektin nykyaikaisia brittiläisiä näytteitä, joissa on vahva alusrakenne (täydentävä huomautus 4, täydentävä kuva 4). Huomaamme, että Kentin näytteissä on samanlainen 37 %:n anglosaksinen komponentti, kun niitä verrataan suomalaisiin ja espanjalaisiin ulkoryhmiin, ja Cornwallin näytteissä arvo on alhaisempi (Täydentävä kuva 5a, Täydentävä taulukko 4).

Vaihtoehtoinen ja mahdollisesti suorempi lähestymistapa näiden osuuksien arvioimiseen on mitata harvinaisten alleelien jakoa suoraan nykyajan brittiläisten ja muinaisnäytteiden välillä. Vaikka analyysi on paljon kohinaisempi kuin hollantilaisia ja espanjalaisia ulkoryhmiä käyttävä analyysi, sillä saadaan johdonmukaisia tuloksia (Täydentävä kuva 5b, Täydentävä huomautus 3). Yhteenvetona voidaan todeta, että tämän analyysin perusteella anglosaksisten maahanmuuttajien osuus nykybrittiläisten syntyperästä on keskimäärin 25-40 prosenttia, ja tämä osuus on suurempi Itä-Englannissa lähempänä maahanmuuttajalähdettä. Britannian sisäisten ryhmien välinen ero on yllättävän pieni verrattuna muinaisissa näytteissä havaittuihin suuriin eroihin. Tämä pätee sekä UK10K-näytteisiin että 1000 genomia -hankkeen brittinäytteisiin, vaikka toteammekin, että UK10K-näytteiden sijainnit eivät ehkä täysin heijasta historiallista maantieteellistä väestörakennetta viimeaikaisen väestön sekoittumisen vuoksi.

Yksi varoitus analyysissämme on se, että käytämme kolmea rautakautista Cambridgeshiren näytettä alkuperäisen brittiväestön sijaisnäytteinä, joka epäilemättä oli jäsenneltyä, vaikkakin vaikuttaa kohtuulliselta pitää näitä näytteiden edustajina ainakin Itä-Englannin osalta. Lisäksi roomalais-englantilaiselta kaudelta peräisin oleva mannermainen geneettinen kontribuutio sisällytettäisiin määritettyyn anglosaksiseen komponenttiin, samoin kuin myöhäisanglosaksinen skandinaavinen tai normannien kontribuutio. Nämä vaikutukset olisivat kuitenkin voimakkaita vain, jos kontribuutio olisi suuri ja voimakkaasti vinoutunut hollantilais-espanjalaiseen akseliin.

Populaatiohistoriallisen mallin rakentaminen harvinaisista varianteista

Saadaksemme lisätietoa näiden jakomallien taustalla olevasta historiasta kehitimme uuden herkän menetelmän, rarecoalin, jolla sovitetaan harvinaisten alleelien yhteiseen jakaumaan suuressa määrässä näyteaineistoja demografista mallia (lisähuomautusliitteet 5 ja 6). Strategiamme on rakentaa modernien eurooppalaisten populaatioiden välisestä suhteesta populaatiofylogenian muodossa oleva malli, johon voimme sijoittaa muinaiset näytteet. Myönnämme, että malli ilman sekoittumista ja jakautumisen jälkeistä geenivirtaa on riittämätön Euroopan väestöhistorian täydelliseksi kuvaukseksi. Tämä on kuitenkin luonnollinen yksinkertaistettu malli, ja tässä tutkimuksessa keskitytään ymmärtämään Englannin maahanmuuttajien ja alkuperäisväestöjen geneettisiä suhteita, joille tämä populaatiofylogeniamalli tarjoaa kohtuullisen telineen.

Keskeinen ajatus on mallintaa eksplisiittisesti johdettujen alleelien jakauman epävarmuus menneisyydessä, mutta approksimoida vastaavaa jakaumaa ei-alkuperäisten alleelien osalta sen odotusarvolla (kuva 3a). Koska rarecoal mallintaa eksplisiittisesti harvinaisia mutaatioita, se estimoi erotukset mutaatiokellon ajassa eikä geneettisen ajautumisen ajassa, toisin kuin yleisten varianttien alleelifrekvenssimuutoksiin perustuvat menetelmät20. Testasimme rarecoalia ensin simuloidulla datalla ja havaitsimme, että se pystyi rekonstruoimaan jakautumisajat ja haarapopulaatioiden koot hyvällä tarkkuudella (kuva 3b), ja se vastasi alleelien jakautumista lähes täsmälleen (täydentävä kuva 6). Testasimme myös sen kestävyyttä pienemmällä otoskoolla vain yhdessä populaatiossa (kuten tässä tutkituissa tanskalaisissa näytteissä) ja sekoittumisen vallitessa (lisähuomautus 5, lisäkuva 7).

Kuva 3: Euroopan historian mallintaminen rarecoalilla.
kuvio3

(a) Rarecoal seuraa harvinaisten alleelien (punainen) linjojen todennäköisyyksiä koalesenssikehyksessä ajassa taaksepäin ja approksimoi ei-alkuperäisten alleelien (tummansininen) jakaumaa (tummansininen) sen keskiarvolla. (b) Optimoimalla datan todennäköisyyttä mallin mukaan voimme arvioida populaatiokokoja ja jakautumisaikoja. Simuloidulla datalla testattuna estimaatit vastaavat hyvin todellisia arvoja (suluissa). (c) Sovellettuna satoihin eurooppalaisiin yksilöihin rarecoal arvioi aika-akselilla osoitetut jakautumisajat ja populaatiokoot kullekin haaralle. (d) Sama kuin c, mutta käyttäen Cornwallin sijasta Kentin näytteitä Ison-Britannian populaation korvikkeena. Erilainen puun topologia c:n ja d:n välillä heijastaa Cornwallin erilaista populaatiohistoriaa verrattuna Etelä-Englannissa sijaitsevaan Kentiin.

Seuraavaksi sovelsimme rarecoal-menetelmää 524 näytteeseen kuudesta eurooppalaisesta populaatiosta (kuvat 3c,d) estimoidaksemme eurooppalaisen demografisen puun, johon voisimme sijoittaa muinaiset näytteet. Koska 1000 genomin projektin brittiläiset näytteet jakautuvat kolmeen erilliseen klusteriin, jotka heijastavat kolmea näytteenottopaikkaa (Kentistä, Cornwallista ja Orkneysaarilta osana Peoples of the British Isles -projektia4,21, lisähuomautus 4)16 , sovitimme eri puita näille eri ryhmille (lisäkuva 8). Yhteistä kaikille kolmelle puulle on ensimmäinen jakautuminen Etelä- ja Pohjois-Euroopan välillä, jonka mediaaniaika on ∼7 000 vuotta sitten, ja sen jälkeen vielä kolme ajallisesti lähempänä ∼5 000 vuotta sitten tapahtunutta jakautumista Alankomaiden, Tanskan, Suomen ja Britannian välillä. Mielenkiintoista on, että kun käytimme brittiläisiä näytteitä Cornwallista, saimme puun, jossa Cornwall muodostaa outgroupin hollantilaiselle, tanskalaiselle ja suomalaiselle väestölle (kuva 3c). Sitä vastoin kun käytämme Kentiä, se muodostaa kladin hollantilaisen väestön kanssa (kuva 3d), mikä on johdonmukaista sen kanssa, että Etelä-Englannissa on enemmän anglosaksista syntyperää kuin Cornwallissa. Kun käytämme Orkney-väestöä brittiläisenä haarana, puun topologia on samanlainen kuin Cornwallin tapauksessa. Nämä tulokset osoittavat, että sekä Cornwall että Orkney ovat kauempana Manner-Euroopasta kuin Kent. Kärkihaaran efektiivinen populaatiokoko on pienin Suomessa (∼12 000), mikä vastaa aiempia havaintoja22,23 , ja suurin Kentissä (∼191 000) ja Alankomaissa (∼184 000). Euroopan aineiston osalta alleelien jaon sopivuus on huonompi kuin simuloidun aineiston osalta (täydentävä kuva 9), mikä johtunee mallin yksinkertaistavista oletuksista, joiden mukaan populaatiokoko on vakio kussakin haarassa ja muuttoliikettä ei esiinny.

Suhteellisen tuore arvio Italian ja Espanjan välisestä jakautumisajankohdasta, ∼2 600 vuotta sitten, voi olla seurausta aiempaa erottelua seuranneesta muuttoliikkeestä; italialais-espanjalaisen esipopulaation populaatiokoko arvioitiin erittäin suureksi, eikä ylärajaa voitu määrittää, mikä voi olla esivanhempien alarakenteen tai sekoittumisen aiheuttama artefakti. Toinen selitys olisi se, että sekä espanjalaiseen että italialaiseen väestöön on sekoittunut samoja aineksia, mikä on johtanut suhteellisen tuoreeseen yhteiseen syntyperään. Näytämme täydentävässä kuvassa 7, miten sekoittuminen voi muuttaa rarecoal-estimaatteja tehokkaiden populaatiokokoestimaattien ja jakautumisaikojen osalta.

Modelling ancestry of ancient genomes using rarecoal

Laajemman eurooppalaisen sukulaisuussuhteen rekonstruoimisen lisäksi rarecoal-menetelmää voidaan käyttää myös yksittäisen muinaisnäytteen suhdetta eurooppalaiseen puuhun. Tätä varten oletamme mallin, jossa yksittäisen näytteen esi-isäpopulaatio sulautuu eurooppalaiseen puuhun tietyssä haarassa tiettynä ajankohtana ennen näytteen alkuperäpäivää. Tämän jälkeen voimme käyttää rarecoal-ohjelmaa arvioidaksemme muinaisen näytteen ja nykyisten populaatioiden välisten yhteisten alleelien jakotietojen todennäköisyyttä kussakin mallissa, joka on määritetty puun oksan ja yhdistymisajankohdan mukaan (kuva 4, lisähuomautus 5). Rautakauden ja anglosaksisen ajan näytteiden välillä oli selvä ero: anglosaksisen ajan näytteet yhdistyivät enimmäkseen hollantilaisiin ja tanskalaisiin haaroihin, kun taas rautakauden näytteet yhdistyivät mieluiten kaikkien nykyisten pohjoiseurooppalaisten näytteiden esi-isähaaran juurelle. Poikkeuksena on, että varhaisen anglosaksisen ajan O4-näytteessä on sama signaali kuin rautakautisissa näytteissä, mikä on yhdenmukaista harvinaisten alleelien jakoanalyysin kanssa (kuva 2). Näytteen O3, joka alleelien jakoanalyysissä näytti olevan sekamuotoinen, todennäköisyys sulautua tanskalaiseen haaraan on suurin. Tässä näytteessä on kuitenkin myös huomattavasti suurempi todennäköisyys sulautua samaan pohjoiseurooppalaiseen esi-isien haarautumispisteeseen kuin rautakauden näytteissä. Tämä on sopusoinnussa sen kanssa, että O3 on hiljattain sekoittanut alkuperäiskansojen ja anglosaksisen alkuperän, vaikkakaan emme voi sulkea pois monimutkaisempia skenaarioita, joihin liittyy tämän yksilön aiempi sekoittunut syntyperä roomalais-brittiläisellä kaudella. Anglosaksisen ajan näytteiden välillä on jonkin verran eroja: näytteillä O1, O2, HS1 ja HS3 on suurin todennäköisyys sulautua hollantilaiseen sukuhaaraan, kun taas näytteillä O3 ja HS2 on suurin todennäköisyys sulautua tanskalaiseen sukuhaaraan, vaikkakin joissakin tapauksissa näiden kahden vaihtoehdon välinen todennäköisyysero on pieni. HS3:n, HI1:n ja L:n signaalit ovat hajanaisempia alhaisen kattavuuden vuoksi, mutta johdonmukaisia muiden tulosten kanssa.

Kuvio 4: Muinaisten näytteiden sijoittaminen eurooppalaiseen puuhun.
kuvio4>

Valittuamme eurooppalaisen puun, jossa on Cornwall brittiläisenä populaatiohaarana, kartoitamme muinaisnäytteet kyseiseen puuhun. Väritämme puun jokaisen pisteen sen mukaan, kuinka todennäköisesti muinaisnäytteen esi-isähaarukka sulautuu kyseisessä pisteessä. Suurimman todennäköisyyden yhdistymispiste on merkitty mustalla ympyrällä. Analyysi osoittaa, että rautakautiset näytteet L, HI1 ja HI2 sulautuvat suurimmalla todennäköisyydellä kaikkien analysoitujen pohjoiseurooppalaisten populaatioiden esi-isähaaraan, kun taas anglosaksiset näytteet sulautuvat hollantilaisiin ja tanskalaisiin haaroihin. Matalan kattavuuden näytteillä L, HI1 ja HS3 on suurin hajonta todennäköisyydessä, mutta ne ovat yhdenmukaisia korkeamman kattavuuden näytteiden kanssa.

Muinaisnäytteiden kartoitus puuhun on samankaltainen puun kohdalla, jossa käytetään Kentiä brittiläisenä populaationa (lisäkuvio 10), ja puun kohdalla, jossa käytetään Cornwallia brittiläisenä sijaisväestönä (kuvio 4). Erityisesti rautakautiset näytteet sijoittuvat Pohjois-Euroopan väestöjen esi-isähaaraan riippumatta siitä, käytetäänkö Kentiä vai Cornwallia brittiläisenä sijaishaarana. Tämä viittaa siihen, että mikään aineistomme nykyisistä populaatioista, Cornwallin populaatio mukaan luettuna, ei ole yhtä läheisessä sukulaisuussuhteessa rautakautisiin näytteisiin kuin Tanska ja Alankomaat anglosaksisiin näytteisiin.

Varmensimme lähestymistapamme yksittäisten näytteiden kartoittamisesta puuhun sijoittamalla nykyaikaiset näytteet samaan puuhun kuin kuvassa 4. Huomasimme, että kaikki puun rakentamisessa käytettyjen populaatioiden näytteet sijoittuivat odotetusti oman haaransa kärkeen (lisäkuva 11). Kun kartoitetaan näytteitä ryhmistä, joita ei ole puussa, kuten Kentin ja Orkneysaarten näytteet, havaitaan, että ne kartoitetaan samaan esi-isien paikkaan kuin rautakautiset näytteet (täydentävä kuva 11), mikä vahvistaa, että ne ovat peräisin Cornwallin väestöstä ja muista puun rakentamisessa käytetyistä populaatioista, samoin kuin rautakautiset näytteet. Kuten täydentävässä huomautuksessa 5 todetaan, kartoitusmenetelmämme riippuu ratkaisevasti vertailupopulaatioiden asianmukaisesta mallista. Kun puun rakentamiseen käytetään Kentin väestöä (kuva 3c), havaitsemme, että brittiläisten näytteiden kartoittaminen huononee (täydentävä kuva 12), mikä johtuu luultavasti siitä, että Kentin väestö ei ole geneettisesti yhtä selvärajainen ja sekoittuneempi kuin Cornwallin ryhmä. Tällaisissa tapauksissa meidän on mallinnettava populaatioiden fylogenioita, joissa on mukana sekoittumista ja geenivirtoja, ja rarecoalin jatkokehitys mahdollistaa näiden monimutkaisempien skenaarioiden tutkimisen.

Vastaa

Sähköpostiosoitettasi ei julkaista.