Samples and sequencing
Wij genereerden genoomsequenties voor 10 monsters die verzameld werden op drie sites in Oost-Engeland dicht bij Cambridge: Hinxton (vijf monsters, aanvullende fig. 1), Oakington (vier monsters, aanvullende fig. 2) en Linton (1 monster), die werden geselecteerd uit een totaal van 23 gescreende monsters op basis van DNA-preservatie (fig. 1b, tabel 1, aanvullende tabel 1, aanvullende noot 1). Alle sequentiemonsters werden radiokoolstof gedateerd (Supplementary Table 2), en vallen in drie tijdsperioden uiteen: het Linton monster en twee Hinxton monsters stammen uit de late IJzertijd (∼100 BCE), de vier monsters uit Oakington uit de vroege Angelsaksische periode (vijfde tot zesde eeuw), en drie Hinxton monsters uit de midden Angelsaksische periode (zevende tot negende eeuw; Fig. 1c). De twee ijzertijdmonsters uit Hinxton zijn mannelijk, alle andere monsters zijn vrouwelijk, gebaseerd op Y-chromosoomdekking en consistent met de archeologie. Alle monsters werden gesequenced tot een genoombrede dekking van 1x tot 12x (Tabel 1). Alle hebben een contaminatiegraad van minder dan 2%, zoals geschat op basis van zowel mitochondriaal DNA als nucleair DNA (aanvullende tabel 3, aanvullende noot 2). Mitochondriale en Y-chromosoom haplogroepen van alle monsters behoren tot de meest voorkomende haplogroepen in het huidige Noordwest-Europa (tabel 1)11,12 en zijn in dit geval niet informatief voor het onderscheiden van immigranten- versus inheemse voorouders.
We genereerden een principale-componentenplot van de 10 oude monsters samen met relevante Europese populaties geselecteerd uit gepubliceerde gegevens13,14 (Supplementary Fig. 3). De monsters uit de oudheid vallen binnen het bereik van moderne Engelse en Schotse monsters, waarbij de monsters uit de ijzertijd van Hinxton en Linton dichter bij de moderne Engelse en Franse monsters vallen, terwijl de meeste monsters uit de Angelsaksische tijd dichter bij de moderne Schotse en Noorse monsters liggen. Over het algemeen zijn de populatiegenetische verschillen tussen deze monsters op gemeenschappelijke allelen echter klein.
Raming van de Angelsaksische component in modern Groot-Brittannië
Terwijl hoofdcomponentenanalyse relatief oude populatiestructuur kan onthullen, zoals gegenereerd uit lange-termijn isolatie-per-afstand modellen15, stellen genoomsequenties ons in staat zeldzame varianten te bestuderen om inzicht te krijgen in meer recente populatiestructuur. Wij identificeerden zeldzame varianten met allelfrequenties tot 1% in een referentiepanel van 433 Europese individuen uit het moderne Finland, Spanje, Italië, Nederland en Denemarken, waarvoor genoombrede sequentiegegevens beschikbaar zijn16,17,18. We bepaalden voor elk oud monster het aantal zeldzame varianten dat werd gedeeld met elke referentiepopulatie (aanvullende noot 3). Er zijn opvallende verschillen in de delingspatronen van de monsters, geïllustreerd door de verhouding van het aantal zeldzame allelen gedeeld met Nederlandse individuen tot het aantal gedeeld met Spaanse individuen (Fig. 2a). De midden Angelsaksische monsters uit Hinxton (HS1, HS2 en HS3) delen relatief meer zeldzame varianten met moderne Nederlanders dan de ijzertijd monsters uit Hinxton (HI1 en HI2) en Linton (L). De vroeg Angelsaksische monsters uit Oakington zijn meer divers, waarbij O1 en O2 dichter bij de midden Angelsaksische monsters liggen, O4 hetzelfde patroon vertoont als de ijzertijdmonsters en O3 een gemiddeld niveau van alleldeling vertoont, wat wijst op een gemengde afstamming. De verschillen tussen de monsters zijn het grootst bij de laagfrequente allelen en nemen af naarmate de allelfrequentie toeneemt. Dit is consistent met het feit dat mutaties met een lagere frequentie gemiddeld jonger zijn, wat wijst op een meer recente afzonderlijke afstamming, vergeleken met mutaties met een hogere frequentie die wijzen op een oudere gedeelde afstamming.
We hebben met dezelfde methode ook 30 moderne monsters van het UK10K-project19 onderzocht, 10 elk met geboorteplaatsen in Oost-Engeland, Wales en Schotland. Over het algemeen staan deze monsters dichter bij de monsters uit de IJzertijd dan bij de monsters uit de Angelsaksische tijd (Fig. 2a). Er is een klein maar significant verschil tussen de gemiddelde waarden in de drie moderne Britse steekproefgroepen, waarbij de Oost-Engelse steekproeven iets meer allelen delen met de Nederlanders, en de Schotse steekproeven meer lijken op de IJzertijd steekproeven.
Om de voorouderfracties te kwantificeren, passen we de moderne Britse steekproeven met een mengmodel van oude componenten, door alle steekproeven op een lineaire as van relatieve Nederlandse allel-deling te plaatsen die de gegevens van allel-tellingen 1-5 integreert (Fig. 2b, aanvullende noot 3). Volgens deze maatstaf zijn de Oost-Engelse monsters consistent met gemiddeld 38% Angelsaksische afstamming, met een grote spreiding van 25 tot 50%, en zijn de Welshe en Schotse monsters consistent met gemiddeld 30% Angelsaksische afstamming, opnieuw met een grote spreiding (supplementaire tabel 4). Deze aantallen zijn gemiddeld lager als we het individu met de lage dekkingsgraad HS3 uitsluiten van de Angelsaksische groep (35% voor Oost-Engelse steekproeven). Een soortgelijk resultaat wordt verkregen wanneer we moderne Britse monsters analyseren van het 1.000 Genomes Project, die een sterke substructuur vertonen (Supplementary Note 4, Supplementary Fig. 4). We vinden dat monsters uit Kent een vergelijkbare Angelsaksische component van 37% vertonen in vergelijking met Finse en Spaanse outgroups, met een lagere waarde voor monsters uit Cornwall (Supplementary Fig. 5a, Supplementary Table 4).
Een alternatieve en mogelijk directere benadering om deze fracties te schatten is het meten van zeldzame allel-deling direct tussen de moderne Britse en de oude monsters. Hoewel dit veel meer ruis oplevert dan de analyse met behulp van Nederlandse en Spaanse outgroups, levert dit consistente resultaten op (Supplementary Fig. 5b, Supplementary Note 3). Samenvattend suggereert deze analyse dat gemiddeld 25-40% van de voorouders van de moderne Britten werd bijgedragen door Angelsaksische immigranten, met het hoogste aantal in Oost-Engeland, dichter bij de immigratiebron. Het verschil tussen groepen binnen Groot-Brittannië is verrassend klein in vergelijking met de grote verschillen die bij de oude steekproeven werden waargenomen. Dit geldt zowel voor de UK10K monsters als voor de Britse monsters van het 1.000 Genomes project, hoewel we opmerken dat de locaties van de UK10K monsters mogelijk niet volledig de historische geografische bevolkingsstructuur weerspiegelen vanwege recente vermenging van bevolkingsgroepen.
Eén voorbehoud bij onze analyse is dat we de drie ijzertijdmonsters uit Cambridgeshire gebruiken als proxies voor de inheemse Britse bevolking, die ongetwijfeld gestructureerd was, hoewel het redelijk lijkt om deze tenminste als vertegenwoordigers voor Oost-Engeland te nemen. Bovendien zou een eventuele continentale genetische bijdrage uit de Romeins-Britse periode in de toegewezen Angelsaksische component worden verdisconteerd, evenals een laat Angelsaksische Scandinavische of Normandische bijdrage. Deze effecten zouden echter alleen sterk zijn als de bijdrage groot was en sterk vertekend op de Nederlands-Spaanse as.
Building a population history model from rare variants
Om meer inzicht te krijgen in de geschiedenis die aan deze delingspatronen ten grondslag ligt, hebben we een gevoelige nieuwe methode ontwikkeld, rarecoal, die een demografisch model past op de gezamenlijke verdeling van zeldzame allelen in een groot aantal steekproeven (Supplementary Notes 5 en 6). Onze strategie is om een model te bouwen in de vorm van een populatiefylogenie van de relatie tussen moderne Europese populaties, waarin we de oude monsters kunnen plaatsen. Wij erkennen dat een model zonder vermenging en genenstroom na de splitsing ontoereikend is als een volledige beschrijving van de Europese bevolkingsgeschiedenis. Dit is echter een natuurlijk vereenvoudigd model, en de nadruk in deze studie ligt op het begrijpen van de genetische relaties van immigranten en inheemse populaties in Engeland, waarvoor dit fylogeniemodel een redelijke steiger biedt.
Het belangrijkste idee is om de onzekerheid in het verleden van de verdeling van afgeleide allelen expliciet te modelleren, maar de overeenkomstige verdeling voor niet-afgeleide allelen te benaderen door de verwachting ervan (Fig. 3a). Omdat rarecoal expliciet zeldzame mutaties modelleert, schat het scheidingen in mutatiekloktijd en niet in genetische drifttijd, in tegenstelling tot methoden die gebaseerd zijn op allelfrequentieveranderingen in veel voorkomende varianten20. We hebben rarecoal eerst getest op gesimuleerde data en ontdekten dat het in staat was om met goede nauwkeurigheid splitsingstijden en takpopulatiegroottes te reconstrueren (Fig. 3b), waarbij de allelverdeling bijna exact overeenkwam (Supplementary Fig. 6). We hebben ook de robuustheid getest met een kleinere steekproefgrootte in slechts één populatie (zoals in de hier bestudeerde Deense monsters), en onder vermenging (aanvullende noot 5, aanvullende fig. 7).
Wij pasten vervolgens rarecoal toe op 524 monsters van zes populaties in Europa (Fig. 3c,d) om een Europese demografische boom te schatten waarin we de oude monsters konden plaatsen. Omdat de Britse monsters in het 1000-genomen project in drie verschillende clusters vallen, die drie monsterlocaties weerspiegelen (uit Kent, Cornwall en de Orkney Eilanden, als onderdeel van het Peoples of the British Isles project4,21, aanvullende noot 4)16, pasten we verschillende bomen op deze verschillende groepen (aanvullende fig. 8). Het gemeenschappelijke kenmerk in alle drie de bomen is een eerste splitsing tussen Zuid- en Noord-Europa met een mediane tijd ∼7.000 jaar geleden, gevolgd door nog drie scheidingen dicht in de tijd ∼5.000 jaar geleden tussen Nederland, Denemarken, Finland en Groot-Brittannië. Interessant is dat wanneer we de Britse monsters uit Cornwall gebruiken, we een boom verkrijgen waarbij Cornwall een outgroup vormt van de Nederlandse, Deense en Finse populatie (Fig. 3c). Wanneer we daarentegen Kent gebruiken, vormt het een clade met de Nederlandse populatie (Fig. 3d), consistent met een hogere Angelsaksische afstamming in het zuiden van Engeland dan in Cornwall. Wanneer we de Orkney populatie gebruiken als de Britse tak, vinden we een vergelijkbare boomtopologie als die voor Cornwall. Deze resultaten tonen aan dat zowel Cornwall als Orkney verder verwant zijn met het Europese vasteland dan Kent. De effectieve populatiegrootte van de tiptak is het laagst in Finland (∼12.000), in overeenstemming met eerdere waarnemingen22,23, en het hoogst in Kent (∼191.000) en in Nederland (∼184.000). Voor de Europese gegevens is de allel-sharing fit slechter dan voor de gesimuleerde gegevens (supplementaire fig. 9), vermoedelijk als gevolg van vereenvoudigende modelaannames van een constante populatiegrootte in elke tak en de afwezigheid van migratie.
De relatief recente schatting van de splitsingstijd tussen Italië en Spanje, ∼2.600 jaar geleden, kan een gevolg zijn van migratie na een eerdere scheiding; de populatiegrootte van de Italiaans-Spaanse voorouderpopulatie werd extreem groot geschat en een bovengrens kon niet worden bepaald, wat een artefact van voorouderlijke substructuur of bijmenging zou kunnen zijn. Een andere verklaring zou een gemeenschappelijke bron van vermenging in zowel de Spaanse als de Italiaanse populatie zijn, resulterend in relatief recente gemeenschappelijke voorouders. We laten in supplementaire Fig. 7 zien hoe bijmenging de schattingen van de effectieve populatiegrootte en de splitsingstijden door rarecoal kan veranderen.
Modellering van de voorouders van oude genomen met behulp van rarecoal
Naast het reconstrueren van de bredere Europese verwantschap uit een grote steekproefset, kan rarecoal ook worden gebruikt om de relatie van een enkel oud monster met de Europese boom te evalueren. Om dit te doen, gaan we uit van een model waarin de voorouderlijke populatie van het enkele monster fuseert met de Europese boom bij een bepaalde tak op een bepaald tijdstip vóór de datum van oorsprong van het monster. We kunnen dan rarecoal gebruiken om de waarschijnlijkheid te evalueren van de gezamenlijke allel-sharing gegevens tussen het oude monster en de moderne populaties onder elk model, gespecificeerd door de tak en de fusietijd in de boom (Fig. 4, supplementaire noot 5). Er was een duidelijk verschil tussen de monsters uit de IJzertijd en de monsters uit de Angelsaksische tijd: de monsters uit de Angelsaksische tijd fuseerden meestal op de Nederlandse en Deense tak, terwijl de monsters uit de IJzertijd bij voorkeur fuseerden aan de basis van de voorouderlijke tak voor alle moderne Noord-Europese monsters. De uitzondering is dat de vroeg Angelsaksische O4 hetzelfde signaal vertoont als de ijzertijdmonsters, wat consistent is met de analyse van de zeldzame allel-sharing (Fig. 2). Voor monster O3, dat van gemengde afkomst leek te zijn in de allel-sharing analyse, vinden we de hoogste waarschijnlijkheid voor samenvoeging met de Deense tak. In dit monster is er echter ook een opmerkelijk hogere waarschijnlijkheid om te fuseren met hetzelfde Noord-Europese voorouderlijke tak zoals we zagen voor de IJzertijd monsters. Dit is consistent met O3 als zijnde van recent gemengde inheemse en Angelsaksische oorsprong, hoewel we complexere scenario’s niet kunnen uitsluiten waarbij dit individu al eerder gemengde voorouders had tijdens de Romaanse-Britse periode. Er is enige differentiatie tussen de Angelsaksische tijd monsters waarbij de monsters O1, O2, HS1 en HS3 de hoogste waarschijnlijkheid hebben om te fuseren met de Nederlandse tak terwijl O3 en HS2 de hoogste waarschijnlijkheid hebben om te fuseren met de Deense tak, hoewel in sommige gevallen het verschil in waarschijnlijkheid tussen deze twee mogelijkheden klein is. De signalen van HS3, HI1 en L zijn meer gespreid als gevolg van een lage dekking, maar consistent met de andere resultaten.
De kartering van de oude monsters op de boom is vergelijkbaar voor de boom die Kent als Britse populatie gebruikt (aanvullende Fig. 10) en voor de boom die Cornwall als Britse proxy gebruikt (Fig. 4). In het bijzonder passen de ijzertijdmonsters in de voorouderlijke tak van de Noord-Europese populaties, ongeacht of Kent of Cornwall als Britse proxy wordt gebruikt. Dit suggereert dat geen van de huidige populaties in onze gegevensverzameling, inclusief de populatie uit Cornwall, zo nauw verwant is met de ijzertijdmonsters als Denemarken en Nederland met de Angelsaksische monsters.
We valideerden onze benadering van het in kaart brengen van individuele monsters in een boom door moderne monsters in dezelfde boom te plaatsen als in Fig. 4. We vinden alle monsters van populaties die gebruikt zijn bij het bouwen van de boom geplaatst op het uiteinde van hun respectievelijke tak zoals verwacht (supplementaire Fig. 11). Bij het in kaart brengen van monsters uit groepen die niet in de stamboom voorkomen, zoals het geval is voor monsters uit Kent en Orkney, zien we dat ze op dezelfde voorouderlijke locatie worden geplaatst als de monsters uit de IJzertijd (aanvullende Fig. 11), wat bevestigt dat ze een andere voorouderlijke afstamming hebben dan de Cornish populatie en andere populaties die gebruikt zijn bij het maken van de stamboom, net als de monsters uit de IJzertijd. Zoals gedetailleerd in aanvullende aantekening 5, hangt onze karteringsbenadering in belangrijke mate af van een geschikt model voor de referentiepopulaties. Wanneer we de Kent populatie gebruiken voor het opzetten van de stamboom (Fig. 3c), zien we dat het in kaart brengen van Britse monsters slechter wordt (aanvullende Fig. 12), waarschijnlijk omdat de Kent populatie minder genetisch gedefinieerd en meer vermengd is dan de groep uit Cornwall. In dergelijke gevallen moeten we populatiefylogenieën modelleren met vermenging en genenstroom, en verdere ontwikkeling op rarecoal zal ons in staat stellen deze meer complexe scenario’s te bestuderen.