サンプルと配列決定
ケンブリッジに近い東イングランドの3つの遺跡から収集した10サンプルについてゲノム配列を作成しました。 Hinxton (5 サンプル、補足図1), Oakington (4 サンプル、補足図2), Linton (1 サンプル) の3地点から収集した10サンプルについて、DNA保存率に基づいてスクリーニングしたところ、合計23サンプルから選択されました (図1b、表1、補足表1、補足注1)。 配列決定されたすべての試料は放射性炭素年代測定が行われ(補表2)、3つの時代に分類された。Linton試料とHinxtonの2つの試料は鉄器時代後期(前100年頃)、Oakingtonの4つの試料はアングロサクソン時代初期(5~6世紀)、Hinxtonの3つの試料はアングロサクソン時代中期(7~9世紀;図1c)である。 Hinxtonの鉄器時代の2つのサンプルは男性で、その他のサンプルはY染色体のカバー率から女性であり、考古学と一致しています。 すべてのサンプルは、1倍から12倍までのゲノムワイドカバレッジで配列決定されました(表1)。 ミトコンドリアDNAと核DNAの両方から推定される汚染率は、すべて2%以下である(補足表3、補足注2)。 すべてのサンプルのミトコンドリアおよびY染色体ハプログループは、現在の北西ヨーロッパで最も一般的なハプログループの一つであり(表1)11,12、この場合、移民と先住民の祖先を区別するための情報源にはならない。
10個の古代サンプルと、公表データから選んだ関連ヨーロッパ集団の主成分図を作成した13、14(補足図3)。 古代のサンプルは現代のイングランドとスコットランドのサンプルの範囲内にあり、ヒンクストンとリントンの鉄器時代のサンプルは現代のイングランドとフランスのサンプルに近く、一方、ほとんどのアングロサクソン時代のサンプルは現代のスコットランドとノルウェーのサンプルに近かった。 しかし、全体として、共通対立遺伝子におけるこれらのサンプル間の集団遺伝的差異は小さい。
現代のイギリスにおけるアングロサクソン成分の推定
主成分分析によって、長期間の隔離による距離モデル15から生み出されるような比較的古い集団構造を明らかにできる一方で、全ゲノム配列によって、より最近の集団構造について洞察を得るために稀な変種を研究できる。 我々は、現代のフィンランド、スペイン、イタリア、オランダ、デンマークの433人からなる参照パネルにおいて、アレル頻度1%までの希少バリアントを同定した16,17,18。 それぞれの古代サンプルについて、各参照集団と共有する希少バリアントの数を求めた(補足注3)。 オランダ人と共有する希少対立遺伝子数とスペイン人と共有する希少対立遺伝子数の比率で示されるように、サンプルの共有パターンには著しい違いがある(図2a)。 HinxtonのMiddle Anglo-Saxon サンプル(HS1、HS2、HS3)は、Hinxton(HI1、HI2)やLinton(L)の鉄器時代のサンプルよりも、現代オランダ人と比較的多くの希少バリアントを共有しています。 Oakingtonの初期アングロサクソン系サンプルはより多様で、O1とO2は中期アングロサクソン系サンプルに近く、O4は鉄器時代のサンプルと同じパターンを示し、O3は中間のレベルの対立遺伝子共有を示し、混合祖先を示唆している。 サンプル間の差は低頻度の対立遺伝子で最も大きく、対立遺伝子頻度が高くなるにつれて減少する。 このことは、平均して低い頻度の突然変異はより若く、より最近の別個の祖先を反映しているのに対し、高い頻度の突然変異はより古い共有の祖先を反映していることと一致する。
我々はまた、UK10Kプロジェクト19から、東イングランド、ウェールズ、スコットランドの出生地を持つ各10個の現代サンプル30個を同じ手法で調べた。 全体として、これらのサンプルは、アングロサクソン時代のサンプルよりも鉄器時代のサンプルに近い(図2a)。
祖先分率を定量化するために、現代イギリス人サンプルに古代成分の混合モデルを当てはめ、すべてのサンプルを対立遺伝子数1~5のデータを統合した相対的オランダ対立遺伝子共有の直線軸上に配置した(図2b、補足注3)。 この尺度では、東部イングランドのサンプルは平均38%のアングロサクソン系祖先と一致するが、25~50%と大きな開きがあり、ウェールズとスコットランドのサンプルは平均30%のアングロサクソン系祖先と一致するが、やはり大きな開きがある(補表4)。 これらの数字は、アングロサクソン系集団からカバー率の低い個人HS3を除外すると、平均的に低くなる(East Englishサンプルでは35%)。 同様の結果は、強い部分構造を示す1,000 Genomes Projectの現代イギリス人サンプルを分析した場合にも得られる(補足注4、補足図4)。 ケント州のサンプルをフィンランドやスペインのアウトグループと比較すると,同様のアングロサクソン成分が37%であり,コーンウォールのサンプルはより低い値であることがわかった(補足図5a,補足表4)。
これらの割合を推定するための代替的で潜在的により直接的なアプローチは,現代イギリスと古代のサンプル間で希少アレルの共有を直接計測することである。 オランダやスペインのアウトグループを用いた分析よりもはるかにノイズが多いものの、一貫した結果が得られた(補足図5b、補足注3)。 要約すると、この解析は現代イギリス人の祖先の平均25-40%がアングロサクソン系移民によってもたらされ、その数は移民源に近い東イングランドでより多くなることを示唆している。 英国内のグループ間の差は、古代のサンプルに見られた大きな差に比べると驚くほど小さい。 これはUK10Kサンプルと1,000ゲノムプロジェクトのイギリス人サンプルの両方に当てはまるが、UK10Kサンプルの位置は最近の人口混合により歴史的な地理的集団構造を完全に反映していないかもしれないことに注意したい。
我々の分析の注意点の1つは、ケンブリッジシャーからの3つの鉄器時代のサンプルを、間違いなく構造化したイギリスの先住民のプロキシとして使用していることだが、これらを少なくとも東イングランドの代表と見なすことは妥当だと思われる。 さらに、ロマノ・ブリティッシュ時代からの大陸系遺伝子の寄与は、アングロサクソン系に割り当てられた成分に組み込まれるでしょうし、アングロサクソン後期のスカンジナビア人やノルマン人の寄与も含まれるでしょう。
Building a population history model from rare variants
これらの共有パターンの根底にある歴史をさらに理解するために、我々は、多数のサンプルにおける希少対立遺伝子の共同分布に人口統計モデルを当てはめる、感度の高い新しい手法rarecoalを開発した(補注5および6)。 私たちの戦略は、現代のヨーロッパ集団の関係を表す集団系統図の形でモデルを構築し、そこに古代のサンプルを配置することである。 混血や分裂後の遺伝子流を含まないモデルは、ヨーロッパ集団史の完全な記述としては不十分であることは認識している。 しかし、これは自然な単純化されたモデルであり、本研究の焦点はイングランドにおける移民と先住民の遺伝的関係の理解であり、この集団系統樹モデルは妥当な足場を提供する。
重要なアイデアは、派生対立遺伝子の分布の過去の不確実性を明示的にモデル化し、非派生対立遺伝子に対応する分布はその期待値で近似する(図3a)ことである。 rarecoalは希少な突然変異を明示的にモデル化しているため,一般的な変異体の対立遺伝子頻度変化に基づく方法とは対照的に,遺伝的ドリフト時間ではなく突然変異時計時間での分離を推定する20。 まずシミュレーションデータでrarecoalをテストしたところ、分裂時間や分岐集団の大きさを精度よく再構成でき(図3b)、対立遺伝子共有もほぼ正確に一致することがわかった(補足図6)。 また、(今回調査したデンマークのサンプルのように)1つの集団のみの少ないサンプルサイズや、混血下での頑健性も検証した(補足注5、補足図7)。
次に、ヨーロッパの6つの集団から得た524のサンプル(図3c、d)にレコアルを適用し、古代のサンプルを配置できるヨーロッパの人口動態樹を推定してみた。 1,000 ゲノムプロジェクトにおけるイギリスのサンプルは、3 つのサンプル場所 (ケント州、コーンウォール州、オークニー諸島から、Peoples of the British Isles プロジェクト 4,21 の一部として、補足注 4) 16 を反映して 3 つの異なるクラスターに入るため、これらの異なるグループに対して異なる木をあてはめた (補足図 8)。 3つの木に共通する特徴は、中央値約7,000年前に南ヨーロッパと北ヨーロッパに最初に分かれ、その後、オランダ、デンマーク、フィンランド、イギリスの間で約5,000年前に近い時期に3つの分かれ目があることである。 興味深いことに、イギリスのコーンウォールのサンプルを用いると、コーンウォールがオランダ、デンマーク、フィンランドの集団のアウトグループを形成する樹形が得られた(図3c)。 一方、ケント州を用いた場合には、オランダ人集団とクレードを形成しており(図3d)、コーンウォールよりもイングランド南部でアングロサクソン系の祖先が多いことと矛盾しない。 オークニー人口をイギリスの枝として使用すると、コーンウォールのものと同様の樹形が得られる。 これらの結果は、コーンウォールとオークニーの両方が、ケントよりもヨーロッパ大陸とより遠縁であることを示している。 先端枝の有効人口規模は、これまでの観察22,23と一致し、フィンランドで最も小さく(∼12,000)、ケント(∼191,000)、オランダ(∼184,000)で最も大きくなった。 これは、各枝の人口が一定で、移動がないという単純化されたモデルの仮定が原因であると思われる。
イタリアとスペインの分裂時期が約2600年前と比較的最近推定されたのは、それ以前の分離に続く移動の結果かもしれない。イタリアとスペインの祖先集団の人口規模が極めて大きく推定され、上限が決定できなかったのは、祖先の部分構造または混血による人工物である可能性がある。 もう一つの説明は、スペインとイタリアの両集団に共通の混血源があり、その結果、比較的最近になって共通の祖先が生まれたというものである。 レアコールを用いた古代ゲノムの祖先のモデル化
大規模なサンプルセットからヨーロッパの幅広い関係を再構築することに加えて、レアコールは単一の古代サンプルとヨーロッパ樹の関係を評価するために使用することが可能である。 これを行うには、単一サンプルの祖先集団が、サンプルの起源日以前の特定の時期に、特定の枝でヨーロッパの木と合併するというモデルを仮定する。 そして、rarecoalを用いて、樹木の枝と合流時期で指定された各モデルの下で、古代のサンプルと現代の集団の間の共同対立遺伝子共有データの尤度を評価することができる(図4、補足注5)。 鉄器時代のサンプルとアングロサクソン時代のサンプルの間には顕著な違いがあった。アングロサクソン時代のサンプルはほとんどがオランダとデンマークの枝にマージしたのに対し、鉄器時代のサンプルは現代の北ヨーロッパすべてのサンプルの祖先枝の基部に優先的にマージしているのである。 例外として、初期アングロサクソン人のO4は鉄器時代のサンプルと同じシグナルを示し、稀な対立遺伝子共有解析と一致する(図2)。 対立遺伝子共有解析で混合祖先と思われたサンプルO3については、デンマーク支族と合併する可能性が最も高いことがわかった。 しかし、このサンプルでは、鉄器時代のサンプルで見られたように、同じ北ヨーロッパの祖先の分岐点にマージする可能性が顕著に高いこともわかった。 このことは、O3が最近になって先住民とアングロサクソン系住民が混血したことと矛盾しないが、ローマ・イギリス時代にこの人物の先祖が混血していたという、より複雑なシナリオを排除することはできない。 アングロサクソン時代のサンプルの中には、O1、O2、HS1、HS3がオランダ支流にマージされる可能性が最も高く、O3とHS2がデンマーク支流にマージされる可能性が最も高いという差異があるが、この二つの可能性の差は小さいケースもある。
ケント州を英国集団とした樹(補足図10)とコーンウォールを英国代理人とした樹(図4)では、古代サンプルの樹へのマッピングは同様であった。 特に鉄器時代のサンプルは、ケント州、コーンウォール州のいずれを代理人として用いた場合でも、北ヨーロッパの集団の祖先の枝にマッピングされる。 このことは、コーンウォールの集団も含め、我々のデータセットに含まれる現代のどの集団も、デンマークやオランダがアングロサクソンの集団と同じように鉄器時代の集団と密接な関係にないことを示唆している。 その結果、樹木の構築に使用した集団からのサンプルはすべて、予想通りそれぞれの枝の先端に配置されていた(補足図11)。 ケントやオークニーからのサンプルのように、樹木に存在しない集団からのサンプルをマッピングすると、鉄器時代のサンプルと同じ祖先の位置にマッピングされ(補足図11)、鉄器時代のサンプルと同様に、コーニッシュ集団や樹木構築に用いた他の集団とは異なる祖先であることが確認された。 補足説明5で詳述したように、我々のマッピング手法は参照集団の適切なモデルに決定的に依存している。 ケント州の集団はコーンウォールの集団に比べ、遺伝的な定義が曖昧で混血が進んでいるためと思われます(補足図12)。 このような場合、混血や遺伝子流動を考慮した集団の系統をモデル化する必要があるが、rarecoalの開発が進めば、このような複雑なシナリオを研究することが可能になるであろう
。