查看原文
其他

欧亚大陆东部草原 6,000 年的动态遗传史--论简版

天体部落长老 天然主义者部落 2023-04-19

Jenne 自然部落:本版本为简论版一,欢迎专业的  业余爱好的 感兴趣的读者加入一起修改(定),为后期读者或自己提供更高质量更佳阅读体验的版本,有阅读洁癖的读者可以等最终定稿版。具体方法:1找小编索要英文版PDF或去官网购买。2 段落 词汇 语法 排版。。。修改建议发给小编。3 修改(定)版再次在本公号发布。大家动手,丰脑足智哦本文只适合作为交流 学习 参考资料。

点击上方蓝字,关注公众号,开始阅读。

本文44111字,阅读大约需要X分钟。





欧亚大陆东部草原 6,000 年的动态遗传史


作者:郑崇元   王克   谢万·威尔金  米亚格玛额尔登   杰西卡·亨迪   克里斯蒂娜·沃纳 等

2020 年 11 月 5 日



强调

来自蒙古和贝加尔湖地区的 214 个古代个体的全基因组分析

青铜时代晚期蒙古三个基因不同的奶牧牧民群体

匈奴游牧帝国是由不同的地方和遥远的群体混合形成的

尽管有 5000 年的奶业文化,但乳糖酶持久性等位基因没有选择



概括

东欧亚草原是历史悠久的游牧帝国的家园,包括匈奴和蒙古人。然而,我们对该地区的族群历史知之甚少。在这里,我们通过分析跨越 6000 年的 214 个古代个体的新全基因组数据来揭示其动态遗传历史。我们确定了游牧民大约在公元前 3000 年左右扩张到蒙古。到青铜时代晚期,蒙古人口在生物地理上分为三个不同的群体,无论血统如何,都从事奶业畜牧业。匈奴是从这些人口与周边地区人口的混合中出现的。相比之下,蒙古人表现出更高的东欧亚血统,类似于当今讲蒙古语的人群。我们的结果阐明了遗传、社会政治、和文化变化之间的复杂相互作用。



图形概要




关键词

族群史    远古DNA   移民    游牧民    东部草原     蒙古    匈奴帝国   蒙古帝国



介绍

最近的古基因组学研究揭示了欧亚草原的动态族群历史,西部草原上的大陆尺度迁徙事件与欧洲、近东和高加索的青铜时代转变同时发生。然而,尽管对西部草原史前遗传史的理解取得了进展,但东部草原的史前种群动态仍然知之甚少。东部草原是一片广阔的草原、森林草原和沙漠草原,绵延2500多公里(图1;图S1)。虽然也覆盖了现代中国和俄罗斯的部分地区,但东部草原的大部分地区都在今天的蒙古国境内。最近的古基因组学研究表明,欧亚东部森林草原区在前青铜时代和早期青铜时代的基因结构中具有强烈的西-东混合梯度祖先,从哈萨克斯坦中部的博泰到西伯利亚南部的贝加尔湖再到俄罗斯远东地区的魔鬼之门洞穴。(注魔鬼之门:滨海边疆区的洞穴,距离俄罗斯远东海岸约 30 公里,在那里发现了人类遗骸,研究中使用的古代 DNA 是..)



图 1古代人口和时间段概述

(A) 用颜色表示的相关文化和时间段的地点分布:青铜前、紫色;早期青铜,红色;中/晚期青铜色,蓝色;早铁,粉红色;匈奴,绿色;中世纪早期,棕色;中世纪晚期,黄金(见STAR 方法)。有关地点代码和标签,请参见图 S1 A 和表 S1 B。

(B) 欧亚大陆的插图,显示当前研究的区域(框)和文本中引用的其他古代人群的位置,按时间段着色。西部/中部草原的地理范围以浅棕色表示,东部草原以浅绿色表示。

(C) 蒙古主要时期和考古文化的时间线。地点位置已被抖动以提高重叠地点的可见性。



图 S1蒙古国考古遗址和地理生态特征,与图 1相关

(A) 本研究分析的蒙古及邻近地区的考古遗址。

(B) 蒙古地区和省(aimags)。省份用灰线和文字表示。区域由黑色虚线和文本表示,符合定义。

(C) 蒙古生态区。使用 QGIS 软件 (v3.6) 制作的地图,其中包含来自 (多吉戈蒂夫, 2004)绘制的生态数据地图。.



在青铜时代,畜牧业的多阶段引入彻底改变了东部草原的生活方式和生存状态。最近的一项大规模古蛋白质组学研究证实,在公元前 2500 年之前,蒙古的牛奶消费量由隶属于 阿凡纳谢沃(约公元前 3000 年)和 切穆切克(公元前 2750-1900 年)文化的个体进行。尽管叶尼塞河上游地区的阿凡纳谢沃族群在遗传上与庞蒂克-里海草原(约公元前 3300-2200 年)的颜那亚文化有关,切穆切克的起源一直存在争议。一旦引入,反刍动物乳品业在青铜时代中期/晚期(MLBA,这里定义为公元前 1900-900 年)变得普遍,在西部和北部与 鹿石-基里格苏尔建筑群(DSKC) 相关的地点以及东部的与乌兰祖克文化的联系。DSKC 和乌兰祖克群体之间的关系知之甚少,对蒙古的其他 MLBA 葬礼传统知之甚少,例如蒙古国霍夫德省蒙赫海尔汗文化和贝塔格。到公元前一千年中期,以前的 MLBA 文化正在衰落,早期铁器时代文化出现:东/南蒙古的石板墓文化(约公元前 1000-300 年),其墓葬有时会包含来自 DSKC 纪念碑的连根拔起的材料,以及西北部萨彦山脉的萨格利/乌尤克文化(约公元前500-200年)(也称为萨格利-巴齐文化,或蒙古的钱德曼文化),与阿尔泰和哈萨克斯坦东部的帕兹里克(约公元前500-200年)和萨卡(约公元前900-200年)文化有着密切的文化联系。


从公元前一千年晚期开始,东部草原上出现了一系列等级森严和中央集权的帝国,特别是匈奴(公元前 209 年至公元 98 年)、突厥(公元 552 年至公元 742 年)、回鹘汗国(公元 744 年至公元 840 年)和契丹 (916–1125 CE) 帝国。匈奴帝国是草原上第一个这样的政体,其向中国北部、西伯利亚南部和中亚深处的急剧扩张对欧亚大陆的人口结构和地缘政治产生了深远的影响。公元 13 世纪出现的蒙古帝国是这些政权中最后一个也是最扩张的,最终控制了从中国到地中海的广阔领土和贸易路线。然而,由于缺乏大规模的基因研究,组成这些国家的人,包括执政精英和当地平民的出身和关系仍然不明。


为了阐明自史前史以来东部草原上的种群动态,我们采集并分析了来自 85 个蒙古和 3 个俄罗斯地点的 214 个人的全基因组遗传数据集,时间跨度约为 6,000 年(约公元前 4600 年至公元 1400 年)(表 S1,S2和S3 A)。为此,我们还添加了最近发布的来自蒙古北部的 19 个青铜时代个体的基因组数据,以及来自俄罗斯和哈萨克斯坦邻近古代种群的数据集(表 S3 B 和 S3C),我们将其与全球现代参考人群(表 S3 C)一起分析。我们还生成了 30 个新的加速器质谱数据,补充了之前发布的 74 个放射性碳数据,在本研究中共有 98 个确定年代的个人(104 个年代)(表 S4)。



结果

 青铜时代前的人口结构和畜牧业的到来

在这项研究中,我们分析了来自三个地点的六名青铜时代前狩猎采集者个体,其可追溯到公元前五千年和四千年:一名来自蒙古东部(SOU001,“东蒙古普雷巴”,公元前4686-4495年),一名来自蒙古中部(ERM003, “中蒙古普雷巴”,公元前3781-3639年) 和四个来自贝加尔湖东部地区 (“福福诺沃_EN”)。通过将这些基因组与之前公布的欧亚大陆古代和现代数据进行比较(图 2;表 S3 C),我们发现它们与贝加尔湖西部地区(“贝加尔_EN”,公元前 5200-4200 年)和俄罗斯远东地区(“魔鬼洞穴_N”,约公元前 5700 年)同时代的狩猎采集者的关系最为密切,填补了该遗传谱分布的地理空白(图 3)一种)。我们将此图谱称为“古代东北亚人”(ANA),以反映其相对于另一种广泛分布的全新世中期遗传特征的被称为“古代北欧亚人”(ANE),后者在更新世狩猎采集者中发现。ANE地理分布在西伯利亚的马勒塔Mal'ta (约公元前. 24500–24100 年) 和阿丰托瓦·戈拉(约公元前 16900–16500 年) 更新世狩猎采集地还有哈萨克斯坦博泰的牧马人(约公元前 3500-3300 年)。在主成分分析 (PCA)(图 2)中,古代 ANA 个体接近与东北亚现代通古斯语和尼夫赫语族群,表明他们的遗传特征仍然存在于今天远东的土著人群中(图S3 A)。东蒙古普雷巴在基因上与 ANA 组魔鬼洞穴_N 没有区别(图 3 A 和4 A;图 S4 A;表 S5 A),而福福诺沃_EN 和稍晚的 “中蒙古普雷巴”都从 ANE 衍生出少数 (12%–17%) 的祖先相关(类似博泰)的群体,其余祖先 (83%–87%) 的特征为 ANA(图 3A和4 A; 表 S5 A)。重新分析贝加尔湖西部新石器时代早期 基托伊 文化 (贝加尔_EN) 和青铜时代早期格拉兹科沃文化 (贝加尔_EBA) 的已发表数据,我们发现它们具有相似的血统特征,并且随着时间的推移 ANE 血统略有增加(从 6.4% 到 20.1%)(图 3A)。



图 2蒙古的遗传结构随时间变化

来自三个主要时期的古代个体(n = 214)的 PCA 投影到当代欧亚人(灰色符号)。主面板显示 PC1 与 PC2;插图显示 PC1 与 PC3。PC1 的插入刻度线对应于主面板的刻度线;PC3 占变异的 0.35%。请参阅图 S3 B 了解总体、样本和轴标签,以及表 S1 B、S1C 和S2 A 了解更多地点和样本详细信息。



图 3以 qpAdm 为特征的东部草原随时间的遗传变化

(A-F) 主要时期:(A) 前青铜时代到早期青铜时代,(B) 中/晚期青铜时代,(C) 早期铁器时代,(D) 匈奴时代,(E) 中世纪早期,以及 ( F) 中世纪晚期。

模型祖先血统比例由样本大小比例饼图表示,祖先血统来源群体如下所示(参见STAR 方法)。每个面板的样本大小范围显示在右上角。对于(B)和(C),贝加尔_EBA 被建模为浅蓝色;在(D-F)中,克夫斯格尔_LBA(紫色)和 钱德曼_IA 的萨格利/乌尤克(粉红色)被建模为新来源(图 4)。文化群体用粗体字表示。对于(D-F),除非另有说明,个体分别是晚匈奴、突厥和蒙古。以前公布的参考人群用白色文字标注;所有其他人都来自这项研究。超出地图边界的人口用箭头表示。埋葬地点已经抖动,以提高重叠个体的可见度。



图 S2与图 5 B 和STAR 方法相关的按组和性别偏见Z分数进行的单亲单倍群分配

(A 和 B) 来自单亲遗传标记的种群结构。(A) Y 单倍群在每个时期的分布。(B) 每个时期线粒体单倍群的分布。

(C) 通过评估常染色体和 X 染色体上 WSH-/伊朗-/汉族相关血统的差异来获得性别偏见 Z 分数。我们为每个与三个祖先中的任何一个具有遗传混合的古代个体计算了 Z 分数。正分表明常染色体上有更多与 WSH-/伊朗-/汉族相关的血统,即男性驱动的混合。



图 S3当前欧亚人口的 PCA 和蒙古的遗传结构随时间变化,与图 2相关

(A) 用作图 2和图 S3 B背景的当今欧亚人口的 PCA 。在这里,我们显示了用于计算 PC 的 2,077 个欧亚个体的人口标签,并在图 2 中绘制为灰点。图中的每个三字母代码代表一个人。与三字母代码匹配的群体 ID 列在底部。

(B) 蒙古随时间变化的遗传结构。来自三个主要时期的古代个体(n = 214)的主成分分析(PCA)投射到当代欧亚人(灰色符号)上。投影和轴方差对应于图 2。种群标签位于属于每个种群的个体的平均坐标上。



图 4所有新报告的基因组的时间顺序的遗传祖先变化

用于 (A) 史前时期和 (B) 历史时期的基于分组的群体遗传学分析的拟合良好的建模结果。每个遗传组中的个体数量在表 S3 A 中给出。原始血统比例和标准误差估计值在表 S5中提供。水平条表示由 qpAdm 估计的 ± 1 标准误差 (SE)。



图 S4东部草原随时间的遗传变化,以 qpAdm 为特征,标明所有个体,与图 3和图4 相关

A) 青铜时代前至青铜时代早期;

(B) 中/晚期青铜时代;

(C) 早期铁器时代;

(D)匈奴时期;

(E) 中世纪早期;

(F) 中世纪晚期。

模型血统比例由样本大小比例饼图表示,血统来源群体如下所示。文化群体用粗体字表示。对于面板 (D-F),除非另有说明,否则个体分别是晚匈奴、突厥和蒙古。以前公布的参考人群用白色文字标注;所有其他人都来自这项研究。超出地图边界的人口用箭头表示。埋葬地点已经抖动,以提高重叠个体的可见度。放大以查看单个标签。在这里,我们报告了混合模型的结果,其中包括将历史晚期中世纪个体解释为一个群体以进行个体之间无偏见交叉比较所需的所有祖先成分。可以在表 S5 中找到具有更简单混合模型的单个结果J. 请参阅第 7 节中的建模详细信息。



蒙古的畜牧业通常被认为是西方草原文化(例如阿凡纳谢沃)通过上叶尼塞和萨彦山区到蒙古西北部或通过西部的阿尔泰山脉向东扩张而引入的。。尽管迄今为止报道的大多数阿凡纳谢沃墓葬都位于阿尔泰山脉和叶尼塞上游地区,但在蒙古中部康盖山脉南部的 沙塔 楚鲁的早期青铜时代 (EBA) 遗址已经发现了阿凡纳谢沃式坟墓,带有反刍动物奶消费的蛋白质组学证据和欧亚大陆西部的线粒体单倍型群。分析这些个体中的两个(阿凡纳谢沃_蒙古国, 公元前3112–2917 年),我们发现他们的遗传图谱与来自叶尼塞地区的已发表的阿凡纳谢沃个体的遗传图谱没有区别(图 2;图 S5 C;表 S5 B),因此这两个阿凡纳谢沃个体证实了西部草原牧民 (WSH) 的 EBA 扩张进一步向东延伸 1,500 公里,超出阿尔泰山脉,进入蒙古中部的中心地带(图 3一种)。



图S5外类群F3 -统计和分枝试验:使用F4 -统计相关的图3和4

(A)东部大草原青铜时代前至青铜时代早期组的外组f3统计数据。我们展示了六个目标群体的345个古代和现代人口中排名前15位的f3型外组统计数据(目标,全球;姆布提):东蒙古普雷巴、中蒙古普雷巴、福福诺沃_EN、阿凡纳谢沃_蒙古、切穆切克_南阿尔泰和切穆切克_北阿尔泰。水平条表示通过5 cM刀切法抽样区间计算得出的±1标准误差(SE)。

(B) 使用f4统计量测试四个 ANA 种群的进化枝。我们展示了四个 ANA 相关目标群体的 345 个古代和现代人口中形式为f4(ANA1、ANA2;世界范围、姆布提)的顶部和底部 15 个对称f4统计数据:东蒙古_preBA、中蒙古_普雷巴、福福诺沃_EN、魔鬼洞穴_N . 水平条代表 ± 1 标准误差 (SE),由 5 cM 刀切法抽样区间计算。f4 - Z-score > 3 的统计以红色突出显示。

(C) 使用f4 -统计数据测试阿凡纳谢沃和切穆切克的进化枝。我们发现顶部和底部15个对称F4三个目标群体阿凡纳谢沃_蒙古,切穆切克_南阿尔泰和切穆切克_北阿尔泰 -南阿尔泰,形式F4(阿凡纳谢沃_蒙古,阿凡纳谢沃;全球范围内,姆巴提),F4(切穆切克_南阿尔泰,博塔; F4(切穆切克 _北阿尔泰,切穆切克_南阿尔泰; 世界范围内,姆布提)和f4(切穆切克 _北阿尔泰,东蒙古_普雷巴;世界范围内,姆布提)在 345 个古代和现代人口中。水平条代表 ± 1 标准误差 (SE),由 5 cM刀切法抽样区间计算。f4- Z-score > 3 的统计数据以红色突出显示。



成功的 EBA切穆切克文化(公元前 2750-1900 年),反刍乳品社会其墓室特征包括石板和拟人石碑,据称也与 WSH 迁移有关。切穆切克 墓葬遍布阿尔泰和中国新疆的准噶尔盆地。我们分析了来自阿尔泰南部雅格辛虎都遗址的两个 切穆切克个体和来自 蒙古昆迪戈壁(KUM001) 和 昆迪戈壁2 (KUR001) 阿尔泰北部遗址的两个个体。与阿凡纳谢沃_蒙古相比,雅格辛虎都个体也表现出高度的西方血统,但在PCA中发生了位移(图2),并且与阿丰托瓦·戈拉3(AG3)、西_西伯利亚_N和博泰等ANE相关的古代个体具有很强的遗传亲和力(图) 3A;图S5A 和 S5C)。我们发现 雅格辛虎都 切穆切克 个体(“切穆切克_南阿尔泰”)与来自哈萨克斯坦东部的同期个体达利_EBA(图 3A)在遗传上相似。雅格辛虎都 和 达利_EBA 个体的遗传谱与博泰 (60%–78%) 和具有古代伊朗相关血统的群体的双向混合模型很好地拟合,例如来自戈努尔泰普 的 戈努尔1_BA,一个关键的 EBA 地点巴克特里亚-马吉安纳考古建筑群 (BMAC)(22%–40%;图 3 A;表 S5 B)。尽管不能排除来自阿凡纳谢沃相关群体的微小遗传贡献,但所有拟合模型都需要伊朗相关血统,并且在建模时估计这种混合发生在 12 ± 6 代之前(~336 ± 168 年;图 S6)使用日期。然而,由于此建模中使用的所有代理源种群在时间或空间上都与 EBA 阿尔泰相距很远,因此尚无法精确识别对 切穆切克 有贡献的邻近种群。在阿尔泰北部,两个切穆切克k 个体(“切穆切克_北阿尔泰”)的血统主要来自 ANA(约 80%),其余与阿尔泰南部切穆切克个体相似(图 3A和4A;表S5B )。因此,我们按地理位置观察了切穆切克个体之间的遗传异质性.(巴克特里亚,公元前3世纪中期古希腊殖民者在中亚草原地区建立的希腊化的奴隶制国家。又称"大夏-希腊王国"。首都巴克特拉(今阿富汗斯坦巴尔赫)。"巴克特里亚"是古希腊人对今兴都。。)



图 S6史前个体的混合时间,与STAR 方法相关

(A) 史前个体的约会混合时间。我们使用 DATES 程序估计混合日期,并通过添加每个古代种群的年龄(校准14 C 日期的 95% 置信区间的中心的平均值)并假设每代为 29 年来转换它。与混合日期(彩色圆圈)相关的水平条是通过对使用留一染色体的刀切 方法的 DATES 估计的方差和14 C 日期估计的方差求和的平方根来估计的,假设这两个量是独立的。已发布的组标有星号 ( ∗)。对于切穆切克_北阿尔泰,考虑到 贝加尔_EN 的样本量较大,我们使用 贝加尔_EN 作为 ANA 祖先的代表来确定混合事件的年代。

(B) 史前个体的祖先协方差。我们展示了从 DATES 计算出的加权祖先协方差(y 轴),预计它会沿着遗传距离(x 轴)呈指数衰减,衰减率指示自混合以来的时间,并拟合指数曲线(以红线显示)。我们在 0.45 厘摩的遗传距离处开始拟合,并通过加权块折刀在每次运行中去除一条染色体来估计标准误差。(厘摩,重组频率的测量单位 。1个厘摩定义为重组频率100次中发生1次。换句话说,若两个基因间相距1个厘摩,那么其后代与父母相比,有1%的个体具有不同的等位基因频率。)



尽管基于少量基因组,我们发现 阿凡纳谢沃和 切穆切克 都没有在随后的 MLBA 中留下持久的遗传痕迹。这与欧洲截然不同,欧洲迁移的 EBA 草原牧民对当地种群产生了变革性和持久的遗传影响。在东部草原,EBA 牧民的短暂遗传影响与其强大而持久的文化和经济影响形成鲜明对比,因为 EBA 牧民最初引入的文化特征,例如墓葬土墩和乳品畜牧业,一直延续到现在日。

 

三方遗传结构的青铜时代出现

此前,我们报道了 EBA 西部贝加尔湖狩猎采集者 (贝加尔_EBA) 和蒙古北部青铜时代晚期 (LBA) 牧民 (克夫斯格尔_LBA) 之间的共同基因图谱。这种分别由主要和次要 ANA 和 ANE 祖先成分组成的遗传谱也与本研究中分析的早期东部贝加尔湖 (福福诺沃_EN) 和蒙古族 (中蒙古_普雷巴) 共享(图 3A、3B 和4A),表明这种遗传图谱在近三千年的区域内持续存在。这种以蒙古北部为中心的遗传特征与其他青铜时代的群体不同。总体而言,我们在青铜时代晚期  蒙古发现了三个不同的地理结构基因库,克夫斯格尔_LBA 群体代表其中之一(图3B 和4A)。另外两个,我们称之为“阿尔泰_MLBA”和“乌兰祖克_石板墓”,如下所述。


在 MLBA(公元前 1900-900 年)期间,随着草原因气候变化而扩张,新的牧民文化从内山地区扩展到东部草原。这一时期也生产马奶的第一个区域证据而值得注意,如今仅与酸马奶酒生产有关,以及马匹使用的急剧增加,包括骑马的出现,这将大大扩展草原偏远地区的可达性。在阿尔泰-萨彦地区,与 DSKC 和其他未分类的 MLBA 埋葬类型(阿尔泰_MLBA,n = 7)相关的乳制品牧民显示出明确的遗传证据表明克夫斯格尔_LBA 相关血统和 辛塔什塔相关 WSH 血统之间的混合(图3B;图S4 B)。总体而言,它们在西部草原群和贝加尔_EBA/克夫斯格尔_LBA 群之间的 PCA 上形成了一个“阿尔泰_MLBA”渐变群体(图 2),它们在 PC1 上的位置根据它们的西方血统水平而变化(表 S5 C)。(辛塔什塔文化被广泛认为是印度-伊朗语言的起源。已知最早的战车是在辛塔什塔墓葬中发现的,这种文化被认为是该技术起源的有力候选者,它传播到整个旧世界并发挥了重要作用。)


这是东部草原上首次出现类似辛塔什塔的血统(在之前的研究中通常称为“草原_MLBA”),这与阿凡纳谢沃和切穆切克群体中存在的先前西方血统不同,而是显示出与欧洲的密切联系绳纹陶器文化 种群和后来的阿凡纳谢沃相关群体,(例如 辛塔什塔在 科布多 省),属于 DSKC 和未分类的 MLBA 组(分别为 BER002 和 SBG001)的个体具有相似的遗传特征,最好将其建模为 克夫斯格尔_LBA 和 辛塔什塔 的等量混合(图3B;表S5C )。该基因图谱与之前在蒙古北部描述的偏离克夫斯格尔-LBA聚类的遗传异常值相匹配。属于 DSKC (ULI001) 和未分类的 MLBA 组 (BIL001、ULI003、ULZ001) 的另外四个 阿尔泰_MLBA 个体也适合具有不同混合比例的混合模型(表 S5 C)。综上所述,阿尔泰_MLBA 谱系揭示了两种源种群的持续混合:辛塔什塔/阿凡纳谢沃 相关的 WSH 种群和以 克夫斯格尔_LBA 为代表的当地种群。据估计,在本研究中分析的个体之前,这种基因混合仅发生了 10 ± 2 代(~290 年),这一发现与其异质祖先比例一致(图 S6)。因为 辛塔什塔文化(约公元前 2200-1700 年)与新的交通技术有关,例如马拉战车,东部草原上出现的这种祖先特征表明,增强的流动能力在将欧亚草原上的不同群体联系起来方面发挥了重要作用.


我们数据集中的三个 MLBA 个体呈现出 阿尔泰_MLBA 基因无法完全解释的遗传特征。这三个,来自克夫斯格尔省的两个阿尔泰个体(UAA001 和 KHI001)和 UUS001,通过 哥诺尔1_BA 作为第三个祖先来源的少量贡献更好地建模(表 S5 C)。综上所述,尽管阿尔泰和蒙古北部的主要 MLBA 墓葬传统(泰蒙克海尔汗、DSKC 和未分类的 MLBA)之间可能存在文化差异,但它们并没有形成不同的遗传群体。


遗传异质性的阿尔泰_MLBA渐变群体 留下了阿尔泰-萨彦地区的后代,我们后来在早期铁器时代蒙古西北部的钱德曼山(“钱德曼_IA”,约公元前 400-200 年)的 萨格利/乌尤克  遗址发现了他们(EIA)。九个钱德曼_IA 个体在远离 克夫斯格尔_LBA 集群的前一个 阿尔泰_MLBA 链的末端在 PCA 上形成一个紧密的集群(图 2)。在 EIA 期间,萨格利/乌尤克  是牧民和小米农牧民,主要集中在今天图瓦的叶尼塞上游地区。他们与阿尔泰的帕兹里克人和哈萨克斯坦东部的萨卡人一起,构成了更广泛的斯基泰文化现象的一部分,横跨西部草原、塔里木盆地和上叶内塞.


我们发现 EIA斯基泰 种群系统地偏离了早期的阿尔泰_MLBA 渐变群,需要第三个祖先成分(图 3C和4A;图S4C)。这个祖先的出现,与中亚(高加索/伊朗高原/河中地区)的群体有关,包括 BMAC,在中萨卡、天山萨卡、塔加尔等铁器时代群中明显发现和钱德曼_IA,而在早期的 DSKC 和 卡拉苏克 组中不存在(表 S5 C-S5E)。这第三个组成部分占这些铁器时代组中祖先的 6%–24%,钱德曼_IA 中的混合日期估计估计为∼早18±4代,约公元前750年,其日期晚于约公元前1600年BMAC的崩溃,略早于约公元前550年波斯阿契美尼德帝国的形成(图S6)。我们认为,这种与伊朗相关的遗传流入是由在 LBA 到 EIA 过渡期间与 河中地区(图兰)和费尔干纳地区(大宛城)的农牧民增加的接触和混合所介导的。骑马在公元前二千年末和一千年初广泛出现,以及此后马匹运输的日益复杂,可能促成了群体接触的增加以及这种与伊朗有关的血统在草原上的传播。我们的结果不排除额外的接触领域,例如沿亚洲内亚山区走廊的流动性增加,这也可能导致这一祖先从青铜时代开始通过新疆进入阿尔泰。


与阿尔泰和蒙古北部的 MLBA 和 EIA 文化相比,蒙古东部和南部地区发现了不同的葬礼传统,尤其是 LBA 乌兰祖克 (公元前1450–1150 年) 和 EIA 石板墓 (公元前1000–300 年) 文化。与其他同期东部草原的人群中,我们发现,这些墓葬类型相关联的个人表现出明显的东北亚(ANA相关)基因同时缺失ANE和WSH混合基因(曲线图2,3 C,以及4)。两组都是反刍动物牧民,EIA石板墓文化也有产奶的马。乌兰祖克和 石板墓个体的基因图谱在遗传上无法区分(图 2;表 S5 C),这与考古学假设一致,即 石板墓 传统起源于 乌兰祖克。这两个群体也与较早的 东蒙古_preBA 个体无法区分,可追溯到大约公元前 4600 年,表明该史前东部蒙古基因库具有长期(> 4,000 年)稳定性(表 S5 C)。在随后的分析中,我们将 乌兰祖克 和 石板墓 合并为一个基因组(“乌兰祖克_石板墓”)。乌兰祖克_石板墓 遗传簇可能是先前描述的 克夫斯格尔 省 DSKC 东部异常值 (ARS017) 的来源。以及从蒙中央文化上未分类个体(TSI001)谁的日期到LBA-EIA过渡(图2,3 B,和3C;表S5 C)。此外,来自蒙古西北部的 泰蒙克海尔汗 个体 KHU001 除了他的贝加尔_EBA 血统外,还有不可忽略的 乌兰祖克_石板墓 血统(图 S4 B;表 S5C)。虽然这三个人证明了在 LBA 期间蒙古西北部和东部之间偶尔的长距离接触,但我们没有发现阿尔泰有 乌兰祖克_石板墓 祖先的证据,并且在 MLBA 期间蒙古东部和南部之外的 乌兰祖克_石板墓 遗传谱的总体频率是非常低。在 EIA 期间,根据环境影响评估,石板墓 文化向北扩展,有时会破坏并连根拔起沿途的前 DSKC 坟墓,并最终到达最北的贝加尔湖东部地区,这反映在本研究中石板墓 个体 PTO001 的遗传谱中(图 3 C)。总体而言,我们的研究结果揭示了青铜时代东部草原种群到早期铁器时代末期的强烈东西遗传分化。从蒙古中部和南部进行的进一步采样将有助于完善这些祖先图谱的空间分布,以及我们当前发现的代表性。



 匈奴帝国,第一个草原帝国政体的兴起

从东部草原的史前人口开始,大规模的政体在公元前第一个千年晚期开始发展。匈奴是历史上第一个由牧民建立的帝国,其建立被认为是东部草原社会政治史上的一个分水岭。从公元前 3 世纪到公元 1 世纪,匈奴在东亚和中亚占据了政治主导地位。构成匈奴帝国的人民的文化、语言和基因构成一种备受关注,他们与东部草原上其他同时代和后来的游牧民族的关系也引起了人们的极大兴趣。在这里,我们报告了来自蒙古各地的 60 个匈奴时代个体的全基因组数据,这些数据可以追溯到大约公元前200年至公元100年,跨越了匈奴帝国的整个时期。尽管大多数个体可追溯到匈奴晚期(公元前 50 年之后),但有 13 个个体早于公元前 100 年,其中包括 12 个个体来自北部的早期匈奴边境遗址 萨尔基廷阿姆 (SKT) 和 阿辛戈 (AST) 和一个来自早期匈奴的个体位于蒙古东部的 贾加兰坦阿姆 (JAG) 遗址。(贾加兰坦阿姆 青铜时代鹿石文化综合体遗址 该遗址位于阿尔汉盖省乌兰省乌兰苏姆省哈努伊河1公里处,占地17.9公顷。一组 30 座鹿石雕像和一些 克里苏和石板墓葬构成了这。。。)


我们观察到促成早期匈奴形成的两个不同的群体进程。首先,一半的早期个体(n = 6)形成一个遗传基因簇(早期匈奴_西),类似于来自阿尔泰-萨彦地区的先前 萨格利/乌尤克  文化的钱德曼_IA(图 2)。他们92%的祖先来自钱德曼_IA,其余的则归因于额外的伊朗相关祖先,这是我们建模使用BMAC作为代表(图3 d和4 d;表S5F)。这表明在 EIA 期间在钱德曼_IA 萨格利/乌尤克 k 中发现的低水平伊朗相关基因流可能在公元前第一个千年的下半叶继续,并蔓延到蒙古西部和北部。其次,六个个体(“早期匈奴_其余”)介于早期匈奴_西 和 乌兰祖克_石板墓 集群之间;四个携带不同程度的 早期匈奴_西(39%–75%) 和 乌兰祖克_石板墓 (25%–61%) 相关血统,两个 (SKT004, JAG001) 与 乌兰祖克_石板墓 集群无法区分(图3D;表 S5F 和 S5G)。这种连接早期匈奴_西部和乌兰祖克_石板墓基因库的基因谱系标志着东部草原上两个截然不同的支系的统一——在西部的 DSKC、泰蒙克海尔汗 和 萨格利/乌尤克 文化的后代与东方的乌兰祖克_石板墓文化 的后代。总体而言,从先前的萨格利/乌尤克 文化延续的与伊朗相关的基因流的低水平流入以及连接东部草原基因库的新型东西方混合群体的突然出现是与匈奴人崛起相关的两个决定性群体的统计学过程。


在匈奴晚期个体中,我们发现更高的遗传异质性(图 2),它们在 PC 上的分布表明,匈奴早期明显的两种群体统计学过程一直延续到匈奴晚期,但伴随着新的基因浪潮和复杂方向的加入。在 47 个晚期匈奴个体中,一半 (n = 26) 可以通过在早期匈奴中看到的相同混合过程充分建模:22个可以 作为钱德曼_IA+乌兰祖克_石板墓 的混合记忆特征,2个(NAI002, TUK002) 作为 钱德曼_IA+ BMAC或钱德曼_IA + 乌兰祖克_石板墓 + BMAC的混合群体;2个(TUK003,TAK001)为任一早期匈奴_西 + 乌兰祖克_石板墓或早期匈奴_西 + 库夫斯古尔_LBA的混合基因(图3 d和4 d;表S5G)。另外两个个体(TEV002、BUR001)也可能从早期的匈奴基因库中获得他们的祖先,尽管他们模型的 p 值略低于 0.05 阈值(表 S5 G)。然而,无法使用 BMAC 或任何其他与伊朗有关的古代人口来模拟另外 11 个在 PC1 沿线具有最高比例的西欧亚亲缘关系的晚期匈奴。相反,它们落在来自西部和中部草原不同地点的一群古代萨尔马提亚人身上(图 2)。


混合模型证实了匈奴晚期存在与萨尔马提亚人相关的基因库:三个个体(UGU010、TMI001、BUR003)与萨尔马提亚人无法区分,两个人(DUU001、BUR002)混合在萨尔马提亚人和 BMAC 之间,三个人(UGU005, UGU006、BRL002)混合在 萨尔马提亚人和 乌兰祖克_石板墓 之间,三个人(NAI001、BUR004、HUD001)需要萨尔马提亚人、BMAC 和 乌兰祖克_石板墓(图 3 D;图 S4 D;表 S5 G)。此外,沿 PC1 具有最高欧亚东部亲和力的 8 个个体与 乌兰祖克_石板墓 和 库夫斯古尔_LBA 遗传谱不同,显示沿 PC2 与来自东亚更南部的现代人的亲和力(图 2))。这些个体中的六个(EME002、ATS001、BAM001、SON001、TUH001、YUR001)被充分建模为 乌兰祖克_石板墓 和 汉人的混合体(表 S5 F 和 S5G),尤其是 YUR001 表现出与先前发表的两个汉帝国的密切遗传相似性士兵 ,我们将其遗传谱称为“汉_2000BP”(表 S5 G)。其余两个人(BRU001、TUH002)相似,但也需要添加萨尔马提亚血统(表 S5 G)。因此,晚匈奴的特点是两个额外的人口统计学过程,使他们与早期的匈奴区别开来:来自与萨尔马提亚相关的新西方血统来源的基因流动,以及与中国同时代汉帝国人民的强化互动和混合。先前对 额金河 匈奴墓地的研究报告了欧亚西部和东部起源的线粒体单倍群,这与我们从全基因组数据中得出的东西方混合物的发现一致。总之,这些结果与记录匈奴对其邻国(包括中亚的丝绸之路王国和中国汉朝)以及据称进出蒙古的迁移所施加的政治影响的历史记录相吻合。总的来说,匈奴时期可以被描述为一个广泛而广泛的基因流动之一,它始于蒙古西部和东部的基因库,结束于西亚和东亚的基因库。



 后匈奴政体中波动的遗传异质性

匈奴帝国灭亡后。公元 100 年,在接下来的几个世纪里,在政治上支离破碎的东部草原上,一系列游牧牧民政权兴衰:鲜卑(约公元 100–250 年)、柔然(约公元 300–550 年)、突厥(公元 552–742 年) )和维吾尔语(公元 744-840 年)。尽管我们对中世纪早期的样本表示不均匀,包括 1 个可追溯到鲜卑或柔然时期 (TUK001) 的未分类个体、8 个来自突厥太平间环境的个体和 13 个来自维吾尔族墓地的个体,但很明显这些个体具有遗传基因与之前的匈奴时期不同的谱,表明此时有新的基因源流入蒙古,沿 PC3 取代了它们(图 2)。个体 TUK001(250-383 cal. CE),其墓葬是对早期匈奴墓地的入侵,具有最高的欧亚西部亲和力。这种血统与萨尔马提亚人的血统不同,更接近具有 BMAC/伊朗相关血统的古代人群(图 2)。在东部欧亚亲和度最高的个体中,两个突厥时期个体和一个维吾尔时期个体(ZAA004、ZAA002、OLN001.B)与乌兰祖克_石板墓集群无法区分。另一人(TUM001)是从唐代突厥时代精英使者的墓道中发现的,汉族血统比例很高(78%;图3 E和4 B;图S4 E;表S5H)。这名男子与两条狗一起埋葬,很可能是为了守卫墓门而牺牲的中国侍从。其余 17 名突厥人和维吾尔人显示中间遗传谱(图 3 E)。


来自维吾尔首都奥尔都巴里克附近的奥隆多夫(OLN;图2)的维吾尔时期墓地的12个个体生动地体现了中世纪早期的高度遗传异质性。这些人中有 6 人来自同一座坟墓(19 号坟墓),其中只有两人有亲属关系(OLN002 和 OLN003,二级;表 S2 D);由于没有更密切的亲属关系,人们对此类墓葬的功能以及埋在其中的人的社会关系提出了质疑。大多数维吾尔人时期的人都表现出高度但程度不一的西欧亚血统——最好被建模为阿兰人的混合体,阿兰人是一个历史悠久的游牧牧区群体,可能是萨尔马提亚人和同时代的匈奴人的后裔。以及伊朗相关(BMAC 相关)血统——连同乌兰祖克_石板墓(ANA 相关)血统(图 3 E)。在这项研究中估计的古代突厥人和维吾尔人的混合日期对应于大约。公元500年:突厥个体前8±2代,维吾尔族个体前12±2代(以ZAA001和奥隆 多夫个体为代表)。



 蒙古帝国的崛起

九世纪中叶维吾尔帝国灭亡后,中国东北契丹人于公元916年建立了强大的辽朝。契丹人控制了东部草原的大片地区,并记录在他们被征服的领土内重新安置了人们,但在蒙古境内鲜为人知的契丹时期墓地。我们的研究包括来自布尔干省的三个契丹人(ZAA003、ZAA005、ULA001),他们都具有强烈的东欧亚遗传特征(图 2),西欧血统<10%(图 3 F 和4 B;表 S5 I )。这可能反映了说蒙古语的契丹语的东北亚起源,但需要更大的样本量来充分表征蒙古境内契丹族群的遗传特征。公元1125年,契丹帝国沦陷于女真金朝,公元1234年又被蒙古人征服。


蒙古帝国(公元 1206-1368 年)在其最大范围内跨越了欧亚大陆的近三分之二。它是世界上最大的连续陆地帝国,这个世界性的实体由流入草原中心地带的不同人口组成。我们分析了 62 名蒙古时代的人,他们的墓葬与地方低层精英的墓葬相一致。没有包括皇室或地区精英墓葬,也没有来自国际大都会喀喇昆仑的个人。虽然我们发现蒙古时代的个体是多样化的,但他们表现出的遗传异质性远低于匈奴时代的个体(图2)),而且他们几乎完全没有残存的 ANE 相关血统(以 钱德曼_IA 和 库夫斯古尔_LBA 的形式),这些血统曾存在于匈奴和更早的北部/西部 MLBA 文化中。平均而言,蒙古时期的个体比以前的帝国具有更高的东欧亚亲和力,这一时期标志着现代蒙古基因库形成的开始。我们发现大多数历史悠久的蒙古人都非常适合具有以下祖先代理的三向混合模型:乌兰祖克_石板墓文化、汉和 阿兰人。与其 PCA 位置一致(图 2),蒙古时代的个体作为一个群体可以仅使用 15%–18% 的西部草原血统(阿兰 或 萨尔马提亚人)建模,但需要 55%–64% 的乌兰祖克_石板墓 和 21%–27% 的汉族血统(表S5一世)。将相同的模型分别应用于每个个体,这个三源模型充分解释了 61 个古代蒙古人中的 56 个(基于阈值为 0.05 的 p 值),以及一个可追溯到蒙古帝国初期左右的未分类的中世纪晚期个体(SHU002)(表 S5 J)。


自公元 1368 年蒙古帝国灭亡以来,蒙古族群的遗传谱并没有发生实质性变化。蒙古帝国时期建立的遗传结构继续成为当今生活在蒙古和俄罗斯的讲蒙古语的人群的特征。我们使用基于个体的 qpWave 分析检查了历史悠久的蒙古人和当今七个讲蒙古语的群体(蒙古人、卡尔梅克人、布里亚特人、哈姆尼干人、达斡尔人、土人和东乡蒙古)之间的遗传分支。在当前数据的分辨率范围内,61 个历史悠久的蒙古人中有 34 个在基因上与至少一个现代蒙古语族群(图 S7B)。蒙古帝国对重组东部草原的政治和遗传景观产生了深远的影响,这些影响在帝国衰落后持续了很长时间,并且在今天的蒙古仍然很明显。



图 S7匈奴地理和遗传的细分以及蒙古时期和现代人口的比较,与图 3和STAR 方法相关

(A) 匈奴地理遗传相关性的分解。我们展示了匈奴时代(y 轴)与他们来自考古遗址的经度(x 轴)的所有个人/群体的西欧亚血统的比例。对于使用萨尔马提亚 作为欧亚西部来源的模型,可以在表 S5 G 中找到个体估计的原始数字。与MLBA/EIA个体不同(图3),来自更多西部地区的匈奴个体的欧亚西部血统比例并不高于东部地区的匈奴个体。

(B) 使用 qpWave 比较古代蒙古人和七个现代蒙古语人口之间的遗传同质性。我们报告的p值的每一个基于个体的qpWave {古代蒙古人的个人;蒙古族} 使用人类起源数据集中的七个现代蒙古语族群:布里亚特人、达斡尔人、卡尔梅克人、哈姆尼干人、蒙古人、东乡蒙古和土人。当qpWave的p 值> 0.05 时,表明 y 轴上的古代个体与 x 轴上显示的现代蒙古语人口在遗传上无法区分。较小的p 值表明古代个体与现代群体显着不同。



 东部草原循环外加剂的功能和性别方面

为了研究东部草原上反复混合的功能方面,我们估计了与乳糖消化功能或进化方面相关的五个 SNP 的群体等位基因频率 ( LCT/MCM6 )、牙齿形态 ( EDAR )、色素沉着 ( OCA2、SLC24A5 )、和酒精代谢 ( ADH1B )(图 5A)。首先,我们发现尽管牧民生活方式具有广泛的牛奶消费直接证据,东部草原的 MLBA 和 EIA 个体没有任何赋予乳糖酶持久性的衍生突变。随后时期的个体确实具有今天在欧洲广泛存在的衍生突变 (rs4988235),但频率低到可以忽略不计 (~5%),并且频率没有随时间增加(图 5A)。这有点值得注意,因为除了其他乳制品外,一些当代蒙古牧民在夏季每天消耗高达 4-10 L 的酸马奶酒(发酵马奶,约 2.5% 乳糖)。,导致每天摄入 100-250 克乳糖。艾拉格生产的岩画描述可以追溯到叶尼塞盆地的环境影响评估,以及历史上蒙古人记录大量和频繁消费酸马奶酒的记录,以及各种额外的液体和固体反刍乳制品,这已被古代蛋白质组学证据进一步证实。蒙古人如何能够在没有乳糖酶持久性的情况下消化如此大量的乳糖数千年尚不清楚,但这可能与他们据报道不寻常的肠道微生物组结构有关,今天这种结构高度富含消化乳糖的双歧杆菌属。




图 5基因混合物的功能等位基因频率和性别偏向模式

(A) 五个表型 SNP 的等位基因频率随时间变化。对于有效等位基因,我们显示了每个古代组的最大似然频率估计和一个标准误差条。前 MLBA 类别对应于 姆恩克海尔汗之前的所有古代群体的总和。匈奴、中世纪早期和中世纪晚期分别对应各个时期所有古代族群的总和。水平虚线显示来自千人基因组计划的五个超级群体的等位基因频率信息。

(B) 按时期和人群划分的遗传混合的性别偏见模式。我们计算了每个具有 WSH-/伊朗-/汉族相关血统的遗传混合物的古代个体的Z分数。正分表明常染色体上有更多与 WSH-/伊朗-/汉族相关的血统,即男性驱动的混合物。有关单个Z分数,请参见图 S2 C



经过区域选择性扫描的遗传标记显示等位基因频率变化与全基因组祖先谱的变化相关(图 5A)。例如,EDAR 中的rs3827760 (外异蛋白A 受体)和SLC24A5(溶质载体家族 24 成员 5)中的rs1426654 分别是东亚人和西欧亚人众所周知的正选择目标。我们的 MLBA 和 EIA 群体在这两个 SNP 的等位基因频率上表现出强烈的群体分化:rs3827760 频率在具有较高东欧亚亲和力的群体中要高得多(库夫斯古尔_LBA、乌兰祖克_石板墓),而 rs1426654 在 阿尔泰_MLBA 和 钱德曼_IA 中更高(表EIA ) . 我们发现最近经历了正选择的两个 SNP在东亚人中,ADH1B(醛脱氢酶 1B)中的 rs1229984 和OCA2(眼皮肤白化病 II)中的 rs1800414 在 MLBA 和 EIA 期间不存在或频率极低,当时欧亚血统主要与 ANA 相关,但在随着东亚血统的比例通过与帝国中国和其他群体的互动而增加,频率随着时间的推移而增加(表 S2 E)。


最后,我们调查了东部草原人口历史的性别维度。遗传混合的性别偏见模式可以提供有关移民、社会亲属和家庭结构的性别方面的信息。我们在环境影响评估/乌尤克 和 突厥时期观察到明显的男性偏向 WSH 混合信号(即,Z分数更正;图5B ),这也对应于 Y 染色体谱系 Q1a 和伴随的下降R 和 J 等欧亚西部血统的兴起(图 S2 A)。在后来的契丹帝国和蒙古帝国,我们观察到男性对东亚血统的显着偏见(图 S2 C),这也可以从 Y 染色体谱系 O2a 频率的上升中看出(图 S2 A)。匈奴时期表现出最复杂的男性偏向混合物模式,由此种群的不同遗传子集表现出不同来源的男性偏向混合物的证据(图 S2 C)。


在匈奴人中,我们还发现了 10 对遗传亲属,包括在 贾加兰坦阿姆 的同一个坟墓中的一对父女(JAG001 和 JAA001),以及在伊利姆谷墓地 的一对母子(IMA002 和 IMA005) ,塔米林·乌兰·霍舒的一对兄弟姐妹(TMI001 和 BUR003),以及萨尔基廷阿姆的一对兄弟姐妹(SKT002 和 SKT006)(表 S2 D)。在剩下的六对中,三对是埋在同一地点的雌性-雌性亲属,这表明匈奴群体中存在着长期的女性亲属关系。先前基于常染色体短串联重复序列(STR)数据对  额金河匈奴墓地的研究也报道了单一地点的一级亲属。这些关系与太平间的特征相结合,为匈奴帝国内部的地方血统和亲属结构提供了最初的线索,否则人们对此知之甚少。



讨论

东部草原的人口历史以欧亚东部和西部不同基因库的反复混合为标志。然而,东部草原上的人口事件并非简单的移民浪潮,而是复杂多变的。我们生成了 200 多个全基因组古代数据集,展示了这种动态种群历史的第一个遗传证据,来自大约 2000 年。公元前4600年至蒙古帝国灭亡。我们发现东部草原在全新世中期居住着 ANA 和 ANE 血统的狩猎采集者,然后在青铜时代转变为奶牛牧民经济。迁徙的颜那亚/阿法纳些沃草原牧民,配备了手推车和家畜,似乎首先引入了反刍奶牛畜牧业。公元前 3000 年但令人惊讶的是几乎没有持久的遗传影响,这与欧洲不同。

到 MLBA,整个东部草原的人口都采用了反刍奶牛畜牧业(威尔金等人,2020a

),无论祖先如何,这种生计一直在继续,随着 LBA 中的马挤奶和蒙古时期的骆驼挤奶。然而,令人费解的是,没有证据表明在这 5,000 年的历史中选择了乳糖酶的持久性,尽管后来从西方的群体迁移反复引入了这种遗传特征。这表明亚洲乳糖适应的不同轨迹,迄今为止仍未得到解释。


在 MLBA 期间,我们观察到东部草原上三方遗传结构的形成,其特征是东部青铜时代前 ANA 血统的延续和北部青铜时代前 ANA-ANE 血统之间的遗传变异以及在西方与辛塔什塔 相关的新 WSH 血统的比例不断增加。辛塔什塔是一种西部森林草原文化,与欧洲绳纹器文化有遗传联系,是青铜冶金和战车的大师,而这个祖先在东部草原上的出现可能与新技术(尤其是与马有关的)技术的引入有关。特别是 DSKC 网站显示了广泛的证据表明马在运输甚至骑马中使用,并且基因分析表明这些动物与辛塔什塔战车马之间存在密切联系。此时青铜器时代东部草原种群之间强烈的东西遗传分裂保持了超过一千年,直到 EIA 结束,当时出现了普遍骑马的第一个明确证据。以及某些群体的流动性增强,特别是东部的板墓文化 ,开始破坏这种结构。最终,三大宗族相遇并混杂,这与匈奴帝国的出现是同时期的。随着来自中国、中亚和西部草原(与萨尔马提亚有关)的新的和额外的祖先迅速进入基因库,匈奴的特点是具有极高的遗传异质性和多样性。


随后的中世纪早期的遗传资料相对稀少且参差不齐,在匈奴与突厥时期400年的时间间隔中,鲜卑或柔然遗址很少被发现。我们在突厥语和维吾尔语时期观察到了高度的遗传异质性和多样性,在维吾尔帝国崩溃之后,我们记录了中世纪晚期向更大的东欧亚血统的最后一次重大遗传转变,这与历史记录的通古斯语扩张是一致的。-(女真)和蒙古语-(契丹语和蒙古语)从东北进入东部草原(比朗, 2012

)。我们还观察到,这种与东亚相关的血统更多地被男性祖先而非女性祖先带入中世纪晚期的人群中。到蒙古时期末期,东部草原的基因构成发生了巨大变化,几乎没有保留史前时期一个突出特征的 ANE 血统。今天,ANE 血统仅在孤立的西伯利亚群体和美洲土著人民中以可观的数量存在。历史上蒙古人的遗传特征仍然反映在当代蒙古人中,表明该基因库在过去 700 年中相对稳定。


记录了东部草原基因转变的关键时期,未来的工作可能能够探索这些转变是否也与文化和技术创新有关,以及这些创新如何影响政治格局。将这些发现与对马技术和放牧习惯变化以及牲畜特性和品种变化的研究相结合,可能会特别具有启发性。这项研究代表了对东欧亚草原的首次大规模古基因组学调查,揭示了该地区极其复杂和动态的遗传多样性。尽管取得了这些进展,但在欧亚大陆中东部地区,特别是中国东北部、塔里木盆地和哈萨克草原东部地区,仍需要进一步的基因研究。



STAR★Methods

 关键资源表(略)



 资源可用性

(略)



 实验模型和主题细节

在这里,我们展示了来自蒙古的 213 个古代个体和来自俄罗斯布里亚特的 13 个个体的新的全基因组数据,我们将这些数据与之前发表的 21 个古代蒙古个体一起分析,共计 247 人。本研究中分析的人类遗骸经蒙古文化部和蒙古教育、文化、科学和体育部审查和批准,参考编号为 A0122772 MN DE 0 8124、A0109258 MN DE 7 643 和 A0117901 MN DE 9 4314和声明编号 12-2091008-20E00225。除了 ERM 外,所有新的蒙古人都是从蒙古国立大学和蒙古乌兰巴托考古与民族学研究所的体质人类学收藏中取样的。ERM001/002/003 由 简·贝曼提供。俄罗斯样本来自蒙古、佛教和西藏研究所以及俄罗斯科学院 (RAS) 布里亚特科学中心。


这个古老的东部草原数据集包含 247 个人,来自 89 个考古遗址(图 1;图 S1 A;表 S1 A),跨越大约 6,000 年的时间(表 S1 A、S1B 和S2 C)。为 214 个人成功生成了高质量的遗传数据,并用于群体遗传分析(表 S2 A)。从牙结石的蛋白质组学分析推断的生存信息最近已针对这些个体的一个子集发表(n = 32;),骨胶原和牙釉质 (n = 137) 的稳定同位素分析也在进行中; 总之,这些数据可以直接比较特定考古文化的生物祖先和他们的饮食,特别是在他们的乳制品和小米消费方面。下面,我们概述了本研究中考古遗址的地理和生态,以及它们的时间和文化背景。



 蒙古地理生态

蒙古位于俄罗斯和中国之间的内亚,包括欧亚东部草原的大部分地区(图1;图S1A)。蒙古有21个省(省),可划分为10个地理区域(图S1 B),具有鲜明的生态(图S1 C)和文化特征。例如,远北的蒙古国与西伯利亚接壤,包括高山和山地针叶林生态区,它是唯一实行驯鹿畜牧业的目标。北蒙古以森林草原为主,也有山地针叶林和草原地带;这里的牛和牦牛畜牧业特别多产,布尔干省以马畜牧业而闻名。阿尔泰地区是阿尔泰山脉从俄罗斯到蒙古的延伸,由高山、山谷、湖泊等错落有致的环境组成,从森林草原到沙漠草原,从北到南延伸;阿尔泰的牧业经济参差不齐,因当地环境条件而异。南蒙古以戈壁沙漠为主,与蒙古中部和东南部接壤,主要以沙漠草原为特征;骆驼畜牧业遍布这些地区。东蒙古是一个广阔的草原地带,一直延伸到中国东北部。今天,采矿以及牛、绵羊、山羊和马的畜牧业在蒙古东部很重要。



蒙古考古概况

蒙古的史前历史可以追溯到 40,000 多年前,有记载的遗址从旧石器时代晚期到现在。在几乎所有的这段时间里,蒙古人的生活方式一直是游牧民族,要么以狩猎、捕鱼和采集为生,要么以畜牧业为生。游牧营地的短期性和短暂性使得它们在景观上难以识别,而风压进一步降低了许多国内营地的能见度和保护。只有在青铜时代,随着石丘和其他墓葬特征的突然出现,遗址才变得更加显眼,考古也得到了更好的证明。因此,蒙古史前史的知识强烈偏向于过去五千年。蒙古的考古可分为7个主要时期:(1)青铜时代之前,公元前3500年之前;(2) 青铜时代早期,公元前 3500-1900 年;(3) 青铜时代中期/晚期,公元前 1900-900 年;(4) 早期铁器时代,公元前 900-300 年;(5) 匈奴,公元前 200 年至公元 100 年;(6) 中世纪早期,公元 100-850 年,和 (7) 中世纪晚期,公元 850-1650 年。下面提供了每个时期的简要摘要以及本研究中包括的站点的详细信息,在图 S1和表 S1。(略)



 前青铜时代(公元前 3500 年之前)

人们对蒙古的早期考古记录知之甚少,尤其是在人类遗骸和墓葬方面。虽然偶尔的发现提供了蒙古现代人类解剖学上早在旧石器时代早期的直接证据,在公元前 4000 年之前,只有一小部分有意埋葬的骨骼被发现。尽管全新世早期和中期(公元前 10,000-3500 年)的特征和墓葬被称为“中石器时代”、“新石器时代”或“新石器时代”,尽管陶器在全新世中期被广泛使用,但没有任何这些地方存在家畜或粮食生产经济的直接证据。蒙古东部的青铜时代前墓葬的特点是缺乏表面建筑特征,而蒙古北部的青铜时代前墓葬通常由小石冢组成。这一时期的随葬品包括石器、珍珠母和鹿、土拨鼠等兽骨制成的器物。本研究中的两个人可以追溯到蒙古的这个前青铜时代时期。第一个可追溯到约公元前4600年公元前4600年,出自科伦金·埃雷格 (SOU),位于蒙古最东端多尔诺德省乔巴山市附近的克尔伦河南岸。它是在一个混乱的环境中发现的,原始的埋葬位置无法重建。然而,这个时期和地区的其他墓葬通常是蹲踞葬。第二个可以追溯到公元前3700年,来自蒙古北部阿尔汉盖省的额尔登曼达尔 (ERM) 。它缺乏石头建筑特征,由一个简单的坑埋葬在浅土丘下。墓葬在 2.3 m 深的地方被发现,墓冢似乎是更大墓地的一部分。


除了这两个来自蒙古的青铜前墓葬外,我们还分析了来自俄罗斯布里亚特贝加尔湖附近的福福诺沃(FNO) 遗址的四个青铜前个体。所有人都被埋葬在简单的坑葬中,部分弯曲(只有腿弯曲)作为个体,或者有时几个人在一起。福福诺沃的人们和贝加尔湖周围的许多其他人一样,埋葬着许多随葬品,包括一排骨和石珠、颈饰、碎石刀片和尖头、骨鱼叉和陶器。这些物品中有来自野猪、紫貂和鹰的碎片或装饰品。


尽管来自蒙古的青铜时代之前的材料很少,但最近在邻近地区的发掘提供了重要的背景。在俄罗斯南部,贝加尔湖考古项目 (BAP) 在三个地点(雅罗斯拉夫尔、萨满卡 II  和 Ust'-Ida I)的挖掘使贝加尔湖新石器时代基托伊(公元前 5200-4200)和 伊萨科沃(公元前 4000-3000 BCE)墓葬传统,包括对这些狩猎采集者中的 14 个进行基因组测序(贝加尔湖_EN;在后来的研究中也被描述为东西伯利亚猎人采集者,ESHG)。六位狩猎采集者的基因组可追溯到大约公元前 5700 年。恶魔之门 (Devil's Gate),位于俄罗斯和韩国边境的新石器时代洞穴遗址。这些人相隔 2500 公里,彼此有着相似的血统,并且与阿穆尔盆地下游的现代通古斯语使用者有着相似的血统,我们将他们称为古代东北亚人 (ANA)。



 青铜时代早期(约公元前 3500-1900 年)

在青铜时代早期 (EBA) 期间,蒙古描述了两种与纪念性太平间建筑相关的主要文化现象:阿凡纳谢沃 和 切穆切克。两者都展示了将它们与反刍畜牧业和更西部的文化联系起来的特征。


阿法纳谢沃(公元前 3150-2750 年)。开始约。公元前 3150 年,一直持续到大约。公元前2750年,尽管可能迟至公元前 2600 年,在蒙古中部的康盖山脉和蒙古西部的阿尔泰山脉中已经发现了属于阿法纳谢沃文化类型的石墓。这些墓葬包含蒙古家畜(绵羊/山羊和牛)的最早直接证据。蒙古的 阿凡纳谢沃 墓葬通常由圆形的扁平石头组成,周围是直立的石头,上面覆盖着一个内部墓坑,里面有一个伸展的腿弯曲的人。这种墓葬类似于俄罗斯阿尔泰的阿法纳谢沃库尔干人,其中埋葬着腿部和头部通常朝东弯曲的仰卧个体。库拉伊戈壁1 和乌兰胡斯(蒙古西部巴彦乌尔盖省;本研究未采样)的墓葬展示了典型的 阿凡纳谢沃 建筑特征。


除了家畜遗骸,阿凡纳谢沃 墓葬还包含蛋形陶器,有时还包括金属制品(来自铜、金和银)和明显的解构手推车物品。最近对 阿凡纳谢沃墓葬中人类牙结石中蛋白质的分析直接证明了阿凡纳谢沃 经济中反刍乳制品的利用和家畜的存在。


我们在本研究中分析了来自一个阿凡纳谢沃文化遗址的个体:沙塔丘鲁 (SHT)。沙塔丘鲁位于杭爱山脉南坡的巴彦洪戈尔省,是欧亚大陆最东端的阿凡纳谢沃墓葬。该遗址的三个墓冢已被挖掘出来,每个墓冢都由一个由大圆石包围的圆形石头平坦平台组成。墓葬排列在土丘下方的坑中,尸体仰卧,屈膝,头朝西。尽管发现的墓葬物品很少,但土丘的整体建筑设计与典型的阿法纳西沃船只的孤立碎片相结合,使这些土墩可以归因于阿法纳西沃考古文化。


切穆切克(公元前 2750-1900 年)。切穆切克考古文化(也称为 亨特塞格、切姆尔切克、沙米尔沙克)跨越公元前 2750 年至公元前 1900 年。这些特征存在于蒙古西部和毗邻国家的毗邻地区,包括新疆的准噶尔盆地和哈萨克斯坦东部。切穆切克文化墓地建筑的特点是集体埋葬在由相互重叠的石头和土制石堆或长达 50 m 的大型矩形石栅栏包围的大型石棺中。海文阿姆(蒙古西部 科布多省;本研究未采样)的切穆切克墓葬展示了典型的切穆切克特征。与阿凡纳谢沃墓葬类似,在 切穆切克墓葬中发现的人以仰卧姿势躺着,双腿弯曲。与东侧的许多 切穆切克 墓葬特征相邻的是拟人的立石,有时被描绘成拿着牧羊人的拐杖 。在墓葬中,发现了石碗、骨器、陶瓷,有时还有金属首饰等文物。偶尔,非丧葬仪式结构,例如带有木炭和动物遗骸的土坑的栅栏或描绘岩画的大石栅栏,也归因于这种文化。。最近根据这些特征对人类牙结石中的蛋白质进行的分析证实了反刍动物乳制品的利用以及切穆切克 经济中家畜的存在。,尽管可用的放射性碳年代学似乎排除了对家马的有意义的使用。我们在本研究中分析了来自 切穆切克三个地点的个体:雅格辛虎都(IAG/YAG)、昆迪戈壁(KUM) 和 昆迪戈壁2 (KUR)。雅格辛虎都位于蒙古阿尔泰南部,而昆迪戈壁和昆迪戈壁 2位于蒙古阿尔泰北部。雅格辛虎都 代表了典型的切穆切克墓葬在一个石堆中,而北部的两个切穆切克文化墓室遗址由直立石头包围的矩形土墩内的墓葬组成,可能属于“混合类型”,融合了哈萨克斯坦东部和俄罗斯阿尔泰的当地传统。


未分类。除了这两种主要类型之外,我们还分析了来自埋葬类型不确定的地点的一个人:丹吉 (GUR)。


邻近地区有几个同期站点的比较基因组数据可用,包括:

(1)博泰,一个可追溯到约 公元前 3500 年在哈萨克斯坦北部; 

(2) 阿凡纳谢沃反刍牧民的多个地点,可追溯到大约。公元前3000-2500年在哈萨克和俄罗斯阿尔泰-萨彦地区;

 (3)  达利,位于哈萨克斯坦东南部的一处遗址,其最底层包含一名可追溯到公元前2650年的女性,但缺乏埋葬背景;

(4) 戈努尔泰普,土库曼斯坦具有代表性的 巴克特里亚-玛吉亚纳考古综合体(BMAC)遗址,可追溯到公元前 2300-1600 年;

(5) 三个贝加尔湖遗址,Ust'-Ida I、萨曼卡 II 和库尔玛席,与格拉兹科沃墓葬传统有关,可追溯到大约 公元前 2200-1800 年.



 中/晚期青铜时代(约公元前 1900-900 年)

蒙古的中晚期青铜器时代 (MLBA) 的特点是蒙古各地突然和广泛地出现了纪念性的墓葬建筑。这些青铜时代中期和晚期的建筑主要以石丘的形式出现,但也包括石碑和其他特征,即使在今天,这些建筑仍然是景观中最显眼的特征之一。青铜时代中晚期墓葬类型复杂,对于如何准确定义和描绘不同的墓葬类型存在学术争论和分歧。在这项研究中,我们专注于几种主要的墓葬形式:姆恩克海尔汗、贝塔格、鹿石-基里格苏尔 复合体 (DSKC)、乌兰祖克和 特夫什(形状)。我们提供了这些墓葬类型的一般概述,但承认并非所有学者都会同意所有细节。


姆恩克海尔汗遗址(公元前 1850-1350 年)。可追溯到切穆切克 时期之后,约公元前1850-1350 年。公元前 ,蒙古北部和西部地区以及图瓦发现了蒙赫海尔汗墓葬,地理区域从西到东约 1000 公里,从北到南约 500 公里。


姆恩克海尔汗墓葬的特点是蹲伏/弯曲的埋葬位置,埋葬后坟墓完全被石头填满,如乌兰政府乌祖尔 2。覆盖墓葬的是外部石头结构,由平坦的圆形或矩形平台组成。这种手推车的直径通常为 3-5 m,但有时直径可达 40 m。仪式结构可能包括石圈和石碑。姆恩克海尔汗 墓葬中没有陶器或动物骨头的报道,对其经济知之甚少。随葬品包括锡青铜刀和锥子、锡青铜二喇叭形戒指、骨勺、骨箭头,以及骨、壳、石制成的装饰品。刀和环在西伯利亚西部和中国的 Oijia、下夏家店、Siba 和二里头文化中都有类似物。这种文化中的坟墓物品和丧葬习俗与贝加尔湖(顺贝加尔湖)以西的遗址有相似之处。我们在本研究中分析了来自两个 姆恩克海尔汗遗址的个体:胡克 Khoshuunii Boom (KHU) 和 乌兰-哥维-乌苏尔 2 (UAA)。


拜塔格(公元前 1050-900 年)。仅限于蒙古西南部,白塔格墓葬由无丘陵的小石环组成,由单层小平板石板构成,例如在 乌延克(蒙古西部 科布多 省;本研究未进行分析)。一个东西向的中央墓坑包含一个人,他跪着仰卧。与 DSKC 墓葬不同,但与之前的阿尔泰族群类似,例如姆恩克海尔汗 和切穆切克,贝塔格 墓葬包含各种小型墓葬物品,包括青铜首饰。这些文物与米努辛斯克盆地的卡拉苏克文化墓葬以及中国西北部新疆和甘肃(诗巫文化)的墓葬中的文物有相似之处。在这项研究中,我们分析了来自乌利亚斯泰河 (ULI) 中阶地的一个 贝塔格 个体 (ULI004)。


鹿石-基里格苏尔 文化综合体遗址 (DSKC)(公元前 1350-900 年)。这种文化包括三种不同的纪念性特征——基里格苏尔、鹿石和 萨格赛风格的坟墓——并且与公元前 2000 年后期蒙古草原上出现的马术密切相关。总的来说,DSKC站点集中在蒙古的西部、北部和中部,只有少数站点在东部。蒙古中部的K基里格苏尔由大石丘组成,周围环绕着圆形或四角形的外围栏,例如在额金河(蒙古北部布尔干省;本研究未进行分析)。在蒙古族阿尔泰,一些奇里格苏尔在中央石柱和外栅栏之间展示石线,形成类似于辐条轮的形状。尽管它们作为墓葬的专属功能是一个争论的主题, 基里格苏尔通常包含一个仰卧的人体 并且通常不会产生其他类型的工件。鹿石是拟人化的立石,可以独立发现,也可以与基里格苏尔共同出现。这些石碑上的雕刻也描绘了腰带、武器和工具——有时甚至是人脸,它们的名字来源于风格化鹿的常见图案。鹿石上描绘的许多武器都是可识别的卡拉苏克风格,与西北 500 多公里的米努辛斯克盆地墓葬中发现的青铜器非常相似,以及附近图瓦鹿石的存在进一步支持了卡拉苏克和 DSKC 之间长距离相互作用的可能性(。在许多蒙古基里格苏尔和鹿石(特别是在蒙古中部),在纪念碑的东部周边发现了包含头、下巴、颈部和马蹄的较小石丘。这些马丘的数量从少数到数百或数千不等。DSKC 马的骨骼学研究揭示了它们在运输和骑马方面的用途,以及它们作为畜群动物的复杂管理。在 DSKC 遗址发现的另一种卫星特征是开放的石圈,通常会产生绵羊、山羊或牛的部分遗骸。鹿石和基里格苏尔遗址的组成和建筑与马祭的类比导致一些人将鹿石解释为没有埋葬在丧葬结构中的人的纪念碑。



萨格赛风格的坟墓通常与 DSKC 文化有关;然而,这种坟墓类型与马祭无关。萨格赛墓葬由圆形或矩形石台组成,没有外栅栏,但用大石块划定了石碑的边缘。在平台的中心下方,个别墓葬位于石坑或石板覆盖的狭窄坑内。个人通常被安排在仰卧位,没有埋葬物品。用于描述这种墓葬风格的其他名称包括 蒙冈-泰加、蒙冈-泰加,甚至基里格苏尔. 类似的埋葬方式被称为“斜坡埋葬”,因为它经常出现在山坡的边缘,通常被认为是 萨格赛类型的变种。斜坡墓葬由一个类似的石棺组成,带有四角围栏和直立的角柱。萨格赛式土墩和斜坡墓葬集中在蒙古西部和北部,在 克夫斯格尔 省出土了具有代表性的例子。


放射性碳建模将蒙古中部基里格苏尔时间定到大约公元前 1350-900 年,鹿石约公元前1150-750 年。公元前,并将 DSKC 马仪式的出现置于约公元前 1200 年 。萨格赛风格的坟墓属于这个范围(公元前 1350-1050 年),进一步加强了他们与 DSKC 文化领域的联系。然而,应该指出的是,这些测算估计可能会受到埋藏或饮食过程的影响。特别是,鹿石的幼枣可能会受到放射性碳污染的影响,早期日期可能会受到水库效应的影响。保存在牙结石中的乳蛋白证明了基里格苏尔文化和萨格赛遗址的牧区、反刍奶制品经济。并且迄今为止的一个 萨格赛 遗址也提供了马挤奶的证据。也许是受到骑马的创新或采用以及随之而来的牧区经济变化的鼓舞,鹿石和各种带有外部围栏的石冢在极广的地理范围内扩散,到达现代图瓦和俄罗斯南部、哈萨克斯坦、吉尔吉斯斯坦和中国西北部。在本研究中,我们分析了来自四个 DSKC 地点的个体:阿布拉格 区 (ARS)、伯克山 (BER)、乌里雅苏台河下游阶地(ULI) 和 乌日林乌瓦 (UUS)。


乌兰祖克 - 特夫什(形状)(公元前 1450-1150 年)。从公元前二千年中期开始,蒙古南部和东南部地区出现了许多不同的葬礼传统。这些群体通过共同的俯卧或面朝下的埋葬位置联合起来,曾经被认为是板墓文化的一部分,但现在被分别归类为离散的墓葬类型乌兰祖克 和特夫什/形状或者有时被认为是一个单一的文化单位 (乌兰祖克-特夫什/形状)。乌兰祖克墓葬(以类型遗址命名),发现于蒙古东南部,由无丘陵的方形或矩形平台组成,周围环绕着竖立的石板墙或放置在中央墓坑上的分层石。阿吉因郭勒遗址(蒙古东部苏赫巴托尔省;本研究未进行分析)提供了这种墓葬类型的代表性示例。特夫什墓葬,也称为形状墓葬,遍布蒙古南部和内蒙古中部,与乌兰祖克墓葬相似,除了它们是沙漏形的。特夫什/形状墓葬的墙壁通常由分层的石头(砖石)制成,有时单边环绕着直立的石板。该地区的其他墓葬样式可能代表不同类型,包括 D 形和马镫形墓葬结构。


放射性碳模型表明,乌兰祖克的特征可以追溯到大约公元前 1450-1150 年,虽然形状墓葬可以早于和晚于这个标记——尽管很少有人能可靠地确定年代。这种文化的墓葬通常包含明显的家畜遗骸,包括绵羊、山羊、马和牛,尽管这些特征中最早的马只能追溯到大约公元前1250年。最近对人类牙结石中蛋白质的分析证实了乌兰祖克经济中反刍乳制品的利用和家畜的存在。在乌兰祖克-特夫什 坟墓中发现了几把来自 卡拉苏克的青铜刀,表明可能与米努辛斯克盆地有长距离的联系。我们在本研究中分析了来自两个乌兰祖克遗址的个体:布尔金埃赫 (BUL) 和乌兰祖克 (ULN)。在本研究中,我们没有分析来自 特夫什/形状墓葬的个体。


未分类。除了这些主要类型之外,我们还分析了来自六个青铜时代晚期遗址的个体,这些遗址包含具有不确定或未分类文化隶属关系的墓葬:比卢提因 阿姆 (BIL)、科伊特森克舍 (KHI/KHO)、沙尔戈壁3 (SBG)、柴达木 ( TSB/TSI)、乌里雅苏台河下游阶地 (ULI) 和 乌里雅苏台扎斯塔夫 II (ULZ)。有关这些墓葬的更多信息,请参见表 S1 C。


邻近地区有几个同期考古遗址的比较基因组数据可用,包括:(1)四个奥库涅沃遗址(维尔赫尼·阿斯基兹、奥库耶夫乌卢斯、乌巴特、赛达 5),可追溯到公元前 2200-2600 年; (2) 五个辛塔什塔 遗址(布拉诺沃、塔纳伯根 II、斯特普诺 VII 和 博尔谢卡拉甘斯基、卡曼尼·安巴尔 5 公墓),可追溯到约 公元前 2200-1700 年; (3) 西西伯利亚西部克拉斯诺亚尔斯克附近的四个中央草原遗址(克拉斯诺亚尔斯克边疆区、波特罗希洛沃 II、乌斯 特比尔 IV、朱米亚斯 佩雷卡特-1)可追溯到公元前 1700-1400 年; (4) 三个卡拉苏克遗址(阿尔班 I、萨宾卡 II 和 贝斯特罗夫卡),可追溯到约 公元前 1400-1300 年.



早期铁器时代(约公元前 900-300 年)

内亚早期铁器时代的文化兴起于新技术进步的时期,包括复合弓的发展以及用于制造箭和骑马设备等物品的铁冶金的开始。这些文化包括 (1) 普遍存在于蒙古东部、东南部和中部以及东贝加尔湖和中国北部部分地区的广泛的板墓文化,以及 (2) 萨彦-阿尔泰及其部分地区的萨格利/乌尤克 和巴泽雷克文化蒙古西北部。这些后一种文化是更广泛的“斯基泰”文化现象的一部分,该现象传播到哈萨克斯坦东部和欧亚大草原,与伊朗北部的萨卡族群和天山山脉有关。萨卡人是一个与斯基泰人有广泛联系的伊朗团体。他们后来(公元前 200 年之后)在粟特、大夏和天山的军事活动被波斯、希腊和中国的资料记录下来。随着早期铁器时代的技术进步,蒙古中部草原以外的长距离互动和粮食生存的强化,但蒙古境内的板墓文化等群体尚未出现.


板坯坟墓(公元前 1000-300 年)。从公元前 1000 年左右开始,蒙古东部开始出现一种被称为板墓的新墓葬风格。板坟之所以如此称呼是因为大石板用来标记墓葬的表面并包含矩形墓地(因此在蒙古语中称为“方形墓地”),其中埋葬着单个人。虽然偶尔会单独发现,但石板墓葬通常被分为几个小墓地。石板竖立在地面上,因此是显眼的墓碑。墓坑很浅,很少发现完整或保存完好的人类遗骸。随着时间的推移,板墓文化向北扩展到贝加尔湖东部,向西扩展到蒙古中部,在那里侵入了前 DSKC 领土。有的石板墓将基里格苏尔人的石构拆开来建造墓地,有的甚至将鹿石重新用作墓穴内的立角石或铺石板。与早期青铜时代的墓葬不同,墓葬物品在板墓墓葬中变得更加普遍,主要由青铜珠、纽扣和小装饰品以及马具、箭头、斧头和刀具组成。石板、陶器、骨器也见于石板墓中,少数墓葬中出土类似内蒙古、满洲的鼎形陶器,或中亚或南亚的绿松石、玛瑙珠等外地随葬品。部分牲畜通常放置在矩形墓地的边缘或外面。除了表明石板墓经济中存在家畜的动物群遗骸外,最近对人类牙结石中蛋白质的分析也证实了反刍动物和马乳制品的利用。尽管板墓现象出现在乌兰祖克文化的前领土之外,但这两个群体之间关系的考古证据一直模棱两可。然而,在板坯墓地发现的青铜器物,尤其是与马具和武器有关的青铜器与在阿尔泰、图瓦和米努辛斯克地区发现的类似器物的相似性可能表明这些地区之间先前建立的远距离关系的延续。在本研究中,我们分析了来自五个 石板墓遗址的个体:博尔布拉格(BOR)、莫林陶勒盖(MIT)、达尔萨特 (DAR)、顺赫莱山 (SHU) 和 佩斯特雷沃 82 (PTO)。


萨格利/乌尤克(公元前 500-200 年)。这种早期铁器时代的文化以叶尼塞河上游地区为中心,在现代图瓦,部分延伸到蒙古西北部。这种文化也被称为萨格利-巴日文化,在蒙古最为人所知的是本研究中包括的钱德曼山(乌兰贡公墓)的彻底挖掘遗址。坟墓上有一堆圆形的石头,通常在一到两打坟墓的墓地中发现。石丘下方是巨大的木屋,里面有几个人(通常被认为是亲属,因为他们包括男人、女人和孩子),所有的人都以部分弯曲的姿势躺在他们身边。部分绵羊也经常被放置在坟墓中。萨格利/乌尤克木屋类似于俄罗斯阿尔泰及周边地区同时代的巴泽雷克 文化建造的类似原木建筑,并且萨格利/乌尤克和巴泽雷克都与更广泛的萨卡文化有关。与萨格利-巴日类似,最近对人类牙结石中蛋白质的分析证实了 钱德曼  山的反刍动物和马奶的利用。同位素研究还表明,包括钱德曼山在内的一些乌尤克社区的饮食中含有大量的小米。。这将它们与西部草原的农牧文化联系起来,那里的小米种植集约化发生在公元前第二个千年。我们在本研究中分析了来自 萨格利/乌尤克地点的个体:钱德曼 山 (CHN)。


帕兹里克(公元前 500-200 年)。这种文化主要以其类型的 巴泽雷克遗址而闻名,其大型墓葬包含许多异国情调的进口商品,包括来自中国的丝绸和来自阿契美尼德波斯的纺织品。巴泽雷克墓葬主要位于俄罗斯北部阿尔泰地区、哈萨克斯坦远东地区和蒙古西北部。与萨格利/乌尤克 和其他“萨卡”风格的坟墓类似,巴泽雷克 墓葬以圆石堆为标志。然而,在这些石堆下面,大多数巴泽雷克坟墓都有较小的木屋,只有一两个人;它们的大小和随葬品差别很大,但其中许多都伴随着整匹马放在墓室旁边。本研究中没有包括新的巴泽雷克 个体;然而,它们是重要的考虑因素,因为阿尔泰北部的整马葬礼后来出现在随后的匈奴时期零星的蒙古中部墓地。巴泽雷克 个体的全基因组数据先前已在哈萨克斯坦阿尔泰地区的贝雷尔遗址报道。


比较基因组数据可用于邻近地区的几个同期站点,包括:(1)俄罗斯西南部的早期萨尔马提亚地点 博克罗夫卡,可追溯到大约 2000 年。公元前 500-100 年,一个来自萨马拉地区的斯基泰人,可追溯到大约。公元前 300 年,以及俄罗斯西南部(切博塔列夫五世、卡梅雪瓦斯基 X、涅斯维泰二世、涅斯维泰四世和腾吉兹)、哈萨克斯坦北部(贝斯塔马克和瑙尔祖姆墓地)以及乌拉尔地区南部(切尔尼雅尔和捷米亚索沃)的九个萨尔马提亚遗址; (2) 阿尔泰 (Altai) 的贝雷尔 (Berel) 的巴泽雷克 遗址,可追溯到大约。公元前 400-200 年; (3)哈萨克斯坦的博尔利、卡拉肖克-1、卡拉肖克-6、纳扎尔-2、沙塔斯(茨贾塔斯)和塔迪-2的萨卡遗址,以及天山的巴斯奎特1、凯登和奥内克遗址; (4) 米努辛斯克盆地 格里什金 洛加 1 的 塔加尔 遗址。来自其他三个可能相关站点的数据(图瓦的 阿尔迪·贝尔 地点 阿尔赞 2,可追溯到公元前 700-500 年,以及哈萨克斯坦东部的泽瓦基诺-奇利克塔 地点 伊斯梅洛沃 和 泽瓦基诺,可追溯到公元前 900-600 年;由于基因覆盖不足而被排除在分析之外。



 匈奴(ca. 200 BCE to 100 CE)

在公元前一千年后期,一个全新的多区域政治实体在蒙古形成,被称为匈奴帝国。匈奴帝国不仅有历史记载,也有遍布内亚的大量考古遗迹证明。大约三个世纪以来,匈奴人从他们在蒙古中部和东部的核心领土进行统治,扩展到蒙古西部、中国北部和贝加尔湖东部,并进军中亚更远的地区。匈奴时期的墓葬多为竖坑,埋设在地表厚厚的石环下。这些墓葬代表了庞大的地区和地方精英网络,而不是匈奴社会的“平民”,他们的墓葬远没有那么显眼,埋在小石堆下或没有标记的坑里。另一方面,帝国最高统治精英的坟墓比环形坟墓的建造规模要大得多。


虽然在整个匈奴时代都发现了环形墓葬结构,但在帝国的过程中,声望装备(以及某种程度上的葬礼)发生了变化。根据这些变化,我们可以看出匈奴早期(公元前 200-50 年)和晚期(公元前 50 年-公元 100 年)匈奴时期的大致划分。总体而言,与蒙古以前的时期和文化相比,匈奴墓葬的特点是墓葬物品和陈设品急剧增加。随着匈奴的扩张,他们征服了东西方的众多邻国,并征服了南方的汉朝邻国。他们不断与中国汉族进行贸易和战争,无视长城边界,并在中亚的丝绸之路王国。来自中国、波斯和地中海的异国物品的发现证明了这些遥远的相互作用,当地精英的坟墓中有埃及风格的彩陶珠,统治者坟墓中有罗马玻璃碗。匈奴时代末期。公元 100 年的标志是,在中国东北部的鲜卑和汉朝的失败之后,匈奴的权力和影响力普遍下降,尽管直到公元 5 世纪,来自匈奴帝国的孤立群体继续存在于中国北方。


匈奴早期(公元前 200-50 年)。匈奴早期的名品以大型铜带件为主;然而,早期墓葬习俗因地区而异。这方面的一个例子发生在 萨尔基廷 阿姆墓地,那里的环形坟墓仪式表现出高度的变化,甚至包括更典型的阿尔泰精英的整匹马,例如 巴泽雷克坟墓中的马。我们在本研究中分析了来自三个早期匈奴遗址的个体:阿斯廷郭勒(AST)、乌拉尔乌尔 (BAU/BRL/BUU) 和 萨尔基廷 阿姆 (SKT)。


匈奴晚期(公元前 50 年 - 公元 100 年)。匈奴晚期的名品更多是铁制物品,常贴金箔甚至镶嵌宝石,越来越注重远距离的异域材料。与此同时,整个帝国的环形坟墓的葬礼也变得更加规范。大多数精英被埋葬在竖井中的木棺中,棺材旁边放着牲畜部分和陶瓷器皿。后期,匈奴的高层统治者采用了一种全新的墓葬结构。这些方形墓葬的表面以长方形石结构为标志,带有梯形“坡道”入口,墓坑极深,木制棺材装饰并嵌套在较大的木室中。我们在本研究中分析了来自 26 个晚匈奴遗址的个体:阿特森阿姆(ATS)、巴伦穆赫达金阿姆(BAM)、巴伦霍夫迪林阿姆(布鲁)、布尔汗陶勒盖(BTO)、钱德曼山(CHN)、德尔格尔汗乌尔(DEL)卡南乌尔 (DOL)、杜尔加乌尔 (DUU);埃梅尔·托勒盖(EME)、胡德吉安(HUD)、伊赫·托霍伊罗(IKT)、伊尔莫瓦亚广场(IMA)、贾加兰坦(也叫 Jargalantin Khondii;JAA/JAG),Tarvagatain Am(也叫 霍伊特·森克尔;霍伊)奈玛·托尔盖(奈伊)、圣乌尔(桑)、索尔比·乌尔(索尔)、松吉诺·海尔汗(儿子)、塔希廷·霍特戈尔(塔克)、塔万·托尔盖(塔夫)、提夫什山(提夫)、乌兰祖赫(乌尔恩)、奥夫贡特(乌尔夫))、塔米林·乌兰霍舒(也称为 Burkhan Tolgoi;BUR / TMI / TUH / TUK)和 乌古穆尔 (UGU)。


邻近地区的几个同时代地点的比较基因组数据是可用的,包括:(1)两个来自 库夫斯古尔(库苏古尔)省的早期匈奴个体,可追溯到公元前 50-350 年; (2) 公元 80-160 年位于阿尔汉盖的一座匈奴晚期皇家陵墓 (DA39.SG)



 中世纪早期(约公元 100-850 年)

匈奴灭亡后,来自中国东北部的鲜卑族群被推入蒙古,虽然历史和考古证据表明,建立庞大而持久的鲜卑政权的证据只出现在中国北方,而没有出现在蒙古。这项研究中的一个人 (TUK001) 在 塔米林·乌兰·霍舒 (Burkhan Tolgoi) 遗址可以追溯到内亚鲜卑政权时代;然而,没有任何文化背景可以证实与鲜卑或中国东北其他群体的联系。取而代之的是,该遗址最近的发掘产生了人工制品,例如来自咸海附近 夸雷兹姆 绿洲文化的陶器和萨珊波斯帝国的硬币,表明与中亚和更远西部地区的重要互动。在四世纪中叶,一个被称为柔然的大政体据称接管了整个蒙古。然而,关于柔然的历史记载很少,迄今为止发现的墓葬只有一处可以追溯到柔然时代。蒙古2至6世纪的考古,即鲜卑和柔然时代,构成了一个极其新的研究领域。


中世纪早期最突出的政治实体是突厥和维吾尔帝国,后者是前者的直接王朝接管。蒙古国出土了许多突厥时代的墓葬。相比之下,迄今为止发现和挖掘的维吾尔族墓葬要少得多。


突厥汗国(公元 550-750 年)。阿尔泰山脉的突厥部落从公元 552 年开始在整个欧亚大陆建立了一个政治结构,一个帝国在公元 581-742 年间统治了蒙古。公元 659 年至 682 年之间发生了短暂的分裂,在此期间,中国唐朝对蒙古提出了要求。本研究中的一个人 (TUM001) 是位于蒙古中部一座中国式墓葬坡道内的一位祭祀人(通过墓碑铭文)到这个确切的时间段。本研究中的其他突厥时代个体是从传统突厥风格的坟墓中挖掘出来的。突厥时期的特征包括横跨草原景观的众多石像和石供盒,而墓葬通常排列成小组坟墓或单个坟墓,插入早期青铜器到铁器时代的墓地。大多数精英被埋葬在木棺中,作为单独的个体被埋在石丘下,许多精英被埋葬在配备有骑乘装备的整匹马身上。其他墓葬在小木棺中,旁边没有整匹马。我们在本研究中分析了来自 5 个土耳其遗址的个体:诺姆贡尼·孔迪 (NOM)、肖隆·本巴加尔(突厥 陵墓;TUM)、扎安霍舒 (ZAA)、乌里雅苏台河下游阶地 (ULI) 和 乌姆穆尔 (UGU)。


回鹘汗国(公元 750-850 年)。八世纪中叶,上叶尼塞地区的维吾尔部落推翻了突厥统治者,并立即建立了一个以蒙古为基础的帝国,以鄂尔浑河谷为首都,并于公元744-840年建立了王朝。迄今为止挖掘出的大多数维吾尔族时期墓葬,包括本研究中的奥隆多夫墓地 (OLN) 的墓葬,都位于鄂尔浑河谷的哈尔巴尔加斯首都附近。大多数挖掘出的墓葬都是在大型土制围墙下发现的,这些围墙包含祭祀最高层精英的仪式结构。这些显眼的仪式围场以单个纪念碑或小团体的形式出现,它们在维吾尔首都附近的山麓的几个地方都有发现。这些带有坡道入口和拱形砖室的巨大坟墓很可能是为维吾尔帝国的统治贵族保留的。本研究中的一个人 (OLN006) 在一座巨大的坟墓中被发现。第二种更普通的维吾尔族墓葬包括放置在表面的石头结构,方形或圆形,其中包含多个人。在奥隆多夫 (Olondov) 记录了数十个这样的墓葬 ,而本研究中的大部分维吾尔族人都来自这样的坟墓。奥隆多夫 的一个这样的坟墓,坟墓 19,包含多个人的遗骸,其中 6 人包括在本研究中。在蒙古还发现了其他零散的维吾尔族单一坟墓的例子,我们分析了其中一个(ZAA001)来自 扎安霍舒遗址。尽管在蒙古中部的其他地方发现了一些大型的“皇家”建筑群,但尚未在首都地区以外发现任何重要的墓地。我们在本研究中分析了来自两个维吾尔族站点的个体:奥隆多夫 (OLN) 和 扎安霍舒 (ZAA)。


邻近地区的同期位点有比较基因组数据,包括:(1) 北奥塞梯-阿拉尼亚的 阿兰 遗址和高加索的阿兰 51; (2)蒙古阿尔康盖喀尔门塔尔遗址柔然遗址。



 中世纪晚期(约公元 850-1650 年)

蒙古的这一时期主要是由契丹人(公元 907-1125 年)和蒙古人(公元 1206-1368 年)建立的两个帝国的权力斗争所主导。契丹时代的墓葬在蒙古几乎不为人知,而蒙古时代的许多坟墓已被记录和出土。两个时期都知道所谓的洞穴墓葬,但他们的人类遗骸不包括在这项研究中。


契丹(约公元 900-1100 年)。公元840年蒙古的维吾尔帝国灭亡后,中国东北的契丹人于公元916年建立了强大的辽朝。契丹人虽然位于满洲,但通过驻军和长城系统征服并控制了今蒙古的草原,将其他被征服地区的人,如朝鲜北部,驱逐到蒙古。公元 1125 年契丹帝国的解体导致蒙古出现权力真空,直到公元 13 世纪初成吉思汗崛起。迄今为止,在蒙古发现的契丹时代墓葬很少。乌兰凯雷姆 II (ULA) 遗址出土了一座契丹时代的坟墓 (ULA001),在 扎安霍舒 (ZAA) 的一个匈奴人定居点的挖掘过程中,还发现了两座契丹时代的无标记男女坟墓。较旧的倒塌建筑物。这名男子在坑房内的一个坑中被发现,被埋在一个带有箭袋和箭的简单坑中。这名妇女在一个坑房附近被发现,她穿着盛装下葬,仰卧在木棺内,头朝西北,还有契丹时代的陶器。这些墓葬在形式和结构上与中国北方的其他契丹墓葬有很大不同,那里是帝国的核心所在。目前,蒙古境内尚未发现契丹高级精英的纪念性陵墓。


蒙古(约公元 1200-1400 年)。蒙古部落的大本营位于蒙古东北部鄂农河和克吕伦河的森林草原地带。他们从这个核心地区成功地征服了欧亚大草原和邻近地区的大多数定居邻居。历史记载表明,他们在不断壮大的帝国各地转移了大量战败者、战俘和奴隶;它们还促进了贸易、知识、技术和技术人员的交流(奥尔森,2015

)。蒙古人的墓葬通常以小组形式分布在平坦的南坡上,或放置在青铜器和铁器时代的墓地内。它们在地面上用不规则的、平坦的、椭圆形或圆形的、单层设置的石头标记。坑通常在 50-150 厘米深之间,很少更深,并且很少被建造为壁龛。典型的蒙古墓葬包含一个人仰卧放置,有时在木棺中,头部朝北。蒙古墓葬的一个非常典型的特征是包括来自小型牲畜的胫骨,主要是绵羊,放置在头部附近,有时放在容器中。关于随葬品,有两种理想的墓葬类型:一种配有弓箭、箭袋、马具和带附件的腰带,另一种配有剪刀、梳子、镜子、珠子和鳅帽– 一顶用桦树皮制成的长帽子,上面覆盖着丝绸,上面装饰着金色的装饰品。这些标准类型的坟墓遍布蒙古各地,目前没有地区差异的报道,也没有已知的纪念性墓葬。本研究包括的蒙古墓葬属于这些类型,包括当地草原勇士和蒙古帝国精英的墓葬。本研究未对来自国际大都喀喇昆仑的个人进行抽样。


历史记载提到,有大量的外来人,无论是出于机会还是被迫迁移到蒙古帝国的核心草原地区。鉴于匈奴时代当地精英成员之间极端遗传多样性的有趣结果,人们可能会期待蒙古时代类似甚至更大的多样性。然而,在核心草原领域,蒙古帝国的低层地方似乎并没有那么开放。必须在其他墓葬环境中寻找所谓的传入外国人的质量,而不是蒙古传统。


未分类。除了这些主要类型之外,我们还分析了来自三个中世纪晚期遗址的个体,这些遗址包含具有不确定或未分类的文化隶属关系的墓葬:顺克莱山 (SHU)、柴达木 Bag (TSB/TSI)、乌日林乌瓦 (UUS)。


由于没有可用于同期站点的比较基因组数据,我们将我们的中世纪晚期数据与现代蒙古语人口(布里亚特语、康尼干语、卡尔梅克语、蒙古语、达斡尔语、图语、蒙古语)进行了比较.



 方法详情

 样品材料的放射性碳测年

在德国曼海姆 (n = 28) 的柯特·恩格霍恩-考古测量中心(CEZA) 和科隆大学加速器质量中心通过骨骼和牙齿材料的加速器质谱 (AMS) 获得了总共 30 个新的放射性碳数据光谱法 (CologneAMS) (n = 2)。为所有具有模糊或不寻常埋葬背景的墓葬以及在其指定时期内作为遗传异常值出现的所有个体进行放射性碳测年选择。所有骨骼和牙齿样本都成功获得了未经校准的直接碳数据(表 S4)。本研究中另外 74 个先前公布的个人放射性碳日期也被编译和分析,使本研究中直接确定日期的个人总数达到 98 个(总共 104 个日期)。日期使用 OxCal v.4.3.2与 r:5 IntCal13 大气曲线 .


在本研究分析的 104 个总放射性碳日期中,有 25 个与挖掘现场笔记或以前的出版物中报告的考古时期名称相冲突(表 S4)。四个文化背景不确定的墓葬被成功分配到青铜器时代(BIL001、MIT001)和中世纪晚期(UUS002、ZAA003)。一个最初分配给中世纪晚期的墓葬在放射性碳测年 (ERM001) 后被重新分配到青铜时代之前,而一个最初分配给中/晚期青铜时代的墓葬同样被重新分配到青铜时代早期 (IAG001)。这表明早期埋葬可能在文献中被低估,因为它们被误认为是后来的坟墓。同样,三个最初归类为中世纪晚期的墓葬被发现比中世纪早期 (TSB001) 和中/晚期青铜时代 (ULZ001, TSI001) 还要古老数百或数千年。尽管一些高度分化的墓葬形式可能具有特定地点和时间段的特征,


除了早葬被误认为晚葬外,晚葬也被错误地分配到较早的时期。例如,最初指定为青铜时代中期/晚期的三个墓葬被确定为早期铁器时代 (DAR001)、匈奴 (ULN004) 和晚期中世纪 (SHU001) 时期,以及两个早期铁器时代 (CHN010、CHN014) 、六个匈奴(TUK001、UGU001、DUU002、BRL001、BAU001、DEE001)和两个早期中世纪(ULA001、ZAA005)坟墓在放射性碳测年之后同样被重新分配到后期。将考古时期正确分配给后来的墓葬的部分困难与后期人群频繁重复使用早期的坟墓和墓地有关。几个匈奴发掘的现场报告指出了墓葬入侵、墓葬移位以及其他墓葬干扰和再利用的迹象。然而,埋葬再利用的证据也可能是微妙的,容易被忽视。因此,我们建议在多时期墓地或任何显示出扰动迹象的墓葬中进行文化或时间分配时要格外小心。



用于古 DNA 回收和测序的采样

对来自 225 个人的破碎颅骨的总共 169 颗牙齿和 75 块岩骨进行了采样(表 S1 C)。对于 14 个人,对牙齿和岩骨进行了采样(表 S2 B)。3人采集2颗牙齿,1人采集2颗牙齿和1颗岩骨(表S2)B)。对于蒙古族材料,在 M. 埃尔丁 和 S. Ulziibayar 的指导和监督下,在蒙古国立大学和考古与民族学研究所的体质人类学收藏中收集了整颗牙齿和岩骨(ERM 除外)。ERM 的岩质和牙齿材料由 J. Bemmann 提供。对于俄罗斯材料,从蒙古、佛教和西藏研究所以及俄罗斯科学院 (RAS) 布里亚特科学中心收集了与岩骨或骨一起的整颗牙齿。收集后,选定的人类骨骼材料被转移到马克斯普朗克人类历史科学研究所(MPI-SHH)进行基因分析。

 

基因数据生成的实验室程序

基因组 DNA 提取和测序双链 DNA (dsDNA) 测序文库制备在 MPI-SHH 的专用古代 DNA 洁净室设施中按照已公布的方案进行(达布尼等人,2013 年

) 稍加修改。我们对尿嘧啶-DNA-糖基化酶 (UDG) 进行了部分处理,以将 DNA 损伤限制在古代 DNA 分子的末端。这种“UDG-half”文库使我们能够最大限度地减少比对基因序列数据中的错误,同时还能保持基于 DNA 损伤的身份验证所需的终端 DNA 错误掺入模式。文库制备包括通过在 P5 和 P7 测序接头处添加独特的 8 聚体索引序列进行双索引。在用于筛选的浅散弹枪定序法测序后,我们通过执行解决方案丰富了 195 个具有 ≥ 0.1% 读数的个体文库(hs37d5;具有诱饵序列的 GRCh37)大约 124 万个信息丰富的核 SNP(“1240K”)使用匹配目标位点的寡核苷酸探针进行捕获。此外,还选择了8 个样本(见表 S2 A 和S2 B)并将其构建到单链 DNA (ssDNA) 测序文库中进行比较。按照制造商的协议,在高通量测序技术 4000 平台上为所有散弹枪定序法和捕获的文库生成单端 75 碱基对 (bp) 或双端 50 bp 序列。通过在两个 8 聚体索引中的每一个中允许一个不匹配来对输出读数进行多路分解。



量化和统计分析

 序列数据处理

使用 EAGER v1.92.55 程序通过自动化工作流程处理短读长测序数据。具体来说,在 EAGER 中,从测序数据中修剪测序 接头序列,并使用 AdapterRemoval v2.2.0 合并重叠序列对。然后使用 BWA aln/samse v0.7.12 将具有 30 个或更多碱基的适配器修剪和合并读数与具有诱饵序列 (hs37d5) 的人类参考基因组对齐。应用了非默认参数“-n 0.01”。使用 dedup v0.12.2。基于 DNA 错误掺入的模式,我们使用 bamUtils v1.0.13,去除基于脱氨基的 5'C>T 和 3'G>A 错误掺入。然后,我们使用 samtools mpileup 模块生成堆积数据,使用 Phred-scale 质量分数 ≥ 30 (“-Q30”) 的碱基对来自原始和最终屏蔽 BAM 文件的 Phred-scale 映射质量分数 ≥ 30 (“-q30”) 的读数。最后,我们从 1240K 捕获面板中的 SNP 堆中随机选择一个碱基,用于使用 pileupCaller 程序 v1.2.2 进行下游群体遗传分析。对于 C/T 和 G/A SNP,我们使用了最终屏蔽的 BAM 文件,对于其他我们使用原始未屏蔽的 BAM 文件。对于 8 个 ssDNA 文库,我们对 C/T SNP 使用了最终掩蔽的 BAM 文件,对其他文库使用了原始 BAM 文件。


如果每个人对一个以上的样本进行基因分析,我们会比较样本之间的人类 DNA 量。对于成对的岩骨和牙齿,13 个人中有 8 个人的岩骨中人类 DNA 较高,13 个人中有 5 个人的牙齿中人类 DNA 较高(表 S2 B)。此外,个体样本内的变异很大,这可以从成对牙齿样本之间观察到的高变异中得到证明(表 S2 B)。最后,在比较 dsDNA 和 ssDNA 文库时,ssDNA 文库在 8 个文库对中的 7 个中产生了更高的内源性含量。在进一步分析之前合并来自配对样本的所有数据。


在分析的 225 个新个体中,18 个在散弹枪定序法筛查中未能产生足够的人类 DNA(< 0.1%)(表 S2 A),另外 6 个个体在 DNA 捕获后未能产生至少 10,000 个 SNP(表 S2 A)。这24个个体被排除在下游群体遗传分析之外。



 数据质量认证

为了确认我们的序列数据由污染最小的古代个体的内源基因组 DNA 组成,我们收集了多项数据质量统计数据。首先,我们列出5'C> T和3'G> A错误掺入率(表S2使用mapDamage v2.0.6读A)作为上的位置的函数。由于降解 DNA 中的胞嘧啶脱氨作用,这种在末端富集的错误掺入模式被认为是古代 DNA 大量存在的标志。其次,我们使用 Schmutzi 程序估计了所有个体的线粒体 DNA 污染。具体来说,我们将去除适配器的读数映射到修订后的人类线粒体基因组剑桥参考序列(rCRS;NC_012920.1),并在末尾延长 500 bp 以保留通过原点的读数。然后我们使用circularmapper v1.1。Schmutzi 程序的 contDeam 和 schmutzi 模块连续运行来自 197 个个体的全球等位基因频率数据库,从而估算出每个个体的线粒体 DNA 污染率(表 S2 A)。最后,对于男性,我们还使用 ANGSD v0.910 中的污染模块根据 X 染色体数据估计了核污染率(表 S2 A)。对于该分析,已知 SNP 与侧翼碱基错配率的增加被解释为污染的证据,因为男性只有一个 X 染色体副本,因此他们的 X 染色体序列不应包含多态性。我们使用“方法 1 和新似然估计”报告矩量法估计,但所有其他估计都提供了定性相似的结果。


估计有 10 个个体具有 > 5% 的 DNA 污染(线粒体或 X)或不确定的遗传性别(表 S2 A);这些个体被排除在下游群体遗传分析之外。



 基因性别分型

我们计算了常染色体和每个性染色体上的基因序列覆盖率,以获得性染色体覆盖率和常染色体覆盖率之间的比率。对于 1240K 捕获数据,我们观察到女性的 X 与常染色体覆盖率的比率大致均匀(X 比率约为 0.8)和 Y 比率为 0,而男性的 X 和 Y 覆盖率约为常染色体的一半( ~0.4)。总共可以确定 224 个个体的遗传性别,其中 100 个为女性,124 个为男性(表 S2 C)。



单亲单倍群分配

我们称为从Schmutzi包使用log2fasta程序Schmutzi输出线粒体共有序列,具有10质量阈值,则我们分配每个共有序列为单倍群(表S2 C)使用HaploGrep 2 v2.1.19。对于 Y 单倍群分配,我们选取了 ISOGG 数据库中列出的 13,508 个 Y 染色体 SNP,并使用 pileupCaller(使用“-m MajorityCalling”选项)对每个男性进行了多数单倍体基因型调用。我们分配每个单独的成单倍群(表S2 C)使用yHaplo程序的一个补丁版本。此版本考虑了 aDNA 数据的高丢失率,以防止程序由于缺少 SNP 并因此分配错误的单倍群而在内部分支过早地停止其从根到尖端的单倍群搜索。我们按照开发人员的建议使用了“–ancStopThresh 10”。单倍群分配显示在图 S2 A 和 S2B 中。



 遗传相关性的估计

为了评估我们数据集中的相关性,我们计算了所有个体常染色体上单倍体基因型的成对错配率。每对个体的成对错配率定义为两个个体具有不同等位基因采样的位点数除以两个个体拥有数据的位点总数。将无关个体之间的成对错配率设置为基线,关系系数与基线成对错配率成反比。更详细的描述可以在找到补充材料的.


在整个数据集(表 S2 D)中总共观察到 15 个一级或二级遗传关系,其中 10 个可追溯到匈奴时代。此外,在一个案例中,被认为属于一个人 (AT-871) 的牙齿和岩骨后来被发现属于两个不同的人 (OLN001.A 和 OLN001.B)。在另一个案例中,发现被认为属于不同个体的两颗牙齿(AT-728 和 AT-729)来自同一个体(TUK001/TAV008)。



 用于群体遗传分析的数据过滤和汇编

为了在已知的古代和现代遗传多样性的背景下分析我们的数据集,我们将其与之前发表的现代基因组数据合并,这些数据来自 i) 在人类起源阵列上基因分型的 225 个全球人群 西蒙斯基因组多样性项目(“SGDP”)中的 300 个高覆盖基因组 欧亚大陆目前可用的古代基因组数据。当与 SGDP 数据集相交时,我们在我们的数据集中获得了 1,233,013 个 SNP 位点(其中 1,150,639 个在常染色体上),在与人类起源阵列相交时获得了 597,573 个位点(其中 593,124 个在常染色体上)。



 人口结构及关系分析

我们使用 Eigensoft v7.2.1 包中的 smartpca v16000 对具有人类起源数据的合并数据集执行主成分分析 (PCA)。现代个体用于计算 PC(图 S3 A),古代个体使用“lsqproject: YES”选项投影到预先计算的组件上(图 2;图 S3 B)。为了进一步表征种群结构,我们还使用 admixtools v5.1 包中的 qp3Pop v435 和 qpDstat v755计算了f3和f4统计数据。我们在用于计算f4统计数据的参数文件中添加了“ f4mode: YES ”选项。



 使用 qpAdm 进行外加剂建模

对于混合建模和估计祖先比例,我们在 admixtools v5.1 包中应用了 qpWave v410 和 qpAdm v810 在与 SGDP 数据合并的数据集上以最大化分辨率。为了将目标建模为其他源种群的混合,qpAdm 利用f4统计量的线性,即可以找到与目标对称相关的源的线性组合,即它们与分析中所有外群的关系. qpAdm 优化混合系数以匹配观察到的 f4 统计矩阵,并报告p 值对于零假设,即目标从与外群不同相关的所选来源中获得其祖先(即,当 p < 0.05 时,零假设被拒绝,因此目标与给定当前集合的所选来源的混合不同外群)。qpAdm 中选择的外群需要与来源不同,以便在测试中“锚定”某个主要祖先,这是相当启发式的。我们使用 qpWave 来测试一组外群的分辨率,以区分欧亚人之间的主要血统,以及给定一组外群的人群之间的遗传多样性。我们在研究中使用了一组 8 个外群种群:中非狩猎采集者 Mbuti.DG (n = 5)、土著安达曼岛民 Onge.DG (n = 2)、台湾原住民 Ami.DG, 新石器时代早期伊朗人 Iran_N (n = 8),来自安纳托利亚西部的新石器时代早期农民 安纳托利亚_N (n = 23),以及来自意大利北部维拉布鲁纳 (Villabruna) 的更新世欧洲狩猎采集者 (n = 1).


为了评估潜在的性别偏见(图 S2 C),我们将 qpAdm 应用于常染色体(默认设置)和 X 染色体(在参数文件中添加“chrom:23”)以比较估计的祖先比例的差异。对于某个祖先,我们使用 P A和 P X之间的比例差异除以它们的标准误差来计算性别偏见 Z 分数(和=(磷一种−磷X/+−−−−−√σ2X)和=(磷一种−磷X/σ一种2+σX2), 在哪里 σ一种σ一种 和 σXσX 是相应的折刀标准误差,如之前在 。因此,Z 分数为正表明常染色体比 X 染色体具有更多的血统,表明男性驱动的混合物。相反,负 Z 分数表明女性驱动的混合物。表 S5 K中提供了来自常染色体和 X 染色体的 qpAdm 估计值。



通过 DATES时间 混合事件

我们使用了 DATES v753 估计古代个体混合事件的时间(图S6 B),并将估计的世代混合日期转换为假设每代29年的年份。我们通过添加每个古代种群的年龄(即每个种群中可用校准 14C 日期的 95% 置信区间的中点的平均值)来显示当前年份的混合日期(图 S6 A)。DATES 估计的标准误差来自加权块折刀,这是 DATES 参数文件中的一个选项。在运行 DATES 的参数文件中,我们在每次运行中使用了“binsize: 0.001”、“maxdis: 1”、“runmode: 1”、“mincount: 1”、“lovalfit: 0.45”,与https上的示例文件相同。



 表型 SNP 分析

我们检查了 17 个基因(表 S2 E)中的49 个 SNP,这些基因已知与欧亚大陆的表型性状或正选择相关。鉴于古代 DNA 数据的低覆盖率,我们专注于其中的五个基因,并根据已发表的策略,根据覆盖在 SNP 上的读数计数,计算每个古代群体中 SNP 的等位基因频率的可能性。在等位基因频率计算中,我们将青铜时代中期/晚期之前的所有古代个体归为一个组,并在 MLBA 期间保留了三个遗传组(库夫斯古尔_LBA、阿尔泰_MLBA、乌兰祖克),在铁器时代保留了两个遗传组(钱德曼_IA、石板墓),一个匈奴一组,中世纪早期一组,中世纪晚期一组。我们计算了与乳糖酶持久性 (LCT/ MCM6 )、皮肤色素沉着 ( OCA2、SLC24A5 )、酒精代谢 ( ADH1B ) 和包括铲形切牙 ( EDAR )在内的上皮表型相关的五个位点 (表 S2 E) 的等位基因频率(图 5)。



 将古代个体遗传聚类为分析单元

为了使用基于组的分析进一步表征东部草原基因库的动态变化,我们结合他们的时间、考古和地理信息定量检查了分析个体之间的遗传差异。我们首先通过观察古代个体在 PCA 上的位置,从 2,077 名现代欧亚个体中获得了人口结构的近似图。PC1 在地理上将东部和西部人群分开,PC2 捕获欧亚东部的内部变异,PC3 捕获欧亚西部的变异,从而使我们能够表征随时间推移的遗传变化的整体模式,并帮助我们制定有关遗传关系的明确假设群体和个人之间。其次,我们计算了外群-f3和对称- f4统计量 (1) 量化在 PCA 上落在一起的个人/群体之间的遗传相似性,以及 (2) 探索其祖先可能通过混合导致观察到的群体之间差异的群体。第三,我们确定了具有代表性的古代种群作为五个不同祖先的代表,然后我们进一步调查(表 S3B)。我们根据时间和考古记录相应地更改了测试组的特定祖先代理。使用这些祖先代理,我们使用 qpWave/qpAdm 进行了正式的混合建模,它测试了目标和代理组合(即混合模型)之间的差异,关于它们对外群的遗传亲和力。我们对属于同一时间/文化/地理类别的测试组应用了相同的混合模型,以直接比较它们(图 3和图4)。在下面的段落中,我们描述了我们数据集中报告的每个基于遗传学的分析组,以及我们使用 qpAdm 对其遗传祖先进行建模所应用的原则。



前青铜时代

⋅ 新基因组:东蒙古_preBA (1)、中蒙古_preBA (1) 和福福诺沃_EN (4)

⋅ 已发表的基因组:魔鬼洞穴_N(6) 和 贝加尔_EN(9)


我们的数据集在欧亚大陆东部的青铜时代开始之前添加了三个与古代东北亚 (ANA) 相关的基因组。在此期间,我们观察到 ANA 祖先从贝加尔湖到俄罗斯远东的广泛分布,跨越 2,000 多公里。由于 贝加尔_EN 已被建模为具有约 10% 的古代北欧亚 (ANE) 血统,我们还分别使用 Botai、AG3、MA1 和 西西伯利亚_N 作为祖先代理,研究了 ANE 在我们青铜时代之前的蒙古人和贝加尔湖群中可能的遗传贡献。我们发现与 ANE 相关的祖先只出现在中蒙古_preBA 和 福福诺沃_EN 中的程度很小;东蒙古_preBA 中不存在 ANE 血统,而其特征仅在于与 ANA 相关的血统(表 S5 A)。



 青铜时代早期

⋅ 新基因组:阿法纳谢沃_蒙古 (2)、切穆切克_南阿尔泰 (2)、切穆切克_北阿尔泰 (2)

⋅ 已发表的基因组:阿法纳谢沃 (23)、奥库尼沃_EMBA (19) 和 贝加尔_EBA (5)


我们的数据集增加了青铜时代早期的三个主要遗传群体:阿法纳谢沃_蒙古、切穆切克_南阿尔泰和 切穆切克_北阿尔泰。我们将来自沙塔丘鲁遗址 (SHT001, SHT002) 的两个个体分组到阿法纳谢沃_蒙古 中,因为这两个个体在考古上都属于 阿法纳谢沃文化背景,并且在遗传上与来自俄罗斯阿尔泰-萨彦地区的阿法纳谢沃 个体无法区分(图 S5 A、S5C;表 S5 B)。


我们将来自雅格辛虎都 遗址 (IAG001, YAG001) 的两个个体分组到 切穆切克_南阿尔泰,因为这两个个体在考古学上都归类为 切穆切克 文化背景,并在 PCA 上聚集在一起,提供了对 切穆切克 文化的首次基因组调查。我们观察到切穆切克_南阿尔泰 对 ANE 相关群体(例如 博泰)的遗传亲和力最高,对伊朗相关群体的次要亲和力(图 S5 A 和 S5C)。鉴于 阿法纳谢沃和 切穆切克 文化之间的地理重叠和相似的埋葬姿势,我们测试了阿法纳谢沃作为潜在的祖先来源,但是将 阿法纳谢沃 作为两个来源之一的 2-way 模型失败了(表 S5 B)。当使用奥库诺沃(与切穆切克同时代的相邻群体,继承了 阿法纳谢沃 文化)作为 阿法纳谢沃 + 奥库诺沃 或 奥库诺沃 +伊朗 时,该模型也会失败(表 S5B)。为了进一步调查切穆切克_南阿尔泰 中与伊朗有关的血统,我们测试了来自 BMAC 遗传簇(哥诺尔_BA、布斯坦_BA、扎尔库坦_BA 和萨帕利_特佩_BA)的四个已发表群体、四个铜石/青铜时代伊朗群体(哈吉_菲鲁兹_C、沙吉_菲鲁兹_C、_加比-希萨_So_希萨尔_Ba、Sepe_希萨尔_BMAC) 、新石器时代土库曼斯坦和塔吉克斯坦群(派凯_EN、萨拉姆_EN 和 特佩亚诺_EN)和中石器时代高加索狩猎采集者 (CHG)。有趣的是,由博泰 + BMAC 遗传簇群组成的 2-way 模型充分模拟了切穆切克_南阿尔泰,后者的祖先比例约为 40%,而之前的新石器时代土库曼斯坦/塔吉克斯坦群体则没有(表 S5B)。时空上更远的群体,例如伊朗铜石器群体或 CHG,也充分模拟了具有相似祖先比例的切穆切克_南阿尔泰(表 S5 B)。由 博泰+ BMAC + 阿凡纳谢沃 组成的 3 向模型从 阿凡纳谢沃返回正贡献,但与零没有显着差异(11 ± 7%;表 S5 B)。因此,尽管草原群体(阿凡纳谢沃、奥库尼沃)和 切穆切克 之间存在一些文化相似性,但我们观察到这里分析的 切穆切克_南阿尔泰个体之间草原种群的遗传影响水平可以忽略不计。


我们发现切穆切克_南阿尔泰与达利_EBA(图 S5 A)具有密切的遗传亲和力,该个体可追溯到约 公元前 2650 年,来自哈萨克斯坦东南部的墓葬环境不佳,混杂了 ANE-伊朗血统。使用 大利_EBA 应用相同的 2-way 混合模型进行比较,我们发现 达利_EBA 还需要额外的伊朗相关血统,但比例较小,并且以 阿法纳谢沃作为来源的模型不适合,复制了 切穆切克_南阿尔泰中的发现。


切穆切克_北阿尔泰 遗传簇由来自阿尔泰北部的两个女性切穆切克个体(KUM001、KUR001)组成,显示出对 ANA 群体的高遗传亲和力,一小部分血统与切穆切克_南阿尔泰 一致(图 S5 A、S5C;表 S5 B)。与阿尔泰北部的其他切穆切克 或类似 切穆切克的墓葬一样,他们的墓葬建筑缺乏一些典型地与更南部的墓葬相关的特征。



 青铜器时代中晚期

⋅ 新基因组:阿尔泰_MLBA(7)、乌兰祖克_石板墓 (11/16)、UAA001(1)、KHI001(1)、UUS001(1)、KHU001(1)和TSI001(1)

⋅ 已发表的基因组:库夫斯古尔_LBA (17)、ARS017 (1)、ARS026 (1)、辛塔什塔_MLBA (37)、克拉斯诺亚尔斯克_MLBA (18)


我们的数据集将 MLBA 期间东部草原的两个主要遗传组 - Altai_MLBA 和 乌兰祖克_石板墓  - 添加到先前发布的来自蒙古北部的 库夫斯古尔_LBA。我们的新数据大大扩展了蒙古具有遗传特征的 MLBA 种群的地理范围,并揭示了 MLBA 东部草原种群结构的整体情况。阿尔泰_MLBA 组包含来自 阿尔泰-萨扬 地区的 7 个人(BER002、BIL001、ULZ001、ARS026、SBG001、ULI001、ULI003),他们混合在与 斯鲁布纳亚/辛塔什塔/安德罗诺沃BA 文化相关的西部草原基因库之间(“草原_ML”)以及与库夫斯古尔_LBA/贝加尔_EBA 相关的那个。尽管该组内的血统比例估计值随基因组而变化,但阿尔泰_MLBA 代表了一个基因库的形成,其中包含了来自西部草原牧民的大量遗传涌入。因此,尽管存在考古和文化差异(DSKC 和未分类的墓葬类型),我们仍将它们归为一个遗传组。这也解释了 库夫斯古尔_LBA (ARS026) 的一个异常值的遗传特征,他现在在遗传上属于 阿尔泰_MLBA 组。值得注意的是,该组的一个成员 ULZ001 不在阿尔泰,而是在远东蒙古。


另一个基因簇,乌兰祖克_石板墓 ,包含 11 个具有乌兰祖克埋葬类型的个体(BUL001、BUL002、ULN001、ULN002、ULN003、ULN005、ULN006、ULN007、ULN009、ULN010 和 ULN010 个体,来自以下 GRA 和 ULN05lab,见 ULN05 个体)、蒙古东部。鉴于它们与 ANA 的强烈遗传同质性,它们都被归为一个单一的遗传组(表 S5C) 以及两者之间的地理联系。乌兰祖克和 石板墓 的这种聚集证实了之前的考古假设,即石板墓文化可能是从乌兰祖克基因库中出现的。这个遗传簇还解释了另一个库夫斯古尔_LBA 异常值 ARS017,他现在在遗传上属于乌兰祖克_石板墓 组,以及一个来自蒙古中部的未知埋葬类型的个体 TSI001,他也属于这个簇。值得注意的是,一个雄性 姆恩克海尔汗个体 (KHU001) 除了来自 贝加尔_EBA 的主要遗传成分外,还有很大比例的来自乌兰祖克_石板墓 的血统(表 S5C)。个人 ARS017、TSI001 和 KHU001 一起表明与蒙古北部和中部的 乌兰祖克_石板墓群体有联系,尽管这些人是根据当地的葬礼习俗下葬的。总的来说,这个乌兰祖克_石板墓 基因簇是 3000 年前 ANA 蒙古东部_preBA 基因库(由 SOU001 代表)的延续。


我们还确定了三个异常值,它们不属于上述三个遗传簇中的任何一个。来自阿尔泰的 UAA001 (姆恩克海尔汗) 非常适合使用阿法纳谢沃、贝加尔_EBA 和 哥诺尔1_BA 的 3 路混合模型(表 S5 C),尽管它们的历史可以追溯到 阿法纳谢沃 文化之后约 1500 年。来自阿尔泰的 KHI001(未分类培养物)非常适合使用 辛塔什塔 、贝加尔_EBA 和 哥诺尔_BA 的 3 向混合模型(p 值 = 0.056;表 S5 C),呈现来自 哥诺尔_BA 的次要遗传成分。或者,KHI001 也可以建模为 阿法纳谢沃 和 库夫斯古尔_LBA 之间的 2 路混合物(p 值 = 0.117;表 S5C); 但是,此模型的优先级低于前一个模型。来自 库夫斯古尔 省的 UUS001 (DSKC) 非常适合使用 辛塔什塔 、东蒙古_preBA 和 哥诺尔1_BA 的 3 路模型(表 S5 C)。鉴于 UUS001 和东蒙古_preBA 个体之间的时间不一致(~3,000 年),UUS001 的混合伙伴更有可能与乌兰祖克群体有关;乌兰祖克与东蒙古_preBA 具有高度的血统,与UUS001 个体同时期,并且一些乌兰祖克 个体与PCA 中的东蒙古_preBA 个体-SOU001 非常接近。



 早期铁器时代

Gen 新基因组:钱德曼_IA (9)、乌兰祖克_石板墓 (5/16)、

⋅ 已发表遗传群:塔加尔(8)、中心萨卡(6)、天山萨卡(10)、哈萨克斯坦_贝雷尔_IA(2;巴泽雷克文化)


我们的数据集在 EIA 期间添加了两个主要遗传组:一个由 乌兰祖克_石板墓表示,另一个由与 萨格利/乌尤克 文化相关的钱德曼 山遗址 (钱德曼_IA) 表示。除了上述 11 座乌兰祖克墓葬外,来自蒙古东部的 4 名板墓人(BOR001、DAR001、MIT001、SHU001)也与乌兰祖克具有同源的遗传特征,因此被合并到 乌兰祖克_石板墓 分析组(表 S5)C)。有趣的是,PTO001,一个跨贝加尔湖的个体,在考古上也被归类为板墓,其遗传谱与蒙古东部的其他板墓个体相匹配,我们还将 PTO001 合并到乌兰祖克_石板墓 遗传簇中。PTO001 的遗传特征与考古学描述的 EIA 期间板墓文化向贝加尔湖地区的扩张一致。


来自蒙古西部阿尔泰-萨彦地区的同时代的钱德曼_IA 具有与之前的阿尔泰_MLBA 系相匹配的遗传谱。由于所有个体都来自一个站点并在 PCA 上聚集在一起,因此我们将它们分组为一个分析单元(“钱德曼_IA”)。在这里,我们使用安德罗诺沃 相关数据集 克拉斯诺亚尔斯克_MLBA 作为混合建模的代表性中央草原_MLBA 组,因为它在地理上最接近我们的测试 EIA 组。我们首先测试了 克拉斯诺亚尔斯克_MLBA + 贝加尔_EBA 的 2 路混合模型,但它未能对 钱德曼_IA 集群进行充分建模,克拉斯诺亚尔斯克_MLBA + 库夫斯古尔_LBA 也是如此。进一步将 草原_MLBA 源从 克拉斯诺亚尔斯克_MLBA 更改为辛塔什塔_MLBA 并没有挽救 2 路混合模型。然后,我们使用来自 哥诺尔 泰普 地点 (哥诺尔1_BA) 的 BMAC 组作为代理,通过添加与伊朗相关的血统作为第三个来源,尝试了一种三向混合模型。使用克拉斯诺亚尔斯克_MLBA 作为 草原 代表,我们在 钱德曼_IA 观察到 51.3% 的草原、42.2% 的 贝加尔_EBA 和 6.5% 的伊朗血统(表 S5 D)。


因为它是先验的由于从大夏/伊朗长距离迁移到 钱德曼_IA 的可能性很小,我们接下来将相同的三向模型 克拉斯诺亚尔斯克_MLBA/辛塔什塔_MLBA+贝加尔_EBA+哥诺尔1_BA 应用于四个铁器时代中亚群体(来自米森斯克 盆地的 塔加尔,来自哈萨克斯坦中部,哈萨克斯坦东部的哈萨克斯坦_贝雷尔_IA,吉尔吉斯斯坦的天山萨卡)以及最终青铜时代组卡拉苏克。我们观察到,在测试的铁器时代组中,与伊朗相关的血统比例在 7% 到 28% 之间,而卡拉苏克则不需要。尤其是在地理上最靠近哥诺尔 泰普遗址的天山萨卡,估计与伊朗有关的血统最多。由于钱德曼_IA 的 萨格利/乌尤克 和 萨卡 之间的文化联系(见上文第 2.4 节),萨卡和天仙、费尔干纳和河中/图兰的相关群体(如采样的天山萨卡)可能是更靠北的铁器时代群体中伊朗血统的近端来源,如钱德曼_IA。为了缩小这个与伊朗相关的祖先的时空起源,我们使用替代的伊朗相关群体作为天山萨卡的代理测试了 3 向模型:(1)其他三个 BMAC 后群体(布斯坦_BA、扎尔库坦1_BA 和 萨帕利_泰普_BA ) 与 哥诺尔1_BA ,(2) 来自伊朗东南角的 沙尔_I_索赫塔_BA1,(3) 三个伊朗铜石器群体(哈吉_菲鲁兹_C、泰普_希萨尔_C、塞赫_加比_C),(4)来自巴基斯坦的两个铁器时代群体(卡泰莱_IA、洛班尔_IA),(5)来自土尔克曼尼石器时代的群体例如 吉奥克修尔_EN、帕克海_EN 和 泰普_安诺_EN,以及 (6) 来自塔吉克斯坦西部的萨拉姆_EN。除了来自 扎格罗斯的 哈吉_菲鲁兹_C 和 塞赫_加比_C 之外,上面提到的所有伊朗血统代理都提供了一个拟合良好的 3-way 模型(表 S5E)。因此,对于铁器时代东部草原来说,仅凭基因数据,只能将伊朗血统的来源缩小到里海以东的广阔地区。然而,就上下文而言,我们认为这个祖先可能是通过河中/粟特地区(即哈萨克斯坦、乌兹别克斯坦和吉尔吉斯斯坦之间的边界)周围的当地接触到达的。


对于上述史前遗传群体,我们使用 DATES 来估计西方血统来源(WSH 或伊朗相关群体)和当地血统来源(即 库夫斯古尔_LBA 或贝加尔_EBA)之间的混合日期(图 S6)。如图S6所示A,卡拉苏克和塔加尔的辛塔什塔和贝加尔_EBA 之间的估计混合日期与在阿尔泰_MLBA 中观察到的混合日期一致 - 在 3,500 BP 左右。对于中萨卡、巴泽雷克(哈萨克斯坦_贝雷尔_IA) 和萨格利/乌尤克 (钱德曼_IA),其掺合日期估计在几个世纪之后,而最近的掺合日期估计为来自天山的萨卡。值得注意的是,我们发现铁器时代组中 哥诺尔1_BA 和贝加尔_EBA 之间的估计混合日期与 辛塔什塔的混合日期大致一致(图 S6 A)。然而,因为我们使用的是一种设计用于在我们的研究中最好地建模为 3 路外加剂的 2 路外加剂测年的方法,我们警告说,应谨慎解释这些外加剂日期。



匈奴帝国 

⋅ 新基因组:早期匈奴_西(6)、早期匈奴_其余(6)、SKT007(1)、晚期匈奴(24)、晚期匈奴_萨尔马提亚(13)、晚期匈奴_汉(8)、TAK001(1)、TUK002(1)

⋅ 已发表的遗传群: 匈奴_WE(2), 匈奴_王室(1, DA39.SG), 汉_2000BP(2)


我们的数据集揭示了匈奴时期大量以前未表征的遗传多样性。对于个体建模,我们测试了五个主要祖先的所有可能组合:草原(克拉斯诺亚尔斯克_MLBA、辛塔什塔、斯鲁布纳亚、萨尔马提亚、钱德曼_IA)、哥诺尔_BA、库夫斯古尔_LBA、乌兰祖克_石板墓 和汉。考虑到个人建模的低分辨率,我们报告了选定的工作模型,这些模型适用于属于同一时间段和考古背景的许多个人,并反映了 PCA 中观察到的定性趋势。我们观察到,铁器时代钱德曼_IA 是许多匈奴人的一个很好的草原血统代理,但也有许多西欧亚血统的比例高于 钱德曼_IA。这些具有高欧亚西部血统比例的个体显示出与伊朗相关血统的强烈亲和力,这无法用早期青铜时代晚期草原群体(例如,克拉斯诺亚尔斯克_MLBA、辛塔什塔_MLBA 或 斯鲁布纳亚)来解释。相反,哥诺尔1_BA 或铁器时代 萨尔马提亚人 更符合所需的遗传特征。此外,一些个体沿着 PC2 落入欧亚大陆东部,并被解释为欧亚东部基因库 乌兰祖克_石板墓  和现代汉族的组合,而没有来自欧亚西部来源的贡献(表 S5 F)。我们使用现代汉族(“汉.DG”;n = 4)的高覆盖全基因组序列作为目前广泛分布在中国北方的祖先成分的代表,与由 乌兰祖克_石板墓  代表的成分不同,进一步到北方。这是为了在我们的混合模型中实现统计能力,因为迄今为止很少有可用的古代基因组反映这一祖先成分。这是因为古代中国、韩国、日本和东南亚大部分地区都没有采样。我们完全承认当代汉族人群中存在的遗传多样性,并且不打算通过我们的混合建模来主张我们研究中的古代人群与当今民族文化身份之间的特定联系。


对于基于组的 qpAdm 建模,我们根据年龄将匈奴分为两类 - 早期的匈奴和晚期的匈奴。我们进一步将早期匈奴分为两个亚组,匈奴早期_西(SKT010, SKT001, SKT003, SKT009, SKT008, AST001)和匈奴早期_其余(JAG001, SKT002, SKT004, SKT006, SKT005, SKT002, SKT005, SKT002异常值 - SKT007(类似 Khövsgöl_LBA)。先前发表的两个被归类为“匈奴_WE”的匈奴个体显示出与 匈奴早期_rest 相似的遗传特征,可追溯到匈奴早期,并且与我们数据集中的两个早期匈奴遗址(SKT 和 AST)来自同一山谷(表 S5 F)。对于匈奴晚期,我们总结了他们的个体建模结果在表S5G. 基于个体建模结果,我们在匈奴晚期个体中建立了三个亚组,以突出关键的人口统计过程,并将它们用于特定分析,例如性别偏见的基因流。首先,我们将 47 个个体中的 24 个分配到主要的晚匈奴群体中(BTO001、CHN010、DEL001、DOL001、IMA001-IMA008、JAA001、KHO006、KHO00、SAN001、SOL001、TEV002、UGU00004表 S5FG); 该组被很好地建模为两个主要铁器时代集群的混合体,钱德曼_IA+乌兰祖克_石板墓(p = 0.316;76.6 ± 0.8% 来自乌兰祖克_石板墓)。另外 13 个人比 钱德曼_IA 拥有更多的欧亚西部血统,因此需要不同的欧亚西部来源。其中两个(NAI002,BUR001)由 钱德曼_IA+哥诺尔1_BA解释,早期匈奴_西的模型,但其余11个需要萨尔马提亚人贡献,包括三个进化到萨尔马提亚人(BUR003,TM001,UGU010)。将所有 13 个个体作为一个组(晚期匈奴_萨尔马提亚人;BRL002、BUR001-BUR004、DUU001、HUD001、NAI001、NAI002、TMI001、UGU005、UGU006、UGU010),我们推断该组的主要贡献(来自 萨尔马提亚人75.±7. 2.8%;表 S5FG)。另一方面,我们将 8 个个体(ATS001、BAM001、BRU001、EME002、SON001、TUH001、TUH002、YUR001)分为第三组晚期匈奴_汉基于他们与汉族和其他东亚人群的亲和力,而 乌兰祖克_石板墓 无法解释(±石板墓 ±石板墓) 10.6% 来自汉.DG;表 S5 F-G)。先前发表的匈奴皇家个体显示出大量与汉族有关的血统(表 S5 F),类似于我们晚期的匈奴族群。此外,匈奴晚期个体 YUR001 是一个极端的东亚异常值,其基因类似于“汉_2000BP”,两名汉帝国士兵从戈壁南部汉城堡垒附近的乱葬坑中找到。这两个群体,晚匈奴_萨尔马提亚和晚匈奴_汉,有力地支持了来自西方和东方的新祖先的涌入,这些新祖先以前在匈奴早期或更早的种群中没有观察到。我们将两个人排除在分组之外,因为他们不寻常的祖先特征:TAK001 大多类似于 库夫斯古尔_LBA,而 TUK002 被建模为 钱德曼_IA+乌兰祖克_石板墓_哥诺尔1_BA(表 S5 G)。与早铁器时代末青铜时代东部草原种群之间强烈的东西遗传分化相反,匈奴时期的特征是极端程度的遗传多样性和异质性,没有任何明显的地理相关性(图S7)一种)。



中世纪早期

⋅ 新基因组:TUK001(1)、早期_Türk(7)、TUM001(1)、早期维吾尔(12)、OLN007(1)


我们的数据集增加了蒙古中世纪早期的两个主要遗传群体:早期_突厥和 早期_维吾尔。对于每个人,我们测试了四个主要祖先的所有可能组合:草原(萨尔马提亚人、艾伦)、哥诺尔1_BA、乌兰祖克_石板墓 和 汉。来自伊朗相关血统的遗传贡献在突厥人和维吾尔人中变得更加突出,这从使用 阿兰(来自高加索的伊朗牧区人口)的拟合良好的模型中可以看出(表 S5 H)。总体而言,这项研究中的突厥人和维吾尔人表现出高度的遗传多样性,如图 2中他们在 PC1 上的广泛分布所示. TUK001(公元250-383年)是我们数据集中最早的中世纪早期个体,来自具有后匈奴占领的匈奴遗址,具有最高的欧亚西部亲和力。该个体与萨尔马提亚人不同,并且可能混合在萨尔马提亚人和具有 BMAC/伊朗相关血统的人群之间(表 S5 H)。在突厥时期的个体中,TUM001 是一个遗传异常值,主要是东亚(汉_2000BP 样)血统。这个人与一把刀和两条狗一起被埋葬在突厥时代陵墓的斜坡内。陵墓的石碑表明它是为效忠唐朝的普谷部落的一位外交使节而建造的。他的火葬遗体在坟墓中被发现;TUM001 很可能是这位使者的仆人。


关于维吾尔族墓葬,许多墓葬由集体坟墓组成,有人认为这些坟墓可能包含亲属的遗骸。我们在 奥隆多夫遗址检查了一个这样的集体坟墓(坟墓 19);然而,在坟墓 19 中分析的 6 个人中,没有一级亲属(父母-后代对或兄弟姐妹),只有两个人(OLN002 和 OLN003)表现出二级亲属(同父异母的、祖父母-孙子女或同父异母的兄弟姐妹) ) 关系。一个维吾尔人 (OLN007) 具有明显更高比例的汉族相关东亚血统,这无法用 乌兰祖克_石板墓  解释,因此与其他早期_维吾尔 个体分开分组(表 S5 H)。

 



中世纪晚期

⋅ 新基因组:晚契丹(3)、中世纪晚期_蒙古l(61)、SHU002(1)

我们的数据集在蒙古的中世纪晚期添加了两个主要的遗传组:中世纪晚期_契丹 和中世纪晚期_蒙古。我们使用了与中世纪早期相同的建模策略,并通过 qpWave 进一步探索了来自蒙古时期和现代蒙古语族群的每个个体之间的遗传进化枝(图 S7 B;表 S5 J)。可用于分析的契丹人相对较少(n = 3),但都显示出与 ANA 相关的高血统(表 S5 I)。蒙古时代的个体(n = 61)在遗传上更加多样化,并且与现代蒙古语族群形成进化枝(图 S7B)。SHU002 是中世纪晚期的一个个体,但没有可辨认的类似蒙古人的墓葬特征。总体而言,与之前的 1600 年相比,蒙古时期的人的特征是西欧亚血统显着减少。它们最好被建模为类似 ANA 和类似东亚血统的混合来源,只有少量的西方遗传血统。此外,近三分之一的历史蒙古男性(12/38)具有 Y 单倍群 C2b,这在现代蒙古人中也很普遍(图 S3;表 S6);C2b 是假定的成吉思汗父系血统。



致谢

我们感谢D.纳凡、Z.巴特赛汗、V.沃尔科夫、D.泽维恩多吉、L.埃尔登堡、M.霍顿、Sh.乌拉奇明、B.纳兰、N.塞尔奥德贾夫、P.科诺瓦洛夫、Kh.拉格瓦苏伦、N.马莫诺娃、E.米吉多吉、L.南斯拉伊丹、AP.奥克拉德尼科夫、Kh.佩里、S.达尼洛夫 和 DI 布拉耶夫的考古贡献以及索罗多夫尼科夫·康斯坦丁的体质人类学分析。我们感谢蒙古国立大学考古学和体质人类学系和布里亚特科学中心博物馆,SB RAS 在该项目上的合作。我们感谢 R.弗莱德 对早期手稿草稿的评论,感谢 M. 布莱斯代尔 和 S. 甘克尤格对采样的帮助,S.纳格尔 和 M. 迈耶 对 ssDNA 文库准备的帮助,S. 纳卡戈姆分享了一个脚本,用于从低覆盖率序列数据中估计种群等位基因频率,以及 P. 穆尔贾尼用于在发布前授予 DATES 程序的访问权限。许可:本研究中分析的人类遗骸经蒙古文化部和蒙古教育、文化、科学和体育部审查和批准,参考编号为 A0122772 MN DE 0 8124、A0109258 MN DE 7 643 和 A0117901 MN DE 9 4314 和声明编号 12-2091008-20E00225。资金:这项研究得到了马普学会、蒙古教育、文化、科学和体育部(授予 EM 和 DT 的 #2018/25)、俄罗斯基础研究基金会(授予 #18-59-94020)的支持EM 和 DT),俄罗斯联邦教育和科学部(批准号 #14.W03.31。



作者贡献

CW、CJ、EM 和 NB 设计了这项研究;CW 和 CJ 监督了这项研究;EM、SW、JH、JHB、SU、WH、NK、BAB、DAM、PBK、EZ、AVM、NB、CW提供材料和资源;BKM、WTTT、JHB、EM进行考古数据分析;RS 和 CC 进行基因实验室工作;KW、CJ、FK、SS进行基因数据分析;BKM、KW、WTTT、CJ和CW整合了考古和遗传数据;KW、CJ 和 CW 撰写了这篇论文,并得到了 BKM、WTTT、JHB 和其他合著者的贡献。



利益声明

作者声明没有竞争利益。



补充信息


文件 S1。蒙古文翻译:欧亚大陆东部草原 6,000 年的动态遗传历史(由 佐尔贾加尔·恩赫·阿姆加兰、恩克希 ·普雷夫、埃尔丁·米亚格玛、图尔巴特·萨甘和 比约恩·赖什哈特 翻译)



参考

1  阿伦托夫特 ME   西科拉 M。圣格伦 K.-G.  拉斯穆森 S.。。。等。青铜时代欧亚大陆的种群基因组学。自然。2015年


2  艾尔森TT   蒙古欧亚大陆的人口流动。  在:阿米泰·R·比兰 M.游牧民族作为文化变革的推动者:蒙古人和他们的欧亚祖先。夏威夷大学出版社, 檀香山2015.


3  安东尼·德威   马、车轮和语言:来自欧亚大草原的青铜时代骑手如何塑造现代世界。普林斯顿大学出版社

4   巴赫拉赫   阿兰人在西方的历史。 明尼苏达出版社

。。。。。

144   兹温斯 N.  潘恩   特塞登多杰 B. 等。人类在中亚和东北亚扩散的北部路线:来自蒙古托尔泊-16 遗址的新证据。

科学。2019 年



文章信息

出版历史

发布时间:2020 年 11 月 5 日

接受:2020 年 10 月 7 日

以修订形式收到:2020 年 3 月 12 日

收稿日期:2020 年 1 月 8



鉴别

DOI:https : //doi.org/10.1016/j.cell.2020.10.015



版权

 2020 作者。由爱思唯尔公司出版。



用户许可

知识共享署名 (CC BY 4.0) | 如何重用 



科学直通车

在 ScienceDirect 上访问这篇文章



关注公号,支持 转发文章,加入自然部落。




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存