古基因组学视角下的人类历史

2024-12-25 00:00:00熊建雪
科学 2024年6期

古DNA是指从古代样本中获取的任何遗传物质,年代从数十万年到数百年不等。其研究对象包括线粒体DNA、Y染色体DNA和核基因组。线粒体DNA是存在于细胞核之外的小型环状DNA,包含约16 500个碱基对,具有多拷贝、高突变率、易受遗传漂变的影响等特性,在高度降解的样本中更容易被检测到,有助于科学家们追踪母系血统的历史及人类进化过程中微小的遗传变化。Y染色体DNA是男性特有的,全长约为60Mb,主要通过父系遗传,其大部分区域不与X染色体发生同源重组,在构建谱系树和追踪父系血统方面具有极高的分辨率,其显著的地理分布特异性为研究特定地域人群的遗传特征提供了宝贵的信息。核基因组是指存储在细胞核内的全部遗传物质,大约有30亿个碱基对,包含22对常染色体和1对性染色体,在划分精细人群结构、估算人群混合时间和推断人群混合程度等方面存在较大优势。近年来,随着古DNA提取、建库、捕获以及第二代测序技术(next-generation sequencing, NGS)的快速发展,研究人员可以从古代遗骸中直接获取数以千兆碱基的信息。这些信息为我们提供了一个了解过去生物体、环境和事件的直接窗口,也是分子考古学这门交叉学科得以建立的基础。

古基因组学发展简史

古基因组学的研究始于从古代遗骸中提取和分析DNA技术的发展。1984年伊格奇(R. Higuchi)等首次从已灭绝的斑驴(quagga)的皮肤中鉴定出一段229个碱基对的线粒体DNA,标志着古DNA研究的开始[1]。瑞典科学家帕博(S. P??bo)从一具距今约2400年的埃及木乃伊中提取出DNA[2],尽管埃及木乃伊的DNA序列现在看来很可能是来自现代的污染物,但它为古DNA技术的发展奠定了重要基础。聚合酶链式反应(PCR)技术的发展使得从古代样本中扩增微量DNA成为可能。结合新的提取技术,PCR可以用于分析来自骨骼、牙齿等钙化遗骸的DNA,这极大地扩展了古DNA研究的范围,也为后来古基因组学研究奠定了重要基础。然而,古DNA的高度降解及PCR对污染的敏感性也导致了一系列的假阳性结果。进入2000年后,古基因组学迎来了重大突破,科学家们成功检测了古代人类和已灭绝的猛犸象的基因组。第二代测序技术的发展极大地提高了DNA测序的效率和精度,使科学家们可以从古代样本中获取完整的基因组序列,推动了古基因组学的发展。这一系列技术进步使得我们可以更深刻地理解过去的生物群体及其进化历史,同时也推动了古DNA在多个科学领域的应用。

古基因组学在重构人类历史中的关键作用

随着第二代测序技术的发展及检测成本的显著降低,古基因组学在重构人类历史中发挥着越来越重要的作用:揭示了世界范围内人群的迁徙混合历史、人类适应性突变的兴起与发展、疾病的起源与传播及社会组织结构的变化等。

人群迁徙混合历史

近年来,随着大量古基因组学数据的发表,欧亚大陆西部、内亚地区、西伯利亚、美洲及东亚和东南亚地区的人群历史逐渐被勾勒出来。相比欧亚大陆西部,东亚地区古基因组的研究相对薄弱。已有研究显示,末次盛冰期之后,东亚大陆开始出现古代东亚北部人群和古代东亚南部人群,二者之间的分化时间至少在1万年前。进入新石器时代之后,东亚南部人群和北部人群之间的交流逐渐增强,东亚北部人群向南方扩张。笔者所在课题组一直着力于对东亚地区新石器时代人群历史的研究。最近,我们重建了山东地区6000年以来的人群历史,发现大汶口时期的山东人群主要由黄河中游农业人群、部分山东本地采集狩猎人群和中国南方古代人群三种祖先成分混合形成。该研究支持了严文明先生早年提出的“重瓣花朵式假说”,黄河中游的新石器农业人群作为花心,在史前不同北方人群的遗传结构中产生着重瓣花朵式的影响,而龙山时期的山东人群与大汶口时期的人群保持着遗传上的连续性[3]。

武帝面貌复原图 (a)颅骨三维模型;(b)原始的面部重建图;(c)表型预测;(d)最终的面部重建图;(e)《历代帝王图》中的武帝肖像。

对于历史名人遗传结构的研究,有助于我们研究一些古代族群的来源问题。笔者所在课题组近年先后对阿史那皇后、北周武帝宇文邕、高宾等历史名人的基因组进行了研究,为揭示鲜卑、突厥等古代族群的来源问题提供了重要的依据,对历史发展进程中的胡汉融合问题也有了更深刻的理解。例如,通过对木杆可汗的女儿阿史那皇后基因组的研究,解决了关于突厥阿史那部祖源的问题,明确了突厥阿史那部起源于东北亚,即今天的中国东北到俄罗斯贝加尔湖区域,否定了欧亚大陆西部起源说和多重起源说。另外,阿史那氏与铁器时代以后的通古斯语人群和蒙古语游牧人群共享更多的基因,如柔然、鲜卑、契丹和黑水靺鞨,与其他古突厥人有显著的遗传差异,显示了突厥汗国内部的多重来源。最后,突厥阿史那部对现代突厥语人群的遗传贡献非常有限,再次确定了突厥语为文化传播模式,而非人群扩张模式[4]。对北周武帝宇文邕的研究则揭示了武帝及其家族的族源,对于理解鲜卑人的起源意义重大。鲜卑人的外貌长相是历史学界较具争议的话题之一,一些史料表明“鲜卑人具有须发茂盛、发色偏黄、高鼻深目等西域胡人特征”,也有史料记载“鲜卑人与东北亚人群长相没有差别”。我们根据与色素沉积相关的位点,发现武帝是黑色头发、黄色皮肤和棕色眼睛,符合典型的东北亚、东亚人长相,这也为我们解开了一些历史上的谜题。

人类适应性

自然选择是一个非随机的、定向的过程,会导致与表型相关的等位基因频率增加,从而在特定环境下赋予适应性优势。人类是如何进化以应对他们在扩张过程中遇到的新环境?史前人类是否在生物学上适应了文化变化,例如与农业相关的饮食变化?这一过程通过古代DNA的研究可以更加准确地追踪和分析,揭示现代人类遗传多样性的形成过程。

经典的生物文化适应的例子是进入成年期持续产生乳糖消化酶与收集和消费来自驯养动物如牛奶及其乳制品的文化习惯共同演化的过程。如果没有乳糖耐受性,食用乳糖的成年人可能会出现包括腹泻在内的肠道症状,甚至导致营养损失,无法从乳糖消化中获得直接的能量益处。人类乳糖耐受性在全球多个地区独立进化,根据现代欧洲人的基因数据,赋予乳糖耐受性的调控突变始于大约7500年前[5],与新石器时代(农业)文化向该地区的传播相吻合。然而,古DNA数据表明,这种适应性变体的频率增加和地理分布仅发生在过去5000年。古DNA所揭示的乳糖耐受性基因的变化对我们理解史前人类健康和行为方式具有重要意义。

牛奶及其乳制品消费的生物文化适应[6] (a)欧洲新石器时代早期乳制品的考古证据;(b)欧洲乳糖耐受性等位基因频率随时间变化;(c)减少乳糖的乳制品加工技术的早期考古学证据。

人类疾病史

长期以来,传染病的研究是通过对考古发掘中的骨骼进行古病理学评估来进行的。然而,这种方法存在很大的局限性,因为许多感染不会在骨骼上留下可见的痕迹,这导致疾病的出现率往往被低估,鉴定的准确性也较低。第二代测序技术的出现极大地弥补了这一缺陷,该技术不仅可以获得人类群体的遗传信息,还可以研究病原体的基因组。病原体基因组分析对于我们理解病原体如何以及何时出现和进化很有价值。迄今为止,鼠疫耶尔森菌(鼠疫)、天花病毒(天花)、霍乱弧菌(霍乱)、HBV(乙型肝炎病毒)、结核分枝杆菌(结核病)和麻风分枝杆菌(麻风病)等古代病原体都得到了广泛的关注和研究。

麻风病被认为是已知最古老的人类疾病之一,如今在亚洲、非洲和南美洲依然流行,每年有超过 20万例病例,其主要病原体是麻风分枝杆菌。该疾病的特征是颅骨损伤(鼻颌骨综合征)和手脚畸形,但是在骨骼遗骸中诊断麻风病很困难,因为梅毒和银屑病关节炎也会引起类似的骨骼变化。由于麻风分枝杆菌是一种专性病原体,因此在古人的遗骸中存在该分枝杆菌被认为是感染麻风病的明确证据。莫诺(M. Monot)等基于对不同区域大量现代样本的比较遗传分析,发现所有的麻风病病例都可归类于一个簇,并描述了4种主要的麻风分枝杆菌菌株。根据这些菌株的传播情况,提出了一种假设,即该疾病出现于东非或中东,随后在人口迁移过程中传播[7]。后有研究人员从中世纪欧洲各个地区的麻风病患者遗骸中获得了10株麻风分枝杆菌的基因组,并对麻风分枝杆菌的遗传多样性和种群结构进行了分析[8]。

来自这些病原体的基因组数据补充了古病理学家以前获得的信息,不仅可以识别古代流行病的病原体,而且还可以识别现已灭绝的病原体谱系,细化病原体在人群中出现的年表,并重建今天仍然与公共卫生相关的病原体的进化历史。

亲属关系

随着大规模人群迁徙问题逐渐得到解决,近年来的研究重点逐渐转向微观现象。这些现象所涉范围从婚姻习俗、埋葬习俗到社会组织结构,甚至社会冲突。其中亲属关系是人们通过生育、婚姻、收养或其他形式的社会化建立的家庭关系网。虽然关于亲属关系的推论可以来自文本记录,但在没有文本材料的社会中,亲属关系可以从基因组中推断出来。通过对遗址中不同个体之间、同一区域不同遗址间个体亲缘关系的分析,可以构建不同时期的家庭组织结构、社会组织结构和婚姻关系网络。

基于低覆盖度的古基因组数据亲属关系分析方法的不断改进,为基于古DNA数据的亲属关系研究打下了坚实的基础,这些研究从各个方面揭示了过去人类社会的各种社会关系。例如,一项对公元5~7世纪意大利北部和匈牙利两个墓地出土人骨的研究表明,这些墓地的布局围绕着一个以丰富随葬品为特征的中心亲属群体组织起来,与本地人群相比,这些墓葬的人群表现出更高比例的中欧血统。这种血统的存在与罗马帝国灭亡后从潘诺尼亚迁移到意大利北部的过程相一致,表明这些新移民家庭对当地原住民群体施加了显著的社会影响[9]。

结 语

古基因组学研究为我们提供了深入了解过去生物体、环境和历史事件的独特视角,从根本上改变了多个学科领域。它在揭示人类起源与迁徙、种群动态、疾病演变、动植物驯化等方面发挥了重要作用。这些研究不仅帮助我们更好地理解人类和其他物种的历史,还为当今的生物多样性保护和疾病防治提供了宝贵的历史经验。随着技术的不断进步,古基因组学将继续为我们揭开更多历史的奥秘,推动科学的前沿探索。

[1]Higuchi R, Bowman B, Freiberger M, et al. DNA sequences from the quagga, an extinct member of the horse family. Nature, 1984, 312: 282–284.

[2]P??bo S. Molecular cloning of ancient Egyptian mummy DNA. Nature, 1985, 314: 644–645.

[3]Du P, Zhu K, Qiao H, et al. Ancient genome of the Chinese Emperor Wu of Northern Zhou. Current Biology, 2024, 34: 1587-1595.

[4]Yang X M, Meng H L, Zhang J L, et al. Ancient genome of Empress Ashina reveals the Northeast Asian origin of G?ktürk Khanate. Journal of Systematics and Evolution, 2023, 61(6): 1056-1064.

[5]Itan Y, Powell A, Beaumont M A, et al. The origins of lactase persistence in Europe. PLoS Comput Biol, 2009, 5: e1000491.

[6]Marciniak S, Perry G H. Harnessing ancient genomes to study the history of human adaptation. Nature Reviews Genetics, 2017, 18(11): 659-674.

[7]Monot M, Honoré N, Garnier T, et al. On the origin of leprosy. Science, 2005, 308: 1040–1042.

[8]Schuenemann V J, Avanzi C, Krause-Kyora B, et al. Ancient genomes reveal a high diversity of Mycobacterium leprae in medieval Europe. PLoS Pathog, 2018, 14: 1–17.

[9]Amorim C E G, Vai S, Posth C, et al. Understanding 6thcentury barbarian social organization and migration through paleogenomics. Nature Communications, 2018, 9(1): 3547.

关键词:古基因组学 人群历史 人类适应性 古病原体 亲属关系 ■