王小娟,钱恩芳,李悦,宋正阳,赵慧,谢何鑫,李彩霞,黄江,江丽
研究报告
中国西南地区藏族人群遗传亚结构研究
王小娟1,2,钱恩芳1,李悦2,宋正阳1,2,赵慧2,谢何鑫2,李彩霞1,2,黄江1,江丽2
1. 贵州医科大学法医学院,贵阳 550004 2. 公安部物证鉴定中心,北京市现场物证检验工程技术研究中心,现场物证溯源技术国家工程实验室,北京 100038
藏族为中国西南地区典型的少数民族,分为卫藏、康巴、安多和嘉绒等多个支系。然而,对藏族支系人群的遗传结构,特别是各分支人群的父系、母系遗传结构却缺乏深度解析。本研究基于个体水平的常染色体、父系来源的Y染色体和母系来源的线粒体3个类别遗传信息,对西藏地区卫藏藏族、四川甘孜地区康巴藏族、青海地区安多藏族和四川阿坝地区嘉绒藏族共4个藏族群体进行研究,以揭示其遗传亚结构关系。采用微测序技术检测各位点分型,利用PowerPlex®Y23和DNATyperTMY26试剂盒检测Y-STRs基因座分型,通过热图和主成分分析、祖先成分分析、单倍群频率统计、网络图及多维尺度分析等探讨其遗传亚结构。结果表明,常染色体和Y染色体遗传标记可将4个藏族人群分为3类:青藏高原的卫藏藏族为一类,高原周边地区的康巴藏族和安多藏族的遗传结构类似分为一类,“藏彝走廊”中嘉绒藏族的遗传结构与其他藏族人群差异显著而为一类。不同藏族分支人群在线粒体遗传信息方面无明显差异性。上述多类别遗传信息的分析结果为深入了解藏族不同分支人群的遗传亚结构提供了新视角。
群体遗传学;藏族;单倍型;遗传亚结构
藏族是中国古老的民族之一,人数达628.2万(2010年全国第6次人口普查数据),其中43.2%分布于西藏自治区,其余主要分布于青海和四川等地(http://www.stats.gov.cn)。藏语属汉藏语系藏缅语族藏语支,分卫藏、康巴和安多3类方言。根据方言类型,可将藏族人群划分为卫藏藏族、康巴藏族和安多藏族[1]。此外,嘉绒藏族等支系也是藏族人群的重要成员[2]。
藏族人群长期居住于海拔3000~5000 m的青藏高原,经长期自然选择,表现出对高原低氧环境较强的适应能力[3,4]。研究表明,藏族人群的高原适应(high-altitude adaptation, HAA)具有明显的遗传学基础。全基因组关联研究发现,在缺氧诱导因子(hypoxia-inducible factor, HIF)通路上存在、等多个候选基因与藏族人群的HAA相关[5,6]。候选基因上多个单核苷酸多态性(single nucleotide polymorphisms, SNPs)位点的等位基因频率分布在藏族人群与平原人群间具有显著差异,如基因上5个SNPs位点组成的单倍型AGGAA (rs115321619、rs73926263、rs73926264、rs73926265和rs55981512)高频分布于藏族人和丹尼索瓦人[7,8];基因上也检测出rs18699510和rs12097901等多个分布差异位点[9]。除常染色体外,Y染色体的非重组区域以单倍型形式呈父系遗传,有效群体小,对漂变敏感,包含人群更多的父系历史信息[10]。Y-SNPs单倍群在世界人群的分布呈现明显的地理特异性,其中单倍群D-M174主要分布于中国西藏、日本和安达曼群岛[11~13]。与Y染色体类似,线粒体DNA呈母系遗传,是反映人群母系遗传信息的遗 传标记,其单倍群的支系分布同样具有地域差异(http://www.phytree.org/tree/index.htm)。目前也有研究结合父系和母系遗传信息探索藏族人群的遗传结构及源流[14]。但是,不同地理位置的藏族分支人群之间的遗传结构特点有待进一步探究。
本研究基于常染色体、Y染色体及线粒体多类别基因组遗传标记,对西藏地区卫藏藏族、四川甘孜地区康巴藏族、青海地区安多藏族和四川阿坝地区嘉绒藏族等4个藏族人群共297份男性样本进行检测,分析其遗传结构,探讨西南地区不同藏族分支人群的遗传亚结构。
采集中国西南地区297份男性藏族无关个体静脉血样本,其中西藏地区卫藏藏族89例、四川甘孜地区康巴藏族88例、青海地区安多藏族82例、四川阿坝地区嘉绒藏族38例。样本信息及人群简称见表1。本研究已通过公安部物证鉴定中心伦理委员会审查,上述样本供者均签署知情同意书。根据试剂盒说明书,采用QIAamp®DNA Blood Midi Kit (德国QIAGEN公司)进行DNA提取。使用NanoDrop 2000c (美国Thermo Fisher Scientific公司)进行DNA定量并稀释至5 ng/μL待检。
基于多类别基因组遗传信息,共选择134个位点,位点信息见附表1。其中包括:(1)通过文献调研[15]选择藏族特异性常染色体位点25个;(2)依据Y染色体谱系树2018版(https://isogg.org)及文献调研,选择在东亚人群中突变频率较高的Y-SNPs位点75个;(3)依据线粒体谱系树17版(http://www.phylotree. org)及公开数据库和文献调研,筛选在东亚人群中突变频率较高及具有藏族特异性的mt-SNPs位点34个。
1.3.1 筛选位点分型检测
使用Primer Premier 5.0软件设计PCR扩增及延伸引物并由生工生物工程(上海)股份有限公司合成。利用Applied BiosystemsTMSNaPshotTMMultiplex试剂盒(美国Thermo Fisher Scientific公司)进行位点检测。应用Mastercycler ProS热循环仪(德国Eppendorf公司)进行复合扩增,扩增产物使用ABI 3130xl遗传分析仪(美国Thermo Fisher Scientific公司)进行毛细管电泳检测,利用GeneMapper ID v3.2软件分析样本分型。
1.3.2 Y-STRs分型检测
选取16个单拷贝Y-STRs基因座(DYS19、DYS389I、DYS389II、DYS390、DYS391、DYS392、DYS393、DYS437、DYS438、DYS439、DYS448、DYS456、DYS458、DYS533、DYS635和GATA-H4)和1个多拷贝基因座DYS385ab,使用试剂盒检测西藏藏族(CTT)、四川甘孜藏族(CTG)、青海藏族(CTQ)和四川阿坝藏族(CTA)4个人群的分型数据,其中西藏藏族(CTT)、四川甘孜藏族(CTG)和青海藏族(CTQ)人群样本使用PowerPlex®Y23荧光标记复合扩增系统(美国Promega公司)试剂盒检测;四川阿坝藏族(CTA)人群样本使用DNATyperTMY26试剂盒(中国公安部物证鉴定中心)检测。扩增产物用ABI 3500xl遗传分析仪(美国Thermo Fisher Scientific公司)进行毛细管电泳检测并使用GeneMapper®ID-X软件进行Y-STRs分型分析。
1.4.1 常染色体遗传标记
采用Genepop v4.2软件(http://www.genepop. curtin.edu.au)计算4个藏族人群的等位基因频率,R v3.2.3软件绘制热图并进行主成分分析。使用DNA族群推断系统软件(DNA Ancestry Analyzer Version 1.0, DAA v1.0)[16]进行人群聚类分析,参数设置为=2,运行20次。
表1 4个藏族人群的样本信息
1.4.2 Y染色体SNPs及STRs遗传标记
基于国际Y染色体协会(Y chromosome consortium, YCC)的单倍群命名原则[17],根据Y-SNPs位点的分型情况划分样本所属单倍群,采用直接计数法统计各单倍群频率。基于16个单拷贝Y-STRs基因座分型使用公式D= [(1–ΣP2)]/(–1)计算每个藏族分支人群的基因/单倍型多样性,其中P为第个等位基因/单倍型频率,为样本数。对Y-SNPs单倍群相同的样本,基于16个单拷贝Y-STRs基因座分型使用Network v5.0软件进行网络图分析[18]。根据Y-STRs基因座的基因多样性和突变率综合评估设定权重值,基因多样性和突变率越高,权重值越低。其中Y-STRs基因座突变率参考YHRD数据库(https://yhrd.org/pages/resources/ mutation_rates)。为评估藏族分支人群的遗传关系,比较了其与6个邻近人群(四川成都/泸州汉族[19~21]、四川彝族[22]、甘肃藏族(YA004043)、昌都康巴藏族[23]、青海回族[24,25]、青海撒拉族(YA003302))和南方汉族(广西汉族(YA004218))、北方汉族(北京汉族[26~28])的17个Y-filer基因座组成的单倍型。所有参考人群的分型数据来自YHRD数据库。利用YHRD数据库在线软件AMOVA & MDS工具计算群体间遗传距离Rst矩阵,并构建多维尺度(MDS)散点图进行可视化。
1.3.3 线粒体SNPs遗传标记
根据PhyloTree 17版谱系树,结合各样本在mt-SNPs位点的分型判断其单倍群类型,采用直接计数法统计各单倍群频率。
2.1.1 群体聚类分析
25个位点在4个藏族人群的等位基因频率分布热图如图1A所示。基于突变型等位基因频率可将4个藏族人群分为3类,除rs10206434、rs375554942、rs76347095、rs6544888和rs1562453位点外,西藏藏族(CTT)在其他各位点的突变型等位基因频率最高,四川甘孜藏族(CTG)和青海藏族(CTQ)的突变型等位基因频率类似且次于西藏藏族(CTT),四川阿坝藏族(CTA)的突变型等位基因频率最低,与其他藏族分支人群具有较大差异性。根据各位点在人群的等位基因频率进行主成分分析,结果见图1B。PC1和PC2成分的累积贡献率为100%,在PC1维度(99.7%)上,4个藏族人群可分为3类且彼此距离较远而区分开:西藏藏族(CTT);四川甘孜藏族(CTG)和青海藏族(CTQ);四川阿坝藏族(CTA)。
2.1.2 祖先成分
STRUCTURE分析可直观反映族群间的聚类关系。4个藏族人群STRUCTURE分析在=2时的结果见图2,黄色和红色分别代表一种祖先成分(以下分别称为成分1和成分2),颜色比例的构成代表祖先成分比例的构成。结果显示,基于祖先成分比例可将4个藏族人群分为3类:(1)西藏藏族(CTT),群体水平上成分1和成分2分别为0.719和0.281,个体水平上56.2%个体成分1大于0.75,34.8%个体介于0.25~0.75之间,9.0%个体小于0.25;(2)四川甘孜藏族(CTG)和青海藏族(CTQ),群体水平上成分1和成分2分别约为0.45和0.55,个体水平上约25.0%个体成分1大于0.75,45.0%个体介于0.25~0.75之间,30.0%个体小于0.25;(3)四川阿坝藏族(CTA),群体水平上成分1和成分2分别为0.175和0.825,个体水平上无成分1大于0.75的个体,36.8%个体介于0.25~0.75之间,63.2%个体小于0.25。
2.2.1 Y-SNPs单倍群在藏族人群中的分布
藏族人群Y染色体单倍群类型及分布频率见表2。各单倍群频率在藏族人群之间存在显著差异,其中以单倍群D-M174 (34.21%~71.91%)和O-M175 (16.85%~60.53%)为主要类型。在下游分支单倍群中,以单倍群D1a2-P99 (44.44%)和O2-M122 (22.90%)为主。基于单倍群D-M174类型,可将4个藏族人群分为3类:(1)西藏藏族(CTT),71.91%个体属于单倍群D-M174,下游分支以D1a2-P99为主,分布频率为53.93%;(2)四川甘孜藏族(CTG)和青海藏族(CTQ),约60%个体属于单倍群D-M174,下游分支以D1a2-P99为主,分布频率约为47%;(3)四川阿坝藏族(CTA),34.21%个体属于单倍群D-M174,下游分支以D1a1-M15为主,分布频率为26.32%。
图1 4个藏族人群聚类分析
A:基于25个常染色体位点等位基因频率的4个藏族人群热图分析。颜色深浅表示各位点在人群中的突变型等位基因频率大小,树状分枝表示人群和位点的聚类关系。B:基于25个常染色体位点等位基因频率的4个藏族人群主成分分析。
图2 基于25个常染色体位点分型的4个藏族人群STRUCTURE分析
个体水平祖先成分见柱状图,其中每个柱形代表一个个体,每种颜色代表一种祖先成分,颜色比例代表该个体祖先成分比例;群体水平祖先成分见饼图,其中每种颜色代表的祖先成分同柱状图,颜色比例代表该群体祖先成分比例。=2,=−5201.9。
表2 藏族人群Y-SNPs单倍群谱系树及频率分布
加粗字体为藏族人群特异性单倍群D-M174及其下游分支类型。
2.2.2 Y-STRs基因座的单倍型多样性和基因多样性分析
16个单拷贝Y-STRs基因座组成的单倍型中,在西藏藏族(CTT,89例)中共检出82种单倍型,单倍型多样性(haplotype diversity, HD)为0.9972;四川甘孜藏族(CTG,88例)中共检出81种单倍型,HD为0.9976;青海藏族(CTQ,82例)中共检出78种单倍型,HD为0.9985;四川阿坝藏族(CTA,38例)中共检出36种单倍型,HD为0.9972。各Y-STRs基因座在4个藏族人群的基因多样性(genetic diversity, GD)如图3所示,GD值在0.2611~0.8350之间。尽管藏族各分支人群间HD无显著差异,但DYS392、DYS389 II、DYS635、DYS448、DYS456、DYS533、DYS393、DYS19和DYS438在西藏藏族(CTT)中的GD值最低,而DYS458、DYS392、DYS439、DYS635、DYS448、DYS456、DYS533、DYS437和DYS391在四川阿坝藏族(CTA)中的GD值最高。
2.2.3 藏族分支人群遗传关系网络图分析
为进一步观察不同藏族分支人群的遗传关系,选择在4个藏族人群中分布频率较高的3个单倍群D1a1-M15、D1a2-P99和O-M175,根据16个单拷贝Y-STRs基因座组成的单倍型绘制网络图,权重值设置见附表2,网络图如图4所示。结果显示,各单倍群中每一分支人群均未发现明显聚类。西藏藏族(CTT)、四川甘孜藏族(CTG)和青海藏族(CTQ)在单倍群D1a2-P99中的分布较多;四川阿坝藏族(CTA)中单倍群O-M175分布较多。各单倍群均存在不同人群共享Y-STRs单倍型。
图3 16个Y-STRs基因座在4个藏族人群中的基因多样性
图4 基于16个Y-STRs基因座分型的4个藏族人群中D1a1-M15、D1a2-P99和O-M175单倍群网络图分析结果
2.2.4 藏族分支人群与其他群体间遗传关系
遗传距离是反映群体间遗传差异的重要指标。基于遗传距离的4个藏族人群与其他8个人群的MDS散点图如图5所示。结果表明,西藏藏族(CTT)、四川甘孜藏族(CTG)和青海藏族(CTQ)聚为一簇,与昌都康巴藏族距离较近,与其他群体相距较远;四川阿坝藏族(CTA)与四川彝族距离最近,与其他藏族人群相距较远。
4个藏族人群线粒体单倍群类型及分布频率见表3,各单倍群的频率分布在藏族人群之间无显著差异性。各藏族人群均检出M、N两支单倍群,其中单倍群M的频率(56.76%~67.05%)高于单倍群N (32.95~43.24%)。单倍群M以M8、M9、G和D单倍群4个下游分支为主,其中单倍群D的分布频率约为25%。单倍群N以A和R两类分支单倍群为主,其中单倍群R的分布频率约为30%。
图5 基于遗传距离的人群多维尺度分析
红色字体为本研究的4个藏族人群,其他人群来源于YHRD数据库;Cluster 1表示西藏藏族(CTT)、四川甘孜藏族(CTG)和青海藏族(CTQ)因遗传距离近而聚为一簇。
本研究结合个体水平的常染色体、父系Y染色体和母系线粒体多类别基因组信息,对中国西南地区4个藏族人群的遗传亚结构进行了研究,常染色体位点和Y染色体SNPs遗传结构分析结果表明4个藏族人群可分为3类:海拔最高的西藏藏族(CTT)为一类;海拔次之四川甘孜藏族(CTG)和青海藏族(CTQ)为一类;海拔最低的四川阿坝藏族(CTA)为一类。线粒体SNPs遗传标记角度的分析结果表明不同海拔的藏族人群的遗传结构无显著差异。
常染色体遗传标记可从个体水平了解群体遗传结构。藏族人群在长期与环境相适应的进化过程中形成HAA机制,其HAA的生物学基础中,HIF通路作为机体调控氧平衡的主要信号通路,是藏族人群HAA的关键,其分布的HAA相关基因(如、、、、、和等)中多个位点在高原藏族和平原人群的频率具有差异性[7,9,29]。使用一组较少的在人群中等位基因频率差异显著的位点可实现人群遗传结构的初步解析。因此,本研究基于文献调研后最终筛选出在藏族人群与平原人群间具有显著差异的25个藏族特异性位点,分别位于2号染色体HIF通路的和等HAA相关基因。各位点等位基因在不同藏族分支人群间的频率分布也存在地域特异性,与前人的相关研究符合[5,8,30]。同时,各位点的等位基因频率分布差异与海拔呈正相关,同柯金坤[31]的研究结果类似,进一步证明了高海拔环境对HAA相关基因存在适应性选择。当然,藏族人群的HAA机制研究不局限于热点研究的基因,如下游的基因中rs116983452的突变型等位基因在藏族人群和其他人群中表现出显著的频率差异[32];基因中rs59098711的等位基因C高频分布于藏族人群[33],此外该基因上163 bp片段缺失和基因中662 bp片段插入也在藏族人群中富集[34]。为增加信息覆盖度,未来可进一步筛选藏族特异性位点对藏族不同分支人群进行研究,探索其遗传亚结构。
表3 藏族人群mt-SNPs单倍群谱系树及频率分布
Y染色体遗传标记是研究群体父系遗传信息的重要手段。根据Y-SNPs的发生时间可将男性人群分为不同单倍群,同一父系祖先的男性后代享有相同单倍群。东亚人群以O-M175、C-M130、D-M174和N-M231为主要单倍群,其中O-M175为优势单倍群,约75%的中国人群归于该单倍群;D-M174在国内主要分布于藏族人群[35]。本研究的4个藏族人群主要为D-M174和O-M175两种核心单倍群(79.80%),结果与文献[36]报道一致。藏族人群特异性单倍群D-M174及其下游分支在不同藏族分支人群中的分布频率具有差异性。其中D1a2-P99在西藏藏族(CTT)、四川甘孜藏族(CTG)和青海藏族(CTQ)的频率明显高于D1a1-M15,印证了前人研究结果[35~37]。而四川阿坝藏族(CTA)以下游分支D1a1-M15为主,区别于其他藏族人群。此外,青海藏族(CTQ)中J-M304和R-M207的分布频率显著高于其他藏族人群,该两类单倍群在国内主要分布于回族人群(分别为9.69%和11.85%)[25],提示两人群间存在历史上的基因交流或部分共同父系祖源。Y-STRs突变率较高,可反映人群近期父系基因交流。4个藏族人群的HD均高于0.99,表明藏族人群的Y-STRs遗传多态性较高,其多态性分布的地区差异性较小。在网络图和MDS中,西藏藏族(CTT)、四川甘孜藏族(CTG)和青海藏族(CTQ)紧密聚集,也提示3者的父系遗传差异较小。值得注意的是,四川阿坝藏族(CTA)在MDS中与其他藏族人群相距较远,这与其常染色体遗传结构差异一致,不过也不排除其样本量较少导致的偏差。
线粒体SNPs是解析群体母系遗传结构的理想标记,其单倍群的支系分布具有族群地域差异[38~40]。本研究的不同藏族分支人群中以主干单倍群M9a'b、G、D、F的分布频率较高,均为东亚起源支系且在藏、汉群体中均广泛分布[41~44]。其中高频分布于中国西南地区的单倍群D是4个藏族人群最普遍的单倍群类型(17.05%~30.38%),其次为F。而单倍群M9a'b广泛分布于东亚大陆[45],国内人群中其频率及多样性在西藏藏族人群中达到最高[36,42]。本研究中除四川阿坝藏族(CTA)外,M9a'b在其他藏族人群中均大于10%。单倍群G在4个藏族人群的分布频率约为10%,类似于前人研究的那曲、拉萨、甘孜等地藏族人群的频率分布[36]。然而藏族人群特异单倍群M62仅在青海藏族(CTQ)检出1例,低于文献报道的其在藏族人群中的分布频率(14/680=2.1%)[42],可能为样本采集范围局限和样本量较少所致。
不同藏族分支人群的常染色体位点和Y染色体SNPs遗传信息具有显著差异性,且与海拔具有相关性。从地理位置分析,西南地区汇聚濮系、氐系、羌系及夷系民族群体[46]。西藏藏族(CTT)居住于以藏族为主体民族(90.5%)的高海拔青藏高原地区,逶迤的山脉(如喜马拉雅山脉)和陡峭的峡谷(如雅鲁藏布大峡谷)等复杂多样的地貌形成地理隔离[47],可能阻碍了西藏藏族(CTT)与其他人群的基因交流,导致其遗传结构更具有高原代表性。四川甘孜藏族(CTG)和青海藏族(CTQ)居于青藏高原周边地区,所在的四川甘孜处于青藏高原东南源,包含藏族(78.3%)和汉族(18.2%)等民族以大范围聚居小范围杂居形式分布[48];青海位于青藏高原东北部,容纳汉族(53.0%)、藏族(24.4%)、回族(14.8%)等民族聚居(http://www. stats.gov.cn)。多民族混居的生活环境使得四川甘孜藏族(CTG)和青海藏族(CTQ)的遗传结构与西藏藏族(CTT)的差异显著,提示其与周围民族之间存在基因交流。四川阿坝藏族(CTA)虽同样居于高原周边地区,但其所隶属的嘉绒藏族是夷系民族在唐代吐蕃东进后融合羌人和吐蕃人基因而形成的[2,49],其所在的“藏彝走廊”位于横断山脉–河谷交错地区,是西北、西南各民族流动迁徙的重要场所。特殊的历史民族交流和地理位置,使四川阿坝藏族(CTA)呈现明显混融特征而区别于其他藏族人群。然而,线粒体SNPs遗传信息在藏族分支人群间无明显差异性,从社会学角度分析可能与藏族人群的婚配制度有关。藏族作为中国典型的少数民族之一,是氐羌族群、游牧民族和西藏土著居民融合的民族[50],可与其他民族通婚。在公元6世纪,西藏松赞干布与唐朝文成公主的联姻打开了西部与中原地带的经济文化等方面的交流新格局[51]。此后中原地区王朝对藏区设置行政管理机构使民族融合趋势加强,推进了藏汉通婚的进程[50]。民族间基因交流尤其是母系基因的渗入使藏族人群的母系遗传多态性增加。
综上所述,本研究基于多类别基因组信息探讨了4个不同藏族分支人群的遗传亚结构,结果表明4个藏族人群间具有遗传差异性,获得的数据可为群体遗传学和法医学实践研究提供数据支持。但涉及的样本量少,且对甘肃、云南等地的藏族人群遗传亚结构尚未探索,未来可增加样本量及更多藏族分支人群开展研究,以进一步探索藏族不同分支的遗传相似性和差异性。
附表详见文章电子版www.chinagene.cn。
[1] Shi S. Tibetan regional characteristics and the related problems-and the Kham characteristic., 2015, 41(1): 207–208.石硕. 藏族的地域特点及相关问题——兼论康区之特点. 青海民族大学学报(社会科学版), 2015, 41(1): 207–208.
[2] Dejizhuoga, The origin of Jirarong Tibetan., 2004, (2): 51–56.德吉卓嘎. 试论嘉绒藏族的族源. 西藏研究, 2004, (2): 51–56.
[3] Majmundar AJ, Wong WJ, Simon MC. Hypoxia-inducible factors and the response to hypoxic stress., 2010, 40(2): 294–309.
[4] Beall CM. Tibetan and Andean Patterns of adaptation to high-altitude hypoxia., 2000, 72(1): 201–228.
[5] Yi X, Liang Y, Huerta-Sanchez E, Jin X, Cuo ZXP, Pool JE, Xu X, Jiang H, Vinckenbosch N, Korneliussen TS, Zheng HC, Liu T, He WM, Li K, Luo RB, Nie XF, Wu HL, Zhao MR, Cao HZ, Zou J, Shan Y, Li SZ, Yang Q, Asan, Ni PX, Tian G, Xu JM, Liu X, Jiang T, Wu RH, Zhou GY, Tang MF, Qin JJ, Wang T, Feng SJ, Li GH, Huasang, Luosang J, Wang W, Chen F, Wang YD, Zheng XG, Li Z, Bianba Z, Yang G, Wang XP, Tang SH, Gao GY, Chen Y, Luo Z, Gusang L, Cao Z, Zhang QH, Ouyang WH, Ren XL, Liang HQ, Zheng HS, Huang YB, Li JX, Bolund L, Kristiansen K, Li YR, Zhang Y, Zhang XQ, Li RQ, Li SG, Yang HM, Nielsen R, Wang J, Wang J. Sequencing of 50 human exomes reveals adaptation to high altitude., 2010, 329(5987): 75–78.
[6] Simonson TS, Yang Y, Huff CD, Yun H, Qin G, Witherspoon DJ, Bai Z, Lorenzo FR, Xing J, Jorde LB, Prchal JT, Ge R. Genetic evidence for high-altitude adaptation in Tibet., 2010, 329(5987): 72–75.
[7] Huerta-Sánchez E, Jin X, Asan, Bianba Z, Peter BM, Vinckenbosch N, Liang Y, Yi X, He M, Somel M, Ni P, Wang B, Ou X, Huasang, Luosang J, Cuo ZX, Li K, Gao G, Yin Y, Wang W, Zhang X, Xu X, Yang H, Li Y, Wang J, Wang J, Nielsen R. Altitude adaptation in Tibetans caused by introgression of Denisovan-like DNA., 2014, 512(7513): 194–197.
[8] Jiang L, Peng JX, Huang MS, Liu J, Wang L, Ma Q, Zhao H, Yang X, Ji AQ, Li CX. Differentiation analysis for estimating individual ancestry from the Tibetan Plateau by an archaic altitude adaptation EPAS1 haplotype among East Asian populations., 2018, 132(50): 1527–1535.
[9] Xiang K, Ouzhuluobu, Peng Y, Yang Z, Zhang X, Cui C, Zhang H, Li M, Zhang Y, Bianba, Gonggalanzi, Basang, Ciwangsangbu, Wu T, Chen H, Shi H, Qi X, Su B. Identification of a Tibetan-specific mutation in the hypoxic gene EGLN1 and its contribution to high-altitude adaptation., 2013, 30(8): 1889–1898.
[10] Wen B. Y chromosome, mtDNA polymorphism and genetic structure of East Asian population [Dissertation]. Shanghai:, 2004.文波. Y染色体、mtDNA多态性与东亚人群的遗传结构[学位论文]. 复旦大学, 2004.
[11] Hammer MF, Karafet TM, Park H, Omoto K, Harihara S, Stoneking M, Horai S. Dual origins of the Japanese: common ground for hunter-gatherer and farmer Y chromosomes., 2006, 51(1): 47–58.
[12] Thangaraj K, Singh L, Reddy AG, Rao VR, Sehgal SC, Underhill PA, Pierson M, Frame IG, Hagelberg E. Genetic affinities of the Andaman Islanders, a vanishing human population., 2003, 13(2): 86–93.
[13] Karafet T, Xu L, Du R, Wang W, Feng S, Wells RS, Redd AJ, Zegura SL, Hammer MF. Paternal population history of East Asia: sources, patterns, and microevolutionary processes., 2001, 69(3): 615–628.
[14] Bhandari S, Zhang XM, Cui CY, Bianba, Liao SY, Peng Y, Zhang H, Xiang K, Shi H, Ouzhuluobu, Baimakongzhu, Gonggalanzi, Liu SM, Gengdeng, Wu TY, Qi XB, Su B. Genetic evidence of a recent Tibetan ancestry to Sherpas in the Himalayan region., 2015, 5: 16249.
[15] Huang MS, Ma Q, Wang L, Ma X, Li CX, Jiang L. The study of Tibetan ancestry informative SNPs on high-altitude adaptive genes., 2017, 32(6): 588–599.黄美莎, 马泉, 王玲, 马新, 李彩霞, 江丽. 高原适应基因中藏族祖先信息位点的研究. 中国法医学杂志, 2017, 32(6): 588–599.
[16] Liu J, Li S, Jiang L, Zhao L, Zhao WT, Feng L, Liu HB, Ji AQ, Li CX. DNA ancestry analyzer: an automatic program for ancestry inference of unknown individuals., 2018, 22(1): 3–7.刘京, 李盛, 江丽, 赵蕾, 赵雯婷, 丰蕾, 刘海渤, 季安全, 李彩霞. 对于未知来源个体进行族群推断的自动分析系统. 生命科学研究, 2018, 22(1): 3–7.
[17] Karafet TM, Mendez FL, Meilerman MB, Underhill PA, Zegura SL, Hammer MF. New binary polymorphisms reshape and increase resolution of the human Y chromosomal haplogroup tree., 2008, 18(5): 830–838.
[18] Bandelt HJ, Forster P, Röhl A. Median-joining networks for inferring intraspecific phylogenies., 1999, 16(1): 37–48.
[19] Wang H, Mao J, Xia Y, Bai XG, Zhu WQ, Peng D, Liang WB. Genetic polymorphisms of 17 Y-chromosomal STRs in the Chengdu Han population of China., 2017, 131(4): 967–968.
[20] Hidding M, Schmitt C. Haplotype frequencies and population data of nine Y-chromosomal STR polymorphisms in a German and a Chinese population., 2000, 113(1–3): 47–53.
[21] Shi MS, Li YB, Tang JP, Zhang HJ, Hou YP. Southwest China Han Population data for nine Y-STR loci by multiplex polymerase chain reaction., 2007, 52(1): 228–230.
[22] Fan GY, An YR, Peng CX, Deng JL, Pan LP, Ye Y. Forensic and phylogenetic analyses among three Yi populations in Southwest China with 27 Y chromosomal STR loci., 2018, 133(3): 795–797.
[23] He GL, Wang Z, Su YD, Zou X, Wang MG, Chen X, Gao B, Liu J, Wang SY, Hou YP. Genetic structure and forensic characteristics of Tibeto-Burman-speaking Ü-Tsang and Kham Tibetan Highlanders revealed by 27 Y-chromosomal STRs., 2019, 9(1): 7739.
[24] Zhao Q, Bian Y, Zhang S, Zhu R, Zhou W, Gao Y, Li C. Population genetics study using 26 Y-chromosomal STR loci in the Hui ethnic group in China., 2017, 28: e26–e27.
[25] Xie MK, Song F, Li JN, Lang M, Luo HB, Wang Z, Wu J, Li CZ, Tian CC, Wang WZ, Ma H, Song Z, Fan YJ, Hou YP. Genetic substructure and forensic characteristics of Chinese Hui populations using 157 Y-SNPs and 27 Y-STRs., 2019, 41: 11–18.
[26] Nothnagel M, Fan GY, Guo F, He YF, Hou YP, Hu SP, Huang J, Jiang XH, Kim W, Kim K, Li CT, Li H, Li LM, Li SL, Li Z, Liang WB, Liu C, Lu D, Luo HB, Nie SJ, Shi MS, Sun HY, Tang JP, Wang L, Wang CC, Wang D, Wen SQ, Wu HY, Wu WW, Xing JX, Yan JW, Yan S, Yao HB, Ye Y, Yun LB, Zeng ZS, Zha L, Zhang SH, Zheng XF, Willuweit S, Roewer L. Revisiting the male genetic landscape of China: a multi-center study of almost 38,000 Y-STR haplotypes., 2017, 136(5): 485–497.
[27] Lang M, Liu H, Song F, Qiao XH, Ye Y, Ren H, Li JN, Huang J, Xie MK, Chen SJ, Song MY, Zhang YF, Qian XQ, Yuan TX, Wang Z, Liu YM, Wang MG, Liu YC, Liu J, Hou YP. Forensic characteristics and genetic analysis of both 27 Y-STRs and 143 Y-SNPs in Eastern Han Chinese population., 2019, 42: e13–e20.
[28] Kwak KD, Jin HJ, Shin DJ, Kim JM, Roewer L, Krawczak M, Tyler-Smith C, Kim W. Y-chromosomal STR haplotypes and their applications to forensic and population studies in east Asia., 2005, 119(4): 195–201.
[29] Bigham AW, Lee FS. Human high-altitude adaptation: forward genetics meets the HIF pathway., 2014, 28(20): 2189–2204.
[30] Peng Y, Yang ZH, Zhang H, Cui CY, Qi XB, Luo XJ, Tao X, Wu TY, Ouzhuluobu, Basang, Ciwangsangbu, Danzengduojie, Chen H, Shi H, Su B. Genetic variations in Tibetan populations and high-altitude adaptation at the Himalayas., 2011, 28(2): 1075–1081.
[31] Ke JK. A study of polymorphism sites of HIF-1α and HIF-2α gene in three Tibetan groups of different altitude [Dissertation]., 2010.柯金坤. 不同海拔三个藏族人群HIF-1α基因与HIF-2α基因多态位点的比较研究[学位论文]. 北京协和医学院, 2010.
[32] Deng L, Zhang C, Yuan K, Gao Y, Pan YW, Ge XL, He YX, Yuan Y, Lu Y, Zhang XX, Chen H, Lou HY, Wang XJ, Lu DS, Liu JJ, Tian L, Feng QD, Khan A, Yang YJ, Jin ZB, Yang J, Lu F, Qu J, Kang LL, Su B, Xu SH. Prioritizing natural-selection signals from the deep-sequencing genomic data suggests multi-variant adaptation in Tibetan highlanders., 2019, 6(6): 1201–1222.
[33] Ouzhuluobu, He YX, Lou HY, Cui CY, Deng L, Gao Y, Zheng WS, Guo YB, Wang XJ, Ning ZL, Li J, Li B, Bai CJ, Baimakangzhuo, Gonggalanzi, Dejiquzong, Bianba, Duojizhuoma, Liu SM, Wu TY, Xu SH, Qi XB, Su B. De novo assembly of a Tibetan genome and identification of novel structural variants associated with high-altitude adaptation., 2019, 7(2): 391–402.
[34] Zhang Q, Ping J, Zhang HX, Kang B, Li YF, Zhou GQ. Genetic association of MKL1 gene polymorphisms with the high-altitude adaptation., 2019, 41(7): 634–643.张晴, 平杰, 张昊翔, 康波, 李元丰, 周钢桥. MKL1基因多态性与高原环境适应性的遗传关联研究. 遗传, 2019, 41(7): 634–643.
[35] Wang CC, Li H. Inferring human history in East Asia from Y chromosomes., 2013, 4(1): 11.
[36] Qi XB, Cui CY, Peng Y, Zhang XM, Yang ZH, Zhong H, Zhang H, Xiang K, Cao XY, Wang Y, Ouzhuluobu, Basang, Ciwangsangbu, Bianba, Gonggalanzi, Wu TY, Chen H, Shi H, Su B. Genetic evidence of paleolithic colonization and neolithic expansion of modern humans on the Tibetan Plateau., 2013, 30(8): 1761–1778.
[37] Wen B, Xie X, Gao S, Li H, Shi H, Song X, Qian T, Xiao C, Jin J, Su B, Lu D, Chakraborty R, Jin L. Analyses of genetic structure of Tibeto-Burman populations reveals sex-biased admixture in southern Tibeto-Burmans., 2004, 74(5): 856–865.
[38] Cavalli-Sforza LL, Feldman MW. The application of molecular genetic approaches to the study of human evolution., 2003, 33(Suppl.): 266–275.
[39] Chu X, Shan KR, Wen B, Qi XL, Li Y, Wu CX, Liu X, Zhao Y, Ren XL, Jin L. Analysis of polymorphisms in Y-DNA haplotypes and mtDNA haplogroups in Yao ethnic group from Guizhou., 2006, 28(2): 153–158.褚迅, 单可人, 文波, 齐晓岚, 李毅, 吴昌学, 刘烜, 赵艳, 任锡麟, 金力. 贵州瑶族3支系Y-DNA及线粒体DNA序列多态性分析. 遗传, 2006, 28(2): 153–158.
[40] Wang XQ Wang CC Deng QY Li H. Genetic analysis of Y chromosome and mitochondrial DNA poly-morphism of Mulam ethnic group in Guangxi, China., 2013, 35(2): 168–174.王晓庆, 王传超, 邓琼英, 李辉. 广西仫佬族Y染色体和mtDNA的遗传结构分析. 遗传, 2013, 35(2): 168–174.
[41] Gu ML, Wang YJ, Shi L, Jiang F, Qiu MJ, Lin KQ, Tao YF, Shi L, Huang XQ, Liu B, Chu JY. Comparative analysis of the complete mitochondrial genome between Tibetan and Han population., 2008, 25(4): 382–386.顾明亮, 汪业军, 史磊, 姜枫, 邱梦洁, 林克勤, 陶玉芬, 史荔, 黄小琴, 刘斌, 褚嘉佑. 藏汉民族线粒体基因组全序列的比较研究. 中华医学遗传学杂志, 2008, 25(4): 382–386.
[42] Zhao M, Kong QP, Wang HW, Peng MS, Xie XD, Wang WZ, Jiayang, Duan JG, Cai MC, Zhao SN, Cidanpingcuo, Tu YQ, Wu SF, Yao YG, Bandelt HJ, Zhang YP. Mitochondrial genome evidence reveals successful Late Paleolithic settlement on the Tibetan Plateau., 2009, 106(50): 21230–21235.
[43] Qin ZD, Yang YJ, Kang LL, Yan S, Cho K, Cai XY, Lu Y, Zheng HX, Zhu DC, Fei DM, Li SL, Jin L, Li H. A mitochondrial revelation of early human migrations to the Tibetan Plateau before and after the last glacial maximum., 2010, 143(4): 555–569.
[44] Peng MS, Palanichamy MG, Yao YG, Mitra B, Cheng YT, Zhao M, Liu J, Wang HW, Pan H, Wang WZ, Zhang AM, Zhang W, Wang D, Zou Y, Yang Y, Chaudhuri TK, Kong QP, Zhang YP. Inland post-glacial dispersal in East Asia revealed by mitochondrial haplogroup M9a'b., 2011, 9: 2.
[45] Soares P, Trejaut JA, Loo JH, Hill C, Mormina M, Lee CL, Chen YM, Hudjashov G, Forster P, Macaulay V, Bulbeck D, Oppenheimer S, Lin M, Richards MB. Climate change and postglacial human dispersals in southeast Asia., 2008, 25(6): 1209–1218.
[46] Meng M. Exploration of the relationship of Yi and Qiang in the Southwest ethnic groups of Han dynasty., 1985, 1: 11–32.蒙默. 试论汉代西南民族中的“夷”与“羌”. 历史研究, 1985, 1: 11–32.
[47] Zheng D, Zhang QS, Wu SH. Mountain Geoecology and Sustainable Development of the Tibetan Plateau., 2000, 57(2): 203–204.
[48] Wang CM. The changes of population size and structure in Garze prefecture based on the census data.,2013, 22(3): 58–67.王长明. 基于人口普查数据的甘孜州人口规模与结构变化. 四川民族学院学报, 2013, 22(3): 58–67.
[49] Li Q. The relationship between Jiarong, Jialiangyi, Ranmang and Ge populations – and explore the origin of Jiarong Tibetan., 2010, 19(4): 1–6.李青. 试论嘉绒、嘉良夷、冉駹与戈人的关系——兼论嘉绒藏族的族源. 四川民族学院学报, 2010, 19(4): 1–6.
[50] Xie L. On the cultural reform of the Han-Tibetan intermarriage and its evolution., 2006, 21(1): 147–149.谢蕾. 藏汉通婚的文化整合及演变. 内江师范学院学报, 2006, 21(1): 147–149.
[51] Yan MS. History of Marriage in Ancient China. Guizhou: Guizhou Ethnic Publishing House, 2003.阎明恕. 中国古代和亲史. 贵州:贵州民族出版社, 2003.
A genetic sub-structure study of the Tibetan population in Southwest China
Xiaojuan Wang1,2, Enfang Qian1, Yue Li2, Zhengyang Song1,2, Hui Zhao2, Hexin Xie2, Caixia Li1,2, Jiang Huang1, Li Jiang2
Tibetan is a typical ethnic minority population in Southwest China, which can be divided into U-Tsang, Kham, Amdo, Jiarong and other sub-populations. However, the genetic structure of these sub-populations has not been comprehensively analyzed, especially from the perspective of paternal and maternal lineages. Based on genetic markers of autosomes, the Y chromosome and mitochondria, we studied four Tibetan populations (the U-Tsang population in Tibet Autonomous Region; the Kham population in Garze, Sichuan province; the Amdo population in Qinghai province and the Jiarong population in Aba, Sichuan province) to interpret their genetic structure. The mini-sequencing technology was used to detect the genotype of each maker. Meanwhile, the PowerPlex®Y23 and DNA TyperTMY26 kit were applied to genotype Y-STRs. Subsequently, the genetic structure was analyzed by heatmap and principal component analysis, ancestry component, haplogroup frequency, network map and multi-dimensional scaling analysis. The results showed that the four Tibetan populations could be divided into three sets based on the autosomal and Y-chromosomal genetic markers, in which set 1 was the U-Tsang population in the Tibetan Plateau, set 2 comprised of the Kham and Amdo populations in the surrounding areas of the plateau, and set 3 was the Jiarong population that resided in the Tibetan and Yi Corridor. No significant difference was observed in mitochondrial genetic markers among four Tibetan populations. In general, multi-category genetic information provides a new comprehensive insight into the Tibetan sub-population.
population genetics; Tibetan; haplotype; genetic sub-structure
附表2 网络图分析中各Y-STR基因座的权重值信息
Supplementary Table 2 The weighting information of each Y-STR loci in Network analysis
注:突变率来源YHRD数据库(https://yhrd.org/pages/resources/mutation_rates)。
2019-12-26;
2020-04-14
国家自然科学基金项目(编号:81772027),国家重点研发计划项目(编号:2017YFC0803501),公安部物证鉴定中心基本科研业务费专项资金项目(编号:2017JB025)和国家科技资源共享服务平台计划项目(编号:YCZYPT[2017]01-3)资助[Supported by the National Natural Science Foundation of China (No. 81772027), the National Key R&D Program of China (No. 2017YFC0803501), the Fundamental Research Funds for Institute of Forensic Science (No. 2017JB025), and the National Science and Technological Resources Platform (No. YCZYPT[2017]01-3]
王小娟,硕士研究生,专业方向:法医物证学。E-mail: 757164796@qq.com
黄江,博士,教授,研究方向:法医物证学。E-mail: mmm_hj@gmc.edu.cn江丽,博士,副主任法医师,研究方向:法医遗传学。E-mail: jl@mail.bnu.edu.cn
10.16288/j.yczz.19-330
2020/4/16 14:03:17
URI: http://kns.cnki.net/kcms/detail/11.1913.R.20200415.1535.002.html
(责任编委: 谢小冬)