靳涛, 田杨, 全言钊, 李明亮, 严安心, 李璐瑶
1.陕西省铜川市公安局刑侦支队, 陕西 铜川 727000;2.公安部物证鉴定中心, 北京 100038;3.西安交通大学第一附属医院, 西安 710061
男性特异的Y染色体遗传标记已经被广泛应用于个体亲缘关系鉴定、家系排查及群体分析等领域[1-5]。研究发现,由Y染色体上的短串联重复序列(Y chromosome short tandem repeats, Y-STRs)组成的Y染色体单倍型可被应用于追踪调查未知的微量DNA男性供体,在性侵案件和家系搜索中具有特殊价值[2, 6-8]。目前,作为法医鉴定和遗传分析中最常用的遗传标记之一,Y-STR已被国内外学者广泛认可并发现具有显著的群体特异性[9-11]。基于法医实际检案的需求,一个可供全球学者公开访问的Y-STR单倍型参考数据库(Y-STR Haplotype Reference Database, YHRD, https://yhrd.org, 第59版)已经建立。YHRD数据库包含了来自世界各地不同地区和国家的多个Y-STRs群体单倍型数据。为了获得更多更可靠的Y-STR单倍型数据,研究者们不断对世界各地区不同群体的遗传多态性进行调查分析,以期对现有的Y-STR数据进行补充和完善[12]。
迄今为止,一系列Y-STR基因座相关的商用试剂盒已被开发出来用于法医领域的探索应用[10-12]。YfilerTMPlatinum 复合扩增试剂盒(美国Thermo Fisher Scientific公司)是新开发的一个商用Y-STR基因座多重检测系统,可同时对多达41个Y染色体标记进行复合扩增,包括38个Y-STRs基因座和3个Y-InDels(insertion/deletion, 插入缺失)基因座,扩增片段长度在60~565 bp[13]。由于该试剂盒包含的38个Y-STRs几乎涵盖了目前常用的商用Y-STR试剂盒中纳入的所有基因座,因此,YfilerTMPlatinum复合扩增试剂盒不仅可以与这些先前开发的试剂盒进行兼容,而且新位点的加入更值得我们验证其在不同群体中的遗传多态性和应用价值。上述研究还发现检测更多Y-STR基因座可以显著提高无血缘关系男性的辨别能力[12]。目前大量中国和世界其他国家不同地区和群体的Y-STR单倍型数据已被报道,旨在为法医学和群体遗传学分析提供参考[14-15]。然而,作为位于中国西北部陕西省中部的一个重要的交通枢纽,陕西铜川地区最主要的群体——汉族群体的Y-STRs单倍型研究仍不充分。
因此,本文旨在采用YfilerTMPlatinum试剂盒检测铜川地区汉族群体669名无关男性个体的进行分析,获得38个Y-STRs(DYS576、DYS389I、DYS635、DYS389II、DYS627、DYS549、DYS645、DYS460、DYS458、DYS19、YGATAH4、DYS448、DYS391、DYS557、DYS593、DYS522、DYS456、DYS390、DYS438、DYS392、DYS518、DYS444、DYS596、DYS570、DYS437、DYS449、DYS643、DYS393、DYS439、DYS481、DYS533、DYS447、DYS385、DYF387S1、DYS527)和3个Y-InDels(rs771783753、rs759551978、rs199815934)的遗传多态性和法医学参数,为铜川地区的法医学案件分析、个人识别和亲子鉴定提供基础数据;同时拟探索铜川地区和其他群体之间的遗传关系,为揭示中国不同地区的群体间的遗传关系提供科学依据。
669份陕西省铜川地区无血缘关系的男性汉族血样均随机选自铜川市公安局DNA数据库。
手工打孔血卡(直径1 mm),用直接扩增的方式采用YfilerTMPlatinum试剂盒扩增。该试剂盒覆盖38个Y-STR(DYS576、DYS389I、DYS635、DYS389II、DYS627、DYS549、DYS645、DYS460、DYS458、DYS19、YGATAH4、DYS448、DYS391、DYS557、DYS593、DYS522、DYS456、DYS390、DYS438、DYS392、DYS518、DYS444、DYS596、DYS570、DYS437、DYS449、DYS643、DYS393、DYS439、DYS481、DYS533、DYS447、DYS385、DYF387S1、DYS527)和3 Y-InDel(rs771783753、rs759551978、rs199815934)基因座。按照YfilerTMPlatinum试剂盒说明书标准程序的扩增体系和扩增条件进行扩增。扩增产物用ABI 3500XL遗传分析仪进行电泳,然后使用分析仪自带的GeneMapper ID-X v 1.5软件对结果进行分析。
采用直接计数法统计等位基因频率及单倍型频率。根据Nei’s公式分别计算相应的基因多样性(gene diversity, GD)、单倍型多样性(haplotype diversity, HD)和单倍型识别率(discrimination power, DC)。公式为GD/HD=[N/(N-1)]×(1-∑Pi2),DC=k/N,其中Pi为第i个等位基因频率或单倍型频率,k代表样本中单倍型的种类数目,N代表样本总量[16]。选取YHRD数据库中的20个参考群体(内蒙达斡尔族、内蒙蒙古族、湖北土家族、甘肃东乡族、甘肃回族、青海回族、青海撒拉族、新疆哈萨克族、新疆维吾尔族、福建汉族、海南汉族、云南汉族、四川彝族、黑龙江汉族、日本群体、韩国群体、老挝群体、菲律宾群体、新加坡群体、泰国群体),基于YHRD数据库中27个重复的Y-STR基因座,运用分子方差分析(AMOVA, Molecular variance, https://yhrd.org/amova)计算群体间遗传距离(pairwise genetic distance, Rst)。然后再根据Rst值进行多维尺度分析图和系统发育树的构建。利用YHRD在线构建多维尺度分析,然后采用MEGA v7软件[17],通过邻接法(neighbor-joining, NJ)[18]构建铜川汉族和20个参考群体的系统发育树。
为了获得669名铜川汉族男性个体的单倍型数据和法医学参数,本研究对获得的原始数据进行了统计分析和HD、GD值的计算。GD代表生物种群之内和种群之间的遗传结构的变异,而HD是衡量一个群体变异程度的重要指标,是指样本中随机抽取到2个不同单倍型的频率,HD值高的群体说明其遗传多样性高[16]。本研究中共观察到657种单倍型,其中,唯一单倍型647个,重复2次的单倍型8个,重复3次的单倍型2个,单倍型频率范围为0.001 5~0.004 5,HD值为0.999 937 345。38个Y-STR和3个Y-InDel基因座的等位基因分布频率及GD值见表1。38个Y-STR基因座共检出428个等位基因,其中,包含等位基因最多的基因座是DYS385(67个),最少的基因座则是DYS437(4个),等位基因频率为0.001 5~0.943 2。GD值范围为0.108 9(DYS645)~0.969 9(DYS385),DC值为0.982 1。
研究还发现,在7个单拷贝基因座(DYS390、DYS439、DYS449、DYS518、DYS557、DYS576、DYS643)上发现了频率较低的双等位基因。与常见的STR等位基因相比,含有某种序列变异的等位基因称为微变异,本研究共检测到45个微变异等位基因。所有微变异等位基因分布在6个基因座(DYS448、DYS458、DYS481、DYS518、DYS627、DYS645)上,共计14种微变异等位基因。其中在DYS518基因座出现的频率较高(0.026 9)且种类也较多(5种)。此外,DYS448基因座上发现5个空等位基因。上述可能会出现双等位基因、微变异或空等位基因的基因座在数据分析过程中应格外注意。
表1 铜川汉族群体38个Y-STR和3个Y-InDel基因座的等位基因分布频率及GD值(n=669)Table 1 Allele frequencies and gene diversities of 38 Y-STR loci and 3 Y-InDels in Tongchuan Han population (n=669)
注:A代表该位点的基因型(allele,缩写为A),F代表该基因型的频率(frequency,缩写为F)。
为进一步探索铜川汉族群体和国内外其他群体间的遗传关系,本研究利用YHRD在线软件计算了铜川汉族群体和20个群体的遗传距离(genetic distance, Rst)。该比较是在与Yfiler plus试剂盒重叠的27个Y-STR基因座的基础上完成的。Rst值的范围是在0~1之间,越接近0代表2个群体间的遗传距离越小,越接近1代表2个群体间的遗传距离越大。
如图1,为了更形象地揭示群体间遗传关系,基于Rst值构建了多维尺度分析图。MDS图中,不同的点代表不同的群体,2个点位置越靠近代表2个群体之间的遗传距离越小,反之代表遗传距离大。图中显示铜川汉族与其他北方汉族、南方汉族及四川彝族紧密聚集在第四象限,中国北方各个少数民族则聚集第二象限和第三象限,东南亚群体主要分布在第一象限,而东亚的日本和韩国群体分布在第四象限右侧边缘。可见与铜川汉族遗传距离最小的是福建汉族,其次是云南汉族、黑龙江汉族、四川彝族、海南汉族,而与达斡尔族最远。而基于Rst值构建的系统发育树则根据分支情况表明遗传关系,分支越靠近代表遗传距离越近。如图2所示,系统分化树可分为3大分支:大部分北方群体占一支(除了陕西汉族和黑龙江汉族),亚洲除中国外的其他群体占一支(包括菲律宾、新加坡、老挝、泰国群体),另外,黑龙江汉族、福建汉族2个群体与陕西汉族聚合,接着与四川彝族聚合,再与日本、韩国群体聚合,最后与云南汉族、海南汉族聚合为一支。铜川群体的分支和福建汉族分支等十分靠近,系统发育树同多维尺度分析结果一样揭示了铜川汉族与其他汉族群体密切的遗传关系。
本研究采用YfilerTMPlatinum复合扩增试剂盒对陕西铜川汉族669名无关男性个体进行遗传多态性调查,并探索铜川地区汉族与其他群体之间遗传关系。本研究共观察到647个唯一单倍型,单倍型频率为0.001 5~0.004 5,HD值与DC值分别为0.999 9和0.982 1。38个Y-STR基因座中有33个基因座(除了DYS533、DYS391、DYS438、DYS437、DYS645)的GD值均大于0.6,表明38个Y-STR基因座在铜川汉族群体中具有较高遗传多态性及系统鉴别效能,适合铜川汉族群体的法医学应用,同时可以作为传统Y染色体商品试剂盒的有效补充。此外,YfilerTMPlatinum试剂盒含有6个Y染色体快速突变基因座(rapidly-mutating Y-STRs)[10],即DYF387S1、DYS449、DYS518、DYS570、DYS576、DYS627,由于这些位点具有较高的突变率,在群体中较传统的Y-STR基因座具有更高的识别能力。
注:红色标记代表中国北方群体,蓝色代表中国南方群体,黑色代表亚洲群体。图1 21个群体基于27个Y-STR基因座的MDS图Fig.1 MDS map of 27 Y-STR loci for 21 populations
注:红色标记代表中国北方群体,蓝色代表中国南方群体,黑色代表亚洲群体。铜川汉族与各国内外群体间的Rst值分别在图右侧标示出来。图2 21个群体基于27个Y-STR基因座的系统发育树Fig.2 N-J phylogenetic trees of 27 Y-STR loci for 21 populations
不同的Y-STR位点组合在不同个体、家系、民族、人种及地域间存在着遗传差异[19],这是群体遗传学研究的理论基础。在中国和世界范围的群体比较中,本研究通过MDS展示了较明显的地理和种族聚集特征。陕西汉族群体与其他地区的汉族群体(无论是南方还是北方汉族群体)之间遗传关系十分接近,而中国的南方、北方汉族群体之间遗传差异明显。其次与彝族群体遗传关系较近,而与地理关系很远的其他亚洲群体遗传关系最远。由此推测,与地理位置因素相比,民族、人种因素对群体遗传关系的影响较大,且北方汉族和南方汉族可能拥有共同的祖先,可能因早期通婚等各种因素发生了基因交流从而遗传距离较近[15]。本研究还发现铜川汉族群体与中国西北回族之间的遗传距离较小。回族是中国西北地区除汉族外的另一主要群体,自唐代古丝绸之路以来,由于商业物流和通婚,与汉族人口混居,因此汉族与回族之间的遗传关系密切,Xie等[20]的研究也得到了同样的结论。
然而本研究只探索了陕西汉族与部分群体之间的遗传关系,尚未充分考虑到铜川周边其他地区、其他民族及地理位置相对较远的其他群体之间的遗传差异,这也是后续研究的一个重要内容。此外,对群体遗传结构和祖源分析需进一步利用Y-SNP等突变率比Y-STR更小的遗传标记进行验证[15, 20]。故后续研究中一方面要不断补充其他地区和群体的Y-STR数据,一方面要纳入新的Y染色体遗传标记进行分析,对法医学分析、族源推断、群体进化等研究中提供更有意义的参考。