刘亚举,郭利红,岳俊涛,李 瑾,石美森,李学博
1.河南省许昌市公安局刑事科学技术研究所,河南许昌 461000;2.河南省公安厅刑事科学技术研究所,河南郑州 450003;3.中国政法大学证据科学教育部重点实验室,北京100192;4.山东省高校证据鉴识重点实验室(山东政法学院),山东济南 250014
Y染色体为男性所特有,具有单倍型连锁遗传及父系遗传等特征,在减数分裂时不与其他染色体发生重组,父代Y-STR基因以稳定的单倍体形式遗传给子代,因此在男女混合、多名男性混合样本及亲权鉴定的法医学应用中有独特的应用价值,并在群体遗传学、人类遗传学等领域发挥着重要作用,是常染色体检测的重要补充。本文选取河南回族、贵州仡佬族和贵州苗族人群的27个Y-STR基因座进行研究,并与其他民族的遗传关系进行聚类分析,重建系统发生树,一方面为法医学鉴定提供参考数据,另一方面进一步探讨了各民族的分子遗传学关系,可用于家族起源、人类进化、迁徙等群体遗传学研究[1]。
1.1材料 从健康体检人群中随机选取1 080例河南回族、297例贵州仡佬族和221例贵州苗族无血缘关系的男性个体,均采集外周血0.1 mL,滴入采血卡(武汉骥腾公司),阴干后常温保存。本研究经复旦大学生命科学学院伦理委员会批准。通过YHRD(www.yhrd.org)数据库获得北京汉族(YA004160)、河南汉族(YA004057)、上海汉族(YA004263)、重庆汉族(YA 004232)、广东汉族(YA004066)、内蒙古达斡尔族(YA004277)、甘肃东乡族(YA004178)、甘肃回族(YA004305)、甘肃藏族(YA004043)、青海藏族(YA004181)、湖北土家族(YA004306)、广西壮族(YA004208)及海南黎族(YA004302)13个群体的27个Y-STR基因座单倍型分布数据(共10 985个)作为对比数据。
1.2方法 根据STRtyper-27Y荧光检测试剂盒(宁波海尔施基因科技有限公司)说明书,用直扩法(免提取)对血液标本进行PCR扩增。在ABI 9700型热循环仪上进行复合扩增,反应体系为10 μL,其中PCR Master Mix 5.0 μL、Primer Mix 2.5 μL、纯水2.5 μL和1.2 mm直径血卡。热循环参数为:95 ℃ 5 min;94 ℃ 10 s,61 ℃ 1 min,70 ℃ 30 s,28个循环;60 ℃ 20 min;4 ℃保温。取1 μL扩增产物与0.5 μL内标SIZE-500 Plus(宁波海尔施基因科技有限公司)和8.5 μL去离子甲酰胺混合,95 ℃变性3 min后,冰浴3 min,置于3500XL型遗传分析仪(美国ThermoFisher公司)上行全自动毛细管电泳,采用Data Collection软件收集数据,采用GeneMarker®HID分析软件(美国SoftGenetics公司)进行等位基因分型,并采用GeneMapper ID-X v1.4分析软件(美国Thermo Fisher公司)进行复核分析。每批样本检测均采用007(美国ThermoFisher公司)和超纯水分别作为阳性对照和阴性对照。
1.3统计学处理 用直接计数法对各基因座的等位基因频率和单倍型检出频率进行计算。基因多样性(GD)和单倍型多样性(HD)按公式h=n(1-∑Pi2)/(n-1)(Pi为等位基因或单倍型频率,n为样本数)计算;系统鉴别能力(DC)=Ndiff /N,其中Ndiff代表观察到的单倍型种类数,N代表样本量[2]。其中双拷贝基因座DYF387S1和DYS385ab作为单倍型计算。利用YHRD数据库提供的在线软件Mega6.0进行AMOVA分析,并计算群体间遗传距离Rst矩阵。
2.127个Y-STR基因座遗传多态性 27个Y-STR基因座包括23个单拷贝Y-STR基因座及2个双拷贝基因座(DYS385ab及DYF387S1,视为4个Y-STR基因座)。3个民族人群的27个Y-STR基因座的等位基因频率见表1~7。在27个Y-STR基因座中,回族人群共检出1 064个单倍型,其中1 048种单倍型为唯一单倍型,16种单倍型分别出现2次,HD值为0.999 972 5,DC值为0.985 185 2;仡佬族人群共检出286个单倍型,其中276种单倍型为唯一单倍型,9种单倍型分别出现2次,1种单倍型出现3次,HD值为0.999 727 1,DC值为0.962 963 0;苗族人群共检出217种单倍型,其中213种单倍型为唯一单倍型,4种单倍型分别出现2次,HD值为0.999 835 5,DC值为0.981 900 4。回族除DYS391基因座外,仡佬族和苗族除DYS391、DYS437、DYS438基因座外,其余基因座GD值均大于0.5。
表1 回族、仡佬族及苗族人群23个单拷贝Y-STR基因座的等位基因频率分布
续表1 回族、仡佬族及苗族人群23个单拷贝Y-STR基因座的等位基因频率分布
注:A代表等位基因;FH、FG、FM分别代表回族、仡佬族、苗族的基因频率;null代表无效基因;下划线表示多个等位基因模式。
表2 DYS385ab在回族人群的等位基因频率分布
注:A代表等位基因;F代表基因频率;下划线表示2个以上等位基因模式。
表3 DYF387S1在回族人群的等位基因频率分布
注:A代表等位基因;F代表基因频率;下划线表示2个以上等位基因模式。
表4 DYS385ab在仡佬族人群的等位基因频率分布
注:A代表等位基因;F代表基因频率;下划线表示2个以上等位基因模式。
表5 DYF387S1在仡佬族人群的等位基因频率分布
注:A代表等位基因;F代表基因频率;下划线表示2个以上等位基因模式。
表6 DYS385ab在苗族人群的等位基因频率分布
注:A代表等位基因;F代表基因频率;下划线表示2个以上等位基因模式。
表7 DYF387S1在苗族人群的等位基因频率分布
注:A代表等位基因;F代表基因频率;下划线表示2个以上等位基因模式。
2.23个人群与参考群体间的遗传距离 通过AMOVA分析,16个人群间的遗传距离在-0.000 1~0.212 0,相同民族间遗传距离较小,而不同民族群体间遗传距离普遍较大。其中河南回族与北京汉族群体间的遗传距离最小(0.005)、与青海藏族群体间的遗传距离最大(0.147);贵州仡佬族与重庆汉族群体间的遗传距离最小(0.005),与青海藏族群体间的遗传距离最大(0.157);贵州苗族与重庆汉族群体间的遗传距离最小(-0.000 1),与青海藏族群体间的遗传距离最大(0.185),见表8。
表8 16个人群Rst值遗传距离矩阵
注:对称轴上方为对应的P值,对称轴下方为Rst值。
Y染色体为正常男性所特有,按遗传方式的不同分为两个区:拟常染色体区,约占5%,以类似常染色体的方式遗传,减数分裂时可以发生交换;非重组区,约占95%,在减数分裂时与其他染色体不发生重组,以单倍型的形式由父亲传递给儿子,呈父系遗传[3]。由于其独特的遗传学特点,Y-STR可以解决常染色体STR无法解决的问题,如男女混合、多个男性混合样本检测及单亲亲权鉴定。Y-STR在减数分裂过程中不发生重组,序列的改变仅由突变引起,研究不同种族、民族和不同地域之间Y-STR遗传多态性,对于了解人类的起源、迁移及重构父系进化历史等方面有着重要的意义[4]。
评估Y-STR鉴别能力的指标是GD,对于连锁的遗传标记,不能采用乘积定律,需先计算单倍型频率,再计算个人识别率[5]。本文27个Y-STR基因座多态性调查结果显示,回族除DYS391基因座外,仡佬族和苗族除DYS391、DYS437、DYS438基因座外,其余基因座GD值均大于0.5,为高多态性遗传标记,表明这些基因座在这3个人群中具有较好的遗传多态性,适合法医学应用。Y-STR基因座的多态性分布因种族、地域、民族的不同具有明显的差异,不同地区和民族之间的差异,使得不同种群之间的基因频率分布资料不宜混用,所以获取各群体Y-STR基因座的等位基因频率是必要且有意义的。
本研究对16个群体进行AMOVA分析,并获得了Rst遗传距离,结果显示,河南回族与北京汉族群体间的遗传距离最小(0.005)、与青海藏族群体间的遗传距离最大(0.147);贵州仡佬族与重庆汉族群体间的遗传距离最小(0.005)、与青海藏族群体间的遗传距离最大(0.157);贵州苗族与重庆汉族群体间的遗传距离最小(-0.000 1)、与青海藏族群体间遗传距离最大(0.185)。此外,本研究发现:(1)同一民族的亚群体聚为一类,遗传距离最小,但由于近代历史中人口的迁徙和国界等地缘因素,即使是同一祖先的民族间依然具有一定差异,并且随着隔离时间和地理距离而变化;(2)同一语系的民族遗传距离也较小,而不同语系的民族表现为遗传距离较大,汉藏语系的汉族和其他民族之间群体间的 AMOVA分析,差异有统计学意义(P<0.05)。 需要指出的是,在对各地人群Y-STR基因座的等位基因频率资料收集的过程中发现,在法医学发展比较好及其邻近地区的Y-STR基因座资料比较全面,部分地区、部分民族的Y-STR基因座资料比较欠缺,并不能明显反映出遗传差异。因此,在法医发展相对落后及部分民族群体中的遗传学资料比较匮乏的地区,应该在调查研究中投入更大的精力,建立本地区、本民族的基因分布频率资料,为法医学应用和民族的起源、进化、迁徙研究提供相对科学的基础数据[3-6]。
综上所述,河南回族、贵州仡佬族和贵州苗族人群的27个Y-STR基因座的基因多态性普遍较高,适用于法医学个体识别和亲权关系中,为本地区构建该民族Y-STR数据库奠定了基础,对进一步的研究具有参考意义;本研究应用多种统计分析方法,对河南回族、贵州仡佬族、贵州苗族人群与其他13个群体的遗传关系进行了分析,所得结果与各民族起源和迁徙史基本一致,进一步证实了这些民族的遗传关系,为今后研究这些民族的起源、进化和迁徙史等人类遗传学研究提供了基础性数据。