徐冲冲 ,王 上 ,魏 巍 ,张 柠 ,黎 宽 ,连心情 ,王诗旭 ,周雪梅 ,卢晓筱 ,钟树荣
(1)昆明医科大学法医学院,云南 昆明 650500;2)北京市公安局法医中心,北京 100192;3)北京通达首诚司法鉴定,北京 100089;4)昆明医科大学司法鉴定中心,云南 昆明 650500)
短串联重复序列(short tandem repeat,STR)也称微卫星DNA 或简单串联重复序列,是由2~6 bp 串联重复单位组成的DNA 片段,约占人类基因组的5%,其中大部分位于非编码区[1]。STR 基因座具有遗传多态性高等特点,是法医DNA 分型的主流遗传标记。目前已开发了多种包含不同STR 基因座的复合扩增体系,极大地促进了STR 遗传标记在法医学中的应用[2-3]。
苗族是云南省少数民族中人口较多的民族之一。根据《2021 年云南统计年鉴》[4],2020 年云南省苗族总人口为125.36 万人,占云南少数民族总人口的8.02%,主要分布在文山、红河等地区(http://stats.yn.gov.cn)。文山红河地区位于我国西南边陲云南省东南部,其东邻广西壮族自治区百色市,西临玉溪和普洱地区,北接昆明和曲靖市,南部与越南接壤。文山红河地区苗族人群极具跨境民族特色,有着独特的群体遗传结构特征,与其他群体间存在复杂的关联,因此研究其遗传多态性对该地区苗族人群的法医学应用和群体遗传学研究具有重要意义。本研究采用PowerPlex®21试剂盒对文山红河地区苗族人群2 209 例无关个体20 个常染色体STR 基因座的遗传多态性进行调查,旨在了解该地区苗族群体的遗传背景和遗传结构,为法医DNA 分析和群体遗传研究提供基础数据。
根据知情同意原则,收集云南省文山壮族苗族自治州和红河哈尼族彝族自治州2 209 例无关健康苗族个体的口腔拭子或血样。
采用Chelex-100 法提取样本DNA,并置于-20 ℃冰箱保存。采用PowerPlex®21 System 试剂盒(Promega 公司,美国),并使用ABIVeriti®PCR 仪(AB 公司,美国)对20 个常染色体STR 基因座(D3S1358、D1S1656、D6S1043、D13S317、Penta E、D16S539、D18S51、D2S1338、CSF1PO、Penta D、TH01、vWA、D21S11、D7S820、D5S818、TPOX、D8S1179、D12S391、D19S433和FGA)进行复合扩增。每批次待测样本以标准品2800M 作为质控的阳性对照,ddH2O 作为阴性对照。用Applied Biosystems®3130 遗传分析仪(AB 公司,美国)对PCR 扩增产物进行毛细管电泳分离,采用GeneMapper® ID v3.2 软件(AB 公司,美国)进行基因分型。STR 分型和命名遵循国际法庭科学遗传学会(ISFG)的命名原则。
使用Modified-Powerstats 软件计算20 个常染色体STR 基因座的等位基因频率(allele frequency,AF)、随机匹配概率(matching probability,Pm)、观测值杂合度(observed heterozygosity,Ho)、多态性信息含量(polymorphism information content,PIC)、个体识别概率(discrimination power,DP)、非父排除概率(probability of exclusion,PE)、亲权指数(paternity index,PI)等法医学参数,并对各基因座进行 Hardy-Weinberg 平衡检验,采用Bonferroni 多重校正,以P< 0.002 5 为差异有统计学意义。计算累积个人识别概率(cumulative discrimination power,CDP)和累积非父排除率(cumulative probability of exclusion,CPE)。使用Arlequin v3.5 软件[5]计算文山红河地区苗族与24个已发表群体[6-29]的遗传分化指数(Fst)和P值,经Bonferroni 多重校正,P< 0.003 3 为差异有统计学意义。使用Phylip 3.69 软件包计算Nei's 标准遗传距离(http://evolution.genetics.washington.edu/phylip.html)。基于Nei's 遗传距离,使用Mega 7.0 软件[29]构建25 个群体的相邻连接(neighboringjoining,N-J)系统发育树,并采用SPSS v24.0 统计软件(IBM 公司,美国)进行多维尺度(multidimensional scaling,MDS)分析。
文山红河地区苗族2 209 例无关个体20 个常染色体STR 基因座的等位基因频率及法医学参数见表1 和表2。共检出265 个等位基因和1 080 种基因型,等位基因频率分布范围为0.000 2~ 0.571 8(D13S317),各基因座等位基因数目为7(D3S1358)~25(FGA)。对20 个STR 基因座进行Hardy-Weinberg 平衡检验,经Bonferroni 校正,各基因座等位基因频率和基因型频率分布均符合Hardy-Weinberg 平衡定律(P> 0.05/20=0.002 5)。20 个STR 基因座的法医学参数如下:Pm 和Ho值的范围分别为0.013 2(Penta E)~0.232 2(TPOX)和0.571 1(TPOX)~0.903 1(Penta E),PIC 值的范围为0.521 1(TPOX)~0.910 8(Penta E)。DP 值的范围为0.767 8(TPOX)~0.986 8(Penta E),CDP值为0.999 999 999 999 999 999 999 932 674 151。PE 值的范围为0.257 6(TPOX)~0.801 8(Penta E),计算该分型系统的CPE 值达0.999 999 935 545 335。
表1 文山红河地区苗族群体20 个STR 等位基因频率分布(n=2 209)(1)Tab.1 Allele frequency distribution of 20 STR loci in Miao population from Wenshan and Honghe regions(n=2 209)(1)
表1 文山红河地区苗族群体20 个STR 等位基因频率分布(n=2 209)(2)Tab.1 Allele frequency distribution of 20 STR loci in Miao population from Wenshan and Honghe regions(n=2 209)(2)
表2 文山红河地区苗族人群20 个STR 基因座法医学参数(n=2 209)Tab.2 Forensic parameters for 20 STR loci in Miao population from Wenshan and Honghe regions(n=2 209)
文山红河苗族和24 个其他群体的Fst 值和P值见表3。经Bonferroni 校正(P< 0.05/15≈0.003 3),文山红河苗族与新疆喀什维吾尔族、云南佤族、越南京族、印度安得拉人、广西侗族、西藏昌都藏族、长春汉族、广东梅州客家人、云南哈尼族、新疆阿勒泰汉族、山东济宁汉族、重庆汉族和新疆伊犁维吾尔族之间有统计学差异的基因座数目最多,有15 个;其次为海南黎族、广东汉族、爱沙尼亚人、云南汉族和四川汉族,有14 个;与新疆维吾尔族、贵州仡佬族、重庆万州汉族和云南布朗族在13 个基因座上存在差异;与北意大利人和云南越南人群的差异基因座数目分别为5 个和4 个。
表3 文山红河苗族与24 个参考群体的Fst 值和P 值(1)Tab.3 Pairwise Fst and P values between Wenshan and Honghe Miao and 24 reference populations(1)
表3 文山红河苗族与24 个参考群体的Fst 值和P 值(2)Tab.3 Pairwise Fst and P values between Wenshan and Honghe Miao and 24 reference populations(2)
表3 文山红河苗族与24 个参考群体的Fst 值和P 值(3)Tab.3 Pairwise Fst and P values between Wenshan and Honghe Miao and 24 reference populations(3)
根据本研究群体与24 个已报道人群的群体数据计算得到Nei's 标准遗传距离矩阵,见表4。其中,文山红河苗族与云南越南人群的遗传距离最小(0.026 537),与爱沙尼亚人群的遗传距离最大(0.904 458)。通过构建NJ 系统发育树进一步剖析这些群体的遗传关系,结果显示文山红河苗族与云南越南人群聚为一支,见图1。基于Nei's 遗传距离进行MDS 分析,同样观察到文山红河苗族与云南越南人群相距较近,而与爱沙尼亚人群相距较远。此外,不同地区的汉族和维吾尔族分别聚为一簇,见图2。
图1 基于Nei’s 遗传距离构建的文山红河苗族与24 个参考群体的NJ 系统发育树Fig.1 The phylogenetic tree based on Nei’ s genetic distances between Wenshan and Honghe Miao and 24 reference populations
图2 基于Nei’s 遗传距离对文山红河苗族与24 个参考群体的MDS 分析Fig.2 Multidimensional Scaling(MDS)analysis based on Nei’ s genetic distances between Wenshan and Honghe Miao and 24 reference populations
表4 文山红河苗族与24 个参考群体的Nei's 遗传距离Tab.4 Nei’s standard genetic distances between Wenshan and Honghe Miao and 24 reference populations
本研究报告了文山红河地区苗族人群20 个常染色体STR 基因座的等位基因频率和相关法医学参数,评估了PowerPlex®21 系统在该人群中的法医学应用价值。PowerPlex®21 分型系统是一种广泛使用的商业试剂盒,该试剂盒包含DNA 联合索引系统(CODIS)推荐的17 个位点,还增加了Penta E,D6S1043和Penta D基因座。DP 和PE 值反映STR 分型系统在个体识别和亲权鉴定中的能力,一般认为DP > 0.80、PE > 0.50 的基因座具有高鉴别能力。本研究中,Penta E,D6S1043和Penta D3 个基因座的DP 和PE 值分别为0.986 8,0.971 1,0.932 7 和0.801 8,0.715 7,0.585 5,可见这些基因座属于高度多态性。在所有20 个基因座中,Penta E的Pm 值最小,DP、PIC、PE、Ho 值最大。分析国内外其他群体发现,该基因座具有极高的鉴别力和多态性,法医学应用价值较高[6-11]。本研究群体在20 个STR 基因座的CDP和CPE 分别高达0.999 999 999 999 999 999 999 932 674 151 和0.999 999 935 545 335,这表明PowerPlex®21 复合扩增体系在文山红河苗族人群中具有极高的系统效能,可用于该地区苗族人群的个体识别和亲权鉴定。
遗传距离是表征群体间遗传异质性或遗传分化的重要指标,本研究通过计算群体间遗传分化指数Fst 值和Nei's 遗传距离,构建N-J 系统发育树和MDS 分析,探索了文山红河苗族人群与其他24 个群体之间的遗传关系。结果表明文山红河地区苗族与云南越南人群的亲缘关系较近。文山红河地区的马关、金平、屏边、河口等县与越南北部的河江、老街、莱州等省(市)接壤。在边境线上跨界而居的民族很多,包括文山红河地区的苗、彝、壮等民族,以及越南北部的越(京)、赫蒙(苗)等民族[29]。由于长期跨界而居,中越边境民族互相通婚,彼此形成了“民族共宗,文化同源,江河同流”等特点[29]。这可能是文山红河苗族与云南越南人群亲缘关系较近的原因之一。方玲等[30]分析了不同民族线粒体DNA 中9 bp 重复序列的缺失频率,结果表明中国南方苗族人群与越南人群在遗传上有较为密切的关系,本研究从常染色体STR 的角度验证了前人的研究结果。此外,不同地区的汉族群体(云南汉族、重庆汉族、四川汉族、广东汉族、山东汉族、新疆汉族和长春汉族)以及3 个维吾尔族群体(新疆伊犁维吾尔族、新疆维吾尔族和新疆喀什维吾尔族)分别聚为一簇,彼此间遗传关系较为密切,证明了不同地区同一民族在共同起源上的潜在关联,说明常染色体STR 遗传标记在评价群体遗传结构和族源推断方面具有一定作用[31-33]。
本研究报告了文山红河地区苗族人群2 209例无关个体20 个常染色体STR 基因座的等位基因频率及法医学参数。结果表明,20 个常染色体STR 基因座在文山红河苗族人群中具有较高的遗传多态性和较好的系统效能,可满足法医学个体识别和亲权鉴定,亦可为群体遗传学研究提供基础数据。