王亚丽,宋振祥,顾 捷,白慧茹,周圆圆,张佳怡,杨 越,史唯一,陈丽琴*
(1.内蒙古医科大学法医学实验室,中国内蒙古呼和浩特010030;2.内蒙古医科大学附属医院,中国内蒙古呼和浩特010030)
个体识别和亲权鉴定是法医遗传学鉴定的主要工作内容。目前法医DNA实验室普遍使用的遗传标记是短串联重复序列(short tandem repeat,STR),但在实际案件中,STR存在突变率高、扩增片段较长、难以解决疑难降解检材检测风险等问题。插入/缺失(insertion/deletion,InDel)作为第三代新型遗传标记,表现为DNA片段的插入或缺失形成的长度多态性。2006年,第一张人类基因组InDel多态性分型图谱被绘制出来,包括40多万个InDel遗传标记,平均密度为每7.2 kb碱基即可发现一个InDel位点[1]。InDel在全基因组中分布广、数量多、密度大,在法医遗传学中具有极大的应用潜能。同时,InDel具有与单核苷酸多态性相近的突变率(1×10-8),明显低于STR突变率(2×10-3),且稳定性好,其扩增序列(<160 bp)明显短于常用的STR[2~3],甚至短于miniSTR,因此更适用于高度降解等疑难生物检材的检测。此外,In-Del属于长度多态性标记,可应用目前通行的毛细管电泳分型平台进行检测,因此易于在实验室间普及[4]。总之,InDel因其突变率低、扩增片段短、数量多、易于检测的特性而弥补了STR和单核苷酸多态性(single nucleotide polymorphism,SNP)的不足,有望解决高度降解等疑难检材的DNA检测,以及复杂个体识别和亲权鉴定问题,因而引起法庭科学领域的关注和积极探索。
本研究通过统计分析30个常染色体InDel位点在内蒙古赤峰地区蒙古族人群的遗传多态性,积累了该地区的群体数据,可为民族、种群遗传关系研究提供基础。
根据知情同意原则,采集50名内蒙古赤峰地区蒙古族无关个体血样,均为女性,年龄在20~60岁之间,载于FTA卡上。
Chelex-100(Bio-Rad公司,美国);蛋白酶K(10 mg/μL)(Promega公司,美国);Investigator DIP-plex试剂盒(Qiagen公司,德国);Hi-Di formamide(Thermo Fisher公司,美国)。
1.2 mm孔径打孔器(Harris公司,美国);9700型PCR扩增仪(Thermo Fisher公司,美国);3130型基因分析仪(Thermo Fisher公司,美国)。
参照文献[5]的方法应用5%Chelex-100对FTA卡上的血样进行DNA提取。1)在1.5 mL离心管中加1 mL纯水,然后加入血样(用1.2 mm孔径打孔器对FTA卡血样进行打孔取3片),小心混匀,放置30 min,间歇振荡;2)10 000~15 000 r/min离心2~3 min,小心移去上清液。若样品为血斑,则保留载体;3)沉淀中加入200 μL的5%Chelex-100,56℃保温30 min;4)高速振荡5~10 s,沸水浴 8 min;5)高速振荡 5~10 s,10 000~15 000 r/min离心2~3 min,取上清液用于扩增反应。
参照Investigator DIPplex试剂盒说明书[6],采用10 μL反应体系对 30个常染色 InDel位点(HLD77、HLD45、HLD131、HLD70、HLD6、HLD111、HLD58、HLD56、HLD118、HLD92、HLD93、HLD99、HLD88、HLD101、HLD67、HLD83、HLD114、HLD48、HLD124、HLD122、HLD125、HLD64、HLD81、HLD-136、HLD133、HLD97、HLD40、HLD128、HLD39、HLD84)和性别位点Amelogenin进行PCR扩增。体系组成包括 Reaction Mix A 2.0 μL,Primer Mix 2.0 μL,Multi Taq2 DNA Polymerase 0.24 μL,DNA模板(10 ng/μL)1 μL,去离子水 4.76 μL。采用标准品9948作为阳性对照,去离子水作为阴性对照。PCR条件:94℃预变性4 min;94℃变性30 s,61℃退火120 s,72℃延伸75 s,30个循环;68℃终延伸60 min;10℃保温∞。
PCR产物变性后在3130型基因分析仪上进行毛细管电泳,体系为8.5 μL甲酰胺、0.5 μL分子量内标Orange500和1 μL PCR产物。应用Gene Mapper ID v3.2.1软件对InDel位点进行分型。
应用 Modified-Powerstates.xls[7]和Cervus v3.0.7[8]对30个常染色InDel位点进行Hardy-Weinberg平衡检验(PHWE),并完成等位基因分布频率(Fdel:缺失多态性等位基因频率;Fins:插入多态性等位基因频率)、个体识别率(probability of discrimination power,DP)、多态信息含量(polymorphism information content,PIC)、匹配概率(match probability,MP)、典型父权指数(typical paternity index,TPI)、观察值杂合度(heterozygosity of observation,Ho)及期望值杂合度(heterozygosity of expect,He)的计算。采用Arlequin软件[8]完成InDel位点之间连锁不平衡分析,以及内蒙古赤峰蒙古族人群与内蒙古鄂温克族[9]、广西蒙古族[10]、北京汉族[11]和新疆维吾尔族[12]4个群体相关InDel位点的等位基因频率分布差异分析。参照文献[13]的公式计算二联体非父排除率(paternity exclusion for duo,PED)、三联体非父排除率(paternity exclusion for trio,PET)、二联体累计非父排除率(combined paternity exclusion for duo,CPED)、三联体累计非父排除率(combined paternity exclusion for trio,CPET)、累计个体识别率(combined discrimination power,CDP)。
Investigator DIPplex试剂盒推荐的PCR扩增体系为25 μL,在本研究中,尝试采用10 μL的扩增体积对标准品9948进行PCR扩增和电泳检测,结果显示电泳分型图谱准确(图1)。在50名内蒙古赤峰蒙古族无关个体中,30个InDel位点均得到有效扩增,扩增片段均在160 bp之内。当两个等位基因相同时为纯合子,表现为1个峰;当两个等位基因不同时为杂合子,表现为2个峰。图2为一例内蒙古赤峰蒙古族样本的基因图谱。
50名内蒙古赤峰蒙古族人群无关个体在30个常染色InDel位点上经Hardy-Weinberg平衡检验后,除HLD83和HLD97位点外,其余InDel位点的P值均大于0.05。经Bonferroni校正后,P值设为0.001 7(0.05/30),此时HLD83(P=0.011 1)和HLD97(P=0.014 9)的P值均大于0.001 7。因此,30个常染色InDel位点均符合Hardy-Weinberg平衡。
图1 Investigator DIPplex试剂盒阳性对照9948分型图谱Fig.1 The genetic typing of positive control 9948 with Investigator DIPplex kit
30个InDel位点的等位基因频率及群体遗传学参数见表1,其中Fdel为0.120 0~0.880 0,Fins为0.120 0~0.880 0,DP 为 0.309 6~0.658 4,PIC 为0.188 9~0.374 9,MP 为 0.341 6~0.690 4,TPI为0.568 2~1.470 6,Ho 为 0.120 0~0.660 0,PET为0.094 4~0.187 4。
图2 一例内蒙古赤峰蒙古族样本的分型图谱Fig.2 The genetic typing of one sample from Chifeng Mongolia population
30个InDel位点共进行435次(435=[n(n-1)]/2,n=30)连锁不平衡检验,其中,有17次的P值小于0.05。经Bonferroni校正后,P值设为0.000 115(0.05/435),此时,各位点之间均不存在连锁不平衡现象,相互独立。采用乘积原则计算,CPET为0.996 257 187 748,CPED为0.957 489 048 877,CDP为0.999 999 999 993。
内蒙古赤峰蒙古族与4个群体(内蒙古鄂温克族、广西蒙古族、新疆维吾尔族以及北京汉族)的等位基因频率分布差异见表2。经Bonferroni校正后,P值设为0.001 7(0.05/30),结果显示:内蒙古赤峰蒙古族与鄂温克族和北京汉族人群在HLD40位点上的差异有统计学意义;与广西蒙古族在HLD64位点上的差异有统计学意义;与新疆维吾尔族在HLD111、HLD56及HLD118位点上的差异有统计学意义。
通过查阅文献资料,得到国内12个群体的30个InDel位点的系统效能(CPE和CDP值)。对比本文研究的内蒙古赤峰蒙古族与国内12个群体(河南汉族[14]、北京汉族[11]、广东汉族[15]、福建汉族[16]、江苏汉族[17]、广西蒙古族[10]、内蒙古鄂温克族[9]、福建畲族[18]、北京藏族[11]、新疆维吾尔族[12]、广西壮族[10]与广西哈萨克族[10])的30个InDel位点的系统效能(CPE和CDP值),CDP值从大到小依次为:新疆维吾尔族>广西哈萨克族>福建畲族>内蒙古赤峰蒙古族>北京藏族>广西蒙古族>北京汉族>内蒙古鄂温克族>河南汉族>广东汉族>福建汉族>广西壮族>江苏汉族;CPE值从大到小依次为:江苏汉族>内蒙古赤峰蒙古族>北京藏族>新疆维吾尔族>北京汉族>河南汉族>广东汉族>广西哈萨克族>广西蒙古族>广西壮族>内蒙古鄂温克族>福建畲族>福建汉族。具体数据信息见表3。
表1 30个常染色体InDel位点的等位基因频率及群体遗传学参数(n=50)Table 1 The forensic parameters and allele frequency of 30 autosomal InDel loci(n=50)
Investigator DIPplex(Qiagen公司)是目前市面上第一款常染色体InDel的商品化试剂盒,包含30个常染色体InDel位点和1个性别鉴别基因座(Amelogenin),扩增片段长度均在160 bp以内。本文检测结果显示:内蒙古赤峰蒙古族人群HLD111 位点的 Fins、Ho、He、DP、PIC、PET、PED及TPI值 均最小,HLD118 位点的 Fdel、He、PIC 及PET、PED值也较小,这两个位点在已报道的河南汉族[14]、广东汉族[15]、江苏汉族[17]、福建汉族[16]及新疆维吾尔族[12]等群体中的等位基因频率及群体遗传学参数也较低,显示这两个位点在中国人群中的多态性较低。这可能与试剂盒开发的针对人群(欧洲)及样本数量的抽样误差有关。
Investigator DIPplex试剂盒包含的30个In-Del位点在内蒙古赤峰蒙古族人群中具有较好的遗传多态性,各位点间相互独立,均不存在连锁不平衡现象,其CDP值为0.999 999 999 993,达到常规STR检测系统的CDP值(0.999 999 999 98)[19],可满足法医个体识别的要求,可独立应用于法医实践中的个体识别鉴定,且由于其片段长度较小,所以也易于检测严重降解的生物检材。但是,30个InDel位点的CPET为 0.996,CPED为0.957,尚未达到13个CODIS STR检测系统的CPE值(0.999 999 992以上)[20],因此尚不能单独应用于亲权鉴定案件中。需要指出的是,由于其突变率较低,在STR出现突变的亲子鉴定案件中,可以作为有效的补充标记。
目前,国内外学者对该试剂盒进行了一系列群体遗传学调查和法医学应用效能评估[9~19]。本文通过比较13个不同群体的系统效能发现,这些群体的CDP值均大于0.999 999 9,其中新疆维吾尔族的CDP值最大,江苏汉族的CDP值最小;但是CPE值最大仅0.997,其中江苏汉族的CPE值最大,福建汉族的CPE值最小。此结果证实了该试剂盒在法医学个体识别和亲权鉴定中可作为STR辅助检测工具的应用价值。
表2 内蒙古赤峰蒙古族与4个群体之间的等位基因频率分布差异Table 2 Pairwise Fst and P values between the Chifeng Mongolia population and other 4 populations
表3 30个常染色体InDel位点在不同人群中的系统效能Table 3 The system performance of 30 autosomal InDel loci in different populations
遗传距离(genetic distance)是通过两个群体同一基因座上相同的等位基因频率差异的函数来计量的[12],是群体间遗传差异或分化的重要参数。最常用的指标是Fst,又称为近交系数,两个群体间基因座的Fst值越大,表示该基因座在两个群体间差异性越大。本研究结果显示:内蒙古赤峰蒙古族人群与鄂温克族人群及北京汉族在HLD40位点上的Fst值较大,分别为0.152 0、0.217 3,其P值为(0.000 00±0.000 0)<0.5,显示其等位基因频率分布具有统计学差异;内蒙古赤峰蒙古族人群与广西蒙古族人群在HLD64位点上的Fst值最大,为 0.269 4,其 P值为(0.000 00±0.000 0)<0.5;内蒙古赤峰蒙古族人群与新疆维吾尔族人群在HLD111、HLD56和HLD118位点上的Fst值较大,其P值均为(0.000 00±0.000 0)<0.5,显示其等位基因频率分布具有统计学差异。中国是一个历史悠久的多民族国家,随着社会经济的发展,人口的聚集、迁移与融合,单一民族的聚居格局逐渐被打破,形成“大杂居、小聚居”模式[21],使同一地区的不同民族间的遗传差异越来越小。
综上所述,内蒙古赤峰蒙古族人群30个In-Del位点的等位基因频率和群体遗传学参数为内蒙古地区蒙古族人群法医学研究提供了基础数据,丰富了该群体的基因信息资源;InDel遗传标记可作为法医物证鉴定工作的补充检测标记。