(南京医科大学第一附属医院 江苏省人民医院司法鉴定所,江苏 南京 210029)
短串联重复(short tandem repeat,STR)序列一般由长度为2~6bp的核心序列串联重复而成,广泛应用于法医学个体识别和亲缘关系鉴定[1-2]。本研究采用Goldeneye®DNA身份鉴定系统20A对江苏汉族九千余份样本展开STR基因座群体遗传学调查,旨在总结江苏地区汉族人群19个常用STR基因座的群体遗传学参数等基础数据。
9025份样本来源于本鉴定所2010—2018年进行亲缘关系鉴定的无关个体,其中男性样本5661份,女性样本3364份。采用本机构自主研发的亲权鉴定信息管理系统和司法鉴定科学研究院研发的亲权鉴定信息管理系统,以公民身份证前4位(省市代码)进行严格筛选,确保所有样本均来自江苏省各地级市范围。血样提供者均签署知情同意书。
采用Chelex-100法提取模板DNA,或对1 mm×1mm血斑免提取进行直接扩增。
扩增体系、扩增条件及分型方法按Goldeneye®DNA身份鉴定系统20A[基点认知技术(北京)有限公司]操作说明书进行。采用10 μL反应体系进行扩增,扩增产物在3130基因分析仪(美国AB公司)上进行电泳。采用GeneScan 3.2软件进行分型结果分析。
联合应用PowerStats v12软件和SPSS 19.0软件对19个常染色体STR基因座进行Hardy-Weinberg平衡检验以及基因频率分析,计算杂合度(heterozygosity,H)、匹配概率(probability of match,Pm)、个体识别率(discrimination power,DP)、非父排除率(probability of paternity exclusion,PE)、多态信息含量(polymorphic information content,PIC)等群体遗传学参数。应用Arlequin v3.5.2.2软件对江苏汉族人群19个常染色体STR基因座进行连锁不平衡分析,并对其与其他17个不同地区人群(13个国内人群、4个国外人群)[3-16]两两之间的遗传分化系数(Fst)和P值进行计算。采用MEGA 7软件进行邻接法进化树绘制。
江苏汉族人群19个常染色体STR基因座的分布均符合Hardy-Weinberg平衡(P>0.05),等位基因频率和群体遗传学参数见表1~2。其中,H为0.616 1~0.916 3,Pm为0.012 8~0.202 6,DP为0.797 4~0.987 2,PE 为0.310 8~0.828 8,PIC 为 0.561 7~0.913 6。各基因座之间相互独立,属于连锁平衡状态,CDP为0.9999999999999999984341,CPE为0.999999989。
通过对江苏汉族人群和其他17个地区人群两两之间的基因频率差异进行统计学分析,获得不同地区之间遗传距离的Fst值和P值(表3)。其中,江苏汉族和新疆阿勒泰汉族之间的Fst值(0.07355)差异具有统计学意义(P<0.05)。
续表1
表2 江苏汉族人群19个STR基因座的群体遗传学参数 (n=9025)
进化树用邻接法推断,本次比对数据按0.010 0比例绘制。进化树结果表明:江苏汉族人群和国内其他汉族人群遗传距离较近,而与新疆阿勒泰汉族、云南苗族、俄罗斯、波兰和奥地利人群距离较远。
图1 邻接法分析18个人群间的遗传进化距离
本研究采用等位基因频率,H、Pm、DP、PE和PIC等群体遗传学参数对江苏汉族人群19个常染色体STR基因座的遗传多态性进行分析。Hardy-Weinberg平衡检验P值均大于0.05,说明所收集的群体数据基因型分布的观察值和预期值之间差异无统计学意义,样本收集有效。H值范围从0.616 1(TPOX)到0.916 3(Penta E),表明体系内所有基因座的两个等位基因在随机抽样情况下区分为两个不同等位基因(杂合子)的可能性较高[17]。Pm值从0.012 8(Penta E)到0.202 6(TPOX),表明随机抽取个体在进行个体识别时匹配可能性较低[17]。PIC值从0.561 7(TPOX)到0.9136(Penta E),当该值大于0.5时STR标记物可提供高度多态性信息[18]。DP和PE值反映遗传标记系统在个体识别和亲权鉴定中的能力,通常当DP大于0.9、PE大于0.5能表明基因座具有高度多态性[19],本研究江苏汉族人群在19个STR基因座的DP值从0.797 4(TPOX)到0.987 2(Penta E),PE值从0.310 8(TPOX)到0.828 8(Penta E)。各基因座之间相互独立,属于连锁平衡状态,CDP为0.9999999999999999984341,CPE为0.999 999 989。其中,TPOX(0.310 8)、TH01(0.3424)、D3S1358(0.4567)和CSF1PO(0.4828) 4个基因座PE值小于0.5,说明在江苏汉族人群中上述4个基因座多态性欠佳,可通过大样本分析获得更符合江苏人群特征的基因座予以替代。以上统计数据表明,本研究选择的STR基因座在江苏汉族人群中具有较高的应用可行性。
对18个不同人群间的Fst和P值进行比较,结果表明,江苏汉族和新疆阿勒泰汉族人群之间的Fst值差异具有统计学意义(P<0.05),和其他人群间的遗传距离差异无统计学意义。新疆阿勒泰汉族人群与大
部分汉族人群间差异均有统计学意义。江苏汉族人群与天津汉族、湖南汉族、吉林汉族、福建厦门汉族、四川汉族、澳门(民族不详)、甘肃汉族、河南汉族、西藏藏族、云南彝族、广西汉族、越南人群的遗传距离依次增加,如以江苏汉族和天津汉族人群的遗传距离(0.01097)作为参考,江苏汉族与云南苗族、俄罗斯、波兰和奥地利等人群有超过2倍以上的遗传距离,用进化树可直观展示上述差异。遗传距离统计分析提示,人群的基因遗传差异与实际的物理距离成正相关。
表3 18个人群间的Fst值(对角线以下)和P值(对角线以上)
目前,江苏地区各鉴定机构采用不同来源的基因频率作为累积亲权指数值计算的依据。由于这些频率可能会存在样本量相对较少、地区代表性低等问题,对区域性亲权鉴定的标准化和规范化造成影响。通过本次9025例大样本数据的分析总结,可得到较以往更科学、可靠的江苏地区19个常染色体STR基因座的群体遗传学数据,将会为江苏地区法医物证专业的有序化、规范化发展提供必要的基础数据支撑。同时,希望通过本研究成果的发表,面向江苏省法医物证专业进行基因频率推广,达到在江苏省内统一基因频率的目标。
(感谢中山大学孙宏钰教授对本文的悉心指导!)