马 佳 郝绍文 赵新艳 戴晓婧 焦海燕,3△
(宁夏医科大学, 1 基础医学院, 2 总医院急诊科, 3 教育部生育力保持省部共建重点实验室, 银川 750004;4 银川市公安局, 银川 750004; 5 美国得克萨斯大学健康科学研究所, 德克萨斯州 77030, 美国)
短串联重复序列(short tandem repeats,STR)是一类具有长度多态性的DNA序列,广泛存在于真核生物基因组非编码区,不转录和编码蛋白质。STR核心序列为2~7 bp, 其基因座所在的染色体区域包含多达几十万kb的DNA序列,并和染色体上的“热点区域”结合而表现出高度的连锁不平衡(linkage disequilibrium,LD), 且遵循孟德尔遗传定律。目前,STR已被广泛用于法医学个体识别、亲权鉴定、疾病相关基因的定位等众多领域。STR不受选择压力的影响,其突变可在进化过程中稳定传递、积累,能保守的在不同群体间传递或仅出现在某些特定群体中[1],不同地区人群STR位点的基因座等位基因频率分布存在差异,形成高度多态性[2]。因此,获取不同地区群体STR遗传特征是非常必要的。本研究以宁夏地区汉族人群为研究对象,分析19个STR在宁夏地区汉族群体的遗传多态性。
随机选择宁夏籍汉族且无血缘关系个体347名,其中,女性139例,年龄19~51岁,平均年龄(26.9±6.4)岁;男性208例,年龄22~55岁,平均(24.0±9.3)岁。所有受试者均对本研究知情同意并签署知情同意书;本研究经宁夏医科大学伦理委员会审核批准。采集其外周血,制成FTA(Flinders Technology Associates,FTA)卡,常温保存。
取孔径为1.0 mm的圆片血样,使用GoldeneyeTM20A 复合STR检测系统, 按照Goldeneye 20A试剂盒说明书(北京基点认知公司),应用ABI 9700型扩增仪(ABI公司),对19个STR基因座(D19S433、D5S818、D21S11、D18S51、D6S1043、D3S1358、D13S317、D7S820、D16S539、CSF1PO、Penta D、vWA、D8S1179、TPOX、Penta E、 TH01、D12S391、D2S1338、FGA) 及牙釉基因直接进行复合扩增。扩增体系为10 μl,其中,PCR Reaction Mix: 4.0 μl;Primer set: 2.0 μl;Taq Gold@ DNA聚合酶:0.16 μl;无菌去离子水:3.84 μl。扩增条件为:95℃×5 min;(94℃×30 s,60℃×60 s,70℃×60 s)×28循环;60℃×35 min;扩增后的PCR产物置于4℃保存备用。
扩增产物经甲酰胺变性后,在ABI 3500 XL 型遗传分析仪上进行电泳。在样本检测过程中,以DNA 9947A作为阳性对照,去离子水作为阴性对照。使用Gene Mapper ID V3.2软件进行基因分型。等位基因命名根据国际法医遗传学会(International Society for Forensic Geneics,ISFG)等位基因命名原则和 Ladder为参照进行样本等位基因分型。采用 Data Collection 2. 0 软件将收集的电泳图谱信息处理成数据信息,使用 Gene Mapper ID software V3.2软件[3]进行等位基因分型。
用 HWE精确检验软件进行Hardy-Weinberg平衡检验,采用powerstate V1.2[4]软件分别计算19个STR基因座的等位基因频率、基因型频率、期望杂合度(expected heterozyogosity,He)、匹配概率(probability match, Pm)、个体鉴别力(power of discrimination,DP)、非父排除率(power of exclusion,PE)、多态性信息含量(polymorphism information content,PIC)等群体遗传学指标。
347例样本检出率为100%,19个STR基因座位点均得到了有效的扩增,测序图谱显示扩增结果较好,特异性较高。对照STR(9947a)、ladder与样本进行了同步检测,检测结果与说明书完全相符,说明检测结果真实可靠。STR检测结果举例说明见图1。
采用HWE精确检验软件对宁夏汉族人群的19个STR基因座位点的基因型频率分布进行Hardy-Weinberg平衡检验。结果显示,各基因座基因型频率分布通过Hardy-Weinberg平衡检验(P>0.05),显示研究对象具有很好的群体代表性(表1)。
表1 宁夏地区汉族人群19个STR基因座的P值(n=347)Tab 1 P values of 19 STR loci in Ningxia Han population(n=347)
图1 STR基因座测序图Fig 1 STR analysis of sample DNA
在受检的347例宁夏汉族无关个体的19个STR基因座上共检出120个等位基因、775种基因型,等位基因频率分布范围在0.001至0.503。基因型频率从高到低的顺序排列为:D12S391、D18S51、D6S1043、D21S11、D2S1338、FGA、Penta D、D3S1358、D5S818、D13S317、D7S820、D19S433、CSF1PO、D16S539、TH01、vWA、TPOX。D8S1179、Penta E(表2)。
表2 宁夏地区汉族人群19个STR基因座等位基因频率分布(n=347)Tab 2 The allele frequencies of 19 STR loci in Ningxia Han population(n=347)
(续表2)
应用Powerstats软件对数据进行分析处理,宁夏地区汉族人群19个STR基因座的Pm在0.032~0.186 之间,DP在0.814~0.986之间, PE在0.330 ~0.770之间,亲权指数(paternity index,PI)在1.360~5.260 之间,PIC在0.590~0.920之间,He在0.631~0.905 之间。这19个STR基因座之间无连锁遗传关系。提示这19个STR对宁夏地区汉族在法医学中的亲子鉴定和个人识别具有较高应用价值(表3)。
表3 宁夏地区汉族人群19个STR基因座的法医参数(n=347)Tab 3 Forensic parameters of 19 STR loci in Ningxia Han population(n=347)
He:Expected heterozyogosity;PE:Power of exclusion;Pm:Probability match;DP:Power of discrimination;PIC:Polymorphism information content;PI:Paternity index
本研究采用 GoldeneyeTM20A 试剂盒对宁夏汉族群体19个STR基因座遗传多态性进行了分析。GoldeneyeTM20A复合STR检测系统由19个STR基因座和1个判定性别的牙釉基因构成,包含了中国国家DNA数据库(National DNA database,NDNAD)所选用的这些试剂盒中的全部STR基因座,在数据库信息检索时,可实现对同一样本数据中更多STR分型信息的比对,提高了数据库检索的兼容性和准确性。同时,使用更多的STR基因座,也意味着更高的多态性和法医学鉴别能力[5]。
目前,国内已有对不同地区、不同民族人群STR基因座基因频率的相关研究分析的报道,这些研究结果显示,在不同地区人群间相同STR基因座等位基因频率分布存在一定差异。如胡利平等[6]报道20个STR基因座(较本研究多了D1S656)在国内不同人群的分布存在差异。陈雁等[7]对比了所检测的相同STR基因座(D19S433、D5S818、 D21S11、 D18S51、 D6S1043、 D3S1358、D13S317、D7S820、D16S539、CSF1PO、Penta D、vWA、D8S1179、TPOX、Penta E、TH01、D12S391、D2S1338、FGA)的等位基因频率,结果显示浙江汉族人群与广东地区汉族人群[8]、新加坡华人[9]、东北地区汉族人群[10]之间的上述等位基因频率的差异均有统计学意义(P<0.05);浙江人群与华东地区汉族人群[11]之间除TPOX外其余基因座差异具有统计学意义(P<0.05)。还有研究显示浙江汉族人群和华南地区在STR D18S51、PentaE、D5S818、D16S539、PentaD、TPOX、FGA这7个基因座的基因频率分布差异具有统计学意义[12];云南汉族人群[13]15个STR本研究中除了D6S1043、Penta D、Penta E、D12S391)基因座与广州[14]、台湾[15]、河南[16]、济南[17]、新疆[18]、辽宁[19]地区汉族人群相比,D21S11、vWA、TPOX、FGA、D5S818的等位基因频率分布差异具有统计学意义。所以,获取不同地区和民族STR位点基因座等位基因频率是非常必要的。
本研究结果显示宁夏汉族人群19个STR基因座上共检出120个等位基因、775种基因型,等位基因频率分布范围在0.001至0.503。基因型频率最高的是D12S391,最低的是Penta E。通过对宁夏地区汉族与屈晓斌等[20]研究的江苏汉族人18个STR基因座CSF1PO、D3S1358、D5S818、D7S820、D8S1179、D13S317、D16S539、D19S433、D21S11、FGA、TH01、TPOX、vWA、D2S1338、D6S1043、Penta D、Penta E、D12S391等位基因频率的分布差异进行比较,结果显示TH01(P=0.002)、D3S1358(P=0.021)、D21S11(P=0.015)、Panta D(P=0.01)、D7S820(P=0.029)的等位基因频率差异具有统计学意义。
一般认为,PIC>0.5时,说明该标记可提供较高的信息量。结果显示(表2)宁夏汉族人群的PIC在0.590~0.920之间。DP和PE 则反映了该遗传标记在法医学个体识别及亲权鉴定中的能力。通常情况下,当DP>0.8、He>0.7、PIC>0.7、PE>0.5时,说明标记物是高度多态性的遗传标记,具有极高的应用价值[21-22]。宁夏汉族人群的DP在 0.814~0.986之间,He在 0.631~0.905之间,PE 在0.330 ~0.770之间,除TH01、TPOX、D3S1358外,其余位点均显示出高度鉴别力、高杂合度,可联合应用于亲权鉴定。因此,本研究所选取的19个STR基因座属于宁夏汉族人群中高鉴别能力、高杂合度、高信息量的STR的基因座。