林琳,蒋欢畅,任苹,吴淑珍
温州医科大学,浙江 温州 325035,1.司法鉴定中心;2.第一临床医学院(信息与工程学院)
短串联重复序列(short tandem repeats, STR)是一种重要的遗传标记,因其具有高度遗传多态性和个体识别能力强、非父排除率高等特点,已广泛应用于法医物证DNA鉴定领域。STR基因座在遗传过程中发生变异的概率较高,因为遗传漂变,不同地区人群的常染色体STR基因座突变分布存在一定的差异。国内外对不同地区人群中有关STR基因座等位基因突变的情况均有相关报道[1-4]。本研究通过对温州地区人群进行大量样本检测,对目前常用的AGCU EX22检测系统中观察到的STR基因座突变规律及其特征进行统计分析,为温州地区人群的法医学亲权鉴定、DNA寻亲数据库建设与应用等提供基础研究数据。
1.1 一般资料 日常检案积累、支持亲权关系的温州地区人群案件共计9 418例,样本类型有血斑、唾液斑、带毛囊的毛发、组织等。其中父母子21 200个样本均来自本实验室,其中父母子三联体2 364例,父子二联体4 578例,母子二联体2 476例。
1.2 仪器与试剂 96孔Veriti PCR扩增仪、3500遗传分析仪(美国AB公司);AGCU EX22、AGCU 21+1、AGCU X19和AGCU Database Y24试剂盒(无锡中德美联生物技术有限公司);SifaSTRTM23 plex 试剂盒(司法部司法鉴定科学技术研究院)。
1.3 DNA提取和STR多态性检测 用聚苯乙烯二乙烯基苯树脂(chelex)法提取所有检材DNA,采用人类荧光标记STR复合扩增检测试剂对检材DNA进行复合PCR扩增,阳性对照用试剂盒提供的9947A,阴性对照用纯水代替样本DNA;用3500遗传分析仪对扩增产物电泳分型检测;采用GeneMapper ID-X 1.5软件对分型结果进行基因型分析。
1.4 突变观察 观察样本基因型的突变情况,主要是确定突变基因座、突变来源、突变步数以及发生突变等位基因的片段大小。
1.4.1 突变基因座的确定:①用AGCU EX22试剂盒对同一案例的相关样本检材进行检测,若亲代和子代之间21个STR基因座中检出1~2个基因座不符合孟德尔遗传定律,则用AGCU 21+1试剂盒增加检测,同时用AGCU X19或AGCU Database Y24试剂盒作为辅助检测;②若亲代和子代间没有出现新的不符合遗传规律的矛盾基因座,并且累积亲权指数(cumulative paternity index, CPI)大于10 000,作为辅助检测的性染色体的X-STR或Y-STR基因座检测数据也不出现新的矛盾基因座,则将这1~2个不符合孟德尔遗传定律的基因座视为突变基因座。对于亲代和子代均为纯合子的疑似突变基因座,换用其他试剂盒(如SifaSTRTM23 plex)进行复核检测,以排除是否是杂合子的一个等位基因丢失为假纯合子,并验证分型。
1.4.2 突变步数的确定:突变步数即亲代和子代在遗传过程中STR重复序列中重复单位的增加或减少个数,每增加或减少一个重复单位,则判为突变增加或减少一步。
1.4.3 突变来源的确定:STR等位基因突变表现为重复单位的增加或减少。将子代的突变等位基因与同一基因座中的父源和母源的两个等位基因比较,步数相差最小的等位基因是发生突变的等位基因。若被检父和被检母同一基因座的等位基因和子代的突变等位基因相差的步数相同,则判为突变来源不明,即突变有可能来自父源,也有可能来自母源;若被检父或被检母的基因型为杂合子,同一基因座的两个等位基因和子代的突变等位基因相差的步数相同,则同样判为突变来源不明,即突变有可能来源于杂合子的其中一个等位基因,也有可能来源于杂合子的另外一个等位基因[5]。短、中、长等位基因的确定:按STR重复序列中重复单位的重复次数的多少,将每个基因座等位基因从小到大排列,将排列在前面25%、中间50%和后面25%的等位基因依次判断为短片段等位基因、中片段等位基因和长片段等位基因[6-8]。
1.5 统计学处理方法 采用SPSS17.0软件进行统计学分析。计数资料用频数或百分比表示,组间比较用χ2检验。P<0.05为差异有统计学意义。
2.1 一般资料 收集的9 418例支持亲权关系的案例中,共观察到11 782次减数分裂,其中有314例发生了突变(共计319次突变事件)。突变案例中,173例来自父子二联体样本(174次突变事件);31例来自母子二联体样本(31次突变事件);110例来自父母子三联体样本(114次突变事件),其中89次是父系突变,24次是母系突变,还有1次突变不能确定突变来源。突变案例中有309例只有单个基因座发生突变,其他5例则存在2个基因座同时突变。2个基因座同时突变的情况见表1。第1、第2、第3、第4号案例存在父源性两个基因座同时突变;第5号案例2个突变基因座中的D6S1043基因座为父源性突变,而FGA基因座的突变来源无法确定,可能来自父方,也可能来自母方。
表1 2个基因座同时突变的情况
2.2 21个STR基因座的突变率 21个基因座突变率范围为0~3.48‰,平均突变率为1.35‰。D12S391基因座的突变率最高,达到3.48%;TPOX基因座的突变率最低,没有观察到突变;除Penta E、D21S11、D6S1043、D12S391、FGA基因座外,其余16个基因座的突变率均小于2‰。各基因座突变率差异无统计学意义(χ2=29.77,P>0.05),见表2。
表2 21个STR基因座的突变次数和突变率情况
2.3 21个STR基因座的突变来源 263次突变事件来源于父系,55次突变事件来源于母系,还有1次突变事件不能确定来源。父源突变与母源突变的比例为4.78∶1。父源等位基因发生突变的概率总体上大于母源等位基因发生突变的概率,差异有统计学意义(t=4.55,P<0.05),见表3。
表3 21个STR基因座的突变来源(次)
2.4 21个STR基因座的突变来源与重复单位的增减方向 来自父源的263次突变事件中,88次突变事件表现为重复单位的增加,115次突变事件表现为重复单位的减少,60次突变事件不能确定重复单位的增减方向;在来自母源的55次突变事件中,20次突变事件表现为重复单位的增加,24次突变事件表现为重复单位的减少,11次突变事件不能确定重复单位的增减方向。父源突变与母源突变出现重复单位增加、减少与不确定3种频次的差异无统计学意义(χ2=0.28,P>0.05),见表4。
表4 21个STR基因座的突变来源与重复单位的增减方向(次)
2.5 突变步数与重复单位的增减方向 本研究319次突变事件的突变步数范围为一至四步,一步突变有308次(96.55%),二步突变有7次(2.19%);三步突变有1次(0.31%),见图1;四步突变有2次(0.63%),见图2、图3。有108次突变事件表现为DNA重复单位增加,有139次表现为重复单位减少,有72次不能明确重复单位增减方向。一步突变与二步及以上突变中出现的重复单位增加、减少与不确定3种频次的差异具有统计学意义(χ2=7.22,P<0.05),见表5。
表5 突变步数与重复单位的增减方向(次)
图1 用AGCU EX22试剂盒检测出的某案例D21S11基因座的三步突变
图2 用AGCU EX22试剂盒检测出的某案例D16S539基因座的四步突变
图3 用AGCU EX22试剂盒检测出的某案例D2S441基因座的四步突变
2.6 突变等位基因片段大小与重复单位增减方向 所有突变事件中7次发生在短片段等位基因,204次发生在中片段等位基因,79次发生在长片段等位基因,另外29次无法明确等位基因长度和位置,见表6。短、中、长片段等位基因突变出现的重复单位增加、减少与不确定3种频次的差异具有统计学意义(χ2=26.81,P<0.05)。
表6 突变等位基因片段大小与重复单位的增减方向(次)
2.7 基因座突变因素在寻亲DNA数据库自动比对中的应用 为了给温州地区的民间寻亲活动提供技术支持,本研究团队自主研发建设了一个寻亲DNA数据库。经过一段时间使用后,将寻亲DNA数据库软件升级,增加了对基因座突变因素的处理。升级后,对数据库内所有DNA数据进行自动比对,发现金某某与蔡某某疑似存在生物学母女关系,而两者仅有一个D8S1179基因座(本研究该基因座的突变率为0.93‰)存在一步突变的情况,见图4。增加检测其他的常染色体STR基因座(AGCU 21+1试剂盒)和X染色体STR基因座(AGCU X19试剂盒),都没有出现违反孟德尔遗传定律的矛盾基因座,见图5、图6。因此将D8S1179视为突变基因座,可以认为是亲代该基因座的等位基因12在遗传过程中发生一个重复单位的减少,为一步突变,子代表现为等位基因11,结论支持金某某为蔡某某的生物学母亲。
图4 用AGCU EX22试剂盒检测出的金某某与蔡某某D8S1179基因座的一步突变
图5 用AGCU 21+1试剂盒检测金某某与蔡某某的基因型
图6 用AGCU X19试剂盒检测金某某与蔡某某的X-STR基因型
3.1 突变率 本研究观察到的温州地区人群21个STR基因座的突变率范围在0~3.48‰,除Penta E、D21S11、D6S1043、D12S391、FGA基因座外,其余16个基因座的突变率均小于2‰,各基因座的突变率之间的差异不具有统计学意义。21个STR基因座的平均突变率为1.29‰,低于目前常用的平均突变率2‰[9],应结合各基因座的突变率计算亲权指数,得出的值更为科学[7]。
STR基因座的突变率与等位基因中基序的碱基结构和重复次数有关[10]。重复单位数目多的基因座长度较长,多态性一般较高,其突变率也较高[1,11]。 毕洁等[12]对20 723例亲子鉴定中19个STR基因座的北方汉族人群突变分析显示,Penta E基因座的突变率最高,TPOX基因座的突变率最低;而本研究观察到的突变率最高的是D12S391基因座,次高的是Penta E基因座,突变率最低的是TPOX基因座,说明不同地域人群的突变率情况有所不同。
李成涛等[13]研究表明,约100例父子或母子二联体亲权鉴定或50例三联体亲权鉴定就可能遇上1~2例等位基因突变。本研究团队研发了寻亲DNA数据库软件,用于寻亲亲子鉴定,后来在司法鉴定实践中将STR基因座的突变因素考虑进去,对软件进行升级,数据库成功检索到了一对母女,两者之间存在D8S1179一个常染色体STR基因座突变。本研究寻亲鉴定实践表明,常染色体STR基因座等位基因突变现象较为常见,在法医学亲权鉴定和DNA寻亲数据库建设中应引起注意,应考虑突变因素。
3.2 突变来源 由于精子的DNA在精原细胞成为精子前要经过多次复制,复制次数越多,产生滑动错配的机会就越多。在减数分裂过程中男性DNA复制的次数比女性要多,其次是精子染色体中碱基替换的累积比卵细胞快2倍[10],因而男性突变的机会要比女性高[2-3,14]。本研究314例突变发生的319次突变事件中,发现263次父源性突变,55次母源性突变,1次不能确定突变来源,父源、母源突变比率为4.78∶1,突变来源的差异与吴微微等[15]研究结果相接近。本研究父源突变与母源突变中出现重复单位增加和减少的情况差异无统计学意义。
3.3 基因突变 基因突变是生物体子代与亲代之间遗传基因发生改变的现象。本研究主要观察温州地区人群的21个STR基因座的基因突变现象,了解一定地域内一群能互相交配的个体的亲权鉴定常用STR基因座的突变率,便于与其他地区人群的基因突变现象进行比较。金璐璐等[16]、吴淑珍等[17]报道的温州地区汉族人群的常染色体STR基因座遗传多态性,是用数理统计的研究方法将获得的数据经过数学处理,得到这些STR基因座的等位基因分布频率、杂合度、匹配概率、个体识别力、多态信息含量、非父排除率、亲子关系指数等。本研究则从基因突变的角度研究STR基因座的突变率,丰富了温州地区人群的群体遗传学数据。