孟 孟,张轶轮,李 敏,刘二珍,刘照俊,李成涛,沈星辉,边英男
(1.哈尔滨医科大学 组织学与胚胎学教研室,黑龙江 哈尔滨 150081;2.司法鉴定科学研究院 上海市法医学重点实验室 上海市司法鉴定专业技术服务平台,上海 200063;3.内蒙古科技大学 包头医学院,内蒙古 包头 0140603; 4.四川大学 华西基础医学与法医学院,四川 成都 610041)
在Y 染色体上,除位于两端的一小段拟常染色区(pseudoautosomal region, PAR)外,约95%的区域在减数分裂过程中不与X 染色体发生重组,因此称为非重组区(non-recombining Y,NRY)或Y 特异性区(male-specific region,MSY),这些非重组区会一代一代由父亲遗传给儿子,具有高度的保守性和特异性[1]。基于这种特殊的遗传方式,人类Y 染色体的多种遗传标记被广泛应用于与男性相关的司法实践中,如男女混合斑检验、男性家系排查、大规模灾难受害者的身份识别,以及父系溯源等,具有重要的法医学应用价值[2]。
Y 染色体上有五类多态性遗传标记,其中短串联重复序列(short tandem repeats,STR)和单核苷酸多态性(single nucleotide polymorphism, SNP)是目前法医学中被广泛应用的两类遗传标记[3-4]。Y-STRs 是由2~6 个碱基作为核心区域串联重复形成的一类具有长度多态性的DNA 序列, 重复次数基本在6~40 之间。核心区域的碱基结构和重复次数不同构成了Y-STRs 的遗传多态性。 Y-SNPs 是基因组中特定部位单个碱基序列的变异而引起的DNA 序列多态性,表现为二等位基因、三等位基因或四等位基因,以二等位基因最常见,应用最广。 Y-SNP 与YSTRs 相比具有极低的突变率(约为1/3×10-8),并且几乎不会出现回复突变[5]。Y-SNPs 具有迭代累加的特性, 如当一个父系祖先的SNP 位点上发生了A突变,那么这个祖先的所有男性后代的SNP 位点上都会保留A 突变,若这个群体中的某一个体的SNP位点又发生了B 突变,则这一个体的所有男性后代将同时具有A 和B 突变。 Y-SNPs 上发生的突变随着人类的迁移和繁衍, 逐渐扩散到世界的各个区域,这些突变遵循时间顺序,因此Y-SNPs 可用来推断共同父系生物地理祖先,追溯人类父系进化史[6]。基于Y-STRs 和Y-SNPs 的遗传特点,本文将从混合斑检测、亲权鉴定、家系排查、个体识别及族源推断这五个方面介绍Y 染色体在法医学的应用。
Y 染色体在强奸案中混合斑男性成分的检测,轮奸案中不同男性个体混合物的分析及少精子或无精子的混合斑中DNA 检测具有重要作用[7]。 常染色体STR 由于易于分型及信息量丰富而被率先用于混合取证样品的DNA 分析[8]。然而常染色体DNA分析存在以下弊端:(1)当分析混合有不同体液的样本,如精液-阴道分泌物混合斑,唾液-阴道分泌物混合斑及其他同时含有男女DNA 成分的混合斑时,使用常染色体STR 分析常常不能得到完好的分型结果[9-11];(2)当混合斑中男性精子远低于女性阴道上皮细胞成分时(比例为1∶25~1∶50),由于PCR的优势扩增,常染色体STR 分型技术往往会掩盖男性DNA,因此只能检测到女性成分[12];(3)当精液样本老化(取材时间>48 h)、精子拷贝数低、生物证据样本发生污染或降解时亦无法获得完整的常染色体STR 分型[13]。 Y 染色体特异性DNA 标记为男性所特有,PRINZ 等[14]报道了即使男女成分比例为1 ∶2 000 时,Y-STR 分型也不会受女性阴道上皮细胞的干扰。HANSON 等[15]开发了一种称为Y 染色体靶向预扩增(Y-TPA)的系统,该系统通过巢式PCR方法预扩增多个Y-STR 基因座,扩增产物再通过使用市售的第二代Y-STR 扩增试剂盒如AmpFlSTR〇RYfiler〇RPlus kit 或PowerPlex〇RY23 System 进 一 步扩增,能从性交6~9 d 后收集的样本中检测到YSTRs 分型结果。
此外,Y-STR 分型在生物学上未检测到精子的性侵犯案件(手指插入或阴茎插入但犯罪者为少精症或无精症)中也能检出阳性结果。 2012 年,TRABUIO[16]使用Yfiler 试剂盒检测在手指插入和阴茎插入但没有检测到精子的外阴拭子中,发现大约三分之一的外阴拭子产生阳性结果(3~17 个等位基因)。 在阴茎插入12 h 内采集的外阴拭子中大约40%可检出六个或更多等位基因的Y-STR 谱,但在12 h 和24 h 之间检测的三个样品中只有一个成功获得类似的分型结果。 该研究结果认为,在类似的性侵案件中,应在性侵发生后的12 h 内采集外阴拭子样本。 2015 年,MCDONALD 等[17]用Yfiler 试剂盒检测来自47 例手指和/或阴茎插入案件的样本,而这些案件均是在事件发生后48 h 内进行的体检,并且在精子洗脱后未检测到精子。 在这些样本中,30%至少产生一个Y-STR 分型, 每个分型包含三个或更多的等位基因,21%至少产生一个Y-STR分型,每个分型包含十个或更多的等位基因。 这项研究将该类案件中采集样本的建议时限从12 h 增加至48 h[18]。
通过Y-STR 分型技术可以从混合斑中鉴定男性成分,同时对于多个体来源的混合斑的个体识别,亦有明显的使用价值。 有研究报道通过将常染色体试 剂 盒AmpFℓSTR〇RNGMSElectTM分 别 与 包 含23位点的Y-STR 试剂盒PowerPlex Y23 和17 位点的Yfiler 试剂盒结合分析的方法,发现Y-STR 分型结果为最终结果的判定增加了高达21%的额外信息量,使用Y 染色体分析检测到多个男性成分的可能性大约是仅仅使用常染色体STR 分析的三倍[19]。 类似的结果在PURRS 等[20]的一项研究中也报道过。2014 年,HAN 等[21]报道采用激光捕获显微切片技术(LCM)和低体积PCR 技术(LV-PCR)可以实现对3供体来源的精子进行分离和检测。
亲权鉴定是指利用人类基因组中具有多态性的遗传标记,对两份或多份检材的身源者是否存在某种亲缘关系进行鉴定。常染色体STR 基因座是目前亲权鉴定运用最广泛的遗传标记[22],而Y-STR 基因座的差异可以证明非亲子关系,具有比常染色体基因座更高的排除概率[23]。 例如要判断一男孩与其已死亡的假定父亲是否有血缘关系,由于无法获得该假定父亲的遗传信息,则无法通过常染色体检测来做父权鉴定,此时只要获得该父亲的任一男性亲属的Y 染色体STR 分型,就可以判断该男孩与该死亡假定父亲的亲缘关系。这是因为Y 染色体呈绝对的单倍型遗传,那么该假定父亲与其男性亲属享有共同的单倍型,进而通过鉴定Y-STR 单倍型是否匹配来判断该男孩与该已亡父亲的生物学关系[24-25]。由于Y 染色体独特的父系遗传的方式,可在某些亲权鉴定或其他父系血缘关系的鉴定中作为补充鉴定的遗传标记使用[26-27]。 一个三联体鉴定的案例报道表明,当出现1~2 个常染色体基因座不符合遗传规律时,若被检胎儿为男性,而此时又能确定该被检父与孩子的生父来自不同父系,应尽可能增加Y-STR 的检验[28]。 在另一例全同胞兄弟关系涉及同一父系鉴定的案例表明,通过常染色检测计算出的累积全同胞关系指数即使达到认定标准,亦可通过增加检测Y-STR 而使结论更可靠,若YSTR 检测有分型不一致的基因座,可进一步检测Y-SNP 而判断其是否来自同一家系[29]。 总之,补充检测Y- SNP 同样能够为亲权鉴定提供有效信息。
家系排查是指将从案发现场提取的生物检材中获得的嫌疑人的Y-STR 分型与某一地区的YSTR 数据库进行比对,找到与嫌疑人存在亲缘关系的家系。人类Y 染色体为男性特有,呈父系、连锁单倍型遗传, 故同一家族中男性个体的Y-STR 分型结果理论上完全一致(除非突变),这使Y-STR 家系排查法在众多重大案件侦破中彰显了其独特价值。2016 年,我国警方就是通过Y-STR 单倍型进行家系排查成功破获特大连环谋杀案-白银案[30]。 目前,全国多个省市、地区,已经建立一定规模的YSTR 数据库。 然而,Y-STR 基因座的突变给家系排查带来问题,特别是当前检验的Y-STR 基因座数量日益增多,并且包含较多高突变率Y-STR 基因座的情况下更易凸显。
Y-STR 基因座突变率不同,常用的Y-STR 基因座的突变率多在2‰~3‰左右。 2010 年,BALLANTYNE 等[31]对186 个Y-STR 基因座进行了研究,在2 000 多对父子样本共352 999 次减数分裂中,共观测到在120 个基因座上的924 次突变,得出所有基因座每代的突变率变化范围从3.78×10-4到7.44×10-2。 张广峰等[32]比较了三种不同的Y-STR 分型体系(Yfiler、Y filerR〇Plus、快速突变Y-STRs)在家系遗传过程中所展现出的变异程度,家系中两名男性个体相隔10 次减数分裂时,其中Yfiler、Y filerR〇Plus、快速突变Y-STR 单倍型不一致的概率分别为7.35 %、91.2 %、100 %。 结果显示同一家系不同男性个体的Y-STR 单倍型具有一定的多样性,并且与Y-STR 单倍型包含的基因座数量和基因座突变率有关。 这提示包含不同Y-STR 基因座组合的Y-STR 单倍型在世代遗传过程中的变化程度差异较大,在亲权鉴定和家系排查过程中, 检测到的Y-STR 分型体系中若包含快速突变基因座时,应注意其发生突变的情况,有时还会存在两步甚至多步突变,因此不要轻易认定其来自不同家系。
插入/缺失(Insertion/Deletion,InDel)和SNP 为二等位基因,具有扩增片段短、突变率低的优点,然而大部分SNP 分型技术对设备要求较高,耗费较大,刘亚举等[33]建议将Y 染色体InDel 位点和YSTR 融合为同一荧光复合扩增系统,以此来规避家系排查中Y-STR 突变的问题。 为了满足国内Y染色体数据库建设规范和需求,各公司纷纷推出针对中国人群的试剂盒。 阅微基因推出了一款MicroreaderTMY Prime Plus ID System[34],该试剂盒利用成熟的6 色荧光标记技术,对37 个常用Y 染色体STR 基因座、1 个国人特有的Y-Indel 进行复合扩增。 2018 年,Thermo Fisher 公司推出了一款新型Y 染色体建库试剂盒-Yfiler Platinum PCR 扩增试剂盒[35]。 该试剂盒包含38 个Y-STR 和3 个适合中国人群的Y-Indel,单倍型识别能力更高。3 个YIndel 位点可以帮助进行初步筛选,在家系调查中,3个Y-Indel 位点如果有一个不匹配,就可以判断这两个图谱来自不同家系,这个结果也可以用来检查家系调查是否准确。 如果3 个Y-Indel 均相同,接下来就可以通过其他Y-STR 位点进行进一步筛选。LIU 等[36]基于我国国内的Y-STR 数据库进行分析,建议对于Yfiler 试剂盒检测出的不匹配基因座个数,小于等于2 时认为两名个体来源于同一家系的可能性大;对于YfilerR〇Plus 试剂盒检测出不匹配基因座的数目小于等于4 时,认为这两个图谱有较大可能来自于同一家系。
综上,利用Y-STR 基因座进行父系亲权鉴定和男性嫌疑人的家系排查,当Y 染色体基因分型并不完全一致时,即使有2 个Y-STR 基因座分型不同,也不要轻易排除其来源于同一父系家系的可能[37]。Y-STR 家系排查法能有效缩小案件排查范围,但并不能实现个体识别,对罪犯的最终确定还要运用常染色体STR 检测,同时可通过ABO 血型等多种方法综合判断[38]。
现主流商业Y-STR 试剂盒有AmpFLSTRR〇YfilerR〇PCR Amplification PCR 扩增试剂盒,GoldeneyeR〇DNA 身份鉴定系统30Y 等。然而这些Y 染色体试剂盒在属于同一父系的个体间的区分能力上存在局限性。 BALLANTYNE 等[31]在2010 年集中观察了186 个Y-STR 基因座的突变率,将13 个突变率(11.9‰~77.3‰)明显高于其他的基因座(DYF387S1,DYF399S1,DYF403S1a/b,DYF404S1,DYS449,DYS 518,DYS526b,DYS547,DYS570,DYS576,DYS612,DYS626和DYS627)命名为快速突变Y-STRs(Rapid-Mutating Y-STRs, RM Y-STRs)基因座。其中93%的Y-STRs 突变率在1×10-4和1×10-3之间,而RM Y-STRs 突变率多在1.19×10-2和7.73×10-2之间。2012 年,BALLANTYNE 等[39]对604 个来自全球51个人群的无关男性样本进行分析,区分开98.5%的男性,同时证明了RM Y-STR 能够提供更高的单倍型多样性和分辨能力(全球604 个男性中仅8 个男性共享了3 种单倍型),而在此样本中用含有17 个Y-STR 的Yfiler 试剂盒检测时,结果为85 个男性共享33 个单倍型。 2014 年,BALLANTYNE 等[40]用13 个RM Y-STR 对超过2 500 对父子对进行个体鉴别,鉴别率可达到29%。2016 年,ADNAN 等[41]收集了572 名属于99 个2~4 代家系的巴基斯坦男性样本,45%的二阶亲属(祖孙、叔侄、半同胞)等可以被13 个RM Y-STR 标记中的一个或多个进行区分,而Yfiler 试剂盒对应的区分力则为14.7%。 同年,我国ZHANG 等[42]用13 个RM Y-STR 成功将1 034 个父子对中的18.96%区别开。
由此可见,RM Y-STR 提高了同一父系遗传男性个体间的区分能力。 据此,RM Y-STR 组合无论在多态性还是个体识别能力方面均明显强于目前常用的Yfiler 系统。 2016年,Thermo Fisher Scientific 公司[43]推出了27 个基因座的Yfiler〇RPlus 六色荧光标记复合扩增试剂盒, 其中加入了7 个快速突变的Y-STR基 因 座(DYF387S1a/b,DYS449,DYS518,DYS570,DYS576,DYS627)。 OLOFSON 等[44]用Yfiler〇RPlus试剂盒检测551 名男性样本并与Yfiler 试剂盒作比较,由于引入了7 个快速突变基因座,具有更高的个人识别能力,而由于RM Y-STR 基因座突变率较高,对亲缘关系的鉴定上Yfiler〇RPlus 试剂盒的效能就相对较弱。 Y-SNP 由于扩增片段短, 在降解DNA 中亦可获得较完整分型,故将Y-SNP 与YSTR 分型结果结合,可应用在来自不同地理区域的人员参与的大规模灾难如飞机坠毁、海啸或恐怖袭击的个体识别案件中[45]。
Y 染色体由于其严格的父系遗传特性而被认为是研究全球男性智人的迁徙历史的最佳来源[6]。如前所述,与常染色体和X 染色体不同,Y 染色体95 %非重组区的信息能完整保存并遗传给下一代[46]。 在人类进化中,一些稳定的突变如Y-SNP 在Y 染色体上累积,并且由于其非重组特征而永久连锁遗传。 因此,这些突变可用来追溯后代的共同父系祖先。 如果在某些雄性个体中发现相同的突变,这些突变就构成了一种单倍型[47]。 群体之间差异最大的遗传物质是Y 染色体单倍群,全世界的Y 染色体单倍群构成了一个划分不同人群的谱系[48]。 目前,人类学及考古学等不同领域研究人类起源、人口的迁移路线及混合比例中均存在一些一致性看法,例如三类基因组(常染色体、线粒体和Y 染色体)均指出,现代人起源于东非[49-51]。同时,从Y 染色体单倍群也可以看到非洲国家的高单倍型多样性[52-53]。
2002 年,国际Y 染色体命名委员会(Y Chromosome Consortium, YCC)发表了第一个统一命名的系统发育染色体图。2003 年,Y-DNA 系统发育图出现在Mark A. Jobling 和Chris Tyler-Smith 的文章上[6]。该系统发育图以245 个Y-SNP 为基础,展示了153个单倍群之间的关系,并把全世界的Y-SNP 类型分为代号为A-T 的20 种主干单倍群,Y 染色体的根部类群是A 型,仅存在于非洲,其次是B 型,也在非洲,C 以后的单倍群(C-T)是从B 分化出来的[6]。所以从Y 染色体看,现代人起源于非洲。 2005 年,家谱DNA 公司创建了Y 染色体系统发育树。同年,国际基因家谱学会(ISOGG,https∶//isogg.org/tree/index.html)成立,其创建的Y 染色体树的列表可以通过上传数据后而不断被更新。 2008 年,KARAFET等[54]报道了一个修订的Y 染色体树,含有600 个Y-SNP 标记,包含311 个不同的单倍群。2011年,ZHONG 等[55]和YAN 等[56]指出O-M175、C-M130、D-M174 和N-M231 是东亚4 个主要单倍群,约占东亚全部男性的93%。 而O-M175 是东亚最大的单倍群,近75%的中国人及超过50%的日本人都可以归到这一类型下,O1a-M119、O2-M268 及O3-M122 是O-M175 分出3 个主要的下游单倍群。 随着Y 染色体树的不断更新和修订,2018 年,O2-M268 和O3-M122 在ISOGG 中分别被修正为O1b和O2[57]。
自20 世纪90 年代以来,人类学界争论最激烈的话题是东亚地区现代人的起源问题。 2001 年,KE等[58]对来自东南亚、大洋洲、西伯利亚和中亚的163个人群的12 127 例男性样本进行了3 个Y-SNP 的突变检测:YAP(Alu 序列插入)、M89(C→T 突变)、M130(C→T 突变)。 结果显示一万多分样品都携带的这3 种突变型中的一个。 而这3 个突变型均来自约3.5 ~8.9 万年前起源于非洲的另一个突变-M168T[59]。从父系角度看,现存的东亚人群都是走出非洲的后裔,是支持现代人非洲单一起源的强有力的遗传证据。 现代人到达东亚后的迁徙路线也是当时的研究热点之一。 1999 年,SU 等[60]通过19 个YSNP 来研究东亚人群,研究结果显示东亚南方人群比北方人群的多态性更加显著,北方人群只拥有南方人群单倍型的子集,认为东亚地区现代人起源于非洲,而后从南方进入东亚,迁移至北方。 2005 年,SHI 等[61]对东亚多个O3 样本进行了更系统的研究,也发现南方群体中的O3-M122 的多样性高于北方,支持O3-M122 的南方起源。2006 年,XUE 等[62]使用贝叶斯全似然法对中国、蒙古、韩国和日本的27 个群体近1 000 份样本的45 个Y-SNP 和16 个Y-STR 位点进行分析, 发现东亚北方群体的基因多样性要高于南方。 但SHI 等[63]认为这种北方高于南方的多样性是由于近期的人群混合所造成,同时由于长期地理隔离所造成的群体内部的瓶颈效应对基因多样性的估算也有较大影响。
目前广泛使用的专用Y-SNP 基因分型方法,主要基于毛细管电泳和SNaPshot 单碱基延伸原理,仅能够对数十个SNP 进行平行分析[64-65]。 有很多报道使用PCR 扩增开发了几种多重基因分型系统以确定Y-SNP 单倍群[66-67]。 然而,除了程序耗时,分析基因座的数量也是有限的,从而限制了Y-SNP 单倍群树的分辨率。 基于大规模平行测序(massively parallel sequencing,MPS )的下一代测序(next generation sequencing,NGS )技术具有从多个样品中对数百至数千个SNP 进行基因分型的能力,在单个实验运行中具有高覆盖度[68]。 迄今为止,两种主要的NGS 系 统,Ion Personal Genome Machine (PGM)(Thermo Fisher Scientific Inc., Waltham, MA, USA)和MiSeq (Illumina Inc., San Diego, CA, USA)普遍分布于法医实验室[69-70]。MPS 通过有限的DNA 资源实现高分辨率Y 染色体单倍群划分,成为了人类法医学研究的新宠儿。 2015 年,RALF 等[71]利用Ion Torrent PGM 平台对530 个Y-SNP 进行平行基因分型,该平台能够对432 个全球Y 单倍群进行分类,涵盖了整个Y 树的分支。 2017 年,QIAN 等[72]和GAO 等[73]将二代测序(NGS)、毛细管电泳和焦磷酸测序技术结合为“NGS+”,设计了针对中国人群的74Y-SNP MPS 系统, 将100 个来自四川汉族人群区分到18 个单倍群,这个新的Y-SNP 单倍群树几乎涵盖所有中国Y 单倍群,可用于中国人群的单倍群划分。 课题组同时开发了一种新数据驱动决策规则-FSindex, 用于估计每个检索到的谱系的可能性, 并能够从错配的Y-STR 单倍型中正确鉴定谱系。 2018 年,WANG M 等[74]又根据之前的研究设计了一个包括165 个Y-SNP 的MPS 系统,用ION S5 XL 系统分析了测序性能、灵敏度及基于MPS-SNP对案例类型样本的分析能力。 结果显示,只有4 个Y-SNP 呈现缺失的基因型, 并且5 个SNP 倾向于被指定为杂合子,而其他SNP 的结果与从其他YSNP 分型工具获得的结果完全一致。 这个MPS YSNP 系统提供了一个便捷的从样本到单倍群的工作流程, 有利于父系谱系分类和法医谱系搜索,为MPS 技术在SNP 分析中的应用提供了支持。
Y 染色体遗传标记由于其独特的遗传特性而在法医实践中具有很大的应用潜力。 同时,Y 染色体遗传标记亦面临着现实的挑战,比如家系排查过程中,由于STR 和SNP 复合单倍型仍处于前期探索阶段,其准确率在不同研究中有较大的差异,因此要应用于实践仍需针对特定的区域和人群做详细的研究,从而推进STR 和SNP 复合单倍型进一步解决家系精准定位的问题。随着Y 染色体单倍群进化树将不断被完善,将人类学研究中的族源推断应用于司法实践中,可为缩小嫌疑人的排查范围提供线索。 此外,多拷贝Y-STR、新型Y 染色体遗传标记的筛选、混合斑男性成分的检测,不同男性个体混合物的分析等相关研究都是目前法医学研究上的热点,这些方向的研究进展也将极大促进其在司法实践中的应用。