明天悦,蒋礼蓉,刘 京,畅晶晶,侯一平,张广峰,*,王 正,*
(1.四川大学华西基础医学与法医学院,成都 610041;2. 公安部物证鉴定中心,北京 100038)
Y染色体为近端着丝粒类属,为男性特有,其性别决定区域(sex-determining region of the Y,SRY)基因决定男性性别。Y染色体除两末端各有一小部分(约占5%)的拟常染色体区域(pseudoautosomal region,PAR)可与X染色体的相应区域发生重组外,其余区域均为非重组区(non-recombining Y,NRY)或称为男性特异性区(male-specific region,MSY)[1]。除发生突变之外,同一父系的男性个体拥有完全相同的NRY区域。Y染色体NRY单倍体遗传的特性,使其被广泛地应用于同男性相关的鉴定实践中,如父系亲权鉴定、家系排查、男女混合斑检验、大规模灾难受害者身份识别、人类迁徙模式探索等[2-5]。本文结合近年来Y染色体的研究进展、相关检测技术的发展及研究成果探讨Y染色体遗传标记在法医学领域的应用和前景。
Y染色体遗传标记主要包括卫星DNA、小卫星DNA、Alu插入元件、插入/缺失多态性(insertion/deletion polymorphism, InDel)、 短 串 联 重 复 序 列(short tandem repeat, STR)和单核苷酸多态性(single nucleotide polymorphism, SNP) 等。 其 中,Y-STR和Y-SNP是目前被广泛研究和应用于法庭科学的Y染色体遗传标记。通常情况下,Y-STR用于定义单倍型(haplotypes),而Y-SNP用于定义单倍群(haplogroups)[6]。Y-InDel相关研究现尚处于前期探索阶段。
Y-STR是一类具有长度多态性的DNA序列,由2~6个碱基作为核心区域串联重复形成。与常染色体STR基因座相比,大多数Y-STR基因座具有复杂的串联重复结构,常含有两种以上不同的重复单位,可同时存在恒定和可变两种重复序列[2]。由于Y染色体存在重复回文序列,某些Y-STR基因座就存在多个拷贝,即应用一对基因座特异性引物扩增时会产生多个PCR产物。这在多态性研究与应用等方面具有独特优势,但在基因座判读时却尤需谨慎[7]。位于NRY区的Y-STR作为一个整体遗传给子代,不同Y-STR基因座的等位基因组合称为单倍型。这种连锁遗传方式使Y-STR分析效能和个体识别能力有限,需要联合多个Y-STR基因座以获得更多的单倍型。近年来,随着Y-STR研究的深入,新的Y-STR基因座逐渐被发现及描述,并根据其应用价值被纳入到商品化检测试剂盒中[8-11]。
由于突变是造成同一父系男性个体间单倍型不一致的原因,Ballantyne等[12]通过父子对样本对186个Y-STR基因座的突变率进行了系统评估,根据突变率的不同将Y-STR基因座划分为三类:
1)快突变Y-STR(rapidly mutating Y-STR,RM Y-STR,突变率约10-2突变/代);
2)中等突变Y-STR(medium-mutating Y-STR,MM Y-STR,突变率约10-3突变/代);
3)慢突变Y-STR(slowly mutating Y-STR,SM Y-STR,突变率约10-4突变/代)。
同时他们还建议可根据应用方向选择相应突变率的Y-STR基因座:快突变Y-STR具有区分亲缘关系较近的男性个体的潜力,中等突变Y-STR适用于种群历史和谱系研究,而慢突变Y-STR则可用于进化研究。
和阿瓦达索命咒不同,我是真实存在于这个世界上的。就在今年,在上海举办的一场教育论坛上,德国波鸿鲁尔大学公布了一组数据,来自全世界11个国家的调查结果显示,未成年人的心理困难总分和心理疾病发病率在11岁时显著增加……在青少年学生心理健康水平研究中,一种名为“二年级魔咒”的现象引起了很多专家的关注。有调查表明,孩子们的心理健康状况在小学二年级、初中二年级、高中二年级,出现比较明显的转折和问题,尤其是初中二年级……
Y-SNP是Y染色体基因序列中特定部位由单个碱基序列变异而形成的DNA序列多态性,可表现为二等位基因、三等位基因或四等位基因标记,其中以二等位基因最为常见,应用也最为广泛[13]。与Y-STR相比,Y-SNP具有极低的突变率(约为10-9突变/代),且几乎不会出现回复突变。因此,当Y-STR分型不匹配时,Y-SNP就可作为有力补充,能降低错误排除同一家系的风险。
研究人员已经建立起强大且详尽的Y-SNP 系统发育树(https://isogg.org/tree/),其反映了有着共同父系祖先的现代人Y染色体非重组区的突变进程[14-17]。Y单倍群的分布具有明显的地域性和人群差异性[18],通过检测相关Y-SNP可推测生物检材的族群地域来源。此外,应用Y-SNP可对群体之间的主要差异情况进行有效估算,不仅在迁徙研究中能扮演重要角色,而且通过估算群体的最近共祖时间(the time to the most recent common ancestor,TMRCA)还可为预测祖先起源提供线索[19]。
插入缺失多态性(insertion/deletion polymorphism,InDel)是基因组中不同大小的DNA片段因插入或缺失突变所形成的二等位基因片段长度多态性遗传标记[20],具有低突变率、扩增片段小等优点。InDel在人类基因组中分布广泛,约7.2 kb就有一个InDel,其分布密度仅次于SNP。但研究发现性染色体上InDel的密集度低于常染色体[21]。目前,Y-InDel的研究处于起步阶段,主要作为性别鉴定的辅助标记物,例如rs76041101和rs199815934被用于STR试剂盒中以弥补Amelogenin基因座易丢失的不足[22]。
随着分子生物学方法及技术不断发展,与刑事侦查相关的DNA检测技术近年来也呈现多样化[23]。对于Y染色体遗传标记的检测无论是长度多态性、序列多态性还是复合检测能力都有进一步的探索与提升。
毛细管电泳技术(capillary electrophoresis,CE)通过在毛细管中注入特定浓度的聚合物溶液形成筛网状结构,变性后的DNA单链在毛细管中从阴极向阳极迁移,其电泳迁移率与其大小呈线性相关,在一定时间内移动的距离不同,从而达到分离的目的[24]。毛细管电泳是目前法庭科学DNA实验室不可或缺的平台和工具,主要包括Thermo Fisher Scientific的3500系列基因分析仪[25]和我国公安部第一研究所研制的GA118法医遗传分析仪[26]。STR和InDel遗传标记不同等位基因的碱基构成及长度不同,各组分所带电荷性质、电荷数量以及相对分子量不同,在同一电场力的作用下泳动的速率各异,小片段会先通过阳极端的激光扫描。DNA单链上的荧光染料被激发,发出特异波长的光,可被计算机获得此荧光强度并记录其通过检测窗口的时间。通过荧光信号判断该DNA来源的基因座,并与分子量内标电泳时间进行比较即可确定各DNA片段的长度,以及与等位基因分型标准物对比可确定等位基因。目前,许多国内外厂商提供了基于CE的Y-STR检测试剂盒,例如Thermo Fisher Scientific的Yfiler Plus PCR amplification kit、Promega的 PowerPlex Y23 System、阅微基因的Microreader Y Prime ID System和中德美联的AGCU Y37 kit等。但受限于荧光标记种类和检测片段范围,复合能力通常小于50个Y-STR基因座。
SNaPshot技术又称为微测序,是基于荧光标记单碱基延伸原理的分型技术,为一种以CE平台开发出的SNP分型方法。SNaPshot主要分为三步:
1)通过PCR扩增包含SNP的DNA片段,并使用ExoSap(核酸外切酶Exo和碱性磷酸酶SAP)消化掉单链引物和剩余的dNTPs;
2)加入紧靠SNP的延伸引物、荧光标记ddNTP混合物和聚合酶进行单碱基延伸反应;
多个研究小组设计开发了基于SNaPshot技术的Y-SNP分型体系用于群体迁徙、Y形态变异、人群遗传亚结构、生物地理祖先推断及族谱等项研究[27]。尽管可通过在引物5’末端加尾不同个数的核苷酸使每个延伸引物之间相差若干个碱基,从而实现复合多引物延伸反应,但同样受限于荧光种类和检测片段范围,复合能力往往在30个SNP左右。
新一代测序技术又称二代测序(second generation sequencing,SGS)、 下 一 代 测 序(next generation sequencing,NGS)或大规模并行测序(massively parallel sequencing,MPS),其核心思想是边合成边测序[23]。基于NGS技术的基因座识别是根据引物序列,可不受限于荧光染料种类,能同时对数百甚至数千个大小重叠的遗传标记进行检测;借助条形码Barcode技术可实现对多个样本并行测序。Illumina推出了基于DNA簇和可逆性末端终结的测序平台[28];Thermo Fisher Scientific发布了基于半导体离子流的Ion Torrent测序平台[29];华大基因研发了采用联合探针锚定聚合技术(cPAS)和改进的DNA纳米球(DNB)核心测序技术[30]。
经过10多年的发展,NGS技术在测序通量、读长、成本等方面不断突破,为法医学Y染色体遗传标记的研究提供了新契机。借助于NGS技术,Y-STR的序列多态性可进一步提高Y-STR单倍型的分辨率。Zhao等[31]率先使用NGS探索法医学Y-STR序列多态性,通过对13个Y-STR序列分析,发现6个Y-STR的等位基因数量得到提高。Shin等[32]对23个Y-STR测序分析也显示了类似的结果。杨凯润等[33]研发了包括52个单拷贝Y-STR基因座、6个二拷贝Y-STR基因座、1个三拷贝Y-STR基因座和1个性别基因座的男性家系精细化排查试剂盒STRSeqTyperY68;所有基因座的扩增子长度均在350 bp以下,为冷案降解检材提供了新检测体系。Ralfa等[34]和Wang等[35]分别设计了基于全球人群系谱和基于中国人群的高分辨Y单倍群分型体系,可同时检测859个和165个Y-SNP,为父源谱系鉴定和生物地理祖先推断提供了新的技术手段。Miao等[36]在BGISEQ-500平台上设计的STR联合SNP分析体系(含有37个Y-STR和34个Y-SNP)为Y染色体遗传标记的联合检测提供了新的思路。
牛津纳米孔测序(Oxford nanopore sequencing)使用溶血素作为核酸分子的纳米通道,通过判断核酸跨膜过程的电流变化从而实现测序过程。单链核酸分子在电场力驱动下穿过纳米尺寸的蛋白孔道;不同的碱基通过纳米孔道会产生与不同阻断程度和阻断时间相关联的电流信号,根据这些电流信号,就能识别每条核酸分子上的碱基信息,从而实现对单链核酸分子的测序[37]。纳米孔测序读长长(超过150 kb),速度快,数据可实时监控,仪器(MinION)也便于携带;但测序数据错误率相对高,NGS序列对比软件不适用,一定程度上阻碍了其在法医学领域的应用。Ren等[38]利用MinION对ForenSeq DNA Signature Prep Kit制备的文库进行测序,通过自主开发的生物信息学工作流程能对24个Y-STR基因座中的14个进行正确分型;Tytgat等[39]提出基于比对的分析方法结合参考数据库可显著提高分型准确性,然而,纳米孔测序在法医学领域目前仍处于探索阶段。
当Y染色体DNA分析结论为不能排除时意味着现场检材可能为嫌疑人所留,也可能源于同一父系下其他男性个体。因此,从随机匹配概率的角度Y染色体分析匹配的证据作用不如常染色体那么有意义;但Y染色体为男性特有的性质在法医学特定方向应用中具有明显的优势。
亲权鉴定指通过分析人类基因组中具有多态性的遗传标记,对两份或多份检材来源者可能存在的亲缘关系进行鉴定。与常染色体STR基因座相比,Y-STR基因座的差异可以确定非亲缘关系,具有更高的排除概率[40]。Y染色体NRY区独特的单倍型父系遗传特征,可为某些亲权鉴定或其他父系血缘关系鉴定提供有效信息。韩莉莉等[41]经对一例三联体鉴定检验,指出当有1~2个常染色体基因座不符合遗传规律而被检个体为男性时,可补充检验Y染色体遗传标记,以使鉴定结论更加准确可靠。汤美云等[42]通过在Y-STR基因座突变的全同胞兄弟鉴定中补充检验Y-SNP或Y-InDel,能有效避免Y-STR突变所导致的结果解释的困难,从而提高鉴定结论的把握度。王海生等[43]通过补充检测Y-STR分析父系遗传关系大大提高了群体性灾难事件死难者识别比对认定的准确性和效率。但由于Y染色体的遗传方式,其遗传标记的检测只是对亲权鉴定起到补充说明的作用,出具鉴定意见还需结合其他鉴定结果。
针对Y染色体的父系遗传特征,主流商品化Y-STR试剂盒设计初衷在于区别不同的父系。而同一家系的男性个体因具有相同的Y-STR单倍型(排除突变)则难以通过常规的Y-STR基因座进行区分。2010年,Ballantyne等[12]将13个突变率在1.19×10-2~7.73×10-2的Y-STR确定为快突变Y-STR,因其突变率较高从而具有更高的多态性,有望用于区分男性近亲属[44-45],他们使用该体系检测报道约66%的男性亲属可以被区分[46],进一步检测2 378对父子对后发现约27%的父子具有不同的单倍型[47],从而证实快突变Y-STR具有可以区分亲缘关系较近的男性个体的潜力。这13个快突变Y-STR在我国汉族[48]和彝族[49]的父子对中分辨率均达约19%。
快突变Y-STR用于区分男性近亲属已成为法医学研究热点,但因快突变Y-STR的数目有限,难以完全区分男性亲属个体。Ralf等[50]经进一步筛选及验证,设计出包含26个快突变Y-STR的RMplex。目前,快突变Y-STR基因座均为国外学者报道,随着群体和家系数据的不断验证,筛选出我国主要群体的快突变Y-STR基因座和建立相应的分型体系将能为有效区分男性近亲属提供技术手段。
通过搜索与现场物证具有相同或相似Y-STR分型的男性个体,可以缩小侦查范围,帮助指明案件的侦查方向。2016年,我国特大连环谋杀案——白银案就是警方通过Y-STR单倍型进行家系搜索得以成功破获的典型案例[51]。最近,针对一19年之久的冷案中,相关精斑检材出现明显降解,CE检测Y-STR基因座丢失较多的情况,张弛等[52]应用STRSeqTyperY68的短扩增子优势,成功检出了所有68个基因座分型并锁定嫌疑人所在家系,为侦破该冷案提供了有力技术支持。
目前常用于构建Y-STR数据库的试剂盒中部分基因座的突变率较高,同一家系男性个体之间可能因突变表现为不同的单倍型,从而干扰家系搜索,误导侦查方向[53]。若建库试剂盒中快突变Y-STR基因座较多,这种可能性发生的概率将随之增大。张广峰等[54]利用遗传关系清晰的大家系比较三种Y-STR分型体系(17个Y-STR 的Yfiler、27个Y-STR的Yfiler Plus和7个快突变Y-STR)在世代遗传过程中所出现变异程度的差异,证实同一家系不同男性个体的Y-STR单倍型不一致与包含的基因座和突变率有关,提示当分型体系中Y-STR个数较多或者含有快突变Y-STR基因座时, 排除家系尤需慎重。Liu等[55]根据大样本量(> 7 000)分析总结Yfiler和Yfiler Plus图谱中分别存在不多于2个不匹配Y-STR基因座或2步突变和4个Y-STR基因座不匹配或5步突变的情况下,倾向于判定为来源于同一家系。但这基于特定的Y-STR基因座,换用含有不同基因座的Y-STR试剂盒时,由于缺乏可信的纳入和排除标准,就可能导致错误排除因而阻碍家系搜索的进程。尚蕾等[56]建议在应用Y-STR开展家系排查时,以中等突变Y-STR或慢突变Y-STR作初步比对,再以快突变Y-STR进行精细比对并根据Y-STR突变类型的不同对判定标准加以调整。
相比于Y-STR基因座,Y-SNP突变率很低,同一家系男性个体因突变造成分型不一致的概率极低,因此可稳定反映父系谱系结构。但Y-SNP的分辨率较低,仅依靠Y-SNP进行家系搜索,难以达到理想的分辨率。Qian等[57]在犯罪现场检材Y-STR单倍型与当地参比家系均存在不匹配的情况下,增加检测139个Y-SNP,在同时考量Y-STR单倍型与Y-SNP单倍群频率的情况下,提出基于贝叶斯原理的家系搜索指数FSindex并成功锁定嫌疑人所在家系。在此基础上,Liu等[58]利用家系样本筛选验证出适用于中国人群体的9个慢突变Y-STR基因座(DYS593、DYS443、DYS645、DYS388、DYS531、DYS596、DYS426、DYS454和DYS455)联合Y-SNP辅助家系排查策略,并在汉族、黎族、回族、藏族群体中进行了效能验证。
混合斑是指包含两名或两名以上个体的混合生物检材,在法医案件常见于性犯罪案件中男性精液与女性受害者阴道液组成的混合斑,以及头发、皮肤、唾液、指甲或口腔脱落细胞等的混合物。Y染色体遗传标记为男性所特有,其对于混合斑男性生物成分的鉴定、不同男性个体混合物的分析和无精子或少精子混合斑中DNA的检测意义重大[59]。Hanson等[60]研发的Y染色体靶向预扩增系统,通过巢式PCR预扩增多个Y-STR基因座,其产物再通过商业化Y-STR试剂盒进一步扩增,最终能够从性交后6~9 d收集的样本中检测出Y-STR分型。McDonald等[61]研究表明Y-STR分型能够将生物学上无法检测到精子的性侵案件(犯罪者为少精症或无精症)检测出阳性结果,48 h内约有30%的样本至少产生1个Y-STR分型,但这类案件的外阴样本采集的时限尚未统一,仍需要更深入的研究。
Purps等[62]通过常染色体试剂盒NGMSElect分别与PowerPlex Y23和Yfiler试剂盒结合检测存放超过30个月的2 077个生物斑痕;结果表明使用Y-STR分析比使用常染色体STR分析检出多个男性成份的可能性约高出三倍。Han等[63]探索使用激光捕获显微切割术和小体积PCR技术进行单精子的分离和检测,可对来自3个个体的精子混合物进行有效识别。综上,Y-STR分型技术对于法医学案件中的混合斑男性成分鉴定和多个男性个体来源的混合斑的个体识别都具有明显的优势和较大的应用价值。
Y染色体NRY区严格的父系遗传特征为研究人类迁徙历史提供了DNA印记;父系亲属也往往倾向于生活在其祖先所在的地理和文化区域,由此形成的Y-STR单倍型分布具有一定的群体差异,据此可以推断种族和群体来源,全世界的Y染色体单倍群构成了一个划分不同人群的谱系[14]。Xue等[64]研究表明相对于Y-STR,Y-SNP突变率更低,其等位基因在人群中更容易稳定下来,是推断族群来源的更好的遗传标记。NGS技术能够对多个样本中成百上千个SNP进行分型,利用有限的DNA实现高分辨率Y单倍群的划分。Ralf等[65]使用Ion Torrent平台对530个Y-SNP进行平行测序分型,涵盖了整个Y树的分支,并划分为432个Y单倍群。2019年,该团队进一步更新Y-SNP分型体系:包含859个Y-SNP,可推断640个Y单倍群[34];群体样本测试显示单倍群R群下7个不同地理区域的群体显示出显著的频率差别。针对中国人群,Hou等首先设计覆盖到中国全部Y单倍群的框架体系(74个Y-SNP)[66],随后根据不同民族进一步筛选Y-SNP细分单倍群,在确保绝大部分单倍群频率小于0.05的前提下构建了包含165个Y-SNP的NGS分型体系,并评估了灵敏度及案例类型样本适用性[35]。近期,该课题组又完成了蒙古族Y-SNP的筛选验证工作,检测体系增加至 215 个 Y-SNP[67]。
具有父系遗传特征的Y染色体NRY区遗传标记随着基因组学、分子生物学技术等领域的研究进展,在法医学实践中发挥着越来越重要的作用,但也面临着现实挑战。例如,商品化试剂盒中包含越来越多的Y-STR基因座,其中的快突变Y-STR会导致家系排查时出现更多不匹配结果的概率,就需要合适的统计学解释与应对方案。此外,Y染色体片段缺失[68],多拷贝Y-STR异常分型[69],不同技术平台下Y-STR分型命名差异[70-71]等都需要进一步的深入研究。同时,随着Y染色体单倍群进化树的不断完善,将人类学研究中的族源推断应用于司法实践中,为缩小嫌疑人的排查范围提供线索,也是一个方向。但Y-SNP的多态性有限,需要筛选出更多适合构建中国主要群体进化树的Y-SNP和慢突变Y-STR。此外,Y-SNP联合慢突变Y-STR以及Y遗传标记与其他遗传标记联用[72]进一步解决家系精准定位的问题也需要更为详细的研究。当然,这些方向的研究进展将极大地促进Y染色体遗传标记在法庭科学实践中的应用。