牛青山 宋志豪 杜馨雨
(中国刑事警察学院科研处 辽宁 沈阳 110035)
Y-STR分型技术在法庭科学的实际案件中的亲缘排查、筛选、种群的推定,甚至个人识别都有着不可替代的作用。自Y-STR数据库在全国各地公安机关建立以来发挥了重大作用,典型的如在侦破甘肃省“白银案”中的成功应用。但随着法庭科学对Y-STR基因座的继续研究发现,目前常用的Y-filer Plus PCR Amplification Kit系统的27个Y-STR基因座普遍存在突变率较高的情况,这可能导致在实际鉴定工作中出现基因座突变而产生错误的排除。而Y-SNP凭借着其极低的突变率、强群体特异性与更短的扩增子受到法庭科学的关注[1],特别是近些年随着对Y-SNP研究的不断深入,Y-SNP位点对于法医学更突显出其重要意义与价值。
Y-SNP位点是指位于Y染色体上的单核苷酸多态性(Single Nucleotide Polymorphisms,SNPs)。单核苷酸多态性是指在基因组的水平上由单个核苷酸变异而导致DNA序列的多态性,是人类可遗传变异中非常重要的一种,在人类基因组中广泛分布,被认为是继STR后的第三代遗传标记。它主要体现为二等位基因变异,由单个基因转换导致的,基因的插入或缺失同样也可导致。目前学术上将SNP位点分为4类,包括个人识别SNP(IISNP)、家系SNP(LISNP)、祖先SNP(AISNP)与表型SNP(PISNP)[2]。人体的Y染色体属于近端着丝粒染色体,包含长臂Yq短臂Yp,长度约为60Mb。位于Y染色体两端的95%为非重组区,而拟常染色区仅占总长的5%。非重组区呈现单倍型独立向下遗传,表现为由父亲传递给儿子[3]。Y-SNP突变模式目前主流学术界认为是“一次性发生”的具有时间顺序的点突变。因此,Y-SNP拥有高度的种群特异性,多Y-SNP位点所构成的系谱树已经为研究群体遗传学提供了重要帮助。由于Y-SNP位点的低突变率(约为10-9),在Y-STR基因库构建的基础上具有辅助作用,可以更好地帮助实际工作中寻找与排除家系,并有望在法医学领域的种群认定与个人识别方A)或巅换面发挥更重要的作用。
在实际检验工作中,往往需要对降解或陈旧检材进行相关Y-SNP位点扩增检验,但因其极易受到其他生物样本的污染,从而增加了对Y-SNP扩增结果判断的难度。因此,对Y-SNP特异性的研究对实际工作中检材样本来源的确定具有重大意义。
Y-SNP位点在研究其特异性时与Y-STR位点类似,大体可分为种属特异性与Y染色体特异性。黄曾杰等人对人类男性的29个Y-SNP位点进行特异性研究中发现,在29个位点中有23个位点针对男性有较好的特异性,可以扩增出相应的PCR产物;29个位点中有3个位点对人,还有部分动物均有部分扩增产物,但两者长度具有显著差异;有3个位点对人还有动物有相应的扩增产物,且长度类似;有5个位点对于男性女性均有扩增产物且其长度大小类似。因此,绝大多数Y-SNP位点对男性具有较好的特异性。部分位点人与动物均可扩增出相应的片段,种属特异性差。极少数位点不具有Y染色体特异性,男性女性均可扩增出相应的片段(如M7、P256、M178、M175、P31等),这可能与X染色体与Y染色体含有相应的同源区段相关[4]。因此,在选择Y-SNP位点时要充分考虑其选取位点的种属特异性与Y染色体特异性,这在为科研与法庭科学检验中选取Y-SNP位点时提供了一定的参考。
Y染色体上的突变率是种群迁徙、基因、医学遗传与法医学研究的重要参数。往往由于Y染色体的突变相对独立,通常是中性的,并且成为非重组部分唯一的变异源,所以对Y染色体上遗传位点的研究可以作为良好的分子钟来研究种群、家系、迁徙等问题。因此,为了矫正这个分子钟,需要对Y染色体上各遗传位点的突变率加以研究分析。对于Y-STR突变率的研究目前在学术界已经有了一定的成果,但是对于Y-SNP突变率的了解却知之甚少。目前,在学术界对Y-SNP的大规模测序工作已经展开,并产生了几个对Y-SNP突变速率的估计。
Y-SNP突变率大体可分为遗传突变率与进化突变率。遗传突变率是指由于血统所引起的不同程度的改变,而进化突变率主要是指从人口事件中所获得的任何对该位点产生影响的任何速率(如校正因子、古DNA等)。
在早期研究中,Xue等人在2009年对具有单一中国血统的Y染色体进行分析,通过Sanger测序法对13代所分离的两个人的Y染色体进行检测分析,分析结果产生了4个突变,并可以在其他家庭成员中得到验证,首次揭示了Y染色体单倍群SNPs的突变。由于已知祖先出生年代与后代的数量已知,故由此可以计算其每年的遗传突变率为1.0×10-9,每一代的遗传突变率为3.0×10-8[5]。
O.Balanovsky等人在2015年对9名哈萨克斯坦人进行了Y-SNP位点的遗传学分析,这9名哈萨克斯坦人的系谱树共同构成了传统系谱树的拓扑结构,从而可以将他们与相同的历史人物联系在一起,进而分析计算遗传突变率。结果在测序深度为71×下,观察到了44个位点的改变(不排除假阳性与阴性情况的发生),测得其遗传突变率为0.78×10-9[6]。O.Balanovsky在2017年对此进行了回顾性分析,分析了从2009年至2015年4位不同学者对Y-SNP位点检测所得遗传突变率的结果,其平均值为0.89×10-9,并认为该突变率可作为一种Y染色体X退化序列良好的遗传突变率[7]。
进化突变率主要影响因素分为两种:由校正因子带来的影响与古DNA所带来的影响。在计算Y-SNP进化突变率时主要考虑上述两种因素。
4.2.1 通过校正因子所计算的进化突变率
Poznik等人在2013年对总计69条Y染色体进行了测序,并以此为基础构建了一个全球范围的Y染色体树。他们通过对外显子测序来验证43个位点,进而得出其进化突变率为0.82×10-9[8]。虽然该结果与全球线粒体DNA树的TMRCA相吻合,但是其突变率是由美国校准的特殊子树中获得的,要考虑到该血统人种种族迁徙、分离等多方面因素,故该结果具有争议性。
Francalacci等人在2013年与2015年分别对1204名撒丁岛人的Y染色体进行低测序深度(2×)与高测序深度(17×)的测序,并重点将其聚焦于Y染色体退变区。他们通过结果证实了 I2a1a-δ单倍群是撒丁岛人所独有的,因为其带有明显的人口爆炸信号,分析其原因可能与新石器时代殖民统治的扩张与改造相关。通过低测序深度所检测的进化突变率为0.53×10-9,其结果由于对假阳性的高度过滤,在实际测序中可能忽略了个别突变的SNPs位点,因而所测得进化突变率偏低。通过高测序深度所检测的 I2a1a-δ单倍群所得的进化突变率更快,通过标准正态分布计算所得的CI为0.62×10-9至0.68×10-9[9]。
4.2.2 通过古DNA所计算的进化突变率
FU等人在2014年对一位约为45000岁的西西伯利亚人进行了完整的基因组测序(测序深度为22×),发现其古老的Y染色体与东/北欧的单倍群NO相类似。其他的研究往往使用概率论的方法直接计算突变并估计突变率,但该学者率先通过贝叶斯建模的方式在构建树的同时,也将其应用于对进化突变率的估计,估计的结果为0.76×10-9(95%CI为0.67×10-9到0.86×10-9)[10]。Trombetta等人在2015年对数百个现代人样本的X退变区(1.5Mb)进行了检测,并以此为数据通过贝叶斯模型建立系统遗传树。后将其与Ust’-Ishim和欧洲旧石器时期晚期的Loshbour样本相结合,通过将古DNA的年龄加入到树中后进行分析计算,最后得到0.71×10-9的进化突变率(95%CI为0.62×10-9到0.82×10-9)[11]。
4.3.1 测序覆盖深度与SNP过滤设置所带来的影响
由于样本本身的差异,在检测时相应参数的设置对最后突变率的测量会带来不同的影响。如为了避免假阳性与假阴性所带来的影响,在测序时要特别注意要寻找一个合适的测序覆盖深度。过低的测序深度会造成相应的错误从而造成假阴性,进而低估突变率。正如Francalacci等人通过测序深度为2×增加到17×进而增加了23%的突变率[12];当测序深度过高时,由于仪器设备的限制,就会造成精准度的偏差,从而造成假阳性。当然,同样也是由于SNP分析阈值由2增加到10进而也可以减少测序的假阳性发生率。故对SNP分析阈值的设置,O.Balanovsky认为要分局部样本(单一位置单一样本)、复合样本(单一位置多样本)与系统样本三种情况分别进行处理。
4.3.2 世代传递时间对突变率所带来的影响
根据对常染色体突变率进行估算时所用计算方法的特点,世代传递时间主要以两种方式来影响对突变率的估算。第一,在对突变率进行估算时,通常所测量的值TMRCA以几代人的速度表达,后转化为以年代为单位。所以,每代人的持续时间将会直接影响到对突变率的估算。第二,随着父亲年龄的增长,随之带来突变的可能性便会加大。但幸运的是,对Y-SNP突变率的估算通常是以年为单位,因而第一种方式可以很好地被避免,但第二种方式却存在,父亲的年龄增加了突变率,并随着世代而变化。因此,男性的青春期年龄、男性精子生长周期与男性生育平均年龄对突变率的估算都将产生影响。
4.3.3 在Y染色体的回文序列与X退化序列突变率的差异
尽管学术界在研究Y-SNP的突变率时重点关注X退化序列,但是Helgason等人在2015年预见性地将大量基于血缘基础的数据,应用于对Y染色体扩增序列中的回文序列、X退化序列与X转位序列。其在研究中发现,在X退变序列中并没有回文序列与X转位序列所含有的旁系同源基因,而该基因是研究对Y-SNP的突变率进行估算的主要研究对象。因此,如果发生突变,则不能确定具体是哪个序列中携带了该突变,则每个序列都被认为是含有突变的,突变大小分别占33%。最后必须通过这些突变在不同序列中的权重来分别进行计算,进而得到一个无偏见的Y-SNP突变率。该学者发现,在这些区域中,回文序列的突变率最低(0.74×10-9,CI:0.64×10-9-0.85×10-9),X退化序列的突变率最高(0.89×10-9,CI:0.80×10-9-0.99×10-9)[13]。
自20世纪DNA的发现到现如今,经历了近百年的SNP分析技术已日益成熟,但由于SNP独特的生理结构特点导致了其各类分析方法均无法达到最完美的结果。目前学术界对SNP位点的研究主要集中在两个方面:其一为对SNP位点进行筛选,从而建立SNP数据库;其二为对不同SNP位点的功能进行研究,从而为医学领域治疗、用药或预防等提供帮助。因此,就法医学对SNP进行分析时,主要应当结合样本条件与实验要求等进行综合分析,分析方法既要在拥有良好的复合扩增体系的同时保证高精准度,也应兼顾高通量与低成本问题,进而选取最恰当的方式。
对于Y-SNP来说,目前所用分析技术与常染色体SNP相类似,主要分为两类:传统凝胶检测法与新型(现代)分析技术方法。其中传统凝胶的分析方法主要包括PCR-RFLP、单链构象多态性分析技术(SSCP)、等位基因特异性探针(ASO)等。新型(现代)分析技术方法主要包括DNA芯片技术、变性高效液相色谱分析(DHPLC)、TapMan荧光探针技术、MassARRAY质谱分析技术、SNaPShot技术、基质辅助激光解吸电离/飞行时间(MALDITOF)质谱法等。传统分析技术由于其通量低、成本高、时间长的缺点,较少应用于Y-SNP的分析中,对此,本文不再赘述。对于高通量的分析方法,目前SNaPShot技术以其独特的优势被大量应用于Y-SNP的分析。
DHPLC技术是在温度调控高效液相色谱技术(TmHPLC)的基础上改进而来的,通过固定相对相同长度片段内部不同碱基对亲和力的不同,从而将3’端按照C、G、A、T的顺序依次洗脱,因而该方法可以分析目的片段与已知片段之间的微小差异。由于该方法在分析进样前无需对样本进行纯化,因此在实际操作中可以应用于高通量的基因分析。但该分析方法不能测出变异位点的具体序列,需要更进一步的测序。正是该方法具有的高通量、操作简便、高效、检出率高(95%~100%)特点,故被广泛地应用于变异SNP位点的发现与筛查[14]。
石美森在2005年首次将DHPLC技术应用于对Y-SNP位点的分析研究。该学者通过将Y染色体M9、M35、M98三个SNP位点进行SNuPE复合位点扩增,后将得到的扩增样本在完全变性的条件下用DNASep®分析柱进行洗脱[15]。根据DNA分析片段的长度及每条单链碱基不同构成的顺序被依次洗脱,然后以峰值的形式记录下来,随后通过分析同一条件下所检测样品的图谱来确定基因型。该方法操作简便、快捷,同时由于无需对扩增样本进行纯化,因此适用于高通量的Y-SNP分型。但由于其本身技术特点限制,尚不能用于明确变异,只能对Y-SNP变异进行初筛、初检,最后仍然需要测序来明确具体变异。
质谱是通过测定待测样品电离后离子的质荷比来判断样品的构成与性质的,最早应用于蛋白质的分析与检测中。在20世纪90年代,随着一些电离技术的出现,质谱技术被应用于高通量的DNA遗传分析。根据不同的电离技术,可以将质谱技术分为基质辅助激光解吸飞行时间质谱(MALDI-TOFMS)、电喷雾离子化质谱(ESI-MS)、MassARRAY质谱分析技术等。杨何义等人在2003年率先将生物质谱应用于SNP的分型检测。他们通过对MALDITOF-MS技术与ESI-MS技术对SNP分型的准确度与分辨率数据的分析来评价生物质谱对SNP分型的优劣势[16]。由于质谱技术为直接对样品电离后的离子进行分型,对比传统的电泳技术可以消除其对扩增片段的抑制效应,从而具有高效、简便、快捷与高通量的特点,通过二等位基因检测体系适合实验室大规模样本试验[17]。但是,其劣势在于对靶序列寡核苷酸的要求高,长度一般不能超过45个碱基,过长的序列可能会导致质谱在分辨率与精度方面的下降,从而造成错误的判定。该技术特点严重影响了多重SNP位点的的检测能力,不利于复合SNP扩增体系的检测。杨何义等人在ESI-MS技术的基础上,尝试通过使用ESI-Qq-TOF-MS技术以提高对靶序列核苷酸的检测长度。结果发现,对于多重SNP位点体系分型方面,该技术相对于传统质谱技术在准确度与分辨率上具有明显优势。王琳等人在2016年通过将MassARRAY生物芯片与MALDI-TOFMS技术相结合来对Y-SNP复合位点进行检测,其方法技术大大提高了传统MALDI-TOF-MS技术对复合SNP位点的检测能力。同时,相比目前常用的SNaPshot技术,极大地节约了分型所需的时间与成本,可以应用于基础科学研究。但其对所需样本量有相应的要求,且对组织样本分型效果差,故难以在日常法医检验中开展。
SNaPshot技术又称小测序、微测序,它主要是在传统电泳凝胶的基础上结合荧光标记单碱基延伸技术,后在通过对含有四色荧光标记(ddNTP)的单链DNA进行荧光信号记录,从而达到对DNA进行测序的目的。由于SNaPshot技术在同一体系内可对多个SNP位点同时进行检测,具有分型准确、价格低廉的特点,可以达到中等通量,同时辅以毛细管电泳仪分析技术而被大量应用于对SNP的科学研究。娄春光等人在使用SNaPshot技术对44个复合SNPs位点进行检测时提出了多种对该技术的优化方法以提升该分型的准确率,如前期对多重PCR反应体系与缓冲液的调整、Mg2+与dNTP浓度的优化、后期单碱基引物延伸反应与反应产物检测的优化等[18]。目前,SNaPshot技术对于Y-SNP位点的分型也已日趋成熟,特别是在对连锁信息性Y-SNP遗传性分析中起到了关键作用。
二代测序技术(Next-generation Sequencing,NGS)又称深度测序,这是一种以边合成边测序与大规模平行测序(Massively Parallel Sequencing,MPS)思想为基本思想,通过检测在合成新子链时所结合的带有荧光标记的dNTP,从而对母链进行测序[19]。相比以前较传统的Sanger测序方法,二代基因测序技术具有在较短时间内高效获取大量序列数据的优势,是一种高通量的测序技术[20]。但由于二代基因测序技术所用仪器总体价格昂贵而限制了其发展。
美国FDA在2013年批准了Illumina公司的MiSeqDx测序仪生产,其是第一台应用二代基因测序技术的测序仪。随后,相继的二代基因测序技术平台不断涌现,如Applied Biosystems公司的SOLiD测序仪、罗氏公司的FLX系统测序仪、赫利克斯公司的Heliscope测序仪等。
罗氏公司的FLX系统主要是基于焦磷酸测序法,可以对中长片段进行读取,适合于适合转录组测序、宏基因组研究、De novo测序等。但是由于其样本制作困难,仪器价格昂贵而较少被使用。
Illumina公司的MiSeqDx测序仪主要是基于可逆链终止物和合成测序法,可以对100bp~150bp的片段进行读取,适用于适合micoRNA鉴定、DNA甲基化和表观遗传学的研究。其缺点在于用于仪器与后期数据整理及分析所需的费用昂贵。
Applied Biosystems公司的SOLiD测序仪主要是基于连接反应测序原理,其读长在所有平台中最短,可低至50bp~75bp,因而适于基因组重测序和SNP检测。但是由于其检测的片段短,导致测序时间长、分析困难等造成了其昂贵的成本[21]。
二代基因检测技术已经彻底改变了生物医学的研究,并将对医学实践产生深远的影响。它增强了我们对基因的识别、量化与功能方面的研究,进而对法医遗传学产生了深远的影响。近年来,二代基因检测技术在人类个体识别与表型形状研究方面已经得以应用,如基因诊断、SNP位点的检测等。对于Y-SNP的检测,二代基因检测技术已经成为其主要检测手段之一[22]。但由于二代基因测序技术对读长的限制,不太适用于需要读取较长的序列来分析复杂基因组中SNP关系的研究。同时,在实践中仪器的价格、运行时间与成本等多方面考虑,该技术的推广也受到了相应的限制。
第三代测序技术又称SMRT测序,这是一种相比二代测序在检测小基因序列时更为精准的测序方式。该技术主要是基于荧光标记核苷酸实时成像技术,通过检测整合到DNA模板中的新生成DNA分子的荧光信号来对序列进行阅读。该技术特点在于其使用DNA聚合酶来驱动并对单个分子进行成像,信号随着时间的推移并不会衰减。目前PacBio RS测序仪的平均读长是3000bp,有的读长可能为2万个甚至更长,相比二代测序技术在读长方面特别是新基因组的de novo测序更具优势[23]。
Xiaoge Guo等人于2015年通过使用SMRT测序技术对酵母菌细胞与人体肿瘤细胞中特定片段SNPs之间的关联研究中发现,SMRT测序技术适用于大量独立样本中的少量目标,同时很容易揭示多态SNPs分析样本中存在的单倍体类型之间的联系,可以替代目前由于二代测序复杂的计算方法,节约科研与实践工作的时间周期,尤其适用于法医遗传学中基于Y-SNP位点家族谱系的建立[24]。但是,该技术在发展上仍然具有相应的不足,特别是在DNA聚合酶与计算误差的减少方面。
目前在法庭科学中Y-SNP主要应用于以下两个方面:一是推测未知样本来源,参与构建Y染色体单倍群进化树,从而实现对种族人群的区分;二是通过选取相应的Y-SNP,并根据其丰富的遗传多样性来实现个人识别与父系亲权鉴定。
Y-SNP由于其本身的遗传特性与突变类型决定了它具有较强的地域性。对此,国际Y染色体协会在2002年对来自于74个男性个体的245个Y-SNP标记进行基因分型,从而在全球范围内构建了153个基于Y-SNP系统的Y染色体单倍群进化树[25]。这不仅是世界范围内构建最早的基于Y-SNP系统的单倍群进化树,同时也制定了一系列的命名规则,该命名规则可兼容于基于系谱的命名与基于突变的命名规则,为后期单倍群进化树的研究奠定了基础。
如今在法庭科学上通过对Y-SNP单倍群的研究,可以将东亚人种主要分为9种大类单倍群,分别为C*-M130、DE*-YAP、F*-M9、O3*-M122、K*-M9、O3a3c-M134、O1a-M119、O2a-M95与P*-M45[26]。目前学者们普遍关注于东亚人所特有的O类单倍群,如O3*-M122,对法庭科学中嫌疑样本的种属鉴定可起到十分重要的作用。
由于Y-SNP突变具有累积效应,对于Y染色体单倍群的迁徙与各地区基因交流等方面的研究同样具有重要意义。于露等人在对209名无血缘河南人的Y-SNP单倍群研究中发现,即使同为东亚地区但不同区域单倍型仍然具有其独特性[27]。河南地区主要以O3单倍群为主,占比约为30.62%。通过不同区域单倍群占比的分析研究,对后期Y-SNP数据库的建立与分析嫌疑样本Y-SNP单倍群的地域性具有重要意义。
Y-SNP位点不仅可以在构建单倍群进化树上提供帮助,对于个人识别同样具有重要的辅助作用。虽然Y-SNP本身所携带的信息量少,但是由于Y-SNP位点数量庞大,因此,其组成的单倍型便可提供丰富的遗传信息,如表型特征信息与个人身份信息等。目前在学术领域主要是通过对常染色体个人识别SNP(IISNP)进行位点分析,但对Y-SNP应用于个人识别还鲜有报道。
近几年,利用SNP进行身份鉴别在法庭科学的取证环节上取得了突飞猛进的发展。GenPlex HID系统通过对48个IISNP的检验,获得了至少达5.0 × 10-19的匹配概率[28]。Pakstis AJ等人随后将19个无关联SNP、40个无关联SNP、92个无关联SNP应用于法医个人识别以验证其效能,并指出通过40个无关联IISNPs即可达到2.02 × 10-17到1.29 × 10-13的匹配概率[29]。同时该研究表示,这些标记相对容易被识别,这对于法庭科学中对SNP检验工作具有重大意义。M. Heath Farris等人在2018年通过开发一种基于大规模平行测序(MPS)的IISNP孤岛算法(同一离散基因组区域的多个身份相关SNP的单倍型)用以对不同的嫌疑样本进行区分与个人识别,该方法同样可以在已知SNP位点变异的基础上识别新的变异并进行区分[30]。
随着全球人口SNP数据库的成熟与保真度的提高,以及新MPS技术的出现,Y-SNP位点分析在个人识别领域将具有广阔的应用前景。
与常染色体STR类似,Y-STR同样在突变率上有高低之分。目前在对Y-STR基因座的检验中,对于突变率高于10‰的快速突变基因座(RM STRs)的判读需要十分谨慎,需结合案情等进行综合判定,以求对犯罪嫌疑人达到准确刻画,便于刑事案件中犯罪嫌疑人家系的排查[31]。随着Y-STR基因库的构建,基因库人数不断地增加,出现了无关个体享有相同的Y-STR单倍群的情况发生[32]。通常情况下,对应的策略为选取突变率更低的Y-STR基因座[33]与增加Y-STR基因座的位点[34]来增强对家系的区分。针对此现象,Kaye N.Ballantyne等人认为可以在Y-STR基因库所选取的位点中适当增加少量RM Y-STR位点,以提升各单倍群的特异性,从而增强对不同家系的区分[35]。但随着对Y-STR单倍群的继续研究,张文琼等人在对4个RM Y-STR的研究报道中指出,异常分型的出现概率高达7.94%[36]。Kaye N.Ballantyne等人在对部分非RM Y-STRs基因座的研究中发现,同样出现了高达1.51×10-3~7.27×10-3不等的突变率。因此,对于来自一个家系的男子,理论上拥有相同的Y-STR单倍型,但是由于Y-STR基因座的突变仍然会造成基因分型的不一。
SNP基因座相比于STR基因座有着低突变率、稳定的性质,使其具有不易降解的特性。Hathaichanoke等人在对泰国人群的降解DNA分型中发现,当STR分型已不能提供足够的信息时,所选取的54个SNP基因位点分型仍然可以提供足够的基因型数据[37],这与SNPs分析时所选取的片段大小相关(45bp~150bp),相对较短的SNP位点扩增子检验对于降解检材或是腐败检材仍然拥有可以挖掘的重要信息。因此,实际工作中对降解与腐败检材的检验,Y-SNP位点就突显其重要的检验价值。同样,Y-SNP不仅可以应用于常规检材的个人识别,对于混合斑中的个人识别同样具有重要意义。
对此,笔者认为在当前条件下,可在所构建的Y-STR基因库相应地添加Y-SNP位点,从而在现有条件下更准确地对家系进行区分。Y-SNP相比Y-STR,具有稳定不易突变性、耐降解性与地域性。特别是在地域性方面,由于Y-SNP位点所具有的单倍型父系遗传可以有效避免染色体重组的发生,同时辅以其极低的突变率在对目前所构建的Y-STR基因库有极大的辅助作用。由于其扩增子短,便于进行大规模的仪器批量检测。目前SNP作为第三代遗传标记在法庭科学中越来越突显其地位,在国际范围内的人类SNP基因库也在逐步构建中。因此,在传统Y-STR基因库的基础上加入筛选的具有家系特征与个人识别特征的Y-SNP,从而以其极低的突变率保障对犯罪嫌疑人家系排查的准确率,辅以RM Y-STR位点甚至有望可达到个人识别水平。这不仅对于公安实战中混合斑、降解与腐败检材的鉴定,前期家系排查工作,甚至是犯罪嫌疑人的同一认定均具有一定的价值,同样对于公安实战从第二代遗传标记(STR)向第三代遗传标记(SNP)的过渡也具有重大意义。但不得不说的是,在选取相应Y-SNP位点时要格外注意,为避免检材因受到其他生物来源及女性成分来源的污染时出现假阳性的情况,要选择对男性有较好种属特异性的Y-SNP位点进行分析。
目前传统检测方法鲜有将Y-STR与Y-SNP复合扩增后进行平行检测的案例,主要体现为分别通过聚合酶链反应—毛细管电泳分型技术(Polymerase Chain Reaction-capillary Electrophoresis,PCR-CE)与MPS平台分别进行测序,后通过整合在一个数据库中。再使用FSindex分析平台对这两种位点的突变率进行校正综合分析(NGS+)[38]。但是,随着检测技术的不断提升,目前已有通过MPS平台对包括STRs、SNPs、mtDNA、Y-STRs和X-STRs在内的遗传位点进行平行基因型测序分析的研究,这不仅可以大大减少检测的操作与时间,同时也可减少对检测样本的消耗。MPS检测平台的发展可为Y-STR与Y-SNP基因库的构建解决技术难题,并有望成为一项很有前途的法医学应用技术。