陶瑞旸,王守宇,袁春艳,夏若成,李成涛
1.司法鉴定科学研究院 上海市法医学重点实验室 司法部司法鉴定重点实验室 上海市司法鉴定专业技术服务平台,上海 200063;2.复旦大学基础医学院法医学系,上海 200032;3.内蒙古医科大学法医学教研室,内蒙古 呼和浩特 010030
从犯罪现场提取的生物检材中获取尽可能多的信息对于案件侦破和犯罪事实认定具有重要意义。其中,通过体液斑鉴定识别生物样本的来源对于明确案情和犯罪性质定性,尤其是性侵犯案件中犯罪事实的认定,具有十分关键的作用。精液(斑)是性侵犯案件中常见的生物检材,且往往与女性成分(如阴道分泌物)以混合物的形式出现,因此,精液(斑)的鉴定和个体识别是法医学领域的研究重点之一。
由于传统的种属预实验和基于免疫学方法的体液鉴定手段存在样品消耗量大、检测特异性和灵敏度较低等问题[1-3],近年来,学者们陆续提出了DNA 甲基化模式分析、拷贝数变异分析和RNA 表达模式分析等方法,为法医学体液斑鉴定提供了更多有效的途径[4-6]。在这些新方法中,RNA 表达模式分析的应用最为成熟,并且可与DNA 遗传标记检测联合应用于未知类型斑痕的体液鉴定和个体识别。然而,由于DNA 遗传标记检测和RNA 分子标记检测的分析结果实际上相互独立,尽管在单一类型的体液斑中可将体液类型信息与其供体信息直接结合起来,但在混合斑中,DNA 分型结果有可能来自RNA 表达分析中未被识别的体液或组织,造成DNA 证据与RNA 证据的错误关联[7]。
为了实现DNA 证据与RNA 证据的直接连锁,HANSON 等[8-10]于2015 年首次提出将基因编码区单核苷酸多态性(coding region single nucleotide polymorphism,cSNP)应用于体液特异性mRNA 的来源个体识别的设想,并尝试进行了相应的检测体系构建。由于同时具有体液特异性与序列多态性,cSNP 在体液斑鉴定中可实现将特定类型的体液与其来源个体相锁定的目的,因此在混合斑鉴定中具有十分明显的优势。
本课题组在前期研究中构建了包含6 个血液特异性cSNP 的复合检测体系[11],探索了将SNaPshot 技术应用于法医体液斑样本cSNP 检测的可行性,并在20 名无亲缘关系个体中验证了分别以基因组DNA(genomic DNA,gDNA)和互补DNA(complementary DNA,cDNA)为模板的情况下cSNP 检测结果的一致性。在此基础上,本研究拟进一步扩大样本类型,期望构建一个有效的精液特异性cSNP 复合检测体系并对其在混合斑鉴定中可发挥的效果进行探索。
根据知情同意原则,精液样本收集自16名无亲缘关系的健康汉族男性个体(24~30 岁),静脉血样本随机取自其中3 名精液提供者。样本收集后立即-80 ℃冻存。制备精液斑时,取50 µL 精液样本滴加在无菌棉签上;混合斑的制备则以不同比例精液-静脉血(表1)混匀后滴加在无菌棉签上。常温风干后分别使用PureLinkTM基因组DNA 小提试剂盒(美国Thermo Fisher Scientific 公司)和TRIzolTM试剂(美国Thermo Fisher Scientific 公司)进行gDNA 和总RNA 的提取。使用TURBO DNA-freeTM试剂盒(美国Thermo Fisher Scientific 公司)去除可能残留的gDNA,随后使用SuperScriptTMⅢ第一链合成系统(美国Thermo Fisher Scientific公司)进行逆转录以获得cDNA。
表1 混合斑样本的供体及混合比例Tab.1 The donors and mixing ratio of mixtures
参照文献[12-13],将已经通过验证的精液特异性mRNA 编码基因作为cSNP 筛选范围。在dbSNP 数据库(https://www.ncbi.nlm.nih.gov/snp/)获取这些基因编码区和非翻译区的全部cSNP 相关信息后,依据以下标准对cSNP 进一步筛选:(1)候选cSNP 在db-SNP 数据库各人群汇总数据中的最小等位基因频率(minor allele frequency,MAF)大于0.2;(2)若候选cSNP 位于同一条染色体,需经过Haploview 软件(https://www.broadinstitute.org/haploview/haploview)计算确保纳入复合检测体系的cSNP 之间r2(连锁不平衡程度的衡量指标)小于0.4;(3)候选cSNP 距最近的内含子距离不超过300 bp。
基于最终确定的cSNP 遗传标记,分别设计针对gDNA 和cDNA 的特异性扩增引物,其中cDNA 的扩增引物至少跨1 个内含子以避免gDNA 污染,单碱基延伸引物可在gDNA 和cDNA 的检测中通用,由于部分cSNP 相邻位置存在其他可能影响单碱基延伸引物与DNA模板结合的SNP,为了避免其干扰,本研究择优选取编码链和模板链的其中一条进行单碱基延伸引物的设计。扩增引物和单碱基延伸引物序列详见表2。
表2 5 个精液特异性cSNP 扩增引物及单碱基延伸引物Tab.2 The amplification primers and single base extension primers of 5 semen-specific cSNPs
使用Multiplex PCR 试剂盒(德国Qiagen 公司)对cSNP 进行复合扩增后,通过聚丙烯酰胺凝胶电泳验证PCR 产物特异性。在确定每个cSNP 具有唯一扩增子后,使用SNaPshotTMMultiplex 试剂盒(美国Thermo Fisher Scientific 公司)进行单碱基延伸并在3130xl基因分析仪(美国Applied Biosystems 公司)上通过CE 进行片段分离和基因型检测:96 孔进样板中每孔加入9.6 µL 去离子甲酰胺、0.4 µL Gene-ScanTM600 LIZTM染料片段标准品(分子量内标,美国Thermo Fisher Scientific 公司)和1 µL 单碱基延伸扩增产物,95 ℃变性3 min,冰浴3 min,短暂离心后置于3130xl基因分析仪中,采用POP-4TM聚合物(美国Thermo Fisher Scientific 公司),毛细管长度为36 cm;进样电压、进样时间、电泳电压等根据各试剂盒说明书设置;采用Genemapper®IDv4.0 软件(美国Thermo Fisher Scientific 公司)分析电泳结果。
在排除了无法设计特异性扩增引物的候选cSNP 之后,共筛选出5 个符合条件的精液特异性cSNP(表3),并基于CE 构建了cSNP 复合检测体系。
表3 精液特异性cSNP 基本信息Tab.3 General information of semen-specific cSNP
应用构建的cSNP 复合检测体系,成功在16 例精液样本的gDNA 和cDNA 中检测到5 个精液特异性cSNP 遗传标记(仅在部分样本中出现检测结果缺失)。在以gDNA 为模板的情况下,仅1 例样本(M02)在rs1995640 未成功获取分型结果。而在以cDNA 为模板的情况下,有4 例样本(M10、M11、M14 和M15)在rs9876921、rs1058274 和rs2301366 上 存在不 同程度的检测结果缺失。对于精液-静脉血混合斑,有6例样本的cSNP 检测结果出现了1 个或多个标记的检测结果缺失,主要是rs1058274 与rs2301366 这2 个cDNA 扩增子长度超过200 bp 的cSNP 遗传标记(16 个样本中有10 个样本获得完整分型)。具体cSNP 分型结果详见附表1。
在成功得到分型结果的cSNP 中,位于KLK3、SEMG1和PRM1基因上的3 个cSNP(rs1058274、rs2301366、rs737008)在分别以gDNA 与cDNA 为模板的情况下检测结果完全一致。而位于TGM4基因上的2 个cSNP(rs9876921 和rs1995640)分别在1 例和5 例样本中出现了检测结果不一致的现象,并且这些等位基因丢失情况完全相同,均为gDNA 的检测结果为“AG”杂合子,而cDNA 只能检测到“G”等位基因。
在M01 精液与M06 静脉血的混合斑中,5 个cSNP在1∶9(混合斑A2)和1∶49(混合斑A3)的混合比例下均成功检出,而在1∶3(混合斑A1)的混合比例下有1 个cSNP(rs2301366)未检出。M03 精液与M01 静脉血的混合斑中,5 个cSNP 中有4 个在1∶49(混合斑B3)的混合比例下成功检出,而在1∶9(混合斑B1)、1∶19(混合斑B2)的混合比例下成功检出的cSNP 数量分别为1、2 个。M06 精液与M03 静脉血的混合斑中,5 个cSNP 在1∶1(混合斑C1)、1∶3(混合斑C2)和1∶9(混合斑C3)的混合比例下均成功检出,而在1∶19(混合斑C4)、1∶49(混合斑C5)的混合比例下成功检出的cSNP 数量分别为1、2 个。以上成功检出的cSNP 分型结果均与精液提供者的基因型一致,并且在精液与静脉血提供者基因型不一致的情况下,cSNP 的分型结果未受到静脉血提供者基因型的干扰(图1)。
图1 cSNP 复合检测体系的基因分型图谱Fig.1 Genotyping electropherogram of the cSNP detection system
目前,国际法医学领域最早开展cSNP 相关研究的BALLANTYNE 教授和HAAS 研究员团队已实现了在高通量测序平台上将部分携带cSNP 的mRNA 分子标记纳入mRNA 体液鉴定复合检测体系,从而在体液类型判定的同时获取相关体液来源个体的遗传多态性信息[8]。而在国内法医遗传学领域,本课题组[11]在前期研究中率先探索了将SNaPshot 技术应用于cSNP检测的可行性,并验证了静脉血中DNA 和RNA 的cSNP 分析结果的一致性。随后,张更谦教授团队[14-15]也针对静脉血和精液cSNP 的个体识别能力进行了探索研究,进一步揭示了其在法医学鉴定中的价值。虽然cSNP 相关研究尚处于起步阶段,但其在法医学鉴定中的巨大应用潜力已经显现。在此基础上,本研究以中国人群为研究对象,筛选了5 个cSNP 以构建精液特异性复合检测体系,并基于SNaPshot 技术在CE平台上对一系列精液斑和混合斑样本进行了检验,以评估cSNP 在法医学实践中的应用潜能。
本研究检测的5 个精液特异性cSNP 在部分cDNA 样本的分型中出现了不同程度的检测结果缺失,并且这种现象主要出现在cDNA 扩增子长度超过200 bp 的cSNP 遗传标记中,这提示部分精液样本中的RNA 在制备斑痕或提取过程中可能发生了一定程度的降解,导致较长mRNA 片段的逆转录效果不理想。由于本研究设计的cDNA 扩增子需要同时满足覆盖cSNP 和跨内含子的条件,在引物设计上受到很大限制,因此各扩增子的长度可调整范围有限,这导致cSNP 在CE 平台上的检测灵敏度可能不及既往研究中构建的一些具有较短扩增子的体液特异性mRNA 复合检测体系[16-18],INGOLD 等[19]在基于高通量测序平台的cSNP 研究中也观察到了类似的情况。然而扩增子长度并不是影响mRNA 检测灵敏度的唯一因素,LIN 等[20]在针对降解检材的研究中发现,一些mRNA 在不同区域的稳定性方面存在较大差异。因此,未来的体液鉴定相关研究可尝试探索更多体液特异性mRNA 的最佳稳定区域,并在cSNP 的筛选过程中将其作为一个重要条件纳入考虑。
在gDNA 与cDNA 的检测结果一致性方面,本研究观察到TGM4基因上的2 个cSNP,尤其rs1995640在cDNA 的检测结果中容易出现等位基因“A”的丢失。由于这种情况并未在其他基因的cDNA 检测结果中观察到,推测TGM4可能在2 条等位基因的转录水平上存在一定差异,这种差异经过PCR 放大造成了SNaPshot 检测结果的偏倚。这一发现提示,未来在构建包含更多cSNP 复合检测体系的过程中,可能需要通过大样本量和不同初始模板量的系统性评估筛除一些容易出现等位基因丢失的标记。此外,本研究发现,在具有T 等位基因的位点检测结果中出现了比较明显的等位基因峰高不平衡现象,对于次要等位基因的判定有所干扰,这一情况很大程度上是由SNaPshot 检测方法本身所导致的。因为用于标记双脱氧尿苷三磷酸(dideoxyuridine triphosphate,ddUTP)的红色荧光强度较弱,T 等位基因的峰高偏低这一问题在其他应用SNaPshot 技术检测SNP 的研究中也经常存在,且其偏倚程度受到检测平台的影响较大。在未来研究中,本研究团队将继续关注这一问题,通过在3130 基因分析仪和3500 基因分析仪平台上分别进行大样本量的检测获取更多有效数据,并系统评估杂合子的峰高比范围,从而为所构建的检测体系提供可参考的分析标准。
在混合斑的区分方面,本研究构建的cSNP 复合检测体系在大部分混合样本中显示出良好的应用潜力,在精液与静脉血的混合比例低至1∶49 的情况下,5 个cSNP 均可以被成功检出,并且分型结果与精液提供者的基因型完全一致。相较于混合比例,部分标记检测结果的缺失似乎受到混合斑中精液样本本身质量的影响更大。此外,本研究观察到在精液与静脉血提供者基因型不一致的情况下,精液特异性cSNP 的分型结果并不会受到静脉血提供者基因型的干扰,这意味着cSNP 检测在不同体液的混合斑鉴定中可解决一些通过传统的DNA 遗传标记分析不能解决的问题,如排除某种体液来源于某一特定个体的可能性,或明确某种体液的提供者必携带某个特定的等位基因。此前,张更谦教授团队[15]对精液特异性cSNP 在不同类型混合斑中的检测灵敏度进行了评估,但其研究中使用单一类型体液样本提取的cDNA 进行混合,而本研究使用体液样本直接混合,随后再进行混合斑的RNA 提取和逆转录。相较而言,本研究使用的混合斑样本与实际案件更为接近,因此对于精液-静脉血体积比影响cSNP 检测灵敏度的评估结果有一定的实践意义。
为了避免连锁不平衡,本研究选用的cSNP 多位于不同基因和染色体,尽管rs9876921 和rs1995640 均位于TGM4基因上,但基于dbSNP 数据库的分析结果显示,这两个标记之间的r2小于0.4,这样的标记筛选标准保证了后期通过等位基因频率计算法医学参数(如累积个体识别能力)的可行性。然而,由于许多体液特异性mRNA 上往往存在多个具有良好多态性但相互之间完全或不完全连锁的cSNP 遗传标记,这种筛选标准在一定程度上会导致cSNP 多态性信息的浪费。因此,后续研究会尝试将一些mRNA 上完全连锁遗传的cSNP 以单倍型的方式进行分析。此外,本课题组也将筛选更多新的体液特异性mRNA 及cSNP 遗传标记,并扩展研究中纳入的体液类型和样本量,通过推进cSNP 的法医学应用转化,进一步提升RNA 证据在法医物证鉴定中的重要性,为疑难案件中混合(斑)的体液类型鉴定及其来源个体判别提供新的技术手段。