高通量测序技术在法医学硅藻检验中的应用进展

2022-06-21 01:23蔡杰王博陈建华邓建强
法医学杂志 2022年1期
关键词:法医学高通量引物

蔡杰,王博,陈建华,邓建强

海南医学院法医鉴定中心 海南省热带法医学司法鉴定工程研究中心 海南省院士工作站(热带法医学)海南医学院法医学教研室,海南 海口 571199

水中尸体检验是法医学实践和研究的重要内容之一,判断死者是生前溺水死亡还是死后抛尸入水,以及推断落水地点成为研究的核心和重点。硅藻在自然界(特别是水中)大量存在,在溺水过程中硅藻会随同溺液进入人体,因此尸体器官组织中存在硅藻是认定生前溺水的“金标准”[1],硅藻检验主要通过对硅藻形态学特征或者区分硅藻DNA 分子差异来进行。近年来,随着高通量测序技术的快速发展,特别是测序成本有了较大幅度的下降,高通量测序技术被广泛应用于包括硅藻在内的微生物群落结构等方面的研究[2-5]。本文拟就法医学硅藻检验的现状和困境、高通量测序技术的基本原理及其在法医学硅藻检验中的应用价值和前景进行综述。

1 法医学硅藻检验现状及困境

法医学实践中,硅藻检验可应用于区分生前溺死和死后抛尸入水、推断溺水地点[6]等。硅藻能够用于推断溺水地点是因其对于水体环境的变化敏感,不同水域的硅藻种类会因环境的变化而具有很大的差异[7-8]。推断溺水地点需要了解所在地区主要水域的硅藻种群分布规律,必须对该地区水域不同时间的硅藻种群分布状况进行详细调查和总结。

目前法医学硅藻检验的研究方法主要分为形态学方法和分子生物学方法2种。形态学方法是通过硝酸消化、微波消解等[9]方法将硅藻从溺液、组织中分离出来,然后利用光学显微镜或电子显微镜对硅藻形态特征进行观察,确定所检测样本内所含的硅藻种类及数量,这是目前法医学实践中硅藻检验的常规方法[10]。但硅藻的形态学检验有其不足,如扫描电子显微镜价格昂贵,检验过程中需要对数量庞大的照片中的硅藻种类进行人工判读,成本高,费时费力;且硅藻种类和形态繁多,故其形态学分类对检验人员的硅藻分类经验要求较高,检验人员需要经过多年的培养和实践才能胜任,而全世界范围内正面临传统分类学专业人员的不断减少[11],致使基于形态学特征的硅藻检验技术广泛应用更加困难。虽有将人工智能(artificial intelligence,AI)技术用于扫描电子显微镜照片识别的报道[12-15],但其应用的可靠性仍有待进一步研究。

硅藻分子生物学检验方法是近年来逐步发展起来的硅藻检验新方法,是法医学领域硅藻形态学检验方法的重要补充。该方法通过获取和分析一段或几段硅藻特异性DNA 序列实现对硅藻种类的鉴定,具有可靠、高效、易于标准化的优点,已被广泛应用于生态学研究、藻类种属鉴定等。与硅藻形态学检验方法相比,硅藻分子生物学检验方法大大减少了检验所需的样本量,提高了检验的灵敏度和可靠性,很大程度上降低了硅藻检验结果出错的概率[16-23],并且硅藻分子检验方法对环境和实验者人体的危害远低于硅藻形态学检验方法。但当前法医学硅藻分子生物学检验方法还不完善,一方面其检测缺乏标准化方法,另一方面,目前基于PCR 和第一代测序为主的硅藻分子研究技术,对于法医学实践中所涉及研究样本中含有多种硅藻种属的情况,在技术方面存在不足,影响其在法医学实践中的广泛应用[24-25]。近年来,随着DNA 测序技术的快速发展,开始有研究尝试将高通量测序技术应用于法医学硅藻DNA 检验,为从检验技术角度解决硅藻检验难题提供了新的思路与方向[26]。

2 高通量测序技术及其应用于硅藻研究的技术关键

SANGER 等[27]开发的基于双脱氧末端终止法的DNA 测序技术奠定了一代测序的基础,后续用荧光基团标记、平行毛细管电泳技术对Sanger 测序法进行改进[28-29]。然而,一代测序技术由于通量较低的限制,无法满足遗传学研究对大批量测序的需求。因此,逐步发展出高通量测序技术[30-31]。

高通量测序技术于2005年兴起,经历了从短读长到长读长的发展历程,高通量、短读长的测序技术被称为二代测序技术,高通量、长读长的测序技术被称为三代测序技术。二代测序技术以美国Roche 公司的454平台、美国Illumina 公司的Solexa 平台和美国Thermo Fisher Scientific 公司的Solid 平台为代表。三代测序技术以美国PacBio 公司的单分子实时(single molecule real time,SMRT)测序和英国Oxford Nanopore Technologies 纳米孔单分子测序技术为代表。与二代测序技术相比,三代测序技术无需PCR 扩增,可实现对单个DNA 分子的测序,避免了PCR 过程中出现的系统偏好性[32],其在保持二代测序技术高通量低成本优势的同时提高了读长,但较高测序错误率和高昂的仪器试剂价格,在一定程度上限制了其应用。

高通量测序技术的出现和发展,使DNA 测序技术实现了从单一的反应体系到高效、快速、海量DNA分子同步检测的跨越式发展,直接推动了人类对DNA 相关研究的爆发式发展,但目前仍然存在一系列问题需要解决。各高通量测序技术平台分别有其优势和劣势,不同测序平台采用不同的测序分析软件,由于所用算法的差异,测序准确率各不相同,分析结果的一致性也尚需进一步验证[33]。当前用于高通量测序序列拼接的算法根据拼接策略分为基于Greedy 策略的算法、基于Overlap-Layout-Consensus策略的算法和基于De Bruijn Graph 策略的算法,其中基于Greedy 策略的算法是最早应用的算法[34],适合于硅藻DNA 高通量测序的序列拼接,但其存在计算资源量耗费大的问题,也需要进一步改进[35]。

硅藻作为当前生命科学领域的研究热点之一,主要集中于生物监测、生物地理学、植物区系研究等领域[36]。其中,硅藻及其群落的分类和特征是最重要的研究内容,最初主要采用基于形态学观察的方法,后来随着DNA 分子标志技术的快速发展,特别是以PCR 为基础的分子检测技术的广泛应用,硅藻研究开始进入DNA 分子水平。但是,由于硅藻研究的主要样本是自然环境的水样,其中含有的硅藻数量和种类繁多,所以,在高通量测序应用于硅藻检验之前,硅藻DNA 分子水平的研究主要针对培养的单一、纯种硅藻进行,无法实现对水样中硅藻种类、群落特征、物种丰富度等内容的研究,高通量测序技术的出现,使得这些问题得以迎刃而解,包括硅藻在内的藻类高通量测序程序见图1[37]。

由图1 可知,高通量测序技术应用于硅藻分类研究受多个关键技术环节影响,主要环节有硅藻DNA 提取、硅藻分子标志物的选择和硅藻参考数据库的选取。

图1 藻类分类高通量测序流程图Fig.1 High-throughput sequencing flow chart of algae classification

2.1 硅藻DNA 提取

硅藻DNA 提取效率对硅藻群落组成的准确鉴定和定量分析有着重要影响。虽然硅藻DNA 提取方法具有不同技术路线,但过程不外乎细胞裂解、DNA 分离和DNA 纯化3 个环节。细胞裂解是否完全、基质是否会吸附DNA、酶抑制剂的共提取和DNA 降解是硅藻样本DNA 提取过程中面临的主要问题[38]。细胞裂解一般采用PK、十六烷基三甲基溴化铵(hexadecyl trimethyl ammonium bromide,CTAB)、SDS 等化学试剂消化降解,特异性与蛋白质、脂质等结合或者利用研磨、振荡等物理破碎的方法,破坏硅藻的硅壳结构,释放硅藻DNA,再利用DNA 自身的物理化学性质进行纯化。以目前广泛使用的PowerSoil®DNA Isolation 试剂盒(美国Mobio 公司)为例,其裂解步骤中既有玻璃珠击打破碎,又有SDS细胞裂解成分,但目前各种试剂盒对硅藻DNA 的提取效果缺乏对比性研究报道。

2.2 硅藻分子标记

硅藻DNA 分子标记的选择和筛选,是硅藻分类效能的关键,对高通量测序技术用于硅藻研究来说,亦是如此[39]。硅藻的DNA 来自硅藻的细胞核、线粒体和叶绿体三部分,因此,目前关于硅藻分类的分子标记选择的研究,也主要集中在硅藻核糖体基因、线粒体基因和叶绿体基因的单独使用或者联合使用[40]。

2.2.1 核糖体基因

核糖体基因是藻类分类中研究较多的基因,因其广泛存在于各类细胞中,很少发生大规模的横向基因迁移,具有一系列从非常保守到高变的区域,又因其所承受的选择压力不同,使得核糖体DNA 各区域核苷酸的保守序列差异明显,所以适用于生物分类研究[41]。硅藻是真核生物,其核糖体DNA 由核糖体基因和与之相邻的间隔区域组成,包括5.8S rDNA、18S rDNA、28S rDNA 和内转录间隔区(internal transcribed spacer,ITS),18S rDNA 的可变区进一步分为V1~V9 区,ITS rDNA 包括ITS-1 和ITS-2[42]。硅藻核糖体基因的研究主要集中在18S rDNA 基因、ITS rDNA 基因等。目前的研究[43]已经证实,通过高通量测序技术测定18S rDNA、ITS rDNA 某个可变区的序列,可以反映不同样本微生物群落间的差异,因而被广泛应用于藻类的系统发育和分类学研究。ZIMMERMANN 等[44]通过对硅藻18S rDNA V4 区种内、种间距离的计算分析,建议将18S rDNA 作为硅藻的DNA 条形码。郭瑞军[45]通过将18S rDNA V9 区域的高通量测序结果与扫描电子显微镜结果比较,认为高通量测序技术在硅藻属水平的分类鉴定中具有优势。马奔[46]利用高通量测序技术对微囊藻ITS 区进行测序,发现其对微囊藻具有较好的分类效果。

2.2.2 线粒体基因

线粒体基因具有高重排率和低突变率的特点[47],应用于硅藻分类研究主要集中在细胞色素c氧化酶亚基I(cytochrome c oxidase subunit I,COI)。COI基因已被成功用于多种动物和某些原生生物的DNA条形码分析[48-49],EHARA 等[50]基于COI基因的研究表明,该区段可以用于硅藻分类,并证明了8种硅藻系统的进化关系。但是,有研究[51]表明COI基因主要适用于硅藻低分类单元和某些近缘物种的鉴别。

2.2.3 叶绿体基因

硅藻叶绿体基因主要集中在叶绿体中编码核酮糖-1,5-二磷酸羧化酶/加氧酶大亚基(ribulose-1,5-bisphosphate carboxylase/oxygenase large subunit,rbcL)基因和23S rDNA V 结构域的UPA(universal plastid amplicon)基因。rbcL 基因以单拷贝形式存在,不发生基因转变;长度达到1 400 bp,有足够的分子性状用于分支分析;进化速率较适于研究远缘亲属间及科级以上的系统关系[51-52]。UPA基因广泛存在于硅藻中,通用性较高,且在硅藻中易于扩增,UPA基因曾一度被认为是藻类DNA 条形码的首选基因。然而进一步研究[51]发现,UPA基因在硅藻类群中的高保守性限制了其作为硅藻DNA 条形码的应用。黄艳等[53]对红藻的rbcL、UPA、COI基因区域进行测序对比,发现测序成功率从高到低依次为rbcL、UPA、COI,得出rbcL 的硅藻种属分类能力优于COI的结论。HAMSHER 等[54]通过对rbcL-3p和UPA区域进行对比研究,也建议将rbcL-3p作为硅藻分类的首选基因。

2.2.4 联合应用

线粒体基因、叶绿体基因和核糖体基因普遍存在于藻类细胞中,对单一基因位点的检测有时往往无法实现满意的藻类种属鉴别[55]。通过多个DNA 分子标志的联合应用,可以提高对藻类种属鉴别的能力,如MONIZ 等[56-57]通过对28 种硅藻(89 个样本)的18S rDNA、COI和ITS2+5.8S rDNA 的分析,建议将ITS2+5.8S rDNA 作为硅藻分类的条形码,后又对114 种硅藻的ITS2+5.8S rDNA 序列进行系统发育分析,建议将ITS2+5.8S rDNA 作为硅藻门内中心纲和硅藻纲的DNA 条形码。

2.3 硅藻参考序列数据库

高通量测序技术要实现对硅藻的分类,必须与参考数据库中已被分类的硅藻序列进行比对匹配,因此参考数据库的准确性和完整性对硅藻分类尤为重要。目前已有多个与硅藻分类有关的分类参考数据库,但这些数据库存在着不同程度硅藻序列的分类错误,不同数据库间参考序列数量偏差极大,不同种类硅藻的序列录入差别较大,且有些种类缺乏[58]。VASSELON等[59]利用形态学方法和高通量测序技术对法国某个岛屿河流的监测发现,高通量测序和形态学检验中只有13%的硅藻种类相同,分析其差异可能主要来源于高通量测序参考数据库的不完善。RIVERA 等[60]在对布尔热湖的底栖硅藻DNA 进行高通量测序与传统形态学分类比较中也发现同样的问题。因此,在通过高通量测序技术进行硅藻研究中,数据库的完善、纠错、扩大以及选择,直接影响后续分析结果。表1为硅藻常见DNA 比对数据库的汇总。

表1 目前常用硅藻DNA 比对数据库Tab.1 Currently commonly used database of diatom DNA alignment

总之,与硅藻高通量测序研究技术相关领域的研究,为将该技术应用于法医学硅藻检验提供了研究基础,但基于法医学硅藻检验的特殊性,将该技术应用于法医学,尚需解决一系列技术难题。

3 高通量测序技术应用于法医学硅藻检验的现状及技术难题

高通量测序技术本身具有的技术优势决定了其特别适合法医学硅藻分子检验的要求,直接将相关学科的硅藻研究结果应用于法医学硅藻检验实践存在极大风险:一方面法医学硅藻检验涉及的样本(如溺死者肺、肝、肾等器官组织)为法医学科特殊检材,其他学科的研究成果不适用;另一方面则是为解决实际应用中溺水地点推断的问题,法医学对硅藻种群关系的区分提出了更高的要求,对参考数据库的覆盖程度提出了更高的标准。相较其他领域,应用高通量测序技术进行法医学硅藻检验,在同样的关键技术环节,面临不一样的技术要求和难题。

3.1 DNA 的提取

溺死地点水样、溺死组织的样本采集及后续DNA 的提取是应用高通量测序技术进行硅藻种属检验的基础。溺死地点水样、溺死组织的采集虽然已有相应的标准[61],但现有标准都是针对硅藻形态学检验制定的,缺乏针对硅藻分子生物学检验的相关标准规范。由于检材、水样等的复杂性和多样性,每个案件中样本的情况都不同,硅藻在不同水域、不同人体组织的含量与分布存在差异,增加了制定统一标准的困难,需要大量研究数据支撑。NGUYEN 等[62]对7 种成品试剂盒的硅藻DNA 提取效果进行比较,发现提取的DNA 普遍存在RNA 污染,推测与样本中抑制物未能完全去除有关。王志龙等[63]发现,不同DNA 提取方法对微生物群落的多样性存在较大影响,但这些研究都是针对自然环境样本进行的,与法医学样本中充斥着大量人体组织DNA 的情况存在差异,因此,需要评价不同硅藻DNA 提取方法对法医学不同硅藻样本的DNA 提取效果,甚至需要建立专门适合人体组织硅藻DNA 提取的技术方法体系,此需求是法医学硅藻研究所特有的,只有依靠法医学自身的研究和积累去完成。后续可以开展针对法医学溺死样本硅藻DNA 提取方法的专项研究,如不同DNA 提取方法效果的比较,综合考虑可靠性、经济性、普及性等因素,制定统一的法医学溺死样本硅藻DNA提取方法标准。

3.2 分子标志的选择

硅藻DNA 不同区域的保守度不同,扩增区域的选择会对硅藻种群分类的分析结果产生影响。CAI等[64]对淤泥中的微生物多样性进行分析,发现微生物的多样性和扩增区域具有很大关系。同一样本用不同引物得出的微生物种群丰度存在差异[65]。理想的引物是用一种引物尽可能多地扩增出样本DNA,同时有效区分不同种属,但“通用引物”都是基于已有序列进行设计,通过少量已知序列设计的引物检测大量未知微生物存在严重问题,不同的引物对不同种属硅藻的覆盖度不同,导致硅藻种属结果与实际情况存在较大偏差[66]。同时,含硅藻的人体组织样本中含有大量人体DNA,这就要求设计硅藻种属特异性较强的引物以避免人类DNA 的干扰,同时实现可扩增的硅藻种类最大化,因此需要对已有硅藻研究的引物进行筛选,设计适合法医学硅藻检验的分子标志引物,后续可以设计简并引物[67]来扩大覆盖度或针对单一硅藻种属设计特异性引物。当前法医学硅藻检验中应用较多的引物主要集中在硅藻核糖体、叶绿体区域,如KANE 等[68]选择16S rDNA 区域引物对水样和组织中微型浮游生物的PCR 产物进行分析,发现微型浮游生物的16S rDNA 的PCR 分析有助于溺水的确定。袁文勇等[69]利用硅藻DNA 的5.8S+ITS2 区域的片段长度多态性来区分生前溺死和死后抛尸入水,取得了较好的效果,但由于样本量很少,需要考虑其偶然性。ZHAO 等[70]利用对硅藻18S rDNA V7 区域的测序分析技术可实现对不同水域不同生长环境的硅藻种群的有效识别。VINAYAK[71]利用实验动物研究不同硅藻叶绿体基因位点用于硅藻分类的效果,发现UPA的分类效果强于rbcL,并用DNA 测序的方法证明了硅藻检验是区分生前溺死和死后抛尸入水的有力证据。LIU 等[72]用高通量测序技术和形态学检验方法对实际案件组织中的硅藻进行检验,比较两者的可靠性,提出当前高通量测序技术应用于硅藻检验最大的困难是缺乏可靠的硅藻分类参考序列。FANG 等[55]利用焦磷酸测序对家兔肺组织和可疑溺液分别进行测序,发现用AdvISER-M-PYRO 算法对测序结果进行处理后,通过溺死组织中的浮游生物群落可追溯溺液的来源。KAKIZAKI 等[26]将高通量测序技术应用于实际案例,发现高通量测序技术所需的样本量从常规硅藻检验所需的10 g降低到200 mg,具备更高的灵敏度。

通过对已有文献的硅藻分子标志引物进行筛选,应 用Basic Local Alignment Search Tool(BLAST,https://blast.ncbi.nlm.nih.gov/Blast.cgi)检验以排除人类基因的干扰,目前已报道的可以排除人体组织影响的硅藻分子标志引物汇总见表2。

表2 可以排除人体组织影响的硅藻检验引物汇总Tab.2 Summary primers for diatom tests which can exclude the influence of human tissues

续表2Continued Tab.2

3.3 测序数据库

目前利用高通量测序技术进行法医学硅藻检验分类所依赖的参考数据库尚不完善,硅藻种类尚未实现全覆盖,且各数据库中硅藻分类也存在不同程度的分类错误和序列错误。因此,高通量测序能否有效应用于法医学硅藻检验,还需要大量的数据积累,对各地硅藻种类进行调查,建立各地符合法医学实践需求的硅藻分子检测参考数据库。

总之,高通量测序技术虽已广泛应用于生命科学的诸多领域,但其在法医学硅藻检验中的研究和应用尚处在起步阶段,面临着诸多问题和挑战,但从长远来说,在法医学硅藻检验中应用高通量测序技术具有良好的前景,相信随着技术的进步和相关难题的攻克,必将在法医学溺水案件鉴定中发挥重要作用。

猜你喜欢
法医学高通量引物
香合欢EST-SSR标记开发及种间通用性研究
甜菜全基因组SSR引物的筛选与评价
高通量卫星服务专用网络的应用模式探索
高通量血液透析治疗老年慢性肾衰竭对治疗有效率、Hb及ALB指标的影响研究
新一代高通量二代测序技术诊断耐药结核病的临床意义
高通量卫星通信综述
马铃薯SSR引物的开发、特征分析及在彩色马铃薯材料中的扩增研究
有关PCR扩增过程中的疑虑与剖析
留学教育与近代法医学的建立
法医学:解密那些“不可告人”的细节