向青青,陈立方,2,苏秦,杜宇坤,梁沛妍,康晓东,石河,徐曲毅,赵建,刘超,,陈晓晖
1.昆明医科大学法医学院,云南 昆明 650500;2.云南省公安厅刑事科学技术研究所,云南 昆明 650228;3.广州市刑事科学技术研究所 法医病理学公安部重点实验室,广东 广州 510442;4.中山大学中山医学院法医学系,广东 广州 510080;5.南方医科大学法医学院,广东 广州 510515
死亡时间(postmortem interval,PMI)指检验尸体时距死亡发生时的死后经历或间隔时间[1],准确推断PMI 在案件侦破中具有重要作用,国内外法医学者一直在研究准确的PMI 推断方法。PMI 推断的技术方法不仅包括形态学、昆虫学、物理化学、生物化学等传统手段,还包括微生物组学、代谢组学、脂质组学、蛋白质组学、基因组学以及转录组学等组学方法。这些方法虽均能为PMI 提供重要信息,但形态学、昆虫学、生物化学和分子病理学等反映的死后时序性变化规律多局限于理想条件或模型中[2],如法医昆虫学方法主要应用于中晚期PMI 推断,但我国较多地区缺乏研究数据影响了其应用;生物化学方法可通过检测死后骨髓细胞核DNA 含量来推断晚期尸体PMI,但DNA含量随取材部位而异且存在个体差异,还易受到疾病、损伤、死亡原因、细菌繁殖等因素的影响。因此,这些方法的适用性和准确性易受到影响。
有学者结合微生物学和法医学两门学科的专业知识,将微生物组学分析应用于法医学研究[3]。哺乳动物的尸体和微生物是环境中营养物质循环的关键,而在不同宿主和环境中,驱动尸体腐败分解的各种微生物在一定程度上是相似的,故哺乳动物尸体的腐败分解过程可能包括一个可预测的微生物序列[4]。这为利用与尸体相关的微生物群落推断PMI 提供了生态学依据,使利用微生物组学方法进行PMI 推断成为可能。已有研究使用测序技术对死后尸体样本(皮肤、肠道等器官组织[5-14])以及尸体相关土壤[5,7-8,11,15]的微生物进行分析,将微生物组数据与PMI 相关联并建立回归模型来预测PMI。基于微生物组数据建立的回归模型在一定程度上提供了较准确的PMI[5,11,13-14]以及可量化的错误率[7-8,16]。因此,利用微生物群落数据进行PMI 推断是一种有价值的法医学PMI 调查手段。本文就微生物群落在PMI 推断中的技术方法、实际应用及影响因素等方面进行综述,旨在为利用微生物组数据进行法医学调查提供新的见解和思路。
细菌、真菌等微生物的生长繁殖规律可通过人工培养方法进行研究,但这种传统的培养方式不仅对环境条件和操作技术要求高,且无法培养大量未知的和某些已知的菌种,还不能全面、准确地解释微生物物种多样性及其分布与功能,但测序技术的发展打破了这一瓶颈。高通量测序(high-throughput sequencing,HTS)不需要分离和培养目标微生物,可直接对与尸体相关的微生物群落进行测序,从而获得测序样本的全部物种分类和丰度信息[17]。虽然高通量测序技术存在读取DNA 长度较短[18]、严重依赖数据储存和分析能力[19]等局限性,但其在鉴定和表征微生物群落结构特征方面的能力不断增强,即使是丰度较低的目标微生物也可通过高通量测序及其相关的生物信息学技术被检测出来,扩大了基于微生物的法医学鉴定范围。因此,高通量测序具有高通量、高精度和大规模自动化能力等优势,是微生物群落应用于法医学研究的理想、合适的分析技术,其主要通过16S rRNA、18S rRNA和内转录间隔区(internal transcribed spacer,ITS)测序来识别或描述样本的微生物群落组成[20]。
16S rDNA 编码细菌核糖体RNA 的小亚基(16S rRNA),其分子大小适中、功能高度保守、序列不同位置的变异速率不同,因此,一般选择16S rDNA 作为分子标记进行细菌或古菌群落结构和功能分析[21]。与原核生物相比,16S rRNA小亚基在真菌和其他真核生物中更保守,且提供的系统发育信息和物种划分能力十分有限[22],故一般不使用16S rRNA 小亚基作为真菌群落物种水平分析的目标。而真核藻类、真菌等真核生物群落多样性研究常用的分子标记是18S rDNA和ITS。所有真核生物中均有18S rRNA,18S rDNA 的保守区允许设计高度通用的引物对真核生物进行广泛的物种鉴定;ITS 位于18S rDNA、5.8S rDNA 与28S rDNA 之间,不编码核糖体成分,种内变异相对较低,能在进化过程中承受变异,其进化速率为18S rDNA的10 倍[23-24]。
有研究者利用高通量测序标记基因(16S rRNA[7-8,13-14]、18S rRNA[5,11]或ITS[23-24])对每个微生物类群进行了分析,并将这些标记基因作为预测特征通过训练、测试回归模型来学习微生物组结构与腐败分解时间点之间的关系。机器学习方法在计算能力和大数据处理方面具有相当大的优势,能分析大量具有巨型DNA 序列的微生物组数据集[9],建立一个基于微生物测序数据的PMI 推断模型。
用于建立PMI 推断模型的机器学习算法种类较多,且各有优势和局限性,实际应用时可根据数据类型和实际情况选择合适的机器学习算法建立PMI推断模型。有研究[7,13-14]表明,随机森林回归(random forest regression)可以基于不同物种尸体不同部位的皮肤样本以及与尸体相关的土壤样本的微生物组数据准确地推断PMI。METCALF 等[7]根据微生物数据训练的随机森林回归模型预测了PMI,在分解早期(前两周)模型中的误差为2~3 d。此外,他们还使用一种与土壤类型相关的细菌数据来训练回归模型,且当其预测其他类型样本的PMI 时,对PMI 的估计仍然准确。随机森林回归模型推测PMI,其优点在于性能优异、易于并行化计算、回归精度较高,但其局限性是具有系统偏差[9]。JOHNSON 等[8]通过开发支持向量回归(support vector regression,SVR)、K-最近邻(K-nearest neighbor,KNN)回归、套索回归、随机森林回归和贝叶斯回归等模型,建立了人类腐败尸体鼻腔和耳道中微生物群落估计PMI 的算法。结果发现,精确至科和属的完整数据集更适合训练回归量,且基于KNN 回归推断模型的平均误差为±55 累积日度(accumulated degree days,ADD),能推断较长的PMI,显示出更高的准确性。KNN 简单直观、模式识别好,但对大数据集的可扩展性较低[5,8,25]。SVR 能较好地处理高维数据,但若相关性少则性能差[16]。LIU 等[13]通过随机森林、支持向量机(support vector machine,SVM)和人工神经网络(artificial neural network,ANN)模型分别预测小鼠死后模型的PMI,将支持向量机递归特征消除(support vector machine-recursive feature elimination,SVM-RFE)模型、随机森林回归模型和ANN 模型应用于小鼠3种器官的死后微生物数据集,并使用PMI推断的平均绝对误差(mean absolute error,MAE)和拟合优度检验(R2)来评估模型的性能和精度,其研究结果表明,ANN 模型结合盲肠的死后微生物数据集为最优组合,24 h 和15 d 内其MAE 分别为(1.5±0.8)h和(14.5±4.4)h。
机器学习算法通过综合考察、挖掘、分析基于高通量测序技术的微生物群落多维度大数据,可评估、识别基因组数据的多变模式,建立准确、高效的回归模型,进一步提升基于微生物群落演替估计PMI 的精确性[26]。
微生物时钟是基于已知PMI 与相应尸体样本微生物组数据建立的回归模型,但其存在什么样本类型或尸体部位有最准确的微生物序列、什么时间段的时钟最准确、哪些环境变量会提高模型的准确性等问题[16]。为此,国内外研究者做了大量工作,METCALF等[5]采集小鼠尸体腹腔内样本及头部、腹部皮肤样本进行测序,发现基于腹腔微生物组数据的PMI 推断模型的MAE 最大,而基于头部皮肤微生物组数据的PMI推断模型的MAE 最小,相比腹腔内样本,皮肤样本更能提供有用的信息来评估PMI。BELK 等[9]的研究也表明,基于微生物的PMI 推断,与尸体相关的土壤和皮肤是较优的样本,比较不同位置的皮肤可以帮助确定微生物时钟最准确的取样部位。ZHANG 等[27]采用高通量测序技术研究了埋于土壤20 cm 深处的SD 大鼠腐败尸体的直肠、皮肤以及尸体相关土壤的微生物群落,结果表明,直肠微生物群落的变化相对缓慢,而尸体相关土壤微生物群落的演替最快,与PMI 的线性回归拟合度最高。该研究还发现,与早期分解阶段相比,晚期分解阶段的α 多样性较低,并且在分解后期不同部位样本的微生物群落趋于相似,这一结果与METCALF 等[7,15,28]的研究结果相似。METCALF 等[7,14]的研究表明,与分解晚期阶段相比,分解早期阶段的微生物群落演替快、多样性高,可能是最准确的时间框架,并且在早期分解过程中更频繁的采样可以提高模型的精度。DAMANN 等[28]探究了尸体腐败分解晚期的微生物群落变化,发现部分白骨化遗骸中存在与人类肠道相关的细菌,而完全白骨化遗骸的细菌组成与土壤群落特征相似。此外,ZHANG 等[27]还发现埋葬于土壤和暴露于空气中的尸体,虽然氧气、湿度和光照等环境条件不同,但在分解过程中存在相似的微生物群落演替。环境因素是微生物群落聚集的重要驱动因素,不同埋藏条件下的死后微生物时钟以及其与暴露于空气中的腐败微生物时钟是否相同,还需进一步研究。
由于编码细菌16S rRNA 的16S rDNA 具有良好的时钟特性,故微生物群落研究主要集中于用细菌群落演替规律推断PMI[6-10,12-15,29]。COBAUGH 等[15]分 析了人类腐败尸体下土壤的细菌群落结构,结果表明,在自然土壤中丰度低而在腐烂过程中显著增加的腐生细菌可成为PMI 推断的生物标志物。DEBRUYN等[12]反复采集自然环境条件下腐烂尸体的盲肠菌群,通过16S rDNA 扩增子测序表征人类肠道细菌群落的死后变化,结果显示,随着时间的推移,肠道细菌丰度显著增加,而多样性则显著降低。还有大量的研究[7-9,13-14]证明细菌群落变化可用于PMI 的估计,且建立的回归模型效果较好,如HU 等[14]从死亡5~192 h 人类尸体的阑尾和横结肠中分别采集菌群样本,并运用阑尾菌群建立了一个R2为0.910、MAE 为(25.79±0.43)h 的随机森林回归模型,同时确定了每个样本实际PMI 和预测PMI 之间的差异,表明可使用人类阑尾细菌群落演替估计PMI。
也有研究者探究了真核生物群落与尸体分解的关系,虽然关于真核生物群落影响尸体腐败分解的研究较少,但其重要性不可忽视。METCALF 等[5]检测了在实验室环境中小鼠尸体的细菌群落和真核生物群落,发现仅基于真核生物群落建立的PMI 推断模型效果不亚于细菌群落。FU 等[11]研究了室内外猪尸体分解过程中的真菌组成及其演替模式,观察到Candida xylopsoci、子囊菌(Ascomycota sp.)和嗜热子囊菌(Thermoascus aurantiacus)等在腐败尸体真菌群落中占主导地位,该研究结果表明,可将这些特定的真菌分类群与PMI 相联系作为推断PMI 的指标,尤其是在尸体严重腐败的情况下,真菌具有相当大的PMI 推断潜力。FORGER 等[30]研究了死亡1 703 个ADD(或死亡60 d)猪尸体腐败分解模型的真核生物群落特征,发现利用分类至科水平的真核生物群落数据所建立的随机森林模型能解释89.58%的ADD(或天)的变化,均方根误差(root mean square error,RMSE)为177.55 个ADD(约为6 d),这一研究结果突出了真核生物群落在分解过程和PMI 推断中的重要性。
水中尸体死后淹没时间(postmortem submersion interval,PMSI)可根据腐败分期、尸体现象、昆虫发育、理化方法、生物膜等方法进行推断[17]。水中尸体腐败分解受到自身(如死者自身穿着、是否负有重物)及其所处水环境(如水文环境、生物因素)的影响[31-33],这些因素会影响PMSI 的准确推断。而水中尸体体表形成的生物膜[由胞外聚合物(extracellular polymeric substance,EPS)包裹的有三维结构的微生物群落],能抵抗外界环境变化[30],且生物膜形成过程中,微生物群落存在演替规律,生物膜结构也由简单逐渐变复杂。生物膜的这些特性均表明生物膜与PMSI密切相关[34],展现出利用水中尸体上生物膜推断PMSI 的潜能。
BENBOW 等[6]研究夏季和冬季河流中猪尸体皮肤的细菌群落变化规律,结果发现,两个季节的属丰富度均显著增加,不同季节的细菌群落存在显著差异,表明探寻不同季节水中尸体的细菌群落变化规律可用于估计PMSI。随后,LANG 等[35]使用自动核糖体间隔基因分析技术对比两条淡水河流中猪尸体上生物膜的细菌群落,发现死亡3~7 d 猪尸体皮肤固有的细菌群落转变为以环境为基础的生物膜细菌群落,且死亡14~17 d 猪尸体上生物膜的细菌群落存在演替,证实尸体上生物膜的细菌群落均显示出与PMSI 相关的演替规律。KASZUBINSKI 等[36]通过高通量测序描述静水环境中猪尸体的死后微生物群落组成变异性,确定了静水环境中与尸体分解相关的关键微生物分类群,建立了R2为0.975、误差为±3 d 的随机森林回归模型以估计PMSI,并确定了几个重要分类群为未来估计PMSI 重要的指标分类群。WANG 等[37]利用第三代全长测序技术检测溺水大鼠皮肤表面的细菌群落,发现尸体皮肤表面的细菌有规律的演替模式,绿弯菌门(Chloroflexi)和梭杆菌门(Fusobacteriota)仅出现在死亡后的前7 天,可用于确定PMSI 是否超过1 周。该研究利用细菌群落数据结合尸体腐败分解征象,将PMSI锁定在具体的时间段内,为利用细菌生物膜估计水中尸体的PMI 提供了参考。
尸体腐败分解过程中,温度、湿度、周围植被和土壤酸碱度等环境因素以及组织类型和昆虫等生物因素均会影响微生物群落的演替[22],目前的研究主要集中于探究昆虫活动及温度对微生物群落演替推断PMI 的影响。
有学者进行了微生物-昆虫相互作用对PMI 推断影响的研究。CROOKS 等[38]研究了大肠杆菌和金黄色葡萄球菌对丝光绿蝇(Lucilia sericata)、红头丽蝇(Calliphora vicina)及反吐丽蝇(Calliphora vomitoria)定殖和生长的影响,了解微生物-昆虫相互作用以改进最小PMI 的估计。该研究还发现,不同种类苍蝇幼虫的生长速度受到不同种类饲粮(包含不同种类细菌)的影响,喂养含有大肠杆菌饲粮和含有混合细菌饲粮的反吐丽蝇的体质量最大,而喂养含有金黄色葡萄球菌饲粮的红头丽蝇的体质量最大,并指出细菌代谢活性增加对幼虫发育的影响可能是积极的、消极的或中性的。而昆虫活动对微生物群落的影响,可能是在尸体分解过程中通过嗜尸性昆虫运输到尸体上的细菌,通过竞争、协同等过程影响尸体上的微生物物种丰度,并且随着时间的推移,由于昆虫的定殖和侵蚀导致物种丰度下降,随后昆虫定殖者的幼虫发育可能会通过在尸体上直接或间接的相互竞争而破坏已建 立的 微生 物群 落[39]。WEATHERBEE 等[40]用16S 扩增子测序表征猪尸体表面相关的、环境中嗜尸性双翅目幼虫内部的以及定殖于猪尸体上的双翅目幼虫群的微生物组,发现多种苍蝇物种在群体中的相对丰度发生了变化,群体中某些丽蝇科(Calliphoridae)物种的存在可能与微生物群落的时间变化有关,表明环境、微生物和昆虫幼虫之间存在显著的相互作用。因此,在利用微生物群落信息进行PMI 推断时应考虑昆虫的存在与否,且应将其作为未来相关研究的重要特征进行检验验证。
已有研究[7-9]表明,温度是微生物分解回归模型的重要环境特征,在同一环境中使用两个季节的PMI模型时,预测精度优于随机水平。IANCU 等[41]研究寒冷季节户外猪尸体直肠和口腔内嗜尸性昆虫物种和细菌群落的演替,发现嗜冷杆菌属(Psychrobacter)和γ 变形杆菌(Gammaproteobacteria)栖息在温度非常低的土壤中,甚至在10 ℃下也能繁殖,还发现不同地区嗜冷杆菌属持续生长的环境温度与该研究调查过程中的最低温度相对应。为探究不同季节不同温度下尸体腐败过程中的嗜尸性昆虫物种及微生物群落变化,IANCU 等[42]又研究了温暖季节猪尸体分解过程中嗜尸性昆虫定殖过程中细菌物种的时间演替,以确定其是否有助于估计PMI。该研究采用主成分分析方法揭示了温暖季节实验中空气温度、土壤温度和相对湿度对分解阶段动态的影响,结果显示:第一主成分轴与空气温度和土壤温度呈高度的直接相关,与相对湿度呈高度的负相关;第二主成分轴与空气温度呈负相关,与土壤温度和相对湿度高度相关。以上研究均表明,温度是尸体腐败分解过程中微生物群落研究不可忽视的因素。
法医学实践中现场实际情况复杂、影响因素不一,每种因素都可能单独影响PMI 推断模型的建立或多种因素产生联合作用影响PMI的推断。如METCALF[16]所指出的陆地、水生等不同环境类型,氧含量、湿度等环境变量,以及尸体衣着、死因等尸体本身相关变量,这些因素是否影响以及如何影响尸体腐败分解过程中微生物群落的演替,都应作为未来研究的重要参数进行检验。是否可以开发一个单一的、可推广的模型,或者建立多影响因素下的PMI 推断模型,是未来利用微生物群落演替规律推断PMI 的重点。
本文综述了近年来利用微生物群落演替规律推断PMI 的研究进展,通过高通量测序技术和生物信息学分析技术表征微生物群落结构和丰度变化,再结合机器学习算法关联死后微生物群落与PMI,并建立PMI推断模型以便更准确地推断尸体PMI。微生物群落在法医学中的应用因高通量测序数据的存储与分析以及基因数据生成的进展而得到了重大突破,与死后尸体相关的微生物群落可应用于陆地、水中尸体的PMI 推断,从而作为辅助证据在刑事案件的法医学调查中扮演重要角色[43],未来微生物组的研究可能在法医学中应用更广泛。
微生物群落变化受环境因素和生物因素的影响,因此,在后续利用微生物群落演替推断PMI 的研究中应充分探究各因素对微生物组的动态影响,综合探讨各影响因素的变化规律对于准确关联PMI 和微生物群落变化具有的重要意义。微生物测序过程中的不同阶段均可能影响结果的准确性,因此,有必要为样本的采集、处置和保存制定标准,还应进一步验证所有方法的灵敏度、特异性、重复性和检测限等性能,并创建可靠、全面、公开可用的基础数据库[44]。利用机器学习算法辅助推断PMI 应扩大研究范围,优化和标准化用于微生物群落分析的机器学习算法,生成一个全面的数据集来训练、测试和建立具有更大样本量的健壮模型,保证模型的普适性、有效性和可靠性,进一步提升基于微生物群落的PMI 推断的准确性。此外,微生物组学方法推断PMI 在研究成本和技术上要求较高,解决关于微生物组现有的知识、技术和数据等问题,在高通量测序技术检测微生物的基础上,研发和筛选出低成本且操作便捷的微生物组学PMI 推断方法势在必行。