大数据与人工智能：死后间隔时间推断的新视野

2020-04-08 08:33邹熠庄冲方琦李飞

法医学杂志 2020年1期

邹熠，庄冲，方琦，李飞

（1.浙江大学医学院附属第二医院病理科，浙江杭州 310000；2.福州市公安局刑事侦查支队技术处，福建福州 350000；3.浙江大学昆虫科学研究所，浙江杭州 310000）

尸体死后间隔时间（postmortem interval，PMI）又称死亡时间或死后经历时间，指发现、检查尸体时距死亡发生的时间间隔[1]。有效而准确的PMI推断对认定和排除嫌疑人有无作案时间，划定侦查范围乃至案件侦破均具有重要的法医学意义。目前，传统的PMI推断方法主要基于对尸体特征的观察和测量，如内部温度改变、死后尸体现象、食物消化状态、消化道排空情况等。同时，尸体腐败过程中相关因子的变化信息亦可为PMI推断提供帮助，如嗜尸性昆虫的发育指标[2]、昆虫相关毒理学数据[3]、微生物法医学数据等[4]。

然而，目前任一PMI推断方法的单独应用或几种方法的简单人工经验性组合均无法满足日益复杂化、高智商化犯罪的刑侦工作需求，大量学者仍投身于发掘新的PMI推断手段或提升现有手段的精度[5]。近年来，随着计算机技术的快速发展，大数据与人工智能（artificial intelligence，AI）已逐渐渗透至科学研究与日常生活的各个方面，基于AI的PMI推断亦得到尝试，并取得一定成果，本文将对大数据及AI在PMI推断中的研究进展进行综述。

1 依托大数据的AI及其工作模式

AI，又称“计算智能（computational Intelligence）”，指利用媒介（agent）的复杂运算进行数据模式识别和智能行为[6]，其核心内容为数据挖掘（data mining）和自动化反馈。因理论上无限的数据接受度和远超传统统计学方法的数据处理能力，使海量大数据的解析和运用成为可能。大数据（big data）为一类庞大而无法使用传统数据分析方法进行有效处理的数据集，其包含样本（rows）多，数据量大，故可保证强大的统计学效力，但同时因其变量（columns）丰富而复杂，故若无有效分析方法，“假发现率（false discovery rate）”将远高于传统数据[7]。AI技术的出现和发展成了对大数据进行有效处理和去伪存真的有力手段，而另一方面充足的大数据亦为AI形成和训练的必须基础，两者相互依存、相得益彰。

AI的工作模式主要为输入相关问题的既有知识（prior knowledge）、以往经验（past experience）、解决目标（goals/values）和观察值（observations），运算得出反馈动作（actions）[6]。具体而言，同医学相关的AI领域主要包括机器学习、人工神经网络（深度学习）、机器人学等，通过相应算法对数据进行“清洗（cleaning）”“整合（integration）”“选择（selection）”“转换（transformation）”“挖掘（mining）”，实现大数据的“模式评价（pattern evaluation）”，形成具有实际意义的“结果呈现（knowledge presentation）”[8]，并同输入的解决目标进行比对和模型校正。上述过程不断往复、训练，最终形成可靠模型并发挥其功用。

2 AI在死后间隔时间推断中的应用意义

目前，虽然PMI推断方法众多，但在实际案件中，任一手段均不完美，存在受周围环境影响大、主观性大、部分观测对象难于量化、可重复性差等诸多弊端。人为地经验性联用多种PMI推断手段并相互比较验证，可获得精度更高的时间推断结果，但是，在此过程中，大量观测和推断可形成主观误差并相互叠加放大，导致明显的结果偏倚，同时推导者自身的相关知识储备及工作经验亦将强烈影响最终推断结果的准确性。

因此，如何保证单途径推导结果的可靠性和多途径结果整合的有效性成了进一步提升PMI推断准确性的重大问题，而此问题恰为AI所擅长。AI可通过综合考察、挖掘多维度大数据，评估权重，识别数据变化模式，建立有效“时间指纹”数学模型。

理论上看，通过基于前期多情景实验性数据的全面训练，可建立有效且适用面广的PMI推断模型；继而将实际案件数据输入模型，进一步进行模型训练和校正；模型稳定后可开展PMI推断工作并根据案件破获后取得的真实PMI继续调优。因AI工作时具有既是“实战”也是“训练”的优良特性，故随着模型实际使用次数的增多（训练数据集的累计），基于AI的PMI推断的有效性和普适性将得到不断提升（图1）。

图1 基于AI的PMI推断理论工作流程Fig.1 Workflow of PMI estimation with AI

3 AI在死后间隔时间推断中的应用研究

随着AI技术的快速发展与成熟，其已应用于诸多法医学研究中，如年龄推断[9]、面部识别[10]、痕迹分析[11]、死亡原因分析[12]、基因与蛋白质分析[13-14]等。AI在PMI推断中的应用见表1。

微生物法医学（microbial forensics）是一门依据尸体相关微生物检测解决法医学问题的交叉学科[4]，而通过死后腐败微生物多样性演替推断尸体PMI为其研究的核心热点。METCALF等[15]将小鼠尸体置于实验室条件下的土壤中，多次多处（口旁、腹部皮肤及腹腔）采集微生物样本，样本经16s rRNA与18s rRNA二代测序（next generation sequencing，NGS）鉴定，获得精度达（3.30±2.52）d（总观察时长48d）的PMI推断模型，且发现于腐败前期（前34d）模型效力最高。据此认为，通过AI技术和微生物测序可建立准确的PMI推断模型，并首次提出“微生物钟”概念。为更接近真实案件，JOHNSON等[16]将21具人类尸体置于森林环境中，予以800积温日（每日平均气温的加和）的自然腐败，每2～3自然日收集尸体鼻腔及外耳道微生物样本，并行16s rRNA NGS检测，数据以多种算法行机器学习，结果显示，完整的数据集最利于模型训练，精确至“科”或“属”的微生物种群信息最利于PMI的模型推断，K-最近邻回归为最优算法（误差±2d）。为进一步检验腐败早期的AI模型预测效果，PECHAL等[17]以猪尸体为实验对象，采集了死后5d内尸体口腔及皮肤的微生物样本，并基于16s rRNA测序数据建立模型，发现预测PMI与实际PMI符合率高达94.4%。同时，部分学者亦成功使用微生物常规鉴定方法及传统统计学手段分析尸体腐败过程中的微生物种群演替[18-20]，但与AI技术结合二代测序的研究方式相比，传统型研究仅可明确微生物种群的大致构成模式及其随时间改变的模式框架转变，而无法实现全定量分析和精准的模型预测。

基于尸体特征变化的AI辅助PMI推断模型亦可见报道。CANTÜRK等[21]采集了1名女性与9名男性死后15h内的角膜图像，并使用AI技术进行分析，结果显示，AI模型的PMI预测准确率最高可达89.0%。SATO等[22]检测了死后48h内大鼠血浆中内源性代谢产物的变化，获得误差为±3.41h的预测模型。BOCAZBENEVENTI等[23]分析了61具人死后3～144 h内玻璃体液中钾离子（K+）、铵离子（NH4+）、钠离子（Na+）和钡离子（Ba2+）的离子浓度变化并建模，模型预测误差可仅为±3.06h。ZHANG等[24-26]通过衰减全反射-傅里叶变换红外光谱法（attenuated total reflectance-Fourier transform infrared spectroscopy，ATR-FTIR）系统分析了兔死亡后48h内血浆、心包液和玻璃体液改变规律，发现基于上述检材，AI模型的预测误差均可控制于3h以内，而血浆的预测模型最优，预测误差仅±1.92h。

此外，BUTCHER等[27]着眼于尸体以外的死亡时间提示因素——嗜尸性蝇类的生长发育，将AI与法医昆虫学、色谱学结合，以气相色谱-质谱联用（gas chromatography-mass spectrometry，GC-MS）检测由糖及猪肝组织饲养的9d内蝇类幼虫的碳氢化合物组成模式，并借此建立蝇幼虫年龄预测模型，获得最高97.5%的预测准确率。

表1 主要AI辅助PMI推断研究比较Tab.1 Studies on PMI Estimation with AI

4 现存问题

目前，虽然AI辅助PMI推断取得了一定的研究进展，但仍有不足。在微生物法医学研究中，METCALF[15]与PECHAL等[17]单纯使用随机森林模型，存在数据噪声较大时易过拟合，处理回归问题无法给出连续值[8]等实际应用缺陷，且两者所获模型均于腐败早期预测效率最高，随腐败演进模型预测准确率下降。而JOHNSON等[16]虽采用了多模型分析，但尸体腐败条件为户外，且实验中微生物样本来源于蝇类偏好产卵并形成幼虫群的部位，其实验后阶段所采集样本极可能已为蝇类幼虫群的微生物，而非尸体体表微生物种群。同时提示，嗜尸性昆虫作为现实案件中尸体腐败过程的另一核心参与者，如果撇开其单独依靠微生物演替数据进行AI建模，所得的实用性有待考证。

嗜尸性昆虫与腐败微生物的交互作用已为研究所证实。IANCU等[28-29]分别于温暖季节和寒冷季节将猪尸体置于室外，对嗜尸性昆虫及尸体口腔、肛门微生物的演替进行观察，结果显示，嗜尸性昆虫的抵达与寄生可强烈改变尸体相关部位的腐败微生物种群构成。另一方面，腐败微生物亦可通过诱集、促进（抑制）生长等效应而反作用于嗜尸性昆虫的生长发育过程[30-31]。同时，因腐败过程中，嗜尸性昆虫可出现数个世代演替，故上述交互作用可不断循环往复，并随尸体有机物的消耗出现两者种群构成的更替，引起交互循环方向的改变，形成复杂的动态循环漂移过程。前述研究AI模型在腐败后期预测效力的下降，可能与嗜尸性昆虫-微生物作用循环的逐渐漂移相关。

而在基于尸体特征变化的AI模型研究中，绝大部分集中于尸体早期的改变，且获得合格模型输入数据的前提是各检材对应解剖结构的相对完整，检材未受污染。但是在实际案件中，创伤型尸体常见，各种外伤对解剖结构的破坏严重，尸体死后循环、各种化学成分死后再分布及嗜尸性昆虫的寄生都可能使体液成分的变化规律出现偏差，增大模型推断结果误差。

5 展望