人工智能技术时代法医学科面临的新机遇与挑战

2020-11-28 23:24:23方雅婷兰琼解通刘艳芳梅书燕朱波峰

法医学杂志 2020年1期

方雅婷，兰琼，解通，刘艳芳，梅书燕，朱波峰，2

（1.南方医科大学法医学院，广东广州 510515；2.西安交通大学口腔医学院陕西省颅颌面精准医学研究中心，陕西西安 710049）

人工智能技术是一门多学科间广泛交叉的前沿科学，自1956年的达特茅斯会议后，其概念和研究领域不断扩展[1]。随着人工神经网络理论的提出，人工智能技术飞速发展，并被广泛应用于医学研究等各个领域[2-4]。近年来快速发展的法医学同样面临着获取、分析和应用大数据，以应对复杂鉴定问题的挑战[5]，很多传统的学习算法已难以适应发展的新需求[6]。如何将人工智能技术融会贯通到法医学各个领域，消除人工分析时产生的主观偏差，形成“人工智能+法医学”的新模式，是当前解决疑难复杂案件、提高实际检案工作的效率与科研能力的新策略。本文对2015年以来人工智能技术在法医学中最新的研究进展及应用前景进行了系统梳理、总结与展望。

1 人工智能在法医学中的运用

1.1 人脸识别

人的面部容貌虽然在生长发育中会发生变化，但是个人特征是相对固定的，因此是同一认定和个体识别理想的生物学特征。PENG等[7]在马尔可夫网络（Markov networks）的基础上，自适应地学习组合图像的多个表征，并采用最小误差边界切割（minimum error boundary cut）算法对重叠区域进行拼接，建立基于多重表征的自适应人脸素描合成方法，实现了高效的人脸识别。SAJID等[8]测量并评估了面部不对称特征的尺寸及其随年龄变化的特点，发现非对称性面部特征是预测年龄的一个强有力指标，基于支持向量机算法针对量化的面部不对称特征估计给定人脸图像的年龄组，并采用卷积神经网络提取非对称的面部特征，通过分析人脸图像年龄组估计误差对人脸识别算法的影响，发现将从年龄组估计中提取到的信息嵌入人脸识别算法中，可以大大提高人脸识别的准确性。

下颌骨是颌面部重要的组成结构，因其仅以软组织连接于上颌部，所以在尸体白骨化中易遗失。为实现丢失了下颌骨的颌面部重建，NINO-SANDOVAL等[9]在2016年采用支持向量机监督学习算法选取哥伦比亚人头颅侧位X线图像中10个颅颌关节变量对下颌骨相对于上颌骨的矢状位置关系进行分类，发现骨性Ⅱ类和骨性Ⅲ类的颅颌面结构有不依赖于下颌骨的独特骨性关系。2017年他们采用人工神经网络等深度学习算法，基于同样的数据集，选取了17个颅颌面形态的解剖相关变量预测上、下颌骨的位置关系，发现人工神经网络的分类预测能力优于支持向量机[10]。

另一方面，随着人脸识别的相关研究逐步报道，如何有效地收集和管理与人脸有关的数据成了另一项挑战。KAUR等[11]采用基于文本挖掘的人工智能技术对文献自动注释，尝试开发一个可以提取面部形态学特征以及面部疾病相关信息的人脸数据库。虽然这项工作目前仍处于初始研究阶段，但其为人工智能在人脸识别中的应用开辟了新思路与方向。

1.2 年龄推断

骨骼的发育过程具有连续性和阶段性特征，对尸骨遗骸的年龄预测有助于推断其死亡时的年龄。传统的骨龄鉴定方法是以人工测定的方法对骨骺生长进行分级，不仅在骨骺分类上存在一定的技术困难，而且无法消除主观性偏差。为克服这些难题，WANG等[12]采用支持向量机对中国青少年的腕关节X线图像进行训练，构建年龄预测模型，实现了对桡骨远端和尺骨远端骨骺的自动分类。ZHANG等[13]考虑到性别差异，运用体绘制技术提取280名女性和282名男性第5颈椎至第1腰椎区域的CT图像信息后，分别采用简单线性回归、多元线性回归、梯度增强回归、支持向量机和决策树等算法构建了男性特异性和女性特异性年龄预测模型。SPAMPINATO等[14]用公共数据集测试并评估了OverFeat、GoogLeNet和OxfordNet三种卷积神经网络模型在骨龄自动评估中的应用，并基于处理后的X线图像，建立了全新的用于骨龄推断的BoNet卷积神经网络模型。LEE等[15]基于手部及腕关节X线图像，创建了一个可以自动检测并分类的卷积神经网络模型，能够在放射科医生的指导下自动生成结构化报告，实现了精准的骨龄评估。NAVEGA等[16]以欧洲女性的股骨为研究对象，构建了基于骨密度测量法的人工神经网络模型用于骨龄评估。

除骨骼外，牙齿的发育情况也是年龄预测的重要指标之一。de TOBEL等[17]先对口腔全景X线图像对比度设置进行优化，评估了下颌第三磨牙的特征，并使用Adobe Photoshop CC 2017软件以标准化的方式在其周围放置矩形边框，随后利用MATLAB R2017a软件中的机器学习算法对下颌第三磨牙的特征进行自动识别，研发了一种基于下颌第三磨牙的年龄预测自动检测技术。STEPANOVSKY等[18]比较了从简单数学模型到复杂机器学习算法的22种年龄预测模型，证明基于机器学习算法的数据挖掘方法优于基于平均年龄的传统数学模型方法，并提出了用具有代表性的中位年龄代替牙齿发育阶段的方法与缺失牙病例的缺失数据替换技术，构建了基于列表多元线性回归模型（tabular multiple linear regression model）的年龄预测模型。

当缺乏完整的骨骼证据时，用分子生物学方法分析案发现场遗留的血液、组织等生物学物证所包含的信息，是法医学年龄推断的另一重要手段。继多元回归、反向传播神经网络、支持向量机以及随机森林模型被应用于基于DNA甲基化的年龄预测模型构建后[19-20]，VIDAKI等[21]选出16个CpG位点，首次应用人工神经网络构建年龄预测模型，不仅提高了预测的精准度，还排除了未成年以及不同种族背景的影响。FENG等[22]使用逐步向后的多元线性回归分析和穷举搜索算法（exhaustive searching algorithm）进行了系统的特征位点选择，确定了用于年龄预测的最优9个CpG位点，最终构建的年龄预测模型的精确度高于其他已经报道的年龄预测模型，提示特征位点选择对最终模型的性能起着至关重要的作用。目前，法医学面临的主要挑战是法医现场检材的质量低、可用于分析的检材量少。同时，每种组织或体液都可能表现出不同的年龄相关DNA甲基化模式，且这种模式受到环境、疾病等多种因素的影响。因此，在广泛的人类组织和细胞类型中开发一种灵敏、多组织适用的年龄预测模型是一项非常具有挑战性的工作[23-24]。

1.3 性别鉴定

在严重的自然灾害、重大事故案件中涉及高度腐烂、残缺尸体遗骸时，基于两性在骨骼形态特征上的差异，通过法医人类学的方法对尸体遗骸进行特征分析，无需借助DNA分型也可快速得到骨骸的性别等信息，有助于节省搜索调查的时间和资源[25]。MUSILOVA等[26]采用相干点漂移密度对应分析（coherent point drift-dense correspondence analysis）方法对103例法国成年人的颅骨CT扫描图像进行分析，并基于径向支持向量机结合交叉验证的算法构建了一个精准度高达90.3%的性别分类器。BEJDOVA等[27]用几何形态计量学分析154例中欧（捷克共和国）成年人的颅骨CT扫描图像后，仅利用上面部骨骼形态构建了支持向量机和交叉验证结合的性别鉴定模型。2018年，GAO等[28]提取中国汉族成人的颅骨三维特征，基于模糊C均值聚类（fuzzy C-means，FCM）算法提出了一种用于颅骨性别鉴定的新的无监督算法——MKDSIFFCM。经比较发现，在同样的中国汉族成人颅骨样本中，MKDSIF-FCM算法的性别鉴定精准度高于决策树、支持向量机等其他常用分类器。CAVALLI等[29]以1700例成人颅骨侧位CT扫描图为研究对象，使用模式识别和人工神经网络，将监督与非监督技术相结合，提出一个不依赖于颅骨测量值的颅骨形状自动建模的新方法。值得注意的是，性别二态性的程度和模式受到地域、环境等多种因素的影响[30]，不同年龄、地域的人类骨骼特征可能具有差异[31]。对此，MUSILOVA等[26]提出可以通过向数据集系统中添加不同的种群样本用以消除分类器的种群特异性，提高性别预测的准确性。

1.4 DNA电泳图谱分析

基于毛细管电泳平台的短串联重复（short tandem repeat，STR）序列分型是法医通过DNA分析解决刑事或民事诉讼案件的主要手段。如何从背景噪声中提取真实的等位基因信息一直是STR电泳图谱解读的挑战。传统的分析方法是设定统一的信号强度阈值区分片段峰，但是往往需要专业人员调整参数才可以得出正确的STR分型结果。TAYLOR等[32-33]避开了信号强度阈值的使用，先是用两个原始电泳图谱训练了一个简单的人工神经网络模型用于光谱分离，而后扩大样本量构建了一个结合贝叶斯算法的人工神经网络模型，探索了人工神经网络在STR电泳图谱峰分类上的应用，不仅有效避免了由于扩增不均衡造成的部分等位基因信息丢失，而且可以排除由于电泳过程中设备电流跳动等情况产生的伪峰干扰。2019年，TAYLOR等[34]考虑到同一实验室可能会有多个不同的毛细管电泳分型仪器，且法医日常检案中的DNA样本可能是混合样本等复杂情况，进一步探索了人工神经网络模型在不同电泳仪器产生的图谱以及混合DNA样本的图谱中的可泛化性。另一方面，MARCIANO等[35]开发了一个智能等位基因检测降噪系统，评估了动态化阈值与机器学习相结合检测伪峰和降噪工具的有效性。该系统用根据样本内的每个基因座计算的动态峰检测阈值取代传统的静态分析阈值，检测等位基因并去除低水平信号噪声后，应用stutter峰过滤器过滤掉stutter峰，用微调算法减少非等位基因、非stutter峰引起的噪声，并用机器学习模型评估基因座中是否存在额外的检测噪声。

对于DNA混合物中DNA供者人数的准确估计是法医工作者对DNA混合物精确分析的重要前提。近些年学者们提出了不同的算法，有效地提高了准确度[36-39]。但研究表明，当DNA混合样本中贡献者人数较多时，现有算法往往无法对贡献者人数进行准确估计。MARCIANO等[40]使用机器学习的方法来推断混合DNA样本中提供者的数量，评估了K近邻（K-nearest neighbors）、分类与回归树（classification and regression trees）、多元逻辑回归、多层感知器（classification and regression trees）及支持向量机5种候选机器学习算法后，构建了最优的贡献者数量估计（probabilistic assessment for contributor estimation，PACE）系统。经过验证，发现在多达4个供体的DNA混合物中，PACE系统识别供者人数的准确度仍然超过98%，是法医评估DNA混合物中贡献者人数的一个有力工具。

1.5 群体遗传学研究

MONSALVE等[41]分析了244个哥伦比亚人群的颅骨特征变异，构建了适用于哥伦比亚祖先信息推断的人工神经网络模型。POSPIECH等[42]在考虑性别因素的影响下，使用神经网络和逻辑回归模型研究了波兰人群中6个IrisPlex SNP[43]在预测虹膜颜色方面的作用，结果发现，6个IrisPlex SNP中有4个与波兰人群的虹膜颜色有关，表明虹膜颜色的遗传具有群体特异性，且不同性别也具有差异。

JUHÁSZ等[44]考虑到迁徙人口中必然包含男性和女性，同时分析了当代欧亚和美国土著人群的线粒体和Y染色体单倍群，并与古线粒体单倍群分布比较，提出了基于单倍群逆秩向量聚类的方法揭示当代欧亚和美国土著人群的迁移过程和史前历史。随后他们[45]联合分析了欧亚大陆共同民族的单倍群遗传数据和民间音乐数据的相关性，发现单倍群-统一轮廓类型（haplogroup-unified contour type，Hg-UCT）的逆向量决定的多维点系统具有非常清晰的结构，证明了民间音乐的传播可能与早期人类迁移过程有关。

1.6 死亡时间推断

死亡时间是指从人体死亡到尸体检验所经历的时间。法医对死亡时间的精准推断，有助于判断嫌疑人是否有作案时间，为案件的侦查提供线索。传统的技术手段包括形态学、生物化学、光谱学、代谢组学、脂质组学、基因组学、转录组学、昆虫学以及死亡微生物组学等[46]。

2019年，LI等[47]通过显微红外技术结合机器学习方法研究人类死后软骨光谱学变化，建立了死亡时间推断模型，推动了光谱成像技术结合多元数据分析（multivariate data analyses）在死亡时间推断上的应用发展。2018年，ZHANG等[48]采用傅里叶变换衰减全反射红外光谱法分析尸体的玻璃体液，并引入先进的机器学习算法，建立了贝叶斯岭回归、支持向量回归和人工神经网络模型进行死亡时间推断。

已有研究[49-51]表明，在尸体腐败过程中，尸体和附近土壤中的微生物群落能够形成一个动态系统，因此可以通过检测尸体附近的土壤微生物估计死亡时间。METCALF等[52]分别对尸体附近土壤进行16S rRNA基因（古菌和细菌群落）、18S rRNA基因（微生物真核生物群落）测序，提取尸体分解过程相关的微生物多样性表征，并使用随机森林回归以及动态贝叶斯网络探究微生物演替在不同土壤类型、季节和寄主物种中的可预测性。JOHNSON等[53]使用7种回归算法对尸体鼻道和耳道中的皮肤微生物群落进行分析，最终开发了一个K近邻回归模型评估死亡时间。

利用犯罪现场尸体上昆虫的发育或演替规律来推断死亡时间是法医昆虫学家们研究的重点。MOORE等[54]先用气相色谱-质谱联用技术分析了丽蝇幼虫表皮碳氢化合物，根据其化学成分随时间的变化构建了基于人工神经网络的丽蝇幼虫年龄推断模型，随后用同样的方法构建了丽蝇成虫年龄推断模型[55]，为精准死亡时间推断提供了新方法。

1.7 损伤以及死亡原因鉴定

REN等[56]应用基质辅助激光解吸电离飞行时间成像质谱技术筛选正常大鼠与弥散性轴索损伤大鼠脑干组织的差异表达蛋白，构建了监督神经网络分类器，为弥散性轴索损伤的鉴定提供了依据。WEI等[57]基于猪颅骨骨折样本开发了一种自动化的模式识别分类方法，用以区分不同场景下的颅骨骨折模式，为法医学鉴定区分婴幼儿意外和虐待性头部创伤提供了新思路。YILMAZ等[58]以10个尸体检验相关参数为基础构建了可以判断活产还是死产的人工神经网络和径向基函数网络模型。这些研究均表明了人工智能在法医损伤鉴定及尸体检验死亡原因鉴定中的应用前景。另一方面，运用文本分类技术对尸体检验后生成的法医纯文本尸体检验报告分类，提取特征向量构建自动化死亡原因预测模型，有效缩短了尸体检验后死亡原因判定的时间，提高了预测准确度。MUJTABA等[59]运用6种不同的自动文本分类技术分析43个从尸体检验记录中提取的主特征向量，构建了一个基于尸体检验记录的死亡原因预测分类模型。随后该团队[60]开发了一种基于概念图的文档表示技术，并提取医学临床术语概念特征，通过图形表示后使用这些特性来训练一个两级文本分类器预测死亡方式及死亡原因。

随着法医影像学技术的发展，利用医学成像技术和计算机软件程序进行虚拟解剖，通过无创的手段查找尸体体内损伤与疾病，已成为死亡原因推断的重要手段。EBERT等[61-62]开发了一种基于死后尸体计算机断层扫描的穿刺针自动放置系统，通过计算机断层扫描引导，用机器人手臂实现尸体穿刺针放置的自动化，提取组织和液体样本进行组织学和毒理学分析。但是该系统在处理多处穿刺等复杂情况时难以找到能够避开与尸体解剖结构以及已经放置的针的最佳进针点。为了解决这个问题，他们在2016年开发了一种新的算法[63]，可以自动为给定的目标置针点规划有效、无碰撞的进针轨迹用于引导机器人自动置针。受深度学习在医学图像分析中应用的启发，2017年，EBERT等[64]用死后尸体计算机断层扫描图像训练了两个独立的深度学习网络用以判断心包有无积血以及心包积血的含量，证明了应用深度学习自动检测出血性心包积液的可行性。

1.8 毒物分析

ELIAERTS等[65]开发了一个用超几何分布抽样结合傅里叶变换红外光谱和支持向量机算法的工具，用于采样并快速分析可卡因和左旋咪唑，帮助执法部门快速缉获可卡因。同年，MOLLERUP等[66]利用人工神经网络建立了液相色谱-高分辨精确质谱联用技术的识别参数预测模型，可以支持毒物的初步筛查。2019年，WENDT等[67]以阿片类镇痛药曲马多为模型药物，以接受过曲马多暴露的芬兰人尸体检验采集的血液为样本集，采用监督机器学习分类算法通过识别和评估CYP2D6基因座中的单核苷酸变异实现CYP2D6代谢表型的自动分类，从而在法医学中帮助调查死亡原因和死亡方式。

1.9 其他

MIGUEL-HURTADO等[68]用21种常用的机器学习分类器通过手部的特征预测性别、身高、体质量以及足部尺寸4种生物特征，加速了自动化的生物特征识别技术在法医学个体识别中的应用；HEINRICH等[69]开发了基于计算机视觉的多算法软件工具，对尸体生前和死后的口腔全景X线片进行分析比对，依据牙齿特征实现个体识别。TACKMANN等[70]分析了5个人体部位和土壤样本的测序数据，训练了一个具有人体部位分类性能的随机森林模型，并报道了一组核心生物标志物，首次用人工智能进行了人体部位特异性微生物生物标志物鉴定。DENG等[71]基于不同个体具有不同心电波形的时间关系和形状，利用动态神经学习机制开发了一种心电动态识别模型用于个体识别。

此外，应用人工智能技术进行交通事故鉴定[72-73]、法医土壤生物地理模式分析[74]、烧焦骨头的最高加热温度估算[75]，利用质子核磁共振波谱结合支持向量机进行血液种属鉴定[76]，于遗传算法等人工智能进行血迹模式分析[77]以及结构磁共振成像结合机器学习算法对青少年罪犯进行心理病态特征分析及预测[78]均为法医案件调查提供了新的科学技术方法。

2 挑战与展望

以上国内外研究表明，人工智能的计算机视觉、语音识别、自然语言处理等各个技术在法医学个体表型特征推断、遗传背景研究、DNA图谱分析、个体识别、死亡时间推断、死亡原因鉴定、虚拟解剖、活体损伤鉴定以及毒物分析等多个方面均有着广泛的应用前景。

机器学习是实现人工智能技术的主要途径和重要手段[79]。在早期研究报道中，人工智能技术的实现主要围绕线性回归、逻辑回归、决策树学习、贝叶斯网络、K近邻法、支持向量机等传统的机器学习算法的运用展开。深度学习走进人们的视野后[80]，由于在图像识别方面具有独特优势而被广泛应用到人脸识别、DNA电泳图谱分析以及基于X线片、CT片的个体表型特征推断、个体识别。此外，深度学习比传统的浅层机器学习算法拥有更多的处理层，更适用于需要提取特征的大数据集挖掘[10，80-82]。由此可见，用深度学习取代浅层机器学习识别图像、用自动学习提取层次化特征取代依靠人工经验提取样本表层特征已经成为当下大数据时代中人工智能的发展趋势。

法医学领域中，虽然现在人工智能的应用研究已经有了突飞猛进的发展，但其研究成果是否可以推广到法医的实际应用，除了新技术带来的伦理等方面的挑战以外，还有许多问题亟待解决。第一，选择适当的算法是运用人工智能有效解决问题的前提。一方面，先进的机器学习算法（如深度学习）有助于人工智能的实现，法医学研究者还需努力学习、探索更先进的人工智能技术，将其融通到法医学领域中；另一方面，在解决一些简单问题中，传统机器学习算法的快速、简便等优势不可忽视。解决实际问题时，应先考虑想要解决什么问题，选择适应的算法构建人工智能模型。第二，初始训练的数据集足够大、具有代表性是人工智能算法有效性的保证。上述研究多为人工智能模型的探索性研究，虽然可以实现相应的广义模型，但样本量是否足以支持模型的可泛化，在此问题上仍存在争议。第三，应用机器学习算法创建预测模型时需要可测量的特性或观察到的现象作为特征向量，选择的特征向量过多或过少，均会导致生成的模型无法泛化[74]。第四，随着分子生物学分析方法的发展，分析平台类型也逐渐多样化，如何消除平台效应成为另一个挑战。无论是将z-score转换作为标准化来排除平台效应[22]，还是引入新的变量来表示平台类型[83]，都为解决上述问题提供了思路。第五，人工智能作为新技术，其在法医学领域的应用标准仍缺乏统一化、规范化[84-87]。只有制定完善的法医学专业标准，才能消除人工智能可否作为法庭证据的争议。第六，如何应用人工智能解决复杂亲缘关系鉴定、组织体液来源精准溯源以及活体损伤时间鉴定、伤病因果关系判定等疑难问题还有待探索。

人工智能可以帮助法医学鉴定工作者从庞大复杂的数据中挖掘出更深层的规律和有用的信息，使数据发挥最大化的价值。基于人工智能和自动化信息技术的特征识别技术为法医学提供了方便、准确和可重复的方法，如何应用三维模型、医学成像技术等方法，使用人工智能实现以非侵入性的方式对人群和人群之间的长期变化进行研究的虚拟人类学、法医DNA分析、虚拟解剖、毒物分析以及智能自动模式识别系统等，国内外法医学者已经做出了很多的尝试，但是想要进一步将人工智能的优势融入法医学实践工作中，真正实现法医学专家和人工智能协同工作的“人工智能+法医学”，还需要更多的努力。