周圆圆,曹永杰,杨越,王亚丽,邓恺飞,马开军,陈忆九,秦志强,张建华,黄平,张吉,陈丽琴
(1.内蒙古医科大学法医学教研室,内蒙古 呼和浩特 010030;2.司法鉴定科学研究院 上海市法医学重点实验室 司法部司法鉴定重点实验室 上海市司法鉴定专业技术服务平台,上海 200063;3.南京医科大学法医学教研室,江苏 南京 210000;4.上海市刑事科学技术研究院,上海 200083)
在法医病理学鉴定实践中,硅藻检验是鉴定溺死的重要手段之一。通过对尸体进行硅藻检验,结合案情的调查,可对疑似溺死者的死亡原因作出判断,对硅藻的种属研究甚至能够推断死者的溺亡地点[1]。硅藻检验方法有很多,传统方法包括化学消化法[2]、DNA测序[3]等,近年来又在这些方法的基础上研发出其他新方法,例如微波消解-扫描电镜法[4]等。其中强酸消化法因操作简单、试剂配制方便,是基层法医实验室中最常用的硅藻检验方法。
在基于强酸消化的传统观察方法中,计数需要有专业基础和经验的法医在光镜或电镜下肉眼观察,这一过程不仅耗时费力,且容易漏检较小的硅藻。因此,将人工智能方法结合数字化病理图像技术应用于法医病理学领域实现硅藻的自动化识别,以使硅藻检验定性定量分析过程更加智能,检验结果更加准确和客观,有利于提升检案效能。
本研究将硝酸破机法联合人工智能硅藻自动化识别系统应用于实际案例的硅藻检验,并对实验结果进行分析,探讨该方法可能面临的问题,为日后人工智能硅藻自动化识别系统的应用提供一定参考。
收集10例案例的内部器官,男性6例、女性4例,其中9例是溺死案例,1例是非溺死案例。2例解剖案例包含肺、肝和肾组织,2例送检案例包含肺和肾组织,另6例送检案例只有肺组织。以上器官与组织均来源于司法鉴定科学研究院,本实验已通过司法鉴定科学研究院伦理委员会批准。
组织样本处理:每个器官均取材20g,加入30mL分析纯硝酸和1 mL无水乙醇,在60℃的恒温磁力搅拌器(上海梅颖浦仪器仪表制造有限公司)上消化至液体澄清无大颗粒杂质。取10mL澄清消化液,以3 000×g离心5 min,弃去上清液,将沉淀混匀后在载玻片上涂片。
水样本处理:取10 mL水样(均为送检单位提供的现场水样)以3000×g离心5min,弃去上清液,沉淀混匀后制成水样涂片。
将器官涂片和水样涂片均使用Aperio AT2切片扫描仪(德国Leica Biosystems公司)扫描成400倍的数字化病理图像,使用人工智能硅藻自动化识别系统进行检测。
深度学习是近年来机器学习及人工智能领域新的研究热点,通过模拟人脑神经元结构对数据进行特征提取,从而实现图像识别等功能[5]。其中,卷积神经网络(convolutional neural network,CNN)就是一种常用于图像识别的深度学习算法[6]。目前,深度学习构架已经被证实在数字化病理图像中疾病程度的自动分类方面具有非常大的应用价值[7]。基于这些技术,本研究院团队自行开发了一套适用于法医硅藻检验的自动化识别系统。
该系统主要由数字化病理图像预处理模块、识别模块和结果展示模块组成(图1)。其中,数字化病理图像预处理模块包括图片切割和图片均值化处理。识别模块中涉及的模型为GoogLeNet深度学习模型。前期研究[8]结果显示,该模型在硅藻识别方面准确率可达到97.67%,其通过逐区域扫描切片,自动提取包含硅藻信息的区片。结果展示模块是根据对提取法医实际检案中有效的辅助信息所设计的,主要可实现的功能有硅藻计数、硅藻图片的截取等。
图1 人工智能硅藻自动化识别系统的操作示意图Fig.1 The operation diagram of artificial intelligence automatic diatom identification system
由于强烈的消化反应会产生硅藻碎片,影响计数结果,因此制定了硅藻计数规则,以保证计数的可靠性。此规则以硅藻面积为标准,面积大于50%的硅藻计数为1个,小于50%的硅藻则不计数。
该系统的硬件配置为:Inter Core i7-8700K@3.70 GHz,六核CPU,NVIDIA TITAN Xp 12 GB独立显卡,8GB内存,Ubuntu 16.04操作系统,基于Python语言的PyCharm开发工具。
模型评价指标使用查准率(precision),并引入受试者操作特征(receiver operator characteristic,ROC)曲线和混淆矩阵,以便更直观且全面地对该系统的性能进行验证。查准率是模型预测出真阳性的数量占所预测出阳性的总体数量的比例,代表了该模型对阳性结果的预测准确程度。ROC曲线以假阳性率(false positive rate,FPR)为横坐标、真阳性率(true positive rate,TPR)为纵坐标,曲线下面积(area under the curve,AUC)取值为0~1,值越接近1,说明该模型的性能越好。各类指标的计算公式如下:
上述公式中,TP代表真阳性,即专家(3位具有5年以上硅藻检验工作经验的法医,其中2位进行初检,1位进行复检)标识为硅藻、模型识别为硅藻的个数;FP代表假阳性,即专家标识为非硅藻、模型识别为硅藻的个数;FN代表假阴性,即专家标识为硅藻、模型识别为非硅藻的个数;TN代表真阴性,即专家标识为非硅藻、模型识别为非硅藻的个数。
该人工智能硅藻自动化识别系统所搭载的深度学习模型的ROC曲线见图2,其AUC值达到98.22%,表明该模型在自动化识别硅藻方面具有较好的性能。经本系统识别实际案例中10mL水样涂片10张,其硅藻检验结果均为阳性。肺涂片10张,肝涂片2张,肾涂片4张,共计检出硅藻6 467个。器官涂片中假阳性结果有528个,由此得出硅藻识别的总体查准率为92.45%(表1)。其中,案件4虽然肺内硅藻只有16个,但在保证无污染的情况下,肝、肾内都检出1个硅藻,结合相关案情,该结果提示生前溺水;案件10肺内硅藻个数为0,不能确证生前溺水,结合案情调查及尸体检验,支持死后抛尸入水。结果表明,该系统灵敏度较高,可以辅助硅藻的检测识别工作。
图2 人工智能硅藻自动化识别系统搭载的深度学习模型ROC曲线及AUCFig.2 ROC curve and AUC of the deep learning model based on the artificial intelligence automatic
表1 人工智能硅藻自动化识别系统识别10个实际案例的硅藻数量Tab.1 The number of diatoms in 10 actual cases identified by the artificial intelligence automatic diatom identification system (个)
该人工智能硅藻自动化识别系统的结果展示模块见图3。由于计算机识别存在一定的误差,在这一步需要人工核实后出具结果(人工确认用时约5 min)。如图所示,真阳性结果标注为红色圆点,假阳性结果标注为绿色圆点。该模块结合法医学鉴定中的实际需求,不但可以直观地观察硅藻的分布情况并进行图片截取,还能够实现自动化硅藻计数。该系统对像素变化十分敏感,相较于人眼,计算机仅在400倍的光镜视野下就可以在复杂的背景中发现肉眼不易发现的组织样本中直径20 μm左右的微型硅藻及硅藻碎片(图4)。
图3 人工智能硅藻自动化识别系统的结果展示模块Fig.3 The result display module of the artificial intelligence automatic diatom identification system
图4 人工智能硅藻自动化识别系统识别出的小硅藻及硅藻碎片(×400)Fig.4 The small diatoms and diatoms fragments identified by the artificial intelligence automatic diatom identification system (×400)
硅藻检验是法医诊断溺死较为常用的方法。目前,用于硅藻检验的方法较多,但在现有的常用方法中,基于DNA序列的硅藻检验因其仪器、试剂较为昂贵,不适用于基层的法医学实验室。而基于形态学方法的硅藻检验常使用各类试剂进行消解,涂片后镜下观察过程耗时费力,且需要具备一定的专业知识和经验,为法医工作者带来一定的挑战。鉴于此,我们开发了基于人工智能的硅藻自动化识别系统[8]。本研究验证了该系统在实际检案中的可行性,为溺死的法医学鉴定提供支持。
硅藻作为一种微生物藻类,形体极为微小,一般只有十几微米到几十微米。在溺死案例中,可以穿过气血屏障经血液循环到达肝、肾的硅藻更加微小,且消化过程中也会产生硅藻碎片,这些小硅藻及硅藻碎片在光镜下通过肉眼难以发现,而本研究所使用的卷积神经网络通过对图像像素进行特征提取从而训练出的自动化识别模型,对像素变化的灵敏度极高,在400倍的光镜视野下就可以发现肉眼不易发现的小硅藻及硅藻碎片。该系统工作效率远高于经验丰富的专家[8],而且针对体积微小的硅藻更具有优势,不仅提高了硅藻的检出率和检案效率,结果也更准确、直观。
当然,该系统也存在一定的问题。第一,所使用的深度学习构架,其数据量的大小直接会影响训练模型的性能[5]。小的数据集训练容易过拟合,需要海量的样本进行训练才能达到较好的泛化能力。其二,该系统的识别能力取决于深度学习模型的学习量,即新背景的图片对系统的识别能力存在影响。针对上述问题,可以在检案的同时,不断对现有的硅藻数据库进行补充与扩建,在现阶段最佳模型上继续进行训练。
综上所述,本研究通过自主研发的人工智能硅藻自动化识别系统对10例实际案件中的水中尸体进行硅藻检验,证明了该系统在法医学溺死案件中应用具有可行性。该系统在降低人工干预方面具有独特的优势,并可与诸多硅藻前处理方法(如酶消化法、真空过滤等)联合使用,为未来实现智能化硅藻检验奠定了基础。由于本系统仍处于初步研究阶段,目前仅具有自动化识别、计数等少数功能,未来可通过硅藻训练数据库的扩充、深度学习算法的优化以及视窗界面的完善等进一步提升该系统的功能。此外,我们将在该硅藻自动化识别系统的基础上建立更为准确、客观、高效的硅藻种属分类模型,从而挖掘深度学习技术在溺水地点推断中的潜在应用价值。