王 炯,魏春明,赵 森,张云峰,常 靖,王芳琳
(1.公安部物证鉴定中心,北京 100038;2.浙江警察学院,杭州 310053)
在我国,随着社会经济的发展越来越多的化合物出现在人们的日常生活中,由此导致的投毒、中毒事件也日益增多,造成了巨大的人民生命财产损失。在应对这些中毒案事件时,无论是及时、专业的现场中毒救治还是实验室的后续毒物检验,其首要任务是判断引发中毒的是哪一种或哪一类毒物,并且能够及时获得相关毒物的基本信息用于辅助现场处置工作[1-2]。因此,研究建立一套中毒判定软件,利用不同毒物中毒所引发的受害人不同中毒反应的区别,以及受害人生前的中毒表现或死后的解剖所见信息来判断毒物种类,并且提供相关毒物的数据信息、检验技术方法或相关处置的行业标准[3-4],对中毒案件处置中的专业人员或非专业人员提供技术支持,可有效地提高中毒现场救治能力和实验室毒物筛查、检验效率,从而提高相关部门应对中毒案事件的能力。
本软件的核心功能是中毒判定,在中毒案例中,不同的毒物中毒会引发受害人不同的中毒反应,在中毒表现或尸体解剖中会表现出不同的中毒特征,因此,应用数据挖掘技术,收集大量的中毒案例数据,从中发现中毒特征与毒物之间的规律[5-6],根据中毒特征对毒物进行判定。
基于数据挖掘技术来实现中毒判定功能,首先建立中毒案例数据库,从中调用与毒物、中毒相关的数据作为源数据来建立数学模型。实现这一过程,需要建立中毒特征模型(数据字典)来描述中毒受害人的中毒表现信息和尸体检验信息,并通过中毒特征模型来将案例中的中毒特征数字化,便于研究应用。本文的中毒特征模型分为中毒表现特征模型(生前)和尸体检验特征模型(死后)两类。其中,中毒表现特征模型分为眼部、神经系统、呼吸系统、循环系统、皮肤黏膜、消化系统、泌尿系统、血液系统、其他共九个部分95个选项,尸体检验特征模型分为尸表体态、解剖所见、病理学检查三个部分99个选项。
在建立的中毒案例数据库中,按以下原则抽取数据:1)案例中有中毒受害人,且其有中毒特征信息;2)案件检材中有中毒受害人的生物检材,且生物检材中检出具体毒物;3)具体毒物为多种时,每一种均与中毒特征对应形成一条训练数据;4)对毒物种类进行筛选,人为合并部分毒物相关案例,形成毒物种类中毒案例,如有机磷类杀虫剂、氰化物等。
本文应用SPSS Modeler13.0数学工具,选用Apriori关联规则建立中毒判定功能的数学模型[7]。Apriori算法用于发现数据中的关联规则,是以下形式的语句:如果条件则结果。
1)支持度(Support)。假设X是一个属性集,D是一个交易数据集,把D中包含X的交易记录个数与D中总的交易记录个数的比值,称为X在D中的支持度。那么,关联规则XY的支持度则定义为既包含X又包含Y的交易记录个数与D中总的交易记录个数的比值,即sup(XY)=P(X∪Y)。支持度描述X和Y同时出现的可能性大小,反映了规则的重要性。支持度很低的规则很可能是偶然出现的,而且多半也是人们不感兴趣的。最小支持度(Minimum Support),记作min_sup。它是由用户给定的,用于衡量属性集在规则发现过程中的最低重要性。
2)置信度(Confidence)。若X和Y都是数据集D中属性的集合,规则XY的置信度记作conf(XY),则conf(XY)定义为在数据集D中同时包含X和Y的记录数与只包含X的记录数的比值,也可以表示为属性集(X∪Y)的支持度与属性集X的支持度之比,即sup(X∪Y)/sup(X)。置信度描述Y在包含X的事务中出现的概率大小,反映规则的正确性。规则XY的置信度越高,说明在包含X的事务中Y出现的可能性就越大。最小置信度(Minimum Confidence)记作min_conf。它是由用户给定的,用于衡量所挖掘得到的规则的最低可信程度。
在进行关联分析生成规则时,需要预先设定最小支持度和最小置信度,关联规则XY有意义,需同时满足最小支持度和最小置信度。设定的最低支持度越低、最低置信度越低、最大条件数越高,发现的规则就越多;反之,最低支持度越高、最低置信度越高、最大条件数越低,发现的的规则就越少。例如,“如果中毒者在中毒后10~30 min之内出现了强直性抽搐和瞳孔扩大的症状,则引发中毒的毒物为毒鼠强,其置信度为 90%。”Apriori从数据中提取一系列规则,提取的规则带有出现频率最高的信息内容。在模型的优化过程中,由于各个毒物出现的次数或频次差别比较大,如果只建立一个模型,则需要设置较小的最低支持度和最低置信度,才能将出现次数较少的毒物与其出现症状之间的关联规则挖掘出来,但这种情况会造成挖掘出的规则数量过多,导致模型过大,运行和加载速度就会很慢。所以,综合考虑模型的准确性和运行加载的速度,本文选择依次建立10个模型(模型参数见表1),建立一个关联规则挖掘系列,既满足准确度需求,也提升功能的易用性、友好度。
表1 Apriori模型参数表Table 1 Parameters of the Apriori model
实际判定时,每个模型运算提交一个判定结果,取置信度最高的前5个结果作为最终判定输出结果,其中包含正确结果时认定为判定准确。在此定义下,用已有的训练集再次作为测试集,对建立的算法模型进行测试,结果中包含正确结果时定义为判定准确。结果中毒表现部分的判定准确率为91.55%,尸体检验部分的判定准确率为88.24%。在国外的类似研究中,采用神经网络的算法,利用生前的中毒症状、毒物性状给出毒物判断的报道[5-6],并没有计算准确率,也未见采用尸检检验特征进行中毒判定相关研究的报道。
鉴于判定功能以单机软件的形式在PC上实现,PC的计算能力有限,运算模型花费时间较久会影响用户体验。因此,软件开发时将输入项为3个特征以内的关联规则用程序固化,输入特征数在3以内时直接输出判定结果,提高运算速率,判定结果基本达到“即选即显示”。
软件针对公安行业处置中毒案事件定制了专门的查询功能,包括毒物数据查询、毒物检验方法查询、行业标准查询功能(见图1)。
图1 毒物查询Fig.1 Interface for query of toxic substance from database
毒物数据查询以中毒案例库中的检出毒物为基础,加以扩充后,集成了临床药物、毒品、农药、杀鼠剂、金属毒物、无机化合物、挥发性毒物、植物毒素、蘑菇毒素、动物毒素及其它毒物共11个大类共计2529种毒物的基础信息,如名称、CAS号、理化性质、用途等信息;还重点收录毒物的中毒特征数据,如毒性、中毒表现、中毒机理、体内代谢、临床救治、法医学检验、解剖及病理图片等内容。软件还集成了文献报道的毒物检验方法,按照方法适用范围、检验材料、提取净化方法、检测方法、结果评价,搜录、整理了1135个毒物检验方法,同时收录了30个毒物检验的行业标准,供毒物检验技术人员参考。
本软件将优化建立的中毒判定数学模型以单机软件的方式运行,在中毒处置辅助毒物中毒判定、涉毒相关信息查询、检验方法咨询方面提供便携易用的专家级辅助应用,为现场调查、中毒救治、实验室检验提供一体化的信息辅助方案,为中毒现场处置人员、实验室检验人员提供实战技术支撑。目前软件研发的版本为1.0版本,使用权完全开放,并没有授权、销售及加密等使用限制,可支持Windows操作系统(Windows XP及以上版本),对PC的性能并没有特殊要求,日常工作的便携式计算机均可以安装使用。后续随着毒物数据、方法标准等的不断完善更新,软件的应用价值会得到提升,在经费允许的条件下,也可考虑开发手机APP,提升软件的易用性。
[1] 廖林川,沈敏,张大明,等.法医毒物分析信息管理系统的开发与应用[J].法医学杂志,2004,20(2):105-106.
[2] 宁旭,董兆君,牟玲,等.重庆市化学事故医学应急救援指挥系统的研制[J].中国危重病急救医学,2006,18(12):755-758.
[3] 贠克明,王玉瑾,刘立新,等.急诊中毒快速检验诊断系统的建立[J].中国药物与临床,2006, 6(9):655-662.
[4] 陈航,戴广宇,沈敏,等.法医毒物学数据库系统设计与开发[J].医学信息学杂志,2012, 33(11):36-40.
[5] BHAVNANI S K, ABRAHAM A, DEMENIUK C, et al. Network analysis of toxic chemicals and symptoms: implications for designing first-responder systems[J]. AMIAAnnual Symposium proceedings, 2007:51-55.
[6] BHAVNANI S K, GANESAN A, SCOTT C, et al. A novel system for rapidly identifying toxic chemicals[J]. AMIAAnnual Symposium proceedings, 2008:878.
[7] WANG J, ZHANG Y, WANG F L, et al. The application of data mining technology for the judgment of poisoning cases[C]//Ubiquitous Intelligence and Computing and 2015 IEEE, Intl Conf on Autonomic and Trusted Computing and 2015 IEEE,Intl Conf on Scalable Computing and Communications and ITS Associated Workshops. IEEE, 2016.