中毒判定辅助软件的研发与应用

2018-05-05 02:33魏春明张云峰王芳琳
刑事技术 2018年2期
关键词:毒物置信度中毒

王 炯,魏春明,赵 森,张云峰,常 靖,王芳琳

(1.公安部物证鉴定中心,北京 100038;2.浙江警察学院,杭州 310053)

在我国,随着社会经济的发展越来越多的化合物出现在人们的日常生活中,由此导致的投毒、中毒事件也日益增多,造成了巨大的人民生命财产损失。在应对这些中毒案事件时,无论是及时、专业的现场中毒救治还是实验室的后续毒物检验,其首要任务是判断引发中毒的是哪一种或哪一类毒物,并且能够及时获得相关毒物的基本信息用于辅助现场处置工作[1-2]。因此,研究建立一套中毒判定软件,利用不同毒物中毒所引发的受害人不同中毒反应的区别,以及受害人生前的中毒表现或死后的解剖所见信息来判断毒物种类,并且提供相关毒物的数据信息、检验技术方法或相关处置的行业标准[3-4],对中毒案件处置中的专业人员或非专业人员提供技术支持,可有效地提高中毒现场救治能力和实验室毒物筛查、检验效率,从而提高相关部门应对中毒案事件的能力。

1 软件研发的原理

本软件的核心功能是中毒判定,在中毒案例中,不同的毒物中毒会引发受害人不同的中毒反应,在中毒表现或尸体解剖中会表现出不同的中毒特征,因此,应用数据挖掘技术,收集大量的中毒案例数据,从中发现中毒特征与毒物之间的规律[5-6],根据中毒特征对毒物进行判定。

2 判定功能研发

基于数据挖掘技术来实现中毒判定功能,首先建立中毒案例数据库,从中调用与毒物、中毒相关的数据作为源数据来建立数学模型。实现这一过程,需要建立中毒特征模型(数据字典)来描述中毒受害人的中毒表现信息和尸体检验信息,并通过中毒特征模型来将案例中的中毒特征数字化,便于研究应用。本文的中毒特征模型分为中毒表现特征模型(生前)和尸体检验特征模型(死后)两类。其中,中毒表现特征模型分为眼部、神经系统、呼吸系统、循环系统、皮肤黏膜、消化系统、泌尿系统、血液系统、其他共九个部分95个选项,尸体检验特征模型分为尸表体态、解剖所见、病理学检查三个部分99个选项。

在建立的中毒案例数据库中,按以下原则抽取数据:1)案例中有中毒受害人,且其有中毒特征信息;2)案件检材中有中毒受害人的生物检材,且生物检材中检出具体毒物;3)具体毒物为多种时,每一种均与中毒特征对应形成一条训练数据;4)对毒物种类进行筛选,人为合并部分毒物相关案例,形成毒物种类中毒案例,如有机磷类杀虫剂、氰化物等。

本文应用SPSS Modeler13.0数学工具,选用Apriori关联规则建立中毒判定功能的数学模型[7]。Apriori算法用于发现数据中的关联规则,是以下形式的语句:如果条件则结果。

1)支持度(Support)。假设X是一个属性集,D是一个交易数据集,把D中包含X的交易记录个数与D中总的交易记录个数的比值,称为X在D中的支持度。那么,关联规则XY的支持度则定义为既包含X又包含Y的交易记录个数与D中总的交易记录个数的比值,即sup(XY)=P(X∪Y)。支持度描述X和Y同时出现的可能性大小,反映了规则的重要性。支持度很低的规则很可能是偶然出现的,而且多半也是人们不感兴趣的。最小支持度(Minimum Support),记作min_sup。它是由用户给定的,用于衡量属性集在规则发现过程中的最低重要性。

2)置信度(Confidence)。若X和Y都是数据集D中属性的集合,规则XY的置信度记作conf(XY),则conf(XY)定义为在数据集D中同时包含X和Y的记录数与只包含X的记录数的比值,也可以表示为属性集(X∪Y)的支持度与属性集X的支持度之比,即sup(X∪Y)/sup(X)。置信度描述Y在包含X的事务中出现的概率大小,反映规则的正确性。规则XY的置信度越高,说明在包含X的事务中Y出现的可能性就越大。最小置信度(Minimum Confidence)记作min_conf。它是由用户给定的,用于衡量所挖掘得到的规则的最低可信程度。

在进行关联分析生成规则时,需要预先设定最小支持度和最小置信度,关联规则XY有意义,需同时满足最小支持度和最小置信度。设定的最低支持度越低、最低置信度越低、最大条件数越高,发现的规则就越多;反之,最低支持度越高、最低置信度越高、最大条件数越低,发现的的规则就越少。例如,“如果中毒者在中毒后10~30 min之内出现了强直性抽搐和瞳孔扩大的症状,则引发中毒的毒物为毒鼠强,其置信度为 90%。”Apriori从数据中提取一系列规则,提取的规则带有出现频率最高的信息内容。在模型的优化过程中,由于各个毒物出现的次数或频次差别比较大,如果只建立一个模型,则需要设置较小的最低支持度和最低置信度,才能将出现次数较少的毒物与其出现症状之间的关联规则挖掘出来,但这种情况会造成挖掘出的规则数量过多,导致模型过大,运行和加载速度就会很慢。所以,综合考虑模型的准确性和运行加载的速度,本文选择依次建立10个模型(模型参数见表1),建立一个关联规则挖掘系列,既满足准确度需求,也提升功能的易用性、友好度。

表1 Apriori模型参数表Table 1 Parameters of the Apriori model

实际判定时,每个模型运算提交一个判定结果,取置信度最高的前5个结果作为最终判定输出结果,其中包含正确结果时认定为判定准确。在此定义下,用已有的训练集再次作为测试集,对建立的算法模型进行测试,结果中包含正确结果时定义为判定准确。结果中毒表现部分的判定准确率为91.55%,尸体检验部分的判定准确率为88.24%。在国外的类似研究中,采用神经网络的算法,利用生前的中毒症状、毒物性状给出毒物判断的报道[5-6],并没有计算准确率,也未见采用尸检检验特征进行中毒判定相关研究的报道。

鉴于判定功能以单机软件的形式在PC上实现,PC的计算能力有限,运算模型花费时间较久会影响用户体验。因此,软件开发时将输入项为3个特征以内的关联规则用程序固化,输入特征数在3以内时直接输出判定结果,提高运算速率,判定结果基本达到“即选即显示”。

3 查询功能集成

软件针对公安行业处置中毒案事件定制了专门的查询功能,包括毒物数据查询、毒物检验方法查询、行业标准查询功能(见图1)。

图1 毒物查询Fig.1 Interface for query of toxic substance from database

毒物数据查询以中毒案例库中的检出毒物为基础,加以扩充后,集成了临床药物、毒品、农药、杀鼠剂、金属毒物、无机化合物、挥发性毒物、植物毒素、蘑菇毒素、动物毒素及其它毒物共11个大类共计2529种毒物的基础信息,如名称、CAS号、理化性质、用途等信息;还重点收录毒物的中毒特征数据,如毒性、中毒表现、中毒机理、体内代谢、临床救治、法医学检验、解剖及病理图片等内容。软件还集成了文献报道的毒物检验方法,按照方法适用范围、检验材料、提取净化方法、检测方法、结果评价,搜录、整理了1135个毒物检验方法,同时收录了30个毒物检验的行业标准,供毒物检验技术人员参考。

4 结语

本软件将优化建立的中毒判定数学模型以单机软件的方式运行,在中毒处置辅助毒物中毒判定、涉毒相关信息查询、检验方法咨询方面提供便携易用的专家级辅助应用,为现场调查、中毒救治、实验室检验提供一体化的信息辅助方案,为中毒现场处置人员、实验室检验人员提供实战技术支撑。目前软件研发的版本为1.0版本,使用权完全开放,并没有授权、销售及加密等使用限制,可支持Windows操作系统(Windows XP及以上版本),对PC的性能并没有特殊要求,日常工作的便携式计算机均可以安装使用。后续随着毒物数据、方法标准等的不断完善更新,软件的应用价值会得到提升,在经费允许的条件下,也可考虑开发手机APP,提升软件的易用性。

[1] 廖林川,沈敏,张大明,等.法医毒物分析信息管理系统的开发与应用[J].法医学杂志,2004,20(2):105-106.

[2] 宁旭,董兆君,牟玲,等.重庆市化学事故医学应急救援指挥系统的研制[J].中国危重病急救医学,2006,18(12):755-758.

[3] 贠克明,王玉瑾,刘立新,等.急诊中毒快速检验诊断系统的建立[J].中国药物与临床,2006, 6(9):655-662.

[4] 陈航,戴广宇,沈敏,等.法医毒物学数据库系统设计与开发[J].医学信息学杂志,2012, 33(11):36-40.

[5] BHAVNANI S K, ABRAHAM A, DEMENIUK C, et al. Network analysis of toxic chemicals and symptoms: implications for designing first-responder systems[J]. AMIAAnnual Symposium proceedings, 2007:51-55.

[6] BHAVNANI S K, GANESAN A, SCOTT C, et al. A novel system for rapidly identifying toxic chemicals[J]. AMIAAnnual Symposium proceedings, 2008:878.

[7] WANG J, ZHANG Y, WANG F L, et al. The application of data mining technology for the judgment of poisoning cases[C]//Ubiquitous Intelligence and Computing and 2015 IEEE, Intl Conf on Autonomic and Trusted Computing and 2015 IEEE,Intl Conf on Scalable Computing and Communications and ITS Associated Workshops. IEEE, 2016.

猜你喜欢
毒物置信度中毒
一种基于定位置信度预测的二阶段目标检测方法
硼铝复合材料硼含量置信度临界安全分析研究
快跑!有毒物 绝密毒药报告
系统可靠性评估与更新方法
家禽中毒怎么办
中毒
毒物——水银
正负关联规则两级置信度阈值设置方法
使用铅笔会中毒吗
爸爸中毒了