中毒判定辅助软件的研发与应用

2018-05-05 02:33魏春明张云峰王芳琳

刑事技术 2018年2期

王炯，魏春明，赵森，张云峰，常靖，王芳琳

(1．公安部物证鉴定中心，北京 100038；2．浙江警察学院，杭州 310053）

在我国，随着社会经济的发展越来越多的化合物出现在人们的日常生活中，由此导致的投毒、中毒事件也日益增多，造成了巨大的人民生命财产损失。在应对这些中毒案事件时，无论是及时、专业的现场中毒救治还是实验室的后续毒物检验，其首要任务是判断引发中毒的是哪一种或哪一类毒物，并且能够及时获得相关毒物的基本信息用于辅助现场处置工作[1-2]。因此，研究建立一套中毒判定软件，利用不同毒物中毒所引发的受害人不同中毒反应的区别，以及受害人生前的中毒表现或死后的解剖所见信息来判断毒物种类，并且提供相关毒物的数据信息、检验技术方法或相关处置的行业标准[3-4]，对中毒案件处置中的专业人员或非专业人员提供技术支持，可有效地提高中毒现场救治能力和实验室毒物筛查、检验效率，从而提高相关部门应对中毒案事件的能力。

1 软件研发的原理

本软件的核心功能是中毒判定，在中毒案例中，不同的毒物中毒会引发受害人不同的中毒反应，在中毒表现或尸体解剖中会表现出不同的中毒特征，因此，应用数据挖掘技术，收集大量的中毒案例数据，从中发现中毒特征与毒物之间的规律[5-6]，根据中毒特征对毒物进行判定。

2 判定功能研发

基于数据挖掘技术来实现中毒判定功能，首先建立中毒案例数据库，从中调用与毒物、中毒相关的数据作为源数据来建立数学模型。实现这一过程，需要建立中毒特征模型（数据字典）来描述中毒受害人的中毒表现信息和尸体检验信息，并通过中毒特征模型来将案例中的中毒特征数字化，便于研究应用。本文的中毒特征模型分为中毒表现特征模型（生前）和尸体检验特征模型（死后）两类。其中，中毒表现特征模型分为眼部、神经系统、呼吸系统、循环系统、皮肤黏膜、消化系统、泌尿系统、血液系统、其他共九个部分95个选项，尸体检验特征模型分为尸表体态、解剖所见、病理学检查三个部分99个选项。

在建立的中毒案例数据库中，按以下原则抽取数据：1）案例中有中毒受害人，且其有中毒特征信息；2）案件检材中有中毒受害人的生物检材，且生物检材中检出具体毒物；3）具体毒物为多种时，每一种均与中毒特征对应形成一条训练数据；4）对毒物种类进行筛选，人为合并部分毒物相关案例，形成毒物种类中毒案例，如有机磷类杀虫剂、氰化物等。

本文应用SPSS Modeler13.0数学工具，选用Apriori关联规则建立中毒判定功能的数学模型[7]。Apriori算法用于发现数据中的关联规则，是以下形式的语句：如果条件则结果。

1）支持度（Support）。假设X是一个属性集，D是一个交易数据集，把D中包含X的交易记录个数与D中总的交易记录个数的比值，称为X在D中的支持度。那么，关联规则XY的支持度则定义为既包含X又包含Y的交易记录个数与D中总的交易记录个数的比值，即sup(XY)=P（X∪Y）。支持度描述X和Y同时出现的可能性大小，反映了规则的重要性。支持度很低的规则很可能是偶然出现的，而且多半也是人们不感兴趣的。最小支持度（Minimum Support），记作min_sup。它是由用户给定的，用于衡量属性集在规则发现过程中的最低重要性。

2）置信度（Confidence）。若X和Y都是数据集D中属性的集合，规则XY的置信度记作conf(XY)，则conf(XY)定义为在数据集D中同时包含X和Y的记录数与只包含X的记录数的比值，也可以表示为属性集(X∪Y)的支持度与属性集X的支持度之比，即sup(X∪Y)/sup(X)。置信度描述Y在包含X的事务中出现的概率大小，反映规则的正确性。规则XY的置信度越高，说明在包含X的事务中Y出现的可能性就越大。最小置信度（Minimum Confidence）记作min_conf。它是由用户给定的，用于衡量所挖掘得到的规则的最低可信程度。

在进行关联分析生成规则时，需要预先设定最小支持度和最小置信度，关联规则XY有意义，需同时满足最小支持度和最小置信度。设定的最低支持度越低、最低置信度越低、最大条件数越高，发现的规则就越多；反之，最低支持度越高、最低置信度越高、最大条件数越低，发现的的规则就越少。例如，“如果中毒者在中毒后10～30 min之内出现了强直性抽搐和瞳孔扩大的症状，则引发中毒的毒物为毒鼠强，其置信度为 90%。”Apriori从数据中提取一系列规则，提取的规则带有出现频率最高的信息内容。在模型的优化过程中，由于各个毒物出现的次数或频次差别比较大，如果只建立一个模型，则需要设置较小的最低支持度和最低置信度，才能将出现次数较少的毒物与其出现症状之间的关联规则挖掘出来，但这种情况会造成挖掘出的规则数量过多，导致模型过大，运行和加载速度就会很慢。所以，综合考虑模型的准确性和运行加载的速度，本文选择依次建立10个模型（模型参数见表1），建立一个关联规则挖掘系列，既满足准确度需求，也提升功能的易用性、友好度。

表1 Apriori模型参数表Table 1 Parameters of the Apriori model

实际判定时，每个模型运算提交一个判定结果，取置信度最高的前5个结果作为最终判定输出结果，其中包含正确结果时认定为判定准确。在此定义下，用已有的训练集再次作为测试集，对建立的算法模型进行测试，结果中包含正确结果时定义为判定准确。结果中毒表现部分的判定准确率为91.55%，尸体检验部分的判定准确率为88.24%。在国外的类似研究中，采用神经网络的算法，利用生前的中毒症状、毒物性状给出毒物判断的报道[5-6]，并没有计算准确率，也未见采用尸检检验特征进行中毒判定相关研究的报道。

鉴于判定功能以单机软件的形式在PC上实现，PC的计算能力有限，运算模型花费时间较久会影响用户体验。因此，软件开发时将输入项为3个特征以内的关联规则用程序固化，输入特征数在3以内时直接输出判定结果，提高运算速率，判定结果基本达到“即选即显示”。

3 查询功能集成

软件针对公安行业处置中毒案事件定制了专门的查询功能，包括毒物数据查询、毒物检验方法查询、行业标准查询功能（见图1）。

图1 毒物查询Fig.1 Interface for query of toxic substance from database

毒物数据查询以中毒案例库中的检出毒物为基础，加以扩充后，集成了临床药物、毒品、农药、杀鼠剂、金属毒物、无机化合物、挥发性毒物、植物毒素、蘑菇毒素、动物毒素及其它毒物共11个大类共计2529种毒物的基础信息，如名称、CAS号、理化性质、用途等信息；还重点收录毒物的中毒特征数据，如毒性、中毒表现、中毒机理、体内代谢、临床救治、法医学检验、解剖及病理图片等内容。软件还集成了文献报道的毒物检验方法，按照方法适用范围、检验材料、提取净化方法、检测方法、结果评价，搜录、整理了1135个毒物检验方法，同时收录了30个毒物检验的行业标准，供毒物检验技术人员参考。

4 结语

本软件将优化建立的中毒判定数学模型以单机软件的方式运行，在中毒处置辅助毒物中毒判定、涉毒相关信息查询、检验方法咨询方面提供便携易用的专家级辅助应用，为现场调查、中毒救治、实验室检验提供一体化的信息辅助方案，为中毒现场处置人员、实验室检验人员提供实战技术支撑。目前软件研发的版本为1.0版本，使用权完全开放，并没有授权、销售及加密等使用限制，可支持Windows操作系统（Windows XP及以上版本），对PC的性能并没有特殊要求，日常工作的便携式计算机均可以安装使用。后续随着毒物数据、方法标准等的不断完善更新，软件的应用价值会得到提升，在经费允许的条件下，也可考虑开发手机APP，提升软件的易用性。

［1］廖林川，沈敏，张大明，等.法医毒物分析信息管理系统的开发与应用[J].法医学杂志，2004,20(2):105-106.

［2］宁旭，董兆君，牟玲，等.重庆市化学事故医学应急救援指挥系统的研制[J].中国危重病急救医学，2006,18(12)：755-758.

［3］贠克明，王玉瑾，刘立新，等.急诊中毒快速检验诊断系统的建立[J].中国药物与临床，2006, 6(9):655-662.

［4］陈航，戴广宇，沈敏，等.法医毒物学数据库系统设计与开发[J].医学信息学杂志，2012, 33(11):36-40.

［5］ BHAVNANI S K, ABRAHAM A, DEMENIUK C, et al. Network analysis of toxic chemicals and symptoms: implications for designing first-responder systems[J]. AMIAAnnual Symposium proceedings, 2007:51-55.

［6］ BHAVNANI S K, GANESAN A, SCOTT C, et al. A novel system for rapidly identifying toxic chemicals[J]. AMIAAnnual Symposium proceedings, 2008:878.

［7］ WANG J, ZHANG Y, WANG F L, et al. The application of data mining technology for the judgment of poisoning cases[C]//Ubiquitous Intelligence and Computing and 2015 IEEE, Intl Conf on Autonomic and Trusted Computing and 2015 IEEE,Intl Conf on Scalable Computing and Communications and ITS Associated Workshops. IEEE, 2016.