公共安全视域下精神药物光谱学无损分类

2022-03-04 05:08李佳瑞王继芬刘津彤
分析测试学报 2022年2期
关键词:二阶特征值波段

李佳瑞,王继芬,刘津彤

(中国人民公安大学 侦查学院,北京 100038)

目前我国公共安全问题突出,针对公共安全的重要组成部分食品药品的安全问题,公安部部署全国公安机关集中开展了“昆仑2020”专项行动,依法对食药环领域的违法犯罪活动进行严厉打击。在药品行业快速发展的背景之下,足不出户就可以通过互联网买到世界各地的药品,导致假药销售及管制类药物走私情况日趋严峻,严重危害了人们的身体健康。因此迫切需要建立对药品的准确、快速检验方法。

非巴比妥类镇静安眠药为新型中枢神经抑制药,包括强安定药和弱安定药两类。前者为抗精神病药,其中吩噻嗪类为首选药物。后者为抗焦虑性镇静药,常用的主要为苯二氮类[1]。目前此类药物的临床应用广泛,有的甚至可在医药商店购买到。吩噻嗪类药物滥用中毒多为锥体外系反应[2];苯二氮类药物的危害也被广泛报道,滥用易产生依赖性,且会对人的认知功能产生负面影响[3]。近年来,管制类药物走私不断出现新特点,不法分子常通过邮寄渠道,如通过快件、空运货物渠道由拉美地区走私入境,或通过行李物品夹藏等方式从空港旅检渠道走私进境,且相关案件呈增长趋势。对此类药物的快速准确检验在犯罪嫌疑人的确定、案件侦破以及定罪量刑等方面都具有重要意义。因此必须完善技术打造利器,精准打击违法犯罪。

光谱技术提供了一种快速灵敏且无损的有效检测方法,成为法庭科学领域的有利分析工具[4-8],适用于药物成分的检验分析。已有的相关研究主要进行简单的药物定性检测,缺乏对光谱数据的深入挖掘与分析[9-10]。在实际检验中,存在多种药物混杂的情况,而对于多种成分共存的药物进行检验在分离和分析方法上尚存在一定的局限性。目前使用高效液相色谱、气相色谱与质谱联用等技术对镇静安眠药进行检测的检材主要为生物样品[11-12],对缴获药物的研究相对较少,且此类检测方法成本较高,操作也较为复杂,无法满足基层公安工作的需要。

红外光谱具有特征性强、测定快速、不破坏样品、试样用量少、操作简便等优势,在物质鉴定方面得到了广泛应用。本研究采集了苯二氮类(艾司唑仑、阿普唑仑、地西泮、硝西泮)和吩噻嗪类(奋乃静、氯丙嗪、异丙嗪)药物的红外光谱数据,通过主成分分析(Principal component analysis,PCA)提取不同波段光谱数据特征后进行降维,并借助贝叶斯判别分析(Bayes discriminant analysis,BDA)和多层感知神经网络(MLP)构建了单一和融合模型进行对比。结果显示,融合模型由于在数据预处理阶段将提取的光谱数据特征值重新串联,从而可获得更丰富的谱图信息。本实验借助数据模型对不同类型样品及同一类型不同种类的样本进行识别与分类,以期为相关案件的检验鉴定提供参考,为相关物证的检验鉴定提供帮助。

1 实验部分

1.1 样本、仪器及光谱采集

Nicolet 5700 型傅里叶变换红外光谱仪(Thermo Fisher Scientific 公司),ATR 样品槽使用金刚石晶体,KBr分束器(Thermo Fisher Scientific 公司),使用OMNIC 光谱数据处理软件。扫描次数为64 次,分辨率为2 cm-1,光谱采集范围为4 000~400 cm-1(4 000~3 700 cm-1主要为设备噪声,1 300~400 cm-1为红外光谱指纹区),每个样本采集4次光谱曲线,取均值作为实验样本光谱数据[13-16]。

1.2 实验方法

借助傅里叶变换红外光谱仪获取样本谱图,采用峰面积归一化、自动基线校正和多元散射校正等对谱图进行处理[17-19],将光谱数据集标准化并进行一阶与二阶求导,经PCA 降维后以70%的样本作为训练集,30%的样本作为测试集构建分类模型[20]。

2 结果与讨论

2.1 各组分样本的红外光谱分析

图1为各样本的红外光谱图,在波数3 700~3 000 cm-1和2 500~2 000 cm-1范围内,各样本之间的峰形有所差异。2 750~3 000 cm-1波数范围内有尖峰,各类样本部分波段出峰位置相似,具有相似的振动基团,总体峰形较为混杂,难以依靠图谱进行直观区分。

图1 苯二氮类(A)和吩噻嗪类(B)样本的红外光谱图Fig.1 Infrared spectra of benzodiazepine(A)and phenothiazine(B)samples

2.2 单一模型:基于全波段光谱及指纹区光谱数据集

分别构建基于全波段光谱和指纹区光谱数据集的原始、一阶和二阶导数的单一模型,比较其BDA和MLP 的分类准确率。由表1可知,单一模型中BDA 训练集和测试集的总体分类准确率较为稳定。这是由于MLP 分类识别率使用的是各数据集重复6 次测试的平均值,且采用随机取样的方式对数据变量进行分析,导致分类识别率在一定区间内变化。而BDA 是按判别函数值最大或后验概率最大进行判别,因此分类识别率保持相对稳定。

表1 不同方法下的分类识别率Table 1 Classification recognition rates under different methods

图2 为全波段和指纹区数据集原始、一阶导数和二阶导数模型的受试者工作特征曲线(Receiver operator characteristic curve,ROC 曲线),纵坐标为感光度,横坐标为特异性,图2A 中的红色和蓝色两条ROC曲线相较于图2B均较为靠近左上角。ROC曲线越靠近左上角或ROC曲线下的面积(AUC)越大,模型越理想。反复进行多次数据分析后发现,相较于指纹区光谱,全波段光谱的分类识别率更高。

图2 不同单一模型的ROC曲线Fig.2 ROC curves of different single models

综合表1、图2 可知,借助BDA 的分类模型中,基于全波段光谱数据集的二阶导数单一模型分类效果最优,总体分类准确率达92.7%。进一步考虑对光谱数据进行融合,以期使用更丰富的数据信息构建分类模型,实现对样本更准确的分类。

如图3 所示,通过PCA 对全波段和指纹区数据集二阶导数模型进行特征变量的提取,全波段和指纹区数据集分别提取到20个和18个特征值。图中纵坐标代表提取的特征值,横坐标的特征值重要性反映了此特征值对应的特征向量对整个数据集的代表程度。特征值重要性的百分比越大,此特征值对应的特征向量对整个数据集的代表程度越好。由此可见,基于全波段和指纹区数据集二阶导数模型提取的大部分特征变量对数据集有较好的代表性。

图3 全波段光谱(A)和指纹区光谱(B)二阶导数模型特征值的重要性Fig.3 Eigenvalue importance of the second derivative model of the full spectra(A)and the fingerprint spectra(B)

2.3 融合模型:基于全波段和指纹区光谱二阶导数的融合数据集

在单一模型的基础上,将经过PCA 降维后提取到的特征值串联后建立模型,对分类准确率最高的全波段和指纹区数据集二阶导数进行融合,得到36 个特征值。如图4 所示,相比单一模型,特征值数量得到明显提高,其重要性有所提升。说明融合模型特征值能更好地反映整体数据集的情况。

图4 全波段与指纹区光谱二阶导数融合模型特征值的重要性Fig.4 Eigenvalue importance of a fusion model of the second derivative spectrum of the full spectra and fingerprint spectra

分别使用BDA 和MLP对全波段和指纹区数据集的二阶导数融合模型进行分析,对比不同模型对两类安眠药的分类预测准确率,结果如表2 所示。由表可见,融合模型的效果优于单一模型,借助BDA的二阶导数融合模型分类效果好且稳定。图5为此融合模型的ROC 曲线,ROC 曲线下面积AUC 更直观地体现了模型的分类效果。融合模型结合了单一模型的优势,对数据特征进行了统计分析,使相似成分能够有效区分,为模型的构建提供了更全面的信息。

表2 不同方法下二阶导数模型的分类识别率Table 2 Classification and recognition rates of the second derivative model under different methods

图5 融合模型的ROC曲线Fig.5 ROC curve of the fusion model

吩噻嗪类:Y2=-33.111+2.582X1+9.682X2+10.469X3-23.157X4-4.367X5+11.491X6-4.610X7-3.893X8+ 3.607X9+ 10.743X10+ 2.101X11-4.845X12-3.784X13-8.514X14+ 3.233X15+ 0.720X16+ 4.382X17+0.596X18-3.116X19+ 2.126X20+ 1.897X21+ 2.401X22-0.081X23-1.298X24+ 8.182X25+ 1.575X26+ 1.254X27+3.817X28+4.638X29-6.281X30+3.626X31+3.297X32+5.108X33-2.739X34-11.766X35-8.238X36。

运用贝叶斯判别公式可以计算出两类镇静安眠药的分类识别率,结果表明两类药物均可实现100%的准确区分,分类结果理想。以上实验表明,借助贝叶斯判别分析的基于全波段和指纹区融合数据集的二阶导数模型为最佳分类模型。

2.4 最佳模型下苯二氮类和吩噻嗪类安眠药的分类结果

采用借助贝叶斯判别分析的全波段和指纹区融合数据集的二阶导数模型对4种苯二氮类和3种吩噻嗪类镇静安眠药进行分类识别,分别得到两类镇静安眠药的空间分布图。如图6A所示,不同种类样品在不同判别轴上的分布差异性大,其中蓝色与绿色较为集中,结合BDA1、BDA2 与BDA3 判别轴,该模型对所有苯二氮类样品的分类正确率达96.7%。如图6B 所示,在BDA4 判别轴上,绿色与红色分离较好;在BDA5判别轴上,蓝色与红色分离较好,结合BDA4 与BDA5 判别轴可实现对所有吩噻嗪类样品100%的准确分类。结果证明该分类模型对同一类型不同种类的安眠药同样适用。

图6 苯二氮类(A)和吩噻嗪类(B)药物的空间分布图Fig.6 The spatial classification details of benzodiazepine(A)and phenothiazine(B)samples

3 结 论

本文将不同波段红外光谱数据融合,借助贝叶斯判别分析和多层感知器构建分类模型,实现了不同类型镇静安眠药的快速、无损有效区分。基于二阶导数构建了全波段与指纹区光谱的融合模型,并与单一模型进行比较,发现融合模型对苯二氮类和吩噻嗪类两个不同类型精神药物的分类准确率可达到100%;对苯二氮类精神药物中艾司唑仑、阿普唑仑、地西泮和硝西泮的分类准确率达到96.7%;对吩噻嗪类精神药物中奋乃静、氯丙嗪、异丙嗪的分类准确率达到100%。不同类型药物的光谱数据不同,可以此为依据对海关现场缴获的精神药物进行分类鉴别,提升公安机关维护社会公共安全的能力。光谱融合技术为管制类药物的研究提供了一种快速且无损的有效方法,有望成为法庭科学领域的有利分析工具。

猜你喜欢
二阶特征值波段
Ku波段高隔离度双极化微带阵列天线的设计
最佳波段组合的典型地物信息提取
新型X波段多功能EPR谱仪的设计与性能
基于扩展FEAST的大规模特征值求解问题研究
最佳波段选择的迁西县土地利用信息提取研究
伴随矩阵的性质及在解题中的应用
二阶矩阵、二阶行列式和向量的关系分析
求矩阵特征值的一个简单方法
二次函数图像与二阶等差数列
一类非线性矩阵方程组性质的研究