, ,3, , , ,
(1.上海理工大学 上海市现代光学系统重点实验室, 上海 200093; 2.上海理工大学 光电信息与计算机工程学院, 上海 200093; 3.公安部第三研究所, 上海 200031; 4.中国科学院 上海高等研究院, 上海 201210)
据《中国禁毒报告2017》所述,全国滥用合成毒品人员总数仍呈上升态势。截至2016年底,全国共破获毒品刑事案件14万起,缴获各类毒品82.1 t。全国现有吸毒人员250.5万名,同比增长6.8%,其中,合成毒品滥用规模居首位,滥用合成毒品人员151.5万名,占60.5%。合成毒品是相对于传统的麻醉毒品(海洛因、鸦片)而言,常见的类型有冰毒(甲基苯丙胺)、麻古、摇头丸(MDMA)、K粉(氯胺酮)等。
合成毒品主要通过对多种化学物质进行化学合成产生。以甲卡西酮为例,该物质会导致急性健康问题及毒品依赖,过量服用会出现不可逆的永久性脑部损伤甚至死亡,俗称“长治筋”、“丧尸药”,在国外被称之为“浴盐”[1]。它主要由氧化1-麻黄碱制得。其各项特性与麻黄碱比较接近,较难进行简单的鉴别。目前常用的分析方法主要是通过气相色谱仪及气质联用仪对体外、体内检材进行分析,或者通过苯丙胺类尿液检测板在吸食后检出[2]。但气相色谱仪及气质联用仪主要应用于实验室环境,需要费用高,分析时间长,不能有效快速实现对甲卡西酮的分析。而苯丙胺类尿检检测板只适用于吸食后尿液检测,对查获的未吸食的甲卡西酮无法进行及时、快速的检测。
指纹图谱是指某些复杂物质,经适当处理后,采用一定的分析手段,得到的能够标示其化学特征的色谱图或光谱图,适用于样本成分较为复杂情况下的鉴别。目前常见的便携式毒品快速检验技术,如离子迁移谱法、拉曼光谱法等。离子迁移谱(ion mobility spectrometry,IMS)[3]是一种常压质谱,不同的毒品物质因其物化特性不同,在迁移电场中具有不同的迁移速度。离子迁移谱工作原理如图1所示,它的设备简单,检测速度快,广泛应用于爆炸物、毒品、危化品等物质检测[4-6]。拉曼光谱(Raman spectra)是一种散射光谱,对与入射光频率不同的散射光谱进行分析以得到分子振动、转动方面信息,并应用于分子结构研究的一种分析方法[7]。但由于掺杂物的影响,单一的采用拉曼光谱毒品检测仪鉴别毒品,或单一的使用IMS,都容易出现将甲卡西酮与麻黄碱之间误报的问题。
图1 离子迁移谱工作原理图Fig.1 Principle of ion mobility spectrometry
综合上述在实际使用中遇到的问题和现象,考虑到单一的使用其中任意一种指纹图谱可能都无法反映样品的全部特征,而使用几种不同设备采集的指纹图谱联用可以从不同侧面反映样品的各种特征,从而可有效控制检验分析中常见的假阳性问题,提高分析结果的可靠性和准确性[8-10]。离子迁移谱分析方法和拉曼光谱分析方法可以从不同角度来反映物质的特征。如果分析样品是实验室制备的高纯度标准品,这两种分析方法都能较好的发挥作用。但实际使用中,毒品中常常被掺杂了其他物质,以谋取暴利。这些掺杂物质在某种程度上,加大了对单一物质分析的难度。比如:掺杂杂质的甲卡西酮仅使用拉曼光谱仪很难被准确识别(特征峰很微弱),同时如果掺杂物质的迁移率与甲卡西酮等毒品接近,也会影响IMS设备识别的准确性。因此,本实验基于离子迁移谱仪与拉曼光谱仪分别采集甲卡西酮、麻黄碱的指纹图谱,尝试指纹图谱数据融合技术结合SVM算法,以此提出一种快速、便捷的鉴别甲卡西酮、麻黄碱的方法。
实验中IMS设备使用的型号为AY05-02便携式毒品探测仪,仪器采用伪随机序列离子开门技术和Hadamard算法[11],有效减少了仪器的误报率。采用的激光拉曼设备型号为SS-AY01-01Ⅱ易制毒化学品快速检查仪,内部采用海阳光学的QEpro光谱仪,激发波长785±0.5 nm,线宽<0.08 nm激光源,输出功率可调范围0~500 mW,工作温度0~45 ℃,于大气环境下采集,单次扫描积分时间8 ms~15 min。实际使用中毋需直接接触样品,即可实现现场样品的无损、快速检测、鉴定,激光拉曼光谱仪的光路图如图2所示。
图2 激光拉曼光谱仪光路图Fig.2 Optical path of theRaman spectroscopy
实验使用的4种甲卡西酮从各地缴获的毒品中获取,4种麻黄碱通过多批次购入。其中甲卡西酮获得样本的形态呈现粉末、块状,颜色表现深浅不一,有乳白色、褐色、灰色等,其颜色差异与掺兑的其他物质相关,也与制毒方式和来源差异性相关。
考虑到激光拉曼光谱在粉末状的情况下更容易出峰,IMS对于爆炸物和毒品只需要痕量就会出峰。所以在制备样本时,先将甲卡西酮、麻黄碱样品统一处理成粉末状态。由于贩毒团伙为了获取更多的利润,通常会添加一些掺杂物,所以实验的样本粉末选择质量分数成分至少10%以上,然后将粉末分别装入透明容器中备用。实验时取少量样本放在载玻片上,寻找合适的位点进行拉曼光谱分析[12]。
离子迁移谱法工作在正离子模式,测试校准物选择丁基化羟基甲苯(BHT),使用试纸沾取少许粉末,离子管工作电压1 800 V,采集时间为30 ms,载气流量为200 mL/min,电离区注入温度保持在180 ℃,迁移区内迁移温度保持在140 ℃。由于环境湿度及仪器自身波动可能导致采集到的离子迁移谱图存在差异,所以对每个样本分别采集5次,采用其均值数据。
拉曼光谱法采集数据时探头口功率约为350 mW,波数扫描范围200~3 200 cm-1,分辨率1 cm-1,于暗室内对光谱进行采集,单次扫描,积分时间约为3 s。由于每次采集的位点存在偏差,所以采样时以有明显出峰的谱图数据作为有效采样数据。
本实验使用MATLAB R2017a对采集数据进行处理。考虑到离子迁移谱仪器设备是对微弱信号进行测量,在经过放大器放大被测数据时,很容易受到放大器及测量电路的固有噪音、传感器噪声、工作环境各类干扰噪音的综合影响,这些噪音叠加在被采集信号上,降低了被采集数据的信噪比。为了降低噪声对波形数据的影响,利用sym6小波对IMS数据进行分解,再根据Birge-Massart策略对离子迁移谱数据进行降噪。
图3 数据融合PCA-SVM流程图Fig.3 Flowchart of the data fusion using PCA-SVM
数据融合流程如图3所示,其中n为进行融合样品的样本数,i与j分别表示样品拉曼光谱数据和IMS数据的维度,z为两个图谱数据融合后提取的主成分数量。单次IMS分析过程中会产生一个多帧样本数据,而单次采集拉曼光谱数据只有一个单帧样本数据。因此在滤波后的IMS多帧数据中取出峰值信号强度大于预先设定阈值的10帧数据,并对它们求平均值,其平均后的谱图则作为IMS的一个样本数据。由于IMS和拉曼谱图数据在幅度上存在差异,所以在数据融合之前需要先对数据进行预处理。首先,分别选取两组数据中含有特征数据的部分,选取特征数据时尽可能保证两者所取数据长度接近。然后,为了防止具有较大初始值域的属性比具有较小初始值域的属性的权重过大,使用最小-最大规范化对降噪后的数据进行归一化处理
(1)
式中:v是原始数据;minA为原始数据集的最大值;minA为原始数据集的最小值。
最后,将经过处理后的拉曼数据直接拼接到处理后的IMS数据之后,至此完成了两个数据融合处理,融合后的数据维度为两个谱图数据维度之和。
如图4所示,甲卡西酮基于实验设备所采集的拉曼光谱,主要出峰数据集中在400~2 000 cm-1,在2 000 cm-1以后的数据基本上没有出现特征值,所以实验中选取400~2 000 cm-1作为拉曼光谱的采集数据。甲卡西酮由异丙基和甲胺构成的支链,取代了苯环上的氢原子,形成单取代苯类化合物。吸收峰主要由CH3和CH2基变形形式的倍频或合频、面内C--H变形衍生的苯环的振动、内环变形以及三角形环呼吸振动组成[16]。如图5所示,麻黄碱吸收峰主要由面内环变形、简并环伸缩振动双峰[17]。这两个物质在采集到的拉曼光谱数据的最强吸收峰,都集中在1 001 cm-1左右,两者的拉曼光谱机器较为相似,较难通过肉眼分别。
图4 甲卡西酮典型拉曼光谱图Fig.4 Raman spectrum ofmethcathinone
图5 麻黄碱典型拉曼光谱图Fig.5 Raman spectrum of ephedrine
图6 8批次甲卡西酮的拉曼光谱PCA图Fig.6 The PCA result of the Raman spectrum of methcathinone from 8 samples
由于不同来源的甲卡西酮样品掺兑的成分多种多样,而采购来的麻黄碱混杂的物质较少,这也决定了两者的光谱曲线在其它部分有一定的区别,并具有特征性,主要体现在光谱吸收峰的强度变化及各个小峰的差异性。为了更好的从数据中提取有效信息,以此对样本进行分类,对采集到的拉曼光谱波段进行了取舍。由于200~500 cm-1、1 700~2 000 cm-1波段内出峰较少并且多为背景峰,因此数据处理时考虑采用的数据区间为500~1 700 cm-1波段内的光谱数据,以此数据为样本矩阵进行PCA处理。由图6可知,两个物质互相重叠,为实现快速鉴别效果,基于PCA降维结果数据,提取贡献率大于98%的6个主成分,作为SVM分类器的输入参数,经过50次随机测试,统计平均识别率为75.21%。PCA是将数据从原来的坐标系转换到新的坐标系,新坐标系的选择是由数据本身决定的。图6中,PC1、PC2、PC3分别为贡献度最大的三个主成分,其贡献度累加值大于98%,PC1的选择原始数据中方差最大的方向,也是最重要的方向。PC2为于PC1垂直或正交方向,该过程重复执行,重复次数为原始数据中特征数目,其坐标为转换到新空间中的数值。实验结果表明,拉曼光谱结合PCA-SVM算法不能较好的鉴别甲卡西酮和麻黄碱。
测试样品物质通过载气分子和样品分子在离子源放射性63Ni的作用下发生一系列的电离反应和离子-分子反应产生产物离子,最终生成正离子[18]。正离子通过离子门栅进入迁移区进行漂移,在电场力的作用下产生迁移运动,最后达到电荷收集器转化为电信号,经过电路采样处理后得到最后的离子迁移谱。迁移时间为
td=L/(KE)
式中:L为迁移管长度;K为迁移率;E为电场。
根据多次对甲卡西酮及麻黄碱的检测,如图7、图8所示,这两个物质出峰位置主要集中在7.5~17.5 ms之间。
由于两种物质在7.5 ms之前与17.5 ms之后几乎没有离子信号,因此在处理数据时,只考虑产物出峰密集的区间,即12.5~17.5 ms之间的谱图数据。为实现甲卡西酮与麻黄碱的可视化描述,以采集样品的IMS数据为样本,选取12.5~17.5 ms区间对应的峰值组成新的样本矩阵,对此数据矩阵进行PCA处理。如图9所示,甲卡西酮和麻黄碱在图中分布的位置很接近,但聚类效果明显。为了实现对两者的快速鉴别,基于PCA降维后的结果数据,对其贡献率大于98%的6个主成分作为SVM分类器的输入参数,经过50次随机性实验,统计平均成功识别率为93.53%。
图7 甲卡西酮典型IMS图谱Fig.7 The IMS spectrum of methcathinone
图8 麻黄碱典型IMS图谱Fig.8 The IMS spectrum of ephedrine
图9 甲卡西酮与麻黄碱的IMS-PCA图Fig.9 IMSPCA result of methcathinone and ephedrine
由于激光拉曼光谱是基于吸收峰的归属来分析样本主要成分,IMS是基于离子在特定电场的迁移率来分析样本主要成分,所以将这两种谱图数据进行融合,将会更全面的反应毒品样本的物质信息。如图10所示,甲卡西酮和麻黄碱在拉曼-PCA分析图上有较高的重叠,而在IMS-PCA分析图上就可以较好的分别。据此推测,将两者数据融合后,在PCA分析图上可以提高其分辨度,同时也可以提高PCA-SVM分类器的鉴别成功率。由于变量数量不同的数据在融合后,变量数量较多的谱图会占更大的权重,所以确保不会因数据量不同引入的权重问题,本实验选取的IMS数据(0~30 ms)、拉曼数据(400~2 000 cm-1),分别为1 200维和1 600维,两者数据维度接近可以直接进行融合。
融合数据与单谱数据由于取值范围和量化单位的差异,为确保尽可能减少噪音干扰和峰值幅度不同造成的权重差异,分别先对IMS数据(0~30 ms)、拉曼数据(400~2 000 cm-1)进行小波滤波、归一化预处理,然后将处理后的数据融合,融合后的数据维度为两者谱图维度总和。基于融合后的数据进行PCA处理。如图10所示,甲卡西酮和麻黄碱在PCA分析图中没有重叠,因此可以认为IMS图谱和拉曼图谱数据融合后可以更全面的反映这两个物质的特征,有助于进一步增强对毒品的检测效果。将融合后的数据取12个贡献度大于98%的主成分作为SVM分类器的输入参数,经过50次随机试验,识别率平均为98.24%。如表1所示,数据融合后的识别率大于单一谱图数据的识别率,数据融合技术可以提高鉴别结果的可靠性。
图10 8批次甲卡西酮的数据融合后PCA图Fig.10 PCA result of methcathinone from 8 samples
数据类型累计贡献率大于98%的主成分数量平均识别率/%IMS693.53拉曼光谱675.21融合数据1298.24
本实验将拉曼光谱与IMS数据融合技术结合PCA-SVM应用于甲卡西酮与麻黄碱的鉴别。甲卡西酮、麻黄碱样品经粉末化处理后,再经拉曼光谱仪和IMS仪分析建立了4种甲卡西酮样品和4种麻黄碱样品的拉曼光谱和IMS指纹图谱库,分别使用单谱数据结合PCA-SVM以及拉曼光谱-IMS数据融合结合PCA-SVM对甲卡西酮、麻黄碱样品进行鉴别分析。拉曼光谱-IMS数据融合结合PCA-SVM建立的鉴别模型对4种甲卡西酮、麻黄碱的识别率达98.24%,相比拉曼光谱的75.21%和IMS的93.53%,有明显提高。拉曼光谱-IMS数据融合结合PCA-SVM为鉴别甲卡西酮、麻黄碱提供了一种可靠、稳定、快速的方法。此分析方法适用于含量相对较高的其他类别毒品分析、比对。因此,本实验使用的拉曼光谱仪和IMS仪均为便携式仪器,操作简单,具有现场快速检测分析的前景。
参考文献:
[1] 赵璐,张红波.长治市甲卡西酮毒品案件现状调查[J].政府法制,2013(22):49.
[2] 常颖,高利生.甲卡西酮概述及其分析方法[J].刑事技术,2011(5):35-38.
[3] EICEMAN G A,KARPAS Z.Ion mobility spectrometry[M].Florida:CRC Press,1994.
[4] EWING R G,ATKINSON D A,EICEMAN G A,et al.A critical review of ion mobility spectrometry for the detection of explosives and explosive related compounds[J].Talanta,2001,54(3):515-529,doi:10.1016/S0039-9140(00)00565-8.
[6] HARRIS G A,KWASNIK M,FERNNDEZ F M.Direct analysis in real time coupled to multiplexed drift tube ion mobility spectrometry for detecting toxic chemicals[J].Analytical Chemistry,2011,83(6):1908-1915,doi:10.1021/ac102246h.
[7] 陈珊.拉曼光谱背景扣除算法及其应用研究[D].长沙:中南大学,2011.
[8] BIANCOLILLO A,BUCCI R,MAGRA L,et al.Data-fusion for multiplatform characterization of an italian craft beer aimed at its authentication[J].Analytica Chimica Acta,2014,820:23-31,doi:10.1016/j.aca.2014.02.024.
[9] TAN J,LI R,JIANG Z T.Chemometric classification of Chinese lager beers according to manufacturer based on data fusion of fluorescence,UV and visible spectroscopies[J].Food Chemistry,2015,184:30-36,doi:10.1016/j.foodchem.2015.03.085.
[11] CLOWERS B H,SIEMS W F,HILL H H,et al.Hadamard transform ion mobility spectrometry[J].Analytical Chemistry,2006,78(1):44-51.
[12] 王继芬,余静,孙兴龙,等.毒品及其常见添加成分的拉曼光谱快速分析[J].光散射学报,2012,24(3):312-315.
[13] GROTH D,HARTMANN S,KLIE S,et al.Principal components analysis[C]∥REISFELD B,MAYENO A N.Computational Toxicology.Totowa,NJ:Humana Press,2013:527-547,doi:10.1007/978-1-62703-059-5_22.
[14] BOSER B E,GUYON I M,VAPNIK V N.A training algorithm for optimal margin classifiers[C]∥Proceedings of the 5th Annual Workshop on Computational Learning Theory.New York,NY,USA:ACM,1992:144-152.
[15] HAN J W,KAMBER M,PEI J.数据挖掘:概念与技术[M].范明,孟小峰,译.3版.北京:机械工业出版社,2012.
[16] 徐鹏宇,苏婉芬,钟爱国.甲卡西酮光谱性质的密度泛函模拟与指认[J].当代化工,2014,43(3):334-336.
[17] 赵金涛,彭勇,徐存英.麻黄素拉曼散射振动模式的研究[J].光散射学报,2001,13(2):114-118.
[18] 檀景辉.基于脉冲正电晕放电离子源的离子迁移谱仪研究[D].天津:天津大学,2010.