赵凌艺,杨 馨,魏 懿,杨瑞琴*,赵 倩,张洪文,蔡伟平
1. 中国人民公安大学侦查学院,北京 100038 2. 刑事科学技术北京市重点实验室,北京 100038 3. 中国人民公安大学信息网络安全学院,北京 100038 4. 中国科学院合肥物质科学研究院固体物理研究所,安徽 合肥 230031
目前,毒品滥用仍是一个全球性问题,由此引发的犯罪、事故与疾病传播给社会稳定和公共卫生带来了极大的威胁。根据《2021年中国毒情形势报告》,在我国现有吸毒人员中,海洛因滥用的比例占近40%,仍是主要滥用毒品之一。海洛因被摄入体内后,会逐步代谢成为6-单乙酰吗啡(6-MAM)和吗啡[1]。鉴于海洛因依旧是高风险阿片类毒品,建立高效、便捷、精准的海洛因及其代谢物的检测与识别方法对毒品管控、打击毒品犯罪至关重要。常规的海洛因及其代谢物的鉴定技术主要有色谱法和免疫分析法[1-2]。但这些方法通常需要较为复杂耗时的样品前处理过程、昂贵的大型仪器和专业的操作人员。表面增强拉曼光谱(SERS),能够提供分子的特征指纹谱图。与常规拉曼光谱相比,SERS可以通过贵金属(Au、Ag等)纳米材料的局域表面等离激元共振效应极大地增强分析物的拉曼信号[3-4],适用于痕量物质的分析检测[5];同时,SERS还具有响应快速、操作简单、无损检测等优点。因此,SERS在毒品鉴定中具有很好的应用前景。近年来,基于SERS鉴定毒品的研究工作已有一些报道[6-9]。其中,也有针对海洛因及其代谢物的研究,例如:2020年,Akcan等将经预处理的加标唾液样品与Ag纳米粒子混合后滴加在Au纳米棒阵列上,以对唾液中的海洛因及其代谢产物(吗啡、吗啡-3-β-葡萄糖醛酸、6-MAM)进行检测[8]。该方法的主要局限在于:(1)需要两种SERS基底的协同作用才能实现对海洛因及其代谢产物的灵敏测定;(2)样品质量或含量受到影响时,可能无法得到与该报道类似的结果。
此外,由Akcan等给出的光谱结果也可知,海洛因、吗啡和6-MAM的拉曼谱图较为相似[8]。对于相似的结果,尽管可通过特征峰信息进行区分,但人工处理大量复杂的谱图数据,不仅耗时较长,而且存在错判的风险。尤其在现场检测时,面对大量复杂的光谱数据,快速获得准确直观的结果,是鉴定人员所期待的目标。而模式识别技术,能够实现对大量样本的自动分类识别,提高分析效率并降低人工误判的可能性。模式识别技术主要包括主成分分析(PCA)、偏最小二乘回归、支持向量机(SVM)、k近邻算法等方法。通过模式识别技术处理拉曼光谱数据,已成功实现了一些毒品(如甲基苯丙胺、可卡因、芬太尼等)的鉴定[10-14]。然而,SERS与模式识别技术结合鉴别海洛因及其代谢物尚鲜见报道。
总之,海洛因及其代谢物的高效检测与精确分类鉴别,仍是亟待解决的需求。为此,针对溶液中痕量海洛因及其代谢物,提出了基于Au/SiO2复合纳米球阵列(Au/SiO2NSA)的SERS检测与模式识别相结合的思路,研究毒品的灵敏检测与高效鉴别。首先,采用胶体球模板-溅射沉积的方法制备了具有良好SERS活性和结构一致性的Au/SiO2NSA。然后,以此为SERS基底(芯片),结合便携式拉曼光谱仪,成功实现了对水溶液中海洛因及其主要活性代谢物(6-MAM和吗啡)的灵敏检测。接下来,借助模式识别技术中的系统聚类分析(HCA)、PCA和SVM对得到的SERS数据进行分析处理,实现了海洛因、6-MAM和吗啡的定性/定量分类识别。这项工作不仅可为基于SERS的痕量毒品检测与精准鉴别提供一种具有实用价值的高质量芯片,也为海洛因及其代谢物的准确分类及识别给出了可行的方案。
甲醇,乙腈和4-巯基苯硼酸(4-MPBA)购自上海阿拉丁生化科技股份有限公司。乙醇,正丁醇和十二烷基硫酸钠(SDS)购自国药集团化学试剂有限公司。海洛因、6-MAM和吗啡标准溶液(1.0 mg·mL-1)购自Sigma-Aldrich。SiO2胶体球悬浮液(球径:150 nm,含量:5%Wt)购于上海辉质生物科技有限公司。硅片购买于浙江立晶硅材料有限公司。所有试剂均为分析纯,使用前无需进一步提纯。整个实验均使用超纯水(18.2 MΩ·cm)。
利用气-液界面自组装[15]和磁控溅射沉积的方法制备Au/SiO2NSA。首先,用移液枪沿烧杯壁缓慢向空气-水界面注入均匀分散的SiO2胶体球-正丁醇悬浮液。随后,注入一定量的SDS溶液,使SiO2胶体球自组装形成密排的薄膜。接着,用镊子夹取表面经臭氧处理的洁净硅片(1.5 cm×1.5 cm)捞取薄膜,从而将SiO2胶体球薄膜转移至硅片上,得到了在硅片上的SiO2胶体球阵列。待水分完全蒸发后,将覆盖有SiO2胶体球阵列的硅片在400 ℃马弗炉中退火2 h以除去残余的SDS和其他杂质。最后,将其切割成2.5 mm×2 mm的基片,并通过磁控溅射在其表面沉积一层Au(英国Quorum Q150R ES plus镀膜仪,电流:30 mA,时长:10 min,等效沉积厚度:约165 nm),即得到了Au/SiO2NSA。阵列的微观形貌观察与元素分析在配备有能量色散X射线光谱仪(EDS,英国Oxford Aztec X-Max 80)的场发射扫描电子显微镜(FESEM,日本Hitachi SU8020)上进行。
用相应溶剂(海洛因、6-MAM∶乙腈;吗啡∶甲醇)分别将1.0 mg·mL-1的海洛因、6-MAM及吗啡的标准溶液稀释至0.1 mg·mL-1作为储备溶液。检测前,将储备溶液用水连续稀释至特定浓度。将1.2中制得的Au/SiO2NSA(2.5 mm×2 mm)作为SERS芯片。在室温下,将其浸泡在海洛因、6-MAM或吗啡的水溶液中。为确保芯片对各个浓度的毒品分子均能充分吸附,浸泡时间为1 h。然后取出芯片并在室温下干燥,再进行拉曼光谱测量。拉曼光谱测量在便携式拉曼光谱仪(美国B&W TEK BWS415-785S)上进行。测试条件为:激发波长785 nm,激光功率80 mW,积分时间5 s,光斑尺寸约为200 μm2。每种样品分别收集15个谱图数据,代表15个样本。每种样品对应的拉曼谱图均为15个样本的平均结果。
进行模式识别分析时,首先,在对SERS数据进行基线校正和归一化处理后,将数值导入SPSS 26.0软件中,分别进行系统聚类和降维处理:系统聚类时样本间距离采用平方欧氏距离,类间距离使用组间联接[16];主成分提取通过数据样本相关性矩阵的特征值分解完成。接下来,利用Python 3.6编写代码,实现各成分的分类识别[17]:首先,读取先前提取到的主成分数据及标签,并将其划分为训练样本及测试样本;然后,调用Python下的sklearn库中集成的SVM算法,用训练样本对SVM分类器进行训练;最后,将训练样本和测试样本分别输入到训练好的SVM分类器中,计算出训练集和测试集的分类准确率。所用编辑器和开发环境为PyCharm2019。采用5折交叉验证评估分类模型的准确性,即将整个样本分成5组,其中一组作为测试集,其余组作为训练集,进行5次轮换验证。这5次计算所得的测试集准确率的平均值即可看作是该模型的分类准确率。
通过SiO2胶体球的气-液界面自组装、转移至硅片,及随后在其上溅射沉积Au,即可获得Au/SiO2NSA,如图1(a)中插图所示。表面形貌观察[图1(a)]表明,该阵列由密排的Au/SiO2复合纳米球组成,SiO2胶体球表面覆盖有Au纳米颗粒。Au/SiO2NSA的EDS分析结果[图1(b)]也证明了元素Au、Si和O的存在。同时,由图1(a)可以看出,Au/SiO2NSA呈现出高度的结构一致性与微/纳尺度的粗糙表面,这种粗糙的表面以及三维SiO2胶体球的圆弧面,使阵列具有较大的比表面积,为良好的SERS活性奠定了基础[18-19]。
图1 (a)Au/SiO2 NSA的FESEM照片(内插图为Au/SiO2 NSA的光学照片);(b)Au/SiO2 NSA的EDS谱图Fig.1 (a) The FESEM image of Au/SiO2 NSA (the inset is a photo of Au/SiO2 NSA);(b) The EDS spectrum of Au/SiO2 NSA
接下来,以4-MPBA为探针分子,用沉积在硅片上的Au纳米颗粒薄膜(Au/Si,一种常用的SERS基底,等效Au沉积厚度同Au/SiO2NSA)为参考,对Au/SiO2NSA的SERS活性进行评估。图2(a)为Au/SiO2NSA与Au/Si在10-7mol·L-14-MPBA溶液中浸泡30 min后的拉曼谱图。
图2 Au/SiO2 NSA的SERS性能评估(浸泡溶液:10-7 mol·L-1 4-MPBA)(a) Au/SiO2 NSA和Au/Si在4-MPBA溶液中浸泡后的拉曼谱图;(b) 1 075 cm-1处特征峰强度与Au/SiO2 NSA的等效Au沉积厚度的关系;(c) 浸泡过4-MPBA的Au/SiO2 NSA上不同位置测得的1 075 cm-1处特征峰强度条形图;(d) 5片等同的Au/SiO2 NSA经4-MPBA溶液浸泡后测得的1 075 cm-1处特征峰强度条形图Fig.2 Evaluation of SERS performance of Au/SiO2 NSA(a) Raman spectra of 10-7 mol·L-1 4-MPBA on Au/SiO2 NSA and Au/Si;(b) Relationship between the characteristic peak intensity at 1 075 cm-1 with equivalent Au deposition thickness of Au/SiO2 NSA;The histograms of the peak intensities at 1 075 cm-1 measured at (c) different positions on a 4-MPBA-soaked Au/SiO2 NSA and (d) 5 equivalent 4-MPBA-soaked Au/SiO2 NSAs
1 000和1 075 cm-1处的峰为4-MPBA的典型特征峰。可以看出,Au/SiO2NSA上这两个特征峰的强度要明显强于Au/Si,即Au/SiO2NSA对4-MPBA拉曼信号的增强能力远高于Au/Si。这表明Au/SiO2NSA具有良好的SERS活性,且明显优于常用的Au纳米颗粒薄膜。在SERS的增强机制中,占据主导地位的电磁场增强源于贵金属纳米材料的局域表面等离激元共振所引起的极强的局域电磁场(“热点”)[3]。而Au/SiO2NSA对信号的增强效果比Au/Si更好,主要可归因于Au/SiO2NSA的大比表面积以及大量的纳米间隙与纳米“尖端”,为SERS增强提供了更多的“热点”。
进一步的研究表明,Au/SiO2NSA的Au沉积厚度对SERS活性有明显影响,沉积厚度过薄与过厚均不利于SERS活性的提高。如图2(b)所示,等效Au沉积厚度约为165 nm时,SERS活性最佳。当沉积开始后,随着Au沉积的进行,越来越多的超细Au纳米颗粒沉积在SiO2胶体球表面,Au沉积层不断增厚。同时,形成了纳米粗糙的表面与大量的纳米间隙,从而构成了高密度的“热点”[18],所以表现为SERS活性随Au沉积层的增厚而增强。而当沉积层过厚时,会掩盖相邻胶体球之间的间隙,进而减少“热点”数量,降低SERS活性。故只有在合适的沉积厚度下,Au/SiO2NSA才会既具有足够厚度的Au层,又保持表面的纳米粗糙度与高密度纳米间隙,展现出最佳的SERS活性。因此,选取等效Au沉积厚度为165 nm的Au/SiO2NSA[图1(a)]作为SERS芯片,用于后续的溶液中毒品SERS检测。
此外,该Au/SiO2NSA作为SERS芯片,也具有良好的SERS信号一致性与重现性。图2(c)为Au/SiO2NSA经10-7mol·L-14-MPBA溶液浸泡后,在表面随机选定不同位置测得的1 075 cm-1处拉曼特征峰强度的条形图。可以看出,随机选取20个位置测得的特征峰强度的相对标准偏差(RSD)仅为4.4%,呈现出高度的信号一致性。同时,多个等同的Au/SiO2NSA芯片经4-MPBA溶液浸泡后,4-MPBA分子特征峰强度的RSD仅为3.7%[如图2(d)],表明Au/SiO2NSA具有良好的信号重现性。
总之,上述Au/SiO2NSA具有高的SERS活性、良好的信号一致性与重现性,可作为SERS检测海洛因及其代谢物的高质量芯片,并为拉曼谱图的模式识别提供可靠保障。
以上述Au/SiO2NSA为芯片,对海洛因及其代谢物进行SERS检测。图3(a)为在10-2mg·mL-1海洛因及其代谢物溶液中浸泡后测得的拉曼谱图。海洛因、6-MAM和吗啡在625 cm-1处均有一强的特征峰,可归属为它们分子结构中环的弯曲振动[6]。此外,海洛因在1 245 cm-1、6-MAM在705 cm-1、吗啡在710和760 cm-1分别存在较强的特征峰[8]。这些特征峰信息可用于以上分析物拉曼谱图的识别。
图3 基于Au/SiO2 NSA的海洛因及其代谢物的拉曼谱图(a)芯片在浓度为10-2 mg·mL-1的毒品溶液中浸泡后测得的拉曼谱图;芯片在不同浓度(b)海洛因、(c)6-MAM、(d)吗啡溶液中浸泡后测得的拉曼谱图Fig.3 Raman spectra of heroin and its metabolites based on Au/SiO2 NSA(a) Raman spectra of the chips soaked in 10-2 mg·mL-1 drug solutions;Raman spectra of the chips soaked in different concentrations of (b) heroin,(c) 6-MAM and (d) morphine,respectively
图3(b—d)展示了不同浓度的海洛因、6-MAM和吗啡的拉曼谱图。各特征峰的强度均随浓度的降低而减弱。当浓度≥10-4mg·mL-1时,皆可观察到明显的特征信号。因此,可认为基于Au/SiO2NSA的SERS芯片对海洛因、6-MAM和吗啡的检测限优于10-4mg·mL-1。
SERS可提供分子的指纹谱图,原则上可根据光谱中的特征峰对分析物进行精准识别。然而,在实际应用中,往往会面对大量复杂的谱线、甚至存在谱峰的重叠。此时,仅依靠主观观察和人工分析,效率低、易出错。特别是在现场检测时,更希望能够简化分析过程、快速获取直观准确的鉴定结果。因此,在SERS检测的基础上,构建了可用于海洛因及其代谢物分类识别的算法模型。通过HCA分类、PCA降维提取特征变量、训练SVM分类模型,逐步完成对海洛因、6-MAM和吗啡的定性分类鉴别。
2.3.1 HCA结果
聚类分析是一种无监督的模式识别技术,可根据一批样本的相似性或差异对该批样本进行分类,即“物以类聚”[20]。首先利用HCA对海洛因及其代谢物的拉曼谱图数据(每种样品各采集15个谱图数据,共45个谱图数据,即45个样本)进行分类,谱系图如图4所示。图中,红色代表海洛因、蓝色代表为6-MAM、绿色代表为吗啡。可以看出,HCA能成功地将海洛因、6-MAM和吗啡分类。这为接下来利用PCA-SVM模型对它们进行分类识别奠定了良好的基础。另外,在成功分出3大类后,6-MAM样本与吗啡样本会先聚成一类,再与海洛因样本合为一类。该现象说明6-MAM和吗啡的拉曼谱图的相似程度更大,这与图3(a)给出的谱图结果一致。
图4 海洛因及其代谢物的系统聚类分析谱系图Fig.4 Pedigree chart of hierarchical cluster analysis for heroin and its metabolites
2.3.2 基于PCA-SVM模型的分类
然后,利用PCA对45个样本在620~630、700~720、755~765和1 240~1 250 cm-1范围的拉曼谱图数据进行降维处理。如图5(a)所示。PCA提取到的前29个主成分的累计方差贡献率可达到100%,表明由PCA得到的这29维特征向量可完全解释原始数据的信息。其中,前两个主成分的累计方差贡献率即可达到64.2%。图5(b)为由这两个主成分得到的二维PCA分布图,图中每个点代表每个样本的拉曼谱图数据。可以看出,每种样本类型可形成不同的簇,且簇与簇之间区分明显,说明海洛因、6-MAM和吗啡能够被清晰地区分开来,也说明了PCA能够很好地将海洛因及其代谢物分类。
图5 对45个样本拉曼谱图信息的PCA处理结果(a) 主成分的方差贡献率和累计方差贡献率;(b) 用于海洛因及其代谢物分类的二维主成分分布图Fig.5 PCA results of Raman spectral information of 45 samples(a) The variance contribution rate and cumulative variance contribution rate of principal components;(b) Two-dimensional principal component distribution plot for classification of heroin and its metabolites
同时,由图5(a)可知,前5个主成分(特征值均大于1)的累计方差贡献率已到达82.0%,应该可以实现良好的分类准确率。为此,将这5个主成分输入SVM分类模型以实现自动识别。利用基于4种常用核函数(径向核函数、线性核函数、多项式核函数、S型核函数)的SVM模型分别对海洛因及其代谢物进行分类识别。各核函数分类模型的识别准确率如图6所示,基于这4种核函数的SVM模型的识别准确率均可达到100%。即选择任一模型,都可以完全区分海洛因、6-MAM和吗啡。这一结果表明,借助PCA-SVM,能够出色地实现海洛因及其代谢物的准确定性分类识别。如将构建的SVM算法嵌入到SERS测量的程序中,则有望实现在检测的同时直接给出可视化的识别结果。
图6 支持向量机模型对海洛因及其代谢物定性识别的准确率Fig.6 Accuracy of support vector machine model for the qualitative classification of heroin and its metabolites
除对它们进行定性鉴别外,本工作也对不同浓度的海洛因及其代谢物进行了定量分类。利用PCA对不同浓度的海洛因、6-MAM和吗啡的SERS数据进行降维处理,图7给出了它们的二维PCA分布图。可以看出,借助PC1可完成对检测限以上(≥10-4mg·mL-1)和检测限以下(<10-4mg·mL-1)样本之间的划分;结合PC2,可进一步区分检测限以上的3种浓度样本(10-2、10-3和10-4mg·mL-1),但仍不能将检测限以下的两类样本(10-5mg·mL-1和空白)很好地分类。10-5mg·mL-1浓度的各分析物与空白样本之间的分类效果较差,这也与不同浓度各分析物的SERS谱图[图3(b—d)]显示的结果一致。对于检测限(10-4mg·mL-1)及检测限以上(10-2和10-3mg·mL-1)的样本,海洛因的分类情况较好,可明显地区分这三个浓度的样本[图7(a)];6-MAM的这三类样本可聚成不同的簇,但簇与簇之间的距离很近,尤其是10-2和10-3mg·mL-1的两类样本[图7(b)];而这三个浓度的吗啡样本则未能得到良好的区分[图7(c)]。如要实现各浓度样本之间、以及低浓度与空白样本之间的精准分类,则需要继续加大样本量,并借助其他模式识别技术如偏最小二乘法、正交偏最小二乘法等。
图7 用于定量区分不同浓度(a)海洛因、(b)6-MAM、(c)吗啡的二维主成分分布图Fig.7 Two-dimensional principal component distribution plots for quantitatively distinguishing different concentrations of (a) heroin,(b) 6-MAM and (c) morphine
接下来,使用PCA-SVM对海洛因、6-MAM和吗啡进行定量识别,可获得各自的识别准确率,如图8所示。对于不同浓度的海洛因,采用基于径向核函数的SVM模型,识别准确率可达到90.1%;而对于不同浓度的6-MAM及吗啡,选用基于线性核函数的SVM模型时的准确率较高,分别为84.8%和70.2%。
图8 基于不同核函数的SVM模型对不同浓度海洛因、6-MAM和吗啡定量识别的准确率Fig.8 Accuracy of SVM models based on different kernel functions for the quantitative classification of heroin,6-MAM and morphine with different concentrations
基于Au/SiO2NSA的SERS检测与模式识别技术相结合,实现了对水溶液中海洛因及其代谢物的高效、灵敏检测与精准鉴别。采用胶体球模板-溅射沉积的方法获得了具有高SERS活性、良好信号均匀性与重现性的Au/SiO2NSA。以此为SERS芯片,结合便携式拉曼光谱仪,成功实现了水溶液中海洛因及其代谢物的高效检测,检测限优于10-4mg·mL-1。在此基础上,利用模式识别技术对获得的SERS数据进行分析处理与分类识别。结果表明,通过HCA、PCA及PCA-SVM均可实现对海洛因、6-MAM和吗啡的完全分类,准确率可达100%;而使用PCA-SVM模型也可实现对不同浓度海洛因、6-MAM和吗啡的定量区分,准确率分别为90.1%、84.8%和70.2%。本工作不仅为基于SERS的毒品鉴定提供了一种有实用价值的检测芯片,也表明了通过模式识别技术实现海洛因及其代谢物快速定性/定量分类鉴别的可行性。如若将构建的分类模型嵌入拉曼光谱仪配套的测量软件中,则有望同时实现测量与可视化鉴别。这对实现毒品现场高效检测与精确分类鉴别具有现实意义,也为相关仪器的研发提供了可行的设计思路。