差分拉曼光谱结合化学计量学对白色购物纸袋的检验研究

2024-01-20 06:47谢佳宁胡晓光姜红章欣黄凯
包装工程 2024年1期
关键词:纸袋曼光谱差分

谢佳宁,胡晓光*,姜红,章欣,黄凯

差分拉曼光谱结合化学计量学对白色购物纸袋的检验研究

谢佳宁1,胡晓光1*,姜红2*,章欣3,黄凯3

(1.中国人民公安大学 侦查学院,北京 100038; 2.甘肃警察职业学院 刑事侦查系,兰州 730046;3.南京简智仪器设备有限公司,南京 210049)

建立差分拉曼光谱用于无损识别白色购物纸袋的方法。对收集到的60种不同品牌、不同规格的白色购物纸袋进行拉曼光谱测定,对样品的拉曼光谱图进行预处理,根据光谱图对样品进行初步分类,并结合化学计量方法对样品进行分组。应用Fisher判别分析方法对分类结果进行验证。最后应用RBF模型对未知样本进行分类判别。结合样品中所含的碳酸钙、滑石粉、硫酸钡的不同,可初步将白色购物纸袋样品分为五大类,采用-均值聚类方法继续细分,通过Fisher判别方法对样品分结果进行验证,判别准确率为100%。应用神经网络RBF模型对未知样本进行判别分析,准确率达到89.48%。该方法简便易行,为白色购物纸袋的分类提供了科学的依据,也为公安基层工作的开展提供了便捷的办法。

白色购物纸袋;差分拉曼光谱;化学计量学;系统聚类

白色购物纸袋是一种环保美观且耐用的绿色产品,其主要材质为纸浆,可以按材质、用途、封底方式等分为多种多样的款式品种。在日常生活中,纸袋价格便宜,使用方便,承重能力大,是许多市民出行购物的必备物品。环保是纸袋的最大优势,可以在微生物、水、氧气等自然作用下很快降解成无害的物质。纸质物证的检验方法主要有高光谱法[1]、差分拉曼光谱法[2-3]、红外光谱法[4]、X射线荧光光谱法[5-6]等。在先前检验纸类材料的方法研究中光谱法前处理简单、检材用量少、快速无损、特征性强;色谱法分离效能高、选择性好、出样速度快;质谱法可准确测定分子量、灵敏度高、能对混合物进行分析。实验采用差分拉曼光谱仪器,较之以往实验器材具有无标记、快速简便的优点,可有效去除干扰峰得到纯净的光谱图。在公安实际刑侦工作中,犯罪嫌疑人可能利用纸袋进行包装或收纳相关涉案物证,因此纸袋这类重要物证可能是公安机关进行侦查破案的关键点。本文通过化学计量学方法建立对白色购物纸袋的检验分类方法,对纸类相关物质的检验分析具有一定的基层实践意义。

1 实验

1.1 仪器及条件

实验仪器:差分拉曼光谱仪(南京简智仪器设备有限公司)。

实验条件:激光功率为250 mW,积分时间为3 s,扫描范围250~2 800 cm−1。

1.2 样品

不同品牌的白色购物纸袋60个,样品参数见表1。

表1 白色购物纸袋样品

Tab.1 Samples of white shopping paper bag

1.3 方法

将白色购物纸袋裁剪为0.5 cm×0.5 cm的待测样品,用无水乙醇棉签轻擦白色购物纸袋样品,待表面风干后对白色部位进行测试。

重复性实验:在上述实验条件下,随机选取27#样品对同一部位进行平行测试10次。

样品均匀性实验:随机选取15#样品,在同一实验条件下对样品上、下、左、右、中间这5个不同部位进行测试。

2 结果与讨论

2.1 实验可行性分析

由实验结果可得,27#样品在同一部位的拉曼光谱图基本一致,表明差分拉曼光谱仪稳定性良好。15#样品的不同部位的拉曼光谱图基本相同,表明样品成分均匀,实验数据准确可靠。

2.2 样品的差分拉曼光谱分析

白色购物纸袋的主要成分是纤维素,为了满足购物纸袋不同的性能要求,在生产过程中会添加不同填料。纸袋中的主要填料有滑石粉、碳酸钙、硫酸钡等,滑石粉可以提高纸张的光泽度、平滑度和白度;碳酸钙价格低廉,能提高纸张的不透明度和吸油墨性能,具有很好的阻燃效果;硫酸钡可以改善纸张的白度、光泽度、平滑度和印刷适印性。常见物质的主要拉曼特征峰见表2。

大部分纸袋成分都含有纤维素,因此纤维素不能有效作为分类的判断标准,故考虑其他填料。通过拉曼光谱图的筛选对比,可以发现280、711、1 085 cm–1是碳酸钙的拉曼特征峰;996、1 115、1 148 cm–1是硫酸钡的拉曼特征峰;370、430、502 cm–1是滑石粉的拉曼特征峰[7]。依据拉曼光谱图中特征峰的不同,可将60个样本分为五大类,具体分类结果见表3。第Ⅰ类样本含有碳酸钙和滑石粉,以2号样本为例(见图1);第Ⅱ类样本含有硫酸钡,以48号样本为例(见图2);第Ⅲ类样本含有碳酸钙、硫酸钡和滑石粉,以1号样本为例(见图3);第Ⅳ类样本含有滑石粉,以59号样本为例(见图4);第Ⅴ类样本不含有碳酸钙、硫酸钡和滑石粉,以56号样本为例(见图5)。

2.3 主成分分析法

对检测得到的拉曼光谱数据用化学计量学的方法处理,可以进一步对样品进行分类。由于拉曼光谱数据有信息量庞大的特点,因此使用主成分分析方法对光谱数据进行降维分析。主成分分析法是借助于一个正交变换,将其分量相关的原随机向量转化为其分量不相关的新随机向量。在代数形式上表现为将原随机变量的协方差矩阵变换为对角矩阵,在几何形式上表现为将原坐标系变换成新的正交坐标系,使原随机向量指向样本点分散开的个正交方向。然后对多维变量系统进行降维处理,再构造适当的价值函数,进一步把低维系统转化为一维系统[8]。

本实验中,样品数量为60个,拉曼光谱数据有2 048维。通过计算光谱数据的协方差矩阵和样品矩阵求出样品的主成分。选取主成分数量的标准有碎石图、累计方差贡献率和KMO检验等。KMO检验的结果显示为0.996,水平上呈现显著性,即表明各变量间具有相关性,主成分分析结果是有效的。选取累计方差贡献率作为筛选标准,一般要求大于90%,将样本数据的2 048个变量降维为16个变量,方差累计贡献率为99.076%,降维后的数据用于后续处理(见表4)。

表2 常见物质的拉曼光谱特征峰

Tab.2 Raman characteristic peaks of common fillers

表3 样品分类

Tab.3 Sample classification

图1 第Ⅰ类2#样品的拉曼光谱图

图2 第Ⅱ类48#样品的拉曼光谱图

图3 第Ⅲ类1#样品的拉曼光谱图

图4 第Ⅳ类59#样品的拉曼光谱图

图5 第Ⅴ类56#样品的拉曼光谱图

2.4 K-均值聚类分析

-均值聚类方法是基于样本集合划分的聚类算法,主要是将样本集合划分为个子集,构成个类,将个样本分到个类中,每个样本到其所属类的中心距离最小,每个样本仅属于一个类。首先,采用欧氏距离平方作为样本之间的距离(x,x):

然后定义样本与所属样本中心之间的距离总和为损失函数,即:

表4 总方差解释

Tab.4 Interpretation of total variance

选择值为5,将60个白色纸袋样本进行-均值聚类,得到分类结果(见表5)与样品填料分类结果进行对比,发现按照填料分类第Ⅰ类的2#号样本被分到了-均值聚类的第Ⅱ类,28号样本被分到了第Ⅴ类;填料分类第Ⅱ类的22号和39号样本被分到了第Ⅴ类;填料分类第Ⅴ类的8号样本被分到第Ⅰ类。分析原因为-均值聚类分析方法对变量的方差齐次性的要求较高,同时初始聚类中心的随机性也会对聚类中心发生影响,因此导致分类差异。除去这5个样本数据,其余样本数据与按照填料分类结果一致,说明分类结果具有一定科学性。

2.5 Fisher判别分析

利用Fisher判别函数分析-均值聚类法对60个白色购物纸袋样品分析结果的准确性和科学性。以降维后的16个变量为研究对象来建立Fisher判别函数,根据Fisher判别函数计算样品得分并将其划入得分高的组别。通过分析建立了3种判别函数,检验判别结果见表6[11]。

图6 不同K值对聚合系数的影响

表5-均值聚类样品分类

Tab.5 K-means clustering sample classification

表6 Wilk的Lambda检验

Tab.6 Wilk's Lambda test

图7 判别函数联合分布图

Wilks' Lambda可以用来判定函数有无价值,由表6得3个函数的显著性水平都小于0.05,因此具有统计意义。方差百分比可以解释判别函数反映的方差变异程度的大小,函数1的方差百分比为78.5%,函数2的方差百分比为20.1%,说明函数1对判别分析的贡献更高。函数1和函数2的累计贡献率达到了98.6%,携带的信息可以解释大部分变量,远超于其他函数,综上选取函数1和2作为模型的判别函数,并建立样本的二维联合分布图(见图7)。可以看到5组样品在空间区域上区分效果明显,并通过次模型对分类结果进行预测,表7显示其正确判别率为100%,说明-均值聚类分类结果具有一定的准确性和科学性。

2.6 RBF模型分析

近年来,机器学习的方法在法庭科学领域的应用范围逐渐变广泛,常用来预测不同的物证,模型通过训练来预测样品的种类。依照先前的分类数据,通过构建模型来验证样品分类的准确性和可靠性。多层感知器神经网络也叫人工神经网络,是一种全局逼近的由一组并行的多个感知器构成的神经网络,其可以为单层或多层结构,见图8。神经网络模型由输入层、隐藏层、输出层组成,外部信息通过输入层进行模型,由隐藏层进行数据处理,再由输入层进行信息输出[12-13]。

表7 Fisher模型分类预测结果

Tab.7 Classification prediction results by Fisher model

图 8 RBF神经网络结构

实验采用RBF模型来实现对未知样本的模型构建与分类。在RBF模型中选择样品的波长作为输入层神经元,选择正态化径向基函数作为隐藏层激活函数[14-15]。以60个差分拉曼光谱数据为基础,构建RBF模型并将样本按70%和30%的比例分为训练集和测试集,进行位置样品的判别训练。共有42个样本作为训练集,18个样本作为测试集,具体分类预测结果见表8。由表8可得,训练集的正确率可以达到94.66%,测试集的正确率有84.3%,其总体正确率为89.48%。由此说明了神经网络模型分类方法是准确可靠的,可与均值聚类结果相互印证,并且可在已知样品分类组别基础上,构建未知样本的模型构建,实现对未知样本的分类。

表8 RBF模型中的分类结果

Tab.8 Classification results in RBF model

3 结语

本文通过差分拉曼光谱法与化学计量学相结合对白色购物纸袋进行分类检验,根据填料不同初步分为五大类,随后应用-均值聚类方法继续细分,将每组样品有效区分开来,并且通过Fisher判别方法对分类结果进行验证,准确率为100%,证明了分类结果的准确性。采用RBF模型对未知样本进行判别分析,模型总体准确率可以达到89.48%。因此采用差分拉曼光谱法结合化学计量学是可以对白色购物纸袋进行有效分类的。本文为实际案发现场中遗留下的纸类证据检验分类工作提供了新的思路,以期能够更高效、更准确地进行侦查破案。

[1] 林凡琦, 姜红, 张文宇. 高光谱结合多元统计分析鉴别一次性纸杯样品[J]. 化学研究与应用, 2021, 33(10): 1949-1955.

LIN F Q, JIANG H, ZHANG W Y. Hyperspectral Analysis Combined with Multivariate Statistical Analysis to Identify Disposable Paper Cup Samples[J]. Chemical Research and Application, 2021, 33(10): 1949-1955.

[2] 陈维娜, 国中正, 李开开, 等. 显微共聚焦拉曼光谱技术结合化学计量法鉴别静电复印纸[J]. 光谱学与光谱分析, 2022, 42(7): 2033-2038.

CHEN W N, GUO Z Z, LI K K, et al. Micro Confocal Raman Spectroscopy Combined with Chemometrical Method for Forensic Differentiation of Electrostatic Copy Paper[J]. Spectroscopy and Spectral Analysis, 2022, 42(7): 2033-2038.

[3] 刘津彤, 张岚泽, 姜红, 等. 差分拉曼光谱结合支持向量机模型对便签纸的鉴别分析[J]. 化学通报, 2022, 85(2): 259-263.

LIU J T, ZHANG L Z, JIANG H, et al. Identification of Note Paper by Differential Raman Spectroscopy Based on Support Vector Machine[J]. Chemistry, 2022, 85(2): 259-263.

[4] 周贯旭, 姜红, 胡晓光, 等. 红外光谱结合主成分分析对纸质快递文件袋的分类研究[J/OL]. 包装工程: 1-8 [2023-04-09]. https://kns.cnki.net/kcms2/article/abstract?v= ZJxhFRRmSIg0z3jdxRX_CHS2JMnC20X8f7LbeMRNkfdYycqW_59-9vcOcwgAFBr1I-HkNJNhQRFf3AAzsfw8vP8hoGcTCYR8VfEPP0nNPN_ipD_nWI0U6OHjDDBLVkEKh2hWjkZ5CPc=&uniplatform=NZKPT&language=CHS

ZHOU G X, JIANG H, HU X G, et al. Classification of Paper Express Delivery Document Bags Using Infrared Spectroscopy Combined with Principal Component Analysis[J/OL]. Packaging Engineering: 1-8 [2023-04-09]. https://kns.cnki. net/kcms2/article/abstract?v=ZJxhFRRmSIg0z3jdxRX_CHS2JMnC20X8f7LbeMRNkfdYycqW_59-9vcOcwgAFBr1I-HkNJNhQRFf3AAzsfw8vP8hoGcTCYR8VfEPP0nNPN_ipD_nWI0U6OHjDDBLVkEKh2hWjkZ5CPc=&uniplatform=NZKPT&language=CHS

[5] 贾镇, 姜红, 李晟全, 等. X射线荧光光谱法结合多元统计学对热敏纸的检验研究[J]. 化学研究与应用, 2021, 33(4): 749-754.

JIA Z, JIANG H, LI S Q, et al. X-Ray Fluorescence Spectrometry Combined with Multivariate Statistics for Thermal Paper[J]. Chemical Research and Application, 2021, 33(4): 749-754.

[6] 姜红, 王欣, 顾安舟. XRF结合多元统计学对热敏纸的分类研究[J]. 中国造纸, 2020, 39(12): 93-96.

JIANG H, WANG X, GU A Z. Study on the Classification of Thermosensitive Paper by XRF Combined with Multivariate Statistical Analysis[J]. China Pulp & Paper, 2020, 39(12): 93-96.

[7] 郭鹏, 姜红. 拉曼光谱检验烟用内衬纸的研究[J]. 中华纸业, 2016, 37(12): 53-58.

GUO P, JIANG H. A Study on Analysis of Inner Liner for Cigarette by Raman[J]. China Pulp & Paper Industry, 2016, 37(12): 53-58.

[8] 朱晓晗, 胡越宁, 何歆沂, 等. 基于主成分分析法对一次性纸杯的拉曼光谱检验研究[J]. 中国造纸, 2020, 39(9): 38-42.

ZHU X H, HU Y N, HE X Y, et al. Detection of Disposable Paper Cup by Raman Spectroscopy and PCA[J]. China Pulp & Paper, 2020, 39(9): 38-42.

[9] 王欣, 姜红, 刘峰, 等. 差分拉曼光谱结合系统聚类法区分检验热敏纸[J]. 化学研究与应用, 2020, 32(12): 2153-2157.

WANG X, JIANG H, LIU F, et al. Differential Raman Spectroscopy Combined with System Cluster Analysis for the Detection of Thermosensitive Paper[J]. Chemical Research and Application, 2020, 32(12): 2153-2157.

[10] 付钧泽, 姜红, 刘峰, 等. 差分拉曼光谱结合系统聚类检验香烟水松纸[J]. 化学研究与应用, 2020, 32(11): 1973-1978.

FU J Z, JIANG H, LIU F, et al. Discrimination of Cigarette Tipping Paper by Differential Raman Spectroscopy Combined with System Clustering[J]. Chemical Research and Application, 2020, 32(11): 1973-1978.

[11] 张进, 姜红, 刘峰, 等. 差分喇曼光谱结合化学计量学检验烟用内衬纸[J]. 激光技术, 2021, 45(1): 61-66.

ZHANG J, JIANG H, LIU F, et al. Differential Raman Spectroscopy Combined with Stoichiometry for Inspection of Cigarette Liner[J]. Laser Technology, 2021, 45(1): 61-66.

[12] LEE J, JIANG H. Analysis of Indole and Indazole Amides Synthetic Cannabinoids by Differential Raman Spectroscopy Based on ANN[J]. Journal of Forensic Sciences, 2022, 67(6): 2242-2252.

[13] AVAKYANTS L P, OBRAZTSOVA E D. Investigation of Mechanical Strains in Porous Silicon by Difference Raman Spectroscopy[J]. Journal of Applied Spectroscopy, 1988, 49(4): 1045-1047.

[14] NIKITIN A P, GAVRILYUK O M, ISMAGILOV Z R. Structure of Industrial Coal Tar Pitch: Raman Spectroscopic Analysis[J]. Coke and Chemistry, 2022, 65(12): 602-606.

[15] 杨梦恩, 姜红, 陈珲, 等. 差分拉曼光谱和统计学方法在食品包装纸分类中的应用[J]. 理化检验-化学分册, 2022, 58(11): 1303-1308.

YANG M E, JIANG H, CHEN H, et al. Application of Differential Raman Spectroscopy and Statistical Methods in Food Packaging Paper Classification[J]. Physical Testing and Chemical Analysis (Part B: Chemical Analysis), 2022, 58(11): 1303-1308.

Differential Raman Spectroscopy Combined with Chemometrics for the Detection of White Shopping Paper Bags

XIE Jianing1, HU Xiaoguang1*, JIANG Hong2*, ZHANG Xin3, HUANG Kai3

(1. School of Investigation, People's Public Security University of China, Beijing 100038, China; 2. Criminal Investigation Department, Gansu Police Vocational College, Lanzhou 730046, China; 3. Nanjing Jianzhi Instrument Equipment Co., Ltd., Nanjing 210049, China)

The work aims to establish a method for non-destructive identification of white shopping paper bags by differential Raman spectroscopy. 60 white shopping paper bags of different brands and specifications were collected and detected by Raman spectroscopy. The Raman spectra of the samples were preprocessed, and the samples were preliminarily classified based on the spectra. The samples were grouped by stoichiometric methods. In addition, Fisher discriminant analysis method was applied to verify the classification results. Finally, the RBF model was applied to classify and distinguish unknown samples. Based on the difference in calcium carbonate, talc powder, and barium sulfate contained in the samples, the white shopping paper bag samples could be preliminarily divided into five categories. K-means clustering method was used for further subdivision, and Fisher discriminant method was used to verify the sample classification results, with a discriminant accuracy of 100%. The application of neural network RBF model for discriminative analysis of unknown samples achieved an accuracy of 89.48%. This method is simple and easy to implement, which provides a scientific basis for the classification of white shopping paper bags, and also provides a convenient way for the development of grassroots public security work.

white shopping paper bag; differential Raman spectroscopy; chemometrics; systematic clustering

O657.37

A

1001-3563(2024)01-0215-08

10.19554/j.cnki.1001-3563.2024.01.025

2023-05-08

中国人民公安大学刑事科学技术双一流创新研究专项(2023SYL06)

猜你喜欢
纸袋曼光谱差分
数列与差分
时髦显瘦的纸袋裤,让你拥有细腰长腿时尚君
基于差分隐私的大数据隐私保护
相对差分单项测距△DOR
差分放大器在生理学中的应用
BMSCs分化为NCs的拉曼光谱研究
便携式薄层色谱-拉曼光谱联用仪重大专项获批
苯的激光拉曼光谱研究
新型4H-3,1-苯并噁嗪类化合物的合成及拉曼光谱研究