杨梦恩 ,姜 红∗ ,陈 珲 ,华 腾 ,王圆圆 ,章 欣 ,段 斌,刘 峰
(1.中国人民公安大学 侦查学院,北京 100038;2.南京简智仪器设备有限公司,南京 210049)
食品包装纸是日常生活中很常见的包装材料,系统科学地对犯罪现场残留的食品包装纸进行检验分析,有助于判断其来源、主要流通途径,为侦查破案提供线索,缩小侦查范围。目前食品包装纸的检验方法主要有原子吸收光谱法[1]、红外光谱法、高效液相色谱法[2]、电感耦合等离子体质谱法[3]、X 射线荧光光谱法[4]等。差分拉曼光谱法基于两个具有轻微偏移的激发光激发样品而收集的两张不同的拉曼光谱进行检测,这种方法可消除荧光物质的影响,具有较高的灵敏度、信噪比和抗干扰性[5],但是在食品包装纸分类方面的研究较少。本工作采用便携式差分拉曼光谱仪收集了48个不同品牌的食品包装纸样品的差分拉曼光谱数据,并依据常见食品包装纸填料的拉曼光谱特征峰以及借助SPSS 26.0软件中的统计学方法对上述样品进行分类,方法具有一定科学性与可行性,可为犯罪现场物证分析提供技术参考。
SERDS Portable-standard型便携式差分拉曼光谱仪;SPSS 26.0软件。
48个食品包装纸样品信息见表1。
表1 48个食品包装纸样品的信息Tab.1 Information for 48 food packaging paper samples
激发波长785 nm;激光功率440 m W;积分时间10 s;扫描范围250~2 800 cm-1。
用酒精棉球对样品进行消毒、去脂后,选取样品颜色相对较浅的部位,裁剪成0.5 cm×0.5 cm 的小片,按照仪器工作条件对其内壁面(避开染料影响部位)进行测试。
为验证仪器的稳定性和样品的均一性,确保试验结果准确可靠,按照试验方法进行了重现性试验:对42号样品同一部位进行5次平行检验[6];分别对15号样品的上、下、左、右、中等5个部位进行检验,所得差分拉曼光谱图见图1。
图1 42号样品和15号样品的差分拉曼光谱图Fig.1 Differential Raman spectra of the No.42 and No.15 samples
由图1可知:排除一些非常微小的干扰峰,样品同一位置光谱图基本一致,说明仪器稳定性较好;样品不同位置光谱图也基本一致,说明样品均一性较好。以上结果说明,利用该方法检验食品包装纸准确、可靠。
食品包装纸一般是以纤维素和半纤维素为主要原料,为了满足实际纸张性能的需求,常常会添加一定量的填料,比如高岭土、碳酸钙、硫酸钡、滑石粉等[7],滑石粉、碳酸钙、硫酸钡和氧化钛红等常用填料的拉曼光谱特征峰[8]见表2。
表2 常用填料的拉曼光谱特征峰Tab.2 Raman spectrum characteristic peaks of common fillers
为适应不同纸张性能的要求,不同食品包装纸中的填料种类及其配比各不相同,因此试验尝试按照填料对样品进行粗略的人工分类。滑石粉为纸张的主要填料,颗粒呈片状,对成纸性能的满足率较高,同时其价格低廉,可在纸张中存留且能改善纸张不透明度、平滑度和印刷适性[9],在各大纸工业中应用广泛。因此,可以依据纸张中是否含有滑石粉,对48个样品进行分类。按照试验方法分析48 个样品,结合滑石粉的拉曼光谱特征峰,将48个样品分为两类,第Ⅰ类(含滑石粉)包含35个样品,第Ⅱ类(不含滑石粉)包含13个样品。再结合其他填料的拉曼光谱特征峰进一步分类,以样品量较多的第Ⅰ类为例[10],可分为4组,结果见表3。
表3 第Ⅰ类样品的分类结果Tab.3 Classification results of classⅠsamples
在第Ⅰ类4组样品中选出4个具有代表性的样品,其差分拉曼光谱图见图2。
图2 第Ⅰ类样品中具有代表性的4个样品的差分拉曼光谱图Fig.2 Differential Raman spectra of the 4 representative samples from class I samples
由图2 可知:36 号样品位于302,433,672,1 092 cm-1处的峰对应滑石粉的特征峰,说明该类样品中主要填料是滑石粉;3 号样品位于1 092 cm-1和603 cm-1处的峰分别对应滑石粉和氧化钛红的特征峰,说明该类样品中主要填料是滑石粉和氧化钛红;44号样品位于434 cm-1和279,995,1 085 cm-1处的峰分别对应滑石粉和硫酸钡的特征峰,在造纸工业中,常将硫酸钡与其他填料相结合,用于改善纸张的物理性能,提高纸张的白度和不透明度[11],以上说明该类样品中主要填料是滑石粉和硫酸钡;23 号样品位于282 cm-1和433,709,1 086 cm-1处的峰分别对应滑石粉和碳酸钙的特征峰,其中碳酸钙增白效果好,颗粒较细,能显著提高纸张不透视率和吸油墨率,成纸后具有良好的光泽度[12],以上说明该类样品中主要填料是滑石粉和碳酸钙。
主成分分析法(PCA)[13]是一种常用的数据降维算法,它通过简化庞大的原始数据来提取特征数据,极大地降低了数据的复杂程度。借助SPSS 26.0软件,成功地将第Ⅰ类样品光谱数据中2 527个变量降维成26个变量,方差累计贡献率为95.4%,数据信息涵盖量达到99.757%,说明PCA 提取效果较好,提取这26个变量进行后续分析[14]。
考虑到人工分组的误差,采用Fisher判别分析法[15]对人工分组的结果进行验证。以PCA 降维后的26个变量数据为研究对象,借助SPSS 26.0软件建立典则判别函数,其中前3个判别函数的主要参数见表4。
表4 判别函数的主要参数Tab.4 Main parameters of the discriminant function
由表4可知:函数1,2的方差百分比为68.1%和25.4%,远大于函数3的方差百分比,表明采用函数1,2即可完成对样品的分类。
为使分类结果可视化,以函数1,2分别作为横、纵坐标绘制联合分布散点图[16],结果见图3。
图3 第Ⅰ类样品的联合分布散点图Fig.3 Scatter diagram of joint distribution of class I samples
由图3可知:人工分组的4个组质心点相对分离地分布在散点图上,其中函数1区分第3,4组样品的效果较好,函数2区分第1,2组样品的效果较好。同时,该预测模型所得分组结果的整体正确判别率为94.3%,说明人工分组结果具有较高的准确度和合理性。
为提高人工分组结果的科学性和准确度[17],试验以PCA 降维后的数据为研究对象,用SPSS 26.0软件中的系统聚类分析法分类,聚类方法选择组间联接法,测量区间选择平方欧氏距离,结果见图4。
图4 第Ⅰ类样品的聚类谱系图Fig.4 Cluster pedigree of classⅠsamples
由图4可知:当平方欧氏距离为1时,样品可分为7类;当平方欧氏距离为2时,样品可分为3类;当平方欧氏距离为3时,样品可分为2类;当平方欧氏距离达到25时,所有样品归为一类。为确定最科学、合理的分类,需对聚类结果进一步分析。
参考文献[18],选择平方欧氏距离为1时聚类结果中不同簇的部分样品进行相关性分析[19],并对所得皮尔逊相关系数(r)进行0.01级别的双尾t检验,结果见表5。其中,“∗∗”表示双尾t检验相关性显著,Sig.(Bilateral)为双尾检验结果。
表5 第Ⅰ类样品中部分样品的相关性分析结果Tab.5 Correlation analysis results of some samples of classⅠsamples
表5 (续)
由表5可知:Sig.(Bilateral)均为0,说明r显著性明显;28号和47号样品以及28号和5号样品间的r为0.976和0.816,表明两对样品相关性很强,而两个样品与其余样品间以及其余各样品间的r均低于0.8,表明样品间相关性较弱[20]。以上结果和平方欧氏距离为1时的聚类分析结果基本一致,说明平方欧氏距离为1时的聚类分析结果较科学,较人工分类的更精细。
采用差分拉曼光谱法分析48个食品包装纸样品,根据主要填料的拉曼光谱特征峰将样品粗略地分为两类,并进一步将含滑石粉的第Ⅰ类样品分为4组,此结果得到了Fisher判别分析法的验证;为降低人工分组误差,采用SPSS 26.0软件中的系统聚类分析法,将第Ⅰ类样品分为7类,此结果得到了皮尔逊相关系数模型的验证。本工作建立的分类方法简便、快捷、无损,实现了对食品包装纸的准确分类与鉴别。在实际应用过程中,实验室可根据自身条件选择合适的分类方法。