鞋底材料的中红外光谱可视化快速鉴别

2019-08-29 09:18王继芬高春芳徐佰祺何欣龙
中国塑料 2019年8期
关键词:鞋底光谱组间

王继芬,高春芳,徐佰祺,董 泽,何欣龙

(1.中国人民公安大学刑事科学技术学院,北京 102600;2. 战略支援部队信息工程大学数据与目标工程学院,郑州 450000;3. 中国人民公安大学治安学院,北京 102600)

0 前言

鞋底材料的种类鉴定是法庭科学中一项重要的研究工作,在案发现场,作为一种常见物证,对其进行检验研究,可快速确定侦查方向,缩小侦查范围,为侦查破案提供线索,为诉讼审判提供证据。

常用于制备鞋底材料的有顺丁橡胶、异戊橡胶、苯乙烯 - 丁二烯 - 苯乙烯嵌段共聚物(SBS)、乙烯 - 醋酸乙烯酯共聚物(EVA)、聚氨酯型(PU)和聚氯乙烯(PVC)等,其中顺丁橡胶回弹性高、耐磨性好;异戊橡胶硫化速度稳定、加工方便、收缩性好;SBS具有优良的拉伸强度、表面摩擦系数大、低温性能好;EVA的弹性好,具有良好的防震、缓冲性能,PU抗撕裂强度高、弹性强,可自动降解,有利于环保。目前,针对鞋底研究主要集中在性能研究和加工工艺方面[1-5],对鞋底材料鉴别的研究较少。林先凯等[6]曾对8 种常用鞋底主要原材料的红外谱图进行建库,通过软件比较检索,可快速方便识别鞋底主要材料。在法庭科学领域,现有研究主要是针对鞋底磨损特征的物理规律分析[7],对于鞋底鉴别未有普适性及完善的研究报道。

一直以来,实现对现场物证快速、无损、准确的鉴别是法庭科学研究者的主要目标,中红外光谱作为一种分子振动光谱技术,具有操作简便、快速无损、波数准确及重复性好等优点,极大简化了一些难溶、难熔及难粉碎聚合物的测试,使结构分析变得快捷,被广泛应用于高分子材料的研究[8-10]。近些年来,仪器分析技术结合化学计量分析已成为分析检测领域的研究热点,借助化学计量分析,研究者可以优化相关实验的测量过程,有效提取实验数据,建立合理的数学模型,进而获取研究者所需的化学信息。陈纪文等[11]采用近红外透射光谱技术对涂料固化剂中游离甲苯二异氰酸酯的含量展开了研究,用偏最小二乘法和完全交互验证方式建立了预测模型,成功实现了对其含量的快速准确测定;于晓礼等[12]采用超高效液相色谱和判别分析与对不同生长特征的五味子展开了研究,为五味子优良品种的筛选提供了新方法。

利用光谱检测和化学计量分析实现不同种类鞋底的快速、无损检测和精确识别与分类,对于案件侦破和诉讼具有重要的意义。基于此,本文借助中红外光谱分析技术采集光谱数据,结合层次聚类分析和K近邻算法,对样本数据进行建模区分并就其相关结果展开讨论,以期为法庭科学中鞋底材料种类鉴别提供一定的借鉴和参考。

1 实验部分

1.1 主要原料

从各地收集的不同品牌型号的43种鞋底材料。

1.2 主要设备及仪器

傅里叶变换红外光谱仪(FTIR),Nicolet 5700,配有ATR衰减全反射套件,DTGS检测器,KBr分光器,ZnSe晶体,光谱数据处理采用OPUS软件(德国Bruker公司),美国Thermo Fisher Scientific公司。

1.3 实验数据采集

数据采集参数:扫描次数32次,光谱分辨率为4 cm-1;测量波数范围4 000~500 cm-1,以空气为背景进行光谱采集,自动基线校正,采用Savitsky-Golay算法进行平滑,借助Z标准化(Zscore)进行数据预处理,使其符合正态分布,便于后期建模分析。

1.4 建模原理

层次聚类分析是一种无监督的学习模型,即不需要事先确定样本所属类别,便可以从庞大的数据集中根据样本自身特征进行聚类,可以计算变量间的相互关系,进而提取信息和规律,建立分类模型,实现对样本有效的归类[13]。距离是分析的依据和基础,主要取决于样品间的距离和类间距离的定义,本实验选择平方欧式距离描述样品间亲疏程度的距离,选择组间平均距离定义类间距离,因为其可以克服离群点敏感性问题,产生的聚类具有相对的健壮性[14],其中平方欧氏距离函数为式(1),组间平均距离函数为式(2):

(1)

(2)

式中 (x,y)——样本的坐标

d——样本间距离

D——类间距离

GK——K类样本

GL——L类样本

K近邻是一种基于距离度量的有效分类方法,其无需估计参数、无需训练、易于实现,不需事先确定类别数量便能达到理想的分类效果,在化学计量鉴别领域具有广泛应用。基本思想如下:在N个已知样本中,找出X的K个近邻,设在这K个样本中,来自ω1的样本有N1个,来自ω2类的样本有N2个,…来自ωi的样本有Ni个,若K1,K2,… ,Kc分别是K个近邻中属于ω1,ω2,…,ωc类的样本数,则可以定义判断函数为式(3):

φi(x)=ki,i=1, 2, …,C

(3)

式中决策规则为若φi(x)=max[φi(x)],i=1, 2, …,C,则决策x∈wi。

1.5 理论模型与红外结果的关联性

鞋底材料是混合物,其拥有多重特征,属于多维尺度样本,不同品牌和型号的样本在组分和其配比间会存在差异,即描述样本的变量其特征均有不同,借助数学模型分析,可实现对这些变量特征差异性的综合考查,从而实现快速准确的鉴别。在FTIR分析中,每一波数对应着透过率,若样本FTIR谱图重合度较高,其波数对应的透过率也相似,说明样本组分和其配比间差异较小,否则差异较大。将这些理化信息的异同用数学模型表达出来,鉴别结果会更具科学性和可靠性。

2 结果与讨论

2.1 层次聚类分析

通过层次聚类分析,求得43个样本的聚类树状图(图1)。图1直观展示了各样本的划分和归类情况,其中距离的选择对样本的分类和归属有明显地影响:选择不同的距离会有不同的分类结果,当组间平均距离最小时,43个样本分为了26类;当组间平均距离为5时,43个样本分为了13类;当组间平均距离为8时,43个样本分为了7类;凝聚到某个程度其聚类之间的距离都大于阈值25时,停止凝聚,所有个体归为一类。好的分类结果需满足组内样本越紧密、组间样本越分离的原则,但是选择哪个“距离”作为分类的参数,目前没有统一的评价指标,本实验借助K近邻算法,对聚类结果进行验证性分析,以此建立具有高鉴别能力的分类模型。

图1 43个样本的层次聚类分析树状图Fig.1 Hierarchical cluster analysis tree of 43 samples

2.2 K近邻分析

运用训练样本即为测试样本的方法交互验证[15],以43个样本的光谱数据为基础,建立K近邻算法模型对各样本进行分类,得到了43个样本特征空间模型的交互式图(图2)和分类正确率(表1)。

图2 特征空间模型的交互式图Fig.2 Eigenvectors space model interactive graphic

图4中,43个样本呈5个聚集区域,H、G、K 3类样本分类情况较为明显,分类效果较好,G和K 2类中,各样本之间的离散程度较大,表明样本个体之间差异较为明显;相比较A类,E类分布更为集中,聚敛程度较大,表明E类样本个体间差异性更小。

结合表1,43个样本分为了7类,总体分类正确百分比为95.35 %,其中A类、 E类、 G类、H类和K类样本实现了100 %准确地区分,L类样本(21#)分在E类,表明21#可能与E类样本的某些组分相同,M类样本(13#)分在了A类,可能13#与A类样本部分组分相同,也可能A类和E类样本在该特征空间中的区分能力较弱,结合层次聚类结果,发现其与当组间平均距离为8时,43个样本分类的结果相一致,表明将43个样本分为7类是较为合理的,且分类正确率为95.35 %,分类结果理想,各样本分类情况如表2所示。

表1 43个样本的分类正确率

Tab.1 Classification accuracy of 43 samples

注:总体分类正确百分比为95.35 %。

表2 43个样本的分类结果

Tab.2 Classification result of 43 samples

2.3 FTIR分析

表3 样本振动基团信息

Tab.3 Infrared vibration information of the samples

3 结论

(1)选择不同的距离时,层次聚类会有不同的结果,借助K近邻算法进行验证性分析,43个样本分为了7类,其结果与层次聚类中,组间平均距离为8时的聚类结果完全一致,且总体分类正确率为95.35 %,分类较为理想;

(2)选取每类中一个样本,对其谱图展开解析,得出6#(A类)样本主要成分为顺丁橡胶、28#(E类)样本主要成分为EVA、16#(G类)样本主要成分为PU、42#(H类)样本主要成分为异戊橡胶、33#(K类)主要成分可能为PVC、21#(L类)样本除了有EVA还包含SBS、13#(M类)样本含有顺丁橡胶;

(3)中红外光谱结合化学计量分析,可作为鞋底材料种类鉴别的一种快速、准确的分析方法,本实验样本种类有限,但实验方法具有普遍意义,可为其他物证如轮胎等的检验提供一种新的参考方法。

猜你喜欢
鞋底光谱组间
基于三维Saab变换的高光谱图像压缩方法
A case of conjunctival intraepithelial neoplasia with spheroidal degeneration: a clinicopathological study
高光谱遥感成像技术的发展与展望
复方血栓通胶囊对早期糖尿病肾病患者局部血流及微炎症反应的影响观察
画与理
一种全自动鞋底清洁机的设计
数据组间平均数、方差关系的探究
“鞋底垫厚点,也能走得快”——贫困户崔普选和他的“梦中梦”
要背沟,不要“虎背熊腰”
鞋底防滑