朱晓晗,姜 红,王 丹
(中国人民公安大学侦查与刑事科学技术学院,北京 100038)
黑色塑料袋是案件现场常见的物证之一,常用于包装毒品、盗窃物、作案工具以及尸块等,是物证鉴定中重要的检验目标。黑色塑料袋的主要成分是聚乙烯和聚氯乙烯等,生产厂家为改善产品的使用效果和降低生产成本,常常会在生产过程中添加一些填料如稳定剂、阻燃剂等[1],导致样品中的元素种类及含量会有一定的差别。X射线荧光光谱法在许多领域以及法庭科学中得到了广泛应用[2-8],因此可以利用X射线荧光光谱,对黑色塑料袋样品进行检验区分。
聚类分析是一种重要的数据挖掘方法[9],主成分分析法则可在保证大部分数据不丢失的前提下减少变量个数,达到降维的目的。由于XRF方法测量出的元素种类和数据较多,使用主成分分析法十分必要。Fisher判别分析能在已有样本数据的基础上,分析类别变量,判别变量之间的数量关系,建立判别函数,最终实现对新数据类别变量取值的预测[10]。本实验利用X射线荧光光谱结合数据处理方法,对不同品牌、不同规格的黑色塑料袋样品进行聚类分析,为黑色塑料袋样品的区分检验提供一种思路。
X-MET8000能量色散型X射线荧光光谱仪:Rh阳极靶,电压40 kV,电流60 mA,测定时间60s。
不同品牌、不同规格的黑色塑料袋样品41个(样品表略)。
利用X射线荧光光谱,在上述实验条件下,对41个不同品牌、不同规格的黑色塑料袋样品进行测定,每个样品测3次,取平均值。
利用X射线荧光光谱对黑色塑料袋样品进行测定。首先,根据样品是否含有Cl元素,将41个样品分成2组;再根据是否含有Ba元素,将其分为4组;最后根据是否含有Cr和Pb这2种元素,将样品分为12组(表1)。
表2为总方差解释结果。由表2可知,主成分分析法指定提取的4个因子,累计贡献率为71.3%,贡献率较高,可以此为变量,进行下一步的数据处理。
表1 黑色塑料袋分组结果Table 1 Grouping results of black plastic bags
表2 总方差解释Table 2 Total variance interpretation
图1 41个样本的系统聚类谱系图Fig. 1 system cluster pedigree of 41 samples
为了进行Fisher判别分析,需确定样本分类组别,我们采用了系统聚类和K-Means快速聚类确定聚类数及组别。系统聚类又称层次聚类,分为R型聚类和Q型聚类。其中,R型聚类可使差异性大的变量分离开来,使具有相似性的变量聚集在一起,可在相似变量中选择少数具有代表性的变量参与其他分析,以实现减少变量个数和变量降维的目的。使用spss软件,以主成分分析法指定提取的4个因子为变量,进行系统聚类,聚类结果见图1。当并类距离为1时,样品可分为12类,结合K均值分类,可得出最佳分类结果,即41个样本分为12组[10]。
K均值算法是一种基于距离的算法,根据数据计算出每一类数据的聚类中心,将数据进行分配,并对与聚类中心的距离进行计算[11]。结果表明,当聚类数为12时最为合适。当聚类数为12时,分类结果与表1中的分类结果相一致,可知使用此聚类方法具有较强的可靠性。
表3 41种黑塑料袋的K均值算法结果Table 3 K-means clustering results of 41 kinds of black plastic bags
绘制各类别变量在Fisher判别空间中的分布和位置情况(图2),图中12组变量的质心可以明显区分[12-18]。该空间中,12类样本的类中心位置见表4。如第一类样本的类中心位置就为(10.766,-4.058,-2.049,5.192),其余类位置以此类推。
表4 各组质心处的函数Table 4 functions at the center of mass
图2 Fisher判别分析散点图Fig. 2 Scatter diagram of Fisher discriminant analysis
利用X射线荧光光谱法,快速无损地测定黑色塑料袋中的元素种类及含量,对于区别不同种类和规格的黑色塑料袋具有重要价值[19]。采用主成分分析与Fisher判别分析相结合的聚类方法,对测定所得的数据进行数据分析,有效降低了变量个数,样品可准确分为12类,得到的结果与利用元素种类进行分类的结果一致。结果表明,通过Cl、Ba、Cr、Pb这4种元素,可对黑色塑料袋实现有效区分,为黑色塑料袋样品的检验提供了一种快速简便无损的方法。