张书敏,李毛英,于清丽,张烈远,刘 菲,江龙发
(1 南昌海关技术中心,江西 南昌 330038;2 成都海关技术中心,四川 成都 610000)
塑料颗粒是生产各种塑料制品的原料,按照不同的来源,分为新料和再生料。新料是指石油等化石原料经过提炼和聚合形成的高分子聚合物。再生料是指回收已经使用过的塑料或废弃的塑料通过分选、破碎、热熔、拉丝、冷却和切粒等工艺得到的一种塑料原料,也叫再生塑料颗粒。将废塑料回收再生,既实现能源的再生利用,又减少了环境污染。
为了弥补国内塑料原料不足,我国每年要进口大量的再生塑料颗粒。国外再生塑料企业主要集中在东南亚国家,由于塑料再生技术落后,生产工艺控制不佳,进口到中国的再生塑料颗粒经常被鉴定为固体废物。固体废物不具有利用价值,或利用价值极低,被禁止进口到国内[1]。随着再生塑料颗粒进口业务量的增多,固体废物进入国内的几率增加,严格控制固体废物的流入是海关现阶段的重点工作。
再生塑料颗粒的固体废物鉴别是一个综合分析评价的过程,根据样品的性状不同,采取不同的检测方案。通常需要将样品的外观、红外光谱定性、差示扫描量热、熔体质量流动速率、热重分析或灰分指标作为固体废物鉴别过程中必做的基础检测指标[2-4],并经过综合分析,确定是否属于固体废物。现有鉴别方法较为复杂,而且需要送往专业实验室才能完成。为了提高通关速率,急需研究探索出一种简便、 快速、准确的检测方法,用于口岸现场快速鉴别。
近红外光谱分析法以其快速、无损等优点在再生塑料和废塑料检测分析领域开展了很多研究。侯玉磊等[5]将近红外光谱技术用于识别聚乙烯再生塑料,采用熔融压膜法制备样品,建立近红外一致性模型,准确率达92%。谢兰桂等[6]采用近红外光谱法结合一致性试验对药品包装容器的掺杂再生料情况进行筛选。该方法可检出再生料最低掺加量20%。张毅民等[7]利用近红外光谱技术对废塑料进行分类识别,分别通过优化模型函数和光谱间反射率比值差异模型,对ABS、PET、PVC、PP、PS和PE共6种塑料进行识别,准确率分别为100%和96.6%。但近红外光谱技术应用于再生塑料颗粒的固体废物鉴别尚无研究报道。
本研究以再生塑料颗粒为研究对象,拟将近红外光谱技术与化学计量学相结合,建立固体废物鉴别方法,实现口岸现场快速鉴别,提高货物通关效率,压缩通关时间。
便携式近红外光谱仪(MicroNIR Pro ES 1700),VIAVI Solutions。用于采集再生塑料颗粒样品的光谱。测试前先对仪器做自检性能测试,并预热30 min。光谱采集条件:漫反射扫描法,采集数据间隔是7 nm,扫描范围950~1 650 nm,背景为标定白板。每个样品装入样品杯中扫描,重新装样,重复采集三次。
图1 仪器结构示意图Fig.1 Schematic diagram of instrument structure
收集842个再生塑料颗粒样品作为试验样品,再生塑料中除了塑料助剂外,主要成分是聚合物,按照聚合物的种类划分,主要包括ABS、PC-ABS、HDPE、HIPS、PA6、PA66、PBT、PC、PET、PETG、PMMA、POM、PP、PPA、LCP等类别,共收集2 526张近红外光谱图。由于不同类别之间的样品数量差异过大,而数量较少的样品不具有统计学意义。所以,忽略光谱数量少于40的样品类别,共计15种类别的塑料,光谱数量最少为41,最大为385。建立模型的光谱共计2 114。收集202个再生塑料固体废物样品,共收集608张近红外光谱。汇总信息表见表1。
表1 样品信息汇总表Table 1 Sample information summary table
样品集一般按比例8∶2,7∶3,6∶4等分为训练集和测试集。其中训练集用来训练模型,而测试集不参与建模,而用来测试模型效果,避免模型发生过拟合现象。本项目中选用系统抽样的方式(距离为三),对于每个类别,分别选取训练集和测试集,其中训练集和测试集的比例约为3∶1。
为了改善数据挖掘分析工作,减少时间和降低成本,经常采用预处理方法,从而达到提高光谱质量和模型效果的目的。本项目选用标准正态变换(SNV),二阶导数,SNV和二阶导数联用的预处理方法分别处理数据、建立模型,并和原始数据建立的模型对比。选用常用的三种模式识别算法,包括最近邻算法(KNN),偏最小二乘分类判别法(PLS-DA),最小二乘支持向量机(LS-SVM)。
由于深色塑料的颜色很重,往往会引起近红外光谱的饱和吸收。一方面使得近红外光谱信息很少;另一方面会导致深色塑料样品的近红外光谱十分相似。因此,在本项目中利用全部的样品(包含深色塑料)和剔除全部饱和吸收的光谱,分别建立模型,并对比剔除前后对模型准确度的影响。
本文选用标准正态变换(SNV),二阶导数,SNV和二阶导数联用的预处理方法分别处理数据、建立模型,并和原始数据建立的模型对比。采用常用的三种模式识别算法,包括最近邻算法(KNN),偏最小二乘分类判别法(PLS-DA),最小二乘支持向量机(LS-SVM)。其中包含饱和吸收光谱的识别结果见表2。
表2 包含饱和吸收光谱的准确度汇总表Table 2 Summary of the accuracy of including saturation absorption spectrum
KNN算法中,结合三种预处理方法的数据和原始数据中,整体的准确度为70%~80%左右,分类效果一般。其中结合SNV和二阶导预处理后的数据能得到最优的识别结果,训练集能得到81.99%的准确度,测试集的准确度能达到80.50%。
相对于KNN算法,PLS-DA算法的效果稍逊。四种预处理后的数据里,整体的准确度仅为45%~50%左右,分类效果较差。同样为SNV结合二阶导的预处理方法能得到最优的准确度,训练集和测试集的准确度分别为50.35%和51.60%。
与其他模式识别算法降维的思路不同,LS-SVM算法是将数据投影到高维空间。在高维空间中,计算出超平面,从而达到分类的目的。在三种分类算法中,LS-SVM算法能得到最好的分类结果。四种数据的整体准确度为76%~100%,其中经过SNV预处理后的数据能得到最好的结果。训练集能达到100%的精准识别,但是训练集的结果稍逊,准确度能达到85.27%。训练集的准确度和测试集的准确度相比为1.17(小于1.20),所以,判定模型没有出现过拟合现象。在准确度可接受的情况下,可用于不同种类再生塑料粒子的固体废物快速鉴别。
由于深色塑料的颜色很重,往往会引起近红外光谱的饱和吸收。一方面使得近红外光谱信息很少;另一方面会导致深色塑料样品的近红外光谱十分相似。所以,将饱和吸收的光谱剔除,利用相同的预处理方法和模式识别算法建立模型,并对比两者数据最终准确度的差别。其中剔除饱和吸收光谱的分类结果见表3。
表3 剔除饱和吸收光谱的准确度汇总表Table 3 Summary of the accuracy of the removal of saturation absorption spectra
从KNN算法建立的分类模型中可以看出,剔除饱和吸收光谱之后,准确度可以得到较大的提升。KNN算法的整体准确度从原来的70%~80%提升到90%~95%,其中SNV和二阶导处理后的数据仍然能达到最优的准确度。训练集和测试集的数据分别为95.42%和95.30%,模型效果较为优异。
PLS-DA算法建立的模型效果也得到了明显的提升,从原来的45%~50%左右提升到了65%~70%左右。单独使用二阶导预处理后训练集的准确度能达到73.07%,测试集的准确度为70.05%。虽然已经得到了比较大的提升,但是PLS-DA算法的分类效果仍然一般。
四种数据建立的LS-SVM算法中,测试集的准确度都能达到95%以上。其中利用原始数据建立的模型能获得最优的效果:训练集能实现全部样品的精准识别,测试集也能达到97.26%准确度。在剔除饱和吸收光谱后,可以实现不同种类再生塑料粒子的固体废物快速鉴别。
本文利用便携式近红外光谱仪采集800多个再生塑料颗粒样品,202个固废塑料样品。借助于多种预处理(SNV,二阶导,SNV结合二阶导)和模式识别方法(KNN,PLS-DA,LS-SVM),建立了多种再生塑料颗粒的固体废物识别模型。在剔除所有饱和吸收光谱的情况下,结合预处理和模式识别算法建立识别模式,训练集的准确率最高可达到97%,可实现不同种类再生塑料粒子的固体废物快速鉴别,可应用于再生塑料固体废物现场初筛,为海关监管提供技术支撑。