基于近红外光谱法的14类纤维快速无损鉴别

2023-01-31 05:40苏子越赵珍玉孙克强王京力巫莹柱
棉纺织技术 2023年1期
关键词:定性光谱阈值

苏子越 赵珍玉 孙克强 王京力 巫莹柱

(1.五邑大学,广东江门,529000;2.中山海关技术中心,广东中山,528400)

随着我国纺织业的发展,纺织品的原料成分检测越发受到重视[1-2]。传统的检测方法,包括显微镜法、燃烧法、着色法等,能够准确检测面料成分,但过程复杂,人为因素影响大且污染环境,不利于绿色可持续发展[3]。近红外光谱分析技术(NIRS)主要用于800 nm~2 500 nm范围电磁波的无损测量[4]。不同于质谱、色谱分析技术,该技术无需提纯,已广泛应用于食品、农业、医药、炼油与化工等领域[5-10]。

近红外光谱的定性分析是利用已知类别的样品建立近红外光谱鉴别模型,再考察未知样品是否属于该类物质的一种方法,主要用于物质的聚类分析和判别分析[11]。黄晶等采用近红外光谱法实现对6种麻纤维的鉴别,但未有对现有常见服装用纤维进行鉴别时可参考的波长选择、阈值设定的研究报道[12]。本课题组在之前的工作中主要进行了近红外光谱技术在纺织产品检测中应用的相关研究[13-16],对提高分析准确性、原料组分快速鉴别、测定样品均匀性等方面进行了针对性研究,讨论了影响分析结果的相关因素,如织物组织结构对预测结果的影响[17-20]。同时进行了多组分混纺织物定量模型建立与优化[21-27],并制定了一项对纤维定量分析系列标准进行补充的行业标准[28],尤其是开发了高精度的三组分混纺织物定量分析模型[29]。上述研究表明近红外光谱技术适用于纺织纤维含量检测,为纺织纤维定性鉴别提供了快速、无损、绿色检测的可能性。近红外光谱定性分析方法是依靠已知样品和未知样品谱图的比较来完成的,相较于定量模型,定性模型检测的是未知种类的样品,是后续进行定量检测的必要前提。

本研究基于近红外光谱法,采用主成分分析结合聚类分析的方法,对14类常见服用纤维进行定性鉴别,建立了鉴别模型,正判率达到100%,可以更加高效、便捷、环保地鉴定待测样品的类别。

1 试验材料及方法

1.1 样品制备

分别收集丝类蛋白质、毛类蛋白质、棉、麻、再生纤维素每类50个代表性样品,聚酯纤维、锦纶、腈纶、丙纶、乙纶、氨纶、氯纶、维纶、醋酯纤维每类20个代表性样品。置于恒温恒湿环境中备用。

1.2 数据采集

将样品装入近红外专用的低羟值样品瓶中进行光谱的采集,装样厚度不得低于1 cm,样品装填密实并保证装样的密实程度一致。用TANGO-R型傅里叶变换近红外光谱仪预热至稳定状态后,经积分球漫反射方式扫描得到近红外光谱,考虑到各类纤维成分的差异性大,每条光谱信号扫描32次。

2 结果分析

2.1 光谱数据的预处理

在近红外光谱分析中,光谱的定性分析即用样品光谱与标准光谱进行比较,以此判断样品种类。因此,所建标准光谱集要稳定可靠。近红外光谱仪所采集的光谱包含了其他无关信息和噪声,在用化学计量学方法中的主成分分析法选取特征峰时,为消除光谱采集过程中引入的噪声,需要进行适当的光谱处理[30]。常用的方法有平滑处理、基线校正、多元散射校正和标准正态变量校正等[31-32]。本项工作采用一阶导数和矢量归一化相结合的方法对光谱进行预处理,如图1所示。可以看出,导数光谱可有效地消除干扰,分辨重叠峰,提高分辨率和灵敏度。

图1 聚酯、再生纤维素和氨纶的近红外光谱图及一阶导数图

2.2 波长选择

14类常见服用纤维的近红外平均光谱图如图2所示。这些近红外光谱特征明显,峰的个数和曲线走势相似,难以直观鉴别分类。因此,需要通过合适的方法分析光谱数据。波长选择可以简化模型,同时也剔除不相关或非线性变量,从而得到预测能力强、稳健性好的校正模型[33]。常用方法主要有相关系数法、逐步回归算法、间隔偏最小二乘法(iPLS)、遗传算法等。逐步回归算法是逐个选入对输出结果有显著影响的变量,并在选入新变量后逐个检验以剔除不显著变量,反复选入、检验、剔除直至无法剔除和选入为止[34]。但如果将光谱仪采集的上千个数据直接输入,会产生“过拟合”的分析模型,使其预测适应能力大大下降。本研究采用逐步回归分析算法选取了4 100 cm-1~5 150 cm-1和5 500 cm-1~7 850 cm-1两个波 段建立了矫正模型,如图2所示。

图2 用于建模的波段选择光谱图

2.3 定性判别分析

欧氏距离标准法属于有监督模式识别方法,通过计算样品光谱与各类标准光谱的欧氏距离判断样品的类别[35]。同类别两个样品的欧氏距离如式(1)所示。

式中:D为欧式距离,a(k)和b(k)是光谱图a和b在光谱波数k点的纵坐标值。

根据结果得出决定鉴别模型的置信水平,从而确定鉴别模型适应的阈值,如式(2)所示。

式中:DT为某一类样品光谱分布的阈值,Dmax为这类样品的最大欧氏距离,S0为这类样品距离分布的标准偏差值,缺省值x选择范围在0.25~1.00之间。

x的大小决定了鉴别模型的置信水平。当x取值过小时,对同类物质易发生误判;当x取值过大时,对不同类物质又易发生误判。因此,在选择x取值时,应确保同类样品的光谱距离小于该阈值,而不同类的光谱距离大于该阈值[36]。在阈值选定后,建立鉴别模型。通过反复取值确定,当x值为0.75时模型具有较高的置信水平,算法成立,如图3所示。

通过式(1)、式(2)和图3可以生成一个有定性鉴别匹配值的报告,其随光谱距离的升序排列,其结果可以归纳为3种。第1种,待测样品光谱与某一预设参考光谱的光谱距离小于阈值,而与其他参考光谱的距离大于阈值,鉴别结果为属于某一已知类别;第2种,待测样品光谱与所有预设参考光谱的光谱距离都大于阈值,鉴别结果为不属于已知类别;第3种,待测样品光谱与不止一个预设参考光谱的光谱距离小于阈值,鉴别结果为不确定。

2.4 模型的验证与优化

利用已知特征值的验证集样品对校正模型进行验证,聚酯纤维、锦纶、腈纶、丝类蛋白质、毛类蛋白质、棉、麻、再生纤维素的测试数量均为100个,正判数量为100个;丙纶、乙纶、氨纶、氯纶、维纶、醋酯纤维的测试数量均为30个,正判数量为30个,所有纤维的正判率达到100%。该模型在对单一常用服用纤维的归类鉴别中具有非常准确的鉴别结果。

3 结语

本研究基于近红外光谱法,采用主成分分析结合聚类分析的方法,成功鉴别14类常见服用纤维。通过逐步回归分析方法选择了合适的波段(4 100 cm-1~5 150 cm-1和5 500~7 850 cm-1),并结合阈值选取建立了特定频率范围的鉴别模型。结果表明:所有纤维的正判率达到100%,成功实现14类常见服用纤维的定性鉴别。该项工作有望加入监督检测部门的日常工作,与传统的检测方式相辅相成,实现在海关及市场现场快检或对较贵重纺织品的高效、便捷、无损定性鉴别。

猜你喜欢
定性光谱阈值
基于三维Saab变换的高光谱图像压缩方法
分裂平衡问题的Levitin-Polyak适定性
高光谱遥感成像技术的发展与展望
小波阈值去噪在深小孔钻削声发射信号处理中的应用
当归和欧当归的定性与定量鉴别
基于自适应阈值和连通域的隧道裂缝提取
比值遥感蚀变信息提取及阈值确定(插图)
基于迟滞比较器的双阈值稳压供电控制电路
星载近红外高光谱CO2遥感进展
共同认识不明确的“碰瓷”行为的定性