纺织品原料组份定性、定量快速检测方法研究——近红外光谱法

2013-11-03 10:13桂家祥耿响周丽萍要磊王京力李慧
质量安全与检验检测 2013年1期
关键词:组份模式识别定性

桂家祥 耿响 周丽萍 要磊 王京力 李慧

(1.江西出入境检验检疫局 江西南昌 330038;2.中山出入境检验检疫局)

1 前言

纺织品是人们日常生活的必需品,其质量好坏直接关系到生产商、贸易关系人、政府监管部门以及每个消费者。各国政府监管部门对纺织品原料组份标识都十分重视,几乎所有的国家(地区)为保护消费者的合法权益,都颁布了法令、强制性标准规定纺织品必须标注纺织品纤维组份及其含量,这使得纺织品原料组份的定性、定量分析在纺织品的众多检测项目中地位非常重要。

现有的纺织品组份分析方法[1]周期长,检测环境要求高,化学试剂有毒有害,检测成本高,对检测人员的要求高,同时检测过程对样品的破坏不可避免。因此,研究和开发一种快速、简便、环保、无损的检测方法是长期以来纺织品检测技术人员的期待,也是全球性纺织品组份检测的重大需求。

近红外光是最早发现的不可见光,由于其光谱信息弱、谱峰重叠等缺点,早期未能有效进行开发应用。随着计算机,特别是化学计量学和仪器硬件技术的不断发展和完善,弥补了其光谱峰重叠、信息弱、数据量大等不足,近红外光谱技术(NIR)自20世纪90年代以来得到较快发展,成为最引人注目的光谱分析技术,已广泛应用于农业[2-4]、石油化工[5]、食品工业、制药工业及临床医学[6]等领域。近年来,已有学者对NIR在纺织品原料组份快速检测中的应用进行了研究[7-9],结果显示NIR在纺织品原料组份定性和定量分析方面具有良好的效果和广阔的应用前景。

本研究在已有研究成果的基础上,就NIR用于纺织品原料组份定性、定量分析模型的建立进行了研究,并对研究成果进行了验证。

2 NIR在纺织品原料组份快速检测中的应用研究

化学计量学方法和计算机的发展使得NIR得以发展和广泛应用。NIR用于定性分析主要依据“相似相聚”的原理,通过不同的模式识别方法将同类样品聚在一起,对不同的样品进行分离,从而对样品的类别进行判定;定量分析是利用化学计量学方法将样品的光谱数据与待检测样品组份的经典检测值之间建立数学关系,从而对未知样品进行预测。NIR的实际应用效果与所用仪器和光谱采集条件都有一定关系,但更重要的是光谱数据的预处理和建模方法的选择。

相同的检测对象,采用不同的建模方法会产生不同的效果,针对纺织品原料组份的定性鉴别和定量分析特点,筛选适用于纺织品原料组份快速分析的定性和定量建模方法是实现突破的关键环节之一。

2.1 NIR在定性分析方法中的应用

2.1.1 定性分析方法

NIR在定性方面的应用是利用模式识别方法[10]对样品的近红外光谱数据进行分析,即对样品中的各组份特征进行挖掘和鉴别。

模式识别是指计算机自动地(或尽量少人为干预)把待识别的模式分配到各自所属的模式类别中。模式识别的目的和作用在于通过分析光谱量测数据对不同样本按某些共同的特征进行分类,从而发现被测样本之间的内在联系,获得决策性的信息。因此,光谱模式识别是将光谱数据转化为解决实际问题所需信息的一种重要手段。

模式识别方法可分为有监督模式识别和无监督模式识别两种。有监督模式识别方法指的是用一组已知类别的样本作为训练集,让计算机向这些已知样本学习,这种求取分类的模式识别方法称为“有监督”或“有老师”的学习,其中训练集就是老师,并由这个学习过程得到分类模型,从而对未知样本的类别进行预测。无监督模式识别方法是一种事先对样本的类别未知,无需训练过程的分类识别方法。研究人员可通过专用近红外软件、matlab等可编程工具,利用模式识别方法进行数据处理。

2.1.1.1 有监督模式识别方法

(1)线性学习机法

以线性分类函数为基础,将n维空间划分为类别区域,该函数在二维空间为一条直线,在三维空间为一平面,在多维空间则为一超平面。该方法的主要缺点是所求的线性判别函数不具有唯一性,当训练集中样本排列发生变化或初始矢量不同时,会得到不同的结果;另外,由于判别面简单,存在奇异样本容易错判和收敛速度慢等不足。所以该方法主要用于线性可分的两类样本的判别分析。

(2)K-最近邻法

是基于距离函数的分类法。它的核心思想是使用一类的重心来代表这个类,计算待分类样本到各类重心的距离,归入距离最近的类。其中距离常用马氏距离,因为马氏距离既考虑了类的均值,又包含了类内方差的信息,对训练样本蕴含的信息利用比较充分。

(3)簇类独立软模式法(SIMCA)

又称相似分析法,该方法是建立在主成分分析基础上的一种有监督模式识别方法,基本思路是对训练集中每一类样本的光谱数据矩阵分别进行主成分分析,建立每一类的主成分分析数学模型,然后在此基础上对未知样本进行分类,即分别试探将该类未知样本与各类样本数学模型进行拟合,以确定其属于哪一类或不属于哪一类。

(4)人工神经网络法(ANN)

是生物神经网络系统的一种高度简化后的近似建模方法,它用大量简单的神经元广泛连成一种计算结构,属于自适应非线性动力学系统,具有学习、记忆、计算和各种智能处理功能,在不同程度和层次上模仿人脑神经系统的结构及信息处理方式。该方法建立的模型有存储和检索功能。

(5)支持向量机法(SVM)

是在20世纪90年代后建立的统计学习理论基础上发展起来的化学计量学方法。该方法的基本思想来源于线性判别的最优分类面,即要求分类面不但能将两类样本无错误的分开,而且要求分类空隙或称分类间隔最大。通过建立最优分类面,可以提高预测能力,降低分类错误率。

(6)判别偏最小二乘法(PLS-DA)

是基于判别分析基础上的偏最小二乘算法,并且以Y变量为二进制变量(类别变量)来取代含量变量。为了决定类归属,组成矩阵的样品必须能描述该样品的特定种类,一般可以设定一个临界值来判定归属。应用PLS-DA进行定性判别分析时,作为样品光谱的输入变量矩阵和二进制变量(类别变量)即输出变量矩阵之间的关系可以用图1描述。其中,N代表建模时的样品数,K表示样品光谱的吸光度点数,M表示类别的数目。

图1 输入变量矩阵和输出变量矩阵之间的关系示意图

2.1.1.2 无监督模式识别方法——聚类分析

在对样本进行模式识别时,事先往往对数据的内在分类一无所知,在这种情况下无监督模式识别方法的优点尤为突出,它具有无需已知类别的训练样本即可对数据进行分类识别的特点。聚类分析利用同类样本彼此相似,即常说的“物以类聚”,相似的样本在多维空间中彼此距离相对较小,从而达到分类的目的。

聚类分析的研究对象主要有样品间的距离、类间的距离、并类的方式和聚类数据的判定。该方法将每一个样品看作是n维空间的一个点,在这n维空间中定义样本间的亲疏程度。

2.1.2 定性分析方法研究成果

2.1.2.1 已有研究成果

2009年,王丹红[11]利用NIR与化学模式识别方法相结合,采用主成分分析和判别分析技术对天丝、棉、粘纤、铜氨纤维进行快速鉴别,效果良好。吴桂芳[12]提出利用NIR快速无损鉴别山羊绒原料品种,应用可见/近红外光谱漫反射技术采集各种山羊绒原料的光谱曲线,采用主组份分析法进行聚类分析并获取山羊绒原料的近红外指纹图谱,结合SVM技术进行品种鉴别,模型对山羊绒原料的鉴别准确率达到100%。2010年,袁洪福[13]收集了214个纺织样品,样品纤维组份包括氨纶、蚕丝、聚酯、棉聚酯、锦纶、棉、麻、棉麻混纺、粘胶、山羊绒、锦羊毛和羊绒羊毛混纺,先对样品光谱进行系统树分析,组成相近的不同种类纤维之间有重叠,后结合SIMCA方法对有交叠的纤维进行分类,成功地将化学组成非常接近的纤维类别进行正确的区分。

上述学者虽然对NIR用于纺织品原料组份的定性判定进行了大量研究,但均是停留在实验室研究阶段,研究的样本量较小,研究的纺织纤维种类不够全面,所使用的建模方法千差万别,难以对研究成果进行应用和推广,也未利用足够的未知样品对模型的准确性和实用性进行验证,更没有建立相应的标准方法,故无法直接应用于实际检测。

2.1.2.2 本研究成果

2.1.2.2.1 定性分析方法筛选

为了确定适用于纺织品原料组份的近红外定性判定方法,达到判定结果准确率高、稳定性好的目标,本研究选择了全棉、聚酯、锦纶、羊毛、蚕丝、粘胶和氨纶共7种纺织纤维成份构成的544个样品,利用SIMCA、K-最近邻法、ANN和PLS-DA 4种定性方法建立定性模型,分析结果见表1。

表1 4种定性建模方法的结果比较

表1显示,4个模型中PLS-DA法模型的准确率和稳定性最好,所以本研究选择该方法作为纺织品原料组份定性判定的建模方法,并以此为基础进行模型优化、完善和验证。

本研究首次提出使用各种成分纯纤维样品建立多个模型并集成为模型组的纺织品定性分析方法,利用该模型组对未知样品进行预测,从而得到该样品的纤维成分定性结果。

2.1.2.2.2 定性分析模型验证

图2所列为8种常见纺织品原料组份的近红外光谱图。

图2 8种纺织品原料组份的近红外光谱图

从图上可看出,8种纺织纤维原料组份的特征区域主要分布在1389-1886nm范围内,除棉和麻相似度较高外,其他6种原料组份的光谱图均有明显特征,易于识别。但对于混纺纺织样品,各纤维间相互影响,使得纤维的特征谱峰不明显甚至消失,仅通过光谱图无法正确判定纤维组成。通过采用化学计量学方法,对纺织样品的近红外数据进行数学处理,可以提炼出纺织品原料组份的特征信息,进而识别出纺织品的纤维种类。

本研究选择PLS-DA方法建立纺织品原料组份的近红外定性模型。为提高模型的准确率,对建模的预处理方法和建模波段进行了优化,表2给出了优化后的定性模型对3698个未参与建模的两组份样品的判定结果。判定错误的样品主要原因是样品中某种纤维成份所占比例较低,或样品颜色造成光谱变形等,而为了避免假阴性,模型设定的阈值较高,所以造成误判比例较高。剔除样品中某一原料组份小于3%的样品后,模型的预测准确性大大提高,均实现了98%以上的准确判断率(见表3)。

表2 定性模型的验证结果(随机样品)

表3 定性模型的验证结果(剔除某一原料组份小于3%样品)

将NIR作为纺织品原料组份定性判定的初筛方法,可大大提高检测速度,减轻实验人员的工作量,实现无损、快速、高效检测。在已有的研究基础上,本研究下一步研究重点是进一步提高模型的准确性和覆盖率。

2.2 NIR在定量分析方法中的应用

2.2.1 定量分析方法

NIR的定量即在原料组份含量(或其他物化性质)与分析仪器响应值之间建立定量关联关系,从而对原料组份比例进行分析。在近红外分析中常用的多元校正方法包括:多元线性回归法、主成分回归法(PCR)和偏最小二乘法(PLS)等线性校正方法,以及ANN等非线性校正方法。

PCR法是采用多元统计中的主成分分析法(PCA)先对混合物光谱量测矩阵X进行分解,然后选取其中的主成分进行多元线性回归分析。PCR法只对光谱矩阵X进行分解,消除无用的噪声信息。同样,浓度矩阵Y也包含PLS法对光谱矩阵X和浓度Y进行分解,对于无用信息,也应作同样的处理,且在分解光谱矩阵X时应考虑浓度矩阵Y的影响。PLS法就是基于以上思想提出的多元回归方法。

2.2.2 定量分析研究成果

2.2.2.1 已有研究成果

2000年,中国农业大学近红外课题组[14]利用PLS法定量对羊毛/粘胶混纺样品中羊毛含量进行尝试性研究,模型的相关系数达到0.982,待测样品的预测值变异系数为 4.1%。2007年,陈斌[15]以棉/丝、棉/聚酯两类棉制品为研究对象,利用遗传算法和PLS法分别建立了棉制品中含棉量的近红外定量校正模型,预测相关系数均达到0.99以上。2010年,杨萌[16]利用46个棉/氨样品建立了分析精度较高的用于检测棉/氨混纺面料中氨纶含量的近红外光谱分析模型,相关系数达到0.99。

上述研究均是针对某一种纺织品进行分析,研究进展局限于模型的建立,建模样品量少,未经大量的样品验证,尚不能投入实际应用。

2.2.2.2 本研究成果

2.2.2.2.1 定量分析方法筛选

本研究在模型建立初期,选择200个棉/聚酯样品,比较了PLS法和ANN两种定量分析方法对纺织品原料组份的定量分析效果,两种方法建立的定量分析模型对样品的判定准确率分别为98%和92%,而且PLS法最成熟、应用最广,所以本研究选择其作为近红外光谱法定量分析纺织品原料组份的建模方法。

2.2.2.2.2 定量分析模型验证

在研究过程中,由于棉/聚酯样品的纤维含量从0-100%均有可能存在,直接采用PLS法建立定量分析模型,准确率无法提高到理想程度。为提高近红外快速检测棉/聚酯纺织品原料组份的预测准确率,本研究首次采用分段建模方法建立了定量分析模型[17],并对纺织品颜色、厚度、结构等因素进行深入研究,该成果在2012年9月举行的全国第四届近红外光谱学术会议上进行了详细介绍[18],得到与会专家认可。

为了能将NIR应用于实际检测中,本研究利用PLS法建立了棉/聚酯、锦/氨、聚酯/氨、棉/氨等16种常见纺织品的系列定量分析模型,并针对每类纺织品的特点,对以上模型进行优化,然后在优化的基础上进行大量的数据验证,结果见表4。其中模型的判定标准是指模型预测结果与经典结果的误差在±3%范围内,判定为正确,否则判定错误。为验证模型的准确性,利用F检验(95%的置信度,5%的置信区间,临界值1.08)对近红外预测结果与经典方法结果进行统计分析,F统计值为1.05,小于临界值,结果证明所建定量模型的预测结果与经典方法间不存在显著差异。

表4 16个定量模型的基本信息

(续表)

在取得此研究成果的基础上,本研究建立了《纺织品近红外光谱法定量分析第1部分:棉和聚酯纤维的混合物》等8个系列标准[19]。该方法作为快速筛选方法,2012年初通过了CNAS认可,目前已经应用于实际检测,对外出具检测报告1万余批,取得了显著成效。此外,本研究在现有成熟模型的基础上进一步扩展了棉/氨、聚酯/氨、锦/氨等20多个纺织品组份模型,并已成功立项了多个行业标准,其中NIR快速检测棉/聚酯已于2012年11月通过审定。这些成果将为NIR在纺织领域的应用奠定坚实的技术基础。

为了推进该技术的广泛应用,本研究正在开发和研制一种专用于纺织纤维组份快速检测的便携式NIR仪,并着手建立含盖多种近红外仪器、多种定性、定量模型为一体的NIR检测纺织品原料组份物联网。鉴于此项研究的进展,2012年11月,本课题组受邀参加第446次香山科学会议并作《消费品品质安全与近红外分析物联网》学术报告。

3 总结

NIR在纺织品原料组份定性和定量方面的应用将颠覆传统纺织品原料组份判定分析方法,使依赖于实验室、化学试剂、具备纺织专业知识背景的操作人员才能完成的繁冗的分析工作由配备了近红外分析模型的NIR仪代替,分析时间由十几小时缩短为3分钟,这将极大地提高纺织品原料组份的分析速度,为纺织品生产、市场监管和销售等各个环节提供快速便捷的分析技术,是纺织品原料组份检测技术的重大创新。

[1]李青山.纺织纤维鉴别手册[M](第2版).北京:中国纺织出版社,2003:303 -305.

[2]McCaig T N.Extending the use of visible/near-infrared reflectance spectrophotometers to measure of food and agriculture products[J].Food Research International,2002,35(8):731 -736.

[3]吉海彦,严衍禄.在国产近红外光谱仪实验样机上用偏最小二乘法定量分析大麦组份[J].分析化学,1998,26(5):607-611.

[4]Delwiche S R,McKenzie K S,Webb B D.Quality characteristics in rice by near Infrared reflectance analysis of whole grain milled samples[J].J Cereal Chem,1996,73:257 -263.

[5]雷猛,冯新泸.二维近红外光谱定量分析内燃机油粘度指数性能的研究[J].石油炼制与化工,2009,40(4):61 -65.

[6]陈卫国,李鹏程,卢广,等.用近红外光拓扑图技术实时跟踪脑血流变化[J].生物物理学报,2000,16(3):613-617.

[7]王栋民,金尚忠,陈华才,等.棉-涤混纺面料中棉含量的近红外光谱分析[J].光学精密工程,2008,16(11):2051-2054.

[8]颜丽,刘莉.纺织混纺面料里纤维含量的红外光谱法测定[J].激光与红外,2009,39(6):605 -607.

[9]吴桂芳,何勇.应用可见/近红外光谱进行纺织纤维鉴别的研究[J].光谱学与光谱分析,2010,30(2):331-335.

[10]陆婉珍.现代近红外光谱分析技术[M](第二版).中国石化出版社,2007:13.

[11]王丹红,吴文晞,林志武,等.近红外光谱法鉴别Tencel等四种纤维[J].福建分析测试,2009,18(4):32-34.

[12]吴桂芳,何勇.基于主组份分析和支持向量机的山羊绒原料品种鉴别分析[J].光谱学与光谱分析,2009,29(6):1541-1544.

[13]袁洪福,常瑞学,田玲玲.纺织纤维及其制品非破坏性快速鉴别的研究[J].光谱学与光谱分析,2010,30(5):1229-1233.

[14]李晓微,赵环环,赵龙莲,等.用近红外光谱定量分析混纺毛织品中羊毛的质量分数[J].中国纺织大学学报,2000,26(3):72-75.

[15]陈斌,崔广,金尚忠,等.近红外光谱在快速检测棉制品中含棉量的应用[J].江苏大学学报(自然科学版),2007,28(3):185-188.

[16]杨萌.近红外光谱技术在棉/氨纶面料分析中的应用[J].中国纤检,2010:61 -63.

[17]桂家祥,耿响,要磊,等.基于近红外光谱法快速检测棉涤混纺织物棉含量的研究[J].纺织学报,2012,33(4):55 -59.

[18]耿响,桂家祥,廖燕燕,等.基于近红外光谱法快速检测涤纶氨纶混纺织物纤维含量的研究[C].全国第四届近红外光谱学术会议,2012.

[19]要磊,耿响,李慧.纺织品近红外光谱法定量分析第1部分:棉和聚酯纤维的混合物(标准操作规范)[Z].2011.

猜你喜欢
组份模式识别定性
鲍曼不动杆菌双组份调控系统研究进展
近红外光谱分析技术在纺织品定性定量分析上的应用
分裂平衡问题的Levitin-Polyak适定性
不同组份地质聚合物砂浆的强度研究
现代主义与20世纪上半叶中国画“进步”之定性
UPLC-MS/MS法结合模式识别同时测定芪参益气滴丸中11种成分
光合作用及其组份的生物进化
第四届亚洲模式识别会议
宋代草市镇研究中的定性与定量
可拓模式识别算法中经典域的确定方法