摘要: 亚麻、汉麻与苎麻纤维的成分组成和物化性质高度相似,三者间的分类鉴别是纺织品检验检测领域的难点。本文对不同种类麻纤维的傅里叶变换衰减全反射红外光谱(ATR-FTIR)作主成分分析(PCA)和线性判别分析(LDA),创建麻纤维分类判别模型以鉴别三种易混麻纤维。选取亚麻、汉麻和苎麻纤维各60组作为样品集进行脱胶清洗处理并采集ATR-FTIR光谱。光谱归一化后对800~2 000 cm-1波长的光谱作主成分分析,分析结果显示:随着主成分个数增加,主成分分数依据麻纤维类别逐渐显现聚类趋势,同时前12个主成分对归一化红外光谱数据的累计贡献率超过99.5%。以训练集前12主成分数为自变量,以麻纤维种类为因变量,通过线性判别分析构建了分类判别模型(典型判别函数和分类函数)。模型验证结果显示:典型判别函数可使前12个主成分分数矩阵根据麻纤维样品类型形成良好的聚类,分类函数对训练集和测试集中所有纤维样品的分类准确率达到100%。此外,PCA-LDA分类判别模型留一交叉验证的分类准确率仍能达到99.6%。结果表明,不同类别麻纤维的ATR-FTIR光谱存在差异,基于麻纤维ATR-FTIR光谱的PCA-LDA统计分析可实现亚麻、汉麻和苎麻三种易混麻纤维的快速无损鉴别。
关键词: 亚麻;汉麻;苎麻;鉴别;红外光谱;主成分分析;线性判别分析
中图分类号: TS127 文献标志码: A
麻纤维自古以来就是纺织品的重要原材料[1-2],如今依旧是纺织工业中产量仅次于棉花的植物纤维。其中,亚麻、汉麻和苎麻纤维具有出色的可纺性和亲肤性,被大量应用于服装面料生产。由于用途和产量的差异,不同种类麻纤维的市场价格存在明显差距,以低价麻纤维冒充高价麻纤维的不法现象时有发生。目前国内鉴别麻纤维的主要依据为FZ/T 01057.3—2007《纺织纤维鉴别试验方法显微镜法》,标准给出了各种麻纤维的纵横向微观照片,由检测人员观察比较实际麻纤维样品的显微镜影像从而确定样品的种类。然而亚麻、汉麻和苎麻的微观形态高度相似,检测人员较难根据该方法准确鉴定麻纤维,以三者为代表的易混麻纤维的鉴别一直是业界的难题,因此健全麻纤维鉴别技术对维护市场稳定和加强质量监管尤为重要。
亚麻、汉麻和苎麻纤维(以下简称麻纤维)均由纤维素、半纤维素、果胶和木质素等物质构成[3],它们的构成比例差异较小且物理化学性质几乎相同,传统的化学溶解法和燃烧法等无法达到鉴别效果。尽管麻纤维来源于不同的植物物种,DNA鉴定技术却难以应用于麻纤维鉴别,原因在于纺织加工用的麻纤维内部已不存在细胞核[4]。学者们研究发现麻纤维旋转方向、着色反应及草酸钙晶体等特征[5-8]可作为区分亚麻、汉麻和苎麻纤维的依据,然而这些微观影像的特征差异十分微弱,检测人员的认知差异极易影响麻纤维鉴别准确性,同时面临操作难度大、检测成本高等问题。
亚麻、汉麻和苎麻纤维的傅里叶变化红外(Fourier transform infrared reflection,FTIR)光谱类似,尚无法通过红外图谱数据库检索鉴别。近年来研究人员致力于通过比较分析麻纤维的红外光谱特性,试图破解定性鉴别难题。王成云等[9]测试麻纤维FTIR光谱后提出光谱吸收峰处吸光度之比是鉴别亚麻、汉麻和苎麻的重要依据。任清庆等[10]通过燃烧法、显微镜法、扫描电镜法及红外光谱法比较亚麻、汉麻和苎麻的异同点,并认为可以通过观察纤维纵横向形态和FTIR光谱上1 033 cm-1和2 917 cm-1处吸收峰的微小差别来区分汉麻和其他二者。相较于传统的FTIR光谱技术,傅里叶变换衰减全反射红外光谱技术(Attenuated total reflection Flourier transformed infrared spectroscopy,ATR-FTIR)具有高效无损的检测优势。Garside等[3]测试了包括亚麻、汉麻和苎麻在内的6种原麻纤维的ATR-FTIR光谱,其指出木质素含量是区分纤维素纤维种类的重要参数,并尝试采用红外特征波段吸光度之比来区分麻纤维,然而效果并不理想。综上所述,前人虽已发现不同种麻纤维间存在较为微弱的红外光谱差异,但目前仍未能利用红外光谱间的数据差异开发出一套快速准确的麻纤维分类鉴别方法,有待进一步研究。
统计学分析方法有利于挖掘不同种类麻纤维间的红外光谱差异并建立与纤维类别间的联系。其中,主成分分析(Principal component analysis,PCA)是一种无监督降维方法,其通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,借此可将大量原始变量压缩为有限几个主成分(Principal component,PC)[11],原始数据中的微小差异得以通过主成分分数表达。线性判别分析(Linear discriminant analysis,LDA)则是一种集“有效特征选择与状态识别”功能于一身的监督学习方法[12],该统计方法能基于训练集建立判别准则,并根据准则确定未知样本所属的类别。迄今为止,基于ATR-FTIR光谱的PCA-LDA统计分析方法已广泛应用于血迹[13]、纸张[14]、朱砂[15]、塑料[16]、动物皮毛[17]、病毒[18]、榛子[19]及物质结构差异较为显著的纺织纤维[20]的检测鉴别,为基于红外光谱的麻纤维鉴别研究提供了借鉴。
综上所述,亚麻、汉麻和苎麻纤维难以通过传统检测方法实现准确鉴别,本文采集不同种类的麻纤维ATR-FTIR光谱并归一化处理,运用主成分分析提取光谱间数据差异并简化变量,而后通过线性判别分析建立麻纤维分类模型,以期实现亚麻、汉麻和苎麻三种易混麻纤维的快速无损鉴别。
1 实 验
1.1 材 料
亚麻、汉麻、苎麻等麻纤维样品(桐乡尚德纺织有限公司、嘉兴市荣华麻纺织有限公司),三种麻纤维(产自中国湖南、湖北、广东、广西、四川及安徽),其种类信息由厂家提供并经过宁波纤维检验所的纤维定性专家抽检验证。每个省份每种麻纤选取10个样品,建成由180个麻纤维样品(亚麻、汉麻和苎麻样品各60个)组成的样品集。这些麻纤维样品在白度、果胶含量和杂质含量等方面存在差异,为避免这些因素对光谱的影响,需对纤维进一步脱胶并去除黏附的杂质。脱胶所需的碱性果胶酶(适活条件为pH值7~9,温度50~60 ℃)(淄博联特生物酶有限公司),分析纯磷酸氢二钠十二水合物(西陇科学股份有限公司)。
1.2 仪 器
配有ATR附件和OMNI采样器的Nicolet IS 10 FTIR光谱仪(赛默飞世尔科技),JSM-5610扫描电子显微镜(日本电子株式会社),SK2210LHC超声波清洗机(上海科导超声波仪器有限公司),YB902G烘箱(温州大荣纺织仪器有限公司),FE20 pH值计(梅特勒-托利多仪器有限公司),JM-B5002电子天平(余姚市纪铭称重校验设备有限公司)及配有IBM SPSS Statistics 25软件的电脑。
1.3 试样预处理
实验采用碱性果胶酶溶液对纤维样品在超声下进行酶脱胶预处理[21]。其过程如下:首先,调制酶质量分数2%为酶溶液后加入磷酸氢二钠十二水合物调节pH值至8,取各个麻纤维样品适量放入锥形瓶中,以浴比1︰25将纤维与酶溶液混合并搅拌至纤维完全润湿浸没。而后将超声波清洗仪工作频率设置为35 kHz,锥形瓶置于超声波清洗仪中55 ℃水浴温度下超声清洗脱胶6 h,脱胶后对纤维样品用蒸馏水冷洗并烘干。最后,使用扫描电子显微镜(SEM)观察脱胶前后麻纤维表面的清洁程度。脱胶预处理前后亚麻纤维样品的SEM照如图1所示,可见该碱性果胶酶预处理过程能有效去除麻纤维表面的果胶和杂质。
1.4 ATR-FTIR光谱采集与处理
红外光谱仪预热,设置扫描样品次数为32次,分辨率为4 cm-1,抽取预处理后的麻纤维样品约0.2 g放置于ATR附件上,旋转OMNI采样器固定钮压紧样品,采集400~4 000 cm-1波长的ATR-FTIR光谱,使用内置软件对获得的光谱进行5点平滑和基线校正,获得的光谱数据保存为csv格式。为了在相同尺度下比较麻纤维样品的红外光谱,根据下式对光谱数据进行归一化。
式中:Nλ和Aλ分别是波长λ处的归一化值和红外吸光度,而Amax和Amin分别是该波长内的最大和最小红外吸光度。
1.5 红外光谱的PCA-LDA分析
若将归一化红外光谱中每个波段的归一化值视为一个变
量,则整个红外光谱包含7 469个变量,鉴于主吸收峰位于800~2 000 cm-1波长内,本文仅统计分析归一化红外光谱中该指纹区域2 490个波段的光谱数据。在SPSS中通过“分析→降维→因子分析”执行主成分分析操作,将这些波段的光谱变量压缩为多个主成分(PC),可得到主成分特征值、方差贡献率及累计方差贡献率等主成分特征指标。同时借助该分析过程,所有180个麻纤维样品的归一化红外光谱数据将转化为180组主成分分数矩阵。其中,特征值大于等于1且累积方差贡献率超过99.5%的前若干个主成分的分数矩阵,可被认为代表了所有原变量所包含的大部分信息,将用于后续分析。
按照5︰1比例分配训练集样本和测试集样本,随机选取150组麻纤维样品的主成分分数矩阵及其纤维种类,作为线性判别分析(LDA)的训练集。其中,第1~50组主成分分数矩阵来自亚麻纤维,第51~100组主成分分数矩阵来自汉麻纤维,第101~150组主成分分数矩阵来自苎麻纤维。以训练集的主成分分数作为自变量,纤维种类作为分组变量(亚麻、汉麻和苎麻分别标记为1、2和3),在SPSS软件中执行“分析→分类→判别”操作,可得到麻纤维LDA分类模型,以典型判别函数和分类函数表示。其余30组麻纤维的主成分分数矩阵及其纤维种类作为测试集,用于对所建函数模型的外部验证,其中第151~160组主成分分数矩阵来自亚麻纤维,第161~170组主成分分数矩阵来自汉麻纤维,而第171~180组主成分分数矩阵来自苎麻纤维。
2 结果与分析
2.1 麻纤维的红外光谱特征
麻纤维800~2 000 cm-1波长的归一化红外光谱如图2所示。由图2可见,亚麻、汉麻和苎麻纤维的红外光谱具有高度相似性,这是由于三种麻纤维的主要组分均为纤维素和半纤维素等多糖物质,且这些组分的组成比例较为接近。麻纤维红外光谱的共同特征表现为:多糖物质内的C—OH键对麻纤维的红外光谱影响最为明显,其伸缩振动在1 029 cm-1处存在最强吸收峰,而在1 053 cm-1处存在第二强吸收峰,其面内摇摆振动在1 203 cm-1处有微弱的吸收峰。而多糖物质中的C—H键在红外光谱中存在较多的吸收峰,但这些吸收峰强相对较弱,其面内对称伸缩振动的吸收峰出现在895 cm-1处,面外摇摆振动的吸收峰则出现在984 cm-1和1 000 cm-1处,摇摆振动的吸收峰出现在1 315 cm-1和1 428 cm-1处。此外,1 104 cm-1处为C—O—C糖苷键的伸缩振动吸收峰,1 159 cm-1处为C—C键的不对称伸缩振动吸收峰,而1 280 cm-1处则为CH2键的摇摆振动吸收峰。
尽管麻纤维的归一化红外光谱十分相似,麻纤维组分的比例差异仍会导致典型化学键的含量差异,因此其归一化红外光谱中若干波段的吸光度略有不同,如C—OH键和CH2键在1 053 cm-1和1 280 cm-1波长处的吸收峰强度差异。即便如此,仅通过人眼对比光谱图的微弱差异来鉴别麻纤维也很难具有说服力,因此需对光谱数据进一步统计分析。
2.2 主成分分析结果
对所有麻纤维的归一化红外光谱进行主成分分析,其主成分特征指标如表1所示。前2个主成分的累积方差贡献率达到84.74%,前3个主成分的累积方差贡献率达到92.06%,而前12个主成分累积方差贡献率达到99.58%,因此可认为前12主成分足以代表光谱中2 490个波段光谱变量所包含的大部分信息。对麻纤维样品主成分分数矩阵作进一步统计,前2主成分分数聚类分布如图3所示,前两个主成分分数分布显得杂乱分散;而前3主成分分数聚类分布如图4所示,前3主成分分数在三维坐标空间中已表现出聚类趋势;可以推断若高于三维的坐标空间可以被刻画,前12主成分在多维坐标系中极有可能按照纤维分类形成聚类,该麻纤维样品光谱的主成分分数聚类特征为基于红外光谱统计分析鉴别麻纤维提供了可能。
2.3 基于麻纤维光谱的PCA-LDA模型
以训练集麻纤维样品主成分分数矩阵中前12个主成分作为自变量x1~x12,以麻纤维种类为分组变量,经线性判别分析,获得麻纤维典型判别函数y1(x)和y2(x),分别如式(2)(3)所示;亚麻、汉麻和苎麻的分类函数yf(x)、yh(x)和yr(x)分别如式(4)(5)(6)所示。
y1(x)=0.034x1+0.068x2+0.228x3-0.115x4+0.003x5+0.233x6-0.085x7-0.196x8-0.182x9+0.12x10-0.304x11+0.223x12(2)
y2(x)=0.053x1+0.035x2-0.089x3+0.06x4-0.071x5+0.03x6-0.136x7+0.095x8-0.148x9+0.022x10-0.211x11-0.059x12(3)
yf(x)=-10.644+0.276x1+0.301x2+0.286x3-0.092x4-0.243x5+0.715x6-0.697x7-0.181x8-0.996x9+0.391x10-1.533x11+0.377x12(4)
yh(x)=-11.450-0.067x1+0.099x2+1.011x3-0.559x4+0.244x5+0.635x6+0.181x7-0.928x8-0.084x9+0.302x10-0.261x11+0.894x12(5)
yr(x)=-17.693-0.209x1-0.400x2-1.297x3+0.650x4-0.001x5-1.350x6+0.516x7+1.109x8+1.079x9-0.694x10+1.794x11-1.271x12(6)
典型判别函数用以表征纤维分类的聚类效果,分类函数则用于预测判断麻纤维样品种类。当未知麻纤维样品的前12个主成分分数代入三种麻纤维分类函数后,该未知麻纤维种类的判别规则如下:若yf(x)取值最大则该麻纤维为亚麻纤维,若yh(x)取值最大则该麻纤维为汉麻纤维,若yr(x)取值最大则该麻纤维为苎麻纤维。
2.4 麻纤维鉴别模型的验证
为了验证PCA-LDA模型的聚类效果,将训练集中的150组主成分分数代回典型判别函数y1(x)和y2(x),在二维坐标平面上以每个纤维样品的y1(x)为横坐标、y2(x)为纵坐标,构建二维坐标,如图5所示。由图5可见,亚麻样品的典型判别函数结果集中在第一象限,汉麻样品的典型判别函数结果出现在第四象限,而苎麻样品的典型判别函数结果则集中在第二和第三象限;典型判别函数结果根据麻纤维种类展现出较好的聚类效果,这进一步证明不同类别麻纤维的ATR-FTIR光谱之间存在差异。
同时,将训练集中的150组主成分分数代回分类函数进行内部验证,结果如图6所示。由图6可见,所有亚麻纤维样品的主成分分数矩阵在亚麻分类函数中取得最大值,而汉麻与苎麻纤维样品的主成分分数也在其各自对应的分类函数中获得最大值,所有训练集样品均被正确分类,内部验证结果表明所建立的PCA-LDA模型对训练集自身样品具有高效稳定的鉴别能力。而后将测试集的主成分分数矩阵代入分类函数进行外部验证,其结果如表2所示。由表2可见,所有麻纤维样品的实际种类与预测结果完全一致,意味着本文所建立的麻纤维分类模型的分类正确率达到100%。
为进一步探讨PCA-LDA统计方法鉴别麻纤维的的准确性,由SPSS软件对180组麻纤维样品的主成分分数矩阵作留一交叉验证[22]。即将每一个样品作为测试样本,其他179个样品作为训练样本,这样得到180个分类器和180个测试结果,用这180个结果的平均值来衡量模型的性能。留一交叉验证的结果如表3所示,验证结果显示仅有一个汉麻纤维样品在分类判别分析中被误判为亚麻,判别模型的分类正确率仍达到99.6%。综上所述,基于麻纤维红外光谱PCA-LDA统计分析获得的麻纤维分类判别模型能够准确鉴别亚麻、汉麻及苎麻等易混麻纤维。
3 结 论
亚麻、汉麻和苎麻纤维的成分组成及物理化学性能高度相似,传统的检测方法难以鉴别,因此本文提出一种基于红外光谱PCA-LDA统计分析的麻纤维分类鉴别方法。选取亚麻、汉麻和苎麻纤维各60组,脱胶清洗处理进一步去除内部果胶和杂质,而后获取其ATR-FTIR光谱并作归一化处理,对比不同种类麻纤维间的归一化光谱发现,仅1 053 cm-1和1 280 cm-1波长等处的吸收峰强度略有差异,但仍无法借此准确区分麻纤维。对归一化光谱数据作主成分分析发现:随着主成分个数增加主成分分数依据麻纤维类别逐渐显现聚类趋势,并且前12个主成分对归一化光谱数据的累积方差贡献率达到99.58%。以训练集前12主成分数为自变量,以麻纤维种类为因变量,通过线性判别分析构建了包括典型判别函数和分类函数的麻纤维分类判别模型。模型验证结果表明:典型判别函数能够使训练集主成分分数矩阵依据麻纤维种类形成聚类,分类函数对训练集和测试集中所有纤维样品的分类准确率达到100%。留一交叉验证模式下麻纤维分类判别函数的分类正确率依旧达到99.6%。由此可见,不同类别麻纤维的ATR-FTIR光谱存在差异,基于麻纤维ATR-FTIR光谱的PCA-LDA统计分析可快速准确鉴别三种易混麻纤维。
参考文献:
[1]YAGI C, YOSHIMURA N, TAKAYANAGI M, et al. Discrimination of traditional plant fibers used in Japanese cultural artifacts by infrared spectroscopy[J]. Vibrational Spectroscopy, 2022(123): 103466.
[2]LUKEOV H, PALAU A S, HOLST B. Identifying plant fibre textiles from norwegian merovingian period and viking age graves: The late iron age collection of the university museum of bergen[J]. Journal of Archaeological Science: Reports, 2017(13): 281-285.
[3]GARSIDE P, WYETH P. Identification of cellulosic fibres by FTIR spectroscopy: Thread and single fibre analysis by attenuated total reflectance[J]. Studies in Conservation, 2003, 48(4): 269-275.
[4]DUNBAR M, MURPHY T M. DNA analysis of natural fiber rope[J]. Journal of Forensic Sciences, 2009, 54(1): 108-113.
[5]HAUGAN E, HOLST B. Determining the fibrillar orientation of bast fibres with polarized light microscopy: The modified Herzog test (red plate test) explained[J]. Journal of Microscopy, 2013, 252(2): 159-168.
[6]NAYAK R, HOUSHYAR S, KHANDUAL A, et al. Identification of natural textile fibres[M]//Handbook of Natural Fibres. Cambridge: Woodhead Publishing, 2020: 503-534.
[7]BERGFJORD C, HOLST B. A procedure for identifying textile bast fibres using microscopy: Flax, nettle/ramie, hemp and jute[J]. Ultramicroscopy, 2010, 110(9): 1192-1197.
[8]WANG H M, WANG X. Surface morphologies and internal fine structures of bast fibers[J]. Fibers and Polymers, 2005(6): 6-12.
[9]王成云, 刘彩明, 李丽霞, 等. 麻纤维的定性鉴别[J]. 中国纤检, 2007(8): 38-41.
WANG C Y, LIU C M, LI L X, et al. Qualitative identification of bast fibers[J]. China Fiber Inspection, 2007(8): 38-41.
[10]任清庆, 冯云, 杨力生, 等. 汉麻纤维定性分析方法[J]. 上海纺织科技, 2013(1): 50-51.
REN Q Q, FENG Y, YANG L S, et al. Methods for qualitative analysis of hemp fiber[J]. Shanghai Textile Science amp; Technology, 2013(1): 50-51.
[11]LIU J, KANG H, TAO W, et al. A spatial distribution: Principal component analysis (SD-PCA) model to assess pollution of heavy metals in soil[J]. Science of the Total Environment, 2023(859): 160112.
[12]SINGH G, PAL Y, DAHIYA A K. Classification of power quality disturbances using linear discriminant analysis[J]. Applied Soft Computing, 2023(138): 110181.
[13]SHARMA S, CHOPHI R, JOSSAN J K, et al. Detection of bloodstains using attenuated total reflectance-Fourier transform infrared spectroscopy supported with PCA and PCA-LDA[J]. Medicine, Science and the Law, 2021, 61(4): 292-301.
[14]XIA J, ZHANG J, ZHAO Y, et al. Fourier transform infrared spectroscopy and chemometrics for the discrimination of paper relic types[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019(219): 8-14.
[15]CHOPHI R, SHARMA S, SINGH R. Discrimination of vermilion (sindoor) using attenuated total reflectance fourier transform infrared spectroscopy in combination with PCA and PCA-LDA[J]. Journal of Forensic Sciences, 2021, 66(2): 594-607.
[16]WU X, LI J, YAO L, et al. Auto-sorting commonly recovered plastics from waste household appliances and electronics using near-infrared spectroscopy[J]. Journal of Cleaner Production, 2020(246): 118732.
[17]ZHAO G, LUO X, YUAN X, et al. Study on principal component analysis and multi-class discrimination against the combination to identify easy-confused fur[J]. Journal of Industrial Textiles, 2021, 50(6): 794-811.
[18]MO H, YANG L, WU G, et al. Rapid and non-invasive screening of high-risk human papillomavirus using Fourier transform infrared spectroscopy and multivariate analysis[J]. Optik, 2020(206): 164292.
[19]MANFREDI M, ROBOTTI E, QUASSO F, et al. Fast classification of hazelnut cultivars through portable infrared spectroscopy and chemometrics[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2018(189): 427-435.
[20]PEETS P, KAUPMEES K, VAHUR S, et al. Reflectance FT-IR spectroscopy as a viable option for textile fiber identification[J]. Heritage Science, 2019(7): 93.
[21]王倩丽, 刘丽芳, 俞建勇, 等. 碱性果胶酶处理对亚麻落麻纤维性能的影响[J]. 东华大学学报: 自然科学版, 2011, 37(6): 703-707.
WANG Q L, LIU L F, YU J Y, et al. Effects of alkaline pectinase on properties of flax noil fibers[J]. Journal of Donghua University (Natural Science), 2011, 37(6): 703-707.
[22]袁旭政, 李鹏妮, 张红, 等. 红外光谱联合主成分分析在貂毛皮鉴别中的应用[J]. 皮革科学与工程, 2022, 32(4): 71-76.
YUAN X Z, LI P N, ZHANG H, et al. Application of infrared spectroscopy combined with principal component analysis in identification of mink fur[J]. Leather Science and Engineering, 2022, 32(4): 71-76.
Discrimination research of bast fibers by PCA-LDA statistical analysis on infrared spectra
ZHANG Chi, WANG Xiangrong
JIANG Jingjing1,2, JIN Xiaoke2, LI Weisong1, ZHUANG Li1, YUAN Xuzheng1, ZHU Chengyan2
(1.National Textile and Garment Quality Inspection and Testing Center (Tongxiang of Zhejiang), Jiaxing 314502, China; 2.College ofTextile Science and Engineering (International Institute of Silk), Zhejiang Sci-Tech University, Hangzhou 310018, China)
Abstract: Flax, hemp and ramie fibers have been important raw materials for textile products since ancient times. Due to the difference in use and output, there has been a significant gap in the market price of these three different species of bast fibers in recent years, and the illegal phenomenon of low-price bast fibers posing as high-price bast fibers often occurs. The composition, physical and chemical properties of flax, hemp and ramie fibers are very close. At present, the standard method for identifying bast fibers in China is FZ/T 01057.3-2007 The Method for Identification of Textile Fibers-Part 3: Microscopy. However, the microscopic morphology of flax, hemp and ramie is highly similar, and the accuracy of identifying bast fibers according to this method is insufficient. The identification of these three species of easily confused bast fibers has always been a difficult task in the field of textile inspection and testing, so it is necessary to improve the identification technology of bast fibers to maintain market stability and strengthen quality supervision.
Although the predecessors have found that there are relatively slight infrared spectral differences between different kinds of bast fibers, no rapid and accurate classification method for bast fibers based on the differences in infrared spectral data has been reported. In our study, the principal component analysis (PCA) and linear discriminant analysis (LDA) on attenuated total reflection Flourier transformed infrared spectroscopy (ATR-FTIR) of different kinds of bast fibers were proposed to establish a discriminant model to identify these three kinds of easily confused bast fibers.
In this study, 60 groups of flax, hemp and ramie fibers were selected as sample sets for degumming cleaning treatment and their ATR-FTIR spectra were collected. After spectral normalization, infrared spectra in the range of 800-2 000 cm-1 were compressed to scores of sets of principal components (PCs) by PCA. The PCA results show that: with the increase of the number of PCs, the PC scores gradually display a clustering trend according to the species of bast fibers, and the cumulative variance contribution rate of the first 12 PCs to the normalized spectral data reaches 99.5%. With the first 12 PC scores as the independent variable and the species of fiber samples as the dependent variable, a discriminant model of the bast fibers including typical discriminant functions and classification functions was established by LDA. The discriminant model verification results show that: the typical discriminant functions can make the first 12 PC scores achieve a excellent cluster according to the species of fiber samples, and the classification functions can reach a classification accuracy of 100% for all fiber samples in the training set and the test set. In addition, the classification accuracy of the PCA-LDA model can still reach 99.6% by leave-one-out cross-validation. These results prove that the differences between ATR-FTIR spectra of flax, hemp, and ramie can be discerned and utilized for the rapid and accurate identification of these easily confused textile bast fibers by PCA-LDA statistic analysis.
In the follow-up study, we will introduce more laboratories and samples to participate in the construction and verification of the PCA-LDA model, so as to further improve the applicability of the bast fiber classification and identification model.
Key words: flax; hemp; ramie; discrimination; infrared spectroscopy; principal component analysis; linear discriminant analysis
收稿日期: 2023-11-24; 修回日期: 2024-05-21
基金项目: 浙江省市场监督管理局科技项目(ZC2021B085);浙江省服装工程研究中心开放基金项目(2021FZK02)
作者简介: 蒋晶晶(1987),男,工程师,主要从事纺织品检测标准研究。通信作者:祝成炎,教授,cyzhu@zstu.edu.cn。