基于近红外光谱的果树残枝纤维组分含量分析

2022-12-21 16:29高倩王亚梅吴平凡张红美周岭
新疆农业科学 2022年8期
关键词:残枝木质素纤维素

高倩,王亚梅,吴平凡,张红美,周岭

(塔里木大学机械电气化工程学院/自治区教育厅普通高等学校现代农业工程重点实验室,新疆阿拉尔 843300)

0 引言

【研究意义】新疆南疆各地区果树(含坚果树)种植面积较大,近5年平均为712.29×103hm2/年,占全新疆的76.7%,仅种植面积最大的红枣树、核桃树、杏树、梨树、苹果树的果树残枝资源量为173.93×104t/年,折标能源量为88.07×104t/年。在果树残枝的开发利用中,纤维组分的含量至关重要。用于测定纤维组分含量的方法很多,主要有范式法和高效液相色谱法等[1]。但耗时长、操作复杂和试验成本高。研究一种果树残枝纤维组分的快速检测方法对生物质资源化利用具有重要意义。【前人研究进展】近红外光谱(NIRS)技术的与化学计量方法相结合能够实现快速、高效、无损、绿色的检测[2],植物中的纤维素、半纤维素和木质素内含有大量的含氢基团(C-H、N-H 和O-H),近红外光谱对其具有较好的吸收,与化学计量学相结合,能够实现定量检测。Huang J 等[3]采用偏最小二乘法(PLS)和主成分分析法(PCR),管丽媛等[4]采用偏最小二乘法均建立了亚麻纤维中纤维素、半纤维素和木质素的近红外模型,实现了高效快速定量分析。谢欢等[5]结合近红外光谱高维高相关性的特点,通过特征波长筛选建立了玉米秸秆纤维素含量的偏最小二乘(PLS)预测模型。任兰天等[6]利用近红外光谱构建快速检测小麦秸秆腐解过程中纤维素、半纤维素、木质素含量的定量检测模型,定量效果较好。陈雪萍等[7]运用不同光谱预处理方法和化学计量学方法建立甘蓝型油菜茎秆纤维组分含量校正模型,建立模型最佳方法为修正偏最小二乘法(MPLS)。【本研究切入点】果树残枝中的纤维组分检测普遍存在耗时长、操作复杂和试验成本高的问题,近红外光谱技术应用于生物质的纤维组分含量的检测得到广泛研究,但是主要以农作物秸秆为主,对果树残枝的研究却鲜见报道。需研究检测新疆南疆果树残枝纤维组分含量。【拟解决的关键问题】以新疆南疆各地采集的150个果树残枝样本为研究对象,利用傅里叶变换近红外光谱仪在10 000 ~4 000 cm-1光谱范围内对果树残枝的纤维组分进行定量检测。采用不同预处理方法对果树残枝原始光谱数据进行预处理,通过选择特征波长,建立稳定性好、准确度高的偏最小二乘(PLS)近红外检测模型,快速测定新疆南疆果树残枝纤维组分含量。

1 材料与方法

1.1 材料

1.1.1 果树残枝

果树残枝样本于2019年12月~2020年3月采自新疆南疆各地区(巴音郭楞蒙古自治州、阿克苏地区、喀什地区、和田地区、克孜勒苏柯尔克孜自治州及新疆生产建设兵团第一师、第二师、第三师、第十四师),所有样本均在剪枝期随机采集,150个样本中包含红枣树残枝28个,核桃树残枝32个,香梨树残枝29个,杏树残枝33个,苹果树残枝28个。

1.1.2 设备

使用Thermo 公司的AntarisⅡ傅里叶变换型近红外(FT-NIR)光谱仪、GZX-9140MBE 型电热鼓风干燥箱、UV-6100S 型紫外分光光度计、TGL-16 型高速离心机、JF-2000 型智能马弗炉、SHZ-D 型真空抽滤泵等。Excel、Origin2018、TQ Analyst9.3和Matlab2018b进行数据统计分析。

1.2 方法

1.2.1 试验设计

1.2.1.1 样本制备

试验前将果树残枝全部用电动剪刀剪至1.5 cm左右,水洗自然晾干,于105℃烘干8 h至恒重,粉碎后过40目筛装进已编号的自封袋,放至盛有变色硅胶的干燥器中备用。

1.2.1.2 光谱数据采集

将实验室温度控制在(22±3)℃,全程避免强光直射。使用傅里叶变换近红外光谱仪采集近红外光谱数据,光谱扫描参数设置:样本扫描次数为32次取平均值,分辨率设为8 cm-1,光谱采集范围为10 000 ~4 000 cm-1[8],对应波长为1 000 ~2 500 nm,背景频率为每个工作流运行1次。

称取约3(±0.05)g 的待测粉末样品,均匀放置在石英片上,尽量保持木屑的均匀松散状态,将盛有样本的石英片平行移动到检测台上采集光谱。每个样本随机选取3个不同位置扫描3次,取平均值作为样本的原始光谱。

1.2.1.3 纤维组分的化学值

果树残枝的纤维组分(纤维素、半纤维素和木质素)含量采用范式法进行测定,每个样本做3次平行试验,取算术平均值。采用科铭生物科技公司纤维素、半纤维素和木质素的试剂盒对果树残枝各纤维组分抽检校正。

1.2.1.4 异常样本剔除与样本集划分

在纤维组分含量的化学测定和近红外光谱采集过程中,实验环境和光谱仪器等因素都会造成试验误差,产生异常样本,试验中果树残枝的异常光谱剔除采用主成分分析(PCA)和马氏距离(MD)相结合的PCA-MD方法,筛选出8个异常样本,果树残枝样品中纤维组分化学值的异常值采用浓度残差法识别[9],其中纤维素含量检测出7个异常样本,半纤维素含量检测出5个异常样本,木质素含量检测出7个异常样本。通过两种方法结合,共剔除纤维素含量异常样本15个,半纤维素含量异常样本13个,木质素含量异常样本15个。

SPXY 算法考虑光谱和浓度两方面因素为特征参数计算样本之间的距离[10]。使用该方法对剔除异常样本后的样本集按照校正集和验证集(约3:1)进行划分[11],纤维素、半纤维素和木质素含量分布范围较宽,变幅较大,具有较好的代表性,符合近红外建模的要求。表1

表1 果树残枝样本校正集和验证集各纤维组含量Table 1 Statistics of fiber group content in the calibration set and verification set of the residual branches of fruit trees

1.2.1.5 建模及评价

偏最小二乘回归法(PLS)对光谱阵和浓度阵同时分解,并考虑两者的相互关系,获得最佳校正模型,是多元线性回归、典型相关分析和主成分分析的完美结合[12]。在建立模型时通常采用相关系数r、决定系数R2、校正标准偏差RMSEC、预测标准偏差RMSEP和RPD等指标对模型进行评价,其中在浓度范围相同的前提下,r越接近1,RMSEC越小,RPD越大(大于2.5 以上)检测模型回归或预测效果越好。

试验采用PLS建模方法,通过均值中心化法、SG卷积平滑法、一阶导和SNV四种预处理方法对原始果树残枝光谱数据预处理,选出建模参数中R2最大和RMSECV值最小的一组用连续投影算法(SPA)[13]和竞争性自适应权重取样法(CARS)[14]优选特征波段,建立近红外光谱最优模型。

2 结果与分析

2.1 近红外光谱谱图

研究表明,建模光谱有1 557个数据点在9 000~4 000 cm-1有很好的光谱响应,分别在4 251、4 352、4 726、5 173、5 775、6 821、8 289 cm-1附近有较宽的吸收峰,不同样本的近红外谱图波形相似,但吸收强度各有不同,光谱数据具有很好的连续性和相似性。图1

图1 150个样本近红外平均光谱Fig.1 NIRS average spectra of 150 samples

在7 170~4 000 cm-1波段下光谱反射率由高到低为红枣树残枝>杏树残枝>苹果树残枝>香梨树残枝>核桃树残枝;在10 000 ~7 170 cm-1波段下光谱反射率由高到低排列为:核桃树残枝>香梨树残枝>红枣树残枝>苹果树残枝>杏树残枝。5种果树残枝的3种纤维组分的吸收峰位置相近,所含的成分相似,只是含量略有差异,可以共同建立近红外定量检测模型。图2

图2 5种果树残枝的近红外平均光谱Fig.2 NIRS average spectra of five fruit tree stump

2.2 光谱预处理

研究表明,纤维素、半纤维素和木质素最优预处理的方法都是SG卷积平滑法,PLS模型决定系数R2和RPD均达到最高值,且RMSECV和RMSEP较小,明显比其他预处理方法的建模效果好。SG 卷积平滑法是最佳的建模光谱预处理方法。表2

表2 不同预处理方法的PLS模型效果比较Table 2 Comparison of PLS model effects of different preprocessing methods

2.3 特征波段优选

研究表明,SPA 通过均方根误差值确定有效特征变量数,当纤维素最终迭代变量数为44,半纤维素最终迭代变量数52,木质素最终迭代变量数为58 时,模型的预测效果最好,RMSECV分别为0.010 5、0.010 5和0.008 5。经过SPA选取特征波段后建模,纤维组分的各项模型验证指标均有所提高。图3

图3 SPA选择变量与RMSECV之间的关系Fig.3 The Relation between SPA selection variables and RMSECV

随着迭代次数的增加,被选择的波长数量减少由快至慢,当纤维素迭代次数为28 次,半纤维素迭代次数为27次,木质素迭代次数为21次时,RMSECV均降到最低,这时选出最优波长组合建立的PLS模型预测效果最好。图4

图4 CARS法变量筛选过程Fig.4 Variable selection process diagram by CARS

采用SPA和CARS选取特征波长与全光谱建模相比,各项指标均有提升,新疆南疆果树残枝纤维素、半纤维素和木质素三分组分均采用CARS法变量筛选后得到最优模型,其相关系数r分别为0.950 3、0.948 7 和0.937 1,决定系数R2分别为0.900 8、0.896 5 和0.875 1,校正标准偏差RMSECV分别为0.007 0、0.005 4 和0.005 1,预测标准偏差RMSEP分别为0.011 8、0.008 9 和0.008 8,RMSEP略大于RMSEC,且均小于1,3个模型的RPD均大于2.5(纤维素RPD为3.18;半纤维素RPD为3.11;木质素RPD为2.83),采用CARS 法进行了光谱变量筛选,建立的3个模型稳定可靠,均具有较好的预测精度。表3

表3 全光谱和特征波长PLS模型比较Table 3 Comparison of full spectrum and characteristic band PLS models

2.4 近红外光谱模型的建立与评价

研究表明,建立新疆南疆果树残枝的纤维素、半纤维素和木质素的近红外定量检测模型,实测值和预测值拟合具有较好的线性关系,模型具有较好的相关性。图5

图5 果树残枝纤维组分实测值-预测值散点Fig.5 Scatter plot of the true value-predicted value of the fiber component of the residual branches of fruit trees

预测值与实测值十分相近,波动范围较为均匀,纤维素、半纤维素和木质素含量的平均相对偏差分别为1.2%、4.92%和3.26%,预测结果较为可靠,建立的模型能够实现果树残枝纤维素、半纤维素和木质素含量的快速定量检测。图6

图6 果树残枝纤维组分实测值-预测值对比Fig.6 Comparison of true value-predicted value of fiber components of fruit tree stumps

3 讨论

3.1 从预处理角度

稳健性好的校正模型,通常会采用特征波段优选的方法[15-18]。SPA 通过多次迭代比较波段投影向量大小,将最大投影量波段列为有效波段,选择冗余信息最少的变量组,从而调高模型的效率[19]。在均值中心化法(mean centering)、SG 卷积平滑法、一阶导和标准正态变量(SNV)四种预处理方法对果树残枝原始光谱数据进行预处理时,SG 卷积平滑法的预测效果较好,可能是因为150个果树残枝样本中包含了5个品种,各组分含量存在一定的差异性,而SG卷积平滑法是一种加权平均法,对光谱数据进行多项式最小二乘拟合,强调了中心点的中心作用,减少了光谱中噪声的影响。

3.2 从特征波段优选角度

由于近红外光谱中存在着大量的冗余信息,因此在建立定量检测模型额时候需要对特征波段进行优选。竞争性自适应权重取样法(CARS)优选光谱信息后,果树残枝的纤维素、半纤维素和木质素的定量检测效果均有明显提升,这是因为这些波段包含了各纤维组分中非键合羟基伸缩振动的组合频以及亚甲基的伸缩振动,选用这些光谱能够减少模型中的异常点,提升模型的稳健性。

4 结论

5种果树残枝可以共同建立近红外定量检测模型,纤维素、半纤维素和木质素最优预处理的方法均为SG卷积平滑法,PLS模型决定系数R2和RPD均达到最高值,分别为0.716 4、0.585 5 与0.619 7,最优的变量筛选法均为CARS法,获得的特征波段数目分别为28、27 与21,建立果树残枝纤维组分实测值-预测值的近红外定量检测模型,平均相对偏差分别为1.2%、4.92%和3.26%。该模型能够实现果树残枝纤维素、半纤维素和木质素的快速定量检测。

猜你喜欢
残枝木质素纤维素
刘红霞
纳米纤维素自愈合材料的研制
纤维素基多孔相变复合材料研究
纤维素气凝胶的制备与应用研究进展
宁静致远(外一首)
残枝握紧的春天
木质素增强生物塑料的研究进展
基于近红外技术的苎麻叶半纤维素、纤维素、木质素及Cd含量快速测定
“机器换人”推进京郊林果残枝综合利用
一种改性木质素基分散剂及其制备工艺