阚相成,解光强,李耀翔,王立海,李怡娜,谢军明,唐 旭
东北林业大学工程技术学院,黑龙江 哈尔滨 150040
木材作为一种可再生材料对我们日常生活和工业生产等都具有不可替代的作用。相比于其他原料,它也存在易腐朽和干缩湿胀等缺陷。这些问题往往都与木材含水率息息相关。不仅如此,含水率的变化在一定范围内影响木材的刚性、 硬度、 强度、 燃烧值、 导热性、 导电性以及机械加工性能等[1]。因此在木材储存、 运输、 加工过程中含水率的检测显得尤为重要[2]。木材含水率检测手段较多,其中近红外光谱法作为一种非接触式的无损检测方法已经成为木材含水率检测的强有力的工具,国内外学者对此也做过大量研究[3-4]。
近红外光谱能够反映物质内部O—H、 C—H等基团的振动信息,结合化学计量学方法实现对含有上述基团的物质进行定性或定量分析,已被广泛应用于化工、 农业、 医药等行业[5-6]。虽然水作为天然的生物基质是由小分子组成的,但其内部却存在很强的氢键,在100 nm~100 μm的电磁光谱上均有水分子中羟基的吸收带。相比于中红外波段,水中羟基在近红外区域吸收没有特别强烈,用近红外光谱更适用于测量含水率变动范围较大的木材[7-8]。近红外光谱属于分子振动光谱,当环境温度改变时,物质分子的振动会加剧或减弱,分子作用力会相应发生变化,进而影响到分子振动或转动状态在不同能级之间的跃迁,从而影响分子的振动光谱,所以当近红外光谱检测过程由温度精确可控的实验室环境进入到实际现场检测环境时,检测精度可能会受到温度变化的影响[9]。国内外学者对不同物质的近红外光谱的温度扰动都做过系列研究。Luan等[10]提出了一种多级最小绝对收缩和选择算子(LASSO)修正近红外分析模型测量双酚A的粘度时温度对NIR模型预测性能的影响,实验结果证明了所提出的模型的有效性,与没有温度校正的现有模型相比,该模型提供了更稳定的预测结果。王冬等[11]采用偏最小二乘算法建立总植物碱在各温度下的校正模型,并把温度作为建立校正模型的扰动因素之一,建立了具有温度自动矫正能力的校正模型,所得预测结果的准确度较高。此外他还研究了样品温度对克螨特-高效氯氰菊酯乳油制剂的近红外光谱定量分析模型预测能力的影响。木材的实际生产环境和条件决定了近红外光谱检测技术在木材科学上的应用必须考虑温度的影响。目前对于近红外光谱预测木材含水率的研究大多局限在实验室、 恒定室温的条件下,而木材在生产、 运输、 加工的过程中其所处的环境温度往往有所变化,尤其在我国的东北林区,-20 ℃以下的低温以及不同季节间60 ℃左右的温差是通常其他样品的近红外光谱检测中较为少见的,这种实验研究与生产实际之间的温度差异严重影响了近红外光谱在木材生产上的广泛应用。因此本实验通过控制不同树种木材的温度和水分探究温度变化对近红外预测木材含水率的影响,为木材生产实践提供理论依据和技术支持。
样品采自黑龙江省方正县林业局星火林场(N45°43′5.73″,E129°13′34.37″) 。选取了樟子松、 水曲柳、 大青杨和红松四个树种在胸径1.3 m以上的木段各1 m。将木段用密封袋包装好带回实验室进行木块分割:在横向距髓心一定距离处沿径向取20 mm×20 mm×1 000 mm木条,然后将木条加工成规格为20 mm×20 mm×10 mm的木块,每个树种各75块,共计300块木块试样,如图1所示。样本具体性质如表1所示。
图1 木材试件Fig.1 Wood samples
表1 样本性质情况Table 1 Nature of the samples
使用美国ASD公司生产的LabSpec5000光谱仪采集样品近红外光谱。波长范围为350~2 500 nm,采样波长精度1 nm。使用两分叉光纤探头在样品的横切面垂直采集NIR光谱, 每次采集的每条光谱为1.5 s内扫描30次全光谱后平均而得。
主要由两个实验组成:(1) 检测每个树种在每个温度梯度下不同含水率时的近红外光谱。(2) 控制所有试样含水率相同(此处设置为50%含水率),检测不同温度时的木材近红外光谱。
实验一 为了保证水分不散失,将采集到的木块放入保鲜袋中密封。将密封好的试样放置于30 ℃的恒温恒湿箱中3 h进行控温,然后快速对试样进行光谱采集。光谱采集全过程使用红外测温仪测温确保温度达标。测量结束迅速放回保鲜袋密封。按照以上步骤采集所有300块试样在20,10,0,-10和-20 ℃下的光谱数据,其中零下温度使用冰箱完成,共计采集1 800条光谱样本。光谱采集完成后测定含水率。试样含水率测定按照 GB/T1931—2009《木材含水率测定方法》。
实验二 将樟子松、 水曲柳、 大青杨和红松试样各75块烘至绝干并记录重量。随后将其浸泡10 d至饱和后,放到玻璃干燥器中进行解析,不断称得质量并计算含水率。当样品含水率到达所需含水率(此处设置为50%)时,用保鲜袋将其密封。采集相同含水率下30,20,10,0,-10和-20 ℃时的近红外光谱,进行光谱分析。控温、 控湿、 光谱采集的具体操作步骤同试验一。实验仪器如表2。
对实验二中采集到的木材试样的近红外光谱进行了光谱求和、 平均、 放大、 一次微分以及主成分分析(principal component analysis, PCA)和偏最小二乘判别分析(partial least squares discriminant analysis,PLS-DA)以观察温度变化对光谱的影响。运用偏最小二乘算法(partial least squares regression,PLSR)分别建立木材含水率单一温度模型和温度全局模型(global calibration model)。预处理方法比较了移动平均平滑法(moving average,MA)、 Savitsky-Golay平滑算法、 多元散射校正(multiplicative scatter correction,MSC)、 一次微分。评价模型优劣的指标为校正均方差(RMSEC)、 预测均方差(RMSEP)、 校正相关系数(Rc)、 预测相关系数(Rp)以及相对分析误差(RPD)。
表2 实验仪器与设备Table 2 Experimental equipments
将在30℃,50%含水率条件下测得的75块樟子松试样的近红外光谱使用蒙特卡洛交叉验证法剔除其中的异常样本,然后进行光谱平均后得到图2(a)中的一条红色光谱。如图2(a)所示,在350~2 500 nm上的6条不同颜色光谱分别代表了樟子松在50%含水率下30,20,10,0,-10和-20 ℃下的Vis-NIR平均光谱。同理,图2(b), (c)和(d)分别为水曲柳、 大青杨和红松试样在50%含水率下不同温度的平均光谱图。在图2中可以看到,四个树种六个温度梯度下的近红外平均光谱的全波段中的整体趋势基本一致,光谱中有多个波峰,其中1 150~1 220 nm的波峰为C—H的二级倍频与合频的吸收峰以及水中O—H的合频吸收峰;1 450 nm波长附近的吸收峰则对应于水分子中游离O—H的一级倍频吸收带和木材中C—H的合频吸收;1 940 nm附近为纯水分子中O—H键伸缩振动的组频吸收带和羰基伸缩振动二级倍频。观察木块试样的原始光谱,我们能看到1 450 nm附近不同温度的光谱波峰有分离现象。为了进一步分析光谱差异,将波长1 450 nm附近波峰进行局部放大。
图2 不同温度下木材近红外平均光谱图 (a):樟子松;(b):水曲柳;(c):大青杨;(d):红松Fig.2 Average NIR spectra of wood at different temperatures (a):Pinus sylvestris;(b):Fraxinus mandshurica;(c):Populus sylvestris;(d):Korean pine
在放大后的光谱图中可以观察到1 450 nm附近波峰的吸光度发生变化,各谱峰的相对强度也发生了变动,但并没有观察到其随温度的变化而产生一致的规律性趋势。由于各羟基谱峰的重叠,难以对谱峰的强度变化进行细致分析。为了继续观察1 450 nm附近吸收峰位置的变化规律,将各温度的平均光谱进行一次微分并对1 450 nm附近谱图进行放大。如图3(a)所示,经过微分处理后,可以见到,随着温度的升高,樟子松试样平均光谱图1 450 nm附近零点有向左移动的变化,既光谱吸收峰有逐渐向高频(短波)波段转移趋势。进行相同操作,我们发现图3(b—d)中水曲柳、 大青杨、 红松试样不同温度的光谱图亦发生了相同变化。这可能是因为温度上升改变了木材样品分子间的作用力,促使氢键发生减弱,使得水分子的伸缩振动向高频转移,致使光谱谱峰发生了迁移。将不同温度之间的波峰位移量化后如图4所示,可以看出四个树种中除水曲柳外,谱峰位移量最大的温度区间均在在-20~-10 ℃和-10~0 ℃两个区间段内,而水曲柳的最大峰移量也发生在-20~-10 ℃区间。整体上温度变动时木材近红外光谱发生位移变动程度零下温度要比零上温度更剧烈。这可能是当温度到达零下时,部分水分子发生了相变,水分子的结构及不同结构形式水分子的含量发生了变化,氢键的缔合程度进一步增大,分子作用力进一步增强的结果[12]。
为了消除原始光谱边界波长震荡效应带来的的影响,去掉光谱两端噪声较大的部分,对1 000~1 800 nm波段内的不同温度樟子松近红外光谱进行主成分分析和PLS-DA判别分析,以观察温度对木材样品光谱潜在的影响规律。如图5为6个温度下的樟子松样品的主成分得分图(PC1=79%,PC2=16%)。从图中可以看到,随着木材样品温度的上升,第一主成分得分逐渐增大,从而使不同温度下的样品发生分离。6个温度下的样本在PC1和PC2的投影分布总体上具有良好的分类聚集特征。各温度水平之间的界限较为明显,仅有个别样品同其他温度下的样品相混合。应用偏最小二乘判别分析对相同含水率下6个温度的光谱进行判别分析,结果如图6和图7所示,温度交叉验证判别准确率达96.1%,预测均方根误差为0.37。结果表明温度变动对样品光谱存在显著影响。
图3 木材1 450 nm附近近红外光谱一次微分图 (a):樟子松;(b):水曲柳;(c):大青杨;(d):红松Fig.3 The first-order derivative graphs of NIR spectral peaks of wood samples at 1 450 nm (a):Pinus sylvestris;(b):Fraxinus mandshurica;(c):Populus sylvestris;(d):Korean pine
图4 不同温度下木材近红外光谱谱峰位移量 (a):樟子松;(b):水曲柳;(c):大青杨;(d):红松Fig.4 NIR spectral peak shifts of wood samples at different temperatures (a):Pinus sylvestris;(b):Fraxinus mandshurica;(c):Populus sylvestris;(d):Korean pine
图5 不同温度下的樟子松样品的第一、 第二主成分得分Fig.5 Scores of the first two PCs of Pinus sylvestrissamples at different temperatures
图6 主成分分析的累计方差图Fig.6 Principal component analysis cumulative variance plot
使用SPXY算法将每个树种的每一个温度下不同含水率的光谱按照3∶1的比例划分为校正集与验证集。为探究温度对木材含水率预测模型的影响,采用单一温度下的校正集分别与各个温度下的验证集建立偏最小二乘含水率预测模型,波段范围选为1 000~2 100 nm内[13]。其中樟子松不同温度建模的RMSEP结果如表3所示,为显示变化规律,在表格中填充色阶。
图7 樟子松不同温度的偏最小二乘判别分析结果图Fig.7 Result of partial least squares discriminantanalysis of different temperaturesP
表3 不同温度下采集的近红外光谱所建校正模型 预测各温度验证集的RMSE
由表3中数据可以看出,每行数据的RMSEP最小值均发生在表的对角线上,然后沿着对角线,每行的RMSEP数值向两边递增,其中校正集温度与验证集温度均为20 ℃时的预测效果最优,RMSEP为0.1。这表明,温度产生变动时,木材含水率预测模型的准确性也会发生改变。从变化趋势来看,单一温度的校正集在与各个温度的验证集建立PLS含水率预测模型时,校正集和验证集的温度差与模型预测准确度呈负相关,即当建模样本温度与待测样品的温度相差越大时其预测准确性也会越低。使用不同温度的校正集与验证集进行建模,其建模结果的变化实际上反映的是每个温度下的模型对温度变动的适应能力。结果表明,木材含水率预测模型更适应于检测与建模样本相同温度的样品。这意味着,在实际生产中,为取得更好的检测效果,我们需要根据实际待测样品的情况建立不同温度的预测模型。
由上述光谱分析和建模分析可以发现温度对近红外预测木材含水率有较大影响,尤其当温度低于零度时影响较为显著。建立多个不同温度的模型显然会增加工作量减小近红外检测法的易用性。提高模型预测能力和温度适应性的方法有很多,关键在于提高模型的稳健性(robustness)和准确性(accuracy)。相比于其他方法,建立全局校正模型(global calibration model)的效果在一些特定分析目标的检测上展现出优越性[16-17]。在1 000~2 100 nm波段范围内对不同温度下的光谱进行综合后组成温度全局校正集,建立了含水率预测温度全局模型,采用SPXY算法,将每个树种的所有温度下不同含水率的光谱按照3∶1的比例设置校正集与验证集。如图5(a)为50%含水率的樟子松在6个温度梯度下全部光谱1 000~1 800 nm段的原始光谱。光谱曲线中不仅包含有用信息,噪声、 谱线重叠也夹杂其中。尤其是是当温度低于0 ℃时,木材表面会产生冰晶,造成光谱的散射和折射以及木材横截面不够平滑造成的散射,这些问题都会影响模型准确性。为进一步提高PLS 温度全局模型的准确性,消除干扰因素,尝试有针对性的对光谱进行预处理。为减小仪器背景或漂移对采集信号的干扰,尝试对光谱进行一次微分;为降低光谱信号中的随机噪声,提高木材样本光谱信号的信噪比,尝试了Savitsky-Golay平滑算法;为消除冰晶和木材表面漫反射过程中带来的散射影响,尝试了多元散射校正(multiplicative scatter correction,MSC)并尝试了几种处理方式联用的效果。经过预处理后的温度全局模型建模效果如表4所示,图8为樟子松原始光谱和经过预处理后的效果。
图8 不同温度下樟子松光谱图(-20~30 ℃) (a): 原始光谱;(b): S-G平滑+MSC校正; (c): S-G平滑+MSC校正+一次微分Fig.8 NIR spectra of Pinus sylvestris atdifferent temperature (-20~30℃) (a): Raw spectra;(b): S-G smoothing+MSC; (c): S-G smoothing+MSC+1st derivative
表4 不同预处理方式的PLS木材含水率近红外光谱预测结果Table 4 Prediction results of PLS models using differentsectral preprocessing methods
将表4与表3中的数据对比可以发现,樟子松未经过预处理的温度全局模型的RMSEP为0.156。预测结果已经明显优于大部分单一温度模型,仅低于20 ℃时的自适应温度模型,水曲柳、 大青杨、 红松树种的温度全局模型RMSEP均在0.2以下。这表明木材含水率预测全局温度模型对不同温度下样品表现出了较强的适应性,有一定的温度修正能力和实际应用潜力。在比较了几种光谱预处理方法后发现,不同光谱预处理方法对PLS木材含水率温度全局模型的预测结果有明显影响,单一平滑预处理的预测准确性要略低于三种预处理方法结合。SG平滑、 多元散射校正与一次微分联用的处理效果最优,在水曲柳的应用中预测相关系数Rp可达0.978,RMSEP为0.074。相比较于原始光谱,在预测准确性方面特定光谱预处理对全局模型的准确性有明显提升。
通过对四个树种不同温度下的近红外光谱进行光谱分析和建模分析,探究了温度变化对近红外光谱预测木材含水率的影响。实验结果显示,温度对木材近红外光谱和光谱建模精度都会产生影响。温度会影响木材的近红外光谱在特定波长吸收峰的位置及吸光度,这种影响在温度低于零度时更显著。通过建模分析,PLS含水率预测模型对温度变动的适应能力有差异,木材含水率预测模型更适应于检测与建模样本相同温度的样品,其中在20 ℃附近的自适应温度模型最好。与单一温度模型相比,PLS温度全局模型对于温度变化具有很好的适应性和应用潜力。基于SG平滑+多元散射校正+一次微分联用的预处理的PLS含水率温度全局模型有较好的预测效果和温度适应性,RP最高为0.978。研究结果显示,温度作为一种随机扰动因素在木材含水率的近红外检测法中是不可忽视的。木材含水率预测模型更适应于检测与建模样本相同温度的样品,但是这使得建模过程更加繁复,减小了近红外光谱检测法的易用性。应用温度全局模型并结合与之适应的预处理方法为问题的解决提供了一个新思路。本实验可对近红外光谱法应用于木材含水率的实际检测应用提供一定的参考。
致谢:感谢唐旭、 刘言旭两位同学在光谱采集过程中给予的帮助。