卢万鸿,王楚彪,林 彦,罗建中
(国家林业局桉树研究开发中心,广东 湛江 524022)
桉树材性性状近红外预测模型的建立
卢万鸿,王楚彪,林 彦,罗建中
(国家林业局桉树研究开发中心,广东 湛江 524022)
试验以采集的100份桉树不同组合杂交子代的木芯及木粉样品作为研究对象,以常规方法测定所取木材样品的木材密度、纤维长度和纤维宽度并用Polychrom ix手持式近红外仪采集了自然风干状态木粉的近红外光谱信息。光谱数据的处理及建模用Unscrambler 9.7软件完成。建模结果显示:木材密度、纤维长度和纤维宽度的预测精度均可达90%以上。建模过程中,木材密度较纤维长度和纤维宽度所需的校正样本集数量要多,说明要达到一定的预测精度,纤维长度和纤维宽度其所建模型的预测范围会相应变小。
桉树;材性指标;近红外光谱;预测模型
桉树(Eucalyptus)在我国发展迅速,至2013年8月其人工林面积达450万hm2[1],年产木材超过2000万m3,对解决我国木材安全问题起着举足轻重的作用。在我国,桉树主要用于制浆造纸和胶合板加工,随着市场的扩大和桉树产业的不断发展,市场对桉树定向育种的需求也越来越多元化,除了追求高生长量、优良干形等指标外,对桉树木材化学性质和物理性状等指标的关注度也越来越高,即桉树的定向育种成为现在的焦点。而这些指标的常规测量和检测方法费时费力,且需要破坏样品,这些问题都严重影响着桉树定向育种的进展,这要求科研工作者寻求一种非表型性状的快速检测技术。
早在食品加工业工艺环节的在线控制、药品品质及安全的监测[2-3]、 “精准农业”、过程统计控制[4]、石油组分的鉴定及在线分析[5]、环境问题的监测尤其是在线监测[6]、木材性质性状的预测[7-11]等领域就已经出现了一种“绿色、快速、非破坏”的分析技术——近红外光谱技术,它能在几分钟内,通过采集被测样品近红外光谱信息,即可完成其多项性能指标的测定;采集光谱时不需要破坏样品或对样品做预处理;分析过程中不消耗其他材料、成本低、分析重现性好。因此,本研究计划探索近红外技术在桉树木材性状预测中的应用效果。
1.1 仪器设备
研究用美国Polychromix公司的Phazir手持式近红外分析仪采集样品近红外光谱信息,其波长范围为1 600 ~ 2 400 nm,钨灯光源,光学分辨率为12 nm,每次扫描完成100个光波信息的采集。近红外光谱信息数据用 Unscrambler 9.7软件处理分析并完成预测模型的建立及对所建模型预测精度的检验。
样本木材纤维长度和纤维宽度以木芯为试验材料,按常规法解样[12],用加拿大 OpTest纤维质量分析仪完成纤维形态的测量。木材密度按饱和排水法测量获得[13]。
1.2 试样及光谱信息采集
建模所取校正集样本来自6年生桉树杂交子代林(表1)。该试验林超过20个杂交组合,包括尾叶桉(E. urophylla)、巨桉(E. grandis)、细叶桉(E. tereticornis)、粗皮桉(E. pellita)和赤桉(E. camaldulensis)等树种间的不同组合,所以样本遗传基础比较丰富,这也就保证了相当大的多样性。
选择混合树种(杂交种)作为近红外预测样本集,是鉴于目前国外相关研究也在探索能否用某一树种建立的近红外预测模型用于其他树种的性状预测,或用一个立地所取样本集建立的预测模型能否用于不同立地条件未知样本的预测。另外,华南地区目前商用无性系均由几个纯种桉树杂交种获得的无性系,其本身属于混合树种。本研究选用不同纯种桉树的杂交种作为预测样本集,其目的在于探索所建模型用于目前商用桉树品种木材性状预测的可行性极其预测精度。
建模总共采集了100份胸高处木芯及对应单株的木粉。木芯用于木材密度、纤维长度和纤维宽度等材性指标的常规法测定,这3个指标均按常规国标法测取(表2)。木粉经自然风干后用于近红外光谱数据的采集,具体方法是将木粉装于透明塑料袋中,用Phazir手持式近红外仪隔袋每样连续测取10次,然后求其均值以代表该样品的光谱信息[14]。
表1 测试样本的亲本信息
表2 预测样本集各木材性状均值
2.1 桉树木粉的近红外光谱原始信息
图1为100个桉树木粉样品的近红外光谱原始信息的反射率光谱。从图1可知,在除了个别偏离较远的离散样本的前提下,不同样品的近红外光谱原始信息反射率的变化趋势基本相似或一致。不同样品近红外光谱原始信息反射率的变化趋势基本一致,说明了此次所收集校正模型预测集的同质性,从而保证了建立预测模型的意义,最终保证所建模型的预测精度。由图1还可知,在研究所用仪器可测量的范围内,样品在不同的波长处其光波发射率有着极其明显的变化,且随着波长的增大反射率有增加的趋势。在波长1 870 ~ 1 940 nm的区间、2 315 nm波长附近,样品的反射率有较大的变化,说明这两个波长区域对所测试样品的特征有较好的反应。
2.2 样品近红外光谱信息的预处理
用远红外、近红外和红外等光谱技术进行样品检测时,采集样品光谱信息的过程中都会受到随机高频噪音、偏移、样本不均匀和光散射等因素的影响,采集的原始光谱信息常常存在一定的偏差,从而降低检测精度[15],因此在数据分析前应对原始数据进行相应的预处理,这是关系近红外分析技术准确性的一个必不可少的环节。本研究用Unscrambler 9.7软件对近红外光谱的原始数据进行S. Golay(平滑处理)和Normalize(标准化处理)两步预处理,不仅去除原始光谱数据存在的偏差,也是为了明晰预处理对校正模型的建立有无影响及影响的程度,从而确定对于特定的光谱数据采用何种预处理会得到最佳的样品特征校正模型。
图2为经平滑和标准化两步预处理后得到的样品反射率,较图1相比反射率存在很大的差别,但在不同波长处反射率的变化趋势却完全一致,因为这两种光谱数据的预处理只是经过相应数学函数处理后所得的函数值,所以从相对性上来说没有从本质上改变数据的性质。
所不同的是从图2中能更明确地看出不同样本在特定波长处反射率的差异情况,如在波长约1 600 ~ 1 900 nm间和2 254 ~ 2 380 nm区间,样本的近红外光谱反射率存在明显的差异,这对在何种波长范围进行异质样本的区分具有重要的依据。
2.3 样品材性性状近红外校正模型的建立
多合一多元数据分析和试验设计软件包 Unscrambler是目前处理近红外光谱数据比较好的化学计量软件。利用近红外光谱数据建立样品特征的快速预测模型其核心就是选择合适的数学回归方法,建立样品光谱数据与其对应的特征值间的回归方程。
利用Unscrambler软件中的regression算法获得回归方程,同时用该软件中的 prediction过程对所建模型进行精度验证,不断修正优化,从而得到最优的校正模型,实现样本的最精确预测目的。此次建模选择PLS法(即Partial Least-squares,偏最小二乘法)进行数据回归,选择全交互式验证,默认主成分数量设为20个。在得到校正模型(图3)后,通过反复去掉离散型样本数据,对已得到的模型进而修正优化,不断提高所建模型的预测精度,获得最优预测模型。
图3为样品木材密度的近红外校正模型建模结果,所建模型预测精度达到 R2=0.950,回归模型RMSE(均方根)值为0.006 (表3)。通过多次模拟回归,根据校正模型的预测精度和主成分分布图,反复去掉离散型样品数据,最终获得预测精度最理想而又能保证有一定数量的预测样本集的校正模型。获得本次木材密度近红外校正模型共用了 85个样本的数据,充足的样本数量可以保证校正模型较广的预测范围。
同样对光谱数据进行桉树纤维长度近红外预测模型的建模,结果显示(图4),所得模型的预测精度达到R2=0.965,回归模型RMSE值为0.010 (表 3)。该模型的预测样本数量为77个,较木材密度预测模型建模所需样本数量少。桉树纤维长度预测模型的建模过程也经过多次模拟回归,依据所得校正模型的预测精度和主成分分布图(图4),反复去掉离 散型样品数据,最终获得预测精度的校正模型。
桉树纤维宽度近红外预测模型的预测精度为R2=0.951,回归模型RMSE值为0.204(表3),此处RMSE的值比木材密度和纤维长度的大,原因是由木材纤维宽度本身的计量大小引起,并非校正模型相关性的降低而导致。纤维宽度近红外预测模型的建模去掉一部分离散型样本数据后,获得该精度预测模型使用了79个样本的校正集。
桉树木材密度、纤维长度和纤维宽度的近红外光谱校正模型,其建模结果显示,这3个性状的近红外预测模型建模所需的校正数量大致相同。说明此次试验所采集的100个样本集对于这3个性状的预测模型建模来说很稳定。另外,3个性状的近红外预测模型具有一定的预测精度,可靠性较强。
表3 桉树材性性状近红外校正模型相关参数
表4是用Unscrambler软件建立的近红外预测模型进行未知样本木材材性预测的结果,包括木材密度和木材纤维形态的预测值,同时也列出了用所建模型进行预测时的精度区间,从精度区间的数据来看,所建近红外预测模型的预测值其精度范围非常小,说明近红外技术用于桉树材性性状的预测是可靠的。本研究所建立的预测模型能较好地用于采样区域桉树木材材性的预测。
表4 桉树材性近红外预测模型精度检验
利用近红外技术进行样品特征的快速预测研究在国内外已有很多报道,其中很多研究结果都表明其预测精度很高。本研究结果表明,利用近红外技术对桉树材性性状进行预测可获得很好的效果,预测模型具有很高的预测精度。建模结果显示,桉树木材密度、纤维长度和纤维宽度的近红外预测精度均达90%以上。因此,利用近红外光谱技术进行桉树木材材性的预测是可行的。
应用近红外技术建立样品特征快速预测的模型除了采用合理的化学计量方法外,选择合适的样本校正集是保证模型预测精确性和稳定性的重要前提。本研究共采集了100份木材样本,对于利用近红外技术进行样本特征快速预测模型的建立,及用化学计量软件和建模方法(偏最小二乘法)的要求而言,该样本数量完全符合建模需求。Unscrambler建模结果显示,达到90%以上的预测精度,桉树木材密度、纤维长度和纤维宽度建模需要的样本数分别为85、77和79个。这几个性状的建模样本集数量相差不大,表明试验所采集的100个样本对于这3个性状预测模型的建模来说很稳定,保证了所建模型的可靠性及预测精度。
另外,结合本研究结论及相关文献[16-17]可推测:第一,能否用来源于不同立地条件下的多品种样本建立混合校正模型用于预测不同品种的未知树种样本;第二,利用某一立地的样本群建立的校正模型能否用于其它立地未知样本的预测;第三,以生长样木的数据为基础建立的校正模型能否用来评估整株样木的性状特征。以上3个问题有待在日后的工作中继续开展。
[1] 陈少雄,陈小菲.我国桉树经营的技术问题与思考[J].桉树科技,2013,30(3):52‒59.
[2] 邓波,周玉荣,庞小峰.FT‒NIR与主成分分析在中药贝母鉴别和聚类中的应用研究[J].光谱实验室,2006,23(5): 1103‒1106.
[3] 石杰,李长滨,吴拥军.近红外光谱法快速定量分析那格列奈[J].郑州大学学报(工学版),2010,31(6):104‒107.
[4] 杨萌.近红外光谱技术在棉氨纶面料分析中的应用[J].中国纤检,2010,11:61‒63.
[5] 毕卫红,张权.基于近红外光电传感技术的溢油监测系统设计[J].仪表技术与传感器,2010(9):43‒49.
[6] 马翔,温亚东,王毅,等.傅里叶变换近红外光谱仪在制丝线上的应用[J].烟草科技,2006(1):22‒24.
[7] Schim leck L R,Evans R.Estimation of Pinus radiata D.Don tracheid morphological characteristics by near infrared spectroscopy[J].Holzforschung,2004,58(1):66‒73.
[8] Via B K,Shupe T F,Stine M,et al.Tracheid length prediction in Pinus palustris by means of near infrared spectroscopy: the influence of age[J].Holz Als Rohund Werkstoff,2005,63(3):231‒236.
[9] Schim leck L R,Jones P D,Peter G F, et al.Nondestructive estimation of tracheid length from sections of radial wood strips by near infrared spectroscopy[J].Holzforschung, 2004,58(4):375‒381.
[10] Schim leck L R,Evans R. Estimation of Eucalyptus delegatensis wood properties by near infrared spectroscopy[J].Canadian Journal of Forest Research,2001, 31(10):1671‒1675.
[11] Sykes R,Li B,Hodge G,et al.Prediction of loblolly pine wood properties using transmittance near‒infrared spectroscopy[J].Canadian Journal of Forest Research, 2005,35(10):2423‒2431.
[12] 卢万鸿.美洲黑杨无性系材性性状变异研究[D].南京:南京林业大学,2008.
[13] 成俊卿.木材学[M].北京:中国林业出版社,1985.
[14] Jones P D,Schim leck L R,Peter G F,et al.Nondestructive estimation of wood chemical composition of sections of radial wood strips by diffuse refectance near infrared spectroscopy[J].Wood Science and Technology,2006, 40(8):709‒720.
[15] 韩瑞珍,宋韬,何勇.基于可见/近红外光谱的土壤有机质含量预测[J].中国科学:信息科学,2010(40):111‒116.
[16] Schim leck L R,Mora C,Daniels R F.Estimation of Tracheid Morphological Characteristics of Green Pinus Taeda L.Radial Strips by Near Infrared Spectroscopy[J]. Wood and Fiber Science,2004,36(4):527‒535.
[17] Roger M,Nicholas E.NIR spectroscopy for rapid determination of permethrin or bifenthrin retention in P. radiata sapwood[C].International Research Group on Wood Preservation 44th Annual Meeting,Stockholm, Sweden,2013.
NIRS Calibration for Predicting Wood Properties of Eucalyptus
LU Wan-hong, WANG Chu-biao, LIN Yan, LUO Jian-zhong
(China Eucalypt Research Centre, Zhanjiang 524022, Guangdong, China)
100 increment cores and wood powder samples from a range of Eucalyptus taxa were collected in order to develop a Near Infra Red Spectral (NIRS) calibration for predicting wood properties of such species. Measurements of wood density, fiber length and fiber w idth of samples were first obtained from the increment cores using conventional methods. A Polychromix Phazir was then used to collect the near infrared spectra of the air-dried wood powder samples. The software Unscrambler 9.7 was used for data analyses and developing calibration models. The accuracy the calibrations obtained for predicting wood density, fiber length and w idth were all greater than 90%. The number of samples used for the calibration for NIR prediction of wood density was higher than for other traits, fiber length and w idth.
Eucalyptus; wood properties; near infrared (NIR);
S725.5
A
2015-03-12
广东省科技计划项目“近红外光谱技术用于桉树木材制浆性能的研究(2012B020302005)
卢万鸿(1982— ),男,在读博士,工程师,主要从事桉树遗传育种研究. E-mail :luwanhong@outlook.com