梁秀英,李小昱,2*
(1.华中农业大学工学院,武汉 430070;2.黄土高原土壤侵蚀与旱地农业国家重点实验室中国科学院水利部水土保持研究所,山西杨凌 712100)
水分是土壤的重要组成部分,快速、准确地测定土壤水分对土壤侵蚀预测预报、农业水土工程管理、实施精准农业、农业试验、农业气象、灌溉管理和旱情监测具有重要的意义。
近红外光谱分析技术具有无前处理、无污染、无破坏性、可在线检测、测定速度快等优点,在土壤[1-7]、农产品[8-9]、水果[10-12,24-25]等方面得到了广泛的应用。近红外区域的信息主要来源于有机分子中含氢基团(O-H、N-H、C-H)的吸收为主,而温度的变化会改变样品分子间和分子内的作用力[13-14],从而引起振动光谱的非线性变化[15],特别是水分的光谱,当温度升高时,羟基官能团处的光谱向低波长处移动且变窄。高鹏程等[14]分析了土壤最大有效含水量与温度的关系,结果表明土壤最大有效含水量随温度升高而降低。Wülfert等[15]研究了温度对乙醇/水/异丙醇混合物短波近红外光谱的影响,结果表明:当某一特定温度下的局部模型去预测另一温度下的样品时,精度较差。Wülfert等[16]采用线性回归法补偿温度对近红外光谱的影响,结果表明:把温度作为外部变量引入到校正模型中并不能提高模型的预测能力,采用线性回归法不能补偿由温度引起的非线性影响。Peirs等[17]应用近红外光谱技术研究了温度对苹果果实可溶性固形物含量的影响,结果表明,温度以非线性的方式影响近红外光谱,光谱反射率随着温度的升高而减小。张军等[18]研究了环境温度(4℃ ~29℃)对小麦粉末蛋白质含量近红外光谱定量分析结果的影响,将温度作为外部变量采用逐步多元线性回归建立温度修正模型,结果表明,预测标准差随环境温度与建模时温度差的增大而增大。
综上所述,近红外光谱易受外界环境的影响,温度是以非线性的方式影响近红外光谱,用线性回归法补偿温度的影响效果不显著或模型很复杂。支持向量机(SVM)是Vapnik等在1995年提出的用于分类与非线性回归的方法,最小二乘支持向量机(LSSVM)是SVM的一种改进方法,能较好地解决小样本、非线性、高维数等众多实际问题[19]。李世勇等[20]采用LS-SVM回归法和偏最小二乘回归(PLSR)法分别建立了烟叶总粮含量的NIR预测模型,结果表明:LSSVM回归法模型的预测准确度比PLSR法的高。Chauchard 等[21]采用 LS-SVM、PLSR、MLR 建立了三种不同种类葡萄酸度的近红外模型,通过预测表明,LS-SVM回归法的预测精度高于PLSR和MLR。
论文采用多尺度小波变换和LS-SVM方法研究温度对近红外光谱检测土壤含水率的影响,利用多尺度小波变换提取特征光谱,采用多波长LS-SVM法补偿土壤温度对近红外光谱分析模型预测结果的影响。
试验土壤样品为湖北地区的黄棕壤,土壤经风干、去杂、粉碎、过筛(2 mm)等处理后进行水分配比,实测土壤含水率的范围为2.467% ~31.485%(湿基),剔除了3个异常样品后,获得47个样品。土壤样品光谱采集采用Ocean Optics NIR256-2.5扩展近红外光谱仪,光谱扫描范围为900 nm~2 550 nm,采用光纤探头采集数据,光学分辨率为6.68 nm,视场角为12.5°。土壤样品含水率(质量百分比)按标准GB 7172—87烘干称重法测定。
将经过配水的47个样品放入培养箱,调整培养箱的温度分别为5℃、10℃、15℃、20℃、25℃、30℃等6个水平制成不同温度的样品,共获得282个样品。每次调整培养箱温度后,土壤样品在培养箱内放置24 h,以使土壤样品各部分的温度均匀,土壤样品从培养箱中取出后马上用Ocean Optics NIR256-2.5扩展近红外光谱仪采集样品光谱反射率,每份样品采集3次光谱,取其平均光谱。
在室温条件下,近红外仪预热1 h后,将装有土样的铝盒置于近红外光纤探头正下方2 cm处,此时获得近红外光谱反射率值最大。光谱采集范围为874.04 nm ~2588.56 nm,数据间隔 6.68 nm。由于光谱边缘存在很大的随机噪声,因此建模时选择光谱范围为954.23 nm~2498.48 nm的共230个波长点处的光谱反射率数据进行建模和预测,以提高模型的预测能力[6-7]。
采用Mallat算法对光谱信号进行多尺度小波分解与重构,多尺度小波分析在Matlab R2007b平台中编程实现。对原始光谱曲线进行6层“db4”小波分解,分别提取小波低频系数进行信号重构,重构后的信号与原始光谱信号进行比较,结果表明,当分解尺度小于等于3时,重构后的信号与原信号重合,当分解尺度等于4时,水分的特征吸收峰开始发生偏移,当分解尺度大于4时,重构后信号波形失真,即多尺度小波变换的分解尺度不能太高,否则会引起信号失真。因此论文选取4阶小波分解。
用多尺度小波变换对原始光谱数据进行4层分解,采用软阈值法对光谱数据进行消噪及数据压缩后,运用最小二乘支持向量机(LS-SVM)在光谱范围954.23 nm~2 498.48 nm建立回归模型,采用相关系数R作为模型预测能力的评价指标[22-23]。其中LS-SVM采用RBF核函数,参数γ和σ2采用二步格点搜索法和留一法相结合进行选择,分别为2 936.215 6和441.769 67。为便于模型之间的相互比较,在对6个温度的光谱集进行建模和预测时,选择每组光谱集中相同样品号的15个样品作为验证集。
采用4阶小波分解尺度LS-SVM回归方法在每个样品温度下以32个校正集样品建立土壤含水率近红外光谱定量分析模型,并预测没有参与建模的15个样品,结果如表1所示。
表1 在各温度下模型的预测结果
由表1可知,用各自温度下建立的模型预测各自温度下的样品,精度都较高。为了分析温度对近红外光谱预测土壤含水率的影响,用样品温度为20℃的土壤样品校正集建立模型,预测其它各个温度下的土壤样品,预测结果如表2所示。
从表2可知,除了样品温度20℃以外,其它样品温度下的预测均方差都比较大,即样品温度不同引起近红外光谱发生变化,影响近红外光谱分析模型的预测精度,因此在建模和预测时应补偿样品温度的影响。
在全谱范围内建立的模型复杂,且预测时间较长;使用单一波长建模则信息量少且预测结果不稳定,如易受电源电压不稳定等的影响。通过理论分析和试验研究,论文选取水分在近红外区的敏感波长即特征吸收波长1450 nm、1940 nm和不敏感即参考波长1300 nm、1800 nm等4个波长处的光谱数据进行建模分析。
把在不同温度下测得的光谱曲线进行4层小波分解,分别用每层小波高频系数进行信号重构,提取重构信号在1450 nm、1940 nm、1300 nm和1800 nm等4个波长处的光谱数据分别与土壤温度、土壤含水率进行回归分析,分析结果如表3所示。
分析表3可知,由第1层小波高频系数重构信号与土壤温度的决定系数R2为0.6675,与土壤含水率的决定系数R2为0.4601,即第1层小波高频系数主要由温度引起。第2、3、4层高频小波系数重构信号与土壤含水率的决定系数都高于与土壤温度的决定系数,即这几层小波系数主要由土壤水分引起。因此,从原始光谱曲线中减去第1层高频小波系数重构后的信号可剔除温度对光谱的影响。
表3 小波高频系数重构信号与土壤温度、土壤含水率的决定系数R2
为了消除由于电源电压波动等外界因素的影响,将提取的特征光谱进行如下变换:
式中R1450,R1940,R1300,R1800分别表示水分敏感波长1450 nm、1940 nm和不敏感波长1300 nm、1800 nm处的反射率;
在各个温度下,以变换后的32个特征光谱数据建立LS-SVM模型,预测各个温度下未参加建模的15个样品,结果如表4所示。
表4 基于多波长法各温度下模型的预测结果
比较表4和表1可知,采用多波长法建立预测模型的预测均方差都大于在全谱范围内建立的预测模型,但相差不大;通过试验表明,基于多波长法和多尺度小波特征光谱提取法建立模型的预测速度比在全谱范围内预测速度快。
在样品温度为15℃下建模,预测其它温度下的样品,预测均方差如表5所示。
表5 基于多波长法15℃下模型的预测结果
从表5可知,利用特征光谱提取法可较好地消除样品温度对预测结果的影响。15℃模型预测其它温度下土壤含水率的预测值与测量值的关系如图1所示,其中图(a)、(b)、(c)、(d)、(e)、(f)分别为用15℃模型预测温度为30℃、25℃、20℃、15℃、10℃和5℃下土壤含水率的预测值与测量值的关系图,预测值和测量值具有较好的线性关系。
图1 用15℃模型预测其它温度下土壤含水率的预测值与测量值的关系图
(1)采用4阶小波分解尺度,在全谱范围内,用样品温度为20℃的32个样品建立了基于离散小波软阈值消噪和LS-SVM回归方法的土壤含水率近红外定量分析模型,并用此模型预测样品温度为5℃、10℃、15℃、20℃、25℃和30℃的土壤含水率,结果表明:样品温度影响近红外光谱土壤含水率的预测精度。
(2)采用多尺度小波分析提取了近红外原始光谱数据中对温度敏感的数据,从原始光谱数据中减掉温度敏感的数据,应用水分的敏感波长1450 nm、1940 nm和不敏感波长1300 nm、1800 nm等4个波长处的特征光谱数据建立LS-SVM近红外土壤含水率预测模型,试验结果表明,应用多尺度小波特征提取和多波长法能较好地消除样品温度对预测结果的影响,且预测速度较快,为今后田间在线检测土壤含水率提供了理论基础。
[1]肖武,李小昱,李培武,等.基于近红外光谱土壤水分检测模型的适应性[J].农业工程学报,2009,25(3):33-36.
[2]李小昱,肖武,李培武,等.基于近红外傅里叶特征提取方法的土壤含水率检测[J].农业机械学报,2009,40(5):64-67.
[3]孙建英,李民赞,郑立华,等.基于近红外光谱的北方潮土土壤参数实时分析[J].光谱学与光谱分析,2006,26(3):426-429.
[4]Paulo H F,Ronei J P,Joao C de A.Determination of Organic Matter in Soils Using Radial Basis Function Networks and Near Infrared Spectroscopy[J].Analytica Chimica Acta 2002,453:125-134.
[5]Michael L Wh,Lin L,Susan L U.Predicting Water Content Using Gaussian Model on Soil Spectra[J].Remote Sensing of Environment,2004,89:535-552.
[6]Mouazen A M,Baerdemaeker J D,Ramon H.Towards Development of on-Line Soil Moisture Content Sensor Using a Fibre-Type NIR Spectrophotometer[J].Soil& Tillage Research,2005,80:171-183.
[7]Mouazen A M,Maleki M R,Baerdemaeker J D,et al.On-Line Measurement of Some Selected Soil Properties Using a VIS-NIR Sensor[J].Soil& Tillage Research,2007,93:13-27.
[8]蒋焕煜,谢丽娟,彭永石,等.温度对叶片近红外光谱的影响[J].光谱学与光谱分析,2008,28(7):1510-1513.
[9]黄康,汪辉君,徐惠荣,等.基于最小二乘支持向量机的番茄汁糖酸度分析研究[J].光谱学与光谱分析,2009,29(4):931-934.
[10]夏俊芳,李小昱,李培武,等.基于小波变换的柑橘维生素C含量近红外光谱无损检测方法[J].农业工程学报,2007,23(6):170-174.
[11]Kawano S,Sato T,Iwamoto M.Determination of Sugars in Satsuma Orange Using NIR Transmittance[C]//Proceedings of the Fourth International Conference on NIR Spectroscopy,by Ed.Murray I,School of Agriculture,Aberdeen,Scotland,1992.
[12]孙通,应义斌,刘魁武,等.梨可溶性固形物含量的在线近红外光谱检测[J].光谱学与光谱分析,2008,28(11):2536-2539.
[13]李民赞.光谱分析技术及其应用[M].北京:科学出版社,2006:70-71.
[14]高鹏程,张一平,张海,等.温度对土壤水分性状的影响[J].西北林学院学报,2003,8(1):77-79.
[15]Wülfert F,Wim Th K,Age K S.Influence of Temperature on Vibrational Spectra and Consequences for the Predictive Ability of Multivariate Models[J].Anal.Chem,1998,70:1761-1767.
[16]Wülfert F,Wim Th K,Onno E de N,et al.Linear Techniques to Correct for Temperature-Induced Spectral Variation in Multivariate Calibration[J].Chemometrics and Intelligent Laboratory System,2000,51:189-200.
[17]Peirs A,Scheerlinck N,Nicolaǐ B M.Temperature Compensation for Near Infrared Reflectance Measurement of Apple Fruit Soluble Solids Contents[J].Postharvest Biology and Technology,2003,(30):233-248.
[18]张军,陈华才,陈星旦.近红外光谱温度修正定量分析模型的研究[J].光谱学与光谱分析,2005,25(6),890-893.
[19]侯振雨,汤长青,姚树文,等.离散小波变换-支持向量回归方法及其在谷物分析中的应用[J].河南农业科学,2006,(8):40-42.
[20]李世勇,王芳,邵学广.最小二乘支持向量回归与偏最小二乘回归建立烟草总糖NIR预测模型比较[J].烟草科技,2006,(11):45-48.
[21]Chauchard F,Cogdill R,Roussel S,et al.Application of LS-SVM to Non-Linear Phenomena in NIR Spectroscopy:Development of a Robust and Portable SensorforAcidity Prediction in Grapes[J].Chemometrics and Intelligent Laboratory Systems,2004,71:141-150.
[22]王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.
[23]徐志龙,赵龙莲,严衍禄.减小样品温度对近红外定量分析数学模型影响的建模方法[J].现代仪器,2004,(5):29-31.
[24]刘燕德,应义斌.光纤传感技术在水果内部品质检测中的应用研究[J].传感技术学报,2003,(2):170-174.
[25]刘燕德,应义斌,蒋焕煜.基于光纤传感的富士苹果糖度检测试验研究[J].传感技术学报,2003,(3):328-331.