闫姗姗,程旭,宋海燕
(山西农业大学 工学院, 山西 太谷 030801)
基于连续统去除的土壤有机质近红外光谱敏感波段提取研究
闫姗姗,程旭,宋海燕*
(山西农业大学 工学院, 山西 太谷 030801)
摘要:土壤是一个复杂的三相集合体,由土壤中不同物质引起的谱带信息重叠现象非常严重,故通过适当的谱图预处理来提取其敏感波段显得尤为重要。本研究将连续统去除方法引入到土壤有机质敏感波段的提取中,分析了当土壤有机质含量变化时其谱图的变化规律,结果表明:采用连续统去除方法可以很好的提取土壤有机质敏感波段,且以提取的敏感波段600 nm、900 nm和2 210 nm为中心,建立的土壤有机质模型可以较准确的预测土壤有机质含量,其所建模型中预测样本均方根误差MSE为0.286,相关系数R为0.979,均优于全波段所建模型中预测样本的均方根误差3.395和相关系数0.861。连续统去除方法可以很好的提取土壤有机质敏感波段,该研究对土壤有机质快速定量测试仪的研制具有重要意义。
关键词:土壤; 有机质; 连续统去除; 敏感波段; 神经网络
土壤有机质含量是土壤肥力检测的重要指标,采用近红外光谱(Near infrared reflectance,缩写NIR)技术对土壤有机质含量进行检测已开展了大量的研究工作[1~3]。近红外光谱主要反映的是有机物质的倍频和合频吸收[4],土壤是一个复杂的三相集合体[5],故在对土壤有机质进行光谱检测时,土壤中的其他物质将会引起严重的谱带信息重叠,在定性定量分析时,全波段波谱中冗余的信息会直接影响到模型的通用性和精度。因此,在近红外光谱检测中,通过适当的谱图预处理技术来提取其敏感波段显得尤为重要。
为发展土壤有机质快速测定技术,前人已经进行了较多的光谱分析[6~9],表明将土壤有机质含量引入到谱图分析中对其敏感波段的提取及有机质定量预测模型建立的精度、通用性均有影响。
连续统去除是矿物高光谱数据处理中常用的方法之一,它为光谱反射率曲线中反射率峰之间的线性连接部分,描述了不同物质的平均光学路径长度与不同的吸收过程[10],它可以去除土壤中特定物质电子跃迁或分子振动引起的特征吸收带以后的吸收特征,可以使弱的吸收特征得到增强[11],具有去除背景吸收影响,突出分析物质吸收特征的优点[12,13]。
为此,本研究将连续统去除方法引入到土壤有机质敏感波段的提取中,使弱的吸收特征得到增强,去除背景吸收影响,突出土壤有机质的吸收特征。
1材料与方法
实验样本为山西省境内不同植被下的51个土壤样本,前36个土壤样本在太谷县采取,后15个土壤样本在关帝山采取。实验仪器为美国ASD公司的FieldSpec 3便携式光谱仪,光谱仪器配备了外置光源和铟镓砷检测器。实验参数中光谱测量范围为350~2 500 nm,光谱采样间隔为1.500 nm,分辨率为3.500 nm。
将采集回来的土壤样本编号并风干3天后,分别从每个样本中取出一少部分,按照土壤有机质含量标准测试方法处理土样,并进行土壤有机质含量测定,最后测得的有机质含量范围为0.402%~7.92%。
将剩余的土壤样本分别过2.500 mm的标准筛,烘箱烘干并冷却后进行光谱检测。光谱测量时首先将土壤样本置于直径为12.5 cm的培养皿中,然后用三角尺将其表面刮平,最后再放入一自制的暗室内进行光谱采集,光谱采集时通过旋转培养皿(约120°)来获取样本表面不同位置处的光谱图,每一位置扫描3次,3个位置共获得9条谱线,将这9条谱线的平均值作为该样本的最终光谱曲线。
2结果和分析
在本研究中,谱线在1 000 nm左右出现跳跃,根据仪器使用说明,此现象并不会影响到所采集数据的质量,可采用ASD公司ViewSpec软件中的Splice Correction修正功能对数据进行修正,因此,首先采用该方法对谱图进行了预处理。图1为经Splice Correction校正后的土样的原始光谱图。
图1 土壤样本的原始光谱图Fig.1 The original spectra of soil samples
由图1中可以看出,当土壤有机质含量不同时,不同土样的原始光谱特性曲线是有变化的,但整体趋势是一致的,曲线均在1 415、1 920和2 210 nm波段附近有峰值产生。为更明显的体现有机质含量变化引起的谱图变化,把51个土壤样本按有机质含量分6个梯度进行了归类,即有机质含量值分别在0.402%~1.5%,1.5%~2%,2%~2.5%,2.5%~3.5%,3.5~4.5%和4.5%~7.92%之间的样本归类,然后对每个类别的全部光谱数据进行平均,最后得到6个类别的6个光谱数据,在后续敏感波段提取的研究中我们将对这6个光谱数据进行分析。
连续统去除的基本思路是:找出光谱曲线的极大值和最大值点,将最大值点作为连续统的一个端点,通过计算该点与长波方向的各个极大值点所连直线的斜率,找出斜率最大的点作为包络线的下一个端点;再以这一点为起点循环以上步骤,直到最后一点;同时向短波方向也进行类似计算,并选择斜率最小点作为下一端点;最后将这些端点用直线连接即形成连续统,通过计算每个波段的实际反射率与连续统反射率比值,结果即为连续统去除的反射率[11]。本研究中的连续统去除是在ENVI4.8环境内利用Continuum Removed模块实现的,如图2(a)所示,其波段的局部放大图如图2(b)所示。
图2(a) 不同类别有机质含量土壤样本的连续统去除光谱图Fig.2(a) The continuous removal spectra of different kinds of soil samples
图2(b) 波段局部放大图Fig.2(b) Bands of partial enlargement
由图2可以看出:在460、900、1 120、1 415、1 920、2 210和2 350 nm处,均出现明显的吸收峰,但只有900和2 210 nm波段处的连续统去除值会随着有机质含量的升高,呈一定的变化规律,即明显的递增排列规律。故可得出结论:900和2 210 nm波段可能是土壤有机质的敏感波段。
此外,在600 nm波段附近,其连续统去除值有快速上升趋势,且在上升至最高点处其连续统去除值随着有机质含量的升高呈现递减的排列规律。经查阅文献得知,土壤有机质在可见光区域内有一定的敏感波段,是土壤有机质定量分析中必不可少的波段[14~16],鉴于上述分析,本研究将600 nm也视为有机质的敏感波段,开展后续研究工作。
为进一步验证上述波段是土壤有机质的敏感波段,我们将此方法运用到土壤水分敏感波段的提取中。
(1)
在室内,按照公式(1)采用具有相同土壤颜色、土壤质地、土壤结构的土壤壤土样本分别配制了含水率为5%、10%、15%、17%的土壤样本,并采用与前述相同的检测方法和谱图预处理方法对土壤样本进行了光谱检测,图3(a)为随机选取的样本在不同含水率下的归一化谱图,其波段局部放大图如图3(b)所示。
图3(a) 不同含水率土壤样本的连续统去除光谱图Fig.3(a) The normalized spectra of soil samples
图3(b) 波段局部放大图Fig.3(b) Bands of partial enlargement
由图3可以看出:在460、900、1 120、1 415、1 920、2 210和2 350 nm处,均出现明显的吸收峰,但只有1 415和1 920 nm波段处随着土壤含水率的升高其连续统去除值呈一定的排列规律,即递减的排列规律。同样的,其他样本均能得出相同的结论。由文献可知,1 425和1 929 nm是水分子中O—H键在近红外光谱区的两个特征谱带[17,18],而本研究得到的1 415和1 920 nm正好属于该波段附近,由此可见,通过连续统去除可准确得到水分的敏感波段,该结论从另一角度证实了采用连续统去除方法提取土壤有机质敏感波段是可行的。
为了进一步分析提取的600、900和2 210 nm这3个波段对土壤有机质的预测能力,我们采用BP神经网络建立了土壤有机质的定量预测模型。模型建立时,建模样本为35个,验证样本为8个,预测样本为8个。建模样本、验证样本和预测样本的选取都是随机形成的。评价模型好坏的指标为有较高的相关系数(R)和较低的均方根误差(MSE)。
考虑到当检测方法或检测样本不同时,敏感波段会有小范围的波动,建模时我们以上述敏感波段为中心进行了适当的扩大,即以600 nm为中心选用的波段范围为580~620 nm、以900 nm波段为中心选用的波段范围为880~920 nm、以2210 nm为中心选用的波段范围为2 190~ 2230 nm。将上述3个波段范围对应的反射率作为神经网络的输入,土壤有机质含量作为输出值,建立了土壤有机质的预测模型,并与全波段350~2 500 nm建立的模型进行了比较分析。其建模样本、预测样本统计参数见表1。
表1 两种模型的参数比较
均方根误差反映了预测值与真实值之间的变化程度,均方根误差越小说明模型描述实验数据的精确度越高。由表1可以看出,对于验证样本,虽然全波段建模后获得的相关系数略低于3波段模型,但是其均方根误差远远小于3波段模型,因此从验证样本的角度来说,全波段模型要优于3波段模型,但对于预测样本来说,结论则恰恰相反。分析其原因,这可能就是因为当采用全波段建模时冗余的信息影响了模型的通用性。
3讨论与结论
土壤有机质是土壤中各种营养元素特别是氮、磷元素的重要来源,故土壤有机质含量是土壤肥力检测的重要指标。在对土壤有机质进行光谱检测时,通过适当的谱图预处理技术来提取其敏感波段,减少由全波段建模引起的冗余信息显得尤为重要。本研究在土壤有机质敏感波段提取方面开展了研究工作,采用连续统去除方法分析了不同梯度有机质含量的谱图变化规律,研究发现在900和2 210 nm波段处有明显的吸收峰,且随着有机质含量的升高,其连续统去除值呈递增的排列规律,而在其他有明显吸收峰波段处,随着有机质含量的升高,其连续统去除值均没有明显的递增或递减排列规律;在600 nm处有一弱吸收峰,且随着有机质含量的升高,其连续统去除值呈递减的排列规律。
为进一步验证上述波段就是土壤有机质的敏感波段,我们将该方法又运用到土壤水分敏感波段的提取中。分析了同一有机质含量在不同含水率下其谱图的变化规律,结果发现在1 415和1 920 nm波段处其连续统去除值随含水率变化呈递减的变化规律,而在其他有明显吸收峰波段处,随着土壤含水率的升高,其连续统去除值均没有明显的递增或递减排列规律,与前人提出的水分敏感波段接近[17,18],说明采用连续统去除方法提取的土壤有机质敏感波段是可行的。
为了分析提取的敏感波段可否实现土壤有机质含量的定量预测,本研究分别以600、900和2 210 nm为中心,将580~620、880~920和2 190~2 230 nm波段处的反射率作为神经网络输入,建立了土壤有机质的BP神经网络模型,结果表明其预测样本均方根误差MSE为0.286,相关系数R为0.979,优于全波段所建模型,进一步说明了所提敏感波段的准确性。
参考文献
[1]彭杰,张杨珠,庞新安,等. 新疆南部土壤有机质含量的高光谱特征分析[J].干旱区地理, 2010, 33(5): 740-746.
[2]刘焕军,吴炳方,赵春江,等. 光谱分辨率对黑土有机质估算模型的影响[J].光谱学与光谱分析, 2012, 32(3): 739-742.
[3]王延仓,顾晓鹤, 朱金山,等. 利用反射光谱及模拟多光谱数据定量反演北方潮土有机质含量[J].光谱学与光谱分析, 2014, 34(1): 201-206.
[4]章海亮,刘雪梅,何勇. SPA-LS-SVM检测土壤有机质和速效钾研究[J].光谱学与光谱分析, 2014, 34(5):1348-1351.
[5]张雪莲, 李晓娜, 武菊英,等. 不同类型土壤总氮的近红外光谱技术测定研究[J].光谱学与光谱分析, 2010, 30 (4): 906-910.
[6]Wu C Y, Jacobson A R, Laba M, et al. Alleviating moisture content effects on the visible near-infrared diffuse-reflectance sensing of soils[J].Soil science, 2009, 174, 456-465.
[7]刘磊, 沈润平, 丁国香. 基于高光谱的土壤有机质含量估算研究[J].光谱学与光谱分析, 2011, 31(3): 762-766.
[8]贺军亮, 蒋建军. 土壤有机质含量的高光谱特性及其反演[J].中国农业科学, 2007, 40(3): 638-643.
[9]田永超, 张娟娟, 姚霞, 等. 基于近红外光谱的土壤有机质含量定量建模方法[J].农业工程学报, 2012, 28(1): 145-152.
[10]刘庆杰, 蔺启忠, 王钦军, 等. 基于连续统快速傅里叶变换的红外光谱处理技术[J].光谱学与光谱分析, 2009, 12(12): 3279-3282.
[11]吴昀昭. 南京城郊农业土壤重金属污染的遥感地球化学基础研究[D].南京: 南京大学, 2005.
[12]杨可明, 郭达志. 植被高光谱特征分析及其病害信息提取研究[J].地理与地理信息科学, 2006, 22 (4): 31-34.
[13]武中臣, 徐晓轩, 张静,等. 近红外差谱法选择信息区提高同分异构体预测模型准确度[J].光谱实验室, 2005, 22 (1): 38-41.
[14]Mervian St Luce, Noura Ziadi, Bernie J Zebarth, et al. Rapid determination of soil organic matter quality indicators using visible near infrared reflectance spectroscopy[J].Geoderma, 2014, 232-234: 449-458.
[15]宋海燕, 秦刚, 韩小平,等. 基于可见光谱的不同质地土壤有机质快速测定[J].农业机械学报, 2012, 43(7): 69-72.
[16]陈旭. 水分对土壤有机质近红外光谱检测影响的研究[D].晋中: 山西农业大学, 2014.
[17]宋海燕, 陈旭. 水分对土壤近红外光谱检测影响的二维相关光谱解析[J].光谱学与光谱分析, 2014, 34(5): 1240-1243.
[18]姚艳敏, 魏娜, 唐鹏钦, 等. 黑土土壤水分高光谱特征及反演模型[J].农业工程学报, 2011, 27(8): 95-100.
(编辑:李晓斌)
Study on the ertraction of sensitive band of soil organic matter near infrared spectrum based on continuum removal
Yan Shanshan, Cheng Xu, Song Haiyan*
(CollegeofEngineering,ShanxiAgriculturalUniversity,Taigu030801,China)
Abstract:The soil is a complex three phase aggregate and the overlapping bands of information caused by its different substances is very serious. Therefore, it is important to extract the sensitive bands through appropriate spectrum processing. The continuum removal method was introduced to extract the sensitive wave bands of soil organic matter and analyse the changing rules of the spectra with the changing of soil organic matter content. In order to further verify that these bands are the sensitive bands of soil organic matter, we applied this method to the extraction of soil moisture sensitive bands, the results were close with previous proposed moisture sensitive wavelengths. Then the soil organic matter prediction model was established by using BP neural network, the 600 nm, 900 nm and 2210 nm as the center of sensitive wavelengths, the results were the root mean square error was 0.286 and the correlation coefficient was 0.979, they were better than the whole band the root mean square error 3.395 and correlation coefficient 0.861. It indicated that it was feasible to extract the sensitive bands of organic matter by using the continuum removal method. It was of great significance to the development of rapid quantitative test instrument of soil organic matter.
Key words:Soil; Organic matter; Continuum removal; Sensitive bands; Neural
中图分类号:S153.6+21
文献标识码:A
文章编号:1671-8151(2016)01-0072-05
基金项目:国家自然科学基金项目(41201294);山西省科技攻关项目(20130313010-6)
通讯作者:*宋海燕,教授,博士,硕士生导师。Tel:0354-6288400;E-mail:yybbao@163.com
作者简介:闫姗姗(1989-),女(汉),山西长治人,硕士研究生,研究方向:农田及农副产品信息采集及相关技术
收稿日期:2015-11-09修回日期:2015-11-23