基于连续统去除法的南疆水稻土有机质含量预测①

2016-07-19 07:33向红英柳维扬王家强迟春明牛建龙
土壤 2016年2期
关键词:预测

向红英,柳维扬,彭 杰*,王家强,迟春明,牛建龙

(1 塔里木大学经济与管理学院资源与环境经济研究所,新疆阿拉尔 843300;2 塔里木大学植物科学学院,新疆阿拉尔 843300)



基于连续统去除法的南疆水稻土有机质含量预测①

向红英1,柳维扬2,彭杰2*,王家强2,迟春明2,牛建龙2

(1 塔里木大学经济与管理学院资源与环境经济研究所,新疆阿拉尔843300;2 塔里木大学植物科学学院,新疆阿拉尔843300)

摘要:监测土壤有机质含量状况,可为土壤肥力诊断及土壤资源的合理开发利用提供科学依据。本研究通过对南疆191个水稻土样品的反射率数据进行连续统去除处理后,构建了有机质连续统去除光谱指数并提取了850 ~1 380、1 380 ~ 1 550、1 730 ~ 2 150、2 150 ~ 2 380 nm 4个波段的吸收特征参数,据此建立了多种定量反演模型。结果表明:经连续统去除后,有机质的吸收特征得到了有效放大,不同有机质含量的连续统去除曲线在850 ~ 1 380 nm,其有机质含量与连续统去除值呈正相关,与吸收面积呈负相关,而在1 730 ~ 2 150 nm波段则呈现相反的规律。反射率连续统去除值与有机质含量的相关性要优于反射率与之的相关性,而反射率一阶微分与连续统去除一阶微分与有机质的相关性差异不明显。不同有机质光谱指数模型之间的建模参数与预测能力差异不大,但均只具备初略估测有机质的能力。吸收特征参数模型中,仅有850 ~ 1 380 nm 波段的面积归一化最大吸收深度(NMAD850~1380nm)所建模型具有较好的定量预测能力。以反射率、反射率连续统去除、反射率一阶微分、反射率连续统去除一阶微分所建的PLSR模型均具有较好的预测能力,相对分析误差均大于2.00。所有模型中,连续统去除一阶微分(CR′)模型的决定系数与相对分析误差最高,分别为0.91、2.58,均方根误差最低,其值为5.62,具有最好的预测能力。

关键词:连续统去除;高光谱;水稻土;有机质含量;预测

土壤有机质既是植物养分的主要来源,也是土壤肥力诊断的核心指标。准确、快速地监测其含量,对于土壤肥力评价、土壤资源合理规划、农业产业结构的调整与布局等方面具有重要意义。传统的有机质化学测定方法虽然具有较高的精度,但因其费时、费力、成本高、环保性差等方面的不足,无法满足现代农业精准变量施肥的要求,同时也很难实现大面积土壤有机质的快速、动态监测。光谱技术的出现,为解决这一瓶颈问题提供了新的思路与途径。可见光-近红外光谱已经成为一种快速、低廉、高效的预测土壤属性的技术[1]。众多研究表明,400 ~ 1 000 nm是有机质主要的光谱响应区域[2-8],具有对有机质进行定量分析的潜力。目前,在我国不同地区进行了大量关于土壤有机质高光谱定量反演的研究[9-15],但不同地区因土壤母质、成土过程、有机质组成等方面的差异,造成有机质敏感波段存在不确定性[16],所建反演模型也不尽相同。因此,目前针对土壤有机质的定量反演还是以区域性研究为主。但是,就全国范围而言,南疆的类似报道较少,特别是关于南疆水稻土有机质高光谱定量反演模型构建方面的报道。

有机质定量反演模型的精度是其有效性与适用性的关键因素。光谱数据处理作为提高模型反演精度的有效途径之一,已经得到了广泛的应用。连续统去除具有消除不相关背景信息、增强感兴趣吸收特征的作用,可明显改善具有吸收特征地物的光谱数据与属性数据之间的相关性,从而提高模型的反演精度。龚绍琦等[17]利用光谱一阶微分、倒数对数和连续统去除法数据,建立了滨海盐土重金属含量高光谱反演模型,结果表明以一阶微分处理的模型精度最高。李晓明等[18]研究表明土壤反射率经连续统去除后,可提高盐分的预测精度。彭杰等[19]利用连续统去除数据研究了土壤盐分的预测,表明以 640 ~ 700 nm 波段连续统去除数据构建的模型对南疆水稻土盐分含量具有很好的反演效果。谢伯承等[20]利用导数光谱法和连续统去除法预测土壤有机质含量,得出光谱特征吸收面积与有机质含量有较好的相关,达到 0.01 显著水平。从国内外研究现状来看,连续统去除法虽然在植物长势监测、矿物鉴定、土壤盐分与有机质的高光谱特征及定量反演方面均有一定的报道,但关于系统地利用连续统去除数据及其不同变换形式以及由其构建的光谱指数来探讨有机质的高光谱特征与反演方面的报道甚少,有待于进一步深入研究。

综上,本研究以南疆水稻土为研究对象,以有机质为研究因子,利用反射率的连续统去除数据探讨有机质的高光谱特征,并建立连续统去除数据及其不同变换形式、光谱指数、吸收特征参数的有机质定量反演模型,以期为南疆水稻土有机质的高光谱遥感监测提供一定的理论基础和参考依据。

1 材料与方法

1.1土样的采集与处理

土壤类型为水稻土,根据代表性、典型性和集中性原则,选取新疆维吾尔自治区阿克苏地区的温宿县、拜城县以及和田地区的和田县为采样区域。采用网格采样法,样点距离为50 m左右,采样深度为0 ~20 cm。每个土样采集重量为2 kg左右,共采集土样191个,其中温宿县112个,和田县58个,拜城县21个。土样带回实验室后,清除小石块及作物残留物等非土壤成分物质,于实验室自然风干。风干后的样品经研磨过10、100目,分别用于光谱测试和有机质含量的测定。

1.2土样的测试项目与方法

采用重铬酸钾容量法-外加热法测定土壤有机质含量,每个土样设3个重复,重复间相对误差控制在5%以内,取3个重复的平均值为其测定值。本次共191个供试土样,随机分成建模组与预测组,其中建模组141个样本,预测组50个样本,有机质含量数据见表1。由表1可知,不同土样的有机质含量变化范围较大,具有较大的标准差和变异系数,这有利于模型的构建,所建模型也更具普适性。

表1 土壤有机质含量统计特征Table 1 Statistic characteristics of soil organic matter contents

1.3土样光谱测试

采用美国ASD公司的FieldSpec Pro FR型光谱仪进行土壤的室内测试,该仪器波长范围为 350 ~2 500 nm,光谱分辨率分别为3 nm(350 ~ 1 000 nm)和10 nm(1 000 ~ 2 500 nm),采样间隔为1 nm。光源是功率为50 W的卤素灯,距土壤样品表面70 cm,天顶角30°。土壤样本放置于直径10 cm、深1.5 cm、内部全部涂黑的培养皿内,用直尺将土样表面刮平。传感器探头位于土壤样本表面垂直上方15 cm处,采用25°视场角探头。测试之前先进行白板校正。每个土样采集4个不同方向的光谱曲线,每个方向之间相隔90°,算术平均后得到该土样的实际反射光谱数据。

1.4光谱数据处理及吸收特征参数提取

每个土样的光谱曲线去除噪声较大的边缘波段350 ~ 399 nm和2 400 ~ 2 500 nm。采用小波去噪法对土壤光谱进行滤波去噪,小波去噪由MATLAB软件实现。数据变换包括一阶微分处理和连续统去除处理。

连续统去除处理后,提取出如下几个典型吸收特征:吸收峰总面积(absorption peak total area,APTA),即为吸收峰的积分面积;最大吸收深度(maximum absorption depth,MAD),即为吸收峰内连续统去除的最小值;面积归一化最大吸收深度(normalization maximum absorption depth area,NMAD),即为最大吸收深度与吸收峰总面积的比值[21]。

1.5有机质光谱指数构建

根据相关性分析结果,选择连续统去除的可见光最大负相关波段600 nm、近红外最大正相关波段950 nm构建连续统去除归一化指数( normalized index of continuum removal,NICR)、连续统去除差值指数(difference index of continuum removal,DICR)、连续统去除比值指数(ratio index of continuum removal,RICR)。

式中:CR610、CR950表示600、950 nm波段的连续统去除值。

1.6模型构建与精度评价

建模方法采用光谱分析中最常用的偏最小二乘回归(partial least squares regression,PLSR),模型验证方法采用交叉验证法。模型精度采用决定系数(R2)、相对分析误差(relative percent deviation,RPD)、均方根误差(root mean square error,RMSE) 3个指标来评价。建模时,随机选择141个样本用于建模,剩余的50个样本用于预测模型。

此外,目前普遍认为,当1.5<RPD<2时表明模型只能对样品高含量与低含量进行粗略估测,当2.0<RPD<2.5时表明模型具有较好的定量预测能力,当 2.5<RPD<3.0时模型具有很好的预测能力,当RPD>3.0时模型具有极好的预测能力[22]。

2 结果与分析

2.1土壤有机质的高光谱特征

图1为不同有机质含量土样的光谱特征曲线。由图1A可以看出,不同有机质含量土样的反射率曲线在400 ~ 900 nm范围内表现出较大的差异,该波段内反射率随有机质含量的增加而降低;同时,在500 ~800 nm波段,低有机质含量土样的曲线具有明显的反射峰,高有机质含量的土样不明显;900 nm波段以后,不同有机质含量曲线之间的反射率差异不如400 ~ 900 nm波段明显,且有机质含量与反射率大小之间没有明显的规律性;在1 400、1 900、2 300 nm波段出现明显的吸收特征,其中,1 900 nm处的吸收深度、吸收面积与有机质含量呈现出正相关趋势,其余两处不明显。

图1 不同有机质含量土样反射率(A)与连续统去除(B)曲线Fig. 1 Reflectance curves (A) and continuum removal curves of soils with different soil organic matter contents

反射率经连续统去除后(图 1B),吸收特征得到了明显放大,如500、770 nm的微弱吸收带在连续统去除曲线中可以观察出来,而在反射率曲线中则不明显。不同有机质含量的连续统去除曲线具有4个典型的吸收特征波段,即850 ~ 1 380、1 380 ~1 550、1 730 ~ 2 150、2 150 ~ 2 380 nm。其中,在850 ~ 1 380 nm,有机质含量与连续统去除值呈正相关,与吸收面积呈负相关,而在1 730 ~ 2 150 nm波段则呈现相反的规律,其余两吸收处无明显规律。

2.2土壤有机质与光谱参数的相关性分析

图2为土壤有机质含量与土壤反射率(R)、反射率一阶微分(R′)、反射率连续统去除(CR)、反射率连续统去除一阶微分(CR′)的相关系数曲线。由图2可以看出,土壤反射率与有机质含量在整个波长范围内均呈负相关,在400 ~ 890 nm达到极显著水平,最大相关系数出现于600 nm左右,但绝对值低于0.6。反射率连续统去除相对于反射率而言,相关性得到了明显改善,达极显著水平波段显著增加,特别在850 ~1 300 nm波段出现一个高相关系数平台,相关系数在0.7 ~ 0.8间变动,最大相关系数位于950 nm附近,达到0.81;此外,在1 400、1 900、2 200、2 300 nm波段也具有明显的相关系数峰,其中1 400 nm处的相关性优于其他3个波段。在可见光部分,反射率一阶微分与有机质含量的相关性要稍优于连续统去除一阶微分与有机质含量的相关性,尤其是在可见光波段的660、820 nm附近,而在近红外波段,则是后者要好于前者。

2.3有机质反演模型的构建

表2为连续统组合光谱指数、吸收特征参数、反射率连续统去除及其一阶微分、反射率及其一阶微分的建模参数。其中,单变量采用直线回归(LR)建模,多变量采用偏最小二乘回归(PLSR)建模,PLSR模型的建模波段均为400 ~ 2 400 nm。由表2可知,所有19个模型中,除 APTA1380~1550nm、APTA1730~2150nm、APTA2150~2380nm、MAD1730~2150nm、MAD2150~2380nm、NMAD1380~1550nm、NMAD1730~2150nm、NMAD2150~2380nm 这8个模型外,其余模型均达极显著水平。总体比较来看,光谱指数模型与PLSR模型具有较好的建模效果,所有模型均达到了极显著水平,RMSE都小于9.00;而以吸收特征参数建立的模型,仅有 850 ~1 380 nm波段具有较好的效果,R2大于0.55,RMSE 在 9.40以下,其余波段提取的特征参数所建模型除MAD1380~1550nm外,R2均未达到显著水平,且 RMSE均大于13.00。由表2还可以看出,反射率经连续统去除处理后,模型的精度得到了有效的改善,R2由0.65提高到0.76,RMSE由8.31降低至6.83,但反射率连续统去除一阶微分与反射率一阶微分相比较而言,反射率一阶微分的建模精度要稍高于反射率连续统去除一阶微分。在所有模型中,以反射率一阶微分建立的PLSR模型的R2最高、RMSE最低,分别为0.81、6.07。

图2 有机质含量与光谱参数的相关性曲线Fig. 2 Correlations between soil organic matter contents and spectral parameters

表2 不同光谱参数的建模效果Table 2 Determination coefficients and RMSEs of models established with different spectral indexes

2.4不同反演模型的验证与比较

表3为50个验证样本对模型预测与稳定性的检验结果。由表3可以看出,光谱指数、反射率连续统去除及其一阶微分、反射率及其一阶微分所建的PLSR模型均通过了极显著水平检验,而以吸收特征参数所建模型的预测能力普遍欠佳,仅 850 ~1 380 nm波段的吸收特征参数具有较好的效果。在以光谱指数建立的模型中,各模型的R2、RMSE、RPD均无明显差异,R2均为0.75左右,RMSE均在8.90左右,RPD均在1.63左右。以吸收特征参数建立的模型中,不同波段提取的特征参数所建模型的预测效果存在明显差异,850 ~ 1 380 nm波段的吸收峰面积(APTA)、最大吸收深度(MAD)、归一化最大吸收深度(NMAD)模型的R2均在0.75以上,RMSE均小于8.30,RPD均在1.75以上,而其余3个波段的特征吸收参数模型,虽然有的 R2也达到了极显著水平,但RMSE普遍大于13.00,RPD均小于1.50,模型的预测能力和稳定性欠佳。反射率经连续统去除处理后,R2明显提高,RMSE更低,RPD也由2.04增加到2.23,同时,反射率一阶微分与连续统去除一阶微分相比较而言,虽然建模效果前者好于后者,但模型的预测能力和稳定性不如后者。所有模型中,光谱指数所建3个模型、APTA850~1380nm、MAD850~1380nm模型的RPD在1.50 ~ 2.0,表明模型只能对样品有机质高含量与低含量进行粗略估测;NMAD850~1380nm、R、CR、R′所建模型的RPD在2.0 ~ 2.5,模型具有较好的定量预测能力;仅有CR′ 模型的RPD在2.5 ~ 3.0,该模型对土壤有机质含量具有很好的预测能力。

3 小结

不同有机质含量的土壤反射率连续统去除曲线显示,在 850 ~ 1 380 nm 波段,土壤有机质含量与反射率连续统去除值呈正相关,与吸收面积呈负相关,而在 1 730 ~ 2 150 nm 波段则呈现相反的规律。土壤有机质含量与光谱数据的相关性分析表明,反射率经连续统去除处理后,与有机质含量的相关性得到了明显改善,特别是在 850 ~ 1 300 nm 波段出现一个高相关系数平台,相关系数在 0.7 ~ 0.8 间变动。反射率一阶微分与连续统去除一阶微分在与有机质含量相关性方面的差异不大。

表3 不同模型的预测效果Table 3 Accuracies of different SOM prediction models

通过比较不同模型的 R2、RMSE、RPD后表明,不同光谱指数模型之间的差异不明显,预测集的 R2均在0.75 左右,RMSE 均在 8.90 左右,RPD 均在1.63 左右。以 850 ~ 1 380、1 380 ~ 1 550、1 730 ~2 150、2 150 ~ 2 380 nm 这 4 个波段提取的 APTA、MAD、NMAD 参数所建立的模型中,以 850 ~ 1 380 nm的吸收特征参数模型明显要优于其他波段,尤其是NMAD850~1380nm所建模型预测集的 R2达到 0.86,RPD 达到 2.29。反射率经连续统去除处理后,R2明显提高,RMSE 更低,RPD 也由 2.04 增加到 2.23。反射率一阶微分与连续统去除一阶微分相比较而言,虽然建模效果前者好于后者,但模型的预测能力和稳定性不如后者。所有模型中,CR′ 模型的 R2与 RPD最高,分别为 0.91、2.58,RMSE 最低,为 5.62,具有最好的预测能力,可推荐为南疆水稻土有机质的高光谱定量反演模型。

参考文献:

[1] Islam K, Singh B, Mcbratney A. Simultaneous estimation of several soil properties by ultra-violet, visible, and nearinfrared reflectance spectroscopy[J]. Soil Research. 2003,41(6): 1 101-1 114

[2]He T, Wang J, Lin Z J, et al. Spectral features of soil organic matter[J]. Geo-spatial Information Science, 2009,12(1): 33-40

[3] 彭杰, 张扬珠, 周清, 等. 去除有机质对土壤光谱特性的影响[J]. 土壤, 2006, 38(4): 453-458

[4] 刘炜, 常庆瑞, 郭曼, 等. 不同尺度的微分窗口下土壤有机质的一阶导数光谱响应特征分析[J]. 红外与毫米波学报, 2011, 30(4): 316-321

[5]Galvao L S, Vitorello Ĺ. Variability of laboratory measured soil lines of soils from southeastern Brazil[J]. Remote Sensing of Environment, 1998, 63: 166-181

[6]卢艳丽, 白由路, 杨俐苹, 等. 高光谱的土壤有机质含量预测模型的建立与评价[J]. 中国农业科学, 2007, 40(9):1 989-1 995

[7] Krishnan P,Alexander J D,Butler B J.Reflectance technique for predicting soil organic matter[J]. Soil Science Society of America Journal, 1980, 44(6): 1 282-1 285

[8] Gunsaulis F R,Kocher M F,Griffis C L. Surface structure effects on close-range reflectance as a fu-nction of soil organic matter content[J]. American Society of Agricultural and Biological Engineers, 1991, 34(2): 641-649

[9] 卢艳丽, 白由路, 杨俐苹, 等. 东北平原不同类型土壤有机质含量高光谱反演模型同质性研究[J].植物营养与肥料学报, 2011, 17(2): 456-463

[10] 刘娇, 李毅, 刘世宾. 光谱测定黑河上游土壤有机质的预测模型[J]. 光谱学与光谱分析, 2013, 33(12): 3 354-3 358

[11] 刘焕军, 张柏, 赵军, 等. 黑土有机质含量高光谱模型研究[J]. 土壤学报, 2007, 44(1): 27-32

[12] 刘磊, 沈润平, 丁国香. 基于高光谱的土壤有机质含量估算研究[J]. 光谱学与光谱分析, 2011, 31(3): 762-766

[13] 王延仓, 顾晓鹤, 朱金山, 等. 利用反射光谱及模拟多光谱数据定量反演北方潮土有机质含量[J]. 光谱学与光谱分析, 2014, 34(1): 201-206

[14] 徐明星, 周生路, 丁卫, 等.苏北沿海滩涂地区土壤有机质含量的高光谱预测[J].农业工程学报, 2011, 27(2):219-223

[15] 彭杰, 张杨珠, 庞新安, 等. 新疆南部土壤有机质含量的高光谱特征分析[J]. 干旱区地理,2010,33(5): 740-746

[16] 纪文君, 史舟, 周清, 等. 几种不同类型土壤的VIS-NIR光谱特性及有机质响应波段[J]. 红外与毫米波学报,2012, 31(3): 277-282

[17] 龚绍琦, 王鑫, 沈润平, 等. 滨海盐土重金属含量高光谱遥感研究[J]. 遥感技术与应用, 2010, 25(2): 169-177

[18] 李晓明, 韩霁昌, 李娟. 典型半干旱区土壤盐分高光谱特征反演[J]. 光谱学与光谱分析, 2014, 34(4): 1 081-1 084

[19] 彭杰, 迟春明, 向红英, 等. 基于连续统去除法的土壤盐分含量反演研究[J]. 土壤学报, 2014, 51(3): 459-469

[20] 谢伯承, 薛绪掌, 刘伟东, 王纪华, 王国栋. 基于包络线法对土壤光谱特征的提取及其分析[J]. 土壤学报, 2005,42(1): 171-175

[21] 张雪红, 刘绍民, 何蓓蓓. 基于包络线消除法的油菜氮素营养高光谱评价[J]. 农业工程学报, 2008, 24(10):151-155

[22] Saeys W, Mouazen A M, Ramon H. Potential for onsite and online analysis of pig manure using visible and near infrared reflectance spectroscopy[J]. Biosystem Engineering,2005, 91(4): 393-402

Predicting Organic Matter Content in Paddy Soil Using Method of Continuum Removal in Southern Xinjiang, China

XIANG Hongying1, LIU Weiyang2, PENG Jie2*, WANG Jiaqiang2, CHI Chunming2, NIU Jianlong2
(1 Institute of Resource and Environmental Economics, College of Economics and Management, Tarim University, Alar, Xinjiang 843300, China; 2 College of Plant Science, Tarim University, Alar, Xinjiang843300, China)

Abstract:Monitoring soil organic matter(SOM) content can provide scientific basis for soil fertility diagnosis and rational utilization of soil resources. Through continuum removal process on reflectance curves of 191 soil samples from southern Xinjiang, SOM continuum removal spectral indexes were constructed and four absorption parameters were identified in accordance with 850-1380, 1380-1550, 1730-2150 and 2150-2380 nm, respectively. Subsequently, a number of quantitative inversion models were established to illustrate SOM contents. The results showed that absorption characteristics of SOM were amplified owing to the continuum removal reflectance, and SOM content was positively correlated with continuum removal values and negatively correlated with absorption area in 850-1380 nm, however, inverse correlations were observed in 1730-2150 nm. Additionally, the correlation between SOM content and values of continuum removal reflectance was better than that between SOM content and reflectance, meanwhile, the correlation between SOM content and first derivative of continuum removal reflectance was not significantly different from that between SOM content and first derivative of reflectance. As a whole,there were no significant differences in predictive accuracies when using exponential models based on SOM spectral indexes, and these models could estimate roughly SOM content. The model generated by NMAD850-1380nm(normalization maximum absorption depth area in 850-1380 nm) could predict SOM content better among all models based on absorption characteristic parameters. All of the PLSR models, which were established based on reflectances(R), continuum removal(CR), first derivative of reflectance (R′) or first derivative of continuum removal reflectance (CR′) values, respectively, could predict SOM content with all RPD values higher than 2.00, while the CR′ model was the best with highest R2(0.91) and RPD (2.58) but lowest RMSE (5.62).

Key words:Continuum removal; Hyperspectral; Paddy soil; Soil organic matter content; Predicting

中图分类号:TP701;S151. 9

DOI:10.13758/j.cnki.tr.2016.02.027

基金项目:①国家自然科学基金项目(41271234;41061031;41261083;41361048)资助。

* 通讯作者(pjzky@163.com)

作者简介:向红英(1980—),女,湖南常德人,助理研究员,主要从事干旱区资源与环境的遥感监测与评价方面的研究。E-mail: hongyingxiang @163.com

猜你喜欢
预测
无可预测
基于PCC-CNN-GRU的短期风电功率预测
选修2—2期中考试预测卷(A卷)答案与提示
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
选修2—2期中考试预测卷(B卷)答案与提示
“预测”得准
不必预测未来,只需把握现在