多光谱遥感结合随机森林算法反演耕作土壤有机质含量

2020-07-10 04:44刘焕军张美薇杨昊轩张新乐孟祥添李厚萱唐海涛
农业工程学报 2020年10期
关键词:输入量反射率波段

刘焕军,张美薇,杨昊轩,张新乐,孟祥添,李厚萱,唐海涛

多光谱遥感结合随机森林算法反演耕作土壤有机质含量

刘焕军,张美薇,杨昊轩,张新乐※,孟祥添,李厚萱,唐海涛

(东北农业大学公共管理与法学院,哈尔滨 150030)

土壤有机质(Soil Organic Matter,SOM)遥感反演一般以单期影像作为输入量,为研究多时相影像遥感结合随机森林提高SOM遥感反演精度的可能性,该研究以黑龙江省农垦总局胜利农场耕地范围为研究区,以Sentinel-2A和Landsat 8影像作为数据源,获取两期裸土遥感影像,构建光谱指数,以随机森林算法筛选波段和光谱指数作为输入量,构建SOM反演模型。结果表明:1)两期影像的SOM反射光谱响应波段包括二者共有的中心波长:约560、660、850 nm,以及Sentinel-2A特有的中心波长740 nm 4个波段;2)基于单期影像最佳波段和光谱指数,Sentinel-2A影像SOM最优反演模型2为0.913,均方根误差为0.860 g/kg,精度高于Landsat 8影像反演模型;3)单期影像最佳波段引入光谱指数,相比以最佳波段作为输入量,使SOM最优反演模型的均方根误差分别提高了28.867%和8.722%;4)引入时相信息,基于单期和两期影像波段和光谱指数,SOM最优反演模型精度由高到低为两期影像(2为0.938,均方根误差1.329 g/kg)、Sentinel-2A影像(2为0.935,均方根误差为1.944g/kg)、Landsat 8影像(2为0.922,均方根误差2.022g/kg),两期影像SOM最优反演模型的稳定性和精度略高于单期影像。研究结果证明了Sentinel-2A影像数据以及多时相裸土影像反演SOM的优势。

土壤;有机质;光谱;随机森林;时相信息;Sentinel-2A;反演精度

0 引 言

土壤有机质(Soil Organic Matter,SOM)是土壤肥力和质量的主要决定因素和指标,与土壤生产力密切相关,因此探测SOM含量是了解土壤肥力的重要途径[1-3]。由于土壤光谱反射率与SOM含量呈显著负相关[4-6],因此可以由土壤反射光谱特征的差异来反映SOM含量,并且利用土壤样点的地表反射率及其数学变化,构建多种光谱指数,为SOM含量的快速预测提供了有效的途径[7-9]。

地统计分析法是传统的SOM空间预测与制图的方法。地统计学是基于区域化变量理论和变异函数模型,以具有空间相关性和依赖性在空间分布上既有随机性又有结构性的自然现象为研究对象的科学[6]。但是其反演精度往往受到样本密度和样本变异程度的限制,只有具有足够数量和密集的样本才能获得准确的SOM空间分布图。近年来随着遥感技术水平的不断提高与成熟,由于土壤光谱学证明了SOM对反射率光谱具有独特的光谱响应区域,这为SOM遥感反演的发展奠定了基础。其方法是在研究土壤光谱反射特征的基础上,通过地面实测数据,分析采样点的遥感影像光谱反射率的变化,建立SOM反演模型,实现研究区域SOM空间预测与制图。而现有的SOM遥感反演研究也多结合景观环境因子作为辅助变量以提高SOM的反演精度。目前,已有很多研究运用普通克里格模型[10]、混合克里格模型[11]、多元线性回归模型[12]、偏最小二乘回归模型[13-14]、人工神经网络模型[15-16]等方法进行SOM空间预测分析与制图。此外,随机森林(Random Forest,RF)算法,它是通过集成学习的思想将多棵树集成的一种算法。RF模型具有较高的预测精度,随机性的引入,使得RF不容易陷入过拟合,并且具有很好的抗噪声能力。

目前,将RF算法运用到SOM空间预测的研究仍在不断的探索中[17-18],但是已有的相关研究多基于较大空间分辨率的遥感影像、单期或者未使用影像来探究SOM的预测精度。Yang等[19]分别以RF模型和回归树模型对高山生态系统的SOM进行了反演。王茵茵等[20]以榆阳区的不同地貌区为例,利用不同空间分辨率Modis遥感影像数据,运用RF算法对表层SOM进行了模拟预测。韩杏杏等[21]以河南省辉县市耕地资源管理单元图斑中心点为基础数据,以土壤类型作为辅助定性变量,利用RF模型预测SOM的含量。此外,基于卫星遥感的SOM反演研究也多以单幅影像作为输入量,屈冉等[22]以富川县为研究区,运用单幅Landsat TM影像,分析了光谱亮度值(Digital Number,DN)与SOM之间的回归关系。王锐等[23]以Landsat 8遥感影像和SOM实测样本为数据源,以重庆市江津区为研究对象,采用多元回归分析的方法,建立SOM反演模型。顾晓鹤等[24]以环境小卫星超光谱影像和SOM实测样本为数据源,筛选SOM响应的敏感波段与特征组合算法,建立基于HSI影像的SOM反演模型。

现有SOM遥感反演模型研究一般利用单期影像,结合不同景观环境因子作为输入量,探究其对SOM反演精度的影响,以及精度的变化。但是由于单期影像可能受降水、秸秆覆盖、表面形态等因素影响,影像特征反映的是部分地区的异常状况,导致遥感影像部分地区地物反射率异常,降低SOM反演模型的稳定性与精度。为了更好地探究耕地SOM的反演精度,以胜利农场裸土时期耕地为研究对象,利用遥感卫星周期性、动态性地对地表信息进行监测,有效地避免单时相影像所反映地物信息的局限性,采用了较高空间分辨率的Sentinel-2A和Landsat 8卫星遥感影像作为数据源,基于RF算法,引入多时相数据结合,构建光谱指数,逐步筛选最佳输入量,建立考虑时相信息的SOM遥感反演模型,并实现SOM空间预测与制图。

1 材料与方法

1.1 研究区概况与数据来源

胜利农场是黑龙江省国营农场,位于饶河县境内,地处饶力河下游的冲积平原地带,中东部山丘起伏。地理坐标为:133°34′~134°09′E,47°13′~47°32′N,地势整体相对平坦。研究区耕地范围面积约为456.838 hm2,此区域土壤肥沃,物理结构良好,黑土层在20 cm以上,土壤有机含量高。年有效积温2 400 ℃,年降水量590 mm,适宜各类农作物生长,以种植水稻、小麦、玉米、大豆为主,作物一年一季。研究区10月末-11月中旬(未降雪)为裸土期,为遥感提取地表信息提供了有利条件。

本研究所使用的耕地土壤样本点于2017年11月4日进行野外采集,在研究区范围内进行GPS定位,样本点位置的确定同时兼顾了地形特征等信息,共计获得162个野外实测样本,并记录其坐标和地形等相关信息,其空间分布如图1所示。室内将土壤称量后研磨、风干,过2 mm筛,用重铬酸钾容量法测定SOM含量。分析162个采样点SOM含量数据,结果表明,最小值为27.6 g/kg、最大值为44.4 g/kg、极差为16.8 g/kg、均值为35.73 g/kg、标准差为3.00 g/kg。

1.2 影像数据介绍与处理

分别获取裸土时期(2018年11月6日)Sentinel-2A影像(https://code.earthengine.google.com/)和(2017年11月9日)Landsat 8影像(http://ids.ceode.ac.cn/query.html)进行SOM反演研究。Sentinel-2A影像为经过几何校正和大气处理的地表反射率数据,其中波段1为气溶胶波段,波段10为反映大气波段,故在运算过程中去除这2个波段;Landsat 8影像使用ENVI5.1进行辐射定标、大气校正(大气校正后的结果为扩大了10 000倍的地表反射率数据),然后将多光谱影像的波段1~7和波段8(15 m分辨率全色波段)融合成分辨率为15 m的影像[25]。又将Sentinel-2A和Landsat 8影像空间重采样为10 m分辨率(Sentinel-2A通过SNAP完成,Landsat 8通过ENVI完成)。Sentinel-2A 影像的波段2、3、4、8、11、12分别与Landsat 8影像的波段2~7相对应,如表1所示,其中Sentinel-2A波段5、6、7为Landsat 8不具有的波段。

图1 研究区土壤采样点分布图

表1 Sentinel-2A与Landsat 8波段参数信息

1.3 光谱指数的构建

单期影像光谱指数的构建:定义波段反射率为ρ,对Sentinel-2A和Landsat 8影像数据波段反射率进行数学变换,得到反射率差D(即ρρ),反射率比R(即ρ/ρ),其中,、均为波段的代号。

多期影像光谱指数的构建方法:不同时期的相同波段差为D_ρ,不同时期的相同波段比为R_ρ,不同时期的某一波段差与另一波段差的差D_ρ,不同时期的某一波段差与另一波段差的比R_ρ,各光谱指数具体计算方法如下:

D-Tn_ρ=D_ρD_ρ(1)

R-Tn_ρ=R_ρ/R_ρ(2)

D-Tn_ρ=D_ρD_ρ(3)

R-Tn_ρ=D_ρ/D_ρ(4)

式中ρ表示波段反射率;ρ表示波段反射率;表示Sentinel-2A影像的日期;为Landsat 8影像的日期。

1.4 最佳输入量筛选与SOM反演方法

RF是由多棵相互没有关联的决策树组成的集成决策树。RF建模通过R语言中的Random Forest包实现。RF模型涉及的3个关键参数:决策树的数量(ntree),分割节点的随机变量的数量(mtry),自变量对SOM影响的重要性(importance)。Random Forest包在运算过程中对影响SOM的自变量重要性进行排序,其数值越大,代表自变量对SOM影响越大,相关性越强。RF的预测结果是多棵决策树集成的结果,每棵树在构建的过程随机且有放回地从训练样本中抽取2/3的样本作为训练样本集(数量为),基于随机样本构建相应的决策树。未被抽取的数据构成袋外样本,作为测试集,然后由袋外样本做为测试集计算袋外误差,其计算方法与交叉验证类似,因此,RF模型不需要单独再做交叉验证[26-27]。在决策树的每个节点上,随机地从总特征维度中抽取个特征子集作为预测变量,每次树进行分裂时,从个特征中选择最优的,最后汇总所有决策树的结果。RF算法可以有效地避免特征之间的多元共线性问题,支持高维度特征,此外,其对缺失的或非平衡的数据也表现出较好的稳定性[27-28]。基于初步的试验结果,本研究在RF实际建模操作中,设定ntree为800,mtry设置为输入量个数的1/3,此时不仅可以产生较稳定的袋外误差率,且数值也较小,模型较为稳定。

本研究SOM预测模型最佳输入量的筛选与精度计算流程为:1)以单期影像波段反射率作为输入量,构建SOM反演模型。2)采用RF方法得到单期影像波段的重要性排序,分别筛选2期影像的最佳波段,确定最佳波段组合,构建SOM反演模型。3)分别以单期影像的最佳波段组合构建光谱指数,以最佳波段和光谱指数作为输入量,建立SOM反演模型。4)得到单期影像的最佳波段和光谱指数的重要性排序,为分析引入光谱指数,SOM反演精度的变化,选择的最终输入量中应包含3种最佳波段组合的波段,故选取前6个自变量作为最终输入量,建立SOM反演模型。5)引入时相信息,为分析两期影像SOM反演的优势,分别以单期和两期影像的波段反射率构建光谱指数,筛选最佳输入量,建立SOM反演模型。6)确定最优模型,反演SOM。

1.5 模型建立与验证

本研究采用RF算法模型,分别用Sentinel-2A和Landsat 8影像数据逐步筛选波段与光谱指数作为输入量,进行SOM反演建模,其中随机选取建模样本121个,验证样本41个。决定系数(2)[29]用于检验模型稳定性,2越大,表明模型越稳定。均方根误差(Root Mean Square Error,RMSE)用于衡量模型的精度,RMSE越小,表明模型精度越高。建模集和验证集RMSE分别为RMSEcal和RMSEval[30],其中RMSEval表征模型的预测适应性,RMSEval越小,模型适应性越好。

2 结果与分析

2.1 卫星影像土壤反射率特征分析

图2a为同一时期不同SOM含量土壤反射光谱特征,图2b为不同时期土壤光谱曲线图。如图2a所示,当SOM含量逐渐上升,光谱曲线整体大致呈下降趋势,光谱曲线遵循反射率随SOM增大而降低这一规律。SOM含量变化时,其中波段3~5(8)差异明显,差异明显的波段可以作为SOM响应波段。如图2b所示,光谱曲线在波段5~7(12)差异也较明显,因此,两期影像表征的土壤信息更加丰富。

注:横坐标刻度值为Landsat 8波段,刻度值2、3、4、5、6、7对应Sentinel-2A波段为2、3、4、8、11、12。

2.2 最佳输入量的筛选

2.2.1 筛选单期影像最佳波段

以单期影像波段反射率作为输入量,采用RF方法得到各波段的SOM预测重要性排序,如表2所示,Sentinel-2A重要性相对较高的波段为波段3、8、6、4,Landsat 8为波段4、3、5、6。因此,分别以Sentinel-2A(波段3、6、8)、Sentinel-2A(波段3、4、6、8)、Landsat 8(波段3、4、5)作为用于SOM反演的单期影像最佳波段。

表2 单期影像SOM预测模型波段输入量的重要性

2.2.2 筛选单期影像最终输入量

以单期影像最佳波段和光谱指数作为输入量,得到最佳波段和光谱指数的SOM预测重要性排序,分别选取前6个自变量作为最终输入量,Sentinel-2A(波段3,6,8)选取:波段3、6、8、83、83、86;Sentinel-2A(波段3,4,6,8)选取:波段3、4、6、8、43、43;Landsat8(波段3,4,5)选取:波段3、4、5、53、54、43,如表3所示。

表3 单期最佳波段与光谱指数的重要性排序

2.2.3 筛选引入时相信息的单双期影像最佳输入量

分别以单期和双期影像的波段反射率构建光谱指数,以其作为输入量,得到各波段与光谱指数的SOM预测重要性排序,筛选最佳输入量,如表4所示。

表4 单期和双期影像波段与光谱指数的重要性

2.3 基于Sentinel-2A与Landsat 8影像数据的SOM预测结果

2.3.1 单期影像SOM预测结果

分别基于单期影像波段反射率、最佳波段、最佳波段和光谱指数、最终输入量4种不同情况输入量进行运算,逐步筛选Sentinel-2A与Landsat 8影像最优SOM反演模型(如表5所示)。由表5可知,以波段反射率作为输入量,Sentinel-2A影像的多波段信息,其SOM反演模型的稳定性与精度高于Landsat 8影像。分别以Sentinel-2A(波段3、6、8)、Sentinel-2A(波段3、4、6、8)和Landsat 8(波段3、4、5)最佳波段组合作为输入量,建立模型的稳定性与精度由大到小为Sentinel-2A(波段3、4、6、8)、Landsat 8(波段3、4、5)。表明Sentinel-2A影像数据的波段6对SOM反演精度的提高起到了促进作用。并且基于Sentinel-2A(波段3、6、8)筛选最终输入量所得到的SOM最优反演模型的稳定性和精度也高于Landsat 8影像。此外,单期影像引入光谱指数相比只选取最佳波段作为输入量,使两期影像的SOM最优反演模型的RMSEval分别提高了28.867%和8.722%。

表5 基于不同时期Sentinel-2A和Landsat 8影像的SOM最优反演模型对比

注:为比值;为差值。下角标为波段。

Note:is the ratio;is the difference. The subscript represents the band value.

2.3.2 引入时相信息的单双期影像SOM预测结果

由表5可知,引入时相信息,基于两期影像的SOM反演最优模型2=0.938,RMSEval=1.329 g/kg;Sentinel-2A影像SOM反演最优模型2=0.935,RMSEval=1.944 g/kg;Landsat 8影像为2=0.922,RMSEval=2.022 g/kg。两期影像SOM反演最优模型的稳定性和精度高于单期影像。

2.4 SOM含量分布图

选择两期影像的反演模型作为最优模型反演SOM(R=0.938,RMSEval=1.329 g/kg)。由于选取的采样点均为耕地土壤样本,因此利用耕地边界范围对影像进行裁剪,并反演SOM空间分布图。从SOM遥感反演图(图3)可以看出,SOM含量分布差异性较大,胜利农场中东部漫川漫岗山丘起伏,SOM含量相比于其他地区变化较大;西北部地区旱田SOM含量较水田含量高;西南部与北部地区地势相似,SOM变化相对较小。

图3 研究区SOM遥感反演结果

3 讨 论

本研究采用较高空间分辨率的Sentinel-2A和Landsat 8遥感影像作为数据源,引入时相信息,运用RF算法,采用了不同的计算方式,逐步建立和筛选SOM最优反演模型,并且实现了研究区SOM的空间制图。根据已有的相关研究表明:SOM在整个可见光近红外波段-短波红外波段(400~2 500 nm)区光谱比较敏感[31],特别在可见光和近红外光谱区有独特的光谱反射率响应波段,因此能够利用区域光谱特征预测SOM含量。Liu等[32]认为在350~800和1 900 nm附近是估测SOM的重要波段。卢艳丽等[33-34]发现东北黑土在545~830 nm光谱范围内SOM含量与原始光谱反射率呈现出显著的负相关,并且在580~738 nm光谱范围内达到了极显著负相关。沙晋明等[35]发现 8种不同环境条件下形成的土壤剖面样品,其 SOM含量与376、676及724 nm波段附近有较高的负相关性。综上,Sentinel-2A与Landsat 8影像筛选的最佳波段的中心波长约为560(波段3)、660(波段4)、850 nm(波段5或8),以及Sentinel-2A特有的中心波长740 nm (波段6)4个波段,与已有研究SOM的反射光谱响应波段相吻合[32-35]。

引入时相信息,利用研究区裸土期的两期影像,建立SOM反演模型。两期影像SOM最优反演模型的稳定性和精度要略高于单期影像,原因在于:1)遥感数据具有瞬时性的特点,即遥感信息是瞬时记录。单期影像体现的是单一时间地表的特征状况。2)时相信息属于遥感研究对象的地学属性范畴,在遥感的应用研究中,要正确的判断地物及现象,就必须对研究对象的地学属性以及光谱特性、空间效应进行深入研究,才能对遥感数据进行有效的解译。因此,单时相由于受到各种影响因子的作用,此时遥感数据解译的信息缺乏代表性,从而降低了SOM反演模型的稳定性与精度。而引入时相信息的优势在于弥补单时相影像信息表达的不足,更为全面地提取到影像中地物的共性信息。例如,裸土条件好的影像可以与地块间影响因子作用不显著的影像结合,起到限制影响因子的影响,充分表达SOM信息的作用;两期影像也可以通过所构建的多期光谱指数来表征影响因子的作用性,作为模型的考虑因素,达到削弱影响因子影响的目的,从而提高SOM的反演精度。

选择双时相影像SOM反演模型作为最优模型,RMSEcal(1.372 g/kg)与RMSEval(1.329 g/kg)差异相对较小,RMSEval更小,说明模型得稳定性与适应性较好,也表明采样点的选取较为有代表性,可达到SOM快速检测的要求。相比单时相,双时相影像数据建立SOM反演模型的RMSEcal与RMSEval更为接近,建模的稳定性与适应性更好。因此,进一步证明了多时相SOM反演的优势性。

4 结 论

本研究基于Sentinel-2A和Landsat 8影像数据,运用RF算法,引入两期影像信息,逐步筛选最佳输入量,对区域SOM含量进行预测,分析SOM反演精度的差异,得到如下结论:

1)Sentinel-2A影像的多波段,并且最佳波段包含波段6,其中心波长为740 nm,为SOM反射光谱响应波段信息,有利于提高SOM预测精度,故Sentinel-2A影像数据建立的SOM遥感反演模型稳定性与精度高于Landsat 8影像数据。

2)通过构建光谱指数作为输入量,使单期影像的SOM反演精度有所提高,为运用RF算法进行SOM反演提供了更有效的输入量。

3)引入时相信息,可以弥补单时相影像信息的不足,表征的土壤信息更加丰富,充分的表达SOM信息,从而提高SOM的反演精度。基于两期影像构建光谱指数,筛选最佳输入量,建立的SOM反演最优模型,稳定性和精度高于单期影像。

研究成果为提高SOM等土壤理化参数遥感反演模型精度提供参考。

[1]Lal R. Soil organic dynamics in cropland and rangeland[J]. Environmental Pollution, 2002, 116(30): 353-362.

[2]Zong Zhengliang, Chen Songchao, Yang Yuanyuan, et al. National digital soil map of organic matter in topsoil and its associated uncertainty in 1980's China[J]. Geoderma, 2019, 335: 47-56.

[3]刘焕军,赵春江,王纪华,等. 黑土典型区土壤有机质遥感反演[J]. 农业工程学报,2011,27(8):211-215.

Liu Huanjun, Zhao Chunjiang, Wang Jihua, et al. Technologies of predictive mapping for soil organic matter[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2011, 27(8): 211-215. (in Chinese with English abstract)

[4]McCarty G W, Reeves J B, Reeves V B, et al. Mid-infrared and Near-infrared diffuse reflectance spectroscopy for soil carbon measurement[J]. Soil Science Society of America Journal, 2002, 66(2): 640-646.

[5]Behrens T, Schmidt K, Ramirez-Lopez L, et al. Hyper-scale digital soil mapping and soil formation analysis[J]. Geoderma, 2014, 213: 578-588.

[6]Sullivan D G, Shaw J N, Rickman D. IKONOS imagery to estimate surface soil property variability in two Alabama Physiographies[J]. Soil Science Society of America Journal, 2005, 29: 1789-1798.

[7]刘焕军,张柏,赵军,等. 黑土有机质含量高光谱模型研究[J]. 土壤学报,2007,44(1):27-32.

Liu Huanjun, Zhang Bai, Zhao Jun, et al. Spectral modelfor prediction of organic matter in black soil[J]. Acta Pedologica Sinica, 2007, 44(1): 27-32. (in Chinese with English abstract)

[8]Volkan Bilgili A, Van Es H M, Akbas F, et al. Visible-near infrared reflectance spectroscopy for assessment of soil properties in a semi-arid area of Turkey[J]. Journal of Arid Environments, 2010, 74(2):229-238.

[9]Summers D, Lewis M, Ostendorf B, et al. Visible near-infrared reflectance spectroscopy as a predictive indicator of soil properties[J]. Ecological Indicators, 2011, 11(1): 123-131.

[10]吴才武,张月丛,夏建新. 基于地统计与遥感反演相结合的有机质预测制图研究[J]. 土壤学报,2016,53(6):1568-1575.

Wu Caiwu, Zhang Yuecong, Xia Jianxin. Prediction and mapping of soil organic matter based on geostatistics andremote sensing inversion[J]. Acta Pedologica Sinica, 2016, 53(6): 1568-1575. (in Chinese with English abstract)

[11]刘焕军,谢雅慧,潘越,等. 黑土区田块土壤有机质空间分异及分布研究[J]. 土壤通报,2018,49(6):1445-1451.

Liu Huanjun, Xie Yahui, Pan Yue, et al. Spatial variability and distribution of soil organic matter in black soil areaat the field scale[J]. Chinese Journal of Soil Science, 2018, 49(6): 1445-1451. (in Chinese with English abstract)

[12]张新乐,窦欣,谢雅慧,等. 引入时相信息的耕地土壤有机质遥感反演模型[J]. 农业工程学报, 2018, 34(4): 143-150.

Zhang Xinle, Dou Xin, Xie Yahui, et al. Remote sensing inversion model of soil organic matter in farmland by introducing temporal information[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(4): 143-150. (in Chinese with English abstract)

[13]张征立,第丹丹,萧王文,等. 应用微型近红外光谱仪快速检测桑园土壤有机质含量的方法[J]. 蚕业科学,2018,44(6):923-928.

Zhang Zhengli, Di Dandan, Xiao Wangwen, et al. Rapid determination of soil organic matter in mulberry field by micro near infrared spectrometer[J]. Science of Sericulture, 2018, 44(6): 923-928. (in Chinese with English abstract)

[14]武彦清,张柏,宋开山,等. 松嫩平原土壤有机质含量高光谱反演研究[J]. 中国科学院研究生院学报,2011,28(2):187-194.

Wu Yanqing,Zhang Bai,Song Kaishan,et al. Retrieval of soil organic matter content from hyper-spectra in Songnen Plain[J]. Journal of the Graduate School of the Chinese Academy of Sciences, 2011, 28(2): 187-194. (in Chinese with English abstract)

[15]Ayoubi S, Shahri A P, Karchegani P M, et al. Application of Artificial Neural Network (ANN) to predict soil organic matter using remote sensing data in two ecosystems[M]// Biomass and Remote Sensing of Biomass. Philippines: InTech, 2011: 181-196.

[16]沈润平,丁国香,魏国栓,等. 基于人工神经网络的土壤有机质含量高光谱反演[J]. 土壤学报,2009,46(3):391-397.

Shen Runping, Ding Guoxiang, Wei Guoshuan, et al. Retrieval of soil organic matter content from hyper-spectrum based on ANN[J]. Acta Pedologica Sinica, 2009, 46(3): 391-397. (in Chinese with English abstract)

[17]Guo P T, Li M F, Luo W, et al. Digital mapping of soil organic matter for rubber plantation at regional scale: An application of random forest plus residuals kriging approach[J]. Geoderma, 2015, 237/238: 49-59.

[18]郭澎涛,李茂芬,罗微,等. 基于多源环境变量和随机森林的橡胶园土壤全氮含量预测[J]. 农业工程学报,2015,31(5):194-202.

Guo Pengtao, Li Maofen, Luo Wei, et al. Prediction of soil total nitrogen for rubber plantation at regional scale based on environmental variables and random forest approach[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(5): 194-202. (in Chinese with English abstract)

[19]Yang R M, Zhang G L, Liu F, et al. Comparison of boosted regression tree and random forest models for mapping top soil organic carbon concentration in an alpine ecosystem[J]. Ecological Indicators, 2016, 60: 870-878.

[20]王茵茵,齐雁冰,陈洋,等. 基于多分辨率遥感数据与随机森林算法的土壤有机质预测研究[J]. 土壤学报,2016,53(2):342-354.

Wang Yinyin, Qi Yanbing, Chen Yang, et al. Prediction of soil organic matter based on multi-resolution remote sensing data and random forest algorithm[J]. Acta Pedologica Sinica,2016, 53(2): 342-354. (in Chinese with English abstract)

[21]韩杏杏,陈杰,王海洋,等. 基于随机森林模型的耕地表层土壤有机质含量空间预测:以河南省辉县市为例[J]. 土壤,2019,5(1):152-159.

Han Xingxing, Chen Jie, Wang Haiyang, et al. Spatial prediction of SOM content in topsoil based on random forest algorithm: A case study of huixian city, henan province: taking huixian City, Henan Province as anexample[J]. Soils, 2019, 51(1): 152-159. (in Chinese with English abstract)

[22]屈冉,张雅琼,聂忆黄,等. 基于多光谱遥感影像的富川县表层土壤有机质含量反演[J]. 环境与可持续发展,2019,44(1):154-157.

Qu Ran, Zhang Yaqiong, Nie Yihuang, et al. Inversionsurface soil organic matter content in Fuchuan county based on multi-spectral remote sensing image[J]. Environment and Sustainable Development,2019, 44(1): 154-157. (in Chinese with English abstract)

[23]王锐,蔡朕. 基于多光谱遥感的耕地土壤有机质定量反演[J]. 农业工程,2018,8(11):85-89.

Wang Rui, Cai Lian. Quantitative inversion of soil organic matter in cultivated land based on multi spectral remote sensing[J]. Agricultural Engineering, 2018, 8(11): 85-89. (in Chinese with English abstract)

[24]顾晓鹤,王堃,潘瑜春,等. 基于HJ1A-HSI超光谱影像的耕地有机质遥感定量反演[J]. 地理与地理信息科学,2011,27(6):69-73.

Gu Xiaohe, Wang Kun, Pan Yuchun, et al. Remote sensing quantitative inversion of farmland organic matter based on HJ1A-HSI hyperspectral image[J]. Geography and Geo-Information Science, 2011, 27(6): 69-73. (in Chinese with English abstract)

[25]翁永玲,田庆久. 遥感数据融合方法分析与评价综述[J]. 遥感信息,2003(3):49-54.

Weng Yongling, Tian Qingjiu. Analysis and evaluation of method on remote sensing data fusion[J]. Remote Sensing Information, 2003(3): 49-54. (in Chinese with English abstract)

[26]张海阳,齐俊传,毛健. 基于R语言的数据挖掘算法研究[J]. 电脑知识与技术,2016,12(28):16-19.

Zhang Haiyang, Qi Junchuan, Mao Jian. Research on data mining algorithm based on R language[J]. Computer Knowledge and Technology, 2016, 12(28): 16-19. (in Chinese with English abstract)

[27]李欣海. 随机森林模型在分类与回归分析中的应用[J]. 应用昆虫学报,2013,50(4):1190-1197.

Li Xinhai.Usingrandom forestfor classification and regression[J]. Journal of Applied Entomology, 2013, 50(4): 1190-1197. (in Chinese with English abstract)

[28]张雷,王琳琳,张旭东,等. 随机森林算法基本思想及其在生态学中的应用:以云南松分布模拟为例[J]. 生态学报,2014,34(3):650-659.

Zhang Lei, Wang Linlin, Zhang Xudong et al. The basic principle of random forest and its applications in ecology: A casestudy of Pinus yunnanensis[J]. Acta Ecologica Sinica, 2014, 34(3): 650-659. (in Chinese with English abstract)

[29]Bin Wang, Cathy Waters, Susan Orgill, et al. High resolution mapping of soil organic carbon stocks using remote sensing variables in the semi-arid rangelands of eastern Australia[J].Science of the Total Environment, 2018, 630: 367-378.

[30]Rudiyanto, Budiman Minasny, Budi Indra Setiawan, et al. Open digital mapping as acost-effective method for mapping peat thickness and assessing the carbon stock of tropical peatlands[J]. Geoderma, 2018, 313:25-40.

[31]Zhang G, Ryu D, Jiao C, et al. Estimation of organic matter content in coastal soil using reflectance spectroscopy[J].Pedosphere, 2016, 26(1):130-136.

[32]Liu Y, Jiang Q, Fei T, et al. Transferability of a visible and near-infrared model for soil organic matter estimation in riparian landscapes[J]. Remote Sensing, 2014, 6(5): 4305-4322.

[33]卢艳丽,白由路,杨俐苹,等. 东北平原不同类型土壤有机质含量高光谱反演模型同质性研究[J]. 植物营养与肥料学报,2011,17(2):456-463.

Lu Yanli, Bai Youlu, Yang Liping, et al. Homogeneity of retrieval models for soil organic matter of different soil types in Northeast Plain using hyperspctral data[J]. Journal of Plant Nutrition and Fertilizer, 2011, 17(2): 456-463. (in Chinese with English abstract)

[34]刘焕军,张柏,王宗明,等. 基于反射光谱特征的土壤盐碱化评价[J]. 红外与毫米波学报,2008,27(2):138-142.

Liu Huanjun, Zhang Bai, Wang Zongming, et al. Soil salinization evaluation based on spectral reflectance characteristics[J]. Journal of Infrared and Millimeter Waves, 2008, 27(2): 138-142. (in Chinese with English abstract)

[35]沙晋明,陈鹏程,陈松林. 土壤有机质光谱响应特性研究[J].水土保持研究,2003,10(2):21-24.

Sha Jinming, Chen Pengcheng, Chen Songlin, et al. Characteristics analysis of soil spectrum response resulted from organic material[J]. Research of Soil and Water Conservation, 2003, 10(2): 21-24. (in Chinese with English abstract)

Invertion of cultivated soil organic matter content combining multi-spectral remote sensing and random forest algorithm

Liu Huanjun, Zhang Meiwei, Yang Haoxuan, Zhang Xinle※, Meng Xiangtian, Li Houxuan, Tang Haitao

(,150030,)

Soil organic matter (SOM) inversion based on remote sensing generally uses single-date images as input. In order to explore the possibility of multi-spectral remote sensing with random forest to improve the accuracy of SOM inversion, this study was carried out in the cultivated land of Shengli Farm in Heilongjiang Province (133°34′-134°09′E, 47°13′-47°32′N). The Sentinel-2A and Landsat 8 images from the bare soil period were chosen as the main data sources, and were used for calculating spectral index. Random forest algorithm was used to select spectral bands and spectral index as the input variables and thus to build SOM inversion model. Results showed that: 1) the SOM spectral response band for both Sentinel-2A and Landsat 8 included the central wavelength: about 560, 660, 850 nm, and additional 740 nm of Sentinel-2A; 2) the performance of the optimal SOM inversion model, using predictors of the optimal band and spectral index in the single date from Sentinel-2A image, was well with the2of 0.913 and RMSEval (root mean square error for validation data) of 0.860 kg/kg, which presented better results on accuracy and stability than that of Landsat 8 image; 3) the SOM inversion accuracies using the spectral indices from Sentinel-2A and Landsat 8 images were increased by 28.87% and 8.72%, respectively compared to that using the optimal bands as input; 4) the accuracies of the inversion model based on single and double-dates bands and the spectral indices were as following: double-date images (2was 0.938, RMSEval was 1.329 kg/kg), Sentinel-2A image (2was 0.935, RMSEval was 1.944 kg/kg), Landsat 8 image (2was 0.922, RMSEval was 2.022 kg/kg). The stability and accuracy of the SOM optimal inversion model for double-date images was higher than that for single-date image. Red-edge band of Sentinel-2A image provided the optimal band information for the SOM inversion because its wavelength range was within the spectral response wavelength range of SOM, which was beneficial to enhance inversion accuracy. In conclusion, by applying random forest algorithm and remote sensing data and introducing spectral indices into the input, the SOM inversion accuracy could be improved and the predicted SOM map could better characterize the spatial distribution of SOM content. The results of this study proved the advantages of Sentinel-2A images and multi-temporal images in the bare soil period for SOM inversion, andcan provide effective methods for improving the precision of remote sensing inversion model of soil physical and chemical parameters such as SOM.

soils; organic matter; spectra; random forest; temporal information; Sentinel-2A; inversion accuracy

刘焕军,张美薇,杨昊轩,等. 多光谱遥感结合随机森林算法反演耕作土壤有机质含量[J]. 农业工程学报,2020,36(10):134-140.doi:10.11975/j.issn.1002-6819.2020.10.016 http://www.tcsae.org

Liu Huanjun, Zhang Meiwei, Yang Haoxuan, et al. Invertion of cultivated soil organic matter content combining multi-spectral remote sensing and random forest algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(10): 134-140. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.10.016 http://www.tcsae.org

2020-01-03

2020-05-10

国家重点研发计划(2017YFD0201803);黑龙江省自然基金(D2017001)

刘焕军,博士,教授、研究员,主要研究方向为农业遥感。Email:liuhuanjun@neigae.ac.com

张新乐,博士,副教授,主要研究方向为生态遥感。Email:xinlezhang@yeah.net

10.11975/j.issn.1002-6819.2020.10.016

S153.6+21; S127

A

1002-6819(2020)-10-0134-07

猜你喜欢
输入量反射率波段
利用镜质组反射率鉴定兰炭与煤粉互混样的方法解析
商品条码印制质量检测参数
——缺陷度的算法研究
车灯反射腔真空镀铝反射率研究
最佳波段组合的典型地物信息提取
新型X波段多功能EPR谱仪的设计与性能
最佳波段选择的迁西县土地利用信息提取研究
蒙特卡洛法在发动机推力测量不确定度评估中的应用
电流互感器测量结果不确定度评定
输入量与尿量比在深Ⅱ度烧伤患者休克预防性补液中的应用分析
基于地面边缘反射率网格地图的自动驾驶车辆定位技术