张春兰,杨贵军,李贺丽,汤伏全,刘畅,张丽妍
基于随机森林算法的冬小麦叶面积指数遥感反演研究
张春兰1,2,3,4,杨贵军2,3,4,李贺丽2,3,4,汤伏全1,刘畅1,2,3,4,张丽妍2,3,4
(1西安科技大学测绘科学与技术学院,西安 710054;2国家农业信息化工程技术研究中心,北京 100097;3农业部农业信息技术重点实验室, 北京 100097;4北京市农业物联网工程技术研究中心,北京 100097)
【目的】通过利用随机森林算法(random forest,RF)反演冬小麦叶面积指数(leaf area index, LAI),及时、准确地监测冬小麦长势状况,为作物田间管理和产量估测等提供科学依据。【方法】本研究依据冬小麦拔节期、挑旗期、开花期及灌浆期地面观测数据,将相关系数分析(correlation coefficient,)和袋外数据(out-of-bag data,OOB)重要性分析与随机森林算法(random forest,RF)相结合,在优选光谱指数和确定最佳自变量个数的基础上,构建了两种冬小麦LAI反演模型||-RF和OOB-RF,并利用独立数据集对两种模型进行验证;然后,将所建LAI反演模型用于无人机高光谱影像,进一步检验所建模型对无人机低空遥感平台的适用性和可靠性。【结果】||-RF和OOB-RF反演模型分别采用相关性前5强、重要性前2强的光谱指数作为输入因子时精度最优,验证决定系数(2)分别为0.805、0.899,均方根误差()分别为0.431、0.307,表明这两个模型均能对作物LAI进行精确反演,其中OOB-RF模型的反演效果更好。利用无人机高光谱影像数据结合OOB-RF估算模型反演得到冬小麦LAI与地面实测值的拟合方程的决定系数2为0.761,为0.320,数值范围(1.02—6.41)与地面实测(1.29—6.81)亦比较吻合。【结论】本文基于地面数据构建的OOB-RF模型不仅具有较高的反演精度,而且适用性强,可用于无人机高光谱遥感平台提取高精度的冬小麦LAI信息。
无人机;高光谱;叶面积指数;随机森林;冬小麦
【研究意义】叶面积指数(leaf area index,LAI)可综合表述为单位土地面积上作物叶片的叶面积总和[1-2],是地表植被生态系统中重要的理化参数之一,不仅与作物蒸腾作用、光合作用、呼吸作用、地表净初级生产力等密切相关,且常被用作评价作物长势、指导田间管理及预测产量的重要依据[3-5]。因此,及时、准确监测作物LAI具有重要的研究意义。【前人研究进展】近年来,遥感技术的快速发展使快速、无损地获取大面积作物LAI成为可能,对于其模型方法国内外已有大量探索。宋开山等[6]基于植被指数建立大豆LAI估算模型时,发现归一化差值植被指数(normalized difference vegetation index,NDVI)在LAI大于3.5时,出现了饱和现象。GITELSON等[7]则通过对植被指数NDVI进行改进,提出了宽动态植被指数(wide dynamic range vegetation index,WDRVI),可以解决饱和性问题。李鑫川等[8]提出分段选择敏感植被指数OSAVI(LAI≤3)+TGDVI(LAI>3),在解决饱和性问题的同时能够提高LAI预测精度。LIANG等[9]认为优化土壤调节植被指数(OSAVI)能够降低土壤背景影响,进而提高LAI估算精度。Liu等[10]指出利用增强型植被指数(EVI)反演LAI具有较高的估算精度。随着作物LAI遥感反演研究的深入,一些研究者尝试利用机器学习算法提高LAI估算精度。如利用神经网络法、支持向量机法可提高冬小麦LAI反演精度[11-13]。【本研究切入点】尽管这些机器学习算法能够提高反演精度,但是在反演时需要大量的训练样本,且极易出现过拟合问题。随机森林算法是一种基于统计学的机器学习算法,能高效处理大数据集,具有极强的拟合能力且不会产生过拟合现象,具有很好的抗噪性能[14],适合解决作物LAI的反演问题。但是,大多研究者利用随机森林算法进行作物参数反演时,直接将各种植被指数作为输入因子,缺乏对输入因子的预先优选[14-15]。鉴于不同植被指数在抗饱和能力、降低或消除土壤背景影响等方面各有特点,有必要对RF模型的输入因子进行优选,以提高RF模型的估算精度。【拟解决的关键问题】本研究基于冬小麦4个关键生育期(拔节期、挑旗期、开花期及灌浆期)的地面高光谱和LAI实测数据,将相关系数分析(correlation coefficient,)和袋外数据(out-of-bag data,OOB)重要性分析与随机森林算法(random forest,RF)相结合,构建了||-RF和OOB-RF两种LAI估算模型,并进行了验证和对比分析,然后将所建LAI反演模型用于低空无人机获取的高光谱影像,进一步检验所建模型的适用性和可靠性。
本研究于北京市昌平区小汤山国家精准农业示范基地(116.44°E,40.18°N)开展冬小麦试验,2014年10月上旬播种,2015年6月下旬收获。研究区属北温带半湿润大陆性季风气候,平均海拔约为36 m,年平均气温13.3—14.1℃。通过考虑作物品种、施氮水平、水分供给水平等因素,共设置16种不同处理,其中,作物品种为中麦175、京9843;氮素处理为N1:0,N2:91.065 kg N·hm-2,N3:182.13 kg N·hm-2,N4:273.195 kg N·hm-2;水分处理为雨养、正常水和两倍正常水。每种处理重复3次,共48个小区,每个小区的种植面积为48 m2。其他田间管理按照当地正常水平进行。
本研究于2015年冬小麦拔节期(4月13日)、挑旗期(4月26日)、开花期(5月14日)及灌浆期(5月25日)4个关键生育期分别采集了作物冠层高光谱反射率数据和LAI数据。其中,地面观测的非成像高光谱数据和LAI数据用于冬小麦LAI估算模型的建立与验证,其中总样本量70%用于建模(n=128),剩余30%用于验证(n=64);无人机遥感获取的成像高光谱数据用于进一步分析检验所建模型对于无人机低空遥感平台的适用性和可靠性。
1.2.1 冬小麦LAI测定 在每个试验小区选取具有代表性的20个冬小麦植株作为样本,立刻装入密封袋带回基地实验室,将样本茎叶分离后,利用美国生产的CI-203型激光叶面积仪测定样本叶片叶面积,然后结合田间群体密度调查数据得到冬小麦冠层叶面积指数。4个生育期共获取192个冬小麦叶面积指数样本数据(表1)。
1.2.2 冬小麦冠层高光谱数据获取 冬小麦地面非成像冠层反射光谱采用美国ASD Field SpecFR Pro 2500光谱辐射仪测定,光谱范围350—2 500 nm,采样间隔为1 nm。测量时天气晴朗,北京时间为10:00—14:00。观测时探头始终垂直向下且距离地面约1.0 m,探头视场角25°。在每个试验小区选定的具有代表性的冬小麦样方采集10条记录,取平均值作为该小区的冠层光谱反射率,每次测量前后均立刻进行标准白板校正。
于2015年4月28日(挑旗期)开展了无人机成像高光谱数据观测。飞行平台为RICOPTE(Riegl,Hom,Austria)八旋翼无人机,搭载德国公司生产的UHD185成像光谱仪获取高光谱影像。UHD185成像光谱仪的光谱范围为450—950 nm,光谱采样间隔4 nm,光谱分辨率8 nm,包含125个通道,具有可见-近红外波段全画幅高光谱成像的优点。50 m航高下,焦距17 mm的UHD185可同时获取50×50像素的高光谱影像和1 000×1 000像素的全色影像,即21 cm空间分辨率的高光谱像元和1 cm空间分辨率的灰度像元。无人机高光谱影像处理过程如图1。
图1 无人机高光谱影像处理过程
光谱指数是由不同波段的反射率以一定代数形式组合而成的一种参数[9],它可削弱环境背景对冠层光谱的干扰,比单波段具有更好的灵敏性。基于重采样的地面非成像光谱数据,根据前人研究结果,选取文献中常用的14个LAI光谱估算指数进行分析(表2)。
表2 本文采用的光谱指数
R是光谱反射率。i,j是一定波段范围内任意两个波段。重采样ASD数据没有与原始ASD高光谱数据对应的波段时,采用最邻近的波段代替。依据参考文献[28],WDRVI中a取0.1
R is spectral reflectance. i and j are arbitrary bands in a certain wavelength range. The resample ASD data is replaced by the nearest neighbor band when there is no band corresponding to the original ASD hyperspectral data. According to [28], the a in WDRVI is 0.1
1.4.1 相关系数分析 相关系数是描述两个具备相关性的数据之间密切程度的指标。本研究中,可以衡量光谱指数与冬小麦LAI之间的相关密切程度,绝对值越接近于1,光谱指数与LAI之间的关系越密切,反之亦然。
1.4.2 袋外数据集重要性分析 随机森林算法RF是由Breiman[33]于2001年提出,是一个树型分类器的集合。它通过利用Bootstrap方法,从原始样本集S中进行k次有放回的简单随机抽样,形成训练样本集。在使用Bootstrap对S进行抽样时,每个样本未被抽取的概率p为(1-1/n)n。当n足够大时,p=0.368,表明原始样本集S中大约37%的样本不会出现在训练样本集中,这些未被抽中的样本称为袋外数据(out of bag,OOB)。利用这部分样本进行模型性能的估计称为OOB估计,其原理是随输入因子的改变会产生估算误差,RF算法可以给出每个变量的OOB变量的误差,根据估算误差计算此输入因子的重要性,重要性值越大,表明光谱指数对LAI估算越重要。
1.4.3 建模方法 对表2中的14个光谱指数利用随机森林算法进行LAI回归分析,将14个光谱指数按照相关性、OOB重要性从大到小进行排序;其次,根据相关性和OOB重要性分析结果,第一次仅用排序第一的光谱指数建模,第二次用排序位于前两个的光谱指数建模,第n次用排序位于前n个的光谱指数建模(1≤n≤14);然后,依据调整后的决定系数确定冬小麦LAI估算模型的最佳自变量个数,进而构建两种冬小麦LAI估算模型||-RF和OOB-RF。本研究基于MATLAB程序代码进行随机森林回归拟合,其中决策树的数量和分割节点的个数是非常重要的2个参数,本文构建了500棵决策树,分割变量为3。随后,利用地面独立数据集对两种模型进行验证;最后,将所建LAI反演模型应用于低空无人机获取的高光谱影像,开展冬小麦LAI遥感反演和效用检验。
1.5.1 决定系数 决定系数(coefficient of determination,2)被用来表示模拟值与实测值的拟合效果,2越接近于1,表明模型拟合精度越高,其计算公式为:
式中,总离差平方和=,残差平方和=,y表示测量值,表示测量值的平均值,表示预测值,表示样本个数。
1.5.2 调整2在多元回归中,若模型增加一个自变量,即使这个自变量在统计上不显著,2也会变大。这是因为增加自变量时,会使残差平方和减少,从而使2变大。因此,在多元回归中,为避免增加自变量而高估2,通常用调整2(Adj.2)来评价拟合效果,因为调整2同时考虑了样本量(n)和回归中自变量的个数(k)的影响,使得调整2的值不会由于回归中自变量个数的增加而越来越接近于1。其计算公式为:
式中,为自变量的个数。
1.5.3均方根误差 均方根误差(root mean square error,)反映了模拟值与实测值的偏离程度,其值越小,表示估算模型的拟合精度越高。其计算公式为:
为了将基于地面ASD构建的优选模型应用于无人机高光谱影像上,本研究对ASD光谱数据和无人机搭载的UHD 185数据进行了光谱响应差异分析。对地面ASD光谱数据进行重采样,对UHD185光谱数据进行标准白板定标,使二者的采样间隔和光谱分辨率保持一致。由图2可以看出,两者呈现高度正相关,2均在0.99以上;由图3可知,基于两种光谱计算的两种植被指数的相关性2均在0.94以上。综合上述分析,定标后的UHD185和重采样的ASD在462—830 nm范围的光谱反射率比较一致,偏差小于1%。
图2 随机3个小区的ASD与UHD185在462—830 nm范围内的光谱反射率相关性分析
图3 基于ASD与UHD185计算的NDSI和RSI的相关性
利用不同试验处理下冬小麦拔节期、挑旗期、开花期和灌浆期等多个生育期的光谱指数与LAI数据进行相关性分析,样本量n=128(表3)。结果表明,本文分析选用的文献中用于估算LAI的光谱指数均与LAI具有较强的相关性,||均在0.65以上,并且均达到极显著水平(<0.01),其中RVI与LAI的相关系数最高,=0.886,相关性最小的是MTVII,相关性为0.666。同时,本文分析了450—950 nm波段范围内任意两个波段组合得到的归一化差值光谱指数NDSI和比值型光谱指数RSI与LAI的相关性(图4)。结果表明,494 nm与718 nm组合的NDSI(R494,R718)、490 nm与610 nm组合的RSI(R490,R610)与LAI的相关性比较强,相关系数分别为0.854,0.893。
表3 光谱指数与冬小麦LAI相关性分析及排序(n=128)
**表示0.01水平下显著相关
** represent significant at 0.01 level of probability
本文利用冬小麦拔节期、挑旗期、开花期和灌浆期数据,对光谱指数和LAI进行OOB重要性分析,重要性越大说明光谱指数在RF建模中发挥的作用越大。由表4可知,重要性大于10的光谱指数有10个,小于10的光谱指数有4个,其中重要性最大的是NDSI(R494,R718),其值为58.683,重要性最小的是MTVII,其值为2.993。与表3结果相比,GRVI、RVI和NDVI的排序发生了较大变化,GRVI从第四变成了第九,RVI从第二变成了第五,NDVI从第九变成了第四,这是由于相关系数主要从每个光谱指数与冬小麦LAI之间是否相关以及相关程度大小的角度考虑,而袋外数据重要性分析则侧重输入每个光谱指数自变量对冬小麦LAI因变量所造成的估算误差,根据估算误差计算此光谱指数的重要性。
a:LAI与NDSI(Ri,Rj)的决定系数;b:LAI与RSI(Ri,Rj)的决定系数
表4 光谱指数与冬小麦LAI的OOB重要性分析及排序(n=128)
在上述分析的基础上,按照||、OOB大小排序依次增加光谱指数的个数作为输入因子进行RF回归建模分析,其调整2见图5。结果表明,||-RF和OOB-RF估算模型的调整2的总体变化趋势均为先增加后减少。基于||-RF建模,输入因子为RSI(R490,R610)、RVI、NDSI(R494,R718)、GRVI、WDRVI 5个光谱指数时,建模的调整2最高(图5-a)。基于OOB-RF建模,输入因子为RSI(R490,R610)、NDSI(R494,R718)2个光谱指数时,建模的调整2最高(图5-b)。这表明||-RF模型和OOB-RF模型分别以相关性||前5强、OOB重要性前2强的光谱指数作为自变量时所建模型效果最佳,其建模结果如图6所示。
利用不同试验处理下冬小麦拔节期、挑旗期、开花期和灌浆期等多个生育期的光谱指数与LAI数据(n=64),分别对所建||-RF和OOB-RF估算模型进行验证,结果如图7所示。总体上来看,两种模型的估算精度2均达到0.8以上,相比较而言,OOB-RF模型的估算精度更高,且OOB-RF模型仅需要两个自变量输入,比||-RF模型的输入自变量个数(即5个)要少,更适于应用。
为了对OOB-RF模型进一步评价,本文还采用支持向量机(support vector machine,SVM)与之对比分析,发现||-SVM模型以相关性从大到小排序前7的光谱指数作为自变量建模时效果最佳,OOB-SVM模型采用重要性从大到小排序前6的光谱指数作为自变量建模时效果最佳,并且二者的验证精度分别为2=0.746、=0.744(图8-a)和2=0.821、=0.585(图8-b)。综合上述分析,OOB-RF模型的估算精度更高,且需要的自变量最少。
a:|r|-RF模型 |r|-RF model;b:OOB-RF模型 OOB-RF model
a:|r|-RF模型 |r|-RF model;b:OOB-RF模型 OOB-RF model
a:|r|-RF模型 |r|-RF model;b:OOB-RF模型 OOB-RF model
在上述研究的基础上,本文进而利用OOB-RF模型和挑旗期无人机高光谱影像开展了冬小麦LAI遥感监测(图9)。同时利用地面同步采集的实测数据进行了精度检验,每个小区LAI地面实测值与无人机高光谱遥感估算值的拟合关系如图10。无人机遥感监测的冬小麦LAI值(1.02—6.41)与地面实测值(1.29—6.81)比较一致,决定系数2为0.761为0.320,精度较高,表明利用OOB-RF模型可用于低空无人机高光谱遥感影像提取冬小麦LAI信息。
传统的统计分析方法大多基于单一植被指数构建作物LAI估算模型,但单一植被指数所包含的信息易存在饱和现象[6],而选用过多的植被指数则有可能产生过拟合现象[34]。随机森林算法是一种统计学习方法,对数据集的适应能力强,相对其他算法有着很大的优势,它具有很好的抗噪性能和极强的拟合能力但不会产生过拟合现象[33]。但是,大多研究者利用随机森林算法进行作物参数反演时,直接将各种植被指数作为输入因子,缺乏对输入因子进行预先优选[14-15]。鉴于不同植被指数在抗饱和能力、降低或消除土壤背景影响等方面各有特点,因此,将相关系数分析和袋外数据重要性分析与随机森林算法相结合,优选模型输入光谱指数并确定最佳自变量个数显得尤为重要。本文||-RF模型以相关性从大到小排序前5强的光谱指数作为自变量建模时效果最佳,OOB-RF模型采用重要性从大到小排序前2强的光谱指数作为自变量建模时效果最佳,并且OOB-RF模型精度高于||-RF模型。通过与支持向量机(SVM)对比分析,发现OOB-RF模型的估算精度更高,且需要的自变量较少,这得益于RF算法引入了两个随机性(一个随机性是指每棵树的每个节点是随机产生的,另一个随机性是指每个节点的分割变量是由随机选取的少数变量产生的),使其具有较强的容噪能力,也不易产生过度拟合现象;而SVR算法的核心问题是确定核函数和相关参数,由于存在核函数和惩罚因子等参数选择的问题,其应用受到了一定限制[12, 35]。本研究构建的LAI估算模型精度高于传统回归模型法[8-10]的精度,原因可能在于随机森林算法是基于统计学的机器学习算法,具有容噪能力强、处理大数据集效率高、不易过度拟合、对结果具有可解释性等优点,适合解决LAI反演问题。对于BP神经网络方法而言,该方法较传统回归模型法在进行冬小麦LAI反演时,虽然模型的反演精度有了大幅提高,但还存在一些不足。比如反演时需要大样本训练集(一般认为样本数n>50即为大样本训练集),且极易出现过度拟合问题;另外,计算量很大,导致其应用能力受限[11, 36]。本文构建的LAI估算模型精度较高,这是由于不同植被指数各有特点,预先进行RF模型输入因子的优选,有助于提高RF模型的估算精度,这与岳继博等[37]的研究结果一致。
a:|r|-SVM模型 |r|-SVM model;b:OOB-SVM模型 OOB-SVM model
图9 基于无人机影像的冬小麦挑旗期LAI分布图
图10 基于无人机影像的冬小麦LAI预测值与实测值关系
本文进一步将所构建的OOB-RF模型应用于无人机遥感平台。与地面验证结果(图7-b)相比,无人机平台估算精度(图10)稍有降低,原因可能有以下几个方面。首先,OOB-RF模型是基于地面ASD光谱数据建立的,尽管本文和前人[38-39]研究均表明无人机搭载UHD185与地面ASD所测的光谱反射率比较一致,且已有文献把基于地面ASD构建的模型应用于无人机影像上[40],但二者之间差异还可能会对无人机平台验证精度产生影响;其次,地面ASD观测范围较小(1 m×1 m代表性样方内),且与LAI采样数据匹配性较强,而无人机遥感监测的LAI值是整个试验小区的均值,鉴于同一小区作物不那么绝对均匀一致,也会影响无人机遥感平台的验证精度;另外,无人机飞行试验(4月28日)与地面测量(4月26日)存在时间差,也会对模型验证精度产生影响。不过,整体来讲,基于无人机遥感平台估算的冬小麦LAI精度较高,这表明本文所构建的OOB-RF模型精度和适用性较强,可基于低空无人机高光谱影像提取高精度的冬小麦LAI信息。
本研究基于不同试验处理(品种、氮肥、水分供给等)、不同生育期(拔节期、挑旗期、开花期、灌浆期等)的冬小麦冠层光谱和LAI数据,将随机森林算法与相关性分析、袋外数据重要性分析相结合,构建了冬小麦LAI遥感估算模型。结果表明,||-RF、OOB-RF模型分别采用按照相关性和重要性优选的5个和2个光谱指数作为自变量时模型效果最佳。利用独立数据集对两种LAI估算模型进行了验证,||-RF、OOB-RF模型验证决定系数(2)分别为0.805、0.899,均方根误差()分别为0.431、0.307,表明OOB-RF模型的估算精度更高一些;与文献已有模型方法相比,亦具有较好的精度。在此基础上,本文进而基于无人机高光谱影像数据,利用OOB-RF模型提取了试验区冬小麦挑旗期的LAI,估算值与地面实测值比较一致,二者拟合方程的决定系数2为0.761,为0.320,估算值范围(1.02—6.41)与地面实际情况(1.29—6.81)亦比较相符,表明本文所建的OOB-RF冬小麦LAI估算模型的精度和适用性较强,可用于低空无人机高光谱遥感平台获取高精度的作物LAI信息。
[1] 贺佳, 刘冰锋, 李军. 不同生育时期冬小麦叶面积指数高光谱遥感监测模型. 农业工程学报, 2014, 30(24): 141-150.
He J, Liu B F, Li J. Monitoring model of leaf area index of winter wheat based on hyperspectral reflectance at different growth stages., 2014, 30(24): 141-150. (in Chinese)
[2] Jin X L, Yang G J, Xu X G, Yang H, Feng H K, Li Z H, Shen J X, Lan Y B, Zhao C C. Combined multi-temporal optical and radar parameters for estimating LAI and biomass in winter wheat using HJ and RADARSAR-2 data., 2015, 7(10): 13251-13272.
[3] Vina A, Gitelson A A, Nguyrobertson A L, Peng Y. Comparison of different vegetation indices for the remote assessment of green leaf area index of crops., 2011, 115(12): 468-3478.
[4] 赵春江. 精准农业研究与实践. 北京: 科学出版社, 2009.
ZHAO C J.. Beijing: Science Press, 2009. (in Chinese)
[5] 王纪华, 赵春江, 黄文江. 农业定量遥感基础与应用. 北京: 科学出版社, 2008.
WANG J H, ZHAO C J, HUANG W J.. Beijing: Science Press, 2008. (in Chinese )
[6] 宋开山, 张柏, 王宗明, 张渊智, 刘焕军. 基于人工神经网络的大豆叶面积高光谱反演研究. 中国农业科学, 2006, 39(6): 1138-1145.
SONG K S, ZHANG B, WANG Z M, ZHANG Y Z, LIU H J. Soybean LAI estimation with in-situ collected hyperspectral data based on BP-neural networks., 2006, 39(6): 1138-1145. (in Chinese)
[7] GITELSON A A. Wide dynamic range vegetation index for remote quantification of biophysical characteristics of vegetation., 2004, 161(2): 165-173.
[8] 李鑫川, 徐新刚, 鲍艳松, 黄文江, 罗菊花, 董莹莹, 宋晓宇, 王纪华. 基于分段方式选择敏感植被指数的冬小麦叶面积指数遥感反演. 中国农业科学, 2012, 45(17): 3486-3496.
LI X C, XU X G, BAO Y S, HUANG W J, LUO J H, DONG Y Y, SONG X Y, WANG J H. Retrieving LAI of winter wheat based on sensitive vegetation index by the segmentation method., 2012, 45(17): 3486-3496. (in Chinese )
[9] LIANG L, DI L P, ZHANG L P, DENG M X, QIN Z H, ZHAO S H, LIN H. Estimation of crop LAI using hyperspectral vegetation indices and a hybrid inversion method., 2015, 165: 123-134.
[10] LIU J G, PATTEY E, JEGO G. Assessment of vegetation indices for regional crop green LAI estimation from Landsat images over multiple growing seasons., 2012, 123(3): 347-358.
[11] 夏天, 吴文斌, 周清波, 周勇.冬小麦叶面积指数高光谱遥感反演方法对比. 农业工程学报, 2013, 29(3): 139-147.
XIA T, WU W B, ZHOU Q B, ZHOU Y. Comparison of two inversion methods for winter wheat leaf area index based on hyperspectral remote sensing., 2013, 29(3): 139-147. (in Chinese)
[12] 谢巧云, 黄文江, 梁栋, 彭代亮, 黄林生, 宋晓宇, 张东彦, 杨贵军. 最小二乘支持向量机方法对冬小麦叶面积指数反演的普适性研究.光谱学与光谱分析, 2014, 34(2): 489-493.
XIE Q Y, HUANG W J, LIANG D, PENG D L, HUANG L S, SONG X Y, ZHANG D Y, YANG G J. Research on universality of least squares support vector machine method for estimating leaf area index of winter wheat., 2014, 34(2): 489-493. (in Chinese)
[13] 梁栋, 管青松, 黄文江, 黄林生, 杨贵军. 基于支持向量机回归的冬小麦叶面积指数遥感反演. 农业工程学报, 2013, 29(7): 117-123.
LIANG D, GUAN Q S, HUANG W J, HUANG L S, YANG G J. Remote sensing inversion of leaf area index based on support vector machine regression in winter wheat., 2013, 29(7): 117-123. (in Chinese)
[14] 韩兆迎, 朱西存, 房贤一, 王卓远, 王凌, 赵庚星, 姜远茂. 基于SVM与RF的苹果树冠LAI高光谱估测. 光谱学与光谱分析, 2016, 36(3): 800-805.
HAN Z Y, ZHU X C, FANG X Y, WANG Z Y, WANG L, ZHAO G X, JIANG Y M. Hyperspectral estimation of apple tree canopy LAI based on SVM and RF regression., 2016, 36(3): 800-805. (in Chinese)
[15] 李粉玲, 王力, 刘京, 常庆瑞.基于高分一号卫星数据的冬小麦叶片SPAD值遥感估算. 农业机械学报, 2015, 46(9): 273-281.
LI F L, WANG L, LIU J, CHANG Q R. Remote sensing estimation of SPAD value for wheat leaf based on GF-1 data., 2015, 46(9): 273-281. (in Chinese)
[16] PENUELAS J, ISLA R, FILELLA I, ARAUS J L. Visible and near-infrared reflectance assessment of salinity effects on barley., 1997, 37(1): 198-202.
[17] HATFIELD J L, KANEMASU E T, ASRAR G, JACKSON R D, PINTER P J, REGINATO R J, IDSO S B. Leaf area estimates from spectral measurements over various planting dates of wheat., 1985, 6(1): 167-175.
[18] SHIBAYAMA M T, AKIYAMA T. Seasonal visible, near-infrared and mid-infrared spectra of rice canopies in relation to LAI and above-ground dry phytomass., 1989, 27(2): 119-127.
[19] RONDEAUX G, STEVEN M, BARET F. Optimization of soil- adjusted vegetation indices., 1996, 55(2): 95-107.
[20] BARET F, GUVOT G. Potentials and limits of vegetation indices for LAI and APAR assessment., 1991, 35(2): 161-173.
[21] GITELSON A A, KAUFMAN Y, MERZLYAK M N. Use of green channel in remote of sensing global vegetation from EOS-MODIS., 1996, 58(3): 289-298.
[22] QI J, CHEHBOUNI A, HUETE A R, KERR Y H, SOROOSHIAN S. A modified soil adjusted vegetation index., 1994, 48(2): 119-126.
[23] GITELSON A A, MERZLYAK M N. Spectral reflectance changes associated with autumn senescence ofL. andL. leaves. Spectral features and relation to chlorophyll estimation., 1994, 143(3): 286-292.
[24] HABOUDANE D, MILLER J R, PATTEY E, ZARCOTEJADA P J, STRACHAN L B. Hyperspectral vegetation indices and novel algorithms for predicting green LAI of crop canopies: Modeling and validation in the context of precision agriculture., 2004, 90(3): 337-352.
[25] BROGE N H, LEBLANC E. Comparing prediction power and stability of broadband and hyperspectral vegetation indices for estimation of green leaf area index and canopy chlorophyll density., 2001, 76(2): 156-172.
[26] HUETE A R, JUSTICE C, LIU H. Development of vegetation and soil indices for MODIS-EOS., 1994, 49(3): 224-234.
[27] LI F, MISTELE B, HU Y, CHEN X, SCHMIDHALTER U. Comparing hyperspectral index optimization algorithms to estimate aerial N uptake using multi-temporal winter wheat datasets from contrasting climatic and geographic zones in China and Germany., 2013, 180(8): 44-57.
[28] TANAKA S, KAWAMURA K, MAKI M, MURAMOTO Y, YOSHIDA K, AKIYAMA T. Spectral index for quantifying leaf area index of winter wheat by field hyperspectral measurements: A case study in Gifu prefecture, Central Japan., 2015, 7(5): 5329-5346.
[29] 任哲, 陈怀亮, 王连喜, 李颖, 李琪.利用交叉验证的小麦LAI反演模型研究. 国土资源遥感, 2015, 27(4): 34-40.
REN Z, CHEN H L, WANG L X, LI Y, LI Q. Research on inversion model of wheat LAI using cross-validation., 2015, 27(4): 34-40. (in Chinese)
[30] LELONG C, BURGER P, JUBELIN G, ROUX B, LABBE S, BARET F. Assessment of unmanned aerial vehicles imagery for quantitative monitoring of wheat crop in small plots., 2008, 8(5): 3557-3585.
[31] POTITHEP S, NAGAI S, NASAHARA K, SUZUKI R. Two separate periods of the LAI-VIs relationships using in situ measurements in a deciduous broadleaf forest., 2013, 169(5): 148-155.
[32] INOUE Y, GUERIF M, BARET F, SKIDMORE A K, GITELSON A A, SCHLERF M, DARVISHZADEH R, OLIOSO A. Simple and robust methods for remote sensing of canopy chlorophyll content: A comparative analysis of hyperspectral data for different types of vegetation., 2016, 39(3): 2609-2623.
[33] BREIMAN L. Random forests., 2001, 45(1): 5-32.
[34] 杨福芹, 冯海宽, 李振海, 高林, 杨贵军, 戴华阳. 基于赤池信息量准则的冬小麦叶面积指数高光谱估测. 农业工程学报, 2016, 32(3): 163-168.
YANG F Q, FENG H K, LI Z H, GAO L, YANG G J, DAI H Y. Hyperspectral estimation of leaf area index for winter wheat based on Akaike’s information criterion., 2016, 32(3): 163-168. (in Chinese)
[35] 王丽爱, 马昌, 周旭东, 訾妍, 朱新开, 郭文善.基于随机森林回归算法的小麦叶片SPAD值遥感估算. 农业机械学报, 2015, 46(1): 259-265.
WANG L A, MA C, ZHOU X D, ZI Y, ZHU X K, GUO W S. Estimation of wheat leaf SPAD value using RF algorithmic model and remote sensing data., 2015, 46(1): 259-265. (in Chinese)
[36] GONG P, WANG D X, LIANG S. Inverting a canopy reflectance model using a neural network., 1999, 20(1): 111-122.
[37] 岳继博, 杨贵军, 冯海宽. 基于随机森林算法的冬小麦生物量遥感估算模型对比. 农业工程学报, 2016, 32(18): 175-182.
YUE J B, YANG G J, FENG H K. Comparative of remote sensing estimation models of winter wheat biomass based on random forest algorithm., 2016, 32(18): 175-182. (in Chinese)
[38] AASEN H, BURKART A, BOLTEN A. Generating 3D hyperspectral information with lightweight UAV snapshot cameras for vegetation monitoring: From camera calibration to quality assurance., 2015, 108(5): 245-259.
[39] YUE J B, YANG G J, LI C C, LI Z H, WANG Y J, FENG H K, XU B. Estimation of winter wheat above-ground biomass using unmanned aerial vehicle-based snapshot hyperspectral sensor and crop height improved models., 2017, 9(7): 708-727.
[40] 秦占飞, 常庆瑞, 谢宝妮, 申健. 基于无人机高光谱影像的引黄灌区水稻叶片全氮含量估测. 农业工程学报, 2016, 32(23): 77-85.
QIN Z F, CHANG Q R, XIE B N, SHEN J. Rice leaf nitrogen content estimation based on hysperspectral imagery of UAV in Yellow River diversion irrigation district., 2016, 32(23): 77-85. (in Chinese)
(责任编辑 杨鑫浩)
Remote Sensing Inversion of Leaf Area Index of Winter Wheat Based on Random Forest Algorithm
Zhang ChunLan1,2,3,4, Yang GuiJun2,3,4, Li HeLi2,3,4, Tang FuQuan1, Liu Chang1,2,3,4, Zhang LiYan2,3,4
(1College of Geomatics, Xi'an University of Science and Technology, Xi'an 710054;2National Engineering Research Center for Information Technology in Agriculture, Beijing 100097;3Key Laboratory of Agri-informatics, Ministry of Agriculture, Beijing 100097;4Beijing Engineering Research Center of Agricultural Internet of Things, Beijing 100097)
【Objective】The objective of this study is to quickly and precisely monitor the growth of winter wheat by inversion of leaf area index (LAI) using random forest algorithm. Thus it could provide a guideline in crop management and mitigation, high and stable yield, agricultural insurance claims, etc.【Method】In this study, field data of canopy reflectance and LAI of winter wheat of four critical growth stages (i.e., jointing period, flag leaf period, flowering period and filling period), were collected under different treatments. The correlation coefficient () analysis and the importance analysis of out-of-bag data (OOB) were combined with the random forest algorithm (RF) to determine the more suitable spectral indices and the optimal number of variables for inputs, and then two LAI inversion models (|| -RF, OOB-RF) were constructed and validated with independent data-sets. Further, the proposed LAI inversion model was applied to the (unmanned aerial vehicle) UAV remote sensing platform to evaluate its performance and reliability for monitoring LAI of winter wheat.【Result】The results showed that the best accuracy of ||-RF and OOB-RF inversion models was achieved when the top five spectral indices in the correlation and the top two spectral indices in the importance were used as input variables, respectively. The coefficients of determination (2) of ||-RF and OOB-RF models during LAI validation were 0.805 and 0.899, and theroot mean square errors () were 0.431 and 0.307, respectively, which indicated that both ||-RF and OOB-RF models could well estimate LAI of winter wheat, while the accuracy of the latter was much higher. The retrieved LAI from the UAV hyperspectral images using the OOB-RF model was in well agreement with the ground measured values, with2=0.761,=0.320, and the range of estimated values (i.e., 1.02-6.41) also consistent with that actually measured (i.e., 1.29-6.81).【Conclusion】The OOB-RF model constructed in this study not only has high retrieval accuracy, but also can be used to extract high-precision winter wheat LAI information from UAV hyperspectral remote sensing platform.
unmanned aerial vehicle (UAV); hyperspectral; leaf area index (LAI); random forest algorithm; winter wheat
2017-07-20;
2017-11-24
国家重点研发计划(2016YFD0200600,2016YFD0200603)、国家自然科学基金(41671411,41471351)
张春兰,E-mail:1964362790@qq.com。
李贺丽,E-mail:lhl237666@126.com