姚 雄 余坤勇 杨玉洁 曾 琪 陈樟昊 刘 健
(1.福建农林大学3S技术与资源优化利用福建省高校重点实验室, 福州 350002; 2.福建农林大学林学院, 福州 350002)
基于随机森林模型的林地叶面积指数遥感估算
姚 雄1,2余坤勇1,2杨玉洁2曾 琪2陈樟昊2刘 健1,2
(1.福建农林大学3S技术与资源优化利用福建省高校重点实验室, 福州 350002; 2.福建农林大学林学院, 福州 350002)
林地叶面积指数(Leaf area index,LAI)的准确估测是精准林业的重要体现。为了快速、准确、无损监测林地LAI,利用LAI-2200型植物冠层分析仪获取福建省西部森林样地的LAI数据,结合同期Pleiades卫星影像计算12种遥感植被指数,分析了各样地实测LAI数据和相应植被指数的相关性,进而使用随机森林(RF)算法构建了林地LAI估算模型,以支持向量回归(SVR)模型和反向传播神经网络(BP)模型作为参比模型,以决定系数(R2)、均方根误差(RMSE)、平均相对误差(MAE)和相对分析误差(RPD)为指标评价并比较了模型预测精度。结果表明:全样本数据中,各植被指数与对应LAI值均呈极显著相关(P<0.01),且相关系数都大于0.4;RF模型在3次不同样本组中的预测精度均高于同期的SVR模型和BP模型;3个样本组中RF模型的LAI估测值与实测值的R2分别为0.688、0.796和0.707,RPD分别为1.653、1.984和1.731,均高于同期SVR模型和BP模型,对应的RMSE分别为0.509、0.658和0.696,MAE分别为0.417、0.414和0.466,均低于同期其他2种模型。
林地; 叶面积指数; 遥感反演; 随机森林模型; 支持向量回归模型; 反向传播神经网络模型
叶面积指数(Leaf area index,LAI)指单位水平地面面积上所有绿叶面积总和的一半[1],是表征森林冠层结构的重要参数,与森林植被的光合、蒸腾、降水截留、碳氮循环等生态过程密切相关,同时LAI也是水文、生态、气候等模型的重要输入参数[2-4]。因此,快速和准确地估测林地LAI,对森林生态系统乃至全球碳循环的研究都具有重要意义。
目前,林地LAI的测量方法可以分为直接和间接测量两大类。直接测量法技术成熟,结果最为准确,但由于叶片样品需破坏性采集,费时费力,而且叶片样品不一定具有代表性,因此该方法仅适用于小范围区域[5]。而耦合遥感数据与地面光学仪器实测数据的林地LAI间接测量法具有破坏性小或无破坏性、测量迅速简便、经济高效等特点,是快速估测大范围林地LAI的唯一途径[6-7]。遥感估算LAI的方法大致可分为经验统计模型、物理模型、机器学习模型。经验统计模型通过光谱数据或表征光谱属性的光谱指数与地面实测LAI之间的统计关系来估算LAI[8-9],模型计算简单且易于实现,但模型的普适性较差。物理模型具有很强的物理理论基础,不因背景环境或植被类型的变化而变化,因此该类模型具有较好的普适性[10-11],但模型涉及参数较多,存在解的不唯一性,而且模型运算时间过长。机器学习模型通过样本数据的不断训练以使目标最优化,它具有很强的非线性拟合能力[12-13],是估算林地LAI的重要手段。
已有众多学者采用机器学习模型进行LAI的遥感估算:王丽爱等[14]基于中国自主研制的环境与灾害监测预报卫星HJ-CCD数据,采用多核支持向量回归算法建立了小麦不同生育期LAI的遥感估算模型;王修信等[15]使用Landsat数据,构建了基于最优多植被指数组合的神经网络模型反演复杂地形水源林LAI的空间变化;韩兆迎等[16]分别采用随机森林算法和支持向量机算法构建了苹果树冠层反射率与实测LAI之间关系,通过模型比对检验,指出随机森林回归模型的预测精度高于支持向量机。尽管这些学者利用机器学习模型估测LAI的研究都取得了相应的成果,但迄今为止,国内外关于随机森林模型在LAI遥感监测预报方面的应用还鲜有报道[16],尚无该模型在林地LAI遥感估测中的相关研究。为此,本研究选择福建省长汀县河田镇为研究区域,使用随机森林模型构建基于遥感植被指数的林地LAI遥感估算模型,并与支持向量机模型和神经网络模型进行反演精度比较,判断随机森林模型在林地LAI遥感估测中的适用性。
1.1 研究区概况
福建省长汀县河田镇位于福建西部,地处武夷山脉南段(25°33′~25°48′N、116°18′~116°31′E),属中亚热带季风气候。境内气候温和,水热资源丰富,年平均气温17.5~18.8℃,极端最高气温39.8℃,极端最低气温-4.9℃。全年光照充足,雨量充沛,降雨集中在夏季,年平均降雨量1 700 mm,无霜期265 d。全镇低山高丘环绕四周,中部开阔,土壤类型以红壤为主,是南方典型的红壤丘陵区。镇域面积296 km2,其中山地面积213 km2,山地植被主要包括马尾松(PinusmassonianaLamb.)、黄瑞木(Adinandramillettii)、胡枝子(LespedezabicolorTurcz.)和芒萁(DicranopterisdichotomaBernh.)。由于历史原因,研究区山地天然植被遭到严重毁坏,水土流失连年加剧,成为南方典型的红壤水土流失严重区(图1)。
图1 研究区地理位置图Fig.1 Geographic location of study area
1.2 地面数据采集
2015年1月份在研究区开展地面数据采集工作,以优劣兼顾为原则,在河田镇布设59个25.82 m×25.82 m的标准样地(包括32个马尾松林地、17个杉木林地和10个阔叶林地),样地面积为667 m2,样地间距离大于500 m,为了避免居民点、道路等地物对调查数据造成干扰,各样地均位于此类地物50 m之外(图1)。样地坐标通过两部麦哲伦海王星400手持GPS获取,当两部GPS定位结果基本一致时记录坐标数据。
LAI采用LAI-2200型植物冠层分析仪(Li-COR Inc,Lincoln,NE,USA)进行测量。测量时,首先在样地外空旷处测量冠上A值,再进入样地内测量4次冠下B值,即采用ABBBB测量方式;测量结束后,仪器自动记录LAI值。每个样地重复测量3次,取其平均值作为该样地的LAI值,共获取59组LAI数据。LAI采样数据的描述统计见表1。
表1 采样点LAI的描述统计Tab.1 Results of LAI for descriptive statistics
1.3 遥感数据获取及预处理
本研究使用的遥感数据在河田镇的过境时间为2014年12月10日,景号分别为0719-04222、0519-03996的法国Pleiades遥感数据,其多光谱波段空间分辨率为2 m,包括4个波段:蓝光波段(430~550 nm)、绿光波段(490~610 nm)、红光波段(600~720 nm)和近红外波段(750~950 nm)。
遥感数据预处理包括大气校正和几何校正,首先使用ENVI 5.1软件中的FLAASH大气校正模块进行影像大气校正,然后采用三阶多项式变换模型对大气校正后的图像进行几何校正,即以河田镇1∶10 000地形图为校正基准图,以Pleiades遥感数据为匹配图,采用匹配图对基准图采点的方法进行几何校正,校正采用Krasovsky椭球体坐标和Gauss Kruger投影。
1.4 植被指数选取
遥感影像数据上的植被信息主要通过绿色植被叶片和冠层光谱信息的差异来体现。植被在不同波段范围所体现的信息与植被的某种特征状态密切关联,但是植被的一些信息(如生物量、植被长势等),难以用单波段或多个单波段数据直接提取,往往需选用多个光谱波段经简单地分析运算,产生可以表征或指示植被长势、生物量等的数值,用一种简单有效的形式(即植被指数)来实现对植被不同状态信息的表达,因而植被指数是估算植被LAI的重要工具[17]。本研究基于Pleiades遥感数据,借鉴前人研究,在众多植被指数中选取12个对LAI敏感且能较好估算LAI的宽波段植被指数[9,18-19],各植被指数表达式见表2。B1、B2、B3、B4分别为蓝光、绿光、红光、近红外波段光谱反射率。
1.5 模型构建方法
在众多神经网络模型中,反向传播(Back propagation,BP)神经网络是应用最广泛的非线性映
表2 植被指数及其表达式Tab.2 Vegetation indexes and their formulas
射学习算法,它的中心思想是调整神经元节点权值使输出总误差最小[20]。本研究中,BP算法结构采用典型的三层网络标准结构,由输入层、隐含层和输出层组成,通过交叉验证优化得到各个参数。研究采用Matlab R2014b编程实现BP神经网络模型。
支持向量机(Support vector machine,SVM)是基于统计学习理论的机器学习方法,根据结构风险最小化准则,采用二次规划的方式得到问题最优解。SVM最初用于解决分类问题,即支持向量分类(Support vector classification,SVC),现已发展至可解决回归问题,即支持向量回归(Support vector regression,SVR)。目前,SVR已经被广泛应用于农作物LAI反演研究[14,21-22]。SVR回归预测精度很大程度上由核函数类型和相关参数决定,因此,核函数和相关参数的确定是SVR建模的核心问题。该研究是利用R语言中的kernlab软件包实现SVR模型。
随机森林(Random forest,RF)模型是Breiman等提出的一种基于分类回归树的机器学习方法[23]。它通过自助法(bootstrap)抽样从原始训练集中抽取k个样本,且每个样本的样本容量均和原始训练集的大小一致;然后对每个样本分别进行决策树建模,得到k个建模结果;最后,利用所有决策树的建模结果,通过投票得到最终预测结果[24]。RF建模的核心问题是确定森林中决策树的数量和分割节点的随机变量数。该研究是利用R语言中的random Forest软件包实现RF模型。
1.6 模型评价
对RF模型、BP神经网络模型和SVR模型的验证集进行评价,常用的评价指标有决定系数(R2)、均方根误差(RMSE)、平均相对误差(MAE)和相对分析误差(RPD)[16]。R2和RPD越大,RMSE和MAE越小,表明模型估测精度越高。
为了检验模型的稳定性,采用保留样本交叉检验方式[25]将LAI原始数据按3∶2 的比例随机划分为2部分,60%(35个)作为建模集用以建立模型,40%(24个)作为检验集用以评价模型,并重复进行3次随机分组,记为样本组1、样本组2、样本组3。
2.1 LAI与植被指数的相关性分析
表3为不同划分方式实测样点LAI值与遥感植被指数间的相关性分析结果。从中可知,除PSRI与LAI值呈显著相关(P<0.05)外,样本组1中的样点LAI值与其余11个植被指数均呈极显著相关(P<0.01),其中建模集中LAI值和植被指数的相关系数均大于0.6,检验组中LAI值和植被指数的相关系数在0.7之上;样本组2和样本组3中除建模集中的PSRI与LAI值无显著相关(P>0.05)外,样点LAI值与其余植被指数均呈极显著相关(P<0.01),且它们的相关系数均高于0.5;从全样本来看,各植被指数与LAI值均呈极显著相关(P<0.01),相关系数由大到小依次为:RVI、WDRVI、NDVI(SAVI)、MSAVI、GRVI、RDVI、TVI、GNDVI、DVI、SIPI、PSRI。所有植被指数中,除PSRI外,其余植被指数与各样本组及全样本中样点LAI值均在P<0.01水平上显著相关。因此这些植被指数可以较好地反映研究区LAI值的变化情况,可以用来构建LAI估算模型。
表3 不同样本组LAI值与植被指数间的相关性分析结果Tab.3 Correlation of LAI and vegetation indices for different sample groups
注:*、** 表示在P<0.05水平(双侧)和P<0.01水平(双侧)上显著相关。
2.2 林地LAI反演模型比较分析
分别利用不同样本组中的建模集,以植被指数为自变量,对应样点的LAI值为因变量,使用BP算法、SVR算法和 RF回归算法构建3个不同样本组的LAI值遥感估算模型。本文中BP算法结构采用三层网络标准结构,通过交叉验证优化得到输入层到隐含层传递函数为tansig、隐含层到输出层传递函数为logsig、训练方式为Levenberg-Marquardt算法、迭代次数为3000的误差反向传播模型。SVR算法的建立包括核函数和相关参数的选取,本研究中,SVR算法中核函数选用高斯核函数,惩罚因子C取10,核函数参数σ取0.1。RF回归算法的核心是确定森林中决策树的数量和分割节点的分割变量数,根据经验及反复试验,本研究中森林决策树的数量为500,节点的分割变量为3。
基于不同样本组中独立于建模集的检验集,得到3个模型的LAI预测数据,通过与对应的LAI实测数据比较,评价不同模型的预测能力,同时对LAI实测数据和预测数据进行回归分析,并绘制3种模型LAI实测值和预测值的1∶1关系线,结果如表4和图2所示。
由表4可以看出,3个样本组中RF模型的R2均在0.688以上,比BP模型至少提高了16.4%,比SVR模型至少提高了7.9%,相应的RMSE和MAE均最小。其中,RF模型的RMSE与SVR模型大致相当,与BP模型相差较大,其值比BP模型依次低0.548、0.976、0.545;RF模型的MAE最大值为0.466,低于其他2种模型的最小值;3个样本组中RPD由大到小顺序均为RF、SVR、BP。以上分析表明,3个样本组中的RF模型预测结果与同组的BP模型和SVR模型相比,均表现出最强的预测能力。
表4 LAI估算模型比较Tab.4 Comparison of LAI estimation models
图2 不同模型LAI实测值与预测值回归分析Fig.2 Regression analysis of measured and predicted LAI for different models
图2中虚线表示1∶1关系线,LAI实测值与预测值线性回归线越接近1∶1关系线,则说明模型的预测效果越好。从图2可以看出,各模型均不同程度上高估了LAI地面实测值,不同样本组中RF模型和SVR模型的回归线与1∶1关系线的吻合度较好,预测精度较高;BP模型的回归线远离1∶1关系线,预测精度较低。
综上,与BP模型和SVR模型相比,RF模型得到的反演结果较为理想。因此,可以用RF模型进行林地LAI遥感估算。
2.3 林地LAI空间分布
通过R语言中的random Forest软件包,利用估测精度最高的样本组2数据对研究区林地LAI进行预测,采用ArcGIS 9.3制作基于RF模型的林地LAI的空间分布图如图3所示。
图3 河田镇林地LAI空间分布图Fig.3 Spatial distribution of forest LAI in Hetian County
从图3可以看出,研究区LAI值范围在0~6.37之间,整体上呈“北高中低”的分布格局;北部地区林地LAI值相对较高,大部分区域的LAI值高于3,主要原因在于该区是阔叶树的主要分布区,林分结构较好;研究区中部地区林地LAI值相对较低,原因在于该区植被稀疏,且林分多为单一马尾松纯林,林下水土流失严重。因而,基于RF模型预测的LAI值较好地还原了研究区LAI值的空间分布趋势。
遥感是快速获取大面积森林植被冠层光谱反射率的重要手段,但易受大气环境、植被冠层结构、土壤背景、太阳天顶角等因素的影响。有研究表明,LAI与冠层光谱反射率之间存在较强的相关关系[24],因而,有学者选取特征波段构建植被指数用来定量反演林地LAI。以往遥感估算林地LAI的研究中,多采用单一植被指数进行遥感反演且选取的植被指数数量较少[19,26],由于单个植被指数只包含单波段的信息且每种植被指数均存在不同程度的饱和性,因此,基于单一植被指数得到的LAI遥感反演模型推广能力较差。
除自变量(植被指数)选取外,建模算法是影响林地LAI遥感监测的重要因素,选择一种合适的模型,有助于提高植被理化参数的遥感预测精度。本研究首次将机器学习算法中的随机森林(RF)模型引入林地LAI遥感估算中,针对样本组1、样本组2和样本组3,分别构建了以12个植被指数为自变量的RF模型,并将模型预测性能与支持向量回归(SVR)模型和反向传播神经网络(BP)模型性能进行了比较,结果表明RF模型的预测精度最高,这与王丽爱等[27]关于农作物LAI的遥感估算结果相一致。后期工作将进一步研究RF模型能否适用林地生物量、土壤养分等林地质量参数的遥感估算,以提升其在精准林业遥感监测中的应用价值。
本研究的RF模型表现出比其他两种模型更好的预测效果,其原因在于RF模型不需要检查变量的交互作用是否显著,加上它进行了两次随机抽样,使得模型在异常值和噪声方面具有较高的容忍度,而且不容易出现过拟合现象,因此该模型具有较高的反演性能[28];SVR模型的性能取决于核函数及其参数的选取,目前对核函数及其参数的选取均为人为经验选择,带有一定随意性和盲目性,本研究也如此,这在一定程度上制约了模型的反演性能;BP模型的预测效果最差,原因可能在于模型在训练过程中陷入了局部最优状态或模型的学习能力过强,导致学习出的模型已表现不出训练样本所包含的规律,最终弱化了模型的泛化能力。此外,这3种机器学习模型均要设置参数,SVR模型需要设置多个参数(核函数类型、核参数、惩罚因子等),BP模型需要的参数也较多(网络层数、节点数、神经元个数、传递函数、学习率等),而RF模型仅需2个参数(森林决策树数量和节点分割变量),这大大提升了RF模型的应用性。另外,本研究采用的12个植被指数多为红光波段和近红外波段的组合,存在严重的多重共线性,但RF模型对多元共线性不敏感。因此,RF模型可以作为林地LAI遥感估算的优选方法。
值得注意的是,本研究中不同样本组的建模集和检验集均基于同一个年份(2015年)的数据,模型在时间维方面的普适性,尚需要进一步验证。另外,王正兴等[29]的研究表明,植被指数存在光谱“饱和”现象,仅利用多植被指数组合作为自变量,可能会影响模型的预测精度,并减弱其泛化能力。后续工作将耦合林地遥感纹理指数和植被指数,引入地形环境因子作为校正参数,以提高林地LAI遥感估算的精度。
基于高分辨率Pleiades遥感数据,构建了3种林地LAI遥感估算模型,通过与地面实测的LAI数据进行比较,结果表明基于RF算法构建的林地LAI遥感估算模型具有较高的预测精度和泛化能力,该模型可为林地LAI的快速、准确、无损遥感监测提供一种新的机器学习方法。
1 CHEN J M, BLACK T A. Defining leaf area index for non-flat leaves [J]. Plant Cell and Environment, 1992, 15(4): 421-429.
2 PU R, CHENG J. Mapping forest leaf area index using reflectance and textural information derived from WorldView-2 imagery in a mixed natural forest area in Florida, US [J]. International Journal of Applied Earth Observation and Geoinformation, 2015, 42: 11-23.
3 DONG T, LIU J, QIAN B, et al. Estimating winter wheat biomass by assimilating leaf area index derived from fusion of Landsat-8 and MODIS data [J]. International Journal of Applied Earth Observation and Geoinformation, 2016, 49: 63-74.
4 NEINAVAZ E, SKIDMORE A K, DARVISHZADEH R, et al. Retrieval of leaf area index in different plant species using thermal hyperspectral data [J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2016, 119: 390-401.
5 任海, 彭少麟.鼎湖山森林群落的几种叶面积指数测定方法的比较[J].生态学报, 1997, 17(2): 220-223. REN Hai, PENG Shaolin. Comparison of methods of estimation leaf area index in Dinghushan forests [J]. Acta Ecologica Sinica, 1997, 17(2): 220-223. (in Chinese)
6 STENBERG P, RAUTIAINEN M, MANNINEN T, et al. Boreal forest leaf area index from optical satellite imagines: model simulations and empirical analyses using data from central Finland [J]. Boreal Environment Research, 2008,13: 433-443.
7 刘婧怡, 汤旭光, 常守志, 等.森林叶面积指数遥感反演模型构建及区域估算[J].遥感技术与应用, 2014, 29(1): 18-25. LIU Jingyi, TANG Xuguang, CHANG Shouzhi, et al. Application of remote sensing to inverse the forest leaf area index and regional estimation [J]. Remote Sensing Technology and Application, 2014, 29(1): 18-25. (in Chinese)
8 朱绪超, 袁国富, 易小波, 等. 基于Landsat 8 OLI 影像的塔里木河下游河岸林叶面积指数反演[J].干旱区地理, 2014, 37(6): 1248-1256. ZHU Xuchao, YUAN Guofu, YI Xiaobo, et al. Leaf area index inversion of riparian forest in the lower basin of Tarim River based on Landsat 8 OLI imagines [J]. Arid Land Geography, 2014, 37(6): 1248-1256. (in Chinese)
9 李粉玲, 王力, 刘京, 等.基于高分一号卫星数据的冬小麦叶片SPAD值遥感估算[J/OL].农业机械学报, 2015, 46(9): 273-281. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20150940&flag=1.DOI:10.6041/j.issn.1000-1298.2015.09.040. LI Fenling, WANG Li, LIU Jing, et al. Remote sensing estimation of SPAD value for wheat leaf based on GF-1 data [J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(9): 273-281. (in Chinese)
10 DENG F, CHEN J M, PLUMMER S, et al. Algorithm for global leaf area index retrieval using satellite imagery [J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(8): 2219-2229.
11 谷成燕, 杜华强, 周国模, 等.基于PROSAIL辐射传输模型的毛竹林叶面积指数遥感反演[J].应用生态学报, 2013, 24(8): 2248-2256. GU Chengyan, DU Huaqiang, ZHOU Guomo, et al. Retrieval of leaf area index of Moso bamboo forest with Landsat Thematic Mapper imagine based on PROSAIL canopy radiative transfer model [J]. Chinese Journal of Applied Ecology, 2013, 24(8): 2248-2256. (in Chinese)
12 林卉, 梁亮, 张连蓬, 等.基于支持向量机回归算法的小麦叶面积指数高光谱遥感反演[J].农业工程学报, 2013, 29(11): 139-146. LIN Hui, LIANG Liang, ZHANG Lianpeng, et al. Wheat leaf area index inversion with hyperspectral remote sensing based on support vector regression algorithm [J]. Transactions of the CSAE, 2013, 29(11): 139-146. (in Chinese)
13 王丽爱, 周旭东, 朱新开, 等.基于HJ-CCD数据和随机森林算法的小麦叶面积指数反演[J].农业工程学报, 2016, 32(3): 149-154. WANG Liai, ZHOU Xudong, ZHU Xinkai, et al. Inverting wheat leaf area index based on HJ-CCD remote sensing data and random forest algorithm [J]. Transactions of the CSAE, 2016, 32(3): 149-154. (in Chinese)
14 王丽爱, 谭昌伟, 杨昕, 等.基于MK-SVR模型的小麦叶面积指数遥感反演[J/OL].农业机械学报, 2015, 46(5): 245-251. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20150535&flag=1. DOI:10.6041/j.issn.1000-1298.2015.05.035. WANG Liai, TAN Changwei, YANG Xin, et al. Monitoring wheat leaf area index using MK-SVR algorithmic model and remote sensing data [J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(5): 245-251. (in Chinese)
15 王修信, 孙涛, 朱启疆, 等.林地叶面积指数遥感估算方法适用分析[J].生态学报, 2014, 34(16): 4612-4619. WANG Xiuxin, SUN Tao, ZHU Qijiang, et al. Assessment of different methods for estimating forest leaf area index from remote sensing data [J]. Acta Ecologica Sinica, 2014, 34(16): 4612-4619. (in Chinese)
16 韩兆迎, 朱西存, 房贤一, 等.基于SVM与RF的苹果树冠LAI高光谱估测[J].光谱学与光谱分析, 2016, 36(3): 800-805. HAN Zhaoying, ZHU Xicun, FANG Xianyi, et al. Hyperspectral estimation of apple tree canopy LAI based on SVM and RF regression [J]. Spectroscopy and Spectral Analysis, 2016, 36(3): 800-805. (in Chinese)
17 刘洋, 刘荣高, 陈镜明, 等.叶面积指数遥感反演研究进展与展望[J].地球信息科学学报, 2013, 15(5): 734-743. LIU Yang, LIU Ronggao, CHEN Jingming, et al. Current status and perspectives of leaf area index retrieval from optical remote sensing data [J]. Journal Geo-Information Science, 2013, 15(5): 734-743. (in Chinese)
18 何亚娟, 潘学标, 裴志远, 等.基于SPOT遥感数据的甘蔗叶面积指数反演和产量估算[J/OL].农业机械学报, 2013, 44(5): 226-231. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20130539&flag=1. DOI:10.6041/j.issn.1000-1298.2013.05.039. HE Yajuan, PAN Xuebiao, PEI Zhiyuan, et al. Estimation of LAI and yield of sugarcane based on SPOT remote sensing data [J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(5): 226-231. (in Chinese)
19 刘玉琴, 沙晋明, 余涛, 等.基于宽波段和窄波段植被指数的草地LAI反演对比研究[J].遥感技术与应用, 2014, 29(4): 587-593. LIU Yuqin, SHA Jinming, YU Tao, et al. Comparing the performance of broad-band and narrow-band vegetation indices for estimation of grass LAI [J]. Remote Sensing Technology and Application, 2014, 29(4): 587-593.(in Chinese)
20 郭孝玉, 孙玉军, 王轶夫, 等.基于改进人工神经网络的植物叶面积测定[J/OL].农业机械学报, 2013, 44(2): 200-204. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20130237&flag=1. DOI:10.6041/j.issn.1000-1298.2013.02.037. GUO Xiaoyu, SUN Yujun, WANG Yifu, et al. Improved artificial neural network for determination of plant leaf area [J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(2): 200-204. (in Chinese)
21 梁栋, 管青松, 黄文江, 等.基于支持向量机回归的冬小麦叶面积指数遥感反演[J].农业工程学报, 2013, 29(7): 117-123. LIANG Dong, GUAN Qingsong, HUANG Wenjiang, et al. Remote sensing inversion of leaf area index based on support vector machine regression in winter wheat [J]. Transactions of the CSAE, 2013, 29(7): 117-123. (in Chinese)
22 谢巧云, 黄文江, 蔡淑红, 等.冬小麦叶面积指数遥感反演方法比较研究[J].光谱学与光谱分析, 2014, 34(5): 1352-1356. XIE Qiaoyun, HUANG Wenjiang, CAI Shuhong, et al. Comparative study on remote sensing invertion methods for estimating winter wheat leaf area index [J]. Spectroscopy and Spectral Analysis, 2014, 34(5): 1352-1356. (in Chinese)
23 BREIMAN L. Random forest[J]. Machine Learning, 2001, 45(1): 5-32.
24 李映雪, 朱艳, 戴廷波, 等.小麦叶面积指数与冠层反射光谱的定量关系[J].应用生态学报, 2006, 17(8): 1443-1447. LI Yingxue, ZHU Yan, DAI Tingbo, et al. Quantitative relationships between leaf area index and canopy reflectance spectra of wheat [J]. Chinese Journal of Applied Ecology, 2006, 17(8): 1443-1447. (in Chinese)
25 史舟.土壤地面高光谱遥感原理与方法[M].北京:科学出版社, 2014.
26 贾玉秋, 李冰, 程永政, 等.基于GF-1与Landsat-8多光谱遥感影像的玉米LAI反演比较[J].农业工程学报, 2015, 31(9): 173-179. JIA Yuqiu, LI Bing, CHENG Yongzheng, et al. Comparison between GF-1 imagines and Landsat-8 imagines in monitoring maize LAI [J]. Transactions of the CSAE, 2015, 31(9): 173-179. (in Chinese)
27 王丽爱, 马昌, 周旭东, 等.基于随机森林回归算法的小麦叶片SPAD值遥感估算[J/OL].农业机械学报, 2015, 46(1): 259-265. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20150136&flag=1. DOI:10.6041/j.issn.1000-1298.2015.01.036. WANG Liai, MA Chang, ZHOU Xudong, et al. Estimation of wheat leaf SPAD value using RF algorithmic model and remote sensing data [J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(1): 259-265.(in Chinese)
28 RODRIGUEZ-GALIANO V, MENDES M P, GARCIA-SOLDADOo M J, et al. Predictive modeling of groundwater nitrate pollution using Random Forest and multisource variables related to intrinsic and specific vulnerability: a case study in an agricultural setting (Southern Spain) [J]. Science of the Total Environment, 2014, 476: 189-206.
29 王正兴, 刘闯, HUETE A.植被指数研究进展:从AVHRR-NDVI到MODIS-EVI[J].生态学报, 2003, 23(5): 979-987. WANG Zhengxing, LIU Chuang, HUETE A. From VVHRR-NDVI to MODIS-EVI advances in vegetation index researh [J]. Acta Ecologica Sinica, 2003, 23(5): 979-987. (in Chinese)
Estimation of Forest Leaf Area Index Based on Random Forest Model and Remote Sensing Data
YAO Xiong1,2YU Kunyong1,2YANG Yujie2ZENG Qi2CHEN Zhanghao2LIU Jian1,2
(1.UniversityKeyLaboratoryforGeomaticsTechnologyandOptimizeResourcesUtilizationinFujianProvince,FujianAgricultureandForestryUniversity,Fuzhou350002,China2.CollegeofForestry,FujianAgricultureandForestryUniversity,Fuzhou350002,China)
Accurate estimation of forest leaf area index (LAI), which is defined as half the total area of green leaves per unit ground surface area, is the important embodiment of precision forestry. In order to monitor forest LAI faster, more accurate and non-destructively, LAI-2200 plant canopy analyzer was used to acquire LAI data from the forest plots in western Fujian. Totally 12 kinds of vegetation index based on the Pleiades satellite images in the same period were calculated and the correlation between measured LAI and the vegetation index was analyzed. The purpose was to construct LAI estimation model specifically by using random forest algorithm (RF). Additionally for each sample group, the models based on support vector regression model (SVR) and back-propagation neural network model (BP) were employed as comparison models. The estimation accuracy of the three models for each sample group was compared based on determination coefficients (R2), root mean square errors (RMSE), mean relative errors (MAE) and relative percent deviation (RPD). The results indicated that the vegetation indices and LAI values were significantly correlated (P<0.01), and the correlation coefficients were greater than 0.4 for all sample data. The forecast accuracy of RF model in three different sample groups was higher than those of the SVR and BP models in the same period.R2of LAI estimated and measured values in the three sample groups based on RF model were 0.688, 0.796 and 0.707, respectively. RPD were 1.653, 1.984 and 1.731, respectively. These data were all higher than those of SVR model and BP model, and RF model showed a higher accuracy than the other two models (RMSE of RF model were 0.509, 0.658 and 0.696, respectively; MAE were 0.417, 0.414 and 0.466, respectively). These results would be helpful for improving the forest LAI remote sensing estimation accuracy.
forest; leaf area index; remote sensing inversion; random forest model; support vector regression model; back-propagation neural network model
2016-08-08
2016-10-21
国家自然科学基金项目(41401385)
姚雄(1990—),男,博士生,主要从事3S技术应用研究,E-mail: 424532024@qq.com
刘健(1963—),男,教授,博士生导师,主要从事森林经营管理与3S技术应用研究,E-mail: fjliujian@126.com
10.6041/j.issn.1000-1298.2017.05.019
TP79; S127
A
1000-1298(2017)05-0159-08