马俊伟 陈鹏飞 孙 毅 谷 健 王李娟
基于无人机多光谱影像和机器学习方法的玉米叶面积指数反演研究
马俊伟1,2陈鹏飞2,4,*孙 毅3谷 健3王李娟1,*
1江苏师范大学地理测绘与城乡规划学院, 江苏徐州 221116;2中国科学院地理科学与资源研究所 / 资源与环境信息系统国家重点实验室, 北京 100101;3中国科学院沈阳应用生态研究所, 辽宁沈阳 110016;4江苏省地理信息资源开发与利用协同创新中心, 江苏南京 210023
为实现基于机器学习方法和无人机影像的叶面积指数(leaf area index, LAI)准确估测。本研究对比了人工神经网络法(Artificial Neural Network algorithm, ANN)、高斯过程回归法(Gaussian Process Regression algorithm, GPR)、支持向量回归法(Support Vector Regression algorithm, SVR)和梯度提升决策树法(Gradient Boosting Decision Tree, GBDT)等几种主流的机器学习方法在基于无人机影像的玉米LAI反演中的优劣。为此, 开展了不同有机肥、无机肥、秸秆还田以及种植密度处理的玉米田间试验, 在不同生育期获取了无人机多光谱影像和LAI数据。基于这些数据, 首先通过相关性分析, 选择对LAI敏感的光谱指数作为估测变量, 然后分别耦合偏最小二乘法(Partial Least Squares Regression, PLSR)和ANN、GPR、SVR、GBDT建立LAI反演模型, 并对它们进行对比分析。结果表明, PLSR+GBDT法构建的LAI反演模型精度最高, 稳定性最好, 建模cal2和RMSEcal为0.90和0.25, 验证val2和RMSEval为0.90和0.29; 与PLSR+GBDT模型结果最接近的是基于PLSR+GPR法建立的模型, 其建模cal2和RMSEcal为0.86和0.30, 验证val2和RMSEval为0.89和0.29, 且具有训练速度快, 并能给出反演结果不确定度的优势; PLSR+ANN法的建模cal2和RMSEcal为0.85和0.31, 验证val2和RMSEval为0.89和0.30; PLSR+SVR法的建模cal2和RMSEcal为0.86和0.32, 验证val2和RMSEval为0.90和0.33。因此, PLSR+GBDT法和PLSR+GPR法被推荐作为玉米LAI反演模型构建的最优方法。
叶面积指数; 机器学习; 无人机; 多光谱影像; 玉米
叶面积指数(leaf area index, LAI)定义为单位土地面积上植物单面叶片面积的总和[1]。LAI是反映植物群体大小的良好指标, 与植物生长状况及光合作用能力密切相关[2], 被广泛应用于作物长势评估。玉米是重要的粮食和饲料作物, 在保障粮食安全中具有重要地位[3]。因此, 实现玉米LAI的快速、无损探测, 对其长势监测和产量预测具有重要意义。
遥感技术可实现作物生理、生化参数的快速、无损探测[4-6]。将遥感技术应用于LAI估测, 能有效弥补传统LAI估测方法耗时、耗力的不足, 实现作物长势的动态监测。近年来, 随着无人机与传感器技术的发展, 无人机遥感技术以具有机动灵活、可获取高时空分辨率影像、低成本等优势[7], 被逐渐应用到农情监测中, 成为现代精准农业研究的重要手段之一[8-9]。在利用无人机遥感技术进行LAI估算方面, 主要有经验模型法和物理模型法。经验模型法是直接基于统计学方法来建立影像光谱信息与LAI间的定量关系模型, 利用模型对目标区域LAI进行预测的方法[10]。该方法易于实现, 但也存在模型由于缺乏机理性解释, 需要大量样本对模型进行重复训练的问题[11]。结合叶片光学模型与冠层模拟模型, 可实现以植被生理、生化参数信息等作为输入来模拟冠层光谱反射率。物理模型法基于其逆向过程实现植被生理、生化参数的反演[12]。该方法的优点是具有较好的物理性解释, 但同时也存在着模型复杂, 所需输入参数多, 容易产生病态反演的问题[13]。总体来说, 经验模型法还是当前实践中应用最多的方法。
经验模型法既包括了光谱指数法(Spectral Index, SI)、偏最小二乘法(Partial Least Squares Regression, PLSR)、主成分回归法(Principal Component Regression, PCR)等传统数据分析方法, 也包括人工神经网络法(Artificial Neural Network, ANN)、支持向量回归法(Support Vector Regression, SVR)、梯度提升决策树法(Gradient Boosting Decison Tree, GBDT)等机器学习方法。当前, 已有大量研究开展了基于机器学习方法的LAI反演工作, 如Liu等[14]基于无人机多光谱影像数据, 利用GBDT反演了玉米LAI; 基于无人机高光谱影像, Yuan等[15]利用ANN构建了大豆LAI反演模型; 利用SVR法, Shi等[16]分别基于茶园红豆、绿豆的无人机多光谱影像建立了LAI反演模型。高斯过程回归法(Gaussian Process Regression, GPR)作为近年来新兴的机器学习方法, 具有结构简单、参数少、训练快等优点[17-18]。目前, 利用GPR法进行玉米LAI反演的研究较为少见。此外, 已有研究表明耦合PLSR与机器学习方法, 以PLSR的潜在变量作为机器学习方法的输入, 比单独利用2种方法会取得更优的作物参数估测效果[19-20]。因此, 耦合PLSR, 比较GPR与其他机器学习方法在玉米LAI反演中的优劣, 为用户提供最优方法具有重要意义。
本研究通过开展田间试验以获取不同生长条件下玉米植株, 并在玉米多个生育期获取无人机影像和LAI数据, 分别基于PLSR 耦合ANN、GPR、SVR、GBDT法构建LAI反演模型, 并进行对比分析, 以期实现玉米LAI高精度反演, 进而为田间精准管理提供支撑。
内蒙古自治区东四盟地区是我国重要的黑土区之一, 是重要的玉米生产基地。试验于2022年在扎兰屯市大河湾农场(47°54'2"N, 123°1'33"E)开展(图1)。该区域属于温带半湿润大陆性季风气候区, 土壤肥沃, 光照充足。研究区共设70个小区, 玉米品种为“华庆6号”, 包括4个不同处理的田间试验, 分别为: 无机肥用量、有机肥用量、秸秆还田量和种植密度试验。此外, 试验还设置2个无肥小区(施肥水平为T0: 0 kg hm–2)、2个稳定性复合肥小区(施肥水平为T1: N-P2O5-K2O比例为26-10-12的稳定性复合肥750 kg hm–2)。其中, 无机肥用量试验: N设4 个施肥水平, 分别为N1: 150 kg hm–2、N2: 180 kg hm–2、N3: 210 kg hm–2、N4: 240 kg hm–2; P2O5设3个施肥水平, 分别为P1: 60 kg hm–2、P2: 75 kg hm–2、P3: 90 kg hm–2; K2O设3个施肥水平, 分别为K1: 75 kg hm–2、K2: 90 kg hm–2、K3: 105 kg hm–2。有机肥用量试验设5个水平, 分别为O1: 0 kg hm–2、O2: 22,500 kg hm–2、O3: 37,500 kg hm–2、O4: 45,000 kg hm–2、O5: 52,500 kg hm–2; 种植密度试验设5个水平, 分别为D1: 50,000株 hm–2、D2: 55,000株 hm–2、D3: 60,000株 hm–2、D4: 62,000株 hm–2、D5: 64,000株 hm–2。秸秆还田量试验设5个水平, 分别为R1: 0 kg hm–2、R2: 3000 kg hm–2、R3: 4500 kg hm–2、R4: 6000 kg hm–2、R5: 7500 kg hm–2。各处理均设2个重复。除上述处理措施有差异外, 有机肥、秸秆还田以及种植密度试验均施N-P2O5-K2O比例为26-10-12的稳定性复合肥750 kg hm–2, 其余各项田间管理措施相同。
分别于玉米四叶期(6月28日)和九叶期(7月15日)进行无人机影像获取和田间采样。
1.2.1 无人机影像获取 本研究基于尾座式垂直起降固定翼无人机和Micasense Altum多光谱相机(MicaSense, 美国)组成遥感平台进行玉米多光谱影像获取。相比固定翼无人机和多旋翼无人机, 尾座式垂直起降固定翼无人机兼具旋翼无人机对场地要求低和固定翼无人机续航时间长、速度快的优势。本研究应用了Altum相机的可见–近红外区域的相关波段, 各波段的中心波长和波宽参数如表1所示。为保证数据的可靠性, 无人机飞行时间选择为10:00—14:00中天气晴朗无云时进行, 设置飞行高度为150 m, 航向重叠度为75%, 旁向重叠度为75%。无人机飞行前, 对灰板进行拍照以用于将获取影像的DN值转化为反射率。另外, 在田间均匀布设46个控制点, 基于厘米级误差差分GPS天宝GEO 7X (Trimble, 美国)获取控制点经、纬度信息。Pix4Dmapper软件(Pix4D, 瑞士)用于对无人机获取的多光谱影像进行拼接处理; ArcGIS软件(Esri, 美国)用于基于控制点对无人机影像进行几何精校正。
图1 研究区位置及田间小区分布情况
N1: 150kghm–2, N2: 180kghm–2, N3: 210kghm–2, N4: 240kghm–2; P1: 60kghm–2, P2: 75kghm–2, P3: 90kghm–2;K1: 75kghm–2, K2: 90kghm–2, K3: 105kghm–2;O1: 0kghm–2, O2: 22,500kghm–2, O3: 37,500kghm–2, O4: 45,000kghm–2, O5: 52,500kghm–2;D1: 50,000 plant hm–2, D2: 55,000 plant hm–2, D3: 60,000 plant hm–2, D4: 62,000 plant hm–2, D5: 64,000 plant hm–2;R1: 0kghm–2, R2: 3000kghm–2, R3: 4500kghm–2, R4: 6000kghm–2, R5: 7500kghm–2; T0: 0 kg hm–2, T1: 750 kg hm–2.
1.2.2 田间采样 无人机飞行后, 在每个小区选择长势均匀一致的区域作为样点, 先基于GEO 7X获取各个小区样点的经、纬度信息, 再采用LAI 2200植物冠层分析仪(LI-COR Inc., 美国)进行玉米LAI测定。
光谱指数通过将光谱波段进行组合, 以消除背景干扰并提高对目标参量的敏感性。许多研究直接基于其来反演植被LAI[21]。因此, 本研究首先基于无人机影像, 以各个小区样点位置为中心, 种植行间距为半径, 提取圆内所有像元光谱反射率并求均值作为各样点玉米冠层光谱反射率, 然后计算20种常见用于反演LAI的光谱指数(表2), 分析光谱指数与LAI的相关性, 筛选出与LAI相关性高的光谱指数。其次, 为消除变量间的共线性, 同时减少输入变量的个数, 将筛选的光谱指数先标准化到[–1,1]以消除变量间数量级差异, 然后将标准化好的数据输入PLSR中以获取对应的潜在变量, 并选择能代表总信息量98%以上信息的潜在变量作为机器学习方法的输入(本研究选择的潜在变量数为6); 最后, 以选择的潜在变量为输入, 分别使用ANN、GPR、SVR、GBDT建立玉米LAI反演模型, 并对4种方法建模的优、劣进行对比分析。总体技术路线图如图2所示, 各种方法具体建模过程详细描述见后。本研究使用Matlab2020a (MathWorks Inc., 美国)编程实现各模型的建模与验证过程。在建模过程中, 基于获取的2期样本数据, 分别按2︰1的比例等间隔选取样本作为建模样本和验证样本, 共获得94个建模样本, 46个验证样本。利用建模样本构建LAI反演模型, 然后使用验证样本进行模型的验证。所有方法都基于相同的建模数据集和验证数据集, 分别采用建模决定系数(cal2)、均方根误差(RMSEcal)及验证决定系数(val2)、均方根误差(RMSEval)作为建模和外部验证的精度评价指标。
表1 Altum多光谱相机的可见-近红外谱区波段相关参数信息
表2 本研究选取的光谱指数
(续表2)
1.3.1 PLSR+ANN模型法 ANN法是20世纪80年代迅速发展起来的一种机器学习算法, 其由一个输入层、多个隐含层以及一个输出层构成, 通过梯度下降和反向传播算法进行反复训练获取最优模型参数, 能够处理输入和输出变量之间的任何线性或非线性关系[42]。本研究采用的是包含输入层、1个隐含层和输出层的3层BP神经网络算法。已有研究表明这是一种高效的神经网络算法[43]。构建ANN模型时, 以选择的PLSR潜在变量为输入, 首先使用留一交叉检验法, 以cv2最大, RMSEcv最小为原则, 来确定ANN模型隐含层节点数、输入层到隐含层激活函数、隐含层到输出层激活函数等参数。其中, 隐含层节点数设置为1~5, 以1为步长变化; 输入层到隐含层和隐含层到输出层的激活函数可选择为tansig函数、logsig函数和purelin函数3种类型。其次, 利用建模数据集所有样本来基于选定的潜在变量、最优隐含层节点数、输入层到隐含层激活函数和隐含层到输出层激活函数来训练网络模型。最后, 基于验证数据集所有样本来对构建的模型进行验证。
1.3.2 PLSR+GPR模型法 GPR法是由Rasmussen和William[44]提出的一种非参数回归模型,通过假设训练样本为高斯过程的采样, 利用先验的均值函数和核函数基于样本进行训练, 并根据训练样本定义似然函数, 利用贝叶斯理论得出目标的后验分布, 以此来进行预测。在构建GPR模型时, 首先基于建模数据集, 以选择的PLSR潜在变量为输入, 采用留一交叉检验法, 以cv2最大, RMSEcv最小为原则, 来确定核函数类型。其中, 核函数类型可选择为指数(Exponential)核函数、平方指数(Squaredexponential)核函数、Matern3/2核函数、Matern5/2核函数、有理二次(Rationalquadratic)核函数、自动相关确定指数(Ardexponential)核函数、自动相关确定平方指数核函数(Ardsquaredexponential)、自动相关确定Matern3/2 (Ardmatern3/2)核函数、自动相关确定Matern5/2 (Ardmatern5/2)核函数、自动相关确定有理二次(Ardrationalquadratic)核函数。其次, 利用所有建模数据集样本, 基于选定的潜在变量、核函数来训练模型; 最后, 基于所有验证数据集样本来对构建的模型进行验证。
图2 基于不同方法的LAI反演模型构建技术路线图
1.3.3 PLSR+SVR模型法 SVR法通过建立最优决策超平面来进行样本数据回归拟合。为解决非线性问题, 其引入了核函数, 通过非线性映射将低维空间映射到高维的特征空间, 在高维空间上进行线性回归[45]。在构建SVR模型时, 首先基于建模数据集, 以选择的PLSR潜在变量为输入, 采用留一交叉检验法, 以cv2最大, RMSEcv最小为原则, 来确定核函数类型。其中, 核函数类型可选择为线性(Linear)核函数、多项式(Polynomial)核函数、径向基(Rbf)核函数以及高斯(Gaussian)核函数。其次, 利用所有建模数据集样本基于选定的核函数来训练模型;最后, 基于所有验证数据集样本来对构建的模型进行验证。
1.3.4 PLSR+GBDT模型法 GBDT法是由Friedman[46]提出的一种迭代决策树方法,其通过迭代训练新的决策树来拟合真实值与当前预测值之间的残差并进行预测。GBDT法的重要参数为决策树的数量及深度[47]。在构建GBDT模型时, 首先基于建模数据集, 以选择的PLSR潜在变量为输入, 采用留一交叉检验法, 以cv2最大, RMSEcv最小为原则, 确定最优的决策树数量和决策树深度组合。其中, 决策树数量设置为100~500, 以100为步长变化;决策树深度设置为2,从0至6以1为步长变化。然后, 利用所有建模样本, 基于选定的最优决策树数量及深度来训练模型。最后, 基于所有验证样本对获得的模型进行验证。
田间试验中, 玉米不同生育期获得的LAI数据情况如表3。由表3可知, 2个生育期的数据都存在较大变异, 尤其是四叶期数据, 说明基于不同田间试验, 本研究获得了具有不同LAI状态的玉米样本。总体来说, 试验获取的玉米LAI范围在0.37~3.19之间, 涵盖了一个较为理想的变化区间, 应能较好的支撑本研究开展不同LAI反演方法的对比研究。
将试验获取的140个样点LAI与其对应的光谱指数进行相关性分析, 各光谱指数与LAI间相关性均达0.01显著水平(表4)。由表4可知, NDRE与LAI相关性最高, 相关系数达到0.90; TCARI、MCARI、TCARI/OSAVI与LAI相关性较低, 相关系数在0.67~0.79之间变化; 其余光谱指数与LAI有中等程度的相关性, 相关系数在0.80~0.89之间变化。这是因为: (1) 红光、蓝光主要受叶绿素吸收影响, 在高植被密度容易饱和; 近红外主要受叶片散射影响, 对LAI具有较高的敏感性; 红边波段对植被长势、健康状态敏感。因此, 应用红边、近红外波段的NDRE对LAI变化最敏感; (2) TCARI、MCARI、TCARI/OSAVI是针对叶绿素反演提出的光谱指数, 在本研究中其与LAI之间也有一定的相关性, 但相关性明显不如其他光谱指数。通过对比分析, 将除TCARI、MCARI、TCARI/OSAVI外的17种光谱指数作为PLSR的输入来计算潜在变量。
如前所述, 根据潜在变量选择标准, 前6个PLSR潜在变量被作为构建ANN模型的输入。在所有隐含层节点数、输入层到隐含层和隐含层到输出层的激活函数组合中, 采用2个隐含层节点、purelin函数作为输入层到隐含层激活函数和隐含层到输出层激活函数时, PLSR+ANN模型的交叉检验cv2最大, RMSEcv最小, 其值分别为0.83和0.33, 如图3所示。基于所有建模样本, 利用该参数组合构建PLSR+ANN模型, 建模cal2为0.85, RMSEcal为0.31 (图4-a); 在基于验证样本进行外部验证时, 验证val2为0.89, RMSEval为0.30 (图4-b)。
表3 玉米LAI数据统计
表4 各光谱指数与玉米LAI的相关性分析结果
**:< 0.01.
图3 PLSR+ANN模型交叉检验结果
图4 基于PLSR+ANN的玉米LAI反演模型结果
(a):建模; (b):验证。(a):calibration; (b):validation.
对于PLSR+GPR模型, 以前6个PLSR潜在变量作为GPR模型的输入, 不同核函数下交叉检验cv2和RMSEcv结果如图5所示。从图5可以看出, 当核函数为平方指数核函数时, 交叉检验cv2最大, RMSEcv最小, 其值分别为0.83和0.33。基于所有建模样本构建PLSR+GPR反演模型时取得了较好的结果, 建模cal2为0.86, RMSEcal为0.30 (图6-a)。利用验证样本对模型进行外部验证, 同样取得了较好的验证结果, 验证val2为0.89, RMSEval为0.29 (图6-b)。
对于PLSR+SVR模型, 以前6个PLSR潜在变量作为SVR模型的输入, 不同核函数下交叉检验cv2和RMSEcv结果如图7所示。当核函数为径向基核函数时, 交叉检验cv2最大, RMSEcv最小, 其值分别为0.84和0.34。基于所有建模样本构建PLSR+SVR反演模型时, 建模cal2为0.86, RMSEcal为0.32 (图8-a)。利用验证样本对模型进行外部验证, 验证val2为0.90, RMSEval为0.33 (图8-b)。
图5 PLSR+GPR模型交叉验证结果
图6 基于PLSR+GPR的玉米LAI反演模结果
(a):建模; (b):验证。(a):calibration; (b):validation.
对于PLSR+GBDT模型, 以前6个PLSR潜在变量作为GBDT模型的输入, 不同决策树数量与树深下交叉检验cv2和RMSEcv结果如图9所示。在所有决策树数量和决策树深度的组合中, 当决策树的数量为500, 决策树的深度为2时, 交叉检验cv2最大, RMSEcv最小, 其值分别为0.79和0.37。利用该组合, 基于所有建模样本构建PLSR+GBDT反演模型时, 取得了较好的结果, 建模cal2为0.90, RMSEcal为0.25 (图10-a); 利用验证样本对模型进行外部验证, 同样取得了较好的验证结果, 验证val2为0.90, RMSEval为0.29 (图10-b)。
图7 PLSR+SVR模型交叉验证结果
图8 基于PLSR+SVR的玉米LAI反演模结果
(a):建模; (b):验证。(a):calibration; (b):validation.
图9 PLSR+GBDT模型交叉验证结果
图10 基于PLSR+GBDT的玉米LAI反演模结果
(a):建模; (b):验证。(a):calibration; (b):validation.
本研究利用无人机多光谱影像, 基于PLSR+ ANN法、PLSR+GPR法、PLSR+SVR法和PLSR+ GBDT法构建了玉米LAI反演模型, 建模2在0.85~ 0.90, RMSE在0.25~0.32之间; 验证2在0.89~0.90, RMSE在0.29~0.33之间。基于无人机多光谱数据, Liu等[48]使用多个植被指数构建苹果LAI的GBDT反演模型, 其验证2达0.85。Sun等[49]基于无人机多光谱影像, 组合光谱指数和纹理指数, 使用SVR法构建了玉米LAI反演模型建模2为0.81, 验证2为0.81;基于无人机高光谱数据, 马怡茹等[50]利用经过筛选的敏感波段, 使用SVR建立棉花LAI反演模型, 建模2为0.63, 验证2为0.63。与上述研究相比, 本研究基于无人机多光谱数据建立的玉米LAI反演模型结果在合理范围之内。
另外, 在农时、天气等因素限定下, 农情信息获取的窗口往往非常短, 迫切需要一种高效的无人机影像获取手段, 以保障大地块(如东北黑土区)农情信息的及时监测。本研究采用自主设计的尾座式垂直起降固定翼无人机平台来获取多光谱影像。如前所述, 该无人机平台采用旋翼起降、固定翼作业, 不但具有机动、灵活无需飞行跑道的优势, 而且作业效率远高于已有研究中常采用的旋翼无人机平台。从本研究的结果看, 在这种平台支撑下获取的无人机影像能较好的反演LAI, 这为垂直起降固定翼无人机应用于农情遥感监测, 提供了应用支撑。
相对于其他机器学习方法, GBDT方法采用了集成学习的思想, 通过综合多棵树开展学习, 降低单次学习的不确定性, 以获得更稳定的模型泛化能力[51]。因此, 在本研究中, PLSR+GBDT模型的方法取得了最优的结果, 其所建LAI反演模型的建模和验证结果均优于其他机器学习方法(表5)。PLSR+GPR模型的结果仅次于PLSR+GBDT模型的结果, 其在建模和验证过程中比PLSR+GBDT模型结果稍差。相比于其他机器学习模型, PLSR+GPR模型的优点是参数少,训练速度快, 而且能给出反演结果的不确定度。从估测误差(RMSE)看PLSR+ANN模型的结果排在第3位,其能够拟合各种非线性过程, 但涉及的参数比较多, 模型训练所需时间比较长, 有时容易出现过度学习问题。PLSR+SVR模型的结果最差, 原因可能是由于核函数选择的限制, 其应用受到了一定的制约[52]。因此, 本研究推荐PLSR+GBDT法和PLSR+ GPR法作为玉米LAI反演建模的方法。
表5 不同方法下玉米LAI反演结果
虽然在本研究的试验中设置了玉米有机肥、无机肥、秸秆还田以及种植密度试验, 但研究采集的数据集中于追肥管理期, 未能采集到玉米生长后期的数据, 并且模型的构建只是基于特定地点同一年份的数据, 这限制了模型在不同情景应用的能力。因此, 将LAI的PLSR+GBDT模型和PLSR+GPR模型真正应用于生产实践, 今后还需要构建不同气候条件、不同年份、各种种植管理模式下的数据集, 来对模型进行进一步优化调整, 以此来满足其在不同场景中的应用。同时, 本研究仅针对玉米开展了模型对比研究, 对于其他作物类型是否适用, 需要在未来进一步验证。
在玉米田间精准管理实践中, 可以首先获取无人机多光谱影像, 其次基于构建的PLSR+GBDT模型或PLSR+GPR模型来对玉米LAI进行预测, 然后根据LAI来判定田间玉米长势情况, 生成精准管理地图; 最后, 根据精准管理地图, 进行玉米田间精准管理。
本研究开展了不同有机肥、无机肥、秸秆还田以及种植密度处理的玉米田间试验, 获取了玉米不同生育期无人机多光谱影像和LAI数据。基于这些数据, 对PLSR耦合ANN、GPR、SVR、GBDT等4种不同机器学习方法反演LAI的优劣进行对比分析。结果表明PLSR+GBDT模型构建的LAI反演模型精度最高; 其次是PLSR+GPR模型, 其与PLSR+ GBDT模型结果接近, 且具有更快的训练速度, 并能给出反演结果的不确定度; PLSR+ANN法构建的模型紧随其后, PLSR+SVR法构建的模型精度最差。因此, PLSR+GBDT法和PLSR+GPR法被推荐作为玉米LAI反演模型构建最优方法。本研究可为人们合理选择方法准确估测LAI, 评估田间玉米长势, 开展精准管理服务。
[1] 夏天, 吴文斌, 周清波, 周勇, 于雷. 基于高光谱的冬小麦叶面积指数估算方法. 中国农业科学, 2012, 45: 2085–2092. Xia T, Wu W B, Zhou Q B, Zhou Y, Yu L. An estimation method of winter wheat leaf area index based on hyperspectral data., 2012, 45: 2085–2092 (in Chinese with English abstract).
[2] Inoue Y. Synergy of remote sensing and modeling for estimating ecophysiological processes in plant production., 2003, 6: 3–16.
[3] 李俐, 许连香, 王鹏新, 齐璇, 王蕾. 基于叶面积指数的河北中部平原夏玉米单产预测研究. 农业机械学报, 2020, 51(6): 198–208. Li L, Xu L X, Wang P X, Qi X, Wang L. Summer maize yield forecasting based on leaf area index., 2020, 51(6): 198–208 (in Chinese with English abstract).
[4] 苏伟, 侯宁, 李琪, 张明政, 赵晓凤, 蒋坤萍. 基于Sentinel-2遥感影像的玉米冠层叶面积指数反演. 农业机械学报, 2018, 49(1): 151–156. Su W, Hou N, Li Q, Zhang M Z, Zhao X F, Jiang K P. Retrieving leaf area index of corn canopy based on Sentinel-2 remote sensing image., 2018, 49(1): 151–156 (in Chinese with English abstract).
[5] 张春兰, 杨贵军, 李贺丽, 汤伏全, 刘畅, 张丽研. 基于随机森林算法的冬小麦叶面积指数遥感反演研究. 中国农业科学, 2018, 51: 855–867. Zhang C L, Yang G J, Li H L, Tang F Q, Liu C, Zhang L Y. Remote sensing inversion of leaf area index of winter wheat based on random forest algorithm., 2018, 51: 855–867 (in Chinese with English abstract).
[6] 任建强, 吴尚蓉, 刘斌, 陈仲新, 刘杏认, 李贺. 基于Hyperion高光谱影像的冬小麦地上干生物量反演. 农业机械学报, 2018, 49(4): 199–211. Ren J Q, Wu S R, Liu B, Chen Z X, Liu X R, Li H. Retrieving winter wheat above-ground dry biomass based on hyperion hyperspectral imagery., 2018, 49(4): 199–211 (in Chinese with English abstract).
[7] 王利民, 刘佳, 杨玲波, 陈仲新, 王小龙, 欧阳斌. 基于无人机影像的农情遥感监测应用. 农业工程学报, 2013, 29(18): 136–145. Wang L M, Liu J, Yang L B, Chen Z X, Wang X L, Ou-Yang B. Applications of unmanned aerial vehicle images on agricultural remote sensing monitoring., 2013, 29(18): 136–145 (in Chinese with English abstract).
[8] Yue J B, Feng H K, Yang G J, Li Z H. A comparison of regression techniques for estimation of above-ground winter wheat biomass using near-surface spectroscopy., 2018, 10: 66.
[9] Fu Y Y, Yang G J, Li Z H, Song X Y, Li Z H, Xu X G, Wang P, Zhao C J. Winter wheat nitrogen status estimation using UAV-based RGB imagery and gaussian processes regression., 2020, 12: 3778.
[10] Liu K, Zhou Q B, Wu W B, Xia T, Tang H J. Estimating the crop leaf area index using hyperspectral remote sensing., 2016, 15: 475–491.
[11] Shi Y, Wang J, Wang J, Qu Y H. A prior knowledge-based method to derivate high-resolution leaf area index maps with limited field measurements., 2016, 9: 13.
[12] 陈鹏飞, 孙九林, 王纪华, 赵春江. 基于遥感的作物氮素营养诊断技术: 现状与趋势. 中国科学: 信息科学, 2010, 40(增刊1): 21–37. Chen P F, Sun J L, Wang J H, Zhao C J. Using remote sensing technology for crop nitrogen diagnosis: status and trends.(Infor Sci), 2010, 40(S1): 21–37 (in Chinese with English abstract).
[13] Durbha S S, King R L, Younan N H. Support vector machines regression for retrieval of leaf area index from multiangle imaging spectroradiometer., 2007, 107: 348–361.
[14] Liu S B, Jin X L, Bai Y, Wu W B, Cui N B, Cheng M H, Liu Y D, Meng L, Jia X, Nie C W, Yin D M. UAV multispectral images for accurate estimation of the maize LAI considering the effect of soil background., 2023, 121: 103383.
[15] Yuan H H, Yang G J, Li C C, Wang Y J, Liu J G, Yu, H Y, Feng H K, Xu B, Zhao X Q, Yang X D. Retrieving soybean leaf area index from unmanned aerial vehicle hyperspectral remote sensing: analysis of RF, ANN, and SVM regression models., 2017, 9: 309.
[16] Shi Y, Gao Y, Wang Y, Luo D N, Chen S Z, Ding Z T, Fan K. Using unmanned aerial vehicle-based multispectral image data to monitor the growth of intercropping crops in tea plantation., 2022, 13: 820585.
[17] Zhang Y, Yang J, Liu X, Du L, Shi S, Sun J, Chen B W. Estimation of multi-species leaf area index based on Chinese GF-1 satellite data using look-up table and gaussian process regression methods., 2020, 20: 2460.
[18] Berger K, Verrelst J, Féret J B, Wang Z H, Wocher M, Strathmann M, Danner M, Mauser W, Hank T. Crop nitrogen monitoring: recent progress and principal developments in the context of imaging spectroscopy missions., 2020, 242: 111758.
[19] Das B, Manohara K K, Mahajan G R, Sahoo R N. Spectroscopy based novel spectral indices, PCA- and PLSR-coupled machine learning models for salinity stress phenotyping of rice.,2020, 229: 117983.
[20] Mahajan G R, Das B, Murgaokar D, Herrmann I, Berger K, Sahoo R N, Patel K, Desai A, Morajkar S, Kulkarni R M. Monitoring the foliar nutrients status of mango using spectroscopy-based spectral indices and PLSR-combined machine learning models., 2021, 13: 641.
[21] Xie Q, Huang W, Zhang B, Chen P F, Song X Y, Pascucci S, Pignatti S, Laneve G, Dong Y Y. Estimating winter wheat leaf area index from ground and hyperspectral observations using vegetation indices.,2016, 9: 771–780.
[22] Miller J R, Hare E W, Wu J. Quantitative characterization of the vegetation red edge reflectance 1. An invertedGaussian reflectance model., 1990, 11: 1755–1773.
[23] Schuerger A C, Capelle G A, Di Benedetto J A, Mao C Y, Thai C N, Evans M D, Richards J T, Blank T A, Stryjewski E C. Comparison of two hyperspectral imaging and two laser-induced fluorescence instruments for the detection of zinc stress and chlorophyll concentration in Bahia grass (Flugge.)., 2003, 84: 572–588.
[24] Richardson A J, Wiegand C L. Distinguishing vegetation from soil background information., 1977, 43: 1541–1552.
[25] Huete A, Didan K, Miura T, Rodriguez E P, Gao X, Ferreira L G. Overview of the radiometric and biophysical performance of the MODIS vegetation indices., 2002, 83: 195–213.
[26] Huete A, Justice C, Liu H. Development of vegetation and soil indices for MODIS-EOS., 1994, 49: 224–234.
[27] Qi J, Chehbouni A, Huete A R, Keer Y H, Sorooshian S. A modified soil adjusted vegetation index., 1994, 48: 119–126.
[28] Rondeaux G, Steven M, Baret F. Optimization of soil-adjusted vegetation indices., 1996, 55: 95–107.
[29] Broge N H, Leblanc E. Comparing prediction power and stability of broadband and hyperspectral vegetation indices for estimation of green leaf area index and canopy chlorophyll density., 2001, 76: 156–172.
[30] Gitelson A A, Kaufman Y J, Merzlyak M N. Use of a green channel in remote sensing of global vegetation from EOS- MODIS., 1996, 58: 289–298.
[31] Huete A R. A soil vegetation adjusted index (SAVI)., 1988, 25: 295–309.
[32] Van Beek J, Tits L, Somers B, Coppin P. Stem water potential monitoring in pear orchards through WorldView-2 multispectral imagery., 2013, 5: 6647–6666.
[33] Erdle K, Mistele B, Schmidhalter U. Comparison of active and passive spectral sensors in discriminating biomass parameters and nitrogen status in wheat cultivars., 2011, 124: 74–84.
[34] Daughtry C, Walthall C L, Kim M S, de Colstoun E B, McMurtrey J E. Estimating corn leaf chlorophyll concentration from leaf and canopy reflectance., 2000, 74: 229–239.
[35] Haboudane D, Miller J R, Tremblay N, Zarco-Tejada P J, Dextraze L. Integrated narrow-band vegetation indices for prediction of crop chlorophyll content for application to precision agriculture., 2002, 81: 416–426.
[36] Haboudane D, Tremblay N, Miller J R, Vigneault P. Remote estimation of crop chlorophyll content using spectral indices derived from hyperspectral data., 2008, 46: 423–437.
[37] Han L, Yang G J, Dai H Y, Xu B, Yang H, Feng H K, Li Z H, Yang X D. Modeling maize above-ground biomass based on machine learning approaches using UAV remote-sensing data., 2019, 15: 10.
[38] Roujean J L, Breon F M. Estimating PAR absorbed by vegetation from bidirectional reflectance measurements., 1995, 51: 375–384.
[39] Chen J M. Evaluation of vegetation indices and a modified simple ratio for boreal applications., 1996, 22: 229–242.
[40] Sripada R P, Heiniger R W, White J G, Meijer A D. Aerial color infrared photography for determining early in-season nitrogen requirements in corn., 2006, 98: 968–977.
[41] Thompson C N, Mills C, Pabuayon I L B, Ritchie G L. Time-based remote sensing yield estimates of cotton in water- limiting environments., 2020, 112: 975–984.
[42] Chen P F, Wang J H, Huang W J, Tremblay N, Ou-Yang Z, Zhang Q. Critical nitrogen curve and remote detection of nitrogen nutrition index for corn in the northwestern plain of shandong province, China., 2013, 6: 682–689.
[43] Farifteh J, Van der Meer F D, Atzberger C, Carranza E J M. Quantitative analysis of salt-affected soil reflectance spectra: a comparison of two adaptive methods (PLSR and ANN)., 2007, 110: 59–78.
[44] Rasumssen C E, Williams C K I. Gaussian Process for Machine Learning. New York: The MIT Press, 2006. p 7.
[45] Valdimirn. The Nature of Statistical Learning Theory. New York: Springer, 2000. pp 267–290.
[46] Friedman J. Greedy function approximation: a gradient boosting machine., 2001, 29: 1189–1232.
[47] Wu T A, Zhang W, Wu S Y, Cheng M H, Qi L S, Shao G C, Jiao X Y. Retrieving rice (L.) net photosynthetic rate from UAV multispectral images based on machine learning methods., 2023, 13: 1088499.
[48] Liu Z J, Guo P J, Liu H, Fan P, Zeng P Z, Liu X Y, Feng C, Wang W, Yang F Z. Gradient boosting estimation of the leaf area index of apple orchards in UAV remote sensing., 2021, 13: 3263.
[49] Sun X K, Yang Z Y, Su P Y, Wei K X, Wang Z G, Yang C B, Wang C, Qin M X, Xiao L J, Yang W D, Zhang M J, Song X Y, Feng M C. Non-destructive monitoring of maize LAI by fusing UAV spectral and textural features., 2023, 14: 1158837.
[50] 马怡茹, 吕新, 易翔, 马露露, 祁亚琴, 侯彤瑜, 张泽. 基于机器学习的棉花叶面积指数监测. 农业工程学报, 2021, 37(13): 152–162. Ma Y R, Lyu X, Yi X, Ma L L, Qi Y Q, Hou T Y, Zhang Z. Monitoring of cotton leaf area index using machine learning., 2021, 37(13): 152–162 (in Chinese with English abstract).
[51] Zhang Z D, Jung C. GBDT-MO: gradient-boosted decision trees for multiple outputs., 2021, 32: 3156–3167.
[52] 王丽爱, 马昌, 周旭东, 訾妍, 朱新开, 郭文善. 基于随机森林回归算法的小麦叶片SPAD值遥感估算. 农业机械学报, 2015, 46(1): 259–265. Wang L A, Ma C, Zhou X D, Zi Y, Zhu X K, Guo W S. Estimation of wheat leaf SPAD value using RF algorithmic model and remote sensing data., 2015, 46(1): 259–265 (in Chinese with English abstract).
Comparing different machine learning methods for maize leaf area index (LAI) prediction using multispectral image from unmanned aerial vehicle (UAV)
MA Jun-Wei1,2, CHEN Peng-Fei2,4,*, SUN Yi3, GU Jian3, and WANG Li-Juan1,*
1School of Geography, Geomatics and Planning, Jiangsu Normal University, Xuzhou 221116, Jiangsu, China;2State Key Laboratory of Resource and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China;3Institute of Applied Ecology, Chinese Academy of Sciences, Shenyang 110016, Liaoning, China;4Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, Jiangsu, China
To make an accurate estimation of leaf are index (LAI) based on machine learning methods and images from UAV, we compared the several mainstream machine learning methods for maize LAI prediction, such as Artificial Neural Network method (ANN), Gaussian Process Regression method (GPR), Support Vector Regression method (SVR), and Gradient Boosting Decision Tree (GBDT). For this purpose, field experiments that considering apply of different amount of organic fertilizer, different amount of inorganic fertilizer, different amount of crop residue, and different planting density were carried out. Based on these experiments, field campaign were conducted to obtain UAV multispectral images and LAI data at different growth stages in maize. Based on above data, firstly, correlation analysis was used to select LAI-sensitive spectral indices, and then the Partial Least Squares Regression method (PLSR) and ANN, GPR, SVR, GBDT were coupled to design the LAI prediction models, respectively, and their performance for LAI prediction were compared. The results showed that the LAI prediction model constructed by PLSR+GBDT method had the highest accuracy and the best stability. The models of2and RMSE values were 0.90 and 0.25, and the verified2and RMSE values were 0.90 and 0.29 during validation, respectively. The model based on PLSR+GPR model was followed, with2and RMSE values of 0.86 and 0.30 during calibration, and2and RMSE values of 0.89 and 0.29 during validation, respectively. Besides, it had faster training speed and could give the uncertainty of the prediction. The model designed by PLSR+ANN method had2and RMSE values of 0.85 and 0.31 during calibration, and2and RMSE values of 0.89 and 0.30 during validation, respectively. The model designed by PLSR+SVR method had2and RMSE values of 0.86 and 0.32, and2and RMSE values of 0.90 and 0.33, respectively. Therefore, PLSR+GBDT method and PLSR+GPR method are recommended as the optimal methods for designing maize LAI prediction models.
LAI; machine learning; UAV; multispectral image; maize
2023-04-17;
2023-05-05.
10.3724/SP.J.1006.2023.33001
通信作者(Corresponding author): 陈鹏飞, E-mail: pengfeichen@igsnrr.ac.cn; 王李娟, E-mail: wanglj2013@jsnu.edu.cn
E-mail: majunwei@jsnu.edu.cn
2023-01-01;
本研究由中国科学院先导A专项(XDA28040502), 国家自然科学基金项目(41871344)和江苏师范大学研究生科研创新计划项目(2022XKT0070)资助。
This study was supported by the Strategic Priority Research Program of the Chinese Academy of Sciences (XDA28040502), the National Natural Science Foundation of China (41871344), and the Jiangsu Normal University Graduate Research Innovation Program Project (2022XKT0070).
URL: https://kns.cnki.net/kcms/detail/11.1809.S.20230504.1627.006.html
This is an open access article under the CC BY-NC-ND license (http://creativecommons.org/licenses/by-nc-nd/4.0/).