基于无人机多时相遥感影像的冬小麦产量估算

2021-12-08 03:32申洋洋陈志超周洪奎娄卫东沈阿林
麦类作物学报 2021年10期
关键词:植被指数拔节期冬小麦

申洋洋,陈志超,胡 昊,盛 莉,周洪奎,娄卫东,沈阿林

(1.河南理工大学测绘与国土信息工程学院,河南焦作 454000;2.浙江省农业科学院数字农业研究所,浙江杭州 310021;3.浙江省农业科学院环境资源与土壤肥料研究所,浙江杭州 310021)

冬小麦为我国的主要粮食作物之一[1],其播种面积占我国粮食播种面积的1/5[2],因而冬小麦是农作物研究的主要对象[3]。作物的产量关乎人民的生活水平和国家的粮食安全,收获前及时、准确地监测预报作物产量对于后期田间作物管理、粮食安全、灾害评估等具有重要意义[4-6]。实地统计调查是传统预测农作物产量的主要方法[7-8],不仅工作量大、效率低,且对作物破坏性大,难以满足大范围作物产量预测的需求[9]。遥感技术以其覆盖面积大、受地面条件限制少、非破坏性、信息量丰富等优点,在农作物监测方面得到广泛应用[10]。目前,遥感估产的方法主要是基于经验模型、物理模型和半经验模型[11-14]。与卫星和地面遥感相比,无人机遥感可以获得更高空间分辨率、时间分辨率和光谱分辨率的影像[15-17],在农作物监测方面得到迅速发展,已成为农业遥感数据获取的重要途径[18]。

近年来,国内外学者利用遥感技术对多种农作物产量估测开展了研究[19-23]。随着研究的不断深入,越来越多的统计分析方法和机器学习算法被用于估测作物产量[24-27]。王恺宁等[28]选取灌浆期的卫星遥感数据计算4种植被指数,并建立植被指数与小麦产量的线性及非线性回归模型,其中非线性回归模型精度较高,以非线性支持向量机(SVM)模型精度最好(R2=0.79)。陶惠林等[29]采集冬小麦拔节期、挑旗期、开花期无人机高光谱影像,用三种方法回归建模,其中用偏最小二乘法(PLSR)建立的回归模型估产最准确(R2=0.77)。Han等[30]结合无人机影像和四种机器学习算法(多元线性回归、支持向量机、人工神经网络和随机森林)估测玉米生物量,其随机森林算法模型具有较高的精度和较低的误差(R2=0.94,RMSE=0.50)。刘昌华等[31]以无人机多光谱影像为基础,提取冬小麦返青期、拔节期、孕穗期、扬花期冠层多光谱数据并建立产量估算模型,其中返青期估算效果较差,拔节期、孕穗期、扬花期估算效果相近且较好(R2分别为 0.93、0.96、0.94)。赵鑫[32]基于小麦扬花期、灌浆期、成熟期冠层影像提取15种植被指数和3种颜色特征,使用6种机器学习算法建立产量估测模型,其中随机森林算法模型精度最高(R2=0.74),灌浆期产量反演模型精度最高。Fu等[33]使用多旋翼无人机采集江苏省三个地区的影像数据,使用5种线性和非线性方法构建小麦产量估算模型,其中在拔节期、抽穗期、开花期和灌浆期,用归一化植被指数(NDVI)构建的随机森林算法模型表现最佳(R2为0.78,RMSE为0.10)。由以上研究结果可知,不同研究得出的小麦最优估产模型不同,因而利用无人机光谱影像进行小麦估产研究需要进一步的深入。本研究以冬小麦拔节期、孕穗期、抽穗期、灌浆期、成熟期的无人机多光谱影像为数据源,并基于植被指数采用统计分析方法(逐步多元线性回归、偏最小二乘回归)和机器学习算法(BP神经网络算法、随机森林算法、支持向量机算法)对不同时期的产量估算模型进行构建和效果评价,以确定最优模型,以期为冬小麦高效、快速的产量估算提供技术和方法。

1 材料与方法

1.1 研究区概况与试验设计

试验地点位于浙江省宁波市宁海县茶院乡(29°18′N,121°34′E),属于亚热带季风性湿润气候,地势西北高东南低。全年的平均气温约 16 ℃,年平均降雨量1 000~1 600 mm,年日照约1 900 h,平均相对湿度78%,气候温暖湿润,四季分明。

供试小麦品种为金运麦1号和扬麦20。试验设置0 kg·hm-2、90 kg·hm-2、180 kg·hm-2、270 kg·hm-24个施氮水平。各处理随机区组排列,共48个小区,每个小区面积40 m2。氮肥为尿素,磷肥为过磷酸钙,钾肥为氯化钾。其中,氮肥分两次施用,基施40%,拔节期追施60%。磷肥和钾肥作为基肥一次性施用,磷肥和钾肥施用量分别为75 kg P2O5·hm-2和120 kg K2O·hm-2。

1.2 无人机多光谱遥感数据的获取与处理

本研究采用深圳市大疆创新科技有限公司的四旋翼精灵4无人机为数据采集平台,该无人机搭载多光谱成像系统,主要参数见表1。多光谱相机有6个影像传感器,其中1个彩色传感器用于可见光(RGB)成像,5个单色传感器用于包含蓝(B 450±16 nm)、绿(G 560±16 nm)、红(R 650±16 nm)、红边(RE 730±16 nm)和近红外(NIR 840±26 nm)波段的多光谱成像。试验安排在2020年冬小麦生长季,在拔节期(2020年3月16日)、孕穗期(2020年3月26日)、抽穗期(2020年4月2日)、灌浆期(2020年4月24日)和成熟期(2020年5月12日)通过无人机飞行获取田间多光谱遥感数据。数据采集当日天空晴朗无云、太阳光照稳定。试验设置无人机航线6条,相对航高30 m,航向重叠率80%,旁向重叠率70%,地面分辨率为1.5 cm,作业过程中可同步获取研究区RGB和多光谱影像。

表1 无人机和多光谱传感器的主要参数Table 1 Key parameters for UAV and multi-spectral sensors

将获取的多光谱影像检查无误后进行处理。使用大疆智图(DJI Terra)进行建图航拍,将采集的照片数据导入DJI Terra,选择农田场景进行二维重建,得到基于单个波段的正射影像。将拼接完成的单个波段影像导入ENVI 5.3,进行波段合并,得到5个生育时期的多光谱影像。灌浆期的多光谱影像如图1所示。基于Python 3.6 提取每个小区1 m×1 m样方的平均光谱值并计算72个植被指数。

图1 无人机多光谱影像图Fig.1 UAV multi-spectral image

1.3 地面数据获取及处理

小麦成熟期选取每个小区均匀且有代表性的1 m2区域进行采样,样品带回实验室脱粒,籽粒晒至恒定重量后测定水分含量并称重,获得各个小区冬小麦产量。

1.4 模型构建与验证

依据多光谱相机五个特征波段数据计算利用72个植被指数值(计算方法等信息主要来源于文献[34]),分别基于逐步多元线性回归(stepwise multiple linear regression,SMLR)、偏最小二乘回归(partial least squares regression,PLSR)、BP神经网络(back-propagation neural network,BPNN)、随机森林(random forest,RF)和支持向量机(support vector machine,SVM)五种方法建立小麦估产模型[35-38]。首先,对72个植被指数与冬小麦产量间及这些植被指数之间分别进行Pearson相关分析和偏相关分析,然后根据植被指数与产量间以及植被指数间的相关性,对植被指数进行排序。将排序的72个植被指数作为输入因子依次减少植被指数的个数进行向后逐步回归分析,最后建立产量多元线性回归估测模型。偏最小回归二乘模型构建时使用的是逐步多元线性回归筛选出来的植被指数。基于机器学习算法建立模型前,从72个植被指数中剔除与产量相关性较低(未达0.05显著水平)、与其他植被指数间相关性较高的植被指数,将剩余的植被指数作为机器学习算法输入因子(20个左右),建立产量估测模型。

相关性分析使用软件IBM SPSS Statistics 21,统计分析使用The Unscrambler X和SPSS,机器学习算法在Matlab环境中实现。随机选择五个生育时期的67%数据作为建模集,剩余数据作为验证集。采用交叉验证方法建立实测产量与预测产量之间的关系,依据决定系数(R2)、均方根误差(RMSE)和相对误差(RE)对估算模型的预测能力进行评价。

(1)

(2)

(3)

2 结果与分析

2.1 基于SMLR和PLSR小麦估产建模和模型验证效果

从建模效果(表2和表3)看,从拔节期到灌浆期,SMLR和PLSR模型的拟合精度均较高,以抽穗期最佳,R2、RMSE、RE分别为0.86、0.46 kg·hm-2、11%和0.86、0.49 kg·hm-2、13%;成熟期的拟合精度较差。经独立数据验证,两类模型的预测精度在不同时期也均表现不同(图2和表3)。拔节期和成熟期的预测精度均较差,其他时期的预测精度均较高,均以灌浆期表现最优,R2、RMSE和RE分别为0.85、0.91 kg·hm-2、23%和0.83、0.97 kg·hm-2、19%。

表3 基于偏最小二乘回归的冬小麦不同生育时期产量模型与模型验证Table 3 Models and model validation of yield estimation at different wheat growth stages based on partial least squares regression

图2 基于逐步多元线性回归的冬小麦实测值与预测值的关系Fig.2 Relationship between measured and predicted winter wheat values based on stepwise multiple linear regression

表2 不同生育时期植被指数与小麦产量的逐步多元线性回归模型Table 2 Stepwise multiple linear regression model of vegetation indices and wheat yield at different growth stages

2.2 基于机器学习算法的产量模型及精度验证

基于BP神经网络算法、RF算法、SVM算法三种机器学习算法建立的模型对于不同生育时期反演精度表现为RF算法>BP神经网络算法>SVM算法(表4)。经验证,不同算法模型的预测精度在不同时期表现不尽相同(表5)。孕穗期、抽穗期、灌浆期和成熟期,RF算法预测精度最高,BP神经网络算法次之,SVM算法预测精度最低。拔节期RF算法预测精度最高,BP神经网络算法预测精度最低。三种算法建立的模型成熟期预测精度最差,拔节期略高(R2>0.63),孕穗期、抽穗期和灌浆期预测效果接近,且有较好的预测能力。基于BP神经网络算法的模型预测精度在孕穗期表现最优(R2、RMSE和RE分别为0.84、0.68 kg·hm-2、28%),基于RF算法和SVM算法的模型预测精度在抽穗期表现最优,R2、RMSE和RE分别为0.91、 0.35 kg·hm-2、15%;0.79、0.59 kg·hm-2、 15%。

表4 基于机器学习算法的冬小麦不同生育时期产量回归模型Table 4 Regression model of yield at different wheat growth stages based on machine learning algorithm

表5 基于机器学习算法的冬小麦不同生育时期产量模型验证Table 5 Verification of yield at different wheat growth stages based on machine learning algorithm

2.3 最优产量估算模型及精度验证

对比两种统计分析方法和三种机器学习算法,综合考虑建模精度和验证精度以及模型的均方根误差和相对误差,五种方法中用RF算法建立的模型精度最高,验证效果总体最优。从RF模型的预测值与实测值的关系(图3)看,抽穗期估算效果最好,拔节期、孕穗期和灌浆期估算效果接近,成熟期的估算效果相对较差。

图3 基于随机森林算法的冬小麦产量实测值与预测值的关系Fig.3 Relationship between measured and predicted winter wheat yield based on random forest algorithm

3 讨 论

无人机作为遥感数据获取的新平台,具有更高的分辨率,在监测作物长势、产量预测等精准农业研究中发挥了重要作用。无人机多光谱数据一般含有红、绿、红边和近红外等遥感所需的重要波段,而且影像处理相对简单,在农业遥感的应用上占据一定的优势。除了数据源,建模算法的选择对农作物参数的估测精度也有一定的影响,定量评价不同算法建立的预测模型精度以及选出最优的建模方法对农业遥感监测具有重要意义。本研究利用无人机多光谱数据结合统计回归和机器学习算法估算冬小麦产量。

对不同生育时期的植被指数进行相关性分析后,采用两种统计分析方法建立植被指数与产量的回归模型。本研究通过向后逐步多元线性回归,以72个植被指数为变量,每建立一个模型就删除一个对模型没有贡献的变量,直至筛选出最优参数建立模型,该方法保留了对模型有显著贡献的变量,降低了模型的复杂性。偏最小二乘回归分析的数学基础是主成分分析,是一种集典型相关分析、多元线性回归分析和主成分分析于一体的方法。该方法能最大限度地利用所有有效数据构建回归模型,且计算量小。两种统计分析方法的优势是在自变量存在多重相关性等问题时能建立有效回归模型,且建立的产量估算模型拟合效果较好,预测效果不相上下。但因其只能建立数据之间的线性关系,估算精度不高。因此,本研究选择对非线性类型问题有较好解释能力的机器学习算法进一步研究。

在BP神经网络、RF、SVM三种机器学习算法中,BP神经网络有非线性映射能力强、自学习和自适应能力强等特点,是处理复杂非线性问题的有效手段;SVM算法具有完备的统计学理论基础,基于结构风险最小化原则,在解决小样本、非线性及高维模式识别等问题中有独特的优势;RF算法是一种结合大量回归树的嵌入学习算法,具有快速运算、较强的抗噪声和不易出现过拟合等优点。本研究中,用BP神经网络、RF算法建立的模型估算效果优于统计回归模型,用SVM算法建立的模型估算效果与统计回归建立的模型估算效果接近。而在模型验证时,只有RF模型的估算能力始终优于SMLR、PLSR和SVM模型。造成这种结果的原因可能是用机器学习算法建模时会出现过拟合现象,而RF算法的鲁棒性和泛化能力强于BP神经网络[34]。用RF算法建立的产量估算模型效果最优,与Han等[30]和Fu等[33]的研究结果一致。用RF算法建立的估算模型中,抽穗期估产效果最好,成熟期估产效果最差,这与刘昌华等[31]得出的无法确定估产关键生育时期的结论不一致,与朱婉雪等[39]研究结果一致。虽然应用机器学习算法可更好地利用遥感数据估算作物产量,但需要进行更多的研究进行以便将遥感数据和其他相关的土壤、天气和管理信息结合起来,用于精确估算作物产量。

猜你喜欢
植被指数拔节期冬小麦
夜间增温对小麦干物质积累、转运、分配及产量的影响
四川水稻分蘖-拔节期低温连阴雨时空特征
2022年山西省冬小麦春季田间管理意见
冬小麦田N2O通量研究
基于无人机图像的草地植被盖度估算方法比较
冬小麦的秘密
2021年山西省小麦返青拔节期主要病虫发生趋势预报
不误农时打好冬小麦春管“第一仗”
麦田欢歌
植被指数监测绿洲农区风沙灾害的适宜性分析