基于遥感多参数和门控循环单元网络的冬小麦单产估测

2022-11-08 02:20王鹏新田惠仁张树誉刘峻明李红梅
农业机械学报 2022年9期
关键词:单产长势冬小麦

王鹏新 王 婕 田惠仁 张树誉 刘峻明 李红梅

(1.中国农业大学信息与电气工程学院, 北京 100083; 2.陕西省气象局, 西安 710014; 3.中国农业大学土地科学与技术学院, 北京 100193)

0 引言

冬小麦作为我国重要的粮食作物之一,其产量对于区域和国家粮食安全问题的决策至关重要,因此及时、客观、准确地获取冬小麦长势、产量,对农业管理和粮食贸易等具有重要意义[1-2]。相对于传统的农作物估产采用的统计调查方法,遥感技术具有探测范围广、采集数据快、获取信息量大、获取成本相对低等优势,为农作物估产提供了科学有效的手段[3]。利用遥感技术进行作物长势监测及产量估测时,许多研究依靠中分辨率成像光谱仪(MODIS)获得的数据与作物长势及产量密切相关的遥感参数,建立与作物产量间的经验模型,进而估测作物产量[4-5]。常用的遥感参数有归一化植被指数(Normalized difference vegetation index,NDVI)、叶面积指数(Leaf area index,LAI)、光合有效辐射吸收比率(Fraction of photosynthetically active radiation,FPAR)、总初级生产力(Gross primary productivity,GPP)等。

干旱会抑制作物根系对水分和养分的吸收,抑制光合作用、蒸腾作用等生理功能,进而影响作物生长和发育[6]。作物生长发育和产量形成是一个极其复杂的生物生理过程,各种环境条件以复杂的非线性方式影响作物的生长、发育和最终产量形成,其生长状况可以用一些能够反映其生长过程并且与该过程密切相关的因子进行表征[7]。其中,LAI和FPAR可表征作物的生长状态和光合作用能力,是作物长势监测及单产估测的重要指标。条件植被温度指数(Vegetation temperature condition index,VTCI)是王鹏新等[8]基于NDVI和地表温度(Land surface temperature,LST)的散点图呈三角形区域分布的基础上提出的,可用于定量化地表征作物水分胁迫信息,已成功用于陕西省关中平原干旱监测及作物单产估测、预测等。一些研究选用遥感单参数、双参数进行作物长势监测与产量估测[9-10],结果表明,基于遥感双参数的作物长势监测与产量估测的精度更高。作物产量的形成是在作物生长发育过程中多种因素共同作用的结果,因此,为更好地进行作物长势监测和产量估测,将选择与作物生长过程密切相关的VTCI、LAI和FPAR 作为遥感参数进行模型的构建与分析。

近年来,机器学习技术,尤其是深度学习技术发展迅速,可以实现对非线性关系的高效表达,在农业估产中引起了广泛关注[11-13]。然而作物长势及产量的研究一般是使用作物生长发育时期的时间序列数据,循环神经网络(Recurrent neural network,RNN)尤其适用于时间序列数据的特征提取。长短期记忆(Long short-term memory,LSTM)神经网络是一种广泛应用的RNN,目前,国内外学者陆续开展了结合LSTM神经网络和遥感数据等的作物长势监测和产量估测研究[14-16]。LIN等[14]结合LSTM神经网络和多任务学习(Multi-task learning,MTL)开发了一个名为DeepCropNet的深度时空学习框架,以捕捉玉米产量估测的时间特征和空间特征,为县级玉米产量估测提供了研究方法。门控循环单元(Gated recurrent unit,GRU)[17]既能有效缓解RNN网络中梯度消失或梯度爆炸的问题,又较LSTM结构简单,训练参数较少,收敛速度快,已广泛应用于自然语言处理、短期负荷预测、农业等领域[18-19]。BI等[20]采用GRU模型预测了大豆猝死综合征的病情发展,结果表明GRU模型较全连接深度神经网络(FCDNN)和XGBoost方法有较高的精度。林靖皓等[21]基于自注意力机制的双向门控循环单元和卷积神经网络进行了芒果产量预测,结果显示模型具有较高的预测准确性。目前,GRU多应用于同一时间序列中后续点的预测,而将遥感参数表示为固定时间尺度的时间序列并将其应用于作物长势监测及产量估测中的研究较少。

本文以陕西省关中平原为研究区域,选取与冬小麦长势密切相关的旬、生育时期尺度的VTCI、LAI、FPAR作为遥感特征参数,分别基于不同时间尺度的输入参数构建GRU模型得到冬小麦长势综合监测指数I,并基于最优的长势综合监测指数I构建与统计单产之间的线性回归模型来估测冬小麦单产。此外,基于深度学习的时间序列结构揭示累积和非线性效应,分析在连续旬中逐步输入参数对产量估测的影响,并进一步评估模型的鲁棒性,以期实现冬小麦长势监测与更准确的单产估测。

1 估测模型建立

1.1 研究区概况

关中平原位于陕西省中部(106°22′~110°24′ E,33°57′~35°39′ N),介于秦岭和渭北北山之间,西起宝鸡市陈仓区,东至潼关县,长约300 km,海拔323~800 m,面积约3.4×104km2。关中平原境域包括西安市、宝鸡市、咸阳市、渭南市、铜川市和杨凌国家农业高新技术产业示范区(图1),为陕西省主要的粮食生产基地[10]。该区地势平坦、土质肥沃,十分适宜耕作,但是区域内水资源相对不足,由干旱造成的冬小麦减产现象时有发生。关中平原为典型的温带大陆性季风气候,年平均气温为6~13℃,年平均降水量为550~700 mm,降水量较少且空间分布不均。冬小麦一般在10月上旬或中旬播种,播种5~6 d后出苗,4月下旬进入抽穗期,5月下旬或6月上旬收获。根据关中平原冬小麦的实际生长状况,将冬小麦主要生育期划分为返青期(3月上旬—3月中旬)、拔节期(3月下旬—4月中旬)、抽穗-灌浆期(4月下旬—5月上旬)和乳熟期(5月中旬—5月下旬)[22]。

图1 研究区域位置及作物种植区Fig.1 Location of study area and crop planting areas

1.2 数据来源与预处理

1.2.1数据来源

本文采用的遥感数据为MODIS的日地表温度产品(MYD11A1)、日地表反射率产品(MYD09GA)、叶面积指数及光合有效辐射吸收比率产品(MCD15A3H)和地表覆盖类型产品(MCD12Q1)。所采用的2011—2019年冬小麦单产数据来源于其所在市(西安市、咸阳市、宝鸡市、渭南市)统计局发布的统计年鉴;所使用的降水量数据从陕西省气象局获得。本文选用关中平原2011—2019年24个县的旬或生育时期尺度的VTCI、LAI和FPAR及冬小麦单产数据进行相关研究。

1.2.2冬小麦种植区提取

根据国家统计局冬小麦种植面积统计(http:∥www.stats.gov.cn/),近10年来我国冬小麦种植面积相对稳定,波动较小。文献[16]研究表明,尽管使用农田掩膜可能会影响产量估算的准确性,但使用农田掩膜进行区域作物产量估算是可行的。关中平原冬小麦种植面积占总种植面积的90%以上,因此本研究采用MODIS土地覆盖类型产品(MCD12Q1)进行冬小麦种植区的提取,该产品是基于Terra和Aqua卫星上的MODIS传感器获得的,由5种不同的土地覆盖分类方案组成,本研究采用国际地圈生物圈计划(IGBP)的分类方案,通过MRT(MODIS reprojection tools)进行预处理并与研究区域行政边界矢量图叠加,得到关中平原县(区)的小麦种植区分布图(图1)。

1.2.3时间序列VTCI生成

选取2011—2020年每年3—5月Aqua-MODIS的空间分辨率为1 000 m,时间分辨率为1 d的日地表温度产品(MYD11A1)及日地表反射率产品(MYD09GA),采用MRT对原始数据进行存储格式转换、投影转换、重采样、影像拼接和裁剪等预处理,得到每年关中平原日LST和日NDVI,运用最大值合成法,分别生成旬时间尺度的LST和NDVI最大值合成产品;基于多年某一旬的NDVI和LST最大值合成产品,采用最大值合成法分别生成多年的旬NDVI和LST的最大值合成产品;基于每年3—5月旬尺度的LST最大值合成产品,逐像素取最小值,生成多年旬尺度LST最大-最小值合成产品;通过多年旬尺度NDVI和LST最大值合成产品确定研究区域VTCI的热边界,通过多年旬尺度NDVI最大值合成产品和多年旬尺度LST最大-最小值合成产品确定VTCI的冷边界,以此计算旬时间尺度的VTCI[8,23]

(1)

其中

Lmax(Ni)=a+bNi

(2)

(3)

式中VTCI——条件植被温度指数

Ni——某一像素的NDVI值

L(Ni)——研究区域内某一像素的NDVI为Ni时的地表温度

Lmax(Ni)、Lmin(Ni)——研究区域内当NDVI等于Ni时的所有像素地表温度的最大值和最小值,分别称作热边界和冷边界

a、b、a′、b′——待定系数,由研究区域NDVI和LST的散点图近似获得

根据冬小麦生育时期的划分,逐像素取某一生育时期包含的多旬VTCI的平均值作为该生育时期的VTCI值。依据关中平原县(区)的冬小麦种植区分布图,取各县域内冬小麦种植区所包含像素的VTCI平均值作为该县该年该旬或该生育时期的VTCI。

1.2.4时间序列LAI和FPAR生成

选取2011—2020年每年3—5月的MODIS MCD15A3H产品进行LAI和FPAR的提取,该产品是基于Terra和Aqua卫星上的MODIS传感器获得的,空间分辨率为500 m,时间分辨率为4 d。该产品虽采用最大值合成法消除了部分大气的影响,但受云、雨天气状况以及水蒸气及下垫面的影响,导致某些时间段LAI和FPAR波动较大,不能反映植被LAI和FPAR的真实情况,其时间序列也不能体现相应的变化规律,应用上包络线Savitzky-Golay(S-G)滤波对LAI和FPAR数据进行平滑去噪处理,经过滤波处理后的LAI和FPAR曲线变化平稳,符合冬小麦的实际生长规律[24]。

VTCI与FPAR的范围均为0~1,为使LAI与VTCI和FPAR具有相同的取值范围,对S-G滤波后的LAI进行归一化处理。逐像素取各旬所包含的多时相LAI和FPAR的最大值作为各旬的LAI和FPAR,逐像素取某一生育时期包含的多旬LAI和FPAR的最大值作为该生育时期的LAI和FPAR。根据关中平原行政区划图和冬小麦种植区分布图,分别计算各县(区)内所包含所有像素的LAI和FPAR的平均值作为该县该年该旬或该生育期的LAI和FPAR。

由于VTCI与LAI和FPAR的空间分辨率不一致,故采用最邻近法将VTCI重采样为500 m空间分辨率。此外,VTCI、LAI和FPAR的范围在0~1之间,而冬小麦单产范围在2 000~7 000 kg/hm2之间,因此,通过归一化将冬小麦单产数据统一到[0,1]范围。

1.3 研究方法

1.3.1GRU模型构建

RNN能够挖掘数据中的时序信息以及语义信息,是一类用于处理时间序列数据的神经网络。GRU是一种特殊类型的RNN网络,GRU模型结构如图2所示,每个GRU都有单独的更新门(Zt)和重置门(rt)。GRU能够学习捕获不同时间尺度上的依赖关系,继承RNN的递归属性,充分利用时序数据的内在特征,并解决RNN网络中的长依赖问题[25]。同时,GRU较LSTM参数少,结构相对简单,却也能够达到与LSTM相当的功能,且更容易训练[26]。

图2 GRU模型的结构图Fig.2 Structure diagram of GRU model

Zt=σ(WZ[ht-1,xt])

(4)

rt=σ(Wr[ht-1,xt])

(5)

(6)

(7)

yt=σ(Woht)

(8)

式中σ——sigmoid激活函数

Zt——t时刻更新门的状态

rt——t时刻重置门的状态

yt——t时刻模型的输出

xt——t时刻模型的输入

ht-1——上一时刻隐藏层的状态

ht——t时刻隐藏层的状态

WZ——更新门权重矩阵

Wr——重置门权重矩阵

Wo——输出层的权重矩阵

(9)

(10)

(11)

式中WZx——输入值到更新门的权重矩阵

Wrx——输入值到重置门的权重矩阵

在本研究中,使用Keras框架构建和训练GRU模型,模型包括1个输入层、2个GRU层、1个输出层。遥感参数表示为旬或生育时期尺度的时间序列,X={返青期,拔节期,抽穗-灌浆期,乳熟期}或X={3月上旬,3月中旬,3月下旬,4月上旬,4月中旬,4月下旬,5月上旬,5月中旬,5月下旬}。3个遥感参数(VTCI、LAI和FPAR)以三维张量的格式输入,以便进行GRU模型的训练,采用的三维张量(样本数量×时间步长×特征数量)的大小为216×4×3或216×9×3。将2011—2019年VTCI、LAI、FPAR和单产时间序列数据随机划分80%作为训练集和20%作为测试集,用于模型的训练和测试。对网络多次训练后发现,最优批尺寸为16,训练步为500个epochs,神经元数目为64,激活函数为tanh,初始学习率为0.001,优化器是Adam,损失函数为均方误差,同时,引入dropout并设置为0.2以避免网络训练过程中的过拟合,提高模型的泛化能力。通过训练最优设置下的GRU模型得到冬小麦长势综合监测指数I。

为分析在连续旬中逐步输入参数对产量估测的影响,进而识别冬小麦的关键生长阶段,使用2011—2018年的数据训练模型,通过在2019年连续旬中逐步输入VTCI、LAI和FPAR,以利用GRU结构捕获冬小麦生长的累积效应[27]。通过对比模型精度的提高程度,分析模型在每旬的产量估算性能,得到每旬输入参数对产量估测的重要性。

1.3.2模型性能评估

通过计算不同时间尺度输入参数下GRU模型的输出与目标向量间的决定系数(R2)和均方根误差(RMSE),得到不同时间尺度输入参数下GRU模型的测试集精度,以此评估构建的冬小麦长势综合监测指数I的精度。

为评估GRU模型的鲁棒性,采用5折交叉验证法,将2011—2019年VTCI、LAI、FPAR和冬小麦单产数据随机分为5组,将每个子集分别做一次测试集用来测试模型,余下的4组子集则作为训练集,计算每一次测试集的R2和RMSE来评估模型的性能。

基于最优模型得到的长势综合监测指数I,构建与冬小麦统计单产之间的线性回归模型,对关中平原2011—2019年各县(区)冬小麦单产进行估算,计算模型的R2、RMSE、平均相对误差(MRE)来评估冬小麦单产估测的精度,并进行逐像素的冬小麦单产估测,分析估测单产的年际变化和区域空间分布特征。

2 结果与分析

2.1 长势综合监测指数I构建

分别以冬小麦旬尺度或生育时期尺度的单参数(VTCI、LAI或FPAR)、双参数(LAI和FPAR、VTCI和LAI或VTCI和FPAR)及多参数(VTCI、LAI和FPAR)作为GRU模型的输入特征,冬小麦单产作为GRU模型的标签,构建长势综合监测指数I,得到不同时间尺度和输入参数下GRU模型精度(表1)。可以看出,旬尺度不同参数模型测试集的R2在0.30~0.62 之间,RMSE在0.11~0.15之间,且均达到极显著水平(P<0.01),表明旬尺度的不同参数模型可以从VTCI、LAI和FPAR中有效地学习与冬小麦长势相关的特征,通过模型的非线性映射关系得到较为准确的长势综合监测指数I。在单参数模型中,单FPAR模型精度最高;在双参数模型中,VTCI和FPAR模型精度最高,原因是FPAR比LAI更能反映冬小麦的光合作用能力,能够更好地表征作物长势,与单产相关性更大。双参数(LAI和FPAR)模型精度与单参数FPAR模型精度基本一致,多参数(VTCI、LAI和FPAR)模型精度与双参数(VTCI和FPAR)模型精度基本一致,原因可能是FPAR与LAI数据来源于同一MODIS产品,反演方法大致相同,且LAI与FPAR相关性很高。

表1 旬和生育时期尺度的GRU模型精度Tab.1 Accuracy of GRU models at different time scales

生育时期尺度不同参数模型测试集的R2在0.27~0.62之间,RMSE在0.11~0.16之间,且均达到极显著水平(P<0.01),可以看出,在单参数模型中,单FPAR模型精度最高;在双参数模型中,VTCI和FPAR模型精度最高。多参数GRU模型较双参数和单参数GRU模型精度有所提高,R2为0.62,RMSE为0.11,表明输入遥感参数越多模型精度可能越高,原因可能是冬小麦的生长发育过程受到多种因素的影响,多参数模型比双参数模型和单参数模型更能反映冬小麦生长过程的水分胁迫和生长状态信息,能较好地对冬小麦长势进行综合监测。生育时期尺度的多参数模型精度有所提高而旬尺度多参数模型精度提升不大,原因可能是旬尺度的VTCI和FPAR能够较充分地表征作物长势,且LAI与FPAR相关性较高,因此在添加LAI后模型可能没有学习到更多与冬小麦长势相关的特征;而生育时期尺度的参数包含的时间序列信息比旬尺度的参数少,因此添加LAI后模型能够学习到更多与冬小麦长势相关的特征,模型精度有所提高。此外,对于单参数和双参数模型,旬尺度的模型精度均高于对应生育时期尺度的模型精度,原因可能是生育时期尺度的参数是由某一生育时期所有旬逐像素取平均值或最大值得到的,旬尺度的参数可能更能反映出冬小麦主要生育期水分胁迫和生长状态的变化,能更好地体现冬小麦在主要生育期对环境因素季节性变化做出的反应,比生育时期尺度的参数包含了更充分的时间序列信息。对于多参数模型,不同时间尺度的模型精度基本一致,原因可能是旬尺度和生育时期尺度的FPAR作用均比较突出,模型能够充分学习与冬小麦长势及产量相关的特征。

综上所述,旬尺度的模型精度总体高于生育时期尺度的模型精度,FPAR更能反映冬小麦的光合作用能力,能够更好地表征作物长势。旬尺度的参数包含了更充分的时间序列信息,更能表征作物长势并预报产量,可以用于构建冬小麦长势综合监测指数I,进而估测研究区域冬小麦单产。

2.2 冬小麦单产估测模型精度评价

旬尺度的参数更能表征作物长势,且旬尺度的多参数GRU模型精度较高。采用5折交叉验证方法进一步验证该模型的鲁棒性(图3),结果显示,在5个子集中,R2的范围为0.49~0.62,RMSE的范围为0.12~0.14,且均达到极显著水平(P<0.01),表明子集之间的差异较小,R2和RMSE表现出良好的稳定性。

图3 5折交叉验证结果Fig.3 Five-fold cross-validation results

旬尺度的多参数GRU模型有较好的鲁棒性,能够较准确地构建冬小麦长势综合监测指数I,进而估测研究区域冬小麦单产。因此,以关中平原冬小麦单产数据作为因变量,以旬尺度多参数GRU模型输出得到的长势综合监测指数I作为自变量,构建冬小麦单产估测的线性回归模型(Y=4 116.82I+2 283.57),结果显示,冬小麦长势综合监测指数I与统计单产之间具有极显著的相关性(P<0.01),R2为0.62,RMSE为509.08 kg/hm2,表明基于长势综合监测指数I构建的冬小麦单产估测模型能够较准确地估测关中平原冬小麦产量。

为进一步评估估产模型的准确性,将估测单产与统计单产进行回归分析(图4),可以看出,统计单产与估测单产的散点图大致分布在1∶1线上,二者的R2为0.62,RMSE为509.08 kg/hm2,MRE为9.01%,通过显著性检验(P<0.01)且达到极显著水平。当统计产量高于5 000 kg/hm2时,模型估产精度有下降趋势,明显低于统计产量在2 000~5 000 kg/hm2范围内的估产精度,模型存在明显高产低估现象,原因可能是样本分布不平衡,关中平原24个县冬小麦产量主要分布在3 000~5 000 kg/hm2之间,高于5 000 kg/hm2的样本较少,导致模型倾向于学习中低产量特征,而学习到高产量的特征过少,从而产生高产低估现象。

图4 冬小麦估测单产与统计单产的线性回归分析Fig.4 Linear regression analysis between estimated and official yield records of winter wheat

为进一步分析模型在每年冬小麦单产估测方面的表现,对研究区域每年的冬小麦估测单产精度进行比较(表2),结果表明,2018年估测单产精度明显低于其他年份,原因是2011—2019年冬小麦估测单产的最大绝对误差出现在2018年西安市阎良区,达到-1 499.38 kg/hm2,且2018年永寿县冬小麦产量较以往年份减少600 kg/hm2,导致模型无法捕获到更多与产量相关的特征,导致估产精度降低。2011年、2013年和2019年冬小麦估测单产精度较高,原因是这几年产量多分布在2 000~5 000 kg/hm2范围内,没有过多高产量且产量相差不大,模型能够充分捕获与产量相关的特征。

表2 2011—2019年研究区域估测单产与统计单产间的精度比较Tab.2 Comparison of accuracy between estimated and official yield records in study area from 2011 to 2019

2.3 累积效应对产量估测的影响

为进一步分析冬小麦每个生长阶段综合多个遥感参数表征冬小麦主要生育期的长势及产量的能力。通过在2019年连续旬中逐步输入VTCI、LAI和FPAR,对模型在每旬的产量估算性能进行比较(图5),结果显示,每旬的输入参数对产量估测的影响程度不同; 3月上旬到3月中旬模型精度提升不大,原因可能是该旬水分胁迫对于单产的影响存在滞后效应,对产量的影响可延期至后几旬,即在该时期发生一定程度的水分胁迫不会对作物生长造成太大的影响,反而能够提高作物在生育后期的水分利用效率,使产量增加;另一原因可能是训练数据量少,模型没有捕捉到与长势及产量相关的特征。3月下旬至4月中旬期间,冬小麦处于拔节期,每旬模型精度均大幅提高,说明3月下旬至4月中旬对冬小麦产量的影响最为重要。该时期是冬小麦根、茎、叶生长的主要阶段,对土壤中水分的吸收利用最为迫切,冬小麦绿叶的正常生长对于干物质的积累和产量生成至关重要[28]。4月下旬时模型精度也有明显提高,原因是随着冬小麦生长发育时期的推进,冬小麦从营养生长阶段向生殖生长阶段过渡,需要大量的水分和养分,是冬小麦产量形成的关键时期[29]; 5月中旬过后,穗粒结构已经形成,需水量相对较小,对水分胁迫表现出一定的耐受性,相较于生殖生长阶段前期,与单产间的相关性略小。

图5 冬小麦产量估测累积效应Fig.5 Cumulative effect of winter wheat yield estimation

此外,可以看出5月下旬时仅比5月上旬时模型R2提高了0.02,表明在冬小麦成熟前20 d可以提供较为准确的预测结果,为冬小麦早期预测提供了可能,对农产品的收获、加工、储存、运输和销售等意义重大。

2.4 冬小麦估测单产时空变化分析

基于旬尺度的多参数GRU模型逐像素模拟关中平原冬小麦长势综合监测指数I,进而估测2011—2020年冬小麦产量(图6),结果表明,从研究区域冬小麦单产的年际变化看,2011—2020年冬小麦产量呈现个别年份波动,整体保持稳定且平稳增长的趋势,然而2013年的冬小麦产量明显低于其他年份,原因是2013年陕西省遭受了严重的气候干旱,在冬小麦生育期内研究区域平均降水量为243.78 mm,明显低于其他年份的降水量,且气温小幅升高,严重影响了冬小麦生长发育,导致冬小麦产量显著下降。2018年冬小麦播种期间,关中平原连续阴雨天气,部分地区冬小麦难以下种,受播种面积下降及来年旱情影响,2019年冬小麦产量明显低于2017年和2018年产量。从研究区域的空间分布看,关中平原冬小麦产量具有西高东低的特征,西部地区的凤翔县、岐山县和扶风县冬小麦产量及中部地区的西安市高陵区、阎良区冬小麦产量较高,东部地区的白水县、澄城县冬小麦产量较低。西部和中部地区是关中平原作物种植的主要区域,估产空间分布特征与实际情况相符,这表明基于旬尺度VTCI、LAI、FPAR的GRU模型构建的长势综合监测指数I能够较好地估测关中平原冬小麦产量。

图6 基于长势综合监测指数I的关中平原冬小麦单产估测结果Fig.6 Yield estimation of winter wheat based on growth comprehensive monitoring index I

3 讨论

GRU神经网络的时间序列结构可以揭示累积和非线性效应,本文将与作物长势密切相关遥感参数(VTCI、LAI和FPAR)聚合到旬或生育时期中作为模型的输入,利用旬或生育时期尺度不同输入参数的GRU模型构建冬小麦长势综合监测指数I,结果表明,旬尺度模型精度总体上较生育时期尺度模型精度高,原因是旬尺度参数更能表征作物长势并进行产量预报;输入与作物长势密切相关的参数越多模型精度可能越高,模型学习到与产量相关的特征可能越多,然而在冬小麦的生长过程中受到多种因素的影响,未来研究可以进一步综合考虑与冬小麦单产相关性较大的其他因素(气象数据、土壤养分数据等)。

由于缺乏地面实测产量数据和历史产量数据,GRU模型在训练过程中的学习信息不足。随着未来监测数据的积累,可以获得更多的学习样本,未来研究可以加入灌溉样点和旱作样点的数据来进一步提高GRU模型的性能,从而使GRU模型能够更好地学习数据特征。同时,由于训练样本少且分布不平衡,导致模型学习到高产量特征过少,一些县(区)出现明显的高产低估现象,未来研究可以使用生成式对抗网络(Generative adversarial networks,GAN)等数据增强方法来进行样本集的扩充并降低数据的不平衡度,进一步提高冬小麦长势综合监测和产量估测的精度。

深度学习的低可解释性使其成为一个“黑匣子”,难以确定所提取特征的具体意义[30],然而在农业领域,了解参数如何影响或表征作物产量至关重要。本文利用GRU结构捕获冬小麦生长的累积效应,通过在连续旬中逐步输入参数来分析模型精度的提高程度,进而识别冬小麦关键生长阶段,该方法有一定的探索性和创新性,但仍难以评估各输入参数在产量估测方面的相对重要性,未来可以对多年的累积效应进行研究,分析冬小麦在干旱年、湿润年和正常年的不同生长阶段对产量估测的影响,也可以采用注意力网络等来说明深度学习的过程。此外,作物生长模型集成了作物生理学和农学的先验知识,可以采用将GRU与基于统计和过程的作物模型结合的方法,进一步提高深度学习的可解释性[11]。

4 结论

(1)旬或生育时期尺度的不同输入参数模型可以从VTCI、LAI和FPAR中有效地学习与冬小麦生长和产量相关的特征。旬尺度的模型精度总体高于生育时期尺度的模型精度,旬尺度的多参数GRU模型具有良好的鲁棒性且精度较高,基于该模型的非线性映射关系得到的长势综合监测指数I估测冬小麦单产,结果显示,冬小麦估测单产与统计单产的R2为0.62,RMSE为509.08 kg/hm2,MRE为9.01%,并通过显著性检验(P<0.01)且达到极显著水平,表明GRU模型具有综合遥感多参数估算冬小麦产量的潜力。

(2)利用GRU结构捕获冬小麦生长的累积效应,结果表明,在冬小麦的不同生长阶段,每旬的输入参数对产量的影响程度不同,其中,3月下旬至4月下旬是冬小麦生长的关键时期。

(3)基于旬尺度的多参数GRU模型逐像素模拟关中平原冬小麦长势综合监测指数I,并进行逐像素的冬小麦单产估测,结果表明,冬小麦产量分布呈现西高东低的空间特性和整体保持稳定且平稳增长的年际变化特征。

猜你喜欢
单产长势冬小麦
结瓜盛期“歇茬” 恢复长势有“方”
山西夏收全面完成 总产单产好于常年
山西270多万公顷秋粮长势良好
2022年山西省冬小麦春季田间管理意见
冬小麦田N2O通量研究
冬小麦的秘密
如冬小麦般耐心
中国花生新品种应用技术进步率的影响研究
论提高广西农垦国有龙北总场红江橙单产途径
如何防治黄瓜长势不一