田东霞 曹久才
(1 北京市昌平区气象局,北京 102200;2 北京市门头沟区气象局,北京 102308)
果业生产是中国现代农业发展的重要组成部分,气候变化对果业发展有着重要影响。 目前,许多学者用不同方法开展了产量预测工作, 并针对产量预测方法提出了建议:李蓬勃等[1]研究了BP 神经网络和多元线性回归的产量预测模型, 并对比了不同统计方法下的模型预测误差;庄 星等[2]运用混合群智能算法优化了神经网络预测模型, 降低了产量预测误差;李 环等[3]基于NARX 神经网络建立了粮食产量预测模型,取得了较好的效果;苏 博等[4]运用GM(1,N)灰色系统与BP 神经网络方法进行了粮食产量预测比较研究,并分析了其预测能力;伍丹华等[5]以粮食种植面积、农药施用量、化肥施用量、农业机械化总动力、 农用排灌动力机械等5 个指标为神经网络输入值建立了预测模型,并进行了产量预测。
本项目结合北京市昌平区近15 年的气象数据对苹果产量进行预测, 旨在为苹果防灾减灾和产业发展提供合理化建议,指导苹果生产趋利避害,有效增加苹果产量,提高苹果产业气象服务水平,为苹果产业科学应对气候变化提供决策依据, 从而更好地为农村稳定、农业增产、农民增收提供针对性和专业性的气象服务,全面助力乡村振兴。
1.1.1产量资料。 昌平区苹果产量数据资料来源于北京市昌平区统计局,包括苹果种植面积和总产量。苹果总产量受种植面积的影响, 因而采用单产数据(总产量/种植面积)分析产量与气象因子的关系。
1.1.2气象资料。 苹果生育期分为萌芽至开花期(3 月25 日至4 月30 日)、坐果期(5 月)、果实生长前期(6 月)、果实生长后期(7 月)、膨大期(8 月)、着色前期(9 月)、着色后期(10 月)。影响苹果产量的因素有很多, 本文选取苹果生长过程中所需要的光、热、水等气象因素进行分析。气象资料来源于昌平国家地面气象观测站,包括2004—2018 年逐月平均温度、最高气温、最低气温、气温日较差、极端最高气温、极端最低气温、日照时数、降水、湿度等数据。
运用逐步回归法和BP 神经网络建立苹果产量预测模型, 运用2004—2018 年产量数据进行运算,运用2019—2020 年产量数据进行模型检验和对比。
多元逐步线性回归是将全部自变量引入方程后,根据自变量对因变量影响程度的大小,利用相关显著性检验系数依次剔除无显著意义的自变量,最终筛选出最具有统计学意义的自变量并建立回归模型,以反映多个自变量与因变量之间的相关关系。
将可能影响昌平区苹果产量的光、 热等气象因子作为自变量x、苹果单产量为因变量y进行逐步回归分析。 通过逐步回归法挑选出4 个影响苹果产量的关键气象因子,分别为4 月平均最低气温、8 月平均气温、10 月平均最低气温、10 月累计日照时数。根据2004—2018 年的关键气候因子资料和产量数据建立苹果产量预测模型, 得到苹果产量的回归模型及相关系数、F检验结果。 方程通过了显著性检验(P<0.05),相关系数R为0.824,F为6.34,显著性水平P为0.005 6。 结果表明,回归模型对产量预测精度较高,预测模型的相关性和拟合效果好,显著性水平值P<0.05,故总体预测效果较好。四因子拟合方程为:
式中,y为苹果单产(kg/hm2),x1、x2、x3、x4分别为8 月平均气温(℃)、10 月平均最低气温(℃)、10 月累计日照时数(h)、4 月平均最低气温(℃)。
BP 神经网络(back-propagation network)又称反向传播神经网络,即通过对样本数据进行训练,不断修正网络权值和阈值, 使误差函数沿负梯度方向下降,逼近期望输出,循环直到误差达到允许的范围之内或训练次数达到预先设计的次数为止[6]。 BP 神经网络是一种多层的前馈神经网络,主要包含输入层、隐含层和输出层。每一层都由若干个节点组成,模型结构如图1 所示。
本文选用MATLAB 中的神经网络工具箱进行网络训练。 为了加快神经网络的收敛速度, 使用premnmx 函数对原始数据进行归一化处理。 该模型利用2004—2018 年数据进行运算,以逐步回归法选出的影响苹果产量的4 个气象因子数据指标作为输入,以研究的预测产量指标作为输出,因而输入层的节点数为4、输出层的节点数为1,根据经验公式确定隐含层的节点数为5, 网络迭代次数为5 000 次,期望误差为0.000 000 1。 经验公式如下:式中,n1为隐含层节点数,n为输入层节点数,m为输出层节点数,k为1~10 之间的调节常数。
利用2019—2020 年数据进行检验:逐步回归预测模型计算得出的2019 年预测产量平均误差为21%,2020 年预测产量平均误差为15.5%;BP 神经网络预测模型计算得出的2019 年预测产量平均误差为3.8%,2020 年预测产量平均误差为12.4%(表1)。 通过2 年数据可以看出,利用BP 神经网络预测模型反演得到的苹果产量与实际产量吻合度更高,较逐步回归法具有更高的预测精度。
表1 逐步回归法和BP 神经网络预测模型检验结果
利用2004—2020 年数据分析对比2 种预测模型(图2),可以看出,2 种预测模型拟合效果均较好,均能较好地预测今后苹果产量趋势,且BP 神经网络模型预测更接近实际产量。 通过实际产量与预测产量的相关性分析可看出: 逐步回归模型的预测产量与实际产量相关性分析方程斜率为0.715 9,拟合度(R2)为0.657 2(图3),预测结果的平均相对误差为11.6%;神经网络模型具有高度非线性和较强的泛化能力,BP 神经网络的模型预测结果优于逐步回归法模型,神经网络预测模型相关性分析方程斜率较大(为1.016 9)、截距最小,拟合度(R2)为0.971 6(图4),预测产量平均相对误差较小(2.2%)。
但是,BP 神经网络模型存在一定的局限性,其缺少对主导预测因子进行筛选的功能[4],只能依照逐步回归法得出的结果, 将挑选出的影响苹果产量的关键气象因子(4 月平均最低气温、8 月平均气温、10 月平均最低气温、10 月累计日照时数)作为神经网络输入层参数,也存在收敛速度慢、迭代步数多、易于陷入局部极小等缺点。
本文运用逐步回归法和BP 神经网络建立苹果产量预测模型。通过检验发现,2 种模型拟合效果均较好,均能较好地预测今后苹果产量趋势。 BP 神经网络模型有较高的预测精度, 但存在一定的局限性。 产量预测能有效指导苹果生长发育过程中针对气候进行趋利避害,为果农进行苹果生产管理提供参考。