段姗姗
河南科技大学,河南 洛阳 471000
粮食产量的提升不仅影响我国人民生活水平的提升,而且与国民经济发展有着密切关系[1]。河南省作为农业大省,其粮食生产在全国范围内占据重要地位。因此,探讨河南省粮食产量影响因素、变化情况及预测未来趋势对粮食产量的稳定及提升有十分重要的意义。
对于粮食产量的影响因素及预测,许多学者提出了不同的观点。在粮食产量影响因素方面,朱坤林等[1]依据灰色关联分析基本原理,以2008—2020 年商丘市粮食产量及相关指标为研究对象,分析商丘市粮食产量的影响因素。杨凡雨等[2]利用湖南省统计数据,运用灰色关联分析法筛选关联性较强的影响因素,并建立GM(1,N)预测模型预测粮食产量,发现粮食产量受国家政策、农业机械总动力的影响最大。Zhang等[3]根据山东省60 余年粮食产量数据,对影响粮食产量的主要因素进行分析,认为影响粮食总产量的最主要因素为单产。在粮食产量预测方面,许德刚等[4]对比分析了时间序列法等4 种分析方法在粮食产量预测方面的优劣势,并对粮食产量预测的发展进行了总结和展望。胡启帆等[5]运用主成分分析法分析了粮食产量的变化特点和影响因素,并运用灰色模型预测了洛阳市未来5 年的粮食产量。曹存梁[6]基于灰色关联分析-影响因子共线性判断-变量选择-多元线性的组合预测模型对2014—2017年河南省粮食产量进行预测,基于GM(1,1)和反向传播(Back Propagation,BP)神经网络的组合模型预测未来一段时间的影响因子和产量数据。Michael 等[7]利用卫星数据和机器学习方法构建了加拿大草原作物产量预测模型,并且对比分析了线性机器学习和非线性机器学习法对作物产量的预测效果,用归一化植被指数预测作物产量,发现归一化植被指数是较好的预测指标,线性模型比非线性模型在作物产量预测中更有优势。
在分析粮食产量影响因素时,大多数学者选择了播种面积、农业机械总动力、农村用电量等指标。在预测粮食产量时,较多学者采用了灰色关联模型。这为研究河南省粮食产量影响因素的指标选取和粮食产量预测方法选取提供了思路。现阶段,我国较少学者对河南省粮食产量影响因素及预测进行研究。因此,笔者在前人研究的基础上选取2002—2021 年河南省粮食生产的相关数据,进行回归分析和差分自回归移动平 均(Autoregressive Integrated Moving Average,ARIMA)预测,以探讨河南省粮食产量影响因素,并对粮食产量进行预测。
河南省处于中国中东部、华北平原以南黄河中下游地区。河南省地形复杂,地势西高东低、北坦南凹,北、西、南三面有太行山、伏牛山、桐柏山、大别山四大山脉环绕,间有陷落盆地,中部和东部为辽阔的黄淮海冲积平原。河南省的气候具有四季分明、雨热同期、复杂多样、气象灾害频繁的基本特点。
河南省是我国的粮食大省,粮食播种面积和粮食产量均位于全国前列。2021 年,河南省粮食播种面积为1 077.231万hm2,全年粮食总产量为6 544.20万t。
2002—2021 年河南省粮食播种面积和粮食产量整体变化趋势如图1 所示。由图1 可知,2002—2008年,河南省粮食播种面积呈平稳增长趋势;2008—2010年,河南省粮食播种面积逐步减少;2010—2016 年,河南省粮食播种面积又呈现平稳增长趋势;2016—2021年,河南省粮食播种面积表现出增减波动的发展趋势,但波动幅度不大。2003 年,河南省粮食产量下降且相较于2002 年下降了640.51 万t,波动幅度较大;2003—2020年呈波动上升的趋势;2020—2021年呈下降趋势。
图1 2002—2021河南省粮食播种面积及产量变化趋势
图2 粮食产量模拟拟合和预测
影响粮食产量的因素较多。笔者在查阅相关资料后,最终选取河南省粮食产量作为因变量,资源因素、技术因素和人力因素作为自变量。资源是粮食产量的基础条件,但随着社会的发展,粮食播种面积受限,在这种情况下,加强技术因素方面的投入可以减少这些限制,同时人力资源的改善对粮食产量有一定贡献。因此,笔者选取粮食播种面积作为资源因素的指标;选取农业机械总动力、农用塑料薄膜使用量、有效灌溉面积、农药使用量、化肥折纯量、农村用电量作为技术因素的指标;选取第一产业就业人员作为人力因素的指标(见表1)。
表1 河南省粮食产量影响因素指标体系
该研究的数据来源于《中国统计年鉴》(2003—2022年)和《河南省统计年鉴》(2003—2022年)。
Pearson 相关性分析是一种常用的统计方法,用于衡量两个变量之间的线性关系强度和方向。它基于协方差的概念,通过计算两个变量的协方差除以它们各自的标准差的乘积,得到一个范围在-1~1 的相关系数。Pearson 相关性检验可以帮助研究人员了解变量之间的关系,从而帮助他们进行更深入的研究。该研究各变量的Pearson相关性检验结果如表2所示。
表2 Pearson相关性检验
由表2可知,农药使用量与粮食产量的相关系数为0.400,没有显著相关性,因此剔除该因素后继续分析。
对时间序列数据进行单位根检验的目的在于判断时间序列是否平稳。如果检验结果存在单位根,则说明时间序列数据是非平稳的。笔者对该研究进行二阶差分单位根检验,该研究的单位根检验结果如表3所示。
瑞士有很多传统的奶酪饮食,其中奶酪火锅就是其中最著名的一款。如果说瑞士有什么美食的话,那一定首推奶酪火锅。瑞士盛产奶酪,而且法令规定一个地区只能生产该地区产的奶酪,因此瑞士的奶酪直至今日仍能够保持极其传统的风味,且不同地区的奶酪味道各不相同。
表3 单位根检验
由表3 可知,基于因变量粮食产量的一阶差分临界值在1%水平上呈现显著性,因此拒绝原假设,该序列为平稳的时间序列,可以进行统计建模。
该研究的线性回归结果如表4所示。
表4 线性回归结果(n=20)
由表4 可知,各变量的方差膨胀系数(Variance Inflation Factor,VIF)均大于5,说明影响因素存在多重共线性,因此进行逐步回归解决多重共线性问题。
逐步回归是以线性回归为基础的方法。其思路是将变量一个接着一个引入,并在引入一个新变量后,对已入选回归模型的旧变量逐个进行检验,将认为没有意义的变量删除,直到没有新变量引入也没有旧变量删除,从而保证回归模型中每一个变量都有意义。该研究的逐步回归结果如表5和表6所示。
表5 逐步回归
表6 逐步回归结果(n=20)
由表6 可知,P值为0.000,在1%水平上呈现显著性,拒绝回归系数为0 的原假设。对于变量共线性表现,VIF全部小于10,因此模型没有多重共线性问题,模型构建良好。模型公式为
基于以上回归分析结果,建立ARIMA 模型对河南省2023—2032年粮食产量进行预测。
ARIMA 作为时间序列分析中十分经典的方法之一,被应用于未来数值的预测。
ARIMA模型的基本原理可以用式(2)表示。
式(2)中:AR(p)表示自回归模型,I(d)表示差分模型,MA(q)表示移动平均模型。ARIMA 模型通过对时间序列的分析与拟合,估计出合适的模型参数,从而进行数据预测和建模。
以2002—2021 年河南省粮食产量数据为例,建立ARIMA 拟合模型,并通过拟合模型建立预测模型,得出(1,1,0)为最优结果,残差为白噪声。
根据所建模型对2023—2032 年河南省粮食产量进行预测,结果如表7所示。
表7 2023—2032年河南省粮食产量预测值
由表7 可知,河南省2023—2032 年粮食产量将呈现平稳增长趋势,发展趋势良好。
笔者基于2002—2021 年数据对河南省粮食产量变化趋势进行分析,并采用逐步回归分析,对影响河南省粮食产量的因素进行研究,最后利用ARIMA 模型对河南省未来粮食产量进行预测,得出以下主要结论。
第一,第一产业就业人员与播种面积对河南省粮食产量影响较大,因此建议持续推进高素质农民教育,培养新型职业农民;坚持耕地红线不动摇,稳定粮食播种面积。
第二,预测结果显示,河南省2023—2032 年粮食产量将呈现平稳增长趋势,发展趋势良好。