基于ARIMA 模型的贵州省玉米产量预测研究

2022-09-21 12:29耿芳艳蔡仕茂
作物研究 2022年4期
关键词:播种面积单产残差

耿芳艳,蔡仕茂

(1 贵州大学经济学院,贵州 贵阳 550025;2 贵阳人文科技学院经济与管理学院,贵州 贵阳 550025)

新中国成立以来,我国玉米的单产和总产远高于其他发展中国家,杂交品种的普及率约为95%。我国也是世界上玉米播种面积和单产增长最快、最多的国家。玉米作为贵州省的第二大粮食作物,也是食品、饲料以及工业的兼用原料,播种面积仅次于水稻。自改革开放以来,贵州省玉米产量总体趋势为不断上升。“十五”期间,贵州省新育成玉米杂交品种产量大幅度增加,呈逐年稳步上升的趋势;单产水平与全国平均水平之间的差距呈递减趋势,但仍落后于全国平均水平。贵州省玉米种植范围广、生育期长、限制因素多[1]。土壤[2]、水分[3]、品种[4]、气候[5]、施肥[6]、耕作管理[7]等是影响玉米生长的关键因素,而干旱是影响贵州省玉米产量的最主要的农业气象灾害之一[8]。玉米从萌发到出苗这一时期对水分最敏感,该时期缺水常造成玉米苗生长缓慢,并导致减产20%左右,影响严重的年份甚至减产达40%~50%[9]。

近年来,农村劳动力的转移、田间杂草得不到有效管理、栽培技术落后等因素均导致了玉米减产,制约了玉米单产的增加[10]。播期和密度搭配不合理也是严重影响产量、造成减产的原因[11-12]。另外,在《调减玉米三年行动方案(2018-2020 年)》实施以后,贵州省的玉米播种面积大幅度减少,导致总产减少。目前,对贵州省玉米产量的研究主要集中在育种[13]、栽培[14]、耕作措施[15-16]、灾害风险分析[17]、评估[18-19]及影响因素分析等方面,主要基于实验室和田间试验等方法,较少运用计量模型开展研究,基于自回归移动平均模型(ARIMA)的研究更为罕见。

玉米作为贵州省的主要粮食作物之一,在人口增长和耕地减少的情况下,提高其产量越来越重要。而预测分析贵州省未来玉米的总产、单产和播种面积,对指导玉米的研究及生产、保证贵州省玉米生产的可持续发展具有现实意义。本研究利用ARIMA模型对贵州省2021—2025 年玉米播种面积和产量进行预测,分析玉米播种面积和产量提升空间,为贵州省玉米稳产增产提供依据。

1 数据来源与研究方法

1.1 数据来源

本研究的分析对象为贵州省1949—2020 年玉米总产、单产和播种面积统计数据,数据来源于国家统计局和贵州省统计年鉴。

1.2 研究方法

本研究采用自回归移动平均模型ARIMA(p,q,d)预测分析贵州省玉米单产、总产和播种面积,其中,p、d 和q 分别为自回归项数、时间序列成为平稳序列时所做的差分次数和移动平均数。根据p、q和d 值来确定ARIMA 模型的具体表达式,其模型的数学表达式为:

式中:∇d=(1-B)d;Φ(Β)=1-Ø1B-…-ØpBp,为平稳可逆ARMA(p,q)模型的自回归系数多项式;Θ(Β)=1-θ1B-…-θpBq,为平稳可逆ARMA(p,q)模型的移动平滑系数多项式。

本研究运用R 语言软件构建ARIMA 模型,基于基期(1949—2020 年)数据预测未来5 年(2021—2025 年)贵州省玉米产量和播种面积。具体逻辑步骤如下:首先,为消除异方差,对1949—2020 年贵州省玉米产量统计值取对数,并对该时间序列进行平稳性检验,如果检验不平稳,可对原序列进行差分,直至序列平稳。其次,在以上步骤的基础上建立平稳时间序列的基础模型,再根据赤池信息准则选择AIC值最小的基础模型构建相应的ARIMA(p,d,q)模型,用于拟合1949—2020 年贵州省玉米产量及播种面积。最后,应用赤池信息准则选择AIC值最小的模型ARIMA(p,d,q)对2021—2025 年玉米产量及播种面积进行预测分析。

根据ARIMA 模型的(平稳)随机过程理论,时间序列变量只有平稳时才具有统计科学意义上的时间趋势。运用ARIMA 模型对1949—2020 年贵州省玉米产量进行建模,并预测分析2021—2025 年玉米产量,应遵循如下操作流程(图1)。

图1 贵州省玉米总产、单产及播种面积建模流程Fig.1 Modeling process of total maize yield,yield and sown area in Guizhou Province

2 结果与分析

2.1 贵州省1949—2020 年玉米的总产、单产及播种面积变化

1949—2020 年贵州省玉米单产和总产整体呈上升趋势,尤其是20 世纪90 年代上升较快。其中总产从1949 年的60.1 万t 上升至2020 年的220.3万t;单产从1949 年的912.4 kg/hm2上升到2020年的4 393.1 kg/hm2;总产为2016 年达到最高值(456.4 万t)之后下降,2020 年仅220.3 万t;单产为2002 年最高(4 876.3 kg/hm2),之后下降,直至2016 年又逐渐上升。1949—2017 年的播种面积在轻微波动中整体呈上升趋势,从1949 年的65.87 万hm2上升到2017 年的100.64 万hm2,其在2016 年达到最高值(104.16 万hm2)后下降,2020 年仅50.15 万hm2。2018 年开始,贵州省玉米总产和播种面积一直下降,造成该问题的原因可能是2018—2020 年贵州省实施调减玉米3 年行动方案,播种面积大幅度减少,导致总产降低。

2.2 贵州省2021—2025 年玉米总产预测

2.2.1 贵州省1949—2020 年玉米总产“时间序列”平稳性检验

运用R 语言软件对1949—2020 年贵州省玉米总产统计值(记为y)序列进行建模分析,采用时序图对序列(y)进行时间序列的平稳性检验。序列(y)随时间变化表现出明显的递增趋势,为非平稳时间序列。为了消除原始数据的异方差,对贵州省玉米总产统计值取对数(记为lny),并运用ADF 单位根检验方法对序列(lny)进行时间序列的平稳性检验。结果表明:对贵州省玉米总产统计值取对数后为非平稳时间序列,再对lny进行一阶差分(记为diff.lny),得到的序列(diff.lny)为平稳时间序列(表1)。

表1 总产统计值的对数序列的ADF 单位根检验Table 1 ADF unit root test of logarithmic series of total output statistics

基于序列(diff.lny)建立贵州省玉米总产的预测基础模型。画出序列(diff.lny)的自相关和偏自相关图。序列(diff.lny)的自相关和偏自相关系数延迟1 阶后始终控制在2 倍标准差的范围以内,因此,采用ARMA(1,1)、AR(1)和MA(1)3 种基础模型对1949—2020 贵州省玉米总产统计值序列(y)进行建模分析。

2.2.2 贵州省玉米总产预测模型的构建

为了从3 种基础模型中选择最佳模型构建预测模型,分别对3 种基础模型的AIC值进行比较(表2)。虽然MA(1)模型的AIC值最低(721.93),但MA(1)模型存在过度拟合的现象,所以选择AIC值次之(721.93)的ARMA(1,1)模型对贵州省玉米总产1949—2020 年统计值序列进行拟合。然后基于ARMA(1,1)模型构建ARIMA(1,1,1)预测模型xt=0.341 7xt-1+εt-0.651 8εt-1,εt~N(0,141 7),并基于ARIMA(1,1,1)模型预测分析2021—2025 年贵州省玉米总产情况。

表2 总产预测基础模型的AIC 值Table 2 AIC values of the basic model for total production forecast

贵州省玉米总产ARIMA(1,1,1)预测模型残差的ADF 单位根检验结果如表3 所示。该模型残差序列平稳性检验P值大于0.05,所以,接受残差序列为白噪声序列(纯随机性)的原假设,表明模型的残差序列平稳,通过显著性检验。为此,ARIMA(1,1,1)模型可用于拟合1949—2020 年、预测2021—2025 年贵州省玉米总产。

表3 总产预测模型残差的单位根检验Table 3 Unit root test of residuals of total production forecasting model

2.2.3 贵州省玉米2020—2025 年总产预测结果分析

运用ARIMA(1,1,1)模型预测2021—2025 年贵州省玉米总产,2021—2025 年贵州省玉米总产预测值分别为247.95 万、257.38 万、260.60 万、261.71万和262.08 万t,明显高于前3 年,且呈现逐年上升的趋势。

2.3 贵州省2021—2025 年玉米单产和播种面积预测结果分析

基于1949—2020 年贵州省玉米单产的对数值(记为lnz)序列的差分(记为diff.lnz)建立基础模型ARMA(2,1)、MA(1)、ARMA(1,1)、AR(2)和AR(1),其AIC值分别为1 043.2、1 042.0、1 041.84、1 041.48和1 040.36,选择AIC值最小的基础模型RA(1)构建ARIMA(1,1,0)模型。ARIMA(1,1,0)模型残差序列的平稳性检验P值大于0.05,所以接受残差序列为白噪声序列(纯随机性)的原假设,表明该模型的残差序列平稳,通过显著性检验。为此,ARIMA(1,1,0)模型可用于拟合1949—2020 年、预测2021—2025 年贵州省玉米单产。根据该模型预测的结果,贵州省2021—2025 年的玉米单产的预测值分别为4 386.13、4 389.37、4 389.37、4 387.86、4 388.56和4 388.24 kg/hm2。

基于贵州省1949—2020 年玉米播种面积的平稳时间序列(记为x)建立基础模型ARMA(4,1)、AR(1)和MA(4),其AIC值分别为810.07、808.73和805.58,选择AIC值最小的基础模型MA(4)构建ARIMA(0,0,4)模型。ARIMA(0,0,4)模型残差序列的平稳性检验P值大于0.05,所以接受残差序列为白噪声序列(纯随机性)的原假设,表明模型的残差序列平稳,通过显著性检验。为此,ARIMA(0,0,4)模型可用于拟合1949—2020 年、预测2021—2025 年贵州省玉米播种面积。应用该模型进行预测,贵州省2021—2025 年玉米播种面积分别为47.72万、55.13 万、70.56 万、69.89 万和70.02 万hm2。

2.4 贵州省1949—2025 年玉米生产态势

如图2 所示,1949—2017 年,贵州省玉米播种面积在轻微波动中上升,而2018—2021 年急剧下降,预计2021 年降到最低(47.72 万hm2),到2012—2025 呈现逐渐上升的趋势。播种面积1949—2006年基本保持不变,2007—2016 年不断增加,2016-2021 年逐渐减少,2022 年又开始上升。1949—2025年,贵州省玉米总产和单产均在波动中提高,二者几乎同步,但总产的波动更大些;2021—2025 年贵州省玉米总产和单产波动较小,基本处于平衡状态。通常情况下,总产的多少与播种面积和单产有关。随着科学技术和生产投入的增加,单产水平呈不断提升的趋势;而播种面积受退耕还林、作物轮作、政策指导性休耕和种植结构调整等因素影响,所以既可能增加也可能减少。

图2 贵州省1949-2025 年玉米总产、单产及播种面积变化趋势Fig.2 Variation trends of total corn yield,unit yield and sown area of Guizhou Province from 1949 to 2025

3 讨论

《贵州省调减玉米三年行动方案(2018-2020年)》指出:“要大规模减少玉米种植,彻底改变种植玉米的传统习性,因地制宜弥补食用菌、精品水果、蔬菜、茶叶、中药材、饲料等绿色优势产业”。因此,提高玉米单产有助于维持玉米的总产。本研究运用时间序列分析方法中的ARIMA(p,d,q)模型,分析预测贵州省玉米总产、单产及播种面积,旨在为贵州省玉米生产及调减提供决策参考。以时间为自变量(1949—2020 年),玉米总产、单产及播种面积分别为因变量,不考虑因变量受其他因素的影响(如光照、温度、水分、土壤、品种、施肥、气候、耕作管理等因素对玉米生长及产量造成的影响),不考虑肥料、农药、农膜、农机动力等生产投入要素(变量)对玉米单产的具体贡献。

时间序列分析法是一种比较简化、科学的预测分析方法,只要因变量随时间变化并呈现出一定的趋势(平稳或非平稳),且拟合模型满足显著性检验的要求,那么模型预测的结果是有效的。本研究运用ARIMA 模型,对贵州省未来5 年玉米的生产情况进行预测。结果表明,贵州省玉米总产、单产数据均呈现较高的规律性和平稳性,模型拟合后通过了显著性检验。用该模型对贵州省2021—2025 年玉米的总产、单产进行预测,其预测结果具有较高置信度。但播种面积的数据规律性和平稳性表现相对较差,因此预测结果的置信度相对较低,但不排除在统计过程中数据存在质量方面的问题。

4 结论

根据ARIMA(p,d,q)模型预测结果,贵州省2021—2025 年玉米生产整体情况为:总产缓慢增加,单产略有提高但基本保持稳定,播种面积呈波动和整体上升的趋势。预计未来贵州省玉米播种面积将逐渐增大,而单产增加趋势较缓慢,总产的提升效果不明显。因此,结合贵州省的政策和生产实际,要稳定和提高贵州省玉米产量,需注重选用优良品种和采用科学合理的栽培措施提高玉米单产。

猜你喜欢
播种面积单产残差
山西夏收全面完成 总产单产好于常年
基于残差-注意力和LSTM的心律失常心拍分类方法研究
用于处理不努力作答的标准化残差系列方法和混合多层模型法的比较*
黑龙江省和全国“十三五”期间三大作物单产变化分析
融合上下文的残差门卷积实体抽取
我国粮食生产喜获“十七连丰”