陈霄霄+孟昭为
摘要:以1980年以来的山东粮食产量数据为基础,先后通过平稳化检验及自相关与偏相关分析,建立ARMA模型,确定模型参数并对残差序列进行白噪声检验。借助Eviews软件对其走势进行分析研究,通过理论模型对粮食产量进行预测,并将预测情况与山东省粮食的实际产量做对比,为政府及相关部门提供决策参考。
关键词:ARMA模型;粮食产量;预测
中图分类号:F2
文献标识码:A
文章编号:16723198(2015)13003103
粮食产量的预测问题是金融及农业领域长期研究的问题,面对严峻复杂的经济形势,为了寻找适合的模型,专家们已做了大量的研究。山东省作为全国产粮第三大省,粮食丰收可以确保国家粮食安全,保障了广大农业人员的生活水平,为经济的平稳健康发展及社会的稳定和谐提供了有力支撑,因此加强对省内粮食产量变动趋势的检测和研究显得尤为重要。粮食产量的预测是基于时间序列数据的。基于时间序列数据的预测方法有很多种,最常用的技术有分解分析法、回归分析法、移动平均法、指数平滑法、混沌时间序列法、自适应过滤法、小波分频技术、自回归滑动平均模型等。ARMA模型(自回归移动平均模型,Auto-regressive and Moving Average Model)由博克斯(Box)、詹金斯(Jenkins)于20世纪70年代创立,因此也称为BJ方法,是目前最为常用的研究时间序列模型之一。本文根据山东省粮食近三十年的产量数据建立ARMA模型,并用Eviews软件对其波动趋势进行预测分析。
1模型介绍
1.1ARMA模型
AR(p)模型也称为自回归模型,它的预测结果主要由过去的观测值和现在的干扰值的线性组合决定。
记:
yt=c+1yt-1+2yt-2+…+pyt-p+μt(1)
c为常数,p为自回归模型的阶数,1(i=1,2,3,…,p)自回归系数,随机项ut服从均值为零,方差为σ2μ的正态分布,通常标记为μt~WN(0,σ2t),μt是相互独立的白噪声序列。
MA(q)模型也称为移动平均模型。其预测方式是通过过去的干扰值和现在的干扰值的线性组合预测。
记:
yt=μt-θ1ut-1-θ2ut-2-…-θqμt-q(2)
其中θi(i=1,2,3,…,q)为移动平均系数,q为移动平均阶数。
模型的构成基础为自回归模型(模型)与移动平均模型(模型)的组合,其基本原理是,将预测指标随时间推移而形成的数据序列看作是一个随机序列,虽然单个序列值具有不确定性,但整个序列的变化却是存在一定规律的,可以用相应的数学模型近似描述:
yt=c+1yt-1+2yt-2+…+pyt-p+μt-θ1μt-1-θ2μt-2-…-θqμt-q(3)
ARMA模型要求用于预测的时间序列是随机平稳的。平稳性(Stationarity)是一个重要的简化假设,它要求过程处于某个特别的“统计平衡”状态。假如一个随机过程的性质不受时间起点变化的影响,那么我们称它为绝对平稳。ARMA模型与其他预测模型相比,其特点主要体现于:
(1)ARMA模型只需考虑时间历史数据所包括和显示的信息,对其他相关的指标不需多做考虑;
(2)ARMA模型尤其适用于对时间历史数据进行短期预测;
(3)ARMA模型不考虑其他相关变量的影响,因此预测方法简明易行,由于其预测精度较高,预测结果准确,因此在对金融时间序列做预测工作时被大量采用。
1.2模型建立准则
对于滞后长度的确定有一定的标准,滞后阶数通常根据AIC准则和SC准则判断。
AIC准则是赤池信息准则,该项准则运用下式的统计量评价模型的好坏:AIC=-2L/n+2K/n,其中L是对数似然值,n是观测值数目,K是被估计的参数个数,AIC的大小取决于L和K,选取标准是:K取值越小,AIC越小;L取值越大,AIC值越小。K小意味着模型简洁,L大意味着模型精确。SC准则是施瓦兹准则,其检验思想也是通过比较不同分布滞后模型的拟合优度来确定合适的滞后期长度。检验过程是:在模型中逐期增加滞后变量,直到SC值不再降低时为止,此时选取的则为使SC值达到最小的滞后期K。因此,AIC和SC的准则要求其越小越好。具体检验方法为:多取几次滞后建立模型,各模型都会有一个AIC和SC统计量,取其最小的统计量所对应的阶数(原值最小化原则)。
因此,建模思想可分为四个步骤:一是序列的预处理,对建模序列进行平稳性检验,若为非平稳序列则通过差分处理得到平稳条件;二是根据自相关系数(ACF)和偏自相关系数(PACF),结合AIC和SC准则,确定ARMA模型的阶数p和q;三是估计模型待定参数并进行残差检验,若通过检验,则可确定ARMA模型,若未通过检验,则需重新选取模型后拟合;四是结合软件对数据的下一步走势进行预测。
2模型建立
模型建立的方法通常使用由Box和Jenkins(1976)所建议的方法,其实质是:将某个时间序列的样本自相关函数(SACF)和样本偏自相关函数(SPACF)的行为与各种理论ACF和PACF的行为相匹配,从中挑选出最优匹配,估计模型的未知参数μt~WN(0,σ2t),通过检查从模型拟合得到的残差,以发现并有效排除可能出现的建模错误。在此基础上,我们选取另一种更为直观的建模方法:考虑模型的p值和q值,在最大建模范围的值和值的基础上选择一组模型,对每个可能的模型依次进行估计,最后是模型的选择,标准是将某个以拟合度为基础的选择标准最小化。
表1自相关和偏自相关函数与模型类型的关系
ACF
PACF截尾拖尾
截尾MA
拖尾ARARMA
2.1数据的选取
选取山东1980—2014年的粮食产量(OUTPUT),数据来自《山东统计年鉴》、山东省农业厅,用ARMA模型进行实证分析。粮食产量的走势图如图1所示。
图1粮食产量走势图
2.2数据的平稳性检验
自相关函数与过程的均值和方差一起,共同表现了平稳随机过程的特征。因此,自相关函数通过测量过程的某个值与历史值的相关程度,显示了过程的“记忆”长度和力度。
用Eviews软件对历史数据检验,得到AC和PAC的相关系数图,如图2。
图2output的自相关分析
由图2可知粮食产量经历了“增长-下降”的演变轨迹,即OUTPUT序列存在明显的上升趋势,故可初步判断不是平稳时间序列。
图3output的ADF验结果
由图3也可以看出序列没有通过ADF检验,OUTPUT序列为非平稳序列。
可以通过差分的方法使其平稳化,对OUTPUT一阶差分(Δoutput)后,再用ADF法进行检验,Δoutput序列通过检验,可认为差分后序列Δoutput是平稳的,如图4。
图4Δoutput的ADF检验结果
2.3模型的定阶
(1)对序列output进行一阶差分消除趋势变为平稳序列,得到相关图。
图5Δoutput的自相关分析
从图5中我们看出ACF和PACF值均没有明显的截尾性,故我们选用ARMA模型,p和q的值则需用AIC准则和SC准则判断确定。
(2)根据AIC准则和SC准则最小化来确定模型ARMA(p,q)。
利用Eviews软件分析,经过比较发现,ARMA(2,1)过程的AIC=13.76595和SC=13.94734都是最小的(见图6),故选取ARMA(2,1)模型作为预测模型,计算得出的估计结果如下:
output=4217.345+1.6387outputt-1-06723outputt-2+μt-0.9605μt-1
(4)
R2=0.8570,DW=2.00,F=57.94
图6ARMA(2,1)的参数估计
估计结果表明,R2,DW值,F检验的相伴随概率均符合要求,说明模型拟合度较好。
3模型检验
选取ARMA(2,1)模型后,还应对其残差序列进行检验。
图7残差的自相关性
图8ARMA模型的残差检验图
从图7和图8中可得知,残差序列不存在自相关
的概率达92%,已达到90%以上。对其残差的AC值和Q统计量检验,发现其残差自相关系数基本在0附近,且Q值基本通过检验,残差不存在相关性,说明残差序列是白噪声序列。因此模型基本符合要求。
4模型预测和分析
根据模型对山东省粮食产量进行预测,Eviews软件提供了动态预测和静态预测两种预测方法,考虑到ARMA模型预测结果的准确性,我们采用一步向前静态预测方法。预测结果如图9所示。
图9预测值与实际观测值对比图
从图9中可以看出,预测值与实际观测值的平均相对误差(MAPE)为4.3277<10,符合标准要求,说明模型预测的精度较好。利用ARMA模型并借助相应软件可以对某些时间序列问题进行研究和预测分析,针对分析结果提出合理的决策和建议,从而保障市场的平稳运行和消费者生活的稳定。
参考文献
[1]谢福鼎.改进的符号化时间序列处理方法[J].计算机工程与设计,2012,33(10):39503953.
[2]程彬,郑广宇,李英.基于ARMA模型的2014年辽宁省生猪生产预测预警[J].Animal Economy,2014,50(18):4753.
[3]赵卫亚.利用Eviews软件检验和处理模型的多重共线性[J].统计与决策,2008,(6):147148.
[4]高铁梅.计量经济分析方法与建模:Eviews应用及实例(第2版)[M].北京:清华大学出版社,2009.
[5]吴琦磊.基于Eviews的我国农产品产量与相关投入的模型分析与预测检验[J].情报探索,2010,6(5):3941.
[6]Judge,George G.计量经济学理论与实践引论[M].周逸江,赵文奇译.北京:中国统计出版社,2004.
[7]白营闪.基于ARIMA模型对上证指数的预测[J].科学技术与工程,2009,9(16):48854888.
[8]陈敏,周志明.应用Eviews对我国部分宏观经济数据的分析识别[J].咸宁学院学报,2009,(6):1317.