吕家权
摘要:运用ARIMA模型对我国1949—2009年的人口总数进行了分析与预测,得出AR IMA(2,2,1)模型可以对我国的人口总数作短期预测的结论。
关键词:AR IMA模型;人口总数;时间序列分析;预测
1.问题的提出
中国是世界上人口最多的国家,人口过多一直是阻碍我国经济发展的重要因素,2011年第六次全国人口普查主要数据显示,全国总人口约为13.7亿。与2000年第五次全国人口普查相比,10年间增加7390万人,增长了5.82%,年平均增長率为0.57%。数据表明,虽然这一段时间我国人口增长处于低生育水平阶段,但人口总数仍居高不下。
2、ARIMA模型介绍
如果时间序列yt,能通过d次差分后变成平稳序列,即yt~I(d),则
ut=Δd yt=(1-Φ(L))dyt
ut为平稳序列,即ut~I0),于是可建立AR IMA(p,q)模型:
ut=c+φ1ut-1+φ2ut-2+…+φput-p+εt+θ1εt-1+θ2εt-2+…+θqεt-q
经d阶差分后的AR IMA(p,q)模型称为AR IMA(p,d,q)模型,其中p为自回归阶数,q为移动平均阶数,εt为一个白噪声序列。
1.建立ARIMA模型的步骤一般如下:
一,平稳性检验。二,模型初步识别。三,估计模型参数。四,模型的诊断分析。
2.模型预测
一、将模型参数估计出来后写出一般方程式,代入解释变量求出被解释变量的估计值;二、将估计值与实际值比较,算出平均误差(不超过5%)。
3.实证分析
(一)数据的选取
本文的数据为1949-2009年中国的人口总数,记为P.
(1)平稳性检验
作出人口的变化趋势图,如下图1。图像明显有向右上方倾斜的趋势,且上升趋势和幅度不一致,说明此序列有增长的趋势,并且存在异方差;对数据做ADF检验,t值为-1.146,绝对值都小于1%、5%、10%显著性水平下的临界值绝对值,所以不能拒绝原假设,认为该时间序列是非平稳时间序列。
(2)对非平稳的时间序列p进行平稳化处理
对序列进行二阶差分,t值为-7.26,绝对值大于三个临界值,拒绝原假设,认为该时间序列经过二阶差分后满足平稳性通过了检验,说明人口序列P为二阶单整序列,即D2(p)~I(2)。
(3)ARIMA模型的拟合
我们可以确定AR IMA(p,d,q)模型中的d应取为2。为了确定模型中的p和q,观察自相关图和偏相关图,看到自相关图和偏相关图都是拖尾的,因此建立AR IMA模型。经过推算,以A IC和SC准则选出最优模型为AR IMA(2,2,1).Eviews回归结果为:
Δ2(p)=277989.5+1.5Δ2(pt-1)-0.51Δ2(pt-2)+εt+0.35εt-1
(189) (957) (-325) (205)
(4)模型的检验和诊断
一、F检验:模型的F检验值为7572324,对应的伴随概率为0,说明回归方程整体是显著的:二、R2检验:判定系数R2=0999,调整判定系数2=0999,说明原回归方程对样本数据拟合得很好。三、t检验:假设显著性水平为005,查表得t值=068,AR(1)、AR(2)、MA(2)的t统计量都大于068,说明解释变量的系数都是显著的,每个变量都不可省略。
模型中的残差序列以及Δ2(p)的实际值和拟合值的序列见下图2:从图2可以看出,模型的拟合值和实际值相差不多,残差值很小,基本上消除了线性或者指数趋势,较为平稳,说明模型通过了适应性检验。为了进一步检验该模型的效果,记εt为该模型的残差序列,对其进行单位根检验,得到的t值为-5.467,其绝对值都大于三个临界值的绝对值。因此,残差序列εt能在1%的显著性水平下被认定位一个白噪声过程,这说明D2(p)的拟合值是实际值的无偏估计,模型的拟合效果是较好的。
(5) 模型的预测
用AR IMA(2,2,1)型对我国人口总数(P)做预测,利用模型对2007到2010年的数值行预测和对照:
由表1可以看出,该模型在短期内预测的比较准确,平均误差为2112%,但随着预测时间的延长,误差可能会逐渐增大。
4、结论
通过以上的分析和预测,说明ARIMA模型对于非平稳时间序列作建模分析,具有较好的预测效果。本文所建立的AR IMA(2,2,1)模型是较为成功的。另外根据模型表达式可知,我国在未来还会有人口的增长,人口基数势必会继续上升,经济发展势必还要受庞大的人口数量的影响,又会带来一系列问题。(作者单位:国立华侨大学)
参考文献:
[1] 李子奈,潘文卿.《计量经济学》(第二版)[M].高等教育出版社,2003.
[2] 张晓峒.计量经济学软件EVIEWS使用指南[M].南开大学出版社,2003.