基于ARIMA模型的我国人口增长的分析与预测

2014-04-29 08:25吕家权
2014年1期
关键词:人口总数时间序列分析预测

吕家权

摘要:运用ARIMA模型对我国1949—2009年的人口总数进行了分析与预测,得出AR IMA(2,2,1)模型可以对我国的人口总数作短期预测的结论。

关键词:AR IMA模型;人口总数;时间序列分析;预测

1.问题的提出

中国是世界上人口最多的国家,人口过多一直是阻碍我国经济发展的重要因素,2011年第六次全国人口普查主要数据显示,全国总人口约为13.7亿。与2000年第五次全国人口普查相比,10年间增加7390万人,增长了5.82%,年平均增長率为0.57%。数据表明,虽然这一段时间我国人口增长处于低生育水平阶段,但人口总数仍居高不下。

2、ARIMA模型介绍

如果时间序列yt,能通过d次差分后变成平稳序列,即yt~I(d),则

ut=Δd yt=(1-Φ(L))dyt

ut为平稳序列,即ut~I0),于是可建立AR IMA(p,q)模型:

ut=c+φ1ut-1+φ2ut-2+…+φput-p+εt+θ1εt-1+θ2εt-2+…+θqεt-q

经d阶差分后的AR IMA(p,q)模型称为AR IMA(p,d,q)模型,其中p为自回归阶数,q为移动平均阶数,εt为一个白噪声序列。

1.建立ARIMA模型的步骤一般如下:

一,平稳性检验。二,模型初步识别。三,估计模型参数。四,模型的诊断分析。

2.模型预测

一、将模型参数估计出来后写出一般方程式,代入解释变量求出被解释变量的估计值;二、将估计值与实际值比较,算出平均误差(不超过5%)。

3.实证分析

(一)数据的选取

本文的数据为1949-2009年中国的人口总数,记为P.

(1)平稳性检验

作出人口的变化趋势图,如下图1。图像明显有向右上方倾斜的趋势,且上升趋势和幅度不一致,说明此序列有增长的趋势,并且存在异方差;对数据做ADF检验,t值为-1.146,绝对值都小于1%、5%、10%显著性水平下的临界值绝对值,所以不能拒绝原假设,认为该时间序列是非平稳时间序列。

(2)对非平稳的时间序列p进行平稳化处理

对序列进行二阶差分,t值为-7.26,绝对值大于三个临界值,拒绝原假设,认为该时间序列经过二阶差分后满足平稳性通过了检验,说明人口序列P为二阶单整序列,即D2(p)~I(2)。

(3)ARIMA模型的拟合

我们可以确定AR IMA(p,d,q)模型中的d应取为2。为了确定模型中的p和q,观察自相关图和偏相关图,看到自相关图和偏相关图都是拖尾的,因此建立AR IMA模型。经过推算,以A IC和SC准则选出最优模型为AR IMA(2,2,1).Eviews回归结果为:

Δ2(p)=277989.5+1.5Δ2(pt-1)-0.51Δ2(pt-2)+εt+0.35εt-1

(189) (957) (-325) (205)

(4)模型的检验和诊断

一、F检验:模型的F检验值为7572324,对应的伴随概率为0,说明回归方程整体是显著的:二、R2检验:判定系数R2=0999,调整判定系数2=0999,说明原回归方程对样本数据拟合得很好。三、t检验:假设显著性水平为005,查表得t值=068,AR(1)、AR(2)、MA(2)的t统计量都大于068,说明解释变量的系数都是显著的,每个变量都不可省略。

模型中的残差序列以及Δ2(p)的实际值和拟合值的序列见下图2:从图2可以看出,模型的拟合值和实际值相差不多,残差值很小,基本上消除了线性或者指数趋势,较为平稳,说明模型通过了适应性检验。为了进一步检验该模型的效果,记εt为该模型的残差序列,对其进行单位根检验,得到的t值为-5.467,其绝对值都大于三个临界值的绝对值。因此,残差序列εt能在1%的显著性水平下被认定位一个白噪声过程,这说明D2(p)的拟合值是实际值的无偏估计,模型的拟合效果是较好的。

(5) 模型的预测

用AR IMA(2,2,1)型对我国人口总数(P)做预测,利用模型对2007到2010年的数值行预测和对照:

由表1可以看出,该模型在短期内预测的比较准确,平均误差为2112%,但随着预测时间的延长,误差可能会逐渐增大。

4、结论

通过以上的分析和预测,说明ARIMA模型对于非平稳时间序列作建模分析,具有较好的预测效果。本文所建立的AR IMA(2,2,1)模型是较为成功的。另外根据模型表达式可知,我国在未来还会有人口的增长,人口基数势必会继续上升,经济发展势必还要受庞大的人口数量的影响,又会带来一系列问题。(作者单位:国立华侨大学)

参考文献:

[1] 李子奈,潘文卿.《计量经济学》(第二版)[M].高等教育出版社,2003.

[2] 张晓峒.计量经济学软件EVIEWS使用指南[M].南开大学出版社,2003.

猜你喜欢
人口总数时间序列分析预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
人口总数变化的比例进入潜伏或染病群体的年龄结构传染病模型及稳定性
数据
2053年全球总人口将达100亿
不必预测未来,只需把握现在
2053年全球总人口将达100亿
基于R软件的金融时间序列的预测分析
微信公众号未来发展态势的实证预测