基于ARIMA模型的西安市国内生产总值预测分析

2020-10-21 03:49胡美
时代金融 2020年22期

胡美

摘要:国内生产总值(GDP)是衡量一个国家经济状况的重要指标,对促进经济增长和协助相关部门做出经济决策具有重要意义。本文以陕西省西安市为例,选取西安市1983年至2019年GDP指标数据作为样本,实证分析找到拟合 GDP 最优模型ARIMA(1,1,1)模型,对西安市GDP数据进行预估、检验。结果表明模型的GDP预测值与实际值误差在5%以内。并运用模型预测西安市未来5年GDP数据。本文对GDP的指标分析具有一定现实意义,希望能为西安市的经济决策提供参考。

关键词:时间序列  ARIMA模型  西安市GDP

一、引言

GDP是衡量一个国家、一个地区经济发展情况的重要指标依据。它是在一定时期内,一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,反映一国的国力与财富。西安市是国务院批复确定的中国西部地区重要的中心城市,是我国四大古都之一,也是联合国科教文组织确定的“世界历史名城”,具有悠久的古韵文化,但其經济总量不高。2019年公布GDP数据虽同比增长7.0%,位居陕西省10市之首,但仍未破万亿元。为使西安市更加符合中心城市的要求,对其GDP数据的研究及相关经济政策的提出,对衡量当地地区经济状况具有一定意义。

二、国内外研究现状

目前,国内外许多学者对GDP的模型预测,大部分集中采用时间序列计量模型与灰色预测模型。时间序列计量模型适用于短期分析,灰色预测适用于通过少量的、不完整的信息,建立数学模型并进行预测。李守丽(2013)运用ARIMA(1,2,3)模型对郑州市2011年到2015年GDP进行预测,模型误差较小。杨探(2018)运用ARIMA(1,1,1)模型,使用1996-2012年的数据对我国城镇居民人均可支配收入进行分析和预测,模型拟合效果较好。王爽、汪海飞(2010)选取1978-2019年海南省GDP数据为研究样本,采用ARIMA(1,1,2)模型对海南省国内生产总值在平均误差 5%内对其做出短期预测。戴琳琳(2019)选取青岛市1990年至2014年GDP指标数据建立ARIMA(1,1,2)模型,对青岛市 GDP 进行预测检验,模型的预测值与实际GDP 值误差较小。对于西安市GDP预测模型研究较少,仅孙爱民(2020)选取西安市2010-2018年的GDP数据建立灰色GM(1,1)模型,对 2019-2023 年的 GDP 数据小误差概率检验进行预测。

三、ARIMA(p,d,q)模型

ARIMA模型全称为自回归求和移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),是由博克思-詹金斯(Box-Jenkins)提出的一种用于进行时间序列预测的模型。称为box-jenkins模型或者博克思-詹金斯法。ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为预测模型中采用的时序数据本身的滞后数(lags),MA为移动平均,q为预测模型中采用的预测误差的滞后数(lags),d为时间序列成为平稳序列所做的差分次数。常用自相关函数(ACF)与偏自相关函数(PACF)判断(p,q)。AR自回归模型,MA移动平均模型,ARMA模型都是特殊的ARIMA自回归积分滑动平均模型。

若序列{}通过d阶差分转化为平稳时间序列,即是一个平稳时间序列,且可以拟合成一个平稳可逆ARMA(p,q)模型,序列{}拟合成如下样式:,称为求和自回归移动平均模型ARIMA(p,d,q)

d阶差分运算表示为:

差分后的序列是原序列的若干序列值的加权和,可拟合成一个自回归移动平均模型。当时,ARIMA(p,d,q)即为ARMA(p,q)模型

其中{}为白噪声。给定{}与{}条件下,使用条件MLE估计ARMA(p,q),首先根据ACF(自相关系数)与偏自相关系数(PACF)判断是否存在或情况,若则判断模型为MA(q)

若,则,产生的扰动项与产生的扰动项无交集,即ACF在时等于0,出现截尾。PACF函数拖尾,不包含自回归部分。

如果,则判断模型为AR(p)

PACF函数在时都等于0,出现截尾。ACF函数逐渐衰减,拖尾,不包含移动平均部分。

若以上两情况都不符合,ACF与PACF函数都拖尾。考虑ARMA(p,q)模型。

四、实证分析

(一)数据的处理

本文选取西安市1983-2019年的 GDP 数据作为研究对象,所有数据均来源于《陕西统计年鉴》,如表 1 所示。在其目前现有数据基础上,根据 ARIMA 模型对西安市 GDP 进行预测,样本数据区间为1983-2019年,将样本外2015—2019 年的实际数据与预测数据进行对比,判断模型的拟合效果误差值,进而再预测 2020—2024 年西安市 GDP 的发展情况。

1.平稳性检验。将1983—2019 年西安市GDP数据做折线图,如图1所示,随着时间的推移,直观看出西安市GDP呈现指数增长趋势,初步判断为非平稳的时间序列。为了消除异方差以及指数趋势,对其进行对数化处理,记为 lnGDP。

图 1 西安市 GDP 的时间趋势图

对lnGDP采用ADF单位根检验,检验结果如下表

表2 lnGDP 的 ADF 检验结果

t-Statistic Protb.*

ADF统计量 -1.371277 0.8496

检验标准 1%临界值 -4.28458

5%临界值 -3.562882

10%临界值 -3.215267

注:临界值为MacKinnon(1996)one-sided p-values。

由检验结果得知ADF 统计量为-1.3713,该值明显大于不同显著性水平下的临界值,对应P值大于显著性水平,说明此时间序列存在单位根,lnGDP序列是非平稳的。建立模型必须是平稳序列,对 LNGDP 进行一阶差分,一阶差分序列记为 DlNGDP,并进行单位根检验。如表3所示,ADF 检验的统计量为 -3.6865,该值小于 5% 显著性水平下的临界值 -3.574,即单位根是不存在的,DlNGDP在 5% 显著性水平下是平稳的时间序列。由此可知,DlNGDP序列是一阶单整过程,存在一个单位根。DlNGDP~I(1),可对平稳的DlNGDP构建ARIMA(p,q)模型。

2.ARIMA 模型的建立和求解。运用博克思-詹金斯法,选择合适的p,d和q值,对西安市lnGDP 的一阶差分变量做自相关分析,图2给出西安市lnGDP 的自相关( ACF)系数和偏自相关( PACF)系数图。

从图2根据表4判断标准可以看出,自相关系数( AC)与偏相关系数 ( PAC )都是拖尾的。但无法确定具体的p与q,大致确定p=1,q=1,但因为信服力不够,本文对其它模型AR(1),MA(1),AR(2),MA(2),ARIMA(1,1,2),ARIMA(1,1,1)进行建模,根据AIC准则、SC准则、R2,DW值确定最佳适合精准度最高的模型。结果如下表所示

根据表5可知,由DW自相关检验可知MA模型存在一阶正自相关,从其余模型根据AIC准则,SC 准则越小越好,判断其最优模型,发现ARIMA(1,1,1)模型优于其他模型,p值为1,q值为1,拟合效果较好。图3是其模型运算结果。

可对lnGDP初步建立ARIMA(1,1,1)模型。利用 1983- 2019 年样本数据建立 ARIMA 模型,结果见下表:取 p=1,q=1,建立 ARIMA(1,1,1)模型:

模型的R2= 0.99,D.W= 2.17

从表6看出模型的LM检验统计量0.7655水平上不拒绝原假设,即模型的残差不存在序列相关,亦可从图4中Q-Stat及其p值显示认为残差序列属于白噪声序列,即模型显著有效。

由表7可得在0.7水平上不拒绝原假设H0:无异方差存在,即所建模型无异方差。

根据 ARIMA(1,1,1)模型对 2015—2019年西安市GDP 进行预测,绘制预测值与实际值误差比较,算出5年的平均误差为3.1252%在5%以内,误差较小,预测准确度较好。

根据西安市1983-2019历史数据,预测2020-2024 年GDP数据值分别为10208.46097亿元、11442.64143亿元、14304.41624亿元、15953.99652亿元,画出拟合图。

从预测中发现,西安市GDP随着时间的推移呈现快速上升趋势,有望于2020年突破万亿元大关,2024年突破1.5万亿元。呈现良好的发展趋势,有助于西安市经济繁荣发展。

五、结束语

通过求和自回归移动平均模型建立的 ARIMA(1,1,1)模型较好地对西安市1983—2019年GDP非平稳时间序列数据进行了拟合,预测出 2020 年到2024 年西安市GDP数据,计算其平均误差百分比为 3.1252%,控制在5%范围内。为西安市政府制定一系列的经济政策提供一定的决策依据。从预测数据中看出,西安市GDP数据有望在2020年突破万亿元大关。本文对GDP分析预测仅考虑其数值,但影响GDP数据的因素有很多,影响机制复杂,日后在考虑其它影响因素方面有待加强改进。

参考文献:

[1]郑少智,杨卫欣.基于ARIMA模型的我国国内生产总值的分析与预测[J].中国市场,2010,000(048):24-25,28.

[2]李守丽.时间序列模型在地级市 GDP 預测中的应用[D].郑州大学,2013.

[3]杨探.基于ARIMA模型的我国城镇居民人均可支配收入的分析与预测[J].时代金融,2018(26):54-55.

[4]王爽,汪海飞.基于ARIMA模型的海南省国内生产总值预测[J].对外经贸,2020(04):44-46.

[5]戴琳琳.基于ARIMA模型的青岛市GDP预测分析[J].河北能源职业技术学院学报,2019,19(03):60-62.

[6]孙爱民.基于改进GM(1,1)模型的西安市GDP预测[J].价值工程,2020,39(09):88-92.

[7]王燕.应用时间序列分析 - 第 2 版[M].中国人民大学出版社,2008.

作者系西安工业大学经济管理学院经济学硕士研究生