杨忠裕 ,薛紫玥
(1.兰州大学 数学与统计学院,甘肃 兰州 730013;2.兰州大学 管理学院,甘肃 兰州 730013)
GDP是指在特定时间内某个国家或区域的社会主义国民经济中所制造出来的所有最终商品和劳动力的价格,反映了该国家或者地区的经济实力和市场规模。笔者认为,GDP的本质含义是判断在一个国家地理边界内一年时间里全部经济活动的活跃程度的一个宏观指标。根据GDP的定义,它还包括了占有相当大比例和具有重要作用的投资和政府开销。对于商品生产和销售活动来说这很容易理解,因为这些都是典型的直接的经济活动。而投资则是为将来的经济活动做准备,政府开销则是对经济活动进行不可或缺的适当形式辅助管理所必要的开支,属于间接的经济活动。GDP则是一定空间内、一定时间段内衡量以国家为单位所有的人所从事的全部经济活动总的活跃程度。研究甘肃省经济发展水平,也就是研究甘肃省全部经济活动总的活跃程度,也就可从侧面得知甘肃省的经济发展是否健康,是否向着良性发展等情况。所以,若能对甘肃省未来GDP作出准确的预测,就能够为宏观经济的健康发展起到一定的导向性作用,有利于作出更好的决策,也有利于甘肃省GDP持续增长。
时间序列,主要是指使用过去和现在的历史数据对未来数据做出预估的一个方式。时间序列经过变换后,能够以3项相加的形式进行表示。由一个时间序列获得信息并划分出趋势项、周期项和随机误差项。时间序列的ARIMA模型是基于历史数据的相关性分析,得出当前期与滞后期之间的相关系数,并利用最小二乘法建立时间序列中当前项和滞后项之间的线性关系。在使用过程中,虽然ARIMA模型对于预计短期内结果的效果较好,但随着预测时期增长会使得模型偏差逐渐变大。
文章将基于ARIMA模型对甘肃省GDP进行分析与预测,在建模的过程中,对不平稳的数据进行了差分处理,使其变得更加平稳,通过ADF 检验,再由偏(自相关分析)图估算其p、q值,从而确立甘肃省GDP的ARIMA模型,并对未来两年GDP进行预测,可为甘肃省的决策部门提供参考,有利于其做出更好的决策。文章还选用了甘肃省省内城市近三十年的GDP数据作为研究对象,对其建立ARIMA模型分析与预测,分析出不同城市的年增长率与预测未来的年增长率,也有利于甘肃省的决策部门得到更好的宏观视角,有利于政策得到更好的落实。
近年来,我国经济受到新冠肺炎疫情、宏观经济产业结构调整等多方面影响,使得GDP的增长速度相对减慢,这显然增加了GDP的预测难度。
GDP受资源、资本、人口等众多因素影响,且各因素之间往往都会存在多重共线性,不同因素之间的相关关系十分复杂。传统的因素解释模型很难对 GDP 进行准确有效的预测,且其拟合精确度较低,而如果使用建立时间序列ARIMA模型的方式,就能获得有较好的模型拟合精确度和估计准确度的新模型。文章中选择了甘肃省1992—2021年GDP历史数据,并构建了ARIMA模型,用历史数据对模型进行了拟合和试验,最后确定拟合ARIMA(0,2,1)模型。
华鹏等根据广东省1978—2008年的GDP进行ARIMA建模,对广东省GDP作出短期估计;熊志斌通过ARIMA建模技术和由神经网络集成的时间序列预测算法,对中国1978—2009年的GDP统计实现了模型拟合;张强等根据C-D生产函数和ARIMA模式建立了GDP的总体预估模式,预测了2016—2050年的GDP;王佳佳基于安徽省1978—2019年的GDP进行分析,建立ARIMA模型对安徽省2020—2021年的GDP进行预测;安博文等基于西藏地区1978—2018年的GDP建立ARIMA模型,对未来十年西藏地区GDP进行预测。
ARIMA(p,d,q)模型结构如下:
(1)
Φ(B)=1-φ1B-φ2B2-…-φpBp
(2)
Θ(B)=1-θ1B-θ2B2-…-θqBq
(3)
式中:B代表的是延迟算子的意义;式(2)中代表的是阶数为p的自回归系数多项式;式(3)中代表的是阶数为q的移动平均系数多项式。p,d,q依次代表了自回归阶次、差分滞后阶次和移动均值阶次。当d=0时,就是ARMA模型,当p=0时,可简记为IMA(d,q)模型,当q=0时,ARIMA(p,d,q)模型可简记为ARI(p,d)模型。
(1)对数据进行ADF检验,识别序列的平稳性。
(2)查看差分前后数据对比图,判断其是否平稳,同时对时间序列进行偏自相关性分析,根据截尾情况估算其p、q值。
(3)查看模型检验表,根据Q统计量的p值对模型白噪声进行检验,也可以结合信息准则AIC和BIC值进行分析(越低越好)。
(4)根据模型参数表,得出模型公式。
(5)结合时间序列分析图进行综合分析,得出向后预测的阶数结果。
文中选择了甘肃省1992—2021年GDP为研究对象,并建立了ARIMA(0,2,1)模型。所有数据均来自国家统计局。
观察自相关与偏自相关图均为拖尾,即可定出为ARIMA(0,2,1)模型。
表1 ADF检验
基于字段GDP,并基于AIC与BIC信息准则,自动寻找最优参数,得出基于2阶差分数据的ARIMA(0,2,1)模型检验表,得出模型公式:
y(t)=24.746-0.998×ε(t-1)
(4)
在检验ARIMA模型(0,2,1)的模型参数表中,Df Residuals为26,Q统计量:Q6,Q12,Q18,Q24的p值分别为0.247(0.619)、4.383(0.625)、8.691(0.729)、10.801(0.903),AIC值为387.027,BIC值为391.024,模型拟合优度R2为0.995。
虽然Q在水平上并不呈现明显性,也不能否定模型的残余误差为白噪声序列的假设,但由于模型拟合优度R2为0.995,因此模型仍相当优秀且模型基本满足上述要求。
表2 时间预测
从拟合结果来看,ARIMA模型短期预测效果较好,且能较好地结合长期趋势和短期波动的情况,来反映甘肃省GDP的整体走势,但受新冠肺炎疫情影响,能否达到此预测值,还有待结合实际验证。
表3 甘肃省省内城市GDP分析
图1 时间预测
由图1可知,甘肃省省内全部城市都处于良好发展阶段,在构建的ARIMA模型中,都呈现出了良性发展,但省内不同城市间的GDP相差较大,期望相关部门可以落实“先富带动后富”政策,让兰州推动省内其余城市的经济发展。
(1)对于不同的地区经济增长趋势结合不同的地域特色,可选择不同的影响要素;但随着不同地区经济发展过程中会有不确定变化,不同地区会做出不同的决策选择。但无论相应地区采取什么经济政策或者发展战略都可以采用ARIMA模型对其进行数据预测。
(2)ARIMA模式并不需要借助于任何的外生变数,而只要求内生变量。
(3)虽然ARIMA模型在实质上只是捕捉线性关系,并没有捕捉非线性关系。但实际上,大部分序列之间都具有非线性关联。若ARIMA模型序列变量的未来取值并不符合先前观察值和随机误差间的线性函数关系,则就不可以构建ARIMA模型。显然,ARIMA 模型是有局限性的。
(4)在建模过程中,首先要求模型数据处理结果必须符合均衡性的要求,如果数据处理结果不符合均衡性检验,则可用选差分和取对数等方法使之通过检测。
(5)使用ARIMA模型预测时间序列数据,其模型数据要求范围必须是固定的,而如果数据的范围不固定的话,则是无法捕捉到数据的变化规律的。建模数据的稳定性可以使用ADF检验,并且使用差分分析对数据进行稳定性处理。
文章选择了差分方式来确定建模数据的均衡性,再根据所绘制出来的ACF图和PACF图,可得出较适合甘肃省GDP的模型为ARIMA(0,2,1),接着对模型进行参数的显著性检测和残差值的白噪声检测,使之更具有可靠性,而预测值与实际值间的比较,也证实了建模的可行性。
在对比2020年的预测值与实际值的过程中,发现时间序列与ARIMA模式间的误差是不可被忽视的,这与2020年新冠肺炎疫情对我国宏观经济的巨大影响息息相关,是在ARIMA模式中所无法反映出的宏观经济影响。可见,利用时间序列的ARIMA模型可对研究对象作出效果不错的短期内的预报,但这结果仅能起到参考作用。最终预测结果表明,未来两年甘肃省GDP会呈平缓持续的增长,在不遭遇特殊事件下,甘肃省GDP预计不会出现剧烈波动的情况。结合中国新冠肺炎疫情的不确定性以及国际形势多变性,再加上我国目前也处在经济社会发展转型的关键时期,与甘肃经济相关的政府部门的当前宏观经济发展战略计划也须适时地调整与完善,以保持甘肃省GDP的平稳上升。在疫情大环境时代,如何能把疫情带来的影响降到最低,找出新的发展策略,促进新的产业转型量升级,从而得到高质量发展,也是解决甘肃未来经济发展的重要课题。