ARIMA模型在重庆市能源消耗量预测中的应用*

2015-05-23 07:50李岩岩重庆工商大学数学与统计学院重庆400067
关键词:ARIMA模型时间序列能源消耗

李岩岩(重庆工商大学数学与统计学院,重庆400067)

ARIMA模型在重庆市能源消耗量预测中的应用*

李岩岩
(重庆工商大学数学与统计学院,重庆400067)

摘要:能源是人类赖以生存和发展的重要物质基础,对经济的快速发展和人们生活水平的大幅度提高起着无可取代的作用,随着经济的发展人们对能源的需求日益增多,由于地球上的资源是有限的,对未来能源消耗量的准确预测显得尤为重要;运用ARIMA模型对《2013重庆市统计年鉴》中重庆市1981-2012年能源消耗量数据进行分析,结果显示:ARIMA(2,3,2)模型预测未来的结果较为准确,为重庆市资源消耗量提供了可靠的依据。

关键词:ARIMA模型;时间序列;能源消耗;预测

重庆市是中国面积最大的城市,辖区总面积为8.24万km2,为北京、天津、上海三市面积的2.39倍。改革开放以来,经济取得了突飞猛进的增长。2013年,工业增加值5 249.65亿元,比2012年增长13.1%,占重庆市地区生产总值的41.5%。伴随着工业化的快速发展,能源处于高耗阶段,能源资源短缺已成为重庆市经济发展的一大瓶颈。国内外不同的机构和许多学者针对能源消耗问题也运用不同的方法做了大量的研究,国家统计局和能源办常会采用定性预测方法对能源问题做一些研究然后制定合理的政策;当然对此问题的研究比较深入的还是广大学者们,他们常用的预测的方法有:回归预测方法、自适应预测、投入产出法、灰色关联法、生长理论、指数平滑法及神经网络预测法等,这些方法都能从一定的方面反映问题,但是由于没有考虑数据的平稳性及数据间的关联性,预测结果往往准确度不高,ARIMA模型克服这方面的局限性,它可以很好的拟合非平稳时间序列,能大大提高预测的精度。

国内学者运用ARIMA模型做了很多研究,其中有刘勇[1]针对我国的能源消费预测和池启水[2]针对我国煤炭消费的预测;还有一些地方性的预测,蒋燕[2]对广西全社会固定资产投资的预测及龚国勇[4]对深圳GDP的预测,李伟[4]对重庆市GDP的预测也用到了ARIMA模型,但是针对重庆市能源消耗问题还没有学者专门运用ARIMA方法进行过预测,现今要求整个社会都要以降低能源消耗为目标,为了尽快全面的掌握重庆市资源消耗状况,为重庆市节能降耗提供科学、有效的统计数据支撑,现通过收集、分析时间序列数据,运用ARIMA数学模型,科学分析重庆市能源消费量,估计模型以预测未来能源消耗量,为相关部门制订节能降耗措施和对策提供科学合理的依据。

1 基于ARIMA模型的重庆市能源消耗量预测方法

1.1ARIMA模型理论

ARIMA模型全称为差分自回归移动平均模型(Auto Regression Integrated Moving Average Model,简记ARIMA),是一类常用的时间序列预测模型,是由博克思(Box)和詹金斯(Jenkins)于20世纪70年代初提出一著名时间序列预测方法,所以又称为Box-Jenkins模型、博克思-詹金斯法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项; MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。ARIMA模型通常借助时间序列的随机特性来描述事物的发展变化规律,指将非平稳时间序列转化为平稳时间序列,然后运用时间序列的过去值、当期值以及滞后随机扰动项的加权来建立模型,从而解释并预测时间序列的变化发展规律。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括自回归移动平均过程(ARMA(p,q):Auto Regression Moving Average)及差分自回归移动平均(ARIMA(p,d,q):Auto Regression Integrated Moving Average)过程。

1.2ARIMA模型结构

ARIMA模型实际就是非平稳时间序列经过差分处理后的ARMA模型,ARMA模型是目前最常用的拟合平稳序列的模型。ARMA模型又可以细分为AR模型、MA模型和ARMA模型三大类。

1.2.1ARMA模型

具有如下的模型称为p阶自回归(auto regression)模型,简记为AR(p):

其中,模型的最高阶数为p,随机干扰项{εt}为零均值白噪声序列即εt~WN(0,σ2ε)。

具有如下结构的模型称为q阶移动平均(moving average)模型,简记为MA(q):

其中,模型的最高阶数为q,随机干扰项{εt}为零均值白噪声序列即εt~WN(0,σ2ε)。

把具有如下结构的模型称为自回归移动平均(auto regression moving average)模型,简记为ARMA(p,q):

限制条件与AR(p)、MA(q)相同,ARMA(p,q)模型实际上就是AR(p)与MA(q)的结合。

1.2.2ARIMA模型具体结构

具有如下结构的模型称为求和自回归移动平均(auto regression integrated moving average)模型,简记为ARIMA(p,d,q)模型[6]:

式(4)中:▽d=(1-B)d,d为差分次数;Φ(B) = 1-φ1B-…-φpBp,为平稳可逆ARMA(p,q)模型的自回归系数多项式;Θ(B) = 1-θ1B-…-θqBq,为平稳可逆ARMA(p,q)模型的移动平滑系数多项式式(4)可以简记为

式(5)中{εt}为零均值白噪声序列。

1.3ARIMA模型拟合基本步骤

(1)检验时间序列的平稳性,一般采用观察时序图和单位根检验的方法。能够用ARMA模型拟合的序列都是平稳时间序列,对于非平稳时间序列,需要先对原始序列进行若干次差分运算使其转化为平稳时间序列,这个差分转换次数就是d,然后再用ARMA模型拟合。

(2)根据时间序列模型的识别理论选取相应的模型。这需要借助与序列的相关图,AR过程的AC(自相关函数)和PAC(偏自相关函数),与MA过程的AC和PAC相比较,有相反的变化理论模式。对于AR模型,其AC从图形上表现为“拖尾性”,而PAC表现为“截尾性”。MA模型,其AC表现为“截尾性”,PAC表现为“拖尾性”。若序列的AC和PAC均表现为“拖尾性”,则适合于ARMA模型。此时可以初步确定p、q的值。

(3)模型参数估计。根据前面确定的d及初步确定的p和q,运用AIC和SC最小法则以及拟合优度最大等综合指标,选取最优的p和q,确定最终模型的参数。

(4)对拟合后的模型进行白噪声检验。检验残差是否为纯随机序列,如果为白噪声序列证明模型还不是最优的需要进一步改进。

(5)利用已经通过检验的模型进行预测分析。

2 ARIMA模型在重庆市能源消耗量预测中的应用

2.1数据描述

从《2013年重庆市统计年鉴》获得1981-2012年重庆市能源消耗量的数据。参照《EViews统计分析与应用》[7]完成下面的操作,首先由原始数据可以绘制出1981-2012年重庆市能源消耗量的折线图,图1所示。其中X表示能源消耗量,单位是万吨标准煤。由图1可知,重庆市能源消耗量呈现指数上升的趋势,增长势头显著,可知时间序列{Xt}为非平稳时间序列。

2.2对数据进行平稳化处理

一般来说对于呈现指数趋势的时间序列,需要通过取对数的形式将其转化为线性趋势,然后再进行差分处理。通常来讲线性趋势可以通过一阶差分消除,二次曲线趋势可以通过二阶差分消除。针对本次时间序列数据,经过取对数Y=lnX以后,经过三次差分运算,序列达到平稳。三次差分后的序列用Z表示,其折线图用图2表示。对Z进行ADF单位根检验结果如表1所示。

图1 X拆线图

图2 三次差分折线图

表1 ADF单位根检验

在表1中,ADF检验t统计量为-4.555 388,其相应的概率值为0.001 5,在1%、5%、10%的检验水平下t统计量的临界值分别为-3.737 853、-2.991 878、-2.635 542。序列Y三阶差分的ADF检验的t统计量都比1%、5%、10%检验水平下的临界值小,因此可以拒绝原假设,即可认为序列Y的三阶差分(即Z)没有单位根,也即序列X取对数后的三阶差分平稳I(3)的。

2.3ARMA模型识别和阶数确定

由于检验出序列{ Zt}是平稳的,因此可以建立相应的模型,在建模之前需要识别模型的类别,即需要确定是AR(p)模型或MA(q)模型或ARMA(p,q)模型。模型的确定通常借助序列的相关图,即序列的自相关函数(AC)和偏自相关函数(PAC)。

图3 Z的AC与PAC图

由图3可以看出自相关和偏自相关图均表现出“拖尾性”,因此序列{ Zt}适合用ARMA(p,q)模型,初步估计有4种模型形式:ARMA(1,1)、ARMA(1,2)、ARMA(2,1)及ARMA(2,2)。

识别ARMA模型的形式后,可以运用最佳准则定价函数法,即Akaike提出的AIC准则,准则是在模型参数极大似然估计的基础上,对模型的阶数和相应的参数同时给出一组最佳估计。一般来讲,在给出不同模型的AIC计算公式的基础上,选取使AIC达到最小的那一组阶数为理想阶数。运用Eviews软件完成本过程,需要注意的是,对参数估计量的t检验显著性水平并不像简单回归方程那么严格,更多的是考虑模型的整体拟合效果。AIC准则及SC准则和调整后的可决系数都是选择模型的重要标准。

通过表2比较4个模型的AIC及其他各项指标,虽说ARMA(1,1)和ARMA(1,2)的各项指标都比ARMA(2,1)和ARMA(2,2)的拟合效果好,但是ARMA(1,1)和ARMA(1,2)的MA(q)拟合过程不可逆,所以只需比较ARMA(2,1)和ARMA(2,2),最终可以确定p=2,q=2为最佳模型的阶数,建立ARIMA(2,3,2)模型:

Zt=-0.000 208-1.080 346Zt-1-0.126 364Zt-2+εt+ 0.009 58εt-1+ 0.922 219εt-2

其中Z =Δ3Y,Y = lnX

表2 模型指标结果比较

续表2

2.4模型检验

模型检验也即对模型的残差序列进行白噪声检验,如果残差序列不是纯随机序列则意味着残差序列中还有信息未被提取,模型需要进一步改进。由图4知残差序列的拟合效果还是比较好的,但这还需要通过相关图进一步检验。对ARIMA(2,3,2)模型的残差进行白噪声检验(图5),可以看出残差序列的自相关函数都在95%的置信区间内,由此可以得出残差序列相互独立即为白噪声的概率很大,故不能拒绝序列为白噪声序列的原假设,即可认为模型ARIMA(2,3,2)估计结果的残差序列不存在自相关。

图5 ARIMA(2,3,2)模型的残差相关图及Q检验

3 预测与分析

根据时间序列{ Zt}的ARIMA(2,3,2)模型:

可以推出时间序列{Yt}的ARIMA(2,3,2)模型的预测方程为

进而推出时间序列{ Xt}的预测方程为

对重庆市2009-2012年的能源消耗量做预测(单位:万吨标准煤),并与实际值做比较(表3)。

表3 预测结果

(1)从{ Xt}的预测方程可以看出,重庆市资源消耗量与序列本身滞后一期值和滞后三期值以及残差项一期和二期有着密切的关系。由于参数估计的时候系数均为负值,这就意味着滞后一期值和滞后三期值以及残差项一期和二期对当期值成负相关关系。也就是说:t-1期资源消耗量增加则t期消耗量就会减少。因此,重庆市政府在安排每年资源消耗量时应注意这一点,不要寅吃卯粮,合理计划每年的资源消耗量,使社会经济更加稳定健康的发展。

(2)图6中虚线是预测置信区间,可以看到随着向后预测期的增加,预测置信区间也变大,从而表明预测期越往后,模型预测的精度越差。表3所列的是2009-2012年序列{ Xt}的预测值、实际值及预测相对误差。从表3中可以看出,序列{ Xt}的预测值与实际值的相对误差比较小,预测的平均相对百分误差为4.921%,一般认为平均相对百分误差在10%以内模型的预测效果比较好[8](易丹辉,2005),可以用来预测。但是也要看到,随着预测期的增加,模型预测的相对误差也变大。这是ARIMA模型的一个缺陷,尽管如此它在短期预测方面相比其他的预测方法,预测的准确度还是比较高的,可以为重庆市能源消耗量短期预测提供借鉴。

图6 2009-2012预测图

参考文献:

[1]刘勇,汪旭晖.ARIMA模型在我国能源消费预测中的应用[J].经济经纬,2007(5):11-13

[2]池启水,刘晓雪.ARIMA模型在煤炭消费预测中的应用分析[J].能源研究与信息,2007,23(2):117-123

[3]蒋燕.ARIMA模型在广西全社会固定资产投资预测中的应用[J].数理统计与管理,2006,25(5):588-592

[4]龚国勇.ARIMA模型在深圳GDP预测中的应用[J].数学的实践与认识,2008,38(4):53-57

[5]李伟,罗泽举.基于线性神经网络的重庆市GDP发展研究[J].重庆工商大学学报:自然科学版,2014,31(2):37-42

[6]王燕.应用时间序列分析[M].北京:中国人民大学出版社,2005

[7]樊欢欢,张凌云.EViews统计分析与应用[M].北京:机械工业出版社,2009

[8]易丹辉.数据分析与Eviews的应用[M].北京:中国统计出版社,2005

Application of ARIMA Model in the Prediction of Energy
Consumption of Chongqing

LI Yan-yan
(School of Mathematics and Statistics,Chongqing Technology and Business University,Chongqing 400067,China)

Abstract:Resource is important basic material for human survival and development.It plays an irreplaceable role in the rapid development of economy and greatly improving people's living standards.With the development of economy,people's demand for energy is increasing,because the resources are limited on earth,therefore,it is particularly important to accurately predict future energy consumption.This paper uses ARIMA model to analyze 1981-2012 annual energy consumption data of Chongqing based on Chongqing Statistical Yearbook 2013.The result shows that the predict of future energy consumption by ARIMA (2,3,2) model is more accurate,which provides reliable basis for resource consumption of Chongqing.

Keywords:ARIMA model; time series; energy consumption; prediction

中图分类号:O224

文献标志码:A

文章编号:1672-058X(2015) 08-0054-07

doi:10.16055/j.issn.1672-058X.2015.0008.012

收稿日期:2014-10-01;修回日期:2014-12-09.

*基金项目:重庆市教委科技项目(KJ1400613).

作者简介:李岩岩(1988-),女,河南开封人,硕士研究生,从事统计学经济社会统计研究.

猜你喜欢
ARIMA模型时间序列能源消耗
基于时间序列模型的中国出口总额分析及预测
基于R软件的金融时间序列的预测分析
基于Eviews上证综合指数预测
基于时间序列的我国人均GDP分析与预测
基于线性散列索引的时间序列查询方法研究
基于ARIMA模型的沪铜期货价格预测研究
基于组合模型的能源需求预测
工业制造项目新增能源消耗影响的对比研究
数据分析检测能源消耗异常研究
项目新增能源消耗影响分析研究