潘玲 朱厚强
[摘要]随着我国经济实力不断增强,人民生活水平也不断提高,民航运输在人们的生活中发挥着越来越重要的作用。本文基于时间序列分析基本原理,选取2005年1月—2013年11月共107个月的月度数据建立ARIMA乘积季节模型,并对2013年12月—2014年12月的民航客运量进行预测分析。以期对序列中民航客运量的长期递增趋势以及以年为周期的季节效应进行解释,并根据预测结果给出相应的结论和建议。
[关键词]民航客运量;ARIMA乘积季节模型;预测
[中图分类号]F562[文献标识码]A[文章编号]1005-6432(2014)22-0115-02
1问题的提出
民航运输作为我国现代化交通运输方式之一,其发展程度有效反映了国民经济水平与社会发展状况。近年来,随着居民收入的提高和人们生活方式的改善,越来越多的人选择飞机作为出行工具。尤其是我国旅游业的快速发展,更是大大带动了人们对民航运输的需求。据统计数据显示,累计到2013年11月,我国民航客运量已达到326亿人,同比增长103%。而根据美国麻省理工学校航空运输实验室的研究结果,市场预测准确度每提高10%,在市场需求旺季航空公司收益就可以提高1%~4%。[1]因此,对未来民航客运量做出准确而又及时的预测,不仅能够帮助我国航空公司优化航线结构,提高收益,更有利于促进我国民航交通建设,方便人们出行。
目前,国内已有相关学者对民航客运量进行了研究与预测。陈林(2008)利用线性回归方法建立了我国民航国内旅客运输需求函数。[2]王翠(2008)基于灰色理论和RBF神经网络模型进行民航客运量预测方法的研究和比较。[3]程小康(2008)则建立了基于判别分析——SVR的“影响因素—民航客运量”预测模型。[4]考虑到民航客运量虽然受众多因素影响,具有不确定性,但同时也具有变化的规律性和历史的延续性。故本文选取时间序列分析方法,建立ARIMA季节乘积模型,对我国民航客运量进行实证分析与预测。
2研究方法
时间序列分析是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以进行定量预测。[5]
ARIMA模型全称为差分自回归移动平均模型,其中AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。当序列中既含有季节效应又含有长期趋势效应,且简单的ARIMA模型不足以提取其中复杂的相关关系时,通常需要采用季节乘积模型。其一般表达式为:
该乘积模型简记为ARIMA(p,d,q)×(P,D,Q)S
3模型的构建及预测分析
31数据的来源及预处理
本文主要分析我国民航客运量,选取2005年1月至2013年11月的月度数据作为样本分析。数据来源于《中国国家统计局官网》。
通过观察民航客运量的序列时序图(图1),可以看出我国民航客运量具有明显的长期递增趋势和以年为周期的季节效应,尤其是每年的10月客运量都很高,可能与“十一”假期有关。同时,观察自相关图自相关系数衰减缓慢。因此,判定该序列是一个非平稳序列。
图1民航客运量序列时序图对原序列做一阶差分和一阶(12步)季节差分,希望提取原序列趋势效应和季节效应。差分后时序图如图2所示,序列类似平稳。自相关图(图3)显示延迟12步自相关系数显著大于2倍标准差范围,说明序列中仍含有季节效应,但相对于一阶差分后的情况季节性特征明显改善。同时,延迟一阶后的自相关系数都落入2倍标准差范围以内,说明差分后的序列具有明显的短期相关性,进一步说明序列平稳。图2民航客运量一阶12步差分后序列时序图
图3民航客运量一阶12步差分后序列自相关图
图4民航客运量一阶12步差分后序列偏自相关图
通过LB统计量检验序列的随机性。由表1可以看出,延期6阶和12阶的LB统计量p值均<005,拒绝原假设,即短期序列值之间存在显著的相关关系。故认为该平稳序列为非白噪声,有规律可循,可以进行下一步研究。
表1非白噪声检验滞后自相关标准误差aBox-Ljung 统计量值dfSig眀600690099204216000212-0364009541540120000a奔俣ǖ幕础过程是独立性(白噪声)。
b被于渐近卡方近似。
32模型定阶
根据自相关图(图3)和偏自相关图(图4)12阶以内的系数特征主观判断,可能有以下三种情况:ACF一阶截尾,PACF拖尾;ACF拖尾,PACF二阶截尾;ACF和PACF均拖尾。所以尝试MA(1),AR(2)和ARMA(1,1)模型提取差分后序列的短期自相关信息。
又自相关图和偏自相关图显示延迟12阶系数显著非零,故尝试以12步为周期的AR(1)12,MA(1)12和ARMA(1,1)12模型提取差分后序列的季节自相关信息。
综合前面的差分信息,拟建立的ARIMA季节乘积模型为(1,1,1)×(0,1,1)12、(0,1,1)×(0,1,1)12、(2,1,0)×(0,1,1)12、(1,1,1)×(1,1,0)12、(0,1,1)×(1,1,0)12、(2,1,0)×(1,1,0)12、(0,1,1)×(1,1,1)12、(1,1,1)×(1,1,1)12、(2,1,0)×(1,1,1)12。
33参数估计与模型检验
对上述9个拟建立的模型进行参数估计,结果显示,模型(0,1,1)×(1,1,1)12、(2,1,0)×(1,1,1)12、(1,1,1)×(1,1,1)12、(1,1,1)×(1,1,0)12系数估计量在5%显著性水平下不具有显著性,故这4个模型不合适应剔除。
其次,根据BIC准则、调整后的R2和平均绝对百分误差MAPE值三个标准在剩下的5个模型中选择合适的模型。模型检验结果如表6,相比之下,虽然(1,1,1)×(0,1,1)12调整后R2最高,但(0,1,1)×(0,1,1)12的BIC值最低,能够有效弥补根据自相关图和偏自相关图定阶的主观性,且2次高,说明此模型拟合效果较好。故选(0,1,1)×(0,1,1)12模型为民航客运量的预测模型。从残差的自相关图和偏自相关图(图5)可以看出,其自相关系数和偏自相关系数均落在2倍标准差范围内,则残差序列可以认为是白噪声序列,序列的有效信息提取的较为彻底,拟合的模型显著有效。
表2模型检验结果R2BICMAPE(0,1,1)×(0,1,1)12040290743587(0,1,1)×(1,1,0)12032491973758(2,1,0)×(0,1,1)1203929153617(2,1,0)×(1,1,0)12031692683795(1,1,1)×(0,1,1)12042191023486
图5残差序列自相关和偏自相关图
最终模型的参数估计结果如表3所示。可以看出参数的P值均为0000,在005水平下很显著,认为模型拟合较好。
表3参数估计结果估计SEtSig泵窈娇驮肆-模型_1民航客运量无转换差分MA滞后 1季节性差分MA,季节性滞后 11053700896033000010601011352990000
综上可以确定我国民航客运量模型(0,1,1)×(0,1,1)12的具体表达式为
(1-B)(1-B12)xt=(1-0537B)(1-0601B12)εt
34模型预测
利用(0,1,1)×(0,1,1)12模型对2013年12月至2014年12月的民航客运量进行预测,预测结果如表4所示。
表4预测结果时间Dec-13Jan-14Feb-14Mar-14Apr-14May-14预测值28539329607629906310677315162312707Jun-14Jul-14Aug-14Sep-14Oct-14Nov-14Dec-14310857349842362667328727341257313561311047
4总结分析
使用2005年1月至2013年11月的民航客运量月度数据建立了模型,模型拟合结果较好,且预测精度较高,现对模型总结如下:
第一,我国民航客运量随着时间的推移不断增加,说明人民生活水平日益提高,越来越多的人能够负担起航空运输,需求上涨;第二,我国民航客运量存在季节性波动,这里的“季节”具有广义性,主要指节假日带来的周期波动,比如每年的“十一”和春节我国民航客运量会显著上升。此外,由模型形式可以得出,差分后的民航客运量序列受自己影响不大,易受外界环境的影响(因为是MA模型),反映出民航客运量是脆弱的时间序列模型。比如2003年的SARS事件导致我国民航客运量急速下降等,模型与事实相符。
同时,预测结果显示,2014年我国民航客运量预计可以突破35亿人次,平均每月客运量能达到3100万人,其中7月最高达到3498万人。面对如此庞大的客流量,航空公司应及时作出应对措施,如及时购买飞机、增设机场和培养飞行员等。但这些都不是短期内能够实现的,因此,进行准确的民航客运量需求预测,为航空企业提供一些有价值的参考信息,在短期应对和长期规划层面都具有重要意义。
参考文献:
[1]王婷泵窈娇驮肆康腁RIMA模型与预测[J].五邑大学学报:自然科学版,2007,21(1):38-42
[2]陈林蔽夜民航国内旅客运输需求函数的实证研究[J].中国民航飞行学院学报,2008,19(1):27-30
[3]王翠被于灰色理论和RBF神经网络民航客运量预测方法研究[D].北京:北京交通大学,2008
[4]程小康被于判别分析SVR的民航客运量预测模型研究及应用[J].四川大学学报:自然科学版,2008,45(3):527-531
[5]王燕庇τ檬奔湫蛄蟹治觯跰].北京:中国人民大学出版社,2005