王旭天 李政远 舒慧生
[摘要]汽车工业在国民经济中占有重要地位,准确预测汽车销量具有十分重要的意义。由于假日及其他因素影响,汽车的月度销售数据表现出季节性的特征。文章选用我国2004年1月—2015年1月的汽车月度销售数据为研究对象,构建了具有季节调整的ARIMA模型并用于销量预测,预测结果的平均相对误差可控制在3%以内,模型合理有效,具有良好的参考价值。
[关键词]ARIMA模型;汽车销量;SARIMA预测
[DOI]10.13939/j.cnki.zgsc.2016.01.071
1 引 言
随着我国经济的快速发展和居民生活水平的提高,汽车在人群中开始逐渐普及,成为许多人的生活必需品。与此同时,汽车工业迅速发展,在国民经济中也扮演着越来越重要的角色,与机械电子、石油化工和建筑业一道构成了我国经济的四大支柱产业,因而如何对汽车销量进行准确的预测具有重要意义。
ARIMA模型是20世纪70年代由博克斯和詹金斯提出的时间序列方法[1][2],所以又被称为博克斯-詹金斯法,其全称是自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model),包含移动平均过程(MA)和自回归过程(AR)两个部分。ARIMA模型发展至今理论已非常成熟,在实践中应用广泛。如龚承刚,王梦等人将ARIMA模型运用到了对湖北省城乡居民收入差距的预测中,预测到未来三年湖北省的城乡居民收入差距比仍处在较高水平。[3]薛蓓蓓运用ARIMA模型对安徽省固定资产投资总额进行了建模和预测,借助Eviews软件给出了短期的预测值。[4]张丽,牛惠芳将SARIMA模型运用到了对我国CPI的分析预测中,对CPI月度数据的变化趋势和季节性进行了分析。[5]虞安和王忠采用引力模型和ARIMA模型对旅游人群进行了预测,对城市管理和旅游秩序的维护工作提供了意见和建议。[6]
本文将以汽车工业协会公布的汽车销量月度数据为研究对象,根据月度数据同时具有长期趋势效应、季节效应和随机波动的特点,选取具有季节调整的ARIMA模型对汽车销量进行预测。
2 模 型
3 建模过程
建模的过程主要分为以下四步:
第一步:序列平稳化。所研究的数据如果是非平稳的,则不满足建模的条件,需要先对数据进行处理,在应用中差分x=xt-xt-1是常用的方法,差分后还需要通过ADF检验验证序列是否已经平稳化。
第二步:模型识别。在这个过程中,绘制样本的自相关函数图(ACF)和偏自相关函数图(PACF),然后观察时间序列样本的自相关系数和偏相关系数的特征确定ARMA模型的阶数,模型阶数的判断标准如下:
第三步:模型拟合。在确定模型的阶数后,需要对模型中的参数进行估计,这一步中常用的方法是最小二乘法,在实际的应用中,可通过统计软件求得拟合值。
第四步:模型诊断。为保证模型的有效性,需要对模型进行残差的白噪声检验。残差的LB统计量近似服从自由度为m的卡方分布,若统计量的P值大于显著性水平,可认为残差序列是纯随机序列,说明信息已被模型完全提取;反之则说明有些信息未能被提取,模型还需改进。为了保证模型的精简性,还要对参数的显著性进行检验,剔除不显著为零的参数。
4 实例分析
本文选取的研究数据为中国汽车工业协会公布的2004年1月—2015年1月全国汽车销量月度数据,原始数据如表2所示。在建模过程中,将2004年1月—2014年3月的销售数据用于构建模型,而将剩余数据将用于检验模型的预测效果。
绘制汽车销量走势图,如图1所示。从图中可以看出,我国的汽车销量同时表现出波动趋势和增长趋势。由于春节假期因素的影响,每年2月都是全年的销售淡季,与其他月相比较2月的汽车销量大幅下滑。而从长期趋势来看,汽车的销量在逐年增长。
下一步对模型进行识别,首先绘制{zt}的自相关图(ACF)和偏自相关图(PACF),如图3所示。图像表明在延迟12阶处,自相关系数和偏自相关系数都显著非零;在延迟24阶处,自相关系数完全落入了2倍标准差范围以内,但是偏自相关系数仍然显著非零。因此在季节自相关特征上,自相关系数截尾,而偏自相关系数拖尾。为了提取差分后序列的季节信息,可以使用ARMA(0,1)12模型。
然后再考虑模型的短期相关性,自相关系数和偏自相关系数在延迟2阶后均快速衰减到2倍标准差之内,可以尝试对p和q取不同的值,再根据SBC准则选出相对最优模型。在模型ARIMA(p,d,q)×(P,D,Q)12中,现在已知P=1,Q=1,以及d=1,D=1。在保持这四个参数不变的条件下,分别取p=1,2和q=0,1,2,SBC信息量的计算结果如表4所示。结果表明,当p=1,q=0时,SBC信息量相对最小。
5 结 论
在每月销量的预测中,除了2014年12月的预测值与实际值偏差较大外,其余月份的预测偏差都控制在了3%以内,其中2014年6月、7月和10月的预测偏差更是控制在了1%以内,而预测值的平均绝对百分比误差为MAPE=2.36,预测效果良好。
在年初由于春节假期的影响,汽车销量往往较低,而在年末因汽车经销商为完成销售指标而开展各种促销活动,汽车销量出现高峰,汽车的销售表现出明显的季节性变化,选用具有季节调整的ARIMA模型是非常合理的。事实上在本例中SARIMA模型的预测偏差能够控制在合理的范围之内,该模型对汽车销量预测活动具有良好的参考价值。
参考文献:
[1]博克斯,詹金斯,格雷戈里,等.时间序列分析:预测与控制[M].4版.北京:机械工业出版社,2011.
[2]王燕.应用时间序列分析[M].3版.北京:中国人民大学出版社,2012.
[3]龚承刚,王梦,谢航.基于ARIMA模型的湖北省城乡居民收入差距的预测[J].统计与决策,2014(15):94-97.
[4]薛蓓蓓.基于ARIMA模型:全社会固定资产投资总额预测[J].统计与决策,2014(15):141-143.
[5]张丽,牛惠芳.基于SARIMA模型的居民消费价格指数预测分析[J].数理统计与管理,2013(1):1-6.
[6]虞安,王忠.基于ARIMA模型与时间序列的城市旅游倾向预测[J].统计与决策,2014(13):86-89.