商丰瑞 张静
摘要:我国快递业务总量目前已成为全球第一,快递业发展具有长趋势性和短周期性。本文探讨基于SARIMA模型对我国快递业务量数据进行分析,解释数据的特征并用来预测。本文分析了我国2003~2015年的月度快递包裹总量时间序列,剔除时间趋势和季节周期性后使原序列平稳并建立季节时间序列模型。通过对不同模型进行参数估计和比较后发现:SARIMA(0,1,1)(0,1,1)[12] 模型可以得到较为理想的结果,它能很好地拟合我国月度快递包裹总量时间序列,分析发现受春节假期影响,模型在二月份预测准确度较差。
关键词:SARIMA 模型;月度快递包裹总量;预测
中图分类号:F252.5 文献识别码:A 文章编号:1001-828X(2016)030-000-01
一、研究背景
2016年,我国快递业务总量已跃居全球第一。电子商务的兴盛有效带动快递行业的高速发展,反之,快递行业的提升也为电子商务的增长提供配套支撑。对快递包裹的总量预判是快递运输企业在投资决策、风险评估、人员管理中至关重要的一环。只有通过理论研究和实证分析,利用科学的分析方法,对海量数据进行有效分析、深度挖掘,并建立包裹量预测模型,才能为企业在运输经营上提供有效决策。
目前,利用我国快递业务量月度数据建立季节时间序列模型并进行短期预测的文章还很少。本文主要运用时间序列的确定性因素分解方法和SARIMA(季节时间序列)模型分析法,借助R软件时间序列分析包tseries和预测包forecast对数据进行处理和模型拟合,最终选择合适的模型参数对我国快递业务量进行分析和预测。
二、SARIMA模型简介
SARIMA模型(Seasonal Autoregressive Integrated Moving Average),全称为自回归单整移动平均季节模型,主要是基于经济学理论知识和计量经济学方法,对研究标的物的变量因素建立序列回归,并利用样本数据观察值(周期项)和随机项对价格走势进行短期测算。季节时间序列在经过合理的函数变换之后,都可以分拆为三项:趋势项、周期项和随机项。趋势项反映的是整体价格走势的方向;周期项表示特定时间周期内的价格变化特点;随机项考虑的是不确定或者突发条件下,产生的价格随机信号和随机噪声。快递业务量的时间序列数据就属于季节时间序列,通过SARIMA模型选择合适的模型参数就可以对其进行分析和预测。
三、模型建立
(一)原始数据预处理
国家统计局网站2003年1月至2014年12月的快递量-当期值(万件)数据显示,从2008年开始,我国快递包裹量呈级数增长,并且存在明显的周期性变化,快递行业在此期间飞速发展。这种周期是由于季节性变化或其他一些固有因素引起的。在快递包裹运输领域中,季节性影响是不可避免的。因此,SARIMA模型可以合理分析和准确预测我国快递业务量。
(二)预测模型建立
接下来使用R软件时间序列包的decompose函数对包括时序数据进行分解,分别为随机、趋势、季节。
通过随机、趋势、季節三张图可以看出,我国快递包裹量呈级数增长;包裹量的变化存在季节性因素;时序随机性变化平稳。
分别选择SARIMA(0,1,1)(0,1,1)[12]模型和SARIMA(0,1,1)(0,1,2)[12]模型进行预测比较。
可见,模型预测效果差距较小,但SARIMA(0,1,1)(0,1,1)[12]模型效果更好,而且除了二月份,其余三个月的预测值可以说非常准。二月份之所以不准,主要原因是赶上春节假期,全国休假,包裹量骤降是必然的。
四、结论
本文利用SARIMA季节时间序列模型,对我国2003~2015年的月度快递包裹总量时间序列进行分析,明确我国快递包裹总量时间序列存在指数级增长趋势和季节性变化。通过设定SARIMA模型的不同参数,得出SARIMA(0,1,1)(0,1,1)[12]模型有较低的AIC值,预测准确率较高。
SARIMA模型是在ARIMA模型基础上优化而来的一种预测模型,与众多预测模型相比,SARIMA模型对季节性时间序列数据具有较好的预测效果。因此,SARIMA模型对今后我国快递业务量的分析和预报有很大的参考价值。
参考文献:
[1]赵喜仓,周作杰.基于SARIMA模型的我国季度GDP时间序列分析与预测[J].统计与决策,2010,11:18-20.
[2]张健.SARIMA模型在预测中国CPI中的应用[J].统计与决策,2011,5:28-30.
[3]贾凯威,韩家彬,杨洋.基于SARIMA模型的短期通货膨胀预测.统计与决策,2014,22:33-35.