耿立艳 胡瑞 张占福
[摘 要]城際高铁客流量序列呈现出不平稳和波动性特征,常规预测方法很难对其进行精准预测。文章提出将EMD、GRNN和ARIAM模型相结合的城际高铁客流量预测模型(EGA)。EGA模型充分利用三者的优势,提升城际高铁客流量预测精度。通过某城际高铁站日客流量数据检验EGA模型的有效性,结果表明,与GRNN相比,EGA模型获得了更高的城际高铁客流量预测精度。
[关键词]EGA;高铁客流量预测;EMD;GRNN;ARIMA模型
[DOI]10.13939/j.cnki.zgsc.2021.04.026
1 前言
由于城际高铁客运系统受到多种复杂因素的共同作用,其客流量数据序列呈现出不平稳与波动性特征。GRNN具有很强的非线性映射能力和柔性网络结构以及高度的容错性和鲁棒性,适用于解决非线性问题,但在对某些接连的点处,数据值有较大波动的数据预测拟合曲线仍十分接近直线。而经验模态分解后的数据极大地消除了数据的不平稳特性,可提高神经网络预测的准确性。模态分解后的数据序列,频率是逐渐减小的。所以可对低频的数据使用ARIMA模型拟合,对高频数据用广义回归神经网络拟合。为提高城际高铁客流量预测精度,文章将经验模态分解、广义回归神经网络、ARIMA模型相结合(文中以下简称EGA模型),通过以上思路预测高铁客流量。
2 EGA模型
2.1 广义回归神经网络GRNN
广义回归神经网络(Generalized Regression Neural Network,GRNN),由美国学者Specht在1991年提出,是径向基神经网络的一种,GRNN具有很强的非线性映射能力和柔性网络结构以及高度的容错性和鲁棒性,适用于解决非线性问题。对于小样本与不平稳的数据也有较强的处理能力。GRNN由四层组成,分别为输入层、模式层、求和层和输出层。理论基础是非线性回归分析,Y相对于X的回归分析实际上是计算具有最大概率值的y。
2.2 EMD
经验模态分解(Empirical Mode Decomposition,EMD),是由美国国家宇航局华裔科学家Norden e Huang博士于1998年提出的一种新的处理非平稳信号的方法。经验模态分解法能使非平稳数据进行平稳化处理。与短时傅立叶变换、小波分解等方法相比,这种方法是直观的、直接的、后验的和自适应的,因为基函数是由数据本身所分解得到。由于分解是基于信号序列时间尺度的局部特性,因此具有自适应性。
2.3 ARIMA模型
ARIMA模型是对数据进行差分后建立ARMA模型。由于建立ARMA模型的前提条件是时间序列的均值和方差没有发生系统变化,ARMA模型要求数据具有平稳性的特性。差分是对求导的近似,数据在差分后具有很好的平稳性。
2.4 模型构建
EGA模型首先通过EMD算法对城际高铁客流量数据进行分解处理,再对分解得到的各阶数据分别建立GRNN预测模型与ARIMA预测模型,通过预测的结果确定两模型对数据的适用阶数,然后对相应的数据进行拟合预测,将得到的各预测值进行相加重构,得到模型的预测结果。
3 实证研究
3.1 数据描述
以某城际高铁站日客流量数据为例进行实证研究,时间区段为2017年1月1日至2017年12月31日,共365个样本。
图1为某城际高铁站日客流量曲线图,从中可直观看出,城际高铁站日客流量序列具有明显的波动性和不平稳性。
3.2 EMD分解与模型阶数的确定
图2为某城际高铁站日客流量EMD分解结果,图3为ARIMA模型和GRNN模型对分解数据的预测误差。由误差曲线对前三阶数据使用GRNN模型进行拟合,对其他阶数据使用ARIMA模型进行拟合。
3.3 预测与结果分析
在365个样本中,取第355天到第364天的数据为需要预测的数据,之前的数据作为已知的数据进行拟合预测。
为了比较预测效果,文章选用RMSE、MAE、MPE以及西尔统计量(Theil)共四项评价指标比较模型的预测性能,四项指标的计算公式如下:
其中,yt和t分别为日客流量的实际值和预测值,N为预测样本个数。以上指标值越小,表明模型的预测性能越好。
表1列出了GRNN模型和EMD-GRNN模型的预测结果。由表1可知,在所选取的样本期内,W-ARIMA模型的预测性能明显优于ARIMA模型,主要体现W-ARIMA模型的RMSE、MAE、MPE和Theil值均小于ARIMA模型的对应值。
图4给出了EGA模型和FRNN模型的预测值曲线图。由图4可看出,EGA模型较好地预测出城际高铁客流量每日流量,客运量预测值均比较接近于实际值,而GRNN模型的客流量预测值在某些连续点与每日实际值偏差较大。
4 结论
文章提出一种结合经验模态分解,GRNN,ARIMA模型的高铁客流量预测模型。实证研究结果表明,该模型与GRNN相比,城际高铁客流量预测能力更强。
参考文献:
[1]胡爱军,孙敬敬,向玲.经验模态分解中的模态混叠问题[J].振动.测试与诊断,2011,31(4):429-434.
[2]BOX G E P,JENKINS G M.Time series analysis:forecasting and control[M].San Francisco:Holden Day,1976.
[3]耿立艳.基于波动聚集性的城际高铁客流量预测[J].铁道科学与工程学报,2019,16(8) :1891-1892.
[4]杨叔子.时间序列分析的工程应用(上册)[M].2版.武汉:华中科技大学出版社,2007:236-237.
[5]珀西瓦尔.时间序列的小波方法[M].北京:机械工业出版社,2004.
[基金项目]国家自然科学基金青年项目(项目编号:61503261);2019年度河北省人才培养工程项目(项目编号:A201901048);2019年中国物流学会、中国物流与采购联合会面上研究课题(项目编号:2019CSLKT3-020)。
[作者简介]耿立艳(1979—),女,汉族,天津人,博士,教授,硕士生导师,研究方向:铁路规划与运输管理。