韦凌翔 陈 红 王永岗 钟栋青 王春娥
(盐城工学院材料工程学院1) 盐城 224051) (长安大学公路学院2) 西安 710064)
基于RVM和ARIMA的短时交通流量预测方法研究*
韦凌翔1,2)陈 红2)王永岗2)钟栋青1)王春娥1)
(盐城工学院材料工程学院1)盐城 224051) (长安大学公路学院2)西安 710064)
为进一步提高短时交通流量预测精度,提出一种基于RVM和ARIMA的短时交通流量降噪方法.设计了降噪方法的流程,选取了降噪方法误差评价指标;基于RVM和ARIMA的短时交通流量预测方法和预测流程,引入平均绝对相对误差(MAPE)作为预测方法误差评价指标,以某城市道路的录像数据为实例,对构建的预测方法有效性进行验证.结果表明,在不同公用时间尺度(5,10,15 min)下,所提出的短时交通流量预测方法的平均绝对相对误差均小于直接运用指数降噪模型、BT神经网络模型、ARIMA模型等方法预测的结果,有效地提高了短时交通流量预测精度.
交通工程;短时交通流量预测;相关向量机;多时间尺度;自回归积分移动平均模型
智能交通系统(intelligent transport system,ITS)被视为缓解城市交通拥挤等一系列交通问题的有效方法之一[1-5].短时交通流量预测是智能交通系统的核心内容,其预测方法分为统计分析模型、人工智能模型、非线性理论、交通仿真、组合预测模型等五大类.由于短时交通流量自身具有一定随机波动特性,导致很多交通参数预测方法很难进一步有效提高预测精度和效果.对于基于人工智能模型和非线性理论的预测方法,这两类预测方法的模型计算复杂、适用条件相对有限,在短时交通流量的预测过程中有很多的局限性;对于基于交通模拟的预测方法,此类预测方法过度依赖交通仿真软件,造成短时交通流量预测前期工作复杂.自回归积分移动平均模型(autoregressive integrated moving average model,ARIMA)作为成熟的基于统计分析模型预测方法,同时也是经典的时间序列模型,在交通流量预测中应用效果良好,但是ARIMA模型预测精度受短时交通流量波动性影响较大.相关向量机(relevance vector machine,RVM)数据训练是在先验参数的结构下,基于主动相关决策理论移除不相关的点,降低数据随机波动性对其变化态势影响,即降低数据噪音干扰,进而获得可体现数据本身变化特征的稀疏化模型.
文中在分析短时交通流量时间序列特性基础之上,借助RVM模型可降低短时交通流量随机波动性(噪音干扰)优势,构建基于RVM的短时交通流量降噪处理方法,以有效降低短时交通流量随机波动特性对预测精度影响;此外,为检验进行降噪处理后的预测精度与效果,拟构建一种基于RVM和ARIMA的短时交通流量预测方法.
1.1 短时交通流量降噪方法构建
1.1.1 短时交通流量降噪模型定义
构建降噪方法的目的是应用训练数据和先验知识来设计一个降噪系统,使设计系统对输入新时刻值x*,降噪输出与之对应时刻的交通流量降噪值q*.为此,给定短时交通流量训练数据集
式中:xn为由公用时间尺度T为时间间隔构成的时间序列(输入向量);tn为与输入时刻xn对应未降噪(原始)的交通流量时间序列(训练向量),tn由实际采集的交通流量数据按照不同时间尺度短时交通流量合并方法确定.
此外,假定qn为与输入时刻xn对应降噪后的交通流量时间序列(输出向量).
基于以上分析和假定,tn可以看作未知函数q(xn,w)被方差为σ2的高斯噪声污染所至.则RVM降噪模型可以定义为
(1)
(2)
式中:tn=(t1,t2,…,tN)T;Φ为N×(N+1)矩阵,Φ=(φ1,φ2,…,φN)T,其中φ(xn)=[1,K(xn,x1),K(xn,x2),…,K(xn,xN)]T.
1.1.2 降噪模型参数确定与更新方法
由于构建的降噪模型中存在较多的参数,而运用最大似然估计由式(3)得到的w,σ2易造成过拟合,所以根据RVM模型参数确定的思路、方法,采用稀疏贝叶斯的原理对w赋予零均值高斯先验分布得:
(4)
式中:α为N+1维的超参数向量.每个权重就可以单独地对应一个超参数,进而达到控制先验分布对各个参数影响,确保RVM降噪模型的稀疏性.
基于上述定义的先验概率分布、似然分布,依据贝叶斯的原理,可求得模型中所有未知参数后验概率分布为
(5)
式中:后验协方差矩阵、均值分别为
(6)
(7)
其中:A=diag(α0,α1,…,αN).
对α对数的边缘似然为
(8)
1.1.3 短时交通流量降噪函数建立
若给定新的时刻输入值x*,对应的短时交通流量数据降噪目标值为t*,则相应降噪输出的概率分布服从高斯分布.
(9)
短时交通流量数据估计值q*可作为在时刻x*的降噪值.
1.2 相关向量机核函数选择集确定
常用的几类核函数有线性核函数、多项式核函数、高斯径向基核函数等三种[8].结合短时交通流量实际特性,综合考虑各种核函数适用性,文中选取高斯径向基核函数构建对应基于RVM的降噪方法,其计算式为
(10)
式中:x为目标输入向量;xi为短时交通流量训练样本集中第维的输入向量;ϑ为高斯径向基核函数宽度.
1.3 降噪方法流程设计及误差指标选取
1.3.1 降噪方法流程设计
对短时交通流量的降噪流程设计见图1.
图1 短时交通流量时序数据降噪方法流程图
1.3.2 评价指标选取
为更好地分析短时交通流量降噪结果以及所建立降噪函数性能,本文选取均方根误差(root-mean-squareerror,RMSE)和模型训练时间作为评价指标.RMSE计算式为
(11)
2.1 短时交通流量预测模型确定
ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数.ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括自回归模型(AR)、移动平均模型(MA)、自回归移动平均模型(ARMA)以及自回归积分移动平均模型(ARIMA).
2.2 短时交通流量预测工作流程设计
对短时交通流量预测流程设计见图2.
图2 基于RVM和ARIMA的预测工作流程图
2.3 短时交通流量预测方法评价指标选取
为更好的对短时交通流量预测方法的预测精度进行比较,引入平均绝对相对误差(MAPE)作为预测方法性能评价指标.其计算式为
(12)
3.1 数据来源
以某城市道路的录像数据为实例验证的研究对象,数据采集时间为2015年某月,选取连续五个周三自有时间尺度为1min全日24h交通流量作为预测工作的数据来源.本文截取06:30—18:30连续12h五个周三的交通流量数据作为预测研究数据,见图3.
图3 五个周三时间尺度为1 min连续10 h交通流量数据
3.2 短时交通流量时间尺度合并
时间尺度可划分为自有时间尺度、公用时间尺度两个类别.自有时间尺度表征各类检测手段获取短时交通流量数据采集的时间周期,通常自有时间尺度为1min或者更小;公用时间尺度则表征用户(使用者)要求预测数据的时间长度,公用时间尺度主要有5,10,15min.基于以上分析,本文预测方法研究的自有时间尺度为1min,公用时间尺度选择5,10,15min三个时间尺度,见图4.
图4 五个周三连续10 h交通流量时间尺度合并图
3.3 基于RVM的短时交通流量降噪
通过多次试验证,在进行基于RVM的降噪时,核函数选取高斯径向基核函数(ϑ=10)的拟合效果合理.结合短时交通流量自身特性,高斯径向基核函数具有较宽收敛域,可适用低维、高维、小样本、大样本等多种情况,高斯径向基核函数同时也是局部学习能力很强的核函数,适合短时交通流量易受到相邻数据影响的特点.基于此,对一些输入参数进行设定如下:核函数选取高斯径向基核函数,ϑ=10;最大迭代次数为1 200次.借助MATLAB编程,可以得到不同公用时间尺度的降噪拟合图见图5(仅展示在公用时间尺度5,10,15min各一个周三的整体降噪拟合图像),不同公用时间尺度下的降噪结果汇总见表1.
表1 五个周三交通流量降噪结果
图5 第一个周三交通流量降噪结果
由图5、表1的降噪结果可知:①整体上看,所设计的降噪方法具有良好降噪功能,其中RMSE值(在不同时间尺度下均小于9,交通流量的数量级为100)相对较小,训练时间(在不同时间尺度下均小于5 s,实际尺度的数据级为60 s)相对较短,RVM降噪函数曲线整体拟合效果较好,因此设计的短时交通流量时间序列降噪方法可作为构建交通流量预测工作前期数据处理方法,可以有效降低短时交通流量随机波动性(噪音干扰).②对于不同时间尺度下的短时交通流量时间序列,基于RVM的降噪方法均表现出良好降噪效果,有效降低短时交通流量时间序列随机波动性(噪音干扰),为提高短时交通流量预测精度提供方法依据.
3.4 短时交通流量预测结果及分析
按照构建的短时交通流量预测方法对未经降噪的短时交通流量数据、经降噪的短时交通流量数据进行预测.得到五个周三公用时间尺度下全日06:30至18:30连续10 h交通流量预测结果见图6~7.
图6 五个周三交通流量预测结果MAPE值
图7 第一个周三交通流量预测图
由图6~7可知:①整体上看,基于RVM和ARIMA的短时交通流量预测方法在不同公用时间尺度(5,10,15 min)短时交通流量的预测值平均绝对相对误差(MAPE)比基于ARIMA的短时交通流量预测方法在不同公用时间尺度(5,10,15 min)短时交通流量预测值平均绝对相对误差(MAPE)要低,可见基于RVM和ARIMA的短时交通流量预测方法在短时交通流量预测中更具适应性,预测准确度更高.②从平均绝对相对误差(MAPE)上看,公用时间尺度越大,MAPE相对越低,预测效果越好;此外,对于不同公用时间尺度下,基于RVM和ARIMA的短时交通流量预测方法相对于基于ARIMA的短时交通流量预测方法能有效的降低MAPE值.
为对比分析本文构建交通流量的预测方法与其他常用方法的差异性、有效性,本文选取常用的指数降噪模型、BT神经网络模型等预测模型对本文的研究数据进行预测分析.其中,指数降噪模型方面,由于截取的试验数据为单日样本时间序列,具有一定的线性趋势但没有季节性的变化,因此选择指数降噪模型中的Holt-Winters无季节性模型;BT神经网络模型参数选取如下:输入单元个数为4个,输出单元个数为1个,隐层神经元个数为8个,输出层神经元激活函数选取线性函数,隐层神经元的激活函数选取sigmoid函数,得到其在不同时间尺度下的MAPE均值对比图见图8.
图8 不同预测模型下的MAPE均值
由图8可知在不同时间尺度下,文中提出的基于RVM和ARIMA的短时交通流量预测方法的MAPE均值均小于其他预测模型,说明提出的短时交通流量预测方法可以有效提高预测精度.
1) 构建了基于RVM的短时交通流量降噪方法,为降低短时交通流量随机波动性提供了较为可靠的理论依据.
2) 提出了基于RVM和ARIMA的短时交通流量预测方法,为实现更为精准的短时交通流量预测提供了新的理论方法.
3) 以某城市道路的录像数据为实例验证构建的基于RVM和ARIMA的短时交通流量预测方法有效性.结果表明基于RVM和ARIMA的短时交通流量预测方法在短时交通流量预测中更具适应性,预测准确度更高.
[1]TADAKI S, KIKUCHI M, FUKUI M, et al. Phase transition in traffic jam experiment on a circuit[J]. New Journal of Physics,2013,15(10):103034-103053.
[2]张轮,施奕骋,杨文臣,等.城市快速路交通拥堵持续时间分布特性研究[J].武汉理工大学学报(交通科学与工程版),2014,38(1):1-6.
[3]LEE G Y, PARK H M, CHO H G, et al. The implementation of the intelligent transport system for the real-time roadside environment information transfer[J]. Journal of Comparative Neurology,2011,520(6):76-81.
[4]CHIEW K, QIN S. Scheduling and routing of amos in an intelligent transport system[J]. IEEE Transactions on Intelligent Transportation Systems,2009,10(6):547-552.
[5]王薇,程泽阳,张伟,等.基于层级控制的区域交通信号控制及交通流诱导协调模型[J].武汉理工大学学报(交通科学与工程版),2016,40(4):609-614.
[6]CAESARENDRA W, WIDODO A, YANG B S. Application of relevance vector machine and logistic regression for machine degradation assessment[J]. Mechanical Systems and Signal Processing,2010,24(4):1161-1171.
[7]WEI L, YANG Y, NISHIKAWA R M, et al. Relevance vector machine for automatic detection of clustered microcalcifications[J]. Medical Imaging, IEEE Transactions,2005,24(10):1278-1285.
[8]张世英.协整理论与波动模型[M].北京:清华大学出版社,2014.
Study on the methods of Short-term Traffic Flow Forecasting Based on RVM and ARIMA
WEI Lingxiang1,2)CHEN Hong2)WANG Yonggang2)ZHONG Dongqing1)WANG Chun’e1)
(SchoolofMaterialEngineering,YanchengInstituteofTechnology,Yancheng224051,China)1)(SchoolofHighway,Chang’anUniversity,Xi’an710064,China)2)
In order to improve the accuracy of short-term traffic flow forecasting, a smoothing method of short-term traffic flow based on relevance vector machine (RVM) is established. Firstly, the step of smoothing method of short-term traffic flow is designed. Then, this paper selects evaluation to test the smoothing method. Moreover, this paper analyzes the smooth and steady of short-term traffic flow of time series, and the method of short-term traffic flow forecasting based on RVM and ARIMA is established. Besides, the step of method of short-term traffic flow forecasting is well designed, and the mean absolute percentage error (MAPE) is selected as the evaluating indicator of the method. Finally, the effectiveness of the method of short-term traffic flow forecasting is confirmed by the traffic flow of recording data in an urban road. Results indicate that the MAPE of method of short-term traffic flow forecasting is smaller than the MAPE of exponential smoothing model, BT neural network model and ARIMA model. The proposed prediction method can effectively improve the accuracy of short-term traffic flow forecasting.
traffic engineering; short-term traffic flow forecasting; relevance vector machine; multiple time scales; autoregressive integrated moving average model
2016-12-28
*陕西省自然科学基础研究计划面上项目(2016JM5036)、陕西省交通科技项目(15-42R、15-39R)资助
U491
10.3963/j.issn.2095-3844.2017.02.034
韦凌翔(1991—):男,硕士,主要研究领域为交通数据挖掘与建模分析