基于ARIMA和灰色模型加权组合的短期交通流预测

2016-02-27 02:00谈苗苗成孝刚李海波
计算机技术与发展 2016年11期
关键词:交通流权值差分

谈苗苗,成孝刚,周 凯,李海波

(南京邮电大学 通信与信息工程学院,江苏 南京 210003)

基于ARIMA和灰色模型加权组合的短期交通流预测

谈苗苗,成孝刚,周 凯,李海波

(南京邮电大学 通信与信息工程学院,江苏 南京 210003)

交通流预测是智能交通系统至关重要的一部分,应用于交通流预测的方法非常多,由于实际路况的复杂性和单个方法的局限性,现有方法的精确度亟待提高。为解决这一问题,采用数据融合的方法,对传感器采集的原始数据做数据预处理,利用小波分析去除信号多余的噪声,然后利用ARIMA模型和灰色模型分别对同一交通流序列进行建模,得出两者各自的预测结果后,找出最佳权值对两种模型的结果进行加权,得到数据融合后的预测结果。仿真结果表明,该组合模型改善了单个预测方法的短处,使得预测精度有所提高。

数据融合;ARIMA;灰色模型;加权;小波分析

0 引 言

近年来,交通流预测成为智能交通系统中十分重要的一项工作,在交通管理和控制系统的计划和发展中起着基础作用,其目的是基于过去的数据来预测一个运输网中将来的交通流量情况[1]。应用于交通流预测的方法数不胜数,其可分为三类:传统统计理论方法、神经网络预测方法和非线性预测方法[2],其中一些预测方法在交通流预测应用中取得了不错的预测结果,但由于道路交通系统是一个有高度不确定性、时变复杂的系统,有多种多样的因素会干扰交通流数据的监测,给交通流的预测带来一定的困难[3]。同时,由于单个预测方法不适用于所有交通状态,使得预测精度难以提高,所以文中使用两种预测模型的加权组合方法,使模型之间进行互补,从而提高预测精度,给智能交通系统的研究加入了新元素。文中使用加州交通局所采集的交通流量数据,这些数据为道路上的定点传感器每隔5 min采集一次所得。

1 数据预处理

将交通流信号模型表示为:f(t)=s(t)+n(t),t=0,1,…,n-1。其中,s(t)是有效信号,n(t)是噪声信号,f(t)是现实中传感器取得的交通流信号。小波阈值去噪相比传统的傅里叶分析可以很好地保存信号中的尖峰和突变部分[4],故文中通过对原始时间序列的分解、阈值处理和重构对交通流信号进行去噪处理。

1.1 小波分解

交通流信号是离散信号,所以文中采用多尺度一维离散小波分解。离散小波变换公式为:

(1)

利用式(1)将交通流信号进行两尺度分解,当信号通过高通滤波器和低通滤波器后,输出参数C和L。

1.2 软阈值处理

交通流信号中的噪声可视为高斯白噪声,小波域中的有效信号对应的系数比噪声对应的系数大很多[5]。根据这个特点,文中使用软阈值法进行去噪处理,其表达式为:

xλ=(f-sgn(f)T)I(|f|>T)

(2)

1.3 小波重构

根据小波分解的第2层低频系数以及阈值量化处理后的第1、2层高频系数,进行信号的小波重构[6],即可得到去噪后的交通流时间序列。

2 基础建模

2.1 时间序列建模

2.1.1 变动处理

经过小波去噪处理后得到新的交通流序列,即:{x(t),t=0,1,…,n}。趋势是时间序列自身发展变化的基本规律和特点,交通流时间序列通过差分可以消除趋势[7]。经过d阶逐期差分后,如果差分后的自相关系数很快趋于0,则说明趋势已经消失,得到新的齐次序列yt,记为:

yt=dxt,t>d

(3)

序列的季节性会在趋势变动消除后显现出来,由于差分步长应与季节周期一致,故需计算和考察差分后序列的AC和PAC,判断时间序列的季节周期[8]。令季节差分后的新序列为wt,可表示为:

(4)

2.1.2 均值检验

2.1.3 阶数估计和参数估计

为了方便直接对原序列xt进行预测,且使预测结果可以直观明了,文中选择对原序列xt建立ARIMA(p,d,q)(P,D,Q)S模型[10-11]。通过计算和考察wt的AC和PAC,可以决定p和q的大小。确定模型的阶数后,使用最小二乘法进行参数估计,流程如下:

(1)拟合模型为:

w估=φ1yt-1+φ2yt-2+…+φpyt-p+ut-θ1ut-1-θ2ut-2-…-θqut-q

(6)

(2)假设实测值为w实,预测值为w估,令:

φ=∑(w实-w估)2

(7)

(3)将式(6)带入式(7),得:

φ=∑{w实-(φ1yt-1+φ2yt-2+…+φpyt-p+ut-θ1ut-1-θ2ut-2-…-θqut-q)}2

(8)

(4)分别对φ1,φ2,…,φp和θ1,θ2,…,θq求偏导,令偏导数等于0,即:

(9)

(10)

(5)化简式(9)和式(10)解方程组,即可获得模型参数:

(11)

2.1.4 模型预测结果分析

对于模型的预测结果,使用希尔不等系数(TIC)作为预测评价指标,当TIC越接近0时,表明预测精度越高[12],其计算方法如式(12)。使用偏差率(BP)、方差率(VP)和协变率(CP)分析误差成分,其计算公式如(13)。

(12)

(13)

2.1.5ARIMA模型算法流程

算法:季节性差分自回归移动平均模型算法。

输入:历史交通流数据{f(t)=s(t)+n(t),t=0,1,…,n-1};

输出:季节性差分自回归移动平均模型的预测序列{A(t),t=0,1,…,n-1}。

步骤如下:

(1)利用式(1)进行小波分解,将分解后的信号带入式(2)进行软阈值处理,根据小波分解的低频系数以及阈值量化处理后的高频系数进行小波重构,得到去噪后的交通流时间序列{x(t),t=0,1,…,n}。

(2)通过式(3)、式(4)对序列x(t)进行平稳化处理,去除序列的趋势变动和季节变动,输出平稳序列w(t)。

(3)利用式(5)计算平稳序列w(t)的均值和均值标准误,如果符合均值零假设,进入下一步。

(4)观察序列的AC和PAC,确定ARMA(p,q)的阶数。

(5)使用式(6)~(11)即最小二乘法估计参数,得到ARMA预测模型,如果参数估计合理,进入下一步,否则回到步骤2。

(6)预留出一部分历史数据,利用除预留数据外的数据进行预测,将预测结果和预留部分进行比较,通过式(12)、式(13)计算决定系数,判断预测效果,得到交通流预测分析报告。

2.2 灰色模型建模

交通流的历史数据有难获取、不精确的现象,往往给预测带来不小的困难。灰色模型可以对仅有少量数据的时间序列进行建模,利用其建立的指数模型具有十分精确的短期预测效果[13]。但由于其预测结果往往呈现指数趋势,故需要不断变换模型参数。文中采用动态灰色模型,实时更新模型参数,实现少量数据情况下的短期预测,以下是灰色模型的建模步骤:

(1)采集6个去噪后的交通流量数据,构造累加生成序列。

(2)构造数据矩阵B和数据向量Y1,计算BTB,(BTB)-1,BTY1,得到a,u[14],得出预测模型:

(14)

(3)结果检验。

计算原始序列标准差和绝对误差序列的标准差,得出方差比:

(15)

计算小误差概率:

(16)

3 数据融合

3.1 模型组合

图1 ARIMA和GM(1,1)建模和加权组合流程图

加权完成后,需要计算出具体的权值。为了提高该组合模型的应用能力,文中引进在线更新技术,使用动态权值对单个模型的预测数据进行加权组合。权值w取0.00~1.00中的100个数值,通过图2的循环计算,输出一百组与权值w相关的数据,得到一组加权后的交通流量值,记为:

(17)

图2 权值w的计算流程图

3.2 权值确定

经过上述处理后,得到一百组与权值w相关的交通流数据。为了确定w的具体值,引入相关系数这个概念,其为衡量两个随机变量之间线性相关程度的指标[15]。通过式(18),比较各组数据与实际数据的相关性,得出最佳权值。

4 计算机仿真结果

4.1 ARIMA(p,d,q)

(1-0.832 1B)(1-0.964 2B10+0.001 4B10)(1+0.328 2B-0.403 5B2)(1-B)(1-B10)log(xt)=(1+0.916 9B10)μt

将数据带入上述ARIMA模型中进行预测,预测数据与预测结果评价指标如图3所示。可以看到,平均绝对百分误差(MAPE)=2.616 1,TIC=0.0163,BP=0.000 3,VP=0.052 3,CP=0.946 9,均在理想范围内。

图3 预测数据图和预测指标结果图

4.2 GM(1,1)

取6个时隔五分钟的交通流量数据,通过式(14)得到相关矩阵和参数,确定模型为:

X(1)(k+1)=-179 96.826 512 885 8e-0.020 913 357 714 412 9k+18 371.706 512 885 8

根据模型对下一个50分钟的数据进行预测,得到以下预测结果(见图4),并且用过残差检验和后验差检验得到方C=0.093 2,小误差概率P=1,均在理想范围内。

4.3 模型组合

对两个模型进行组合,通过流程图得到权值w的具体值以及组合后的预测结果。图5是ARIMA(2,1,2)(1,1,1)10、GM(1,1)单独预测结果和实际数据的相关系数值,以及两者相结合的预测结果和实际数据的相关系数值。

图5 相关系数比较结果

从图中可以得出rACTUAL+ARIMAFORECAST=0.973 890,rACTUAL+GMFORECAST=0.949 520,rACTUAL+COMBINATION=0.982 541,故可知模型组合后的预测结果和实际数据的相关度最高,即两个模型预测结果的加权组合与实际交通流时间序列更加匹配,说明组合后的预测精度有所提高。

5 结束语

文中提出一种将ARIMA(p,d,q)(P,D,Q)和GM(1,1)的预测结果进行加权组合的方法,首先采集一组原始交通流数据,利用小波分析对其做去噪处理,再使用ARIMA(p,d,q)(P,D,Q)和GM(1,1)两种基础模型对预处理后的数据分别建模,得到两者的预测结果后,利用动态权值w将两个模型的预测结果进行加权组合,得到最终改善后的预测结果。通过对加州交通局提供的数据进行仿真实验,证明该方法使模型不仅适用于正常状态,也适用于突发状态,提高了预测精度,增加了模型的适用性。

[1]DaraghmiYousef-Awwad,YiChih-Wei,ChiangTsun-Chieh.Negativebinomialadditivemodelsforshort-termtrafficflowforecastinginurbanareas[J].IEEETransactionsonIntelligentTransportationSystems,2015,15(2):784-793.

[2]TeselentisDI,VlahgianniEI.Improvingshort-timetrafficforecasts:tocombinemodelsornottocombine?[J].IETIntelligentTransportSystems,2014,4(12):202-210.

[3]HouYi,EdaraP,SunC.Trafficflowforecastingforurbanworkzones[J].IEEETransactionsonIntelligentTransportationSystems,2015,16(4):1761-1770.

[4]VlahogianniEI,YannisG,GoliasJC.Criticalpowertwowheelerdrivingpatternsattheemergenceofanincident[J].AccidentAnalysisandPrevention,2013,58:340-345.

[5]ChenC,HuJ,MengQ,etal.Short-timetrafficflowpredictionwithARIMA-GRACHmodel[C]//ProcofIEEEintelligentvehiclesymposium.[s.l.]:IEEE,2011:606-611.

[6]MinW,WynterL.Real-timeroadtrafficpredictionwithspatio-temporalcorrelations[J].TransportationResearchPartCEmergingTechnologies,2010,19(4):606-616.

[7]DoorleyR,PakrashiV.Short-termforecastingofbicycletrafficusingstructuraltimeseriesmodels[C]//ProcofIEEE17thinternationalconferenceonintelligenttransportationsystems.[s.l.]:IEEE,2014:212-220.

[8]DeenihanG,CaulfieldB.Estimatingthehealtheconomicbenefitsofcycling[J].JournalofTransport&Health,2014,1(2):141-149.

[9]R-Core-Team.R:alanguageandenvironmentforstatisticalcomputingRfoundationforstatisticalcomputing[M].[s.l.]:[s.n.],2013.

[10]ZhangDongchen,WangShoufeng.AnovellongtermtrafficforecastalgorithmandcasestudyforChina[C]//Procofinternationalconferenceonadvancedinformationnetworkingandapplicationsworkshops.[s.l.]:[s.n.],2014:425-430.

[11]SommerM,TomfordeS,HanerJ.Usinganeuralnetworkforforecastingonanorganictrafficcontrolmanagementsystem[C]//Procofinternationalworkshoponembeddedself-organizingsystems.[s.l.]:[s.n.],2013.

[12]WangHaiyan,WangYouzhen.Vesseltrafficflowforecastingwiththecombinedmodelbasedonsupportvectormachine[J].TransportationInformationandSafty,2015,3:695-698.

[13]ChanKY,DillonTS,SinghJ,etal.Neural-network-basedmodelsforshort-termtrafficflowforecastingusingahybridexponentialsmoothingandLevengberg-Marquardtalgorithm[J].IEEETransactionsonIntelligentTransportationSystems,2012,13(2):644-654.

[14]LippiM,BertiniM,FrasconiP.Short-termtrafficflowforecasting:anexperimentalcomparisonoftime-seriesanalysisandsupervisedlearning[J].IEEETransactionsonIntelligentTransportationSystems,2013,14(2):871-882.

[15]DunneS,GhoshB.Weatheradaptivetrafficpredictionusingneurowaveletmodels[J].IEEETransactionsonIntelligentTransportationSystems,2013,14(1):370-379.

Short-term Traffic Flow Forecasting Based on Combination of ARIMA and Gray Model

TAN Miao-miao,CHENG Xiao-gang,ZHOU Kai,LI Hai-bo

(School of Telecommunication and Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)

Traffic flow forecasting is a very important part of the intelligent transportation system.There are many methods for traffic flow forecasting,most of them have good results for the traffic flow.However,due to the limitations of a single forecasting method,it cannot guarantee the accuracy of prediction in different situations.In order to solve this problem,the method of data fusion is used.The original data by sensors is carried out in data preprocessing,using wavelet analysis to remove the excess noise.Then,the ARIMA model and gray model are used to model the same traffic flow series.After the results of the two projections are come out,getting the optimal weights,and the results of the two models are weighted,and the results are obtained after data fusion.The simulation results show that the combination model improves the shortcomings of the single forecasting method,which makes the prediction accuracy improved.

data fusion;ARIMA;gray model;weighted;wavelet analysis

2016-01-05

2016-05-18

时间:2016-09-19

国家自然科学基金资助项目(61401236);南京邮电大学引进人才项目(NY214005)

谈苗苗(1991-),女,研究方向为交通流预测在智能交通系统中的应用;成孝刚,讲师,通讯作者,研究方向为交通流预测在智能交通系统中的应用和雾霾能见度检测;李海波,中组部千人特聘教授、江苏省特聘教授,博士生导师,研究方向为新媒体技术。

http://www.cnki.net/kcms/detail/61.1450.TP.20160919.0841.040.html

U491.112

A

1673-629X(2016)11-0077-05

10.3969/j.issn.1673-629X.2016.11.017

猜你喜欢
交通流权值差分
RLW-KdV方程的紧致有限差分格式
一种融合时间权值和用户行为序列的电影推荐模型
数列与差分
CONTENTS
基于加权组合模型的短时交通流预测研究
一种平稳化短时交通流预测方法
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
交通流随机行为的研究进展
路内停车对交通流延误影响的定量分析