基于组合预测模型的短时交通流预测

2013-07-31 21:35李颖宏刘乐敏王玉全
交通运输系统工程与信息 2013年2期
关键词:欧式估计值交通流

李颖宏,刘乐敏,王玉全

(北方工业大学城市道路智能控制技术北京市重点实验室,北京100144)

基于组合预测模型的短时交通流预测

李颖宏*,刘乐敏,王玉全

(北方工业大学城市道路智能控制技术北京市重点实验室,北京100144)

在现代智能交通系统中,短时交通流预测是实现先进的交通控制和交通诱导的关键技术之一.为了提高短时交通流预测的准确性,本文提出了一种基于组合预测模型的短时交通流预测方法.一方面,根据当前的交通流数据来动态调整其对未来预测的影响;另一方面,通过对历史交通流数据的时空特性分析,利用数据挖掘领域的相关知识寻求与当前交通流特性最为相似的历史曲线,并以其为基础来获得预测值的匹配值;然后,将二者获得的信息进行融合,采用多种不同的组合方式来实现短时交通流预测.以厦门市莲花路口断面的交通流量为例,通过对仿真图像和数据的分析,得出各种组合方法的预测平均绝对相对误差均小于10%,能够较好地满足交通诱导系统的需求.

城市交通;交通流预测;组合预测;交通流;匹配值;估计值

1 引 言

短时交通流预测是现代智能交通系统的核心内容,是实现先进的交通控制和交通诱导的基础.近几十年国内外的许多专家和学者都致力于该领域的研究,研究了很多预测模型.大体分为三类,一是基于解析数学方法的模型,包括历史平均模型、自回归模型、滑动平均模型、自回归滑动平均模型及卡尔曼滤波模型[1];二是基于经验的智能预测模型,包括非参数回归模型、神经网络模型、动态交通分配模型及基于混沌理论的模型等;三是组合预测模型.单一的数学解析模型难以适应交通流所具有的短时随机性强的特点,基于经验的智能预测模型其复杂度高,在工程实现上有一定的困难,本文综合考虑,提出了一种组合预测算法.

2 预测方法设计

2.1 设计依据

短时交通流预测是基于短期交通流参数序列进行的,短期交通流序列具有高度时变性、非线性和不确定性.但在路网中特定的观测点,其在一定的观测时间内具有如下特征:

(1)关联性.交通流参数不是独立的,参数间具有一定的相关性,且观测地点参数与其相关路段参数之间也具有较强的关联性.

(2)趋势性与趋势变动性.交通流参数时间序列在时空上呈一定规律的变化趋势.

(3)连续性.交通流参数在时间上具有连续性和延续性,同一变量在不同时刻的取值之间存在着相关性.

本文提出的预测算法主要是基于交通流以上3个特征提出的.

2.2 组合预测模型

组合预测是一种将不同预测方法所得结果综合起来形成一个最终预测结果的方法.组合的主要目的是综合利用各种方法所提供的信息,尽可能地提高预测精度.组合预测有两种基本形式:

(1)等权组合.即各预测方法的预测值按相同的权数组合成新的预测值.

(2)不等权组合.即赋予每种预测方法以不同的权值.

这两种形式的原理相同,但在权值的考量上不一样.不等权组合通过修正权值来达到跟踪、调整预测误差的目的,从而获得更好的预测效果.

本文提出的预测模型形式上与指数平滑模型相似.指数平滑模型是依据当前的交通流时间序列:距预测时刻越近的数据对预测起的作用越大,越远的数据作用越小.作用的大小按权值的几何级数衰减.本文采纳了这一思想,但进行了调整和改进.首先,数据不再局限于当天获得的交通流时间序列,而是通过历史相似序列寻求匹配值,某种程度上将交通流在时空上的相似性引入到短时预测中;其次,利用k-1及k时刻流量值的变化趋势预估k+1时刻值,其效果也将好于直接将k时刻值用于预测模型中;最后,按照误差跟踪原理,实时调整权值,以期获得更好的预测准确度.

本文提出的组合预测模型为

式中 k——当前时刻;

k+1——预测时刻;

S(k+1)——预测值;

u″k+1——从历史曲线中寻找与当前交通流在[k-n,k]时刻具有相同变化趋势的时间序列,取其下一时刻值为u″k+1,将其称为匹配值;

Y(k+1)——利用k-1及k时刻流量值的变化趋势预测k+1时刻的值,将其称为估计值;

α(k)——自适应平滑系数,根据预测误差动态调整参考相似时间序列与当前估计值在预测中的权重.

该模型的预测示意图,如图1所示.

图1中,上半图为历史曲线数据库,存有多条历史曲线;下半图为预测当天检测到的实时交通流.预测过程:从历史曲线中寻找与预测当天交通流在[k-n,k]时刻的变化趋势最为相似的一条曲线,作为参考曲线,将其下一时刻的值作为预测值的匹配值进行预测,同时利用预测当天检测到的交通流的变化趋势动态调整其对预测值的影响.预测时,需确定3个参数——自适应平滑系数、匹配值及估计值.

图1 预测示意图Fig.1 Prediction diagram

3 参数确定

3.1 自适应平滑系数

本文依据误差跟踪原理确定平滑系数α,使其能够根据预测误差进行动态调整,从而可在一定程度上提高预测的精度.设t时刻α的值为α[2].

t首先,定义两个误差信号[3]

式中 Et——平滑误差;

At——平滑绝对误差;

et——预测绝对误差,且et=yt-t,t,为(t-1)时刻对t时的预测值;

r——加权系数,0<r<1,一般取r=0.1~0.2[3].

在模型能够正确反映预测对象变化规律的情况下,预测误差et为随机误差,因此et服从均值为零的正态分布,且此时Et接近于零.又因为At总是大于零的,所以的值总是在[-1,+1]内.

根据平滑系数与预测误差之间的变化关系,令平滑系数αt为

这样αt便可根据误差大小自动进行调整,使预测模型不断地适应预测对象的变化.

3.2 匹配值

由于交通流的时间分布按自然周(7天)呈现一定的规律性,诸如每周一的早高峰具有相似的交通流分布特性.利用该特性获得匹配值的方法之一是将交通流历史数据集(此处的集合实际上是按星期一至星期五、节假日分开建立的6个子集)中所有时间序列k+1时刻值的平均值作为预测值的匹配值;另外一种方法是从交通流的历史序列中寻找与待匹配子序列最为相似的序列,取该相似序列下一时刻的值作为预测值的匹配值,此处,相似序列的查找可以利用欧式距离法(Euclidian)和动态时间弯曲距离法(Dynamic Time Warping,DTW)实现.

3.2.1 欧式距离

欧式距离是进行时间序列相似性查找最常用的方法之一.假设给定两条长度相同的时间序列X={x1,x2,…,xn},Y={y1,y2,…,yn},将每个序列看作是n维空间中的一个点,则它们之间欧式距离定义为当两个序列之间的距离小于某一阈值时,认为两个序列相似,否则两个序列不相似[4].

这种方法的优点是计算简便,且满足三角不等式,支持多种类型的数据挖掘方法;缺点是对数据噪声的鲁棒性较差,时间序列在时间轴上的微小变化将引起欧式距离的很大变化.

另外,本文采用子序列匹配的方法来寻找相似序列,两种思路:(1)如图1所示,在与待匹配子序列对应时刻相同的历史序列中查找相似的子序列; (2)扩大查询范围,以滑动窗口的形式在历史数据序列中进行相似性查寻.采用这两种思路,利用欧式距离法进行相似性判断,均可得到匹配值.这里将这两种思路的计算方法分别称作对应时刻欧式距离法和扩展时刻欧式距离法.

3.2.2 动态时间弯曲距离

动态时间弯曲起初被应用于语音视觉模式识别的研究领域,后来Berndt和Clifford将它用于时间序列的数据挖掘.经过研究发现,DTW在比较时间序列的相似性上比传统的Euclidian方法有明显的优越性,且为聚类分析提供了更好的手段.

时间序列X、Y的Dtw距离可以定义为

Dtw(<>,<>)=0,

Dtw(X,<>)=Dtw(<>,Y)=∞,

Dtw(X,Y)=D(x1,y1)+min{Dtw(X,Rest(Y)), Dtw(Rest(X),Y),Dtw(Rest(X),Rest(Y))}

式中 <>表示空序列,X={x1,x2,…,xm},Y={y1, y2,…,ym},Rest(X)={x2,x3,…,xm},Rest(Y)= {y2,y3,…,ym},D(x1,y1)为两序列中对应点的Lp范数距离[5].

这种方法的优点是允许两个长度不相等的时间序列进行相似性搜索,克服了时间序列在时间轴上的伸缩引起的匹配问题;缺点是计算复杂性较大,不满足三角不等式[6].

图2中(a)和(b)分别显示了欧式距离和动态时间弯曲距离计算序列各点之间的对应关系.利用欧式距离进行计算时,两序列之间各点一一对应;利用动态时间弯曲距离进行计算时,两序列之间各点非线性对齐.

图2 欧式距离和动态时间弯曲距离的点对应关系Fig.2 Point correspondence relationship of Euclidean distance and dynamic time warping distance

3.3 估计值

对采集的数据进行丢失数据及缺失数据的处理,得到5 min交通流的变化,如图3所示.

图3 5 min交通流数据图Fig.3 Data graphs of traffic flow

将图3进行局部细节放大,如图4所示.

从图4中可以看出5 min交通流的变化趋势带有很强的随机性,相邻交通流量值之间的变化相差很大,预测时刻流量值的大小与之前N个时刻流量值只是在某一较大范围内存在趋势上的关系(如图3所示),而具体取值之间的关系并不明显(如图4所示),因此在预测时如果依据当前k时刻的值与之前k-N个(N=1, 2,…)时刻的值之间的变化趋势来确定估计值,将造成较大的误差.

图4 5 min交通流曲线的变化趋势图Fig.4 Trend charts of 5min traffic flow curve

为了体现交通流变化的随机性,本文仅采用k-1及k时刻流量值的变化趋势来求得估计值,即估计值是根据k时刻的流量值到k+1时刻的历史平均值的变化趋势deta_u(k)与k-1时刻的流量值到k时刻的流量值的变化趋势deta_y(k)的对比得来的,如图4所示.

其中,deta_u(k)=U0(k+1) -y(k), U0(k+1)为k+1时刻的历史平均值;

deta_y(k)=y(k)-y(k-1);

当deta_y(k)与 deta_u(k)同号时,估计值Y(k+1)=deta_y(k)+y(k),如图4(a)所示;

当deta_y(k)与 deta_u(k)异号时,估计值Y(k+1)=deta_u(k)+y(k),,如图4(b)所示.

也就是说,当 deta_y(k)与 deta_u(k)同号时,Y(k+1)为k时刻的流量值利用其前一时刻的变化趋势对自身值的修正值;当 deta_y(k)与deta_u(k)异号时,Y(k+1)为k+1时刻流量的历史平均值.

4 算法仿真

仿真实验以厦门市莲花路口断面的交通流量为研究对象,通过安装在路面的RFID检测器采集道路断面每隔5 min的交通流数据(厦门岛内电子标签贴签率达到90%以上).

实验以2012年1月1日至2月21日之间获得的数据作为历史数据库,并按周一至周五、节假日建立相应的历史数据库子集.以2012年2月22日星期三的交通流数据作为预测效果验证曲线.

预测时间设定为22日上午10:05到晚上20:00,采用本文提出的组合模型进行预测.预测时,分别采用不同的方法进行匹配值的计算,根据采用方法的不同将组合预测模型分别称为基于历史平均值法、对应时刻欧式距离法、扩展时刻欧式距离法、动态时间弯曲距离法.

四种组合预测模型的预测效果如图5所示.

预测的部分交通流数据如表1所示.

四种方法在10:05至20:00间所有交通流数据的预测误差,如表2所示.

由以上预测结果可知,组合预测方法在一定程度上反映了交通流的变化,预测效果较为理想,平均绝对相对误差均在10%以下,能够较好地满足交通诱导系统的要求.但是由于采用的是等间隔采样周期,所以采样周期越小,车辆出现跨周期现象的几率越大,原始交通流序列的波动性就越大,这是造成最大绝对相对误差较大的一个主要原因.

在实际工程应用中,在满足一定预测精度的要求下应综合考虑预测算法的效率、实时性及复杂度.

图5 预测结果图Fig.5 Prediction result figure

表1 部分交通流数据Table 1 Part of the traffic flow data

续表

表2 预测误差(10:05-20:00)Table 2 Prediction error(10:05 to 20:00)

5 研究结论

本文利用数据挖掘领域的相关知识对短时交通流预测方法进行了改进,提出了一种组合预测模型,充分利用了交通流在时空上的相似性.模型中预测值的大小由匹配值和估计值的加权和得到,分别采用了基于历史平均值法、对应时刻欧式距离法、扩展时刻欧式距离法及动态时间弯曲距离法来实现,这几种组合预测方法能较好地体现交通流的变化,且相对一些智能预测算法更适于在工程中应用.

在后续的研究中将考虑把数据的采集与信号控制周期相结合,通过绿灯时间内流量与绿灯时间的比值,即绿灯流率作为预测变量,就可以使预测变量与控制周期无关,从而消除不同周期对模型的影响,将得到更好的预测效果.

[1]陆海亭,张宁,黄卫夏,等.短时交通流预测方法研究进展[J].交通运输工程与信息学报,2009,4(7): 84-89.[LU H T,ZHANG N,HUANG W X,et al. Research progress of short term trafnc flow predictionmethods[J].Journal of Transportation Engineering and Information,2009,4(7):84-89.]

[2]盖春英,裴玉龙.自适应指数平滑预测模型预测区域经济研究[J].公路,2001,11(11):43-45.[GAI C Y, PEI Y L.Study on forecasting regional econpmy by selfadaptive exponential smoothing method[J].Highway, 2001,11(11):43-45.]

[3]曹凤萍.城市道路交通参数短时多步预测方法研究[D].吉林大学,2008.[CAO F P.Study on the methods of traffic parameters short-term and multi-steps prediction for urban road[D].Jilin University,2008.]

[4]高成锴.基于约束动态弯曲距离的时间序列相似性匹配[D].大连理工大学,2010.[GAO C K.The similarity measurement based on constraint dynamie time warping[D].Dalian University of Technology,2010.]

[5]孙达辰.基于DTW的时间序列相似性搜索的研究[D].大庆石油学院,2010.[SUN D C.The research of similarity match based on DTW in TSDM[D].Daqing Petroleum Institute,2010.]

[6]李俊奎.时间序列相似性问题研究[D].华中科技大学,2008.[LI J K.The study of the time sequence similarity[D].Huazhong Univercity of Science and Technology 2008.]

Short-Term Traffic Flow Prediction Based on Combination of Predictive Models

LI Ying-hong,LIU Le-min,WANG Yu-quan
(Beijing Key Laboratory of Urban Road Intelligent Control Technology, North China University of Technology,Beijing 100144,China)

In modern intelligent transportation systems,short-term traffic flow forecasting is one of the key technologies to achieve a real-time-traffic control and traffic guidance.In order to improve the precision of the short-term traffic flow forecasting,a short-term traffic flow prediction method is proposed based on the combination forecasting model.The future projections are dynamically adjusted according to the current traffic flow data in the first part.Meanwhile,through the analysis of spatial and temporal characteristics of historical traffic flow data,the historical curve similar to the current traffic flow characteristics is sought in another part to find the data that is matching to the predicted value.The information obtained by the both can be organically combinated in different ways to achieve the short-term traffic flow forecasting.Taking the traffic flow of Xiamen Lotus junction cross-section as an example,is the paper demonstrates that the average absolute relative deviations of the methods are all less than 10%,which is able to meet the requirements of the traffic guidance system(GIS).

urban traffic;traffic flow prediction;combination prediction;traffic flow;matching value; estimated value

U491.1

A

U491.1

A

1009-6744(2013)02-0034-08

2012-09-25

2012-11-01录用日期:2012-11-13

863课题(2012AA112401);国家科技支撑计划(2011BAH16部-05);北京市教委专项(PXM01412113625).

李颖宏(1968-),女,北京人,博士,教授.

*通讯作者:lyh427@ncut.edu.cn

猜你喜欢
欧式估计值交通流
基于Creo软件的石材欧式壁炉三维造型设计
一类特殊混合跳扩散Black-Scholes模型的欧式回望期权定价
一道样本的数字特征与频率分布直方图的交汇问题
欧式城堡——木炭与色彩的碰撞
对我国小城镇建设过程中欧式古典风格建筑兴起的思考
统计信息
2018年4月世界粗钢产量表(续)万吨
交通流随机行为的研究进展
路内停车对交通流延误影响的定量分析
具有负压力的Aw-Rascle交通流的Riemann问题