基于多源交通数据融合的短时交通流预测

2019-05-14 01:41陆百川马广露
关键词:交通流量交通流数据源

陆百川,舒 芹,马广露

(1. 重庆交通大学 交通运输学院,重庆 400074; 2. 重庆交通大学 山地城市交通系统与安全实验室,重庆 400074)

0 引 言

随着计算机技术迅速发展,交通信息采集的智能化程度不断提高[1],获得的交通数据种类和数量越来越多。由于各类交通检测器检测原理不同及安装位置变化等,使得每类交通数据中所包含的信息及所受到的限制条件各不相同,故对多源交通数据动态融合能获得更有用的交通信息,从而才能为解决城市交通问题打下基础。

在交通数据采集方面,陆化普等[2]分析了不同来源交通数据的基本特性,提出了交通数据分析方法将从单一数学模型转变为集机理、知识和数据驱动为一体的混合建模发展趋势。在交通数据融合方面,史岩等[3]利用神经网络和回归分析法,并基于浮动车与微波检测器速度参数构建了融合模型,得到了更高质量的速度数据,但对两者速度特性及差异缺乏分析;沈颖洁等[4]引入数据融合技术对不同预测方法的行程时间预测值进行处理,虽考虑了检测器布设影响,但融合数据仅来自均匀分布的检测器。在短时交通流预测方面,吴凡等[5]增加动量项和自适应学习率来修正GA-WNN预测模型网络参数,以较快收敛速度获得了较高预测精度,但对样本数据来源可靠性缺少分析;蒋肖[6]选取交通量、占有率和平均车速为训练参数,基于支持向量机回归及RBF神经网络分别建立了单交通参数及多参数融合的短时交通流预测模型,但训练数据仅来源于单一交通检测器。

笔者利用融合数据互补性、全面性和精准性等特点,结合遗传算法较强地全局搜索能力和小波神经网络较高地自适应学习性,提出利用多源数据融合与遗传-小波神经网络(GA-WNN)相结合方法进行交通流预测。以不同检测器得到单一流量数据序列为基础,分别基于GA-WNN、GA-NN与WNN构建交通流量预测模型,得到单源最优预测序列;在对多源交通数据融合和短时交通流预测必要性进行综合分析基础上,利用最小二乘动态加权融合算法将各单源预测结果进行处理,得到最优融合预测序列。通过案例分析证明:基于GA-WNN和多源交通数据融合的短时交通流预测结果精度高于单一数据源的结果。

1 基于多源数据融合短时预测

1.1 多源交通数据特性分析

目前城市交通系统中存有大量交通数据,通常包括静态数据与动态数据。动态交通数据会随着采集时间、地点和获取方式差异而出现不同特征和性质,在实际运用时必须对这类数据进行分析处理,从而得到有用的交通信息。

按采集时间不同,获得动态数据能描述断面历史与实时的交通状态特征。按采集地点变化,获得的交通数据能描述整个路网交通流空间分布特征。按采集方式差异[7],人工调查数据能直接解析调查区域交通出行特征与规律,但数据量有限且主观性强、更新周期长;车检设备数据能提供检测地点的交通流特征,但精确性与布设密度有关;浮动车GPS数据能提供行驶路段区间的运行参数特征或单个车辆的实时运行特征,但稳定性、连续性差;手机信令、公交IC卡数据,获取方便、内容完整、更新连续,能提供交通出行的精细化过程,但巨量数据分析与处理过程繁琐。因而,不同的交通数据在时间、空间、侧重点及用途上都表现出差异性[8],能以不同程度描述目标路段交通流运行特征。综合分析、处理多源交通数据就能得到全面、可靠与互补的交通信息。

1.2 多源交通数据融合

不同来源的交通数据包含着不同的且有限的交通信息,将各单源交通数据进行融合能克服单源获取信息的局限性,能获得更全面与有用的交通信息,以掌握整个路网交通运行状态。

交通数据融合有3个层次[9]:① 数据级融合是直接对原始交通数据进行处理,信息量大,处理时间长且数据必须同类型;② 特征级融合是将从原始数据中提取出来的交通流量、速度及行程时间等特征信息融合,但交通特征参数提取困难且关联复杂度高;③ 决策级融合是对每个单源信息交通输出结果以融合处理,即使某数据源出现错误,也能输出正确结果,灵活性高、信息量小。笔者以车检(微波、视频、地磁)数据与浮动车数据为分析要点,由于车检数据源属于断面交通参数,浮动车数据源属于区间交通参数;经数据时空匹配后两者都有一致的时间、空间特性,故采用决策级融合,即利用各单一数据源预测的交通流量值进行融合分析,从而为解决交通问题提供更可靠的决策依据。

1.3 短时交通流预测需求分析

交通管理、控制与智能诱导不但需要掌握实时交通流状态,还必须了解未来交通变化状况与发展趋势,短时交通流预测作为未来交通数据的主要来源,能为智能交通系统提供有效的未来交通信息。

对交通管理者而言,通过预测交通信息判断路网未来交通状态波动,为交通控制与诱导提供决策支持,实现路网交通流均匀分配,使路网交通总延误最小与道路利用率最高;对交通出行者而言,根据预测信息获取出行区间内路段未来交通运行状态,为出行路径规划提供参考,以提前选择出行线路、出行方式及出行时间[10],达到最小的出行成本与出行延误,最高的出行便捷性与舒适性。

1.4 多源数据交通流预测

不同的交通检测器数据采集频率不能完全一致,使得获得的交通数据在时间序列与空间位置上并不能完全同步,直接将原始数据进行融合无法很好反应断面交通特性。笔者分别对各个检测器的交通流量参数进行短时预测处理,输出目标路段在同一时段、相同间隔的交通流量预测序列,从而保证了各单源预测序列在时间与空间上的同步;之后将预测结果进行动态加权融合,获得最优短时交通流预测序列,如图1。

图1 基于多源数据的交通流预测模型

按照时间、空间特性匹配的原则收集城市道路网络中的各交通检测器数据,以同路段为约束将其转换为同时段、同间隔的关联数据;之后将各检测器的交通量数据按相同时间范围分为训练集与验证集,运用各训练集数据拟合预测模型,以各验证集数据为输入得到各单源在同一时段的短时交通流预测结果;将各检测器实际采集交通量数据与预测输出值对比,计算不同源数据在每时段间隔内预测结果的方差;最后根据上一时段融合值与检测值实时更新下一时段各单源交通数据预测值的最小二乘动态融合权重,得到融合后的最优短时交通流量预测序列。

2 短时预测模型构建

2.1 遗传-小波神经网络(GA-WNN)

遗传算法[11](genetic algorithm, GA)是一种基于自然选择和基因遗传学原理的群体优化搜索算法,具有并行、高效、全局搜索等优点。小波神经网络(wavelet neural networks, WNN)是基于小波分析与神经网络的结合。小波分析[12]时-频局部化性质良好,可聚焦到任一局部信号细节,能降低交通流中的噪声干扰;神经网络容错性使多源数据中某信息源出现错误时仍可输出可靠结果,自学习与自组织功能使系统能适应数据的不确定变化,神经网络具有自学习和实现从输入-输出的任意非线性映射关系的特点,适用于对多源交通数据的融合处理。基于两者优势结合使小波神经网络具有更强的函数逼近能力与适应性。

由于小波神经网络权值、阈值及因子采用随机化的方式初始化,使网络的收敛速度、融合预测精度以及平稳性无法得到保证,而遗传算法作为并行随机搜索的最优化方法,用其去优化小波神经网络初始参数可有效防止搜索过程收敛于局部最优解,能提高融合预测模型精度与加快收敛速度,同时能为网络参数的初始化选择提供依据。

2.2 基于GA-WNN的交通数据处理及预测

选用含有3层网络拓扑结构,即输入层、隐含层、输出层的遗传-小波神经网络(GA-WNN)对多源检测器的交通量参数进行处理。设某种交通检测器以5 min为一个周期进行统计,所采集交通流量序列为xi(i=1,2,3,…,k),并作为小波神经网络的输入交通参数,则隐含层输出计算如式(1):

(1)

式中:s(j)为隐含层第j个节点的输出流量值,且j=1,2,…,n;sj为小波基函数;ij为输入层到隐含层的权值;b(j)、a(j)分别为小波基函数sj的平移因子、伸缩因子。

选择Morlet小波作为WNN的基函数来处理所采集的交通流量序列,如式(2):

s(x)=e-x2/2cos(1.75x)

(2)

网络输出层计算预测交通量值如式(3):

式中:y(k)为输出层第k个节点的预测流量输出值;jk为隐含层到输出层的权值;s(j)为隐含层第j个节点的输出流量值;m、l分别为输出层、隐含层节点个数。

联立式(1)~(3),并经大量输入输出交通流量数据训练、拟合模型后,模型便有了预测能力;通过输入验证流量数据序列,便可输出基于该种检测器数据的预测交通流量序列。但网络模型在训练时,会产生误差且会反向传播[13],引入梯度下降算法对模型各层的连接权值及参数按式(4)进行修正,使预测值逼近期望值。

{λ(i+1)n,k=λ(i)n,k+Δλ(i+1)n,k

a(i+1)k=a(i)k+Δa(i+1)k

b(i+1)k=b(i)k+Δb(i+1)k

(4)

式(4)中的修正值可按式(5)进行计算:

式中:η为小波神经网络学习速率;e为预测误差。

预测误差e可按式(6)计算。

(6)

式中:yn(k)为实际交通流量值;y(k)为预测交通流量输出值。

对目标路段上,同一时段里每种交通检测器的流量数据都采用以上方法及步骤对其进行分析处理,从而获得基于单源检测器的预测流量序列,为后期的多源融合最好数据准备。

2.3 基于GA-WNN与多源预测结果融合

笔者以多源预测值中的加权误差平方和最小为原则,充分利用不同数据源经GA-WNN预测输出结果的不同交通流特性,依据预测流量值与实测流量值分别进行实时方差计算,并根据上一时段融合值与实测值实时更新下一时段各单源交通数据预测值的最小二乘动态融合权重,使精度较高交通量预测序列所占比重大,而精度较低的交通量预测序列所占比重小。基于最小二乘动态加权融合的算法既考虑了不同数据源预测流量序列的不同交通特征信息,又考虑了随机因素对流量检测值的影响,增强了融合的精度与抗干扰能力。

以不同检测器预测输出值作为融合的基础,并以(t-1)时段融合权重实时更新t时段动态误差,由式(7)可得t时段融合后的交通流量预测值。

(7)

式中:yt为t时段融合后的交通流量预测值;yti为第i种交通检测器在t时段的交通流量预测值;wt-1,i则为yti的融合权重;n为多源交通检测器个数。

设第i种检测器的交通流量预测方差为σi,且σi=E[(yk-yki)],k=t-1,t-2,…,t-n;yk为k时段各交通检测器的实测流量值,yki为k时段第i种交通检测器的预测流量值。利用式(8)能得到多源融合的预测估计方差。

(8)

取式(8)中wti的偏导数,并令其为0,取其极小值,有wti=1/σi,则t时段融合权重与方差成反比。并且将其代入(8)可得多个交通检测器预测结果融合输出后的估计方差,按式(9)计算:

(9)

从式(9)可看出:将不同交通检测器的预测流量输出值进行融合后,其预测方差比单一交通检测器预测结果方差小,从而短时交通流预测结果精度更高,提供的未知交通信息更可靠。

基于多源交通流量数据融合及GA-WNN的短时交通流预测流程如图2[14]。

图2 基于多源数据与遗传小波神经网络的交通流预测流程

基于GA-WNN与多源交通数据的短时交通流预详细步骤如下:

1)收集预测路段各种交通检测器的交通参数,经预处理后使不同源数据在时间与空间上保持一致性;

3)将预测交通流量与实际采集交通流量间的误差和确定为适应度值;

4)选择、交叉、变异操作,且取交叉概率为0.7,变异概率为0.008;

5)重复步骤3)、4)直到达到最大迭代次数或规定适应度要求,并将遗传算法优化而得到的最优种群依次解码得到各种参数;

6)利用所采集的多源交通流量数据分别对步骤5)解码后的权值及因子训练拟合预测模型,并不断修正及更新参数,直到训练误差或训练次数满足规定要求;

7)分别以不同检测器的历史交通流量数据为预测模型的输入,将要预测时刻的流量作为预测模型的输出,得到单一检测器流量数据的预测结果;

8)按照各单一数据源流量预测结果精度的高低运用最小二乘加权动态融合法进行处理,得到最优短时交通流量预测序列。

3 算例分析

笔者以合肥市某小型路网为研究对象,其实际路网如图3。该道路网络中分布有丁字形、十字形等交叉口,具有代表性;布设有微波、视频、地磁等车辆检测器,交通数据获取方便。选取“黄山路—科学大道”交叉口至“黄山路—天智路”交叉口间路段的多源交通数据为分析基础;其中,微波与视频检测器安装在距“黄山路-天智路”交叉口停车线25m处,地磁检测器在距停车线5、40m处都有安装,但40m处检测器采集的交通数据缺失,故地磁数据源以距停车线5m处的采集数据为准。

图3 实际路网

考虑到工作日交通流的相似性,整理和处理视频、微波、地磁与浮动车在2016年6月27日—7月1日、7月4日—8日的交通流数据;由于视频与浮动车数据的采集在夜间缺失严重,故笔者只选用每天08:00—20:00的多源数据为预测样本。为反映样本数据采集时效性,同时降低交通流波动对数据采集结果的影响,将各单源数据以5min时间间隔划分,实现多源数据时间同步;以固定检测器位置(如:微波检测器)来挑选浮动车数据,由微波检测器DETECT_ID(设备编号)与ROAD_ID(路段编号)确定的检测路段在浮动车LINK_ID中找到相匹配信息,实现多源数据空间同步。浮动车直接获取的交通参数为速度,利用杨涛[15]提出的三段式速度-流量模型对求得的平均速度进行处理,得到行车区间内的交通流量推算值。表1为不同数据源在7月5日13:00—13:30时段内的初始交通流量(pcu/5min)。

表1 初始数据采集及处理结果

使用微波、地磁与浮动车流量数据融合预测短时交通流量,并将预测结果与视频实测流量值进行比较;选取前9 d流量数据作为网络训练集;并以7月14日流量数据作为验证集,预测输出为11:30—14:30时段内的交通流量序列。采用MAE、MRE和MSE这3个误差指标来量化评价短时预测精度及预测结果融合的可靠性。其中:MAE反映预测值误差的实际情况;MRE反映预测偏离实测值的程度;MSE反映预测误差的集中与离散程度。其定义如式(10):

(10)

为比较单检测器流量数据与多检测器流量数据融合的短时交通流预测结果。利用MATLAB平台基于遗传小波神经网络模型对微波、地磁及浮动车流量数据以及预测输出结果进行处理,得到4种数据源的交通流量预测序列及相对误差分布,如图4;预测误差分析如表2。

通过4种数据源预测流量序列与实测流量序列偏离程度及平均相对误差波动范围的比较,预测效果由坏到好依次为浮动车数据、地磁数据、微波数据及多源融合预测。由于多源融合协调了各种数据源不同的交通特性,综合运用了不同的交通信息,提高了预测样本数据的时空覆盖率,从而使预测结果相对单源较平稳,预测效果最好。

图4 4种数据源的交通流量预测及相对误差

表2 多源交通数据及融合预测结果对比

微波、地磁、浮动车与多源数据预测的平均绝对误差(MAE)分别为8.65、12.21、13.15、7.71,则多源融合预测累计误差小于单源数据预测序列误差;平均相对误差(MRE)分别为0.27、0.20、0.26、0.16,多源融合的MRE低于单源检测器预测的误差值,使预测值偏离实测值的离散程度得到改善。通过与MSE值对比,也可看出多源融合预测精度高于单源预测结果;因此基于多源融合的预测结果优于仅使用固定或移动数据的短时交通流预测序列。为验证GA-WNN模型融合预测可靠性,利用MATLAB将实测流量分别基于遗传神经网络(GA-NN)模型、小波神经网络(WNN)模型进行处理。表3为预测误差定量化分析;图5为不同模型预测结果比较曲线及其平均相对误差分布。

表3 基于不同模型的融合预测结果对比

图5 基于不同模型的交通流量预测及相对误差

基于GA-WNN模型融合预测交通流量最接近于实测值,预测误差波动范围也最小,模型融合预测性能最好;基于GA-NN模型融合预测值能较好接近真实值,融合预测效果为次最优;而WNN模型的预测结果与实测值偏差最大,误差波动范围也最大,预测效果最差。

对于MAE指标,GA-WNN相比于GA-NN减小了7.5%,相比于WNN减小了15.1%;对于MRE指标,GA-WNN相比于GA-NN减小了7.1%,相比于WNN减小了23.2%;对于模型计算时间(TIME)指标,GA-WNN相比于GA-NN减小了3.0%,相比与WNN减小了37.5%。由此可见,笔者提出的GA-WNN模型融合预测的MAE、MRE与MSE都最小,且网络收敛速度也快,预测可靠性及实时性强,预测效果最好。故基于遗传小波神经网络和多源交通数据融合的短时交通流预测序列结果最优、精度最高,能为交通管理者的判断决策与交通出行者的路径选择提供更准确、全面的交通信息。

4 结 语

笔者通过对多源交通数据智能融合及短时交通流预测必要性的综合分析,以微波、地磁、浮动车与视频交通流量参数序列为基础,分别利用GA-WNN、GA-NN与WNN进行短时流量预测,采用最小二乘动态加权融合法将单一数据源预测结果融合处理而得到最优短时交通流预测序列。利用平均绝对误差MAE、平均相对误差MRE和均方差MSE这3个误差指标为各模型的短时预测序列评价标准。经实例验证分析,基于多检测器数据融合和遗传小波神经网络的短时交通流预测精度优于单一数据源的短时交通流预测序列。

猜你喜欢
交通流量交通流数据源
基于LSTM的沪渝高速公路短时交通流预测研究
京德高速交通流时空特性数字孪生系统
基于XGBOOST算法的拥堵路段短时交通流量预测
基于GA-BP神经网络的衡大高速公路日交通流量预测
Web 大数据系统数据源选择*
基于不同网络数据源的期刊评价研究
路内停车对交通流延误影响的定量分析
基于真值发现的冲突数据源质量评价算法
混合非机动车交通流超车率影响因素模型
基于复合卡和ETC的交通流量采集研究