龙佰超 关为生 肖建力
摘要:针对路网的拓扑信息不完整而无法实现时空结合交通流预测的情况,提出了一种基于时间序列预测模型联合数据编解码机制的预测方法。对路网内路段交通流数据进行编码得到路网信息的链状结构,以此获取路网结构中的拓扑信息;通过时序模型对链状结构进行交通流预测,完成对链状结构的时序特征提取;最终,通过解码方法得到路网的时空交通流预测结果。采用GPS数据,选取不同路网进行对比实验,引入数据编解码的时空交通流预测方法与时间序列模型进行比较,并且与基线模型HA和ARIMA展开了对比实验。实验结果表明:深度学习模型引入数据编解码机制后,模型性能明显提升;引入数据编解码机制的深度学习模型的性能比基线模型的性能更优越。该方法仅仅使用简单的时间序列深度网络再联合数据的编解码机制即可实现时空结合的交通流预测。
关键词:智能交通系统;交通流预测;数据编解码;时序模型;深度学习
中图分类号:U 491.112
文献标志码:A
随着城市道路和车辆的增多,实时、准确的交通流预测尤为重要。单一的时间序列预测模型无法满足交通流预测的需求。路网中相邻道路之间相互影响,交通流预测任务必须同时考虑时间特性和空间特性。因此,基于时空特性的交通流预测方法成为当下智能交通领域的热门研究话题。
在特征提取的尺度上,模型可以分为3种:时序模型、空间模型和时空模型[1]。时序模型和空间模型分别提取交通流数据的时间特征和空间特征。时空模型既能提取交通流数据的时间特征,也能提取空间特征,并且在交通流预测中取得了不错的效果。时序模型又可以分为传统模型和基于深度学习的模型。白回归综合移动平均模型‘1、灰色预测模型[3]、卡尔曼滤波模型H、支持向量机同归模型[5]、K最近邻模型[6]、贝叶斯模型[7]、模糊逻辑模型[8]和人丁神经网络模型[9]为传统的时间序列模型。基于深度学习的时序模型有循环神经网络[10]、长短期记忆[11]和门控循环单元[12]等。空间模型中的卷积神经网络适用于欧几里德空间,而图卷积网络可以从本质上描述空间特征,并提取复杂路网结构,但需要拥有路网中图结构的邻接矩阵等信息。路网交通情况十分复杂,这些方法的交通流预测性能需要进一步提升,因此,时空模型脫颖而出。当下时空模型大多数为时空混合模型,即为时间模型和空间模型的融合。在路网拓扑结构可以获得的情况下,混合模型可以得到不错的效果,但是,足够的拓扑数据不易获取。
综上,本文提出了一种基于数据编解码的时空交通流预测方法。在不能获取足够拓扑信息的情况下,此方法充分考虑交通流的时间特性和空间特性,利用数据编解码对路网进行空间特征的提取,运用时序模型对路网进行时间特征的提取,从而能更准确地预测实际交通状况,有效提高预测精度。
1 交通流预测方法概述
智能交通系统发展至今,许多学者提出了基于时间、空间和时空特性的交通流预测方法,不同的交通流预测方法在特征提取上各有不同。
1.1 基于时间特性的交通流预测方法
传统的基于时间特性的交通流预测方法少数为参数模型[13],如白同归综合移动平均模型、灰色预测模型和卡尔曼滤波模型等,上述模型算法简单,计算方便。但是其依赖于系统模型的静态假设,不能反映交通数据的非线性和不确定性。而非参数模型[14]在拥有充足历史数据的条件下,可以很好地解决这些问题。常见的非参数模型有支持向量机同归模型、K最近邻模型、贝叶斯模型、模糊逻辑模型和人工神经网络模型等。随着深度学习的发展,循环神经网络及其变种长短期记忆和门控循环单元成为当下常用的时间序列预测模型。
1.2 基于空间特性的交通流预测方法
卷积神经网络在处理规则的网格数据时效果十分显著,但是路网结构往往是不规则的图结构。相较于卷积神经网络,图卷积网络在处理非欧式结构数据上效果更好,可以用于捕获图数据的结构特征。由于两者所面对的数据结构不同,图卷积网络广泛应用于路网交通流预测,并且取得了良好的效果。在充足的路网拓扑数据下,图卷积网络在空间特征提取上有着不错的效果,如路网图结构的度矩阵、邻接矩阵等。
1.3 基于时空特性的交通流预测方法
许多学者将时间序列模型和空间序列模型组合成为时空混合模型,混合模型既能提取时间特征,还能提取路网的空间拓扑信息。Zhao等[15]将图卷积网络与门控循环单元相结合,提出时间图卷积网络。Zhang等[16]提出基于动态特征编码的时空模糊图卷积网络模型,该模型将图卷积网络与长短期记忆网络相结合,同样达到了不错的时空预测效果。无论时序模型和空间模型如何组合,都需要充足的路网拓扑数据才可以进行交通流预测,而拓扑数据往往比较难以获取。Yu等[17]通过图卷积和注意力机制捕获几何交通数据相关性,并使用生成式对抗学习框架内的编码器和解码器体系结构提取和扩展时间数据相关性。传统的统计学算法以及近年来的机器学习、深度学习算法都可以用于时间序列预测,不同的方法各有优劣。当同时预测多个时间序列,并且各个时间序列之间存在空间上的关系时,就不能只将每个时间序列单独建模,而需要考虑不同时间序列之间的空间依赖关系。基于时空特性的交通流预测方法主要为时序模型和空间模型组成的混合模型,在已知路网信息充足的情况下,上述方法有着不错的表现。但数据的获取往往十分困难,且路网信息不完整的情况长期存在。考虑道路拓扑数据获取困难等问题,本文提出基于数据编解码的时空交通流预测方法,该方法的具体流程如 所示。
首先对初始路段数据进行初始化得到归一化的数据X;然后选取中心路段进行路网构建和数据的编码,提取路网中隐藏的空间特征矩阵X,此过程将路网的拓扑结构信息编码为链状结构;将编码后的数据输入时序模型中提取路网的时间特征,得到编码数据矩阵Y;最后通过数据解码得到路网中道路的交通流数据Y。表1 为本文符号说明。
2 路网输入数据的编码
道路交通流数据是常见的时间序列数据,用于描述交通现象随时间变化的情况。单个路段有多种表示形式,如经纬坐标、道路编号等。为路网结构的一个示例。
图2用数字编号代表路段名称。以路段5为路网的中心路段记录路网层次信息,具体的路网信息如 所示。
其中,路段5为第0层,路段13,16,17,6,14为第1层,路段2,11,1,7,19,8,9,18,15,3为第2层。第1层的路段与第0层的中心路段相邻,第2层的路段通过第1层的路段与第0层相邻。由中心路段5出发构成的路网层次遍历如 所示。
逐层之间父节点与子节点为相邻路段,并且具有空间依赖关系。具体的路网输入数据的编码算法如下:
步骤1设置时间序列长度Ⅳ的初始值,选取中心路段,获得路网遍历层数为K,令i=1;
步骤2令L=0,j=1,获取第L层的路段数WL;
步骤3遍历第L层所有路段交通速度数据Xij,每次遍历路段数据后j=j+1,如果j> WL,则执行步骤4,否则重复步骤3;
步骤4 1=1+1,如果L>K,则执行步骤5,否则重复步骤3,直到最后一个路段交通流速度数据Xij遍历结束,此时遍历路段总数为M;
步骤5
xi= (Xil Xi2 - XiM)T,i=i+l,如果i>Ⅳ,则执行步骤6,否则重复步骤2--4,直到遍历完所有时间序列;
步骤6将交通流速度数据x1,x2,…,xN接为矩阵X;
步骤7记录路网数据层次遍历的顺序信息,得到路段编号集合R。例如根据 所示的实例,则R={{5},{13,16,17,6,14},{2,11,1,7, 19,8,9, 18, 15,3}}。由上述算法得到的路网输人数据编码形式如下:
路网输入数据编码可以总结为将路网复杂的拓扑结构映射为链状结构,图4为路网输人数据编码的输入与输出。
其中,原始道路数据为复杂的图结构,红色路段为中心路段,蓝色路段为相邻路段,其次为次相邻路段。将其编码为链状数据结构输出,路段的排序方式分别为中心路段、相邻路段和次相邻路段。时间维度上扫描的数据为1--N。
3 时序模型
基于编解码的时空交通流预测方法在时序特征提取上采用循环神经网络( recurrent neuralnetwork,RNN),长短期记忆(long short-termmemory,LSTM)和门控循环单元(gated recurrentunit,GRU)等模型,这些模型都可以处理多元时间序列数据。RNN结构简单,但由于在进行反向传播的时候,过长的序列导致梯度的计算异常,发生梯度消失或爆炸,所以,传统循环神经网络在解决长序列之间的关联时,效果很差。因此,在RNN模型中加入内存单元或门控结构是解决以上问题的有效方法。LSTM为RNN的变体,在学习长期依赖性方面显示出很好的效果。相比于LSTM模型,GRU模型结构更简单,只有重置门和更新门,而且也能很好地解决时间序列的长期依赖性问题。
时间序列预测模型根据历史数据只可提取数据的时间特征,最终得到预测结果。此时,在交通流预测任务中,预測结果未考虑路网内相邻道路之间的空间相关性,道路之间的预测结果彼此相互独立。引人数据编解码后,将通过数据编码得到的时间序列输入到时序模型中进行交通流预测,得到对应步长的输出序列。图5为引人数据编解码后的时间序列预测图。
图5中:p为历史窗口大小,即历史数据的长度;q为预测步长。q=1为单步预测,预测下一时刻的交通流速度;q>1为多步预测,预测多个时间步的交通流速度。通过时间序列模型预测编码后交通流数据的结果。
4 模型输出数据的解码
模型输出数据的解码将预测的链状结构时间片映射到路网复杂的拓扑结构中。本文根据保存的路段信息依次将预测后的交通流数据映射到路段编号中并输出,即可得到整个路网的交通流预测,模型输出数据解码示意图如图6所示。
图6中,左边为时序模型的输出数据,右边为解码后的路网交通流预测结果。模型输出数据的解码算法如下:
步骤1设置预测步长g的初始值,获取路段编号集合R,获得路网遍历层数为K,令i=1;;
步骤2 令L=0,j=1;
步骤3 映射第L层所有路段交通流速度Yij;
步骤4 L=L+1,如果L>K,执行步骤5,否则重复步骤3,直到最后一个路段交通流速度数据映射结束;
步骤5 Yi=(Yi1 Yi2 ... YiM)T,i=i+1,如果i>q,执行步骤6,否则重复步骤2~4,直到解码完所有的时间片;
步骤6输出路网交通流预测结果Yi,其中f-1,2,…,q。
5 实验
本文实验主要围绕两个核心问题进行展开:深度学习模型引入编解码机制后,性能指标是否得到提升;引入编解码机制的深度学习模型的性能是否比基线模型的性能优越。为此,实验的主要内容分为两个部分:一是深度学习模型引入编解码机制前后性能的比较实验;二是引入编解码机制的深度学习模型与基线模型性能的比较实验。
5.1 数据来源与预处理
本文所用的原始数据为上海市交通信息中心提供的GPS数据[18]。实验时,从原始数据中提取了所选路网的速度数据。数据的时间范围为2012年2月1日至2012年2月7日。数据的采样周期为2 min。
本文采用历史平均值法自动填充丢失的数据,并且对数据进行归一化处理,计算公式如下:
式中:xij归一化后的第i时刻第j道路的交通流速度,i=1,2,…,N,j=1,2,…,M; Xij为第i时刻第j路的交通流速度;min Xij为所有时刻所有道路交通流速度的最小值;max Xij为所有时刻所有道路交通流速度的最大值。
5.2 交通流预测方法的性能评价指标
本文使用的评价指标为平均绝对误差( meanabsolute error,MAE)、平均绝对百分比误差(meanabsolute percentage error,MAPE)、均方根误差(rootmean square error,RMSE)、对称平均绝对百分比误差( symmetric mean absolute percentage error,SMAPE),分别用XMAE,XMAPE,XRMSE,XSMAPE表示,计算公式如下:式中:NM为测试集数据量;Yij为第i时刻第j道路交通流速度的真实值;y;i为第f时刻第j道路交通流速度的预测值。
5.3 实验结果与分析
本文实验中历史窗口p= 12,时序模型采用RMSporp优化器,自动保存最优模型。
5.3.1深度学习模型引入数据编解码机制前后性能的比较
为说明深度学习模型引入编解码机制后模型的性能会提升,在不同路网上分别对多种时序模型引入数据编解码机制。时序模型名稱前的ED代表该模型引入了编解码的时空交通流预测方法。表3和表4分别为路网1和路网2中深度学习模型引入编解码机制后的实验结果对比。
结果表明,引人数据编解码后,时序模型RNN.LSTM和GRU中,中心路段的交通流预测效果比引入前更好,并且在路网1和2中ED-RNN的表现效果最佳;路网1为上海市中心城区的路网结构,与不引人数据编解码的时序模型相比,路网1的MAE降低了17.75%,MAPE降低了16.21%,RMSE降低了16.69%,SMAPE降低了19.63%。路网2为与路网1不同的中心城区的路网结构,路网2的MAE减少了14.42%,MAPE减少了10.87%.RMSE减少了10.12%,SMAPE减少了14.54%。在多个时间序列预测模型中引人数据编解码机制,结果显示,引人数据编解码后模型的性能均会有所提升。
5.3.2引入编解码机制的深度学习模型与基线模型的性能比较
为说明引入编解码机制的深度学习模型比基线模型的交通流预测结果更能体现真实的交通状况,分别在路网1和路网2中比较ED-RNN与基线模型的交通流预测。目前,主流的交通流预测方法多为时空结合的交通流预测方法,这些方法需要拥有充足的路网拓扑信息。虽然模型可达到不错的预测效果,但模型复杂不易实现,且算法的时间复杂度和空间复杂度都很高。而本文方法具有模型简单、算法易于实现等优点,所以本文的基线模型选取传统的交通流预测模型HA与ARIMA。选取2012年2月1日18:30到2012年2月1日19:28路网l和路网2的中心路段进行模型交通流预测结果对比,如图7和图8所示。结果显示,相较于基线模型,RNN在引人数据编解码后的交通流预测结果更趋近真实速度曲线。
通过MAE,MAPE,RMSE和SMAPE 4种评价指标对模型性能进行比较,以及根据预测结果分析表明,路网拓扑信息不充足的情况下,在深度学习模型上引入编解码机制可以有效地提高交通流预测的准确性。
6 结束语
基于数据编解码的时空交通流预测方法对路网数据进行编码提取空间特征,再利用时序模型提取路网时间特征,最终解码得到路网的交通流预测。通过将数据进行编解码与时序模型的结合,可以同时提取时空特征,获得更高的准确度。将数据编解码的时空交通流预测方法在不同路网上进行测试,并与传统方法进行对比,实验结果表明,在无法提取充足的路网信息时,通过在时序模型上引入数据编解码方法可得到不错的预测效果。相比于目前已有的交通流预测方法,本文方法所训练的模型更简单和高效。在未来的研究工作中,为了使模型预测准确度提高,还需要考虑多重外部因素影响,比如节假日、温湿度以及降雨、雪量等。
参考文献:
[1] WU Z H,PAN S R,CHEN F W. et al.A comprehensivesurvey on graph neural networks[J]. IEEE Transactions onNeural Networks and Learning Systems, 2021, 32(1): 4-24.
[2] WILLIAMS B M,HOEL L A.Modeling and forecastingvehicular traffic flow as a seasonal ARIMA process:theoretical basis and empirical results[J]. Journal ofTransportation Engineering, 2003, 129(6): 664-672.
[3] DUAN H M. XIAO X P. A multimode dynamic short-termtraffic flow grey prediction model of high-dimensiontensors[J]. Complexity, 2019, 2019: 9162163.
[4]CAI L R, ZHANG Z C, YANG J J, et al. A noise-immuneKalman filter for short-term traffic flow forecasting[J].Physica A: Statistical Mechanics and its Applications. 2019,536: 122601.
[5] WU C H. HO J M, LEE D T. Travel-time prediction withsupport vector regression[J]. IEEE Transactions onIntelligent Transportation Systems, 2004, 5(4) : 276-2 8 1 .
[6]张晓利,贺国光,陆化普,基于K-邻域非参数回归短时交通流预测方法 [J].系统工程学报, 2009, 24(2): 178-183.
[7] WESTGATE B S, WOODARD D B. MATTESON D S, etal. Travel time estimation for ambulances using Bayesiandata augmentation[J]. The Annals of Applied Statistics,2013, 7(2): 1139-1161.
[8] YIN H B, WONG S C, XU J M. et al. Urban traffic flowprediction using a fuzzy-neural approach[J] . TransportationResearch Part C:Emerging Technologies, 2002, 10(2):85-98.
[9] HUANG W H, SONG G J. HONG H K, et al. Deeparchitecture for traffic flow prediction: deep beliefnetworks with multitask learning[J]. IEEE Transactions onIntelligent Transportation Systems, 2014, 15(5):2191-2201.
[10] FU R, ZHANG Z, Ll L. Using LSTM and GRU neuralnetwork methods for traffic flow prediction[C]//Proceedings of the 2016 3lst Youth Academic AnnualConference of Chinese Association of Automation. Wuhan:IEEE. 2016; 324-328.
[11]劉昶.基于时间序列的经典模型和LSTM模型的城市宏观行程速度预测研究[D].北京:北京交通大学,2019.
[12]赵建东,申瑾,刘麟玮.多源数据驱动CNN-GRU模型的公交客流量分类预测[J].交通运输工程学报,2021.21(5): 265-273.
[13] VLAHOGIANNI E I,GOLIAS J C,KARLAFTIS M G.Short-term traffic forecastmg: overview of objectives andmethods[J]. Transport Reviews, 2004, 24(5): 533-557.
[14] VAN LINT H,VAN HINSBERGEN C.Short-term trafficand travel time prediction models[M]//TransportationResearch Board of the National Academies. TransportationResearch Circular E-C168:Artificial IntelligenceApplications to Critical Transportation lssues. Washington:Transportation Research Board of the National Academies.2012. 22: 22-41.
[15] ZHAO L SONG Y J,ZHANG C,et al.T-GCN:a temporalgraph convolutional network for traffic prediction[J]. lEEETransactions on Intelligent Transportation Systems, 2020.21(9): 3848-3858.
[16] ZHANG S,CHEN Y,ZHANG W Y.Spatiotemporalfuzzy-graph convolutional network model with dynamicfeature encoding for traffic forecasting[J]. Knowledge-Based Svstems, 2021. 231: 107403.
[17] YU J J Q.Citywide traffic speed prediction:a geometncdeep leaming approach[J]. Knowledge-Based Systems.2021. 212: 106592.
[18] XIAO J L WANG Z H.Traffic speed cloud maps:a newmethod for analyzing macroscopic traffic flow[J]. PhysicaA:Statistical Mechanics and its Applications, 2018, 508:367-375.
(编辑:丁红艺)