崔书恒 刘雅妮 陈芳
摘 要:高速公路的路况问题日益,这使得人们越来越重视对高速公路交通运行状态的评估与预测。高速公路不同于普通公路,是一段全封闭的道路,车流量大和行车速度快是其最大的特点。因此,如何利用交通大数据来挖掘分析交通流的特征,并通过智能化的手段科学合理地预测出未来时间交通流的变化情况已经成为智能交通领域的一个研究热点。文章正是在智能交通领域下,深入研究基于时空图网络的高速公路路网交通流预测方法,对空间依赖性和时间依赖性分别进行建模,建立了一个长短时交通流预测模型去评估高速路况,并取得了很好的效果。
关键词:高速公路;交通流预测;时空图网络
中图分类号:F25;U491文献标志码:ADOI:10.13714/j.cnki.1002-3100.2023.04.026
Abstract: The increasingly serious situation of expressway traffic conditions makes people pay more and more attention to the evaluation and prediction of expressway traffic operation status. The expressway is different from the ordinary road section. It is a totally closed road. Its biggest characteristics are large traffic flow and fast speed. Therefore, how to use traffic big data to mine and analyze the characteristics of traffic flow and scientifically and reasonably predict the changes of traffic flow in the future through intelligent means has become a research hotspot in the field of intelligent transportation. In the field of intelligent transportation, the paper deeply studies the traffic flow prediction method of expressway network based on spatio-temporal graph network, models the spatial dependence and temporal dependence respectively, and establishes a long-term and short-term traffic flow prediction model to evaluate the expressway traffic conditions, and has achieved good results.
Key words: highway; traffic flow prediction; spatio-temporal graph network
随着车流量的增加,高速公路出现了交通拥挤、交通安全性能降低等的新问题。交通流预测是實现合理交通分配和持续发展的基础,是实现智能交通的必要条件。短期交通流预测使用历史交通数据、当前交通数据及其他影响交通运行的因素对其进行挖掘分析,构建预测模型以预测未来一段时间内的交通运行状态。交通流预测分为长期预测和短时预测,一般短时预测的时间尺度为5分钟至30分钟,长期预测则超过30分钟。
现有的交通流预测方法缺乏将时间、空间两个维度进行同步分析的研究,为此,文章构建了一种基于时空图网络(S-TGN,Spatio-Temporal Graph Network)的高速公路路网交通流预测模型,将路段的门架监测数据输入图卷积网络(GCN)和门控递归单元(GRU)相结合的高速公路交通流的预测模型中以进行高速公路路网的预测。模型可以处理复杂的空间依赖关系和时间依赖关系。
1 文献综述
当前,高速公路交通流预测越来越受到学者们的重视。徐建闽等从出行发生量预测、OD交通量预测和交通量分配三方面进行研究,运用一元线性回归模型、重力模型法和静态多路径分配模型等完成了对广州珠光高速未来25年内的交通量预测[1]。撒元功等应用误差反传神经网络(Back Propagation,BP)建立了高速公路交通流模型,通过特征性训练和适应性训练,得到了较为准确的高速公路交通流神经网络模型[2]。曲仕茹等在利用BP神经网络进行高速公路交通流预测的基础上,不断对模型进行优化,通过修改神经网络中的参数,提高预测的精准性[3-5]。刘清林等在对以往BP神经网络研究的基础上,利用小波滤波器对数据进行白噪声的消除,进而利用闭环反馈BP神经网络对高速公路节假日拥堵情况进行预测[6]。肖智等在考虑到高速公路交通流多种影响因素的条件下,提出利用POS方法进行参数优化的支持向量回归(SVR),从而进行多因素单目标的高速公路交通流预测[7]。焦琴琴建立了DBN-SVR短时交通流预测模型,利用美国高速公路数据进行实证验证,结果表明在预测精度方面优于单一的SVR预测模型[8]。
2 模型方法
将高速公路的道路拓扑结构抽象成图结构,给定初始化未加权的图结构G(V,E),其中V为图的节点集合,E为边的集合。将数据预处理得到的邻接矩阵A∈RN*N用于表示高速公路之间的连接,其中N表示路网中的节点数,邻接矩阵只包含0和1的元素,元素1表示两条道路相连,元素0表示不相连。
再将X∈RN*P用于表示特征矩阵,将高速路网上的交通流视为网络中节点的属性特征,其中P表示每个节点的特征数。节点属性特征可以是任何交通流数据,例如速度、流量和交通密度,在这里采用速度数据。
预测问题的目标就是用前S个时间步的交通流来预测未来T个时间步的交通流。给定图G及其历史步长S的图信号,通过学习函数f来预测下一T时间步的图信号,可以利用下式进行分析。
获取复杂的空间相关性是交通预测的关键问题,卷积神经网络(CNN)可以获得局部空间特征,但它只能用于欧几里德空间。高速公路的道路网络不是二维网格,这意味着CNN模型不能反映路网的复杂拓扑结构,因此,考虑采用可处理任意图结构数据的图卷积网络(GCN)来准确捕捉空间依赖性。
对于一个图G=(V,E),输入X是一个N*D的矩阵,表示每个节点的特征,同时有图的邻接矩阵A,我们希望得到一个N*F的特征矩阵Z,代表学得的每个节点的特征表示,其中F是希望得到的表示的维度。
给定邻接矩阵A和特征矩阵X,GCN模型在傅里叶域中构造滤波器。过滤器作用于图的节点,通过其一阶邻域捕获节点之间的空间特征,然后通过叠加多个卷积层来建立GCN模型,其可表示为:
其中A=A+IN表示邻接矩阵的自连接过程,D表示度矩阵,D=ΣjAij,DAD表示预处理过程,Ol表示l层的输出,Wl表示该层的权重矩阵,ReLU(·)是ReLU激活函数。
本文选择2层GCN模型来获得空间相关性,实现关键信息的汇聚可以表示为:
f(X,A)=ReLU(AReLU(AXW0)W1)
其中X是特征矩阵,A=,W0∈RP*H表示从输入层到隐藏层的权重矩阵,P是特征矩阵大小,H是隐藏单元的数量,W1∈RH*T表示从隐藏层到输出层的权重矩阵,f(X,A)∈RN*T表示預测长度为T的输出。
使用GCN模型从交通数据中学习空间特征。如图1(a)所示,假设节点1是中心道路,蓝色节点表示这些道路与中心道路相连,GCN模型可以获得中心与周围道路之间的拓扑关系,对道路网络的拓扑结构和道路上的属性进行编码,然后获得空间相关性如图1(b)。
目前处理序列数据使用最广泛的模型是递归神经网络(RNN)。为了修复梯度消失和梯度爆炸等缺陷,递归神经网络的变体LSTM模型和GRU模型应运而生。然而LSTM训练时间较长,而GRU模型具有相对简单的结构、较少的参数和较快的训练能力。因此本文选择GRU模型从交通流数据中获取时间依赖性。GRU通过将时刻t-1的隐藏状态和当前交通信息作为输入来获取时刻t的交通信息。
将具有空间特征的时间序列输入门控递归单元GRU中,通过单元间的信息传递获得道路交通信息数据的动态变化,从而得到时间特征。
GRU有两个门,分别是重置门rt和更新门ut。重置门rt用于控制候选交通状态Ct的计算是否依赖上一时刻交通状态ht-1,更新门ut用于控制当前交通状态ht需要从上一时刻交通状态ht-1中保留多少信息,以及需要从候选交通状态ct中接受多少信息。Xt表示时间t的交通信息,GRU通过将上一时刻交通状态ht-1和当前交通信息作为输入来获得时间t的交通状态。
其中,f(A,Xt)表示由公式(3)定义的图卷积过程,W和b表示训练过程中的权重和偏差。
GRU以t-1时刻的隐藏状态和当前交通信息为输入,获取t时刻的交通信息。该模型在捕获当前时刻的交通信息的同时,仍然保留了历史交通信息的变化趋势,并具有捕获时间相关性的能力。
为了同时捕捉交通数据的空间和时间依赖性,本文提出了一种基于时空图网络(S-TGN,Spatio-Temporal Graph Network)的交通流预测模型。如图3所示,左边是时空预测的过程,右边是一个S-TGN单元的具体结构,ht-1表示t-1时刻的输出,GC是图卷积过程,ut和rt分别是t时刻的更新门和重置门,ht表示t时刻的输出。
S-TGN模型可以处理复杂的空间依赖关系和时间依赖关系。一方面,图卷积网络用于捕获高速公路路网的拓扑结构,以获得空间相关性。另一方面,门控循环单元用于捕获道路上交通信息的动态变化,以获得时间相关性,最终实现交通流预测任务。
3 实 验
本文选用RMSE和Accuracy作为评价指标,RMSE用于测量预测误差,数值越小,预测效果越好。Accuracy用于检测预测精度,数值越大,预测效果越精确。
其中M为时间样本数,N是道路数。
其中Y和Y分别表示实际交通流和预测交通流。
选用2021年4月1日到2021年6月30日这91天的高速公路交通数据,选取156条主要高速公路及其周边道路作为研究对象。实验数据主要包括两部分,一个是156*156邻接矩阵,用于描述道路之间的空间关系。每行表示一条道路,矩阵中的值表示道路之间的连接;另一个是特征矩阵,它描述了每条道路上的速度随时间的变化,每行代表一条道路,每列是不同时间段道路上的交通速度。
首先每15分钟计算一次各条道路的交通速度。在实验中,输入数据被标准化为区间[0,1]。此外,80%的数据用作训练集,其余20%作测试集。实验结果如表1所示。
然后每30分钟计算每条道路的交通速度,进行短期预测,实验结果如表2所示。
最后每60分钟计算每条道路的交通速度,进行长期预测,实验结果如表3所示。
可以发现,在短期预测和长期预测中,S-TGN模型相比于其他模型都表现出了最好的预测性能。对于15分钟交通流预测任务,S-TGN模型和GRU模型的RMSE误差分别比ARIMA模型低45.77%和32.97%,两种模型的准确率分别提高了63.54%和62.42%。与SVR模型相比,S-TGN和GRU模型的RMSE误差分别降低了5.28%和0.67%,比SVR模型准确率高出约2.63%和1.93%。这是由于ARIMA和SVR等方法难以处理复杂的非平稳时间序列数据。GCN模型的预测效果较低是因为GCN只考虑了空间特征,忽略了交通数据是典型的时间序列数据。
4 总 结
本文对高速公路交通流问题进行了抽象化,使得模型在保持预测精度的同时,降低预测的时间复杂度,提高预测模型的实时性。本文从空间依赖性和时间依赖性方面分别进行建模,捕获了道路网络的拓扑结构和交通数据的动态变化,构建了一个基于时空图网络S-TGN的交通流预测模型,用于高速公路路网的预测,建立了一个长短时交通流预测模型,并取得了很好的效果。
参考文献:
[1] 徐建闽,尹宏宾.广珠高速公路交通量预测[J].系统工程理论与实践,1998(4):123-126.
[2] 撒元功,胡郁葱,徐建闽.高速公路动态交通流的神经网络模型[J].华南理工大学学报(自然科学版),2002(8):91-94.
[3] 曲仕茹,陈志强.基于神经网络的高速公路交通流预测模型及其应用[J].广东工业大学学报,2008(3):100-102.
[4] 王军,许宏科,蔡晓峰,等.基于BP神经网络的高速公路动态交通流预测[J].公路交通技术,2007(1):150-152+163.
[5] 戴洪波,曾献辉.基于BP神经网络的高速公路短时交通流预测[J].智能计算机与应用,2015,5(4):36-38+41.
[6] 刘清林,戴红良.小波滤波BP神经网络的高速公路节假日拥堵预测分析[J].公路工程,2016,41(6):98-102.
[7] 肖智,李玲玲.PSO-SVM在高速公路交通量预测中的应用[J].管理评论,2011,23(12):32-37+67.
[8] 焦琴琴.基于深度学习的路网短时交通流预测[D].西安:长安大学,2016.