基于动态图生成的车道级交通流预测

2023-02-02 09:09刘炜焘王一然王凌云余凯峰孔祥杰

浙江工业大学学报 2023年1期

刘炜焘,冯辉,王一然,王凌云,余凯峰,孔祥杰

(1.浙江浙能技术研究院有限公司,浙江杭州 311121;2.浙江工业大学计算机科学与技术学院,浙江杭州 310023)

随着城市化进程的加快和智慧城市的建设,几乎无处不在的道路传感器使车辆处于普适环境中。在车辆与传感器的隐式交互下,传感器能够不断地探测车速、车流量等交通情况,因此人们无须关心道路上潜在的计算设备,只需关注自身的出行,从手机应用或智能车载终端获取拥堵提示、路径引导等出行服务。由此可见,智能交通系统(Intelligent traffic system,ITS)是普适计算的重要应用之一,而ITS的交通控制和交通规划需要以实时、准确的交通流预测作为基础。交通流预测能够掌握路网、路段、车道在一般时段和日期下的运行规律,并学习特殊地段(商圈、学校、医院)、突发事件(交通事故、交通拥堵)、特殊期间(拥堵形成期、拥堵期、拥堵消散期)的交通运行特性,完成对未来交通情况的准确预测[1],为日常出行和交通管理提供关键信息。现有的交通流预测方法可大致分为模型驱动型和数据驱动型两大类[2-4]。模型驱动型方法[5-6]以交通流中基本参数(速度、流量、占有率)之间的各类公式为先验知识,无法对天气、交通事故等特殊因素或偶然事件进行处理。因此现有的研究着重于数据驱动型方法中具有多维度数据分析能力的深度学习方法。Wu等[7]为了使预测过程能够适应环境的变化,提出了基于T-RNN的多模态预测方法。为了更好地拟合高峰流量,Jing等[8]引入了基于梯度提升决策树的轻量级梯度提升机算法,并结合LSTM神经网络模型对城市轨道交通客流进行预测。Jia等[9]使用DenseNet和ConvLSTM模型分别捕获空间依赖的动态变化和时间依赖的非周期性特性。然而,上述研究无法判断路段及道路交叉口内各车道间的相似性与差异性,只是笼统地将其视为一个整体[10]。

由于车辆的高度流动性,不同车道间的交通运行模式存在差异,不同交叉口、不同流向间的车道更倾向于呈现出相异的交通运行状态[11-12]。同时,在普适计算的背景下,交通流预测应当能够及时地感知不同车道间的道路动态,完善行车、人、道路一体的普适环境。因此车道级的交通流预测是ITS未来重点发展技术之一。Gu等[13]使用基于熵值的灰色关联法分析各车道之间的依赖关系。Ke等[14]提出TM-CNN模型,将同一路口下的不同车道视为各通道内的图片。Xie等[15]以车辆变道行为作为切入点,使用深度置信神经网络与LSTM建立包括变道决策与变道实施在内的车辆变道模型。然而,上述研究没有考虑车道间交通模式的动态变化,以及其他异构数据对预测结果的影响。对此笔者提出了车道级交通流预测异质图卷积模型,同时考虑了静态和动态的路网结构,并融合车辆速度、道路占有率和最小能见度等数据,缓解单源数据的信息缺乏问题。模型主要由3部分构成,分别为基于动态图生成的内源图卷积网络、外源异质数据融合网络及基于注意力机制的编解码神经网络。其中,内源卷积网络使用车流量和皮尔逊相关系数计算道路拓扑图中节点之间的关联度,生成路网的动态图,更好地处理了时空相关性。外源异质数据融合网络将车速、道路占有率和最大可见度3个指标与车流量一起综合考虑,提升了交通预测的准确度。编解码神经网络使用时序注意力机制,进一步挖掘时间依赖。在两个真实数据集上的实验结果表明:异质图卷积神经网络模型在多个指标上均优于对照组方法,能够有效地预测未来交通流情况。

1 车道级交通流预测异质图卷积模型

图1为异质图卷积网络的模型架构,网络主要由3部分构成,分别为基于动态图生成的内源图卷积网络、外源异质数据融合网络和基于注意力机制的编解码神经网络。为更方便地在图1中表示,内源卷积网络与外源异质数据融合网络被整合表示为关联性卷积单元(Association convolution block,ACB)。

图1 基于动态图生成的异质图卷积网络模型Fig.1 Architecture of the heterogeneous graph convolution model based on dynamic graph generation

在ACB的内源卷积部分,根据与目标车道的关系,将参与车道分为同路口和不同路口两大类,分别计算道路之间的关联性。针对不同路口之间的车道,融合动态图矩阵与静态邻接矩阵;针对同一路口下的车道,仅采取动态图生成过程,代替静态邻接矩阵。上述两部分矩阵分别参与图卷积运算,并将运算结果融合为最终的内源图卷积结果。在ACB的外源融合部分,采取注意力机制,合理分配各类参数(交通流特征参数、天气参数)的参与权重,获取外源融合结果,并与内源图卷积结果整合得到各ACB的输出值。将各ACB中的输出值作为时序编码器中的输入值,使用注意力机制对各时刻GRU单元中隐藏层分配时序权重,加权后组成上下文向量。将该上下文向量输入解码器,经迭代处理后得出最终预测结果。

2 基于动态图生成的内源图卷积网络

由于各类交通运行状况信息可被视为图中的信号,现有许多研究将图神经网络应用于交通流预测问题,捕捉交通网络中的空间特征。使用基于谱域的图卷积网络,挖掘同路口、不同路口车道的静态邻接图与动态图中的深层次空间依赖关系。

按道路拓扑连接结构定义无向权重图G=(V,E),其中:V为节点的集合，V={v1,v2,…,vN}，N为节点的数量;E为各节点之间边的集合,表示节点之间的连通性。图G的权重和静态邻接矩阵AI∈

RN×N，其计算式为

(1)

式中:i,j为节点的编号;di,j为两个节点之间的距离。静态邻接矩阵AI只有0值和非0值,0值表示节点之间无关联,非0值表示节点之间的关联度大小。关联度大小由两点之间的距离计算,距离越小,两节点间的关联度越大,而距离越大,两点间的关联度越小。为了提高卷积的效率,利用切比雪夫多项式近似拟合卷积核,即

(2)

然而,基于切比雪夫多项式的图卷积网络无法通过式(1)的静态邻接矩阵发现交通模式的动态变化。例如:早高峰时郊区与城区连接干道的车流大幅度增长,车流方向为郊区通往城区;晚高峰时城区通往郊区的返程车辆呈现增长趋势。两者之间的车流关系与上下游传导关系相反,静态的连接关系显然无法反映车道间交通模式的改变。图2展示了各节点间关联程度随时间变化的过程,边的颜色越深表示关联程度越高,颜色越浅表示关联程度越低。

图2 各节点的关联情况Fig.2 Association between nodes

此外,式(1)依据与目标节点的距离计算其余节点关联度的做法,忽略了各节点间可能存在的相似交通运行模式带来的影响。各节点间的静态与动态连接如图3所示,以S3作为目标节点,根据距离邻接关系可以得到图3(a)的结果:S3与S1,S2,S4的距离最近,因而具有更高的权重;S3与S5,S6,S7距离较远且不直接相邻,因而只有较低的权重。假设对各节点交通运行模式进行数据分析后发现S3的交通状况与S6的状况最为相近,包括到达早晚高峰的时间以及高峰期最大流量,并且S6的拥堵会在短时间内蔓延至S3,那么应有图3(b)所示的节点间关联性分析结果,虽然S3与S6的距离较远,但是它们之间拥有最高的影响权重。考虑到上述因素,笔者创新性地提出基于动态图生成的内源图卷积网络,图4为具体网络结构。

图3 各节点间的静态与动态连接Fig.3 Static and dynamic links between nodes

图4 基于动态图生成的内源图卷积网络Fig.4 Internal graph convolutional network based on dynamic graph generation

将数据输入内源图卷积网络前,根据与目标车道的邻接关系,将所有参与车道分为同路口邻接车道Xs以及不同路口邻接车道Xd这两类。由于车流量能够很好地反映路网的拥挤程度及发生事故的概率,因此选用流量为指标,由皮尔逊相关系数计算各节点之间的关联度,生成动态图,即

(3)

(4)

(5)

(6)

(7)

式中:W为自学习的权重项;⊙为哈达玛积运算。

将两次卷积结果Fs与Fd进行融合,得到第l时刻内源卷积的最终结果,即

(8)

3 外源异质数据融合网络

在交通流预测中,仅考虑单一类型数据,而忽略异质数据是造成预测结果精度低的另一个主要原因。根据交通中速度—流量等基础方程,可以得知速度、流量以及道路占有率三者间复杂的非线性影响关系。例如道路在某时段内平均流量低,无法根据该单一的指标确定是因为处于平峰段导致车流少,还是因为拥堵造成交通不畅。此外,天气因素也会对交通运行情况造成较大的影响。当天气晴朗,能见度高时,通常道路中车辆的行驶速度较快,饱和流量可以达到较高水平;当阴雨或是大雾等恶劣天气时,能见度低,道路中车辆行驶速度较慢,流量低且难以达到饱和水平。因此,单源交通流特征参数无法精准地描述交通运行状况,模型需要车辆速度、道路占有率和最小能见度等数据作补充。

外源融合部分弥补了单源数据中信息缺乏的问题。图5为外源异质数据融合网络的具体结构,该网络采取注意力机制,通过神经网络的自学习,合理分配各类异构特征参数的参与权重,自适应地达到各时刻内各目标节点的最优解,其注意力权重计算式为

图5 异质数据融合神经网络Fig.5 External heterogeneous data fusion network

(9)

(10)

(11)

4 基于注意力机制的编解码神经网络

如图6所示,将内源卷积神经网络与外源异质数据融合网络的输出值进行线性变化,融合后可得到各ACB中的最终输出,即

图6 内源卷积网络、外源异质网络的输出融合Fig.6 Fusion of internal network and external network

(12)

式中:Wl1,Wl2为可自学习的权重项;bl1,bl2为与之对应的偏移项。

得到各时刻下ACB中的输出值后,虽然该输出值中包含深层次空间依赖,但还需进一步挖掘其中的时间依赖关系,以提升结果的精度。在交通流预测研究中,已有较多的结论证明LSTM,GRU等网络可通过历史信息的有效收集,依据前文的场景干预下文的预测,有效地处理时间序列。因此,笔者以GRU为基础单元,用头尾相连的方式搭建编码器。通常情况下,编码器会将处理的输入信息与序列压缩到上下文向量中,然而由于存储空间的限制,上下文向量通常具有固定的长度,无法存储全部的信息,仍然无法妥善地解决序列问题中的远程依赖与长期依赖。

为解决上述问题,在编码器中引入了时序注意力机制。时序注意力以神经网络自学习和并行计算的方式,合理且高效地分配各时段参与的权重,从而获得全局的最优解,解决了远程依赖与长期依赖问题。时序注意力权重计算式为

(13)

(14)

获取时序注意力权重后,可以求得上下文向量,即

(15)

(16)

(17)

(18)

5 实验

5.1 实验数据集

笔者使用美国加利福尼亚州运输机构在真实高速公路上采集的两组大型数据集PeMSD4和PeMSD8,对提出的网络以及其余对比实验组进行性能测试。根据传感器位置所属的路口及所属的车道对数据进行细分,并以5 min为间隔统计车道的总流量、平均占有率及平均速度。根据道路限速及实际情况,对不合理的数据进行清洗,对毛刺点进行平滑处理,并使用固定长度的滑动窗口法对缺失数据进行了补充。此外,笔者还搜集了两地区在上述时段内的天气状况数据,选择了其中的能见度指标。

PeMSD4中共有307个传感器,它们分布于旧金山湾区的29条道路中。数据集包含2018年1月1日—2月28日共56 d的数据,其中41 d数据作为训练集,15 d数据作为测试集。PeMSD8中共有170个传感器,分布于圣贝纳迪诺地区的8条道路中。数据集包含2016年7月1日—8月31日共62 d的数据,其中47 d数据作为训练集,15 d数据作为测试集。

5.2 对比实验

为了考察基于动态图生成的异质图卷积网络的优越性,笔者将其与7种对照算法进行对比,对照算法涵盖了参数型方法、非参数型方法以及深度学习方法:

1) HA。该方法是一种基于统计学的方法,它使用训练集中对应时刻的交通流特征参数作为标准,计算其平均值,以此作为预测结果。

2) SVM。该方法是一种有监督学习方法,所求得的最优超平面可使多个类别之间相距最远。

3) ARIMA。该方法是一种时间序列预测方法,它由一个自回归块和一个移动平均块构成。

4) GRU。该方法是LSTM的一种变体,它删除了其中的遗忘门,仅由更新门和重置门组成。

5) T-GCN[16]。该方法是使用GRU-GCN结构的时间序列神经网络。其中,GCN处理空间依赖关系,GRU处理时间依赖关系。

6) ST-AFN[17]。该方法使用时空注意力构建车道级交通流预测融合网络,是本课题组先前的工作成果。该网络主要由4部分构成,分别为速度处理神经网络、空间性编码网络、异质信息融合神经网络与时间性解码网络。

7) ASTGCN[18]。该方法是时空注意力图卷积网络。它将时间序列分为邻近、天和星期3个子模块,并在各个子模块中使用时间、空间注意力,最后融合3个子模块得到预测结果。

所有的实验运行于同一台主机上,主机操作系统为Ubuntu 18.04,内存64 GB,CPU为Intel Xeon Silver,显卡为NVDIA Quadro M4000。Pytorch版本为v1.6.0,初始学习率设置为0.000 1,批次大小(Batch size)设置为128,编解码器中GRU单元的隐藏层与细胞状态大小统一设置为64,预测所使用的历史数据的步长设置为12。笔者使用平均绝对误差(Mean absolute error,MAE)、根均方误差(Root mean square error,RMSE)和平均绝对百分比误差(Mean absolute percentage error,MAPE)作为评价指标,表1列出了各组实验最终的平均结果。

表1 整体性能对比Table 1 Overall performance comparison

由表1可知:基于统计学的HA方法虽然效率高,但由于算法过于简单,无法应用于复杂多变的真实交通环境中;时间序列预测方法ARIMA虽然比传统机器学习方法SVM预测结果更好,但是精度仍较低;深度学习方法GRU取得了优于ARIMA的结果;空间依赖关系的欠缺是提升预测精度的瓶颈,T-GCN使用复合的网络结果解决了这一问题,它较GRU取得了进步明显;多分支结构的ASTGCN使用了时空注意力,精度比用于地面道路预测的ST-AFN更高一些;笔者提出的基于动态图生成的异质图卷积融合网络取得了最优预测结果,在PeMSD4中的3项评估指标分别为16.1654,24.656及12.413%,在PeMSD8中分别取得了15.486,22.513及13.641%的结果。

与周末相比,工作日的早晚高峰趋势更加明显,车流量增长的幅度更大,而平峰时期车流量更少,两者之间存在较明显的差异。为了更好地展示神经网络在工作日与非工作日的预测结果,对工作日与非工作日的预测结果分别进行了统计。表2展示了T-GCN、ASTGCN和笔者所提的异质图卷积神经网络在工作日和非工作日中的各个指标,异质图卷积神经网络在工作日与非工作日都取得了最优的预测结果,并且在非工作日取得的结果精度高于在工作日取得的结果精度。

表2 工作日与非工作日结果对比Table 2 Performance comparison of working days and nonworking days

为了更好地展示异质图卷积模型的真实有效性,从PeMSD4中选取了一个工作日,从PeMSD8中选取了一个休息日,分别进行预测结果的图形展示,结果图7所示。由图7可知:异质图卷积模型取得了较好的交通流预测结果,并且非工作日的预测结果略好于工作日的预测结果。从细节上分析,虽然在交通运行状况较为平稳时,神经网络预测正确率较高,但是在波动发生时,神经网络预测值与真实值的差距相对较大,仍存在一定的缺陷。例如,在正午时刻交通流量发生突变的情况下,误差会较大,并且早晚高峰时期的最大流量值未被准确预测。

图7 预测结果Fig.7 Prediction results

5.3 网络消融实验

为了证明内源图卷积网络以及外源异质数据融合网络的有效性,分别去除两个子网络,消融性实验结果如表3所示。其中:author*为删除内源图卷积网络后仅使用静态图卷积网络的预测结果;author**为删除外源异质数据融合网络后的预测结果。当仅使用静态图挖掘车道间的空间依赖时,author*在PeMSD4数据集的MAPE指标为16.105%,在PeMSD8数据集的MAPE指标为20.896%,和其他对照组相比没有获得良好的实验结果。而在没有考虑最小能见度、道路占有率等外源数据的情况下,author**在PeMSD4数据集的MAE和RMSE指标分别为26.221和37.542,在PeMSD8数据集的MAE和RMSE指标分别为26.462和38.403,实验数据均高于其他对照组模型。在考虑动态图卷积和外源数据的author实验中,各指标在PeMSD4和PeMSD8数据集下都取得了最优的实验结果。因此,笔者引入的基于动态图生成的内源图卷积网络和外源异质数据融合网络都对模型性能的提升起到了关键作用。

表3 消融性实验结果比较Table 3 Performance comparison of ablation experiment

5.4 算法运行效率分析

笔者还对T-GCN、ASTGCN等图卷积算法以及ST-AFN进行了运行效率的分析。表4为网络训练消耗时间对比。ST-AFN因其使用高效的注意力机制而具有最快的速度,T-GCN因其相对简单的网络结构训练完成速度较快,拥有众多网络分支的ASTGCN训练速度较慢。笔者提出的模型虽然在PeMSD4和PeMSD8两个数据集上的MAE，RMSE和MAPE性能指标均优于其他对照组模型,但在运行效率上仍存在不足。

表4 算法训练耗时对比Table 4 Training cost comparison

6 结论与展望

在普适环境下,车道级交通流预测比已有的预测方法能够更精细化地感知城市中的道路情况,发现客观环境的动态变化。笔者提出基于动态图生成的异质图卷积神经网络,网络总体采用编解码的结构,以各时刻ACB中的输出值作为时序编码器中的输入,其中ACB中包括内源图卷积、外源异质数据融合这两个子网络。ACB单元将动态内源图信息与外源异质数据进行了融合。时序编码器使用注意力机制合理分配各时段权重,组成上下文向量。最后解码器对上下文向量进行解码,完成交通流预测。实验使用PeMS中两个真实的交通数据集,结果充分证明了该网络的可行性与优越性。由于PeMSD4和PeMSD8数据集采集自美国加利福尼亚州的高速公路,后续会在国内的城市数据集和其他交通数据集上进一步验证异质图卷积模型的有效性。利用编解码结构与注意力机制虽然有效地提高了网络的运行效率,但要做到根据当前交通情况进行实时运算仍存在提升空间。后续工作也将探索边缘计算方法,把繁重的运算任务卸载到路边单元(Road side unit,RSU)或尝试迁移学习中的模型预训练思想,进一步提升网络模型的实时性。