基于多组件融合与空洞图卷积的车道占用率预测模型

2021-11-18 02:18孙秀芳李建波吕志强董传浩

计算机工程 2021年11期

孙秀芳，李建波，吕志强，董传浩

（青岛大学计算机科学技术学院，山东青岛 266071）

0 概述

随着我国经济的快速发展和现代化进程的加快，交通需求不断增大，交通负荷愈发严重，从而导致交通拥堵、安全事故以及交通资源分配不足等问题不断加剧。交通拥堵不仅造成环境污染，还增加了能源消耗，给城市的可持续发展和居民的生活带来较大的负面影响。随着对交通问题研究的深入，交通对策的设计必须逐步从以设施供给为主的硬对策转向设施供给与需求管理相结合的软硬协同方法。为此，智能交通系统（Intelligent Traffic System，ITS）［1-3］应运而生。ITS 能通过检测当前交通状况以预测未来一段时间的交通情况，从而规划交通出行方式，为交通路径的选择给出参考策略，最终实现智能出行。ITS 能够有效改善和缓解交通问题，并为城市规划建设提供参考。交通预测是交通管理和控制部门采取交通诱导措施的主要依据，因此，交通预测模型的研究成为近年来数据挖掘领域的重点［4］。

根据预测目标的不同，交通预测可以分为车流量预测、车辆速度预测、车道占用率预测等。由于交通数据受到天气状况、突发状况等多种因素的影响，因此交通数据是高度非线性的。车道占用率和车辆交通流在一定条件下可以互相表示、互相替代。交通预测经过长时间的发展，目前已取得丰硕的研究成果，当前主流交通预测是采用典型的统计学方法和深度学习方法［5］。基于统计学的线性理论模型有历史平均方法（HA）［6-7］、时间序列方法、卡尔曼滤波方法［8-9］等。自回归移动平均模型（ARIMA）［10-12］以及该模型的变形均基于传统统计学方法进行时序预测，此类模型是线性模型，线性模型结构简单，计算比较方便，但是对于具有很强随机性和不确定性的非线性交通数据而言，该类模型需要时序平稳分布，受时序波动的影响较大，抗干扰能力低，因此，预测结果不够精准。

为了捕捉交通数据的非线性，研究人员又提出基于小波的理论模型［13］、混沌理论模型、非参数回归模型［14］等非线性预测模型。非线性预测模型主要以非线性系统理论为基础，利用混沌理论、分型概念等方法建立预测模型，理论上而言，混沌理论对于交通这种非线性数据具有很好的适应能力，但是，在实际中即使能充分地适应交通数据的非线性，这类方法仍存在不足，它们具有非常庞大的满足“临近”匹配和“临近”查找的复杂性。随着深度学习的发展，越来越多的研究人员采用深度学习方法进行交通预测，如K 近邻（KNN）［15］、支持向量机（SVM）［16］、神经网络等，它们取得了更高的精确度，从而可以对更复杂的数据进行建模。

文献［17］提出基于深度信念网络（DBN）的快速学习算法，该算法通过非监督的贪婪预训练方法来获取模型的权重参数，通过多层的表征学习得到更能涵盖数据特征的表征，并且逐层训练的方式降低了深度神经网络的训练难度。但是该算法很难在全连接的方式下提取时间和空间特征，并且由于对空间属性的严格限制，该算法的表示能力受限严重。

为表现交通流受空间特征影响的特性，研究人员将卷积神经网络引入到交通预测模型中，以捕获交通流中的空间特征。一些学者使用卷积神经网络来捕获网络中的临近信息，并且在时间轴上部署神经网络结构。文献［18］提出卷积LSTM，其为带有嵌入卷积层的全连接LSTM 的扩展，虽然卷积LSTM 能够提取时间和空间特征，但是其采用了常规的卷积，只能应用于常规的网状结构，而不能对有图结构特性的路网进行处理，此外，基于循环网络的模型计算量大，在计算过程中容易使得误差增大从而难以训练。文献［19］提出融合时间和空间特征的STGCN 模型，该模型利用图卷积捕获交通流的时间和空间特征，但是没有考虑其他因素对交通流的影响。

上述研究通常侧重于对流量和速度这2 个交通指标进行预测，虽然是对车流量进行预测，但往往忽略了当前车道占用率。不同的道路对车辆的承载数不同，即使同一时段有相同数量的车辆，但是不同的道路所出现的路况将不同，车道数少的道路可能会出现拥堵的情况，因此，对车道占用率进行研究非常有必要。准确预测车道占用率不仅能够分析当前道路未来一段时间是否拥堵，还能为城市道路建设提供参考。

因为车道占用率数据获取难度较高，所以利用车道占用率对车流量进行预测的相关研究尚处于起步阶段［20-21］。文献［22］研究防撞系统中交通参与者的车道占用率，文献［23］将胶囊网络和卷积神经网络相结合，提出一种混合的车道占用率预测模型2LayersCapsNet，文献［24］提出扩散卷积递归神经网络（DCRNN）模型以对速度进行预测，文献［25］提出图多注意网络模型（GMAN）以预测车流量。但是，以上方法仅考虑时空相关性，没有考虑其他因素对车道占用率的影响。针对该问题，本文提出一种多组件融合的车道占用率预测模型MCFDGCN，该模型不仅考虑时间和空间特征对车道占用率的影响，还引入车流量和车辆速度这2 个隐式因素，在融合多种特征后对车道占用率进行预测。

1 相关工作

1.1 问题定义

车道占用率预测实质上是融合多种影响因素的时序预测问题，将车道占用率作为预测指标，利用历史时间的车道占用率预测未来一段时间的车道占用率。如图1 所示，车道占用率问题就是用N个节点前h个时间段的交通信息（包括车辆数量、车辆速度、各个节点的时空信息、车道占用率等信息），以预测未来p+1 个时间段的车道占用率状况。具体到特定的点，就是使用车道占用率的时间序列Oh=［ot-h，ot-h+1，ot-h+2，…，ot-1］预测未来时间序列O′h=［ot，ot+1，ot+2，…，ot+p］。

图1 时序预测示意图Fig.1 Schematic diagram of time series prediction

1.2 车道占用率

车道占用率是指车道的使用占比，具体表现为某个特定区域的特定时间内，车辆真实使用的道路量与该区域中道路总量的比值。车道占用率是衡量道路资源是否被充分利用的重要衡量指标，其主要有2 种表现形式：空间占用率和时间占用率。空间占用率计算是通过空间测量法而得出，即车道当前单位面积中所有车辆所占面积总和的比重。由于车辆行驶需要有安全距离且面积计算具有复杂性，为了方便数据的采集和计算处理，通常采用某个时间段内通过一段车道上车辆长度的总和与该段车道的总长度之比作为空间占用率。车辆车道空间占用率OS计算公式如下：

其中：RL是车道总长度；RLi是当前时间戳在这段车道上第i辆车的车辆长度。

车辆车道时间占用率OT是通过时间测量法计算而得出，表示为车道上的监测站在特定时间间隔内所观测的车辆通行占用时间的比重：

其中：TL是设定的时间段；TLi是第i辆车通过监测站时所花费的时间，车辆所花费的时间总和与总时间的比例即为车道的时间占用率。

车道占用率是根据不同标准定义的，但是时间和空间2 种定义标准下的占用率都能反映当前时间车道的占用率情况。下文所提及的车道占用率均指车道的时间占用率。

1.3 时空相关性的影响

交通状况受到时间方面的影响主要体现在历史时间上，历史时间的交通状况会对后续时间的交通状况产生重要影响。由于交通流的连贯性，交通状况也会受到周边情况的影响，道路的交通状况不仅与当前路口相关，还和与之相连的道路的交通状况密切相关。如图2 所示，将同一时间段节点的交通信息表现在一张平面图中，节点之间的线段表示其连通性，从图中的道路拥堵情况以及变化情况可以看出，交通状况不仅受时间还受空间因素的影响，因此，交通信息的时空相关性对交通状况的影响是明确的。

图2 交通时空特性示意图Fig.2 Schematic diagram of traffic spatio-temporal characteristic

从图3 可以看出，道路上的每个监测站不是独立存在的，监测站采集到的交通数据节点也不是独立的，节点之间两两相互连接构成网状结构，即路网。将节点信息以图的形式定义在路网中，能方便模型利用图卷积提取特征。节点的合集J可以被呈现在无向图中，无向图定义为G=（J，E，W），节点j1就可以定义为图G中权重为W1i的一个信号，J表示顶点的有限集，顶点的个数就是本文选取的监测站个数，E表示顶点之间相互连通的边εi的集合，W表示权重的邻接矩阵。

图3 路网结构Fig.3 Road network structure

路网上的节点相互连接，本文将路网上的包含交通信息的节点在无向图上进行建模，由于传统网格上的标准卷积不能应用于广义图，因此本文采用图卷积的方法对广义图上的交通信息特征进行提取。文献［26］提出的图卷积普遍应用于计算机视觉领域，在对图数据进行处理时表现卓越。单个节点的数据不能代表该节点全部的交通信息，如果只考虑单个节点而不考虑节点之间的连接关系，容易造成特征偏差，因此，考虑邻居节点的信息比考虑单个节点信息所得到的单一特征更完整，图卷积是一个较好的解决方案。本文将节点定义到图中，充分地将节点之间相互连接的特征保留，进而提取邻近节点的相关信息。

1.4 车流量和车辆速度的影响

车道占用率与通行车辆速度、当前道路的车流量有着密不可分的关系，三者互相影响。

车道占用率和车辆速度的关系如图4 所示。车辆速度快可以提高道路占用率，但过高的车道占用率会使得车道接近饱和，从而影响车辆的速度，使车辆通行变慢，车速降低。由图4 可以看出，18%的车道占用率为一个分界点，在车道占用率小于18%时，车辆的速度越高，通过规定路段的时间越短，则车道占用率越低；当车道占用率超过18%时，两者开始相互限制，即较高的车道占用率造成交通拥堵从而使通行的车辆速度降低，行驶过慢的车辆在车道占用时间较长，从而提高了车道占用率。在车辆通行时，多种突发因素会干扰车流，导致车辆速度降低以及车道占用率发生变化。

图4 车道占用率与车辆速度的关系Fig.4 Relationship between lane occupancy and vehicle speed

车道占用率在一定程度上可以和车流量进行相互替代，单位时间内通过的车辆越多，车流量越大，车道占用率就越高，然而这种变化关系并不是线性的，较高的车道占用率使道路变得拥挤，从而使得单位时间内通行的车辆数下降。从图5 可以看出，车道占用率与车流量的整体趋势相同，即车流量增大，车道占用率也会随之提高，但是一旦车道占用率超过25%，车道占用率提高车流量却呈现下降趋势，说明在车道占用率超过25%阈值时，当前道路开始拥堵，车辆在当前车道停留的时间较长，车道占用率提高，从而使得单位时间内通过当前车道的车辆数量降低。

图5 车道占用率与车流量的关系Fig.5 Relationship between lane occupancy and traffic flow

2 预测模型

2.1 模型架构

如图6 所示，本文车道占用率预测模型主要分为3 个部分，即2 个多组件融合（Multi-Component Fusion，MCF）模块和末尾的输出部分。MCF 模块由时空块、车流量、车辆速度以及记录权重的邻接矩阵组成，这一部分将在下文中详细描述。在该模型中，输入序列Oh=［ot-h，ot-h+1，ot-h+2，‧‧‧，ot-1］，经过特征提取得到输出序列O′h=［ot，ot+1，ot+2，‧‧‧，ot+p］，即未来t～t+p时间段内当前道路的车道占用率，具体计算公式如下：

图6 车道占用率预测模型架构Fig.6 Lane occupancy prediction model architecture

2.2 多组件融合模块

图7 所示为MCF 模块架构，其主要由2 个时间卷积块（Temporal_conv）和1 个空间卷积块（Spatial_conv）相间组合构成。将历史时间的车道占用率序列作为输入，经过时间卷积块提取数据的底层时序特征，然后经过提取空间特征的卷积，在该过程中加入经过处理得到的权重邻接矩阵，随后加入车流量和车辆速度的影响，对以上提取到的特征进行融合，接着再经过提取时序特征的时间卷积块进行卷积，得到最终输出。在空间卷积块中，为将结构化数据进行泛化，将谱框架引入模型中，在谱域中应用图卷积，利用切比雪夫趋近将时间复杂度降至线性；时间卷积块中利用空洞卷积能更广泛地捕捉节点附近邻近节点的特征。MCF 模块能够同时融合时间和空间特征，从而处理映射到路网图结构上的时间序列。

图7 MCF 模块结构Fig.7 MCF module structure

MCF 模块的求解步骤具体如下：

输入包含历史时间车道占用率的交通信息Oh=［ot-h，ot-h+1，ot-h+2，‧‧‧，ot-1］

输出预测的未来时间段内车道占用率情况O′h=［ot，ot+1，ot+2，‧‧‧，ot+p］

步骤1在时间卷积块中，通过空洞卷积对输入数据进行时间特征提取，后面紧接门控线性单元进行激活。

步骤2时间卷积块主要由图卷积构成，计算路网中每一个监测点之间的欧几里得距离，得到路网的邻接矩阵W，利用时间卷积块抽取空间特征。

步骤3加入车流量和车辆速度的序列Fh=［ft-h，ft-h+1，ft-h+2，‧‧‧，ft-1］和Vh=［vt-h，vt-h+1，vt-h+2，‧‧‧，vt-1］，对已经提取的特征进行初步融合。

步骤4对序列矩阵进行第2 次卷积操作，提取时间特征，输出。

2.3 车流量和车辆速度的影响

从图7 可以看出，在模型预测的过程中加入了车辆速度Vh=［vt-h，vt-h+1，vt-h+2，‧‧‧，vt-1］和车流量Fh=［ft-h，ft-h+1，ft-h+2，‧‧‧，ft-1］的影响。其中，车辆速度和车流量都是作为一维卷积添加进所预测的矩阵，可表示为：

其中：T0b是时间层；Kb为谱图卷积核；Vb是车辆速度序列；Fb是车流量序列；ReLU 为激活函数。经过上述模块的处理，不仅能同时融合时间和空间特征，还能将车流量和车辆速度2 个隐式因素的影响加入模型中，从而处理图结构上的时间序列。

2.4 时序特征提取

在通常情况下，选择用RNN 模型对时间序列特征进行提取，但是RNN 用于交通预测时迭代比较耗时，模型复杂度较高，对于时间序列的动态变化捕捉较慢，从而导致模型时间复杂度上升。交通数据非常依赖时序变化，具有高度的非线性，因此，需要选择能够快速捕捉时间序列动态变化的模型，提高特征的提取能力。本文引入空洞卷积，其比普通卷积具有更大的感受野，可以提取节点周围更多节点的特征，从而捕获交通信息在时间序列上的动态变化特征。

本文预测模型在空洞卷积之后添加门控线性单元，可以将输入时序卷积的序列看作有Ci个通道数且长度为Q的序列卷积核被映射进S得到的输出为其中，M和N是通道数的一半，因此，卷积操作可以定义为：

其中：⊗表示哈达玛积；σ是sigmoid 门，控制当前卷积的状态。如果时序卷积堆叠，也可以在每个节点上使用这样的卷积核，进而实现时序卷积的泛化。

2.5 空间特征提取

关于交通信息空间属性的研究，大多将空间信息划分成块或网状结构，虽然这样可以捕捉交通信息的空间属性，但是过分侧重交通网络中的连通性，从而使得提取到的空间特征存在局限性。在空间特征提取部分，本文模型将交通信息映射到路网中，将交通信息转化为图信息，然后利用图卷积对路网进行操作，从而在输入的空间信息中提取有意义的空间特征，用于模型融合和预测。式（4）可被拓展为：

3 实验分析

3.1 数据集和预处理

本文实验数据集是加利福尼亚运输部公开的PeMS（Caltrans Performance Measurement System）第7 区（下面简称PeMS7（O））从2019 年1 月1 日—2 月19 日共50 天238 个监测站所观测的数据，以及PeMS 中四车道道路（下面简称PeMS7（4））从2019 年6 月1 日—7 月20 日共50 天内监测站观测到的数据。每一条数据信息包括本文模型需要的时间属性、空间信息、单位时间内的车流量、车辆平均速度、车道占用率。监测站采样的时间间隔为30 s，收集的数据是5 min 内采集的数据聚合而得的交通信息。选取40 天数据作为训练集，5 天数据作为评估数据，5 天数据作为测试集。

在数据输入模型之前先对数据进行预处理。数据中时间间隔是5 min，因此，每天24 h 就会产生288 个数据点。将这些数据进行清洗，使用线性插值法补全数据，再通过数据中记载的信息将这些数据点映射到有向图中。其中，模型中用到的记载权重的邻接矩阵计算如下：

其中，Wab是路网中边的权重；α和β是控制邻接矩阵分布和稀疏性的值，为方便计算，将α和β这2 个值分别设置为10 和0.5。

3.2 结果分析

本文在真实数据集PeMS7（O）和PeMS7（4）上进行实验，根据前面12 个时间段（每个时间段为5 min）的数据预测未来9 个时间段（45 min）的车道占用率情况。设置本文MCFDGCN 模型的时间卷积核和空间卷积核大小均为3，学习率为le-3，采用RMSProp 优化器。为了显示MCFDGCN 模型的正确性和优越性，将其与历史平均值（HA）模型、自回归移动平均（ARIMA）模型、长短期记忆网络（LSTM）、MCF（ST）（Multi Component Fusion（ST））、扩散卷积递归神经网络（DCRNN）、图多注意网络（GMAN）模型进行对比。对比模型具体如下：

1）HA 为基于历史交通数据和当前时间戳数据进行预测的模型。

2）ARIMA 将非平稳时间序列转化为平稳时间序列以进行预测。

3）LSTM 是一种解决长序列训练过程中梯度消失和梯度爆炸问题的特殊RNN。

4）MCF（ST）仅融合时间和空间特征，没有加入车辆速度和车流量2 个组件的影响。

5）DCRNN 捕获时间和空间相关性以进行预测。

6）GMAN 利用注意力机制进行预测。

本文采用平均绝对误差（Mean Absolute Error，MAE）、均方根误差（Root Mean Square Error，RMSE）、平均绝对百分误差（Mean Absolute Percentage Errors，MAPE）作为评价指标。MAE 是绝对误差的平均值，能反映预测值误差的实际情况；RMSE 是预测值与真实值偏差的平方和与预测次数比值的平方根，其衡量预测值与真实值之间的偏差；MAPE 以百分比的形式反映模型预测的准确程度，其数值越小则预测精度越高。3 种指标的计算公式分别如下：

其中：xi为真实值，为预测值。表1 和表2 所示分别为数据集PeMS7（O）和PeMS7（4）上7 种预测模型在15 min、30 min、45 min 时的指标结果。从中可以得出，在这3 个时间节点，传统的线性模型HA 预测结果最差，误差最高，LSTM 模型优于ARIMA 模型，MCF（ST）与本文MCFDGCN 模型相对对比模型准确率具有较大提升，DCRNN 和GMAN 进一步缩小了预测误差，本文MCFDGCN 模型误差值最小。

表1 PeMS7（O）数据集上各模型性能对比结果Table 1 Performance comparison results of various models on PeMS7（O）dataset

表2 PeMS7（4）数据集上各模型性能对比结果Table 2 Performance comparison results of various models on PeMS7（4）dataset

图8～图10 所示为数据集PeMS7（O）上预测步长为5 min 的模型的预测结果（彩色效果见《计算机工程》官网HTML 版，下同），该结果能够更加直观地反映模型预测误差的变化规律。

从图8～图10 可以看出：MCFDGCN 模型误差最低，不仅初始预测误差最低，并且随着时间的增加，其与传统线性模型误差的差距增大；车道占用率的预测确实受到车流量和车辆速度的影响，加入这2 个隐式影响因素，能有效减小预测误差，提高模型的预测精度。

图8 7 种模型的MAE 值对比结果Fig.8 Comparison results of MAE values of seven models

图9 7 种模型的MAPE 值对比结果Fig.9 Comparison results of MAPE values of seven models

图10 7 种模型的RMSE 值对比结果Fig.10 Comparison results of RMSE values of seven models

3.3 实验预测值与真实值

将本文模型对车道占用率的预测值和真实观测数据进行对比，结果如图11 所示。从图11 可以看出，本文模型预测值的变化趋势与真实观测值变化趋势基本一致。由于道路上会发生各种突发状况，车道占用率会瞬时升高，但随着时序变化或其他因素的影响，车道占用率又会瞬时回落，因此，模型预测结果存在误差属于正常现象。MCFDGCN 模型能在预测车道占用率变化趋势的同时实现比现有多数方法更精准的预测。

图11 PeMS7（O）数据集上预测值与真实值对比结果Fig.11 Comparison results of predicted values and real values on PeMS7（O）dataset

4 结束语

本文提出基于多组件融合与空洞图卷积的车道占用率预测模型MCFDGCN，该模型不仅考虑时空特征对车道占用率的影响，还加入车流量和车辆速度这2 个隐式因素，利用历史时间的车道占用率对未来短时间的车道占用率进行预测。实验结果表明，MCFDGCN 模型预测误差较小，与GMAN、ARIMA 等模型相比，其误差增长速度缓慢，预测精确度明显提升。MCFDGCN 模型也适用于其他交通道路的车道占用率预测，例如将车道占用率作为隐式因素引入到车流量或车辆速度的预测模型中。下一步将融合其他卷积、组件或注意力机制来简化参数，以在更长时间跨度内提高预测精度，扩大MCFDGCN 模型的适用范围。