融合多相关收费站数据的高速公路交通流预测

2024-03-22 07:56张阳姚芳钰杨书敏
中外公路 2024年1期
关键词:交通流收费站残差

张阳,姚芳钰,杨书敏

(1.福建理工大学 交通运输学院,福建 福州 350118;2.同济大学 交通运输工程学院,上海市 201804)

0 引言

以中国大循环为主体的新发展格局对于推动中国高质量发展具有重大而深远的意义。在中国大循环的带动和支持下,城市群间经济社会的联系日益紧密。高速公路是联系城市群区域间的走廊和纽带,紧密的经济联系导致交通需求飞速增长,高速公路拥堵问题日益严峻。为缓解高速公路收费站拥堵问题及对制定合理的高速公路控制和诱导策略提供基础和支撑,同时兼顾外部因素的影响,需寻找交通流时空变化规律,准确预测高速公路收费站流量。

传统的交通流预测方法多集中于交通流数据时间序列变化规律的研究,经典模型有差分自回归移动 平 均 模 型[1](Autoregressive Integrated Moving Average Model,ARIMA)、卡尔曼滤波器[2]等,传统方法处理非线性数据能力较弱,对原始数据质量要求较高,在数据有缺失的情况下效果更不佳,也难以实现实时预测。受流量采集设备的误差和流量变化的非线性特征等因素的约束,这类方法在实际试验中精度往往无法达到要求。

深度学习的迅猛发展引起越来越多的学者关注,并将其运用至交通流预测领域。其中具有代表性的长短期记忆网络[3](Long Short-Term Memory,LSTM)和 门 控 循 环 单 元[4](Gated Recurrent Unit,GRU),不仅能够较好地寻找交通流的时间变化规律,同时也能有效解决梯度消失和梯度爆炸的问题。GRU 与LSTM 效果相似,因操作简单,GRU 更适合构建大型模型[5]。然而,这两种经典模型对数据的空间关联性不够敏感,在交通流预测领域中更多地侧重寻找数据间的时间关联性,遗漏了空间关联性,制约了预测精度的进一步提升。学者们发现卷积神经网络(Convolutional Neural Networks,CNN)能很好地对空间信息进行提取[6-7],但是CNN 通常运用于欧几里得网络中,而高速公路网络的结构通常都是非欧网络,将其视为矩阵并用CNN 进行预测,不考虑网络拓扑信息,将无法对一些细微数据和信息进行充分提取,最终影响预测效果。

针对这一问题,众多学者对高速公路收费站的车流量预测进行了研究。Wang 等[8]分别使用支持向量机(Support Vector Machine,SVM)和K 最邻近(K-Nearest Neighbor,KNN)对高速公路出口收费站进行预测,但其只考虑了时间特性,没有对周围收费站的影响进行衡量,准确性受到很大程度的限制;Han 等[9]使用CNN 和LSTM 的结合网络,使用CNN提取高速公路交通流空间信息,因道路网络的非欧性,运用中将产生误差;Jin 等[10]提出改进图卷积网络(Graph Convolutional Networks,GCN),对高速公路出口收费站的流量进行预测,运用图注意网络能更准确地描述非欧空间,但其只对周围相邻的节点进行考虑,而难以对远处交通流数据的影响进行量化。然而由于城市群的经济联系日益紧密,区域间多相关收费站的交通数据间也存在一定的内在关联性,准确寻找该规律并有效结合交通流数据的时间变化规律对提升高速公路交通流预测的精度有积极作用。由于受诸多不确定性的影响,该关联性难以捕捉和量化,如何对相关收费站间关联级别进行分类和量化,如何在提取多相关收费站内在关联性的基础上有效融合数据间的时间规律还亟待解决。

为了解决相关收费站影响难以量化的问题,本文提出一种基于ATGCN-ResGRU 算法的组合深度学习高速公路交通流预测模型。 首先,通过Attention 机制对范围内的收费站分配权重,量化其对目标收费站的影响程度,并据此构建包含不同注意度的3 个高速公路网络拓扑图,分别使用GCN 在高速公路路网中提取空间信息后,加权获得空间相关性预测;同时,使用GRU 模块,实现对过往高速公路收费站交通流数据的时间相关性提取,为了进一步提升其对时间数据的学习能力,通过残差网络将两个GRU 模块连接;最后,通过特征融合和全连接层,对时空数据进行融合,输出最终预测结果,以期能得到较好的预测结果。

1 ATGCN-ResGRU 组合深度学习预测模型

收费站是进出高速公路的重要节点,也是车辆在高速公路上运行的起讫点。一个被预测的目标收费站同时和多个其他起讫点收费站间因经济社会联系而相关联,其交通流量间有一定的关联规律。为了准确捕捉、分类和量化多相关收费站间流量的关联性,本文构建一种基于ATGCN-ResGRU 算法的组合深度学习预测模型,该模型由两类学习模型组合而成,分别提取高速公路收费站交通流的空间和时间变化规律。由于多相关收费站与预测目标收费站间的交通流空间关联性强弱有差异,本文提出一种新的ATGCN 关联空间信息提取模型,利用注意力机制对相关收费站的关联度进行分类,并将其融合进GCN 网络实现多相关收费站间流量的关联性的捕捉和量化。同时,将两个GRU 网络通过残差连接,组成ResGRU 模型提取交通流在预测目标收费站上的时间变化规律。最后,使用特征融合层和全连接层将预测信息结合输出。ATGCN- ResGRU 组合深度学习预测模型结构示意图如图1 所示。

1.1 一种新的ATGCN 关联空间信息提取模型

考虑到注意力机制(Attention)提取和分类信息重要性的能力较强,而GCN 具有较强的空间信息提取能力,本文将注意力机制融合进GCN 算法中,提出一种ATGCN 关联空间信息提取算法,利用注意力机制计算多相关收费站节点的注意度,再将节点根据注意度量化值划分成高注意度、中注意度和低注意度3个层次,并分别构建拓扑网络图运用GCN 提取各层次空间关联信息,对不同层次的计算结果进行加权,获得空间预测结果。ATGCN 模型示意图如图2所示。

图2 ATGCN 模型示意图Figure 2 ATGCN model

多相关收费站节点的注意度计算公式如下:

式中:b为偏移值;Wn为权重;Xn为第n个节点的交通流数据。

为计算每一个节点的交通流数据对目标节点影响度所占比例的大小,同时消除负数对结果造成的影响,利用指数函数的非负性提取所占注意度,并最终输出注意度结果。

式中:αn为通过注意力机制后计算所得的权重。

计算注意度后,根据各个节点的权重值不同,将各个节点分为高注意度、中注意度和低注意度,再将节点回归至道路拓扑网络中。因高速公路具有路段全封闭性质,故将非本拓扑图节点视作连通,由此形成3 个拓扑图,分别为Ms,Mm,Ml,代表对节点交通流不同注意度影响的交通网络。3 个拓扑图仍然为非欧氏空间数据,GCN 网络处理非欧氏空间数据相互关系能力较强,因此采用GCN 网络对提取不同层次注意度间的空间联系。

ATGCN 在卷积过程中使用3×3 的滤波器,每一节点都将与周围一阶邻节点产生关联,中心节点由相邻一阶邻节点数据取均值获得。ATGCN 神经网络层中,层与层之间的传递公式如下:

式中:I为单位矩阵;D~ 为A~ 的度矩阵;σ为非线性激活函数;H为每一层的特征;W为参数矩阵。

节点交通流受不同注意度拓扑图的影响不同,故在分别进行图卷积神经网络的运算之后,也需要根据其注意度的不同,将多重图卷积的输出结果进行加权融合,以获得最后的空间关联信息。将各个节点分为高、中、低3 种注意度网络的依据是在Attention 机制中权重的计算,因此在加权融合计算中,将各个注意度网络中,除目标节点外的各个节点的权重值求平均值,作为加权融合的权重。权重与预测所提取的特征则通过哈达玛积进行计算,后逐个相加。计算公式如下:

式中:◦为哈达玛计算;wi为每个图卷积网络对应的权重;wiGn为第i个图卷积网络中第n个节点的对应权重。

1.2 基于ResGRU 残差网络的时间信息提取模型

为使模型同时拥有时间规律扑捉学习能力,本文通过残差块连接的GRU 模块,使用恒等映射,将较深层次的网络映射至浅层,形成一个更深层次的网络,有效提取交通流中的时间信息。本文所构建的ResGRU 网络由两个GRU 模块通过残差网络连接而成,该模型结构示意图如图3 所示。

图3 ResGRU 模型示意图Figure 3 ResGRU model

GRU 是循环神经网络中的一种经典模型,为解决RNN 梯度消失和梯度爆炸的问题而生。同时更充分地学习时间信息,本文提出ResGRU 时间序列学习模型,该模型用残差块连接两个GRU 模块,并通过恒等映射构造网络,克服因深度高过平滑的问题。运用残差块将两个GRU 模块连接时,残差块连接公式如下:

式中:Xl+1为残差块的输出;Xl为残差块的输入。

ResGRU 包含有输入层、隐藏层和输出层。其中,隐藏层中含有其核心算法,包括更新门和重置门,均对上一层操作。更新门选取相关度高的时间数据并添加,重置门用于选取相关度低的时间数据并剔除,由此对数据进行筛选,保证所传递信息均为预测所用的时间关联相关信息,再通过残差块将两个GRU 模块连接。ResGRU 单元计算公式如下:

式中:Rt为重置门;Zt为更新门;H~t为候选隐藏状态;Ht为隐状态;σ为Sigmoid 激活函数;Wij为各个门、输入值、隐藏层之间的对应权重参数;b为各个门及隐藏层的偏移量;X为输入量;Ht-1指上一层隐藏层的输入数据。

1.3 ATGCN-ResGRU 交通流预测模型实现步骤

本文选取广东省浔峰洲收费站作为预测目标,对目标收费站及范围内相关的高速公路收费站车流数据进行收集,并且对收费站所在地区的城市人口、人均GDP、产业结构等与出行相关的因素进行采集,同时对所在地区的相关政策进行收集,作为未来交通量变化的相关因素。先对所取得的数据进行预处理,剔除噪声数据,以此为输入,使用过去1 h 的信息对未来15 min 交通流进行预测。其预测步骤如下:

步骤1:采集高速公路交通流数据样本,包括目标节点及研究范围内各个高速公路收费站的数据,采集时间为1 个月。同时需要对各个节点之间与目标节点间的距离进行采集。对数据进行预处理,将数据根据不同日期进行分类,从不同类别中各自选定训练集和预测集;对数据进行清洗和集成,剔除噪声数据,最后将所得车流量数据按5 min 聚合,并使用模型预测所需格式保存。

步骤2:将选定范围内各个节点的交通数据输入至Attention 机制中,根据公式(1)~(3)计算结果分别选出高、中、低3 种注意度节点,再回归拓扑网络中,使用GCN 进行预测,计算公式如式(4)~(5),最后根据公式(6)将其融合,以学习范围内交通流的空间相关性。

步骤3:构建ResGRU 网络,先将目标节点的历史交通流信息输入至GRU 网络中,根据公式(8)~(11)进行计算,再根据公式(7)将其映射至低层网络中,再根据公式(8)~(11),对历史信息进行学习,充分提取时间相关性。

步骤4:将步骤2 和步骤3 中的预测结果进行特征融合,结合有关交通流预测的不同信息,获得时间特征和空间特征,将其分别输入至特征融合层,形成特征向量。再输入至全连接层,使之前所提取的特征综合,并将学习结果用以预测交通流。融合时间和空间特征后将其输出。

步骤5:利用训练集对预测模型进行测试,并对各个参数进行调整,提高预测精度。

步骤6:将真实值与预测结果比较并计算相关指标,若预测精度达到预期目标则输出结果,若未达到预期目标则返回步骤2,调整各个参数后重新进行学习,直至精度达到预期效果。

2 实例分析

2.1 试验数据说明

本次试验范围为广东省广州市内高速公路路网,研究范围内道路有广深高速、机场高速、广清公路、广佛江珠高速,范围内高速公路收费站有浔峰洲收费站、黄岐收费站、沙贝收费站、广清收费站等。本试验以浔峰洲收费站作为试验对象,研究其与周围高速公路收费站和周围高速公路路网的关系。研究范围内的道路网示意图如图4 所示。

图4 研究对象范围内路网示意图Figure 4 Road network within research area

将高速公路收费站的ETC 收费数据及人工收费数据相结合,获得高速公路收费站出口车流量信息。经过数据分析和预处理,得到9 月1 日到10 月15 日的数据,共45 d,将其作为试验数据,工作日28 d,其中节假日17 d,样本采集时间间隔为15 min。考虑高速公路交通流在工作日和节假日存在一定差异性,故本文对工作日和节假日分别进行训练,结合收费站流量和道路空间信息对两个模型分别进行训练。将10 月14 日(工作日)和10 月15 日(节假日)的数据作为测试集,其余作为训练集,测试算法的性能。

2.2 模型评价指标

为客观评价本文所提算法对高速公路交通流预测的准确性,选取平均绝对误差[11](Mean Absolute Error,EMAE)、均方根误差[12](Root Mean Square Error,ERMSE)、最 大 相 对 熵[13](Max Relative Entropy,EMRE)几个指标评估本文所述模型性能。

式中:Yyeat(t)为在t时刻的交通流量实际值,Ypred(t)为在t时刻的本文模型预测值;N为样本数量。

2.3 评估ATGCN 模型对预测性能的影响

为评估本文所提的ATGCN 关联空间信息提取模型对高速公路交通流预测性能的影响,使用ATGCN模型和ResGRU 模型组合网络(以下简称ATGCNResGRU)与传统GCN 模型和ResGRU 模型的组合网络(以下简称GCN-ResGRU)对交通流进行预测,并通过2.2 所选指标对二者的预测结果进行比较。

本文中所有网络模型由tensorflow 构建,使用SGDM 作为模型优化器以调整参数,设置模型迭代的学习率设置为0.01,每个模型设置迭代50 次,迭代20 次后,每5 次迭代学习率降低5%。GCN 卷积核大小为3×3。使用训练集和过去1 h 的交通流信息,对未来15 min 的交通流信息进行预测。

因高速公路交通流在节假日和工作日的特征差别较大,故本次试验分别对工作日和节假日进行预测,并与真实值进行比较。在节假日和工作日中,ATGCN-ResGRU 模型的性能都比GCN-ResGRU模型更优,比较结果如图5、6 所示,具体指标如表1所示。

表1 预测结果对比Table 1 Comparison of prediction results

图5 工作日预测结果对比Figure 5 Comparison of prediction results on weekdays

图6 节假日预测结果对比Figure 6 Comparison of prediction results on holidays

2.4 与经典算法的性能比较

将本文提出的ATGCN-ResGRU 模型与其他经典模型比较,以证明本文模型的预测有效性。本文选用经典深度学习模型及其改进模型,多元集成CNN-LSTM[14]、CNN-BiLSTM[15]、DL-SVR[16],分别对节假日和工作日车流量数据进行预测,根据2.2 所选指标进行比较。试验证明:本文所提算法与经典模型相比预测精度有所提升。比较结果如图7、8 所示,具体指标如表2 所示。

表2 预测结果对比Table 2 Comparison of prediction results

图7 工作日预测结果对比Figure 7 Comparison of prediction results on weekdays

图8 节假日预测结果对比Figure 8 Comparison of prediction results on holidays

根据图7、8 和表2 比较可以得出:本文所提出的ATGCN-ResGRU 模型,不仅深度提取交通流数据的时间关联信息,更通过注意力机制和GCN 网络的结合,对区域内不同影响程度的收费站进行划分并加以预测,多元集成CNN-LSTM 模型和CNN-BiLSTM模型虽然都对空间关联性进行考虑,但所使用的CNN 模型都对道路网络的信息提取不够准确,因此无法准确提取道路信息,CNN-BiLSTM 模型使用双向长短时模型,增加了对前序时间信息的提取,精度有了一定提升,但二者对非相邻收费站的影响考虑不足,无法准确估计和度量其对交通流的影响,而最终导致预测精度不佳的情况。DL-SVR 模型则因处理非线性数据效果不佳的原因,使得预测结果与真实值相差甚远。无论在节假日还是工作日中,本文所提出的ATGCN-ResGRU 算法都具有良好的预测精度,证明不论训练样本大小,本文所提模型精度均优于经典模型。

3 结语

本文构建一种组合式深度学习高速公路交通流预测模型,着重考虑研究范围内多相关收费站对交通流预测产生的影响,在模型中,提高时间关联度预测的层次以获得更优效果,通过Attention 机制划分不同注意度以获得不同距离的收费站间的关联度,增强了模型对交通流时间和空间信息的学习。试验结果证明:本文所提出的预测方法,与传统预测方法相比,准确度上有所提升,可以有效对高速公路车流量进行预测,为高速公路的控制决策提供基础数据,同时有效缓解高速公路拥堵情况,具有一定的实际作用。

猜你喜欢
交通流收费站残差
江苏20个高速收费站实施“准自由流”改造
浙江首个“云收费站”投用
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
基于Spark的高速收费站大数据系统的设计与实现
一种收费站排队模型的模拟实现
交通流随机行为的研究进展
路内停车对交通流延误影响的定量分析
平稳自相关过程的残差累积和控制图