基于GCN-BiLSTM的短时交通流预测模型

2023-11-13 07:08陈德旺陈云飞
关键词:交通流路网卷积

张 阳 胡 月 陈德旺 陈云飞

(福建工程学院交通运输学院1) 福州 350118) (福州大学计算机与大数据学院2) 福州 350118) (福建工程学院电子电气与物理学院3) 福州 350118)

0 引 言

道路交通流的变化是一个实时性、非线性及非平稳性的随机过程.采样间隔时间越短,交通流变化的随机性和不确定性越强,越难以准确分析其变化规律[1].

目前,城市道路的短时交通流预测方法包括传统方法和机器学习方法.传统方法主要利用时间序列预测短时交通流,如卡尔曼滤波模型(KF)、自回归移动平均(ARIMA)模型、多元线性回归模型等.Kumar等[2]将短期交通流预测与季节性ARIMA模型相结合,并通过有限的数据来使用ARIMA模型预测交通流.Kumar等[3]提出了一种只需有限的数据即可进行交通流量预测的方法,即基于卡尔曼滤波模型来解决依赖大量数据进行开发的不足.

常用的机器学习模型通过自适应学习不断调整自身参数来捕捉复杂的非线性关系,如支持向量回归(SVR)、K近邻(KNN)等.虽然这些模型可以解决传统方法性能差的问题,但追求高精度容易导致模型训练时间成本大、数据样本要求过高[4].李林超等[5]提出一种基于核函数切换的预测方法,根据不同时刻的核函数的SVR模型在处理交通流时的差异性,在不同时刻选择最合适的核函数进行短时交通流量预测.Cai 等[6]在考虑道路网络时空关联性的前提下,提出使用高斯加权方法,来增强KNN模型的预测精度.

深度学习是近年来机器学习领域中的主要研究方向,包括循环神经网络(recurrent neural networks,RNN)、长短时记忆网络(long short-term memory,LSTM)等深度学习模型.这些模型虽然能有效地学习交通流序列的长期相关性以及捕捉复杂的时间特征,但对于交通路网的空间性这一特性鲜有考虑,因此难以解决路网间的交通流预测问题.Bruna等[7]提出使用图卷积网络(graph convolutional network,GCN)来解决道路网络空间相关性问题,通过利用图形结构信息提取道路网络拓扑结构,再处理图结构中的不规则数据来实现交通预测.Xie 等[8]提出了一种新的基于RNN-GCN和BRB的交通流预测方法.Wu等[9]用GCN提取交通数据中的拓扑结构特征,使用LSTM结构提取时间特征,结合ResNet优化整体模型,减少网络退化中梯度消失或爆炸的发生,最终实现交通流预测.张阳等[10]利用长短时记忆神经元提取时间关联性,并利用卷积传输提取空间关联性,从而对交通流进行预测.

由于现有的交通预测模型很少从路网的角度考虑,只是单纯的从单一道路的角度考虑,没有将路网拓扑结构融入预测模型中,预测精度有待提高.文中在以往预测模型的基础上,通过提取道路路网拓扑结构,考虑路网路段交通状态和交通流时空相关性,以此来实现短时交通流预测,并以实例验证了模型的预测精度.

1 基于GCN-BiLSTM的短时交通流预测模型

1.1 图卷积神经网络

交通流预测的准确度得益于邻近交通信息和时间信息的使用[11].用图卷积网络可以通过捕捉交通数据空间相关性来预测路网交通流,进而提高交通流预测的精度.

假设有一批N个节点的图数据,构成N*D矩阵X,然后节点间形成N*N矩阵A,车流特征矩阵X和邻接矩阵A为图卷积模型的输入,中间层和中间层之间的传播模式为

(1)

图1 图卷积神经网络结构图

(2)

(3)

式中:Aij为节点i和节点j之间的连接关系.

1.2 长短时记忆神经网络

在LSTM体系结构中,遗忘门、输入门和输出门这三种特殊的结构赋予了其处理短期和长期时间序列内相关性的能力[12].遗忘门丢弃原单元状态中的信息,输入门存储来自外部状态的信息用来更新单元状态,输出门得到所有结果,计算并生成LSTM结构的输出.

遗忘门取xt和ht-1作为输入信息,利用sigmoid激活函数丢弃信息,为

ft=σ(Wf[ht-1,xt]+bf)

(4)

it=σ(Wt[ht-1,xt]+bi)

(5)

(6)

(7)

结合当前记忆Ct和长期记忆Ct-1,形成新的细胞状态Ct.

输出门产生ht的最终输出.整个过程分为两个阶段,为

ot=σ(Wo[ht-1,xt]+bo)

(8)

ht=ot×tanh(Ct)

(9)

式中:tanh函数为双曲正切激活函数;σ为Sigmoid函数;Wf,Wt,Wo,Wc为遗忘门、输入门、输出门和记忆单元的权重系数矩阵;bf,bt,bo,bc分别为遗忘门、输入门、输出门和记忆单元的偏置条件.

1.3 GCN-BiLSTM模型

本文使用双向LSTM模型来提取交通流数据的时间周期特征.双向LSTM的组成是由前向LSTM和反向LSTM叠加,从当前节点的正向和反向两个角度分析交通数据的时间周期性,它不仅可以捕获未来数据的信息特征,而且可以捕获过去数据的信息特征.所以在发现重复出现的交通模式,以及在处理数据时比单向LSTM效果更好.使预测结果更加准确.双向LSTM网络结构见图2.

图2 双向LSTM网络结构图

定义G=(V,E)为交通道路网络的拓扑结构.每条道路都被视为一个节点,V为一组道路节点,E为边集,邻接矩阵A为道路之间的连接,特征矩阵X为网络中节点的属性.因此,交通流预测的时空问题可以看作是路网拓扑结构G和特征X通过一系列变换得到的映射函数f(本文中f表示GCN-BiLSTM模型).即:

Xt=f(G;(Xt-n,…,Xt))

(10)

GCN-BiLSTM模型由图卷积神经网络和双向长短时记忆网络这两部分组成.本次研究将长度为n的时间序列数据输入模型,利用GCN结构解析道路网络监测流量的拓扑结构,提取交通流量的空间特征;将具备空间特征的时间序列数据输入BiLSTM中来学习时间特征,通过线性回归层得到预测数据,见图3.

图3 GCN-BiLSTM模型体系

1.4 基于GCN-BiLSTM的短时交通流预测实现步骤

本文利用地感线圈、浮动车等采集的交通流量、速度等数据,实现基于GCN-BiLSTM的短时交通流预测.该方法主要实现步骤如下.

步骤1采集预测目标路段的历史交通流流量和速度等数据,路网区域内其他路段与目标路段之间的距离以及路网区域内其他路段的历史交通流流量和速度数据.并对采集的数据进行分析和预处理.

步骤2设定GCN模型的结构和参数,将数据集转换成拓扑图结构的形式,作为GCN模型的数据输入.设定BiLSTM模型的参数,确立输入层、隐含层和输出层等网络结构.

步骤3构建基于GCN-BiLSTM的短时交通流预测模型,设置卷积层、池化层、全连接层等显隐层结构,各层神经元利用LSTM模型构建,初步设定显隐层节点数、隐层层数等参数指标.

步骤4选取预测区域内路段的交通流量数据作为训练集和测试集.利用训练集训练短时交通流预测模型,再用测试集测试训练好的模型.

步骤5将预测结果和真实值进行分析,检查预测精度是否达到预期目标,如达到则输出预测结果,若未达标则返回步骤2,对模型结构参数指标进行重置,直至精度达标.

2 实验结果及分析

2.1 数据描述与评价指标

本次实验研究范围为福州市晋安区,道路网络由福新路、福新中路、五一北路、五一中路、国货西路、国货东路、连江北路、福马路和古田路等道路构成,具有图结构的区域相关性图见图4.本实验以福马路某断面为预测对象,研究范围内的其他道路为区域内的空间相关道路.

图4 研究对象路网结构示意图

实验随机采集福马路2019年11月4—18日共14 d的交通流时间序列数据,以5 min为时间步长,每天可划分为288个时间段,共有4 032个数据样本.考虑到周一至周五工作日的交通特性与周末的交通特性有一定的差异,分别对工作日和周末的不同时间段进行交通预测,全面验证算法性能.故选取前14 d中的工作日和周末这两个时间段为两个训练样本集.

2.2 性能指标

为了定量分析 GCN-BiLSTM模型性能,引入三种常用的性能指标来比较流量预测模型.

均方根误差(RMSE):

(11)

平均绝对误差(MAE):

(12)

平均绝对百分比误差(MAPE):

(13)

2.3 GCN-BiLSTM预测性能与算法性能比较

将本文提出的GCN-BiLSTM与其他算法的短时预测效果进行比较,利用性能指标对预测结构进行评估.预测结果见图5和表1~2.

表1 GCN-BiLSTM模型和其他基准模型在工作日预测结果对比

表2 GCN-BiLSTM模型和其他基准模型在周末预测结果对比

图5 工作日及周末预测结果对比

将GCN-BiLSTM模型的预测性能与以下2个基准模型进行比较:①DCRNN 扩散卷积递归神经网络,提出交通流建模为向上的扩散卷积,将交通流的空间和时间结合起来,预测未来时刻的交通数据.②T-GCN 时间图卷积网络,该模型通过使用GCN和GRU相结合的方法来同时捕捉空间和时间的依赖关系,进行交通速度预测.

本文提出的短时交通流预测算法的主要参数设置如下:使用AdamOptimizer自动优化,设置初始学习率为0.001,设置批量大小为32,设置训练次数为1 000.图卷积核设为2.

当GCN图卷积层数设置为2,BiLSTM层数设置为4时,模型的预测效果最好.选择两个图的卷积层,加上四个BiLSTM和一个全连接层的组合模型进行预测.交通流数据具有一定的周期性和规律性,周末与工作日的交通流所表现的数据特性差异性较大.分别对工作日和周末进行交通流预测,将1 h设置为一个时间周期,使用过去1 h的历史数据来预测后15 min的交通流数据,并与测试集中的真实值进行比较.

由图5和表1~2可知:本文提出的GCN-BiLSTM模型在工作日和周末预测效果均优于其他两种经典的预测算法.相较于DCRNN,工作日与周末RMSE指标分别少了12.24%和13.20%,MAE指标少了9.31%和9.39%,MAPE指标减少了3.81%和5.96%.由实验结果表明,GCN-BiLSTM在捕获时空相关性方面效果更好.将GCN-BiLSTM和T-GCN这个预测模型进行比较,GCN-BiLSTM和T-GCN这两个模型都利用了图卷积的方法从交通数据中提取空间相关性特征.相较于T-GCN,对于工作日与周末的预测结果,其中RMSE指标分别减少了5.87%和2.68%.MAE指标分别减少了5.32%和5.50%.MAPE指标分别减少了0.57%和5.07%.在数据集上的15 min交通流预测任务中,GCN-BiLSTM的预测准确率高于T-GCN.该实验结果表明了GCN-BiLSTM模型在挖掘交通信息的时空相关性特征方面具有优势.

3 结 束 语

本文提出了一种基于GCN-BiLSTM的城市道路网络预测交通流模型.该模型通过建立观测点邻接矩阵,利用GCN和BiLSTM分别捕捉道路交通流数据的时间特征和空间特征.结果表明:GCN-BiLSTM组合模型具有较高的预测精度,预测的交通流数据相比与另外两个模型与真实交通流数据保持了较高的一致性,是一种实用的短时交通流预测模型.后续研究将考虑天气、事故等外部因素对交通流量的影响,进一步提高模型的预测精度.

猜你喜欢
交通流路网卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
打着“飞的”去上班 城市空中交通路网还有多远
基于傅里叶域卷积表示的目标跟踪算法
省际路网联动机制的锦囊妙计
首都路网 不堪其重——2016年重大节假日高速公路免通期的北京路网运行状况
路网标志该如何指路?
交通流随机行为的研究进展
路内停车对交通流延误影响的定量分析
具有负压力的Aw-Rascle交通流的Riemann问题