基于时空多图卷积网络的交通站点流量预测

2020-05-20 10:22武志昊刘晓辉赵苡积林友芳景一真
计算机工程 2020年5期
关键词:结点时空站点

荣 斌,武志昊,刘晓辉,赵苡积,林友芳,景一真

(1.北京交通大学 a.计算机与信息技术学院; b.交通数据分析与挖掘北京市重点实验室,北京 100044;2.中国民用航空局民航旅客服务智能化应用技术重点实验室,北京 100105)

0 概述

随着智能交通系统的快速发展,交通流量预测问题受到人们和科研机构的广泛关注,交通流量的准确预测能为智能交通系统提供信息支撑与决策支持。由于生活中存在多种交通站点,如城市地铁站、高速公路收费站和民航机场,因此站点拥堵状况与整个交通网络正常运转关系密切,如果能对站点的出入流量进行有效预测,则有利于提高交通网络的运行效率,减少安全隐患,便于旅客合理安排出行,对智能交通系统的发展具有重大意义。

近年来,大量学者针对交通流量预测问题进行相关研究,根据研究方法可将其分为三大类,分别为经典时间序列预测方法、传统机器学习方法以及深度学习方法。早期流量预测模型以经典序列预测方法为主,如历史均值法、向量自回归模型、自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model,ARIMA)[1]及其变体模型。之后,学者使用传统机器学习方法来预测交通流量,主要通过构建集成模型,如文献[2]将经验模式分解与BP神经网络相结合,文献[3]提出小波支持向量机(Wavelet-SVM),这2种模型均用于地铁站人流量预测;文献[4]将GBDT模型用于收费站的短时交通流量预测。随着深度学习在计算机视觉、语音文本处理等任务中不断取得突破[5],开始有学者将深度学习技术应用于交通流量预测任务。文献[6-7]将RNN类时序预测模型及其变体模型用于交通流量预测。文献[8]将RNN类模型与传统机器学习方法相结合进行流量预测。文献[9]将城市区域划分成等大小的网格,设计基于残差单元的ST-ResNet模型用于预测各区域的人流量。文献[10]在此基础上引入LSTM单元对模型进行改进,但此类模型只适用于网格状数据。

为解决传统卷积神经网络在图数据上的局限性,图卷积技术应运而生。文献[11]使用图卷积与门控卷积捕捉高速公路上各路段车速的时空依赖性。文献[12]认为捕获空间特征的图结构是随着实际路况动态变化的,从而基于动态图卷积思想对文献[11]方法进行改进。文献[13]通过建模待预测流量与近期流量、日周期流量以及周周期流量之间的关系,并采用时空注意力机制捕获结点交通流量之间的时空相关性。文献[14]利用多图卷积网络预测共享单车的租赁流量。还有学者将图卷积应用于其他时空数据挖掘任务,如文献[15]结合城市设施与信息点(Point of Information,POI)将城市区域作为结点构建多张图,提出STMGCN模型预测短期内各区域的出租车需求量。

交通站点流量受地理位置、时间、交通状况等多种因素影响,具有复杂的非线性。对于不同站点,低阶相邻站点之间与高阶相邻站点之间的交通状况均会互相影响;对于相同站点,历史交通状况与未来交通状况密切相关,因此准确地预测站点出入流量需要充分考虑站点之间的时空相关性,而现有模型在解决该问题时均存在一些不足:如经典序列预测方法主要通过从交通流量序列中挖掘出时间维度上的规律进行预测,一般要求时间序列具有一定的周期性或规律性,因此预测效果不理想;常用的传统机器学习方法[2-3]与RNN类时序预测模型[6-7]仅考虑了序列的时间维特征,未考虑流量序列之间的空间相关性;STGCN[11]在捕获空间特征之前,未考虑其他历史周期片段与预测时段的相关性,并在模型中对时间维进行逐步降维,导致时空特征表示不充分;ASTGCN[13]只考虑了结点间的低阶相邻关系,难以直接捕获高阶相邻结点之间的空间关系,且忽略了不同历史周期片段之间的相关性;STMGCN[15]难以充分捕获不同时间区间结点之间的时空关系,对于长期预测,结点的时空特征学习能力不足。

本文从空间维度与时间维度两个角度出发,提出一种基于上下文门控的时空多图卷积网络(Contextual Gated Spatio-Temporal Multi-Graph Convolutional Network,CG-STMGCN)模型,其能够基于站点间的相邻关系与流通流量关系捕获站点流量之间的时空相关性。

1 问题定义与准备工作

1.1 问题定义

定义5(连续出入网络记录组) 二元组Tio(Tk,Tk+1)表示某个体连续进出一次网络产生的记录组,其中,Tk.κ=in,Tk+1.κ=out,Tk.p=Tk+1.p,Tk.τ

定义6(站点出入流量)t=[tstart,tend)表示某个时间区间,Δt=tstart-tend表示区间长度,则在时间区间t内,站点v上产生的进出流量分别为:

(1)

(2)

(3)

1.2 图卷积

目前,实现图卷积的主要方法为:1)将结点重新组合排列成网格形状,再使用传统卷积进行处理[16],属于空间类方法;2)谱图卷积,即在谱域对图信号进行卷积操作[17]。本文使用谱图卷积实现图卷积。

(4)

(5)

2 模型架构

本文提出的CG-STMGCN模型架构如图1所示。首先,根据站点之间的不同关系构造邻居图与流通流量图。然后,分别在邻居图与流通流量图上构建时空卷积组件,两个组件架构相同,均由多个基于上下文门控的时空卷积模块串行组成。之后,通过全连接层将最后一个时空卷积模块的输出映射为待预测时段的流量值,最终使用哈达玛乘积将两张邻居图上的预测结果进行融合作为最终的预测结果。为优化学习效率,本文在每个基于上下文门控的时空模块中使用残差学习框架。

图1 CG-STMGCN模型架构

(6)

其中,Th=Tr+Td+Tw。模型输入拼接示意图如图2所示。

图2 模型输入拼接示意图

2.1 多图构造

在现实生活中,当某个交通站点的出入口出现拥堵时,人们可能会选择该交通站点附近的站点出行,因此相邻站点的流量之间存在相关性。在整个交通网络中,各结点流出流量的源头来自其他若干个站点的流入流量,因此有流通流量的站点之间存在流量依赖性。为分别捕获相邻站点之间的邻近相关性与流量依赖性,本文分别构造邻居图与流通流量图。

2.1.1 邻居图

(7)

2.1.2 流通流量图

(8)

(9)

(10)

(11)

(12)

(13)

(14)

其中,avg(Ftf)表示在时间区间tf内站点之间的平均流通流量,式(13)为归一化操作,AF,ij∈[0,1]。

2.2 基于上下文门控的时空卷积模块

本文在每张图上构建多个基于上下文门控的时空卷积模块用于捕获站点流量的时空特征。由于模型输入中包含待预测时段不同周期的时间区间观测值,因此本文首先使用上下文门控单元建模各个时间区间对待预测时段的重要程度,然后使用图卷积单元分别捕获站点流量之间的相关性与依赖性,此时各结点的特征中已经包含对应图上相邻结点的信息,最后使用时间维的卷积单元在时间维度进行卷积,从而有效捕获站点流量的时空特征。

2.2.1 上下文门控单元

本文使用若干个历史区间观测值预测未来若干个时间区间的流量值,直观上不同时间区间的观测值对待预测时段的影响程度不同。受通道注意力机制[19-20]与STMGCN模型[15]的启发,首先,本文使用上下文门控单元来建模历史观测值中各时间区间观测值对待预测时段的重要程度。

(15)

t=1,2,…,Ti

(16)

s=σ(W2δ(W1z))

(17)

其中,W1与W2是参数矩阵,σ表示激活函数ReLU,δ表示激活函数sigmoid。

2.2.2 图卷积单元

2.2.3 时间维卷积单元

经过上下文门控单元与图卷积单元后,每个结点的特征信息中已经包含对应图上相邻结点的特征信息,因此使用时间维卷积单元不仅能提取各结点在时间维度上的特征信息,而且能融合其他关联结点的特征信息,并且由于模型将待预测时段的近期片段、日周期片段、周周期片段按照时间顺序进行拼接,时间维卷积单元能够获取到不同周期片段之间的相关性。因此,时间维卷积单元能有效获取站点流量的时空特征。一个结点的时间维卷积示意图如图3所示。

图3 时间维卷积示意图

(18)

2.3 时空多图卷积融合

(19)

其中,⊙表示哈达玛乘积,WN与WF为待学习的参数张量。

3 实验结果与分析

3.1 数据集

本文在两个交通站点出入流量数据集上对模型进行实验。第一个数据集是杭州市地铁网络80个地铁站在2019年1月1日至2019年1月26日的出入人流量数据,使用前一周的数据构造流通流量图,将2019年1月1日至2019年1月20日的数据作为训练集,2019年1月21日至2019年1月23日的数据作为验证集,2019年1月24日至2019年1月26日的数据作为测试集。第二个交通站点数据是某地区高速公路网络426个收费站在2018年6月30日至2018年8月27日的出入车流量数据。本文使用前一周的数据构造流通流量图,将2018年6月30日至2018年8月15日的数据作为验证集,2018年8月16日至2018年8月21日的数据作为验证集,2018年8月22日至2018年8月27日的数据作为测试集。

3.2 对比方法与评价指标

本文将CG-STMGCN模型与8种预测方法的实验结果进行比较,具体为:1)历史相邻均值法(HA);2)历史周期均值法(PreHA),即将待预测时段的前n天相同时间段的均值作为预测值;3)ARIMA模型;4)长短期记忆网络(LSTM)模型;5)门控循环单元网络(GRU)模型;6)STGCN模型[11];7)STMGCN模型[15];8)ASTGCN模型[13]。

本文采用均方根误差(Root Mean Square Error,RMSE)与平均绝对误差(Mean Absolute Error,MAE)作为实验结果的评价指标,计算方法如式(20)、式(21)所示:

(20)

(21)

其中,xi表示实际值,x′i表示预测值,n表示预测值的个数。

3.3 实验参数与结果分析

在计算站点出入流量时,对地铁站数据集的时间区间长度取5 min,高速公路收费站数据集的时间区间长度取10 min。本文使用MXNet实现CG-STMGCN模型,在上下文门控单元中图卷积对应的K′取2,对图卷积层中对应的K取1、2、3,最佳实验结果对应K=2,图卷积层中的卷积核个数取64,时间维的二维卷积核大小取3。在训练过程中,初始学习率取1e-3,训练轮次为100,使用验证集早停策略避免过拟合,批次大小取32,优化器选择Adam。本文分别选取待预测时段的3个近期片段、1个日周期片段以及1个周周期片段在时间维度上按照时间先后顺序进行拼接并将其作为模型输入,预测步长取12,实验结果如表1所示。

表1 交通站点流量预测实验结果

Table 1 Experimental results of flow prediction for traffic stations

方法与模型地铁站数据集高速公路收费站数据集RMSEMAERMSEMAEHA方法44.5221.0019.8810.29PreHA方法38.6617.6415.577.90ARIMA模型45.4219.0918.378.85LSTM模型32.8418.3418.358.72GRU模型30.5716.5316.347.09STGCN模型25.1012.6112.046.27STMGCN模型22.0611.3910.395.56ASTGCN模型20.8010.8110.135.37CG-STMGCN模型19.3010.049.365.15

由表1可知,本文CG-STMGCN模型在RMSE与MAE这两种评价指标上较其他方法均取得了最优效果,深度学习类方法较传统时间序列预测方法普遍能够取得更好的预测效果,考虑时空相关性的深度学习模型比仅考虑时间维度相关性的深度学习模型能取得更好的预测效果。

另外,本文针对不同的预测步长,分别使用以上方法进行实验,实验结果如图4、图5所示。可以看出,当预测步长较短时,CG-STMGCN模型能取得良好的预测效果,虽然STMGCN模型在短期预测时也能取得不错的预测效果,但是随着预测步长的增加,预测难度越来越大,STMGCN模型与其他方法的预测误差开始呈现上升趋势,但是CG-STMGCN模型的预测误差较其他方法上升更加缓慢,且仍能取得最好的预测准确性,证明了CG-STMGCN模型的有效性与稳定性。

图4 交通站点流量预测方法在地铁站数据集上的实验结果

Fig.4 Experimental results of flow prediction methods for traffic stations on subway stations dataset

图5 交通站点流量预测方法在高速公路收费站数据集上的实验结果

本文将已有的单图时空卷积模型进行扩展,分别在邻居图与流通流量图上构建单图时空卷积模型,使用哈达玛乘积将两张图上的输出结果进行融合,将ASTGCN扩展为ASTGCN-MG,STGCN扩展为STGCN-MG,并在地铁站数据集上分别取预测步长为3、6、9、12进行实验,结果如表2所示。由实验结果可知,ASTGCN-MG模型的预测效果优于ASTGCN模型,STGCN-MG模型模型的预测准确性优于STGCN模型,证明了多图的有效性。由于CG-STMGCN模型结合站点上下文注意力机制对多周期时间区间的重要程度进行建模,然后进行图卷积与时间维卷积,能够充分捕获站点流量的时空特征,因此取得了最好的预测效果。

表2 基于时空多图卷积网络模型的交通站点流量预测实验结果

Table 2 Experimental results of flow prediction for traffic stations based on spatio-temporal multi-graph convolutional network model

模型预测步长为3预测步长为6预测步长为9预测步长为12RMSEMAERMSEMAERMSEMAERMSEMAESTGCN模型20.1910.4821.8411.2023.4311.8925.1012.61STGCN-MG模型19.8310.2721.1010.8022.0811.2623.0011.71ASTGCN模型19.6310.2820.0510.3820.6710.6720.8010.81ASTGCN-MG模型19.3310.0619.9410.2520.1210.5520.3810.63CG-STMGCN模型18.349.6119.319.9919.5210.2419.3010.04

4 结束语

本文针对交通站点流量预测问题提出一种基于上下文门控的时空多图卷积网络(CG-STMGCN)模型。根据站点流量间存在的两种空间关系,分别构造邻居图与流通流量图用于表示站点流量之间的相关性与依赖性,使用上下文门控单元、图卷积单元与时间维的标准卷积单元捕获交通站点流量的时空特征,解决了现有交通站点流量预测方法时空特征捕获不足的问题,并在两种真实数据集上进行实验,结果证明了该模型具有良好的预测效果。后续将通过增加卷积动态图来优化CG-STMGCN模型架构,进一步提升预测能力并扩大其应用范围。

猜你喜欢
结点时空站点
跨越时空的相遇
LEACH 算法应用于矿井无线通信的路由算法研究
基于八数码问题的搜索算法的研究
镜中的时空穿梭
基于Web站点的SQL注入分析与防范
玩一次时空大“穿越”
积极开展远程教育示范站点评比活动
首届欧洲自行车共享站点协商会召开
怕被人认出
时空之门