汤肖
摘 要:动态的交通需求对于开发有效的实时交通管理和控制策略、算法至关重要。准确预测网约车需求具有一定的挑战性,但对智能交通系统的发展具有重要作用,有助于协调区域内的网约车供需,提高车辆的利用率,为乘客减少等待时间。文章提出一种时空门控多图卷积网络(Spatial-Temporal Gated Multi-Graph Convolutional Network,STGMGCN)模型,使用门控循环单元挖掘时间特征,并研究了三种不同的图卷积网络挖掘空间上的相关性。文章首先使用门控循环(GRU)单元提取研究区域的网约车的需求的时间相关性,之后构建三种不同图结构提取空间特征包括邻近关系图、功能相似性图、交互关系图并对输出结果进行融合,得到最终的预测结果;最后将该研究模型在真实网约车数据集上与基准模型进行对比实验,实验结果表明该模型的预测性能优于其他模型。
关键词:网约车需求预测;图卷积网络;门控循环单元;深度学习
中图分类号:F572.88;TP183;U492.434文献标志码:ADOI:10.13714/j.cnki.1002-3100.2023.04.027
Abstract: Dynamic traffic demand is crucial for developing effective real-time traffic management and control strategies and algorithms. Accurate ride-hailing demand forecasting is challenging but valuable for the development of intelligent transportation systems, which can help coordinate the supply and demand of online vehicles in a region, improve the utilization of vehicles, and reduce the waiting time for passengers. In this paper, we propose a Spatio-Temporal Gated Multi-Graph Convolutional Network (STGMGCN) model that uses gated recurrent units to mine temporal features and three different graph convolutional networks to mine spatial correlations. After that, three different graph structures are constructed to extract spatial features including proximity graph, functional similarity graph, and interaction graph, and the output results are fused to obtain the final prediction results. Finally, the model is compared with the benchmark model on a real online taxi dataset, and the experimental results show that the model outperforms other models.
Key words: online car-hailing demand forecasting; graph convolutional network; gated recurrent unit; deep learning
0 引 言
随着经济不断发展,网约车在人们的日常出行中担负起越来越重的责任,已经成为人们日常生活中不可缺少的一部分。短时的区域网约车需求预测可以协调网约车的供需协调指挥车辆调度,提高车辆的利用率,为乘客减少等待时间,提高车辆利用率。短期交通特征预测方法基于数据挖掘,主要分为三种:第一种是基于时间序列的统计学方法如自回归整合移动平均模型(ARIMA)[1]等,但由于这类模型是基于时间序列的稳定性假设的,它们无法捕捉交通流的突变,预测精度较低。第二种是包括支持向量机[2]、K-近邻模型(KNN)[3]等算法在内的机器学习模型,它们可以对交通流的更复杂特征进行建模,但是捕捉非线性模式的能力有限;并且随着交通大数据的不断增加,机器学习模型也不再能满足交通预测的需要了。第三种就是深度学习模型如循环神经网络模型(RNN)[4]、卷积神经网络模型(CNN)[5]、图卷积神经网络模型(GCN)[6]等。研究人员发现这类模型在更大的数据中表现效果更好。它强悍的特征表达能力和非线性拟合能力也吸引了更多的研究人员。这类模型中,人们最开始是将循环网络(RNN)用于预测交通流量,然而深入研究后研究人员发现这类模型存在梯度消失和梯度爆炸现象,这一缺陷在处理长序列数据时尤其明显,因此循环网络在学习长时间序列的非线性关系上表现得很差。面对这一难题,人们对RNN进行了改进,出现了很多RNN变体如长短期记忆神经网络(LSTM)、门控循环单元(GRU)、双向长短期记忆网络(BiLSTM)等。其中LSTM解决了RNN时间跨度大的信息学习方面的问题,并以其特殊的门控结构和在记忆长短期信息方面的出色表现受到人们的关注。林友芳等[7]基于LSTM建立出发地至目的地客运需求预测模型以预测OD之间的客运需求量,并用实例验证模型的有效性。而作为LSTM变体的GRU,因为其预测效果与LSTM同样优秀,但是它将LSTM的3个门改为了2个,大大减少了参数数量,从而加快了数据收敛的速度,受到研究人员的青睐。刘明宇等[8]利用GRU预测交通流量,并探求了预测效果最佳的GRU单元数。然而,這些基于循环神经网络的模型只能挖掘数据的时间特征,而不能挖掘其空间特征。段宗涛等[9]提出了融合CNN与LSTM的深度学习架构进行出租车需求预测, CNN捕捉流量的局部空间关系,LSTM则学习数据的临近性、周期性和趋势性变化。最后融入了天气、温度等外部条件进行相关研究。然而,CNN是基于欧几里得空间设计的,如图像和网格,它不适用于具有图结构特征的交通数据。陈丹蕾等[10]提出了GCN与GRU的组合模型以预测路网的交通流量,利用GCN拓扑复杂的城市路网结构。闫旭等[11]利用图卷积网络预测交通流量,他们定义了一个自由流可达矩阵作为虚拟的路网图,并在真实数据集上验证了其优越性。陈喜群等[12]提出了基于切比雪夫图卷积(ChebNet)和GRU的多时空图卷预测路网速度,他们使用了日序列、周序列和月序列三种不同的时间组件捕获其在历史时间上的相关性。
然而,现有的利用图卷积对时空交通数据的预测模型大多只考虑了欧氏距离,但是具有类似背景环境的远方区域网约车的需求量也有关系。基于此,本文提出时空门控多图卷积循环网(STGMGCN),以对研究区域内的网约车短时的区域级需求量进行预测。该模型采用GRU挖掘区域网约车历史需求的时间相关性,之后将GRU的输出分别输入3个具有不同图结构的图卷积进行卷积操作,最后对卷积结果进行聚合得到最终结果,并采用西安二环轨迹数据验证该模型的有效性。
1 问题定义
1.1 网络图
本文使用无向图G=(V,E,A)表示研究区域。其中,V是图的顶点集合。将研究区域按照经纬度划分为N个网格,每个网格被定义为一个区域v∈V,其中V={v1,v2,v3,v4,...,vN}∈RN。E是边的集合,A∈RN×N是图的邻接矩阵,其每个元素值代表这边的权重。
1.2 网约车需求预测
区域vi在第t个时间段网约车的订单数量为xit∈Xt,其中Xt={x1t,x2t,x3t,x4t,...,xNt}∈RN代表了该时间段所有区域的订单量。网约车需求预测就是计算映射函数f(·),利用该函数通过历史需求与区域网格图G预测第t+1时间段的网约车需求量Xt+1。那么下一时刻的网约车需求量可以表示为。
其中T是历史窗口中的时间步数。
2 STGMGCN模型
2.1 时间相关性建模
在基于深度学习方法解决时间序列预测问题中,常常选择长短期记忆(LSTM)和门控循环单元(GRU)实现预测目标。GRU 是 LSTM 的一种变体,在相同的数据集上,其预测结果与LSTM结果差距不大。但是其与LSTM相比,它将门的数量从3个减少到2个,显著地减少了参数量和计算量,收敛速度更快,因此本文选择GRU挖掘数据的时间相关性,其状态更新过程如下。
图1为GRU的内部更新过程:在更新门,第t-1时刻隐藏状态h(t-1)与第t时刻Xt分别进行线性变换(即与偏置矩阵相乘)并将两部分相加,之后加入Sigmoid激活函数得到zt∈[0,1]。重置门得到rt∈[0,1],它的计算方法与更新门一样,只是线性变化的偏置矩阵不同,功能和用法也不一致。重置门是用来控制前一时刻的状态信息的保留程度,更新门则是用来决定带入当前状态的前一时刻的隐藏状态信息量。ht-1经过线性变化后与rt计算Hadamard乘积,Xt与经线性变换后的矩阵相加,并投入双曲正切激活函数得到当前时刻的记忆内容h't。ht-1与zt的Hadamard乘积实现前一时刻的信息保存,当zt=0时不保留前一时刻的信息,只保留当前时刻自身的信息;1-zt与h't的Hadamard 实现当前时刻信息的保留,zt=1则舍弃当前信息,全数保留前一时刻的信息。将两部分相加得到当前时刻的隐藏状态ht。Wr,Wh,Wz,bh,br,b2为可学习参数。
2.2 图卷积
图卷积在交通网络上已经应用于动态最短路径规划、动态交通分配、交通拥堵分析等方面。交通邻域的图卷积网络是基于谱域上的图卷积。Bruna等[4]最早提出了这种谱图卷积。谱图卷积网络利用邻接矩阵或拉普拉斯矩阵描述图的结构。对于无向图G=(V,E,A)的对称归一化拉普拉斯矩阵为L=IN-D-1/2AD-1/2,其中D是度矩阵,当i=j时Di,j=ΣjAi,j,否则Di,j=0,IN是单位矩阵。L=UUT是对L进行特征分解得到其特征相向量U和所有特征值组成的对角矩阵。在处理规模巨大的图结构数据时,求解U和的过程复杂度很大,时间成本很高。为解决这一问题,研究人员采用 Chebyshev 多项式近似求解代替特征分解,对网络进行加速。切比雪夫图卷积方法利用了切比雪夫多项式。
其中,T(·)是阶Chebyshev多项式,即,T0(x)=1,T1(x)=x,表示Chebyshev 多项式系数,c是图信号矩阵c',表示将拉普拉斯矩阵L缩放到区间[-1,1],λmax是L的最大特征值。使用切比雪夫多项式对图卷积的卷积核进行改造就可以得到切比雪夫图卷积。
其中,表示Xl+1的輸入特征,ReLU表示激活函数 。
本文用图对三种不同类型区域之间的相关性进行建模,包括邻近关系图GD=(V,E,AD),编码欧式距离的接近性;功能相似性图GS=(V,E,AS),编码区域周围兴趣点(POI)的相似性;交互关系图GC=(V,E,AC),编码空间距离遥远但网约车流入、流出的相似性。
2.3 空间依赖性建模
2.3.1 临近关系
Toble的地理学第一定律:“毗邻区域的相关性远高于遥远区域”,这一定律可以理解为欧式距离近的两个区域之间网约车需求的相关性大于距离较远的区域。基于此,本文用网格质心之间的相对距离,体现网格之间网约车需求量的相关性,距离越小,相关性越强。具体做法如下:将任意区域的网约车需求量集中反映在几何中心处,首先算出任意两个区域 vi、vj之间的几何中心欧式距离Dij,然后用Dij与区域相邻方格的距离D0计算出网格之间的相对距离Dij/D0。由于网约车需求量与空间距离之间具有负相关性,为了表示具有不同空间距离的区域间的相互关系的强度,本文采用相对距离的倒数作为临近关系结构图的边的权重。由于空间距离太大区域间的相关性较低,设置阈值δD,因此临近关系的距离矩阵表示如下。
2.3.2 交互关系
空间相隔较远的两个区域之间的网约车流量的流入和流出也有一定关系,这种关系被称为区域之间的交互关系。两个区域之间人们出行交互的密切程度在网约车需求中体现在订单量上,且密切程度与订单量成正比。分别计算以区域vi为起点、vj为终点的订单量Svi→j和以区域vj为起点,vi为终点的订单数Svj→i,比较选择最少值构成交互矩阵NI,对其利用最小—最大规范化对其线性变换归一化。考虑到区域间订单的交互量较小时,对需求影响较小,因此设置了阈值δC,本文中归一化的交互矩阵由如下公式计算。
2.3.3 功能相似性
两个区域之间由于具有相似的功能而具有相似的网约车订单序列模式。比如,同为教育属性的两个不同的地域,它们的空间距离较远,两个区域间的订单交换量也不一定很大,但这两个区域在早晚高峰以及工作日和节假日上有着相似的订单规律。本文用兴趣点(POI)衡量区域的类别属性,如果两个区域的类别相似度较高,那么其具有一定关联性。用Pi∈RM表示区域vi的POI、M表示选取的POI属性种类。计算Pearson相关系数得到两个区域间的类别相关性,以此表示区域之间的功能相似性的强度pi,j;并设置阈值δS,低于该值则认为两个区域之间的功能不相似,因此功能相似性矩阵计算如下。
3 数据集处理
西安市二环局部区域被选为研究区域,使用滴滴出行“盖亚”数据开放计划提供的轨迹数据集进行研究,该数据集中轨迹点的采集间隔为2~4s,字段包括订车编号、司机编号、时间戳、经纬度等。本文从轨迹数据集中提取订单起讫点信息,按照订单编号提取同一订单的起终点时间戳和经纬度构成初始数据集。采样时间为2016年10月1日—2016年10月30日,共30天。对数据集以5min为间隔统计各个区域的订单量,那么整个研究时间段被划分为8 640个时间段。将研究区域划分为1km2的90个方形网格,POI数据由高德地图API得到,其中包括13种不同属性。GRU隐藏单元数为32,3 个不同图卷积的超参数完全相同的隐藏单元数为64,选用Adam优化器,学习率为0.001,关系图阈值δD=0.6、δC=0.5、δP=0.6,多项式阶数为2,历史时间序列的长度为12,预测结果为单步预测,即用前60min的网约车需求量预测未来5min网约车的需求量。 沿着时间轴将所用的数据集分为三部分:训练集(75%的样本)、控制集(15%的样本)和验证集(10%的样本)。
为了评估模型的预测性能,实际网约车需求量和预测结果之间的误差本文选均方根误差(RMSE)的平均绝对误差(MAE)来评估。
其中,M代表着数据个数,Yi代表真实网约车需求量,为模型预测结果。
实验选取了3种典型模型作为基准模型,以此与本文所提出的模型的预测结果进行对比。3种基准模型分别支持向量回归模型(SVR)、历史平均模型(HA)和门控循环单元(GRU)。实验结果如表1所示,从表1中的结果可以看出,本文的时空门控多图卷积模型在相同数据集上的预测效能高于其他3种模型。
此外为了探求空间建模所构建的三种空间图结构对模型的预测效能的影响,对于模型不同图结构方式的预测结果进行了横向对比,即分别采用单一图结构模型和双图结构与本文中的三图结构模型进行对比,在实验中除了所采用的空间结构图不同以外,其他参数均相同。预测结果如表2所示,从表2可以看出文中的具有三图结构的STGMGCN模型优于单一图结构模型和双图结构模型。
4 結 论
本文提出了时空门控多图卷积模型(STGMGCN)以对网约车需求进行区域级的短期预测。考虑到网约车需求预测的复杂时空特性,该模型利用门控循环单元挖掘历史网约车需求的时间相关性,构建了邻近关系图、功能相似图和交互关系图三种不同的空间结构图表示不同区域之间的关系,充分挖掘其空间相关性。研究最后将模型运用在实际数据集上进行实验并与其他基准模型对比,实验结果表明该模型优于其他模型;研究还对该模型在不同结构图上的表现进行横向对比,实验表明具有三种不同图结构的STGMGCN的性能比具有单一图结构和双图结构的模型性能好。因此该模型在网约车短时需求预测方面具有较为精准的预测效果。但网约车的需求量还受到天气、温度等外部因素的影响,因此在下一步的工作中需要将这些相关的外部因素加入模型中,尽可能地提升模型的预测精度。
参考文献:
[1] 韩超,宋苏,王成红.基于ARIMA模型的短时交通流实时自适应预测[J].系统仿真学报,2004(7):1530-1532+1535.
[2] 杨兆升,王媛,管青.基于支持向量机方法的短时交通流量预测方法[J].吉林大学学报(工学版),2006(6):881-884.
[3] 张晓利,贺国光,陆化普.基于K-邻域非参数回归短时交通流预测方法[J].系统工程学报,2009,24(2):178-183.
[4] 秦瑶,李勇,王世民.改进RNN的城市交通拥堵预测模型研究[J].电子世界,2018(6):45-46.
[5] 孔繁钰,周愉峰,陈纲.基于时空特征挖掘的交通流量预测方法[J].计算机科学,2019,46(7):322-326.
[6] 冯思芸,施振佺,曹阳.基于全局时空特性的城市路网交通速度预测模型[J].计算机工程,2022,48(5):112-117.
[7] 林友芳,尹康,党毅,等.基于时空LSTM的OD客运需求预测[J].北京交通大学学报,2019,43(1):114-121.
[8] 刘明宇,吴建平,王钰博,等.基于深度学习的交通流量预测[J].系统仿真学报,2018,30(11):4100-4105+4114.
[9] 段宗涛,张凯,杨云,等.基于深度CNN-LSTM-ResNet组合模型的出租车需求预测[J].交通运输系统工程与信息,2018, 18(4):215-223.
[10] 陈丹蕾,陈红,任安虎.考虑时空影响下的图卷积网络短时交通流预测[J].计算机工程与应用,2021,57(13):269-275.
[11] 闫旭,范晓亮,郑传潘,等.基于图卷积神经网络的城市交通态势预测算法[J].浙江大学学报(工学版),2020,54(6):1147- 1155.
[12] 陈喜群,周凌霄,曹震.基于图卷积网络的路网短时交通流预测研究[J].交通运输系统工程与信息,2020,20(4):49-55.