刘晓磊 段征宇† 余庆 毛孝鑫 马忠政
(1.同济大学 道路与交通工程教育部重点实验室,上海 201804;2.同济大学 CAD研究中心,上海 201804; 3.上海申通地铁集团有限公司,上海 201102)
城市轨道交通具有运量大、准时、环保等优势,已成为解决城市交通问题的重要交通方式。随着城市轨道交通建设进程加快及成网运营,城市轨道交通客流量快速增长,客流时空分布失衡现象时有发生,上海地铁2018年的日均客流量为1 016.5万乘次[1],工作日高峰时段部分断面客流饱和度常达130%[2],一旦出现运营异常,会迅速波及整个轨道网络,造成严重的经济损失及安全隐患。因此,准确、合理的进行城市轨道交通网络客流分布预测,可为管理者掌握线网客流状态演化、制定站点客流组织策略、调整列车运行组织方案提供依据,同时也能使乘客掌握轨道线网的拥挤程度,合理选择出行时间和出行路径。
目前,客流预测模型主要分为参数模型和非参数模型两大类。参数模型计算快速、模型简洁、所需数据量少,如历史平均模型、时间序列模型[3]、线性回归模型和卡尔曼滤波模型[4]等。但参数模型是以选定函数形式的方式来学习,通常只能应对简单的问题,难以反映数据的非线性、不确定性特征。非参数模型能够凭借自身学习能力和自适应能力对非线性规律进行有效捕捉,可以有效解决以上问题,常见的非参数模型有:支持向量回归[5]、贝叶斯网络模型[6]和神经网络模型[7- 8]等。
近年来,基于神经网络的客流预测或交通流预测方法受到众多学者的关注。循环神经网络及其变体长短期记忆网络[9- 10]和门控循环单元在预测中取得了良好的效果[11]。但这些模型只考虑了时间特征,忽略了空间特征。为表征空间特征,许多学者引入卷积神经网络[12- 13],卷积神经网络适用于具有欧几里德结构的数据,如图像、栅格等,但对于具有复杂的拓扑结构的轨道交通网络仍有一定的局限性。图卷积网络[14]则可以有效捕捉网络的拓扑结构,为考虑网络特征的轨道交通客流预测带来可能。本研究组合图卷积网络和循环神经网络实现对大规模城市轨道客流的预测,同时考虑其他因素对客流的影响,并通过随机森林方法进行影响因素特征选择。
图卷积网络GCN是卷积神经网络CNN在图领域的拓展,可以从图数据中提取特征从而进行节点分类、图分类、边预测等。图由若干节点和连接两个节点的边组成,节点所具有的特征构成了特征矩阵X,不同节点相互连通的边的特征构成了特征矩阵A。图卷积网络能够考虑节点之间的结构关联性,实现对图结构的结构信息和节点属性信息同时学习,通过考虑图节点及节点的一阶邻域的谱卷积实现捕捉图的空间特征,层与层之间的传播方式可以表示为[15]
(1)
城市轨道交通网络是具有非欧几里德结构的复杂拓扑网络,该网络上下游断面的客流量相互影响,本文在进行客流预测时,将上下游断面客流量的关联关系考虑在内,通过图卷积网络学习城市轨道交通网络的拓扑关系和断面的属性特征,实现捕捉空间特征。
循环神经网络在处理时间序列数据方面有着广泛应用,但传统的循环神经网络具有梯度消失和梯度爆炸的缺陷,无法解决长时依赖问题。由此,循环神经网络的变体长短期记忆模型(LSTM)及门控循环单元(GRU)出现,两者原理相似,预测效果相近,但GRU比LSTM少一个门控,参数更少,训练速度更快,过拟合风险低。
zt=σ(Wz[ht-1,Xt])
(2)
rt=σ(Wr[ht-1,Xt])
(3)
(4)
(5)
GRU将前一时刻的隐藏状态及当前的客流信息作为输入,来预测当前时刻的客流状态。根据其原理可知GRU在预测时保留了历史数据的变化趋势特征,可以实现捕捉客流数据的时间特征。
本文中考虑了城市轨道交通网络中不同断面间客流的相互影响,并以断面为节点,断面与断面之间的关联关系为边构造图结构G,G=(V,E),其中,V={v1,v2,…,vN}表示断面节点集合,E为边集合[14]。邻接矩阵A表示断面之间的连接关系,A∈RN×N,矩阵中的元素表示断面之间是否连接,如果连接,表示为1,否则为0。网络节点的属性特征用特征矩阵X∈RN×P表示,P表示节点属性特征的数目,包括历史时间序列的长度和其他特征等。
组合图卷积网络和循环神经网络构建深度学习模型,实现通过城市轨道交通m个历史断面客流状态来预测未来某一时段t的状态,模型结构见图1。首先将邻接矩阵A和特征矩阵X输入到GCGRU模型中,通过图卷积网络(GCN)学习断面之间的关联关系,得到边的权重特征值,经过激活函数后进入门控循环单元(GRU)学习不同断面的时间序列规律特征,加入激活函数提高神经网络对模型的表达能力。在提取到城市轨道交通网络客流的空间特征和时间特征后,通过全连接层实现预测任务,得到N个包含时空特征的输出状态ht,即{h1_t,h2_t,…,hN_t}。GCGRU的具体计算过程如下:Gc表示图卷积过程。
zt=σ(Wz[ht-1,Gc(A,Xt)])
(6)
rt=σ(Wr[ht-1,Gc(A,Xt)])
(7)
(8)
(9)
图1 组合图卷积网络和循环神经网络模型结构
文中旨在实现对大规模城市轨道交通网络的客流预测,以上海市地铁网络客流预测为例展开研究。数据来源于上海地铁2019年不同轨道线的上行断面客流,2019年共有16条线路正常运行,运行时间基本为5:00~24:00。经过数据处理,得到上海市地铁网络共计408个断面,每个断面全年共6 935个客流值。
2.2.1 影响因素分析
地铁客流变化受多种因素的影响,文中考虑不同因素对客流量的影响,并将具有相关性且影响显著的因素纳入特征集中。
月份:客流量在不同的月份展现出不同特征,见图2,12月客流量最少,2月客流量其次,而4月、8月、10月的客流量较多。
图2 客流量按月份分布
星期:选取日常连续两周的客流量进行可视化,如图3所示,可以看出,周一至周五客流量较高,周六客流量大幅降低,周日客流量最小。
图3 客流量周变化趋势
时段:选取工作日与非工作日两个特征日,分别绘制某断面的客流时变图,见图4(a)及图4(b),
(a)工作日
(b)非工作日
在工作日客流量呈现3个高峰,分别在9:00、13:00、18:00左右。客流量在早高峰时段最集中,晚高峰时段其次;在非工作日,客流量较低,且整体呈现出一个峰值。
工作日:将所有节假日及不被调休的周末视为非工作日,其余视为工作日,绘制工作日与非工作日客流量的箱型图,如图5(a)所示,工作日客流量分布更集中,非工作日客流量分布表现为分散,两者日均客流量均值相当。
节假日:探究法定节假日对客流量的影响,绘制箱型图,如图5(b)所示,节假日客流分布更分散,非节假日客流量分布更集中,非节假日日均客流大于节假日日均客流量。
(a)非工作日与工作日
(b)非节假日与节假日
2.2.2 特征选择
采用随机森林的平均不纯度减少方法进行特征重要度计算。平均不纯度减少表示每个特征对误差的平均减少程度,在随机森林中,决策树每次分裂都是针对一个可以使误差最小化的特征。通过计算特定变量使得误差减少的情况得到该特征贡献程度,即特征重要程度。特征重要度排序如图6所示。
通过图6可知,在以上分析的6个因素中,时段特征最重要,其次重要的因素是月份、星期、工作日和节假日。工作日和节假日重要度评分均较低,非工作日特征中包含了节假日部分,且不同节假日对客流量影响程度不一样,因此,这里删掉节假日这一特征,保留其余4个特征。
图6 特征重要度排序
将数据集按照8:2的比例划分训练集和测试集。目前上海城市轨道交通以小时为单位调整运行图,因此,文中采用1天的客流历史数据实现对未来1 h客流量的预测,预测结果可识别最大客流断面,为运营管理者调整运行图提供参考依据。由此,设定模型输入的历史时间窗口为19 h,加入时间、月份、星期及工作日4个特征,输入的属性特征为23个,用以预测未来1小时的客流量。
使用Adam优化器和均方误差训练模型,模型在多次调参对比试验后,最终确定的参数设置为:学习率0.001,迭代次数5 000;批量64。
指标1 均方根误差R
(10)
指标2 平均绝对误差M
(11)
指标3 准确率A
(12)
指标4 判定系数r2
(13)
R和M用于衡量预测误差,值越小代表预测效果越好;A用于衡量预测精度,值越大代表预测效果越好;r2用于衡量预测能力,值越大代表预测能力越好。
模型在训练过程中,测试集的损失函数值及模型准确率变化如图7、图8所示,可以看出,模型收敛速度较快,损失函数收敛值最终小于100,模型准确率接近90%。
图7 损失函数值变化
图8 模型准确率
将预测结果进行可视化分析,如图9所示,可看出GCGRU预测的客流结果与实际客流变化趋势基本一致,证明GCGRU能够很好的捕捉上海地铁全网的拓扑结构及客流量的变化规律,预测效果较好。
图9 断面客流预测可视化结果
测试集中一周内不同天的预测结果比较见图10(a),周一至周五预测精度相近,预测准确率达90%以上;周末的预测误差较大;周末居民出行更易受到是否调休、天气好坏、是否有大型活动等因素的影响。对比工作日和非工作日预测结果精度,如图10(b)所示,工作日预测准确率达到91%,而非工作日预测准确率为87%,非工作日居民出行需求弹性较大,是否节假日、天气好坏、是否有大型活动等会影响居民的出行需求。
(a)周一至周日
(b)工作日与非工作日
为评价GCGRU模型的预测结果,选取历史平均模型(HA)、移动平均自回归模型(ARIMA)、循环神经网络(LSTM、GRU)及卷积循环神经网络(CNGRU)来进行对比。历史平均法和移动平均自回归模型是传统的时间序列预测模型。历史平均法是根据历史时间序列,逐项推移,依次计算包含一定项数的序时平均数来进行预测的方法;移动平均自回归模型是在将非平稳时间序列转化为平稳时间序列的过程中,将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归,建立模型来进行预测的方法。循环神经网络变体能够捕捉时间特征,被广泛地应用于时间序列预测中,其原理见1.2节。卷积循环神经网络为神经网络组合模型,是新兴的用于时间序列预测的模型。CNGRU模型通过组合卷积神经网络CNN与循环神经网络变体GRU实现预测,CNN实现特征提取,保留有用信息并传输给GRU,GRU接收上层传输的信息并学习时间序列的特征进而实现预测。
通过表1可以看出,神经网络模型的预测精度高于参数模型HA和ARIMA,说明传统的时间序列预测模型对于非线性变化的客流数据的拟合能力较差,具有局限性。LSTM与GRU的预测效果较好且近似,说明LSTM和GRU能够学习到客流时间变化规律。与GRU相比,组合模型CNGRU和GCGRU预测精度进一步提升,RMSE预测误差分别降低了15.25%、35.37%,精度分别提高了3.00%、6.95%。图卷积循环神经网络模型GCGRU的预测效果最好,预测准确率达到89.38%。证明GCGRU能够同时捕捉城市轨道交通网络的空间拓扑特征和客流状态变化的时间特征,具有良好的时空预测能力。
表1 预测结果比较
文中组合图卷积网络和循环神经网络构建深度学习模型实现对大规模城市轨道交通网络的客流量预测,将断面客流视为图结构中节点的属性,断面间的联系视为边的属性,利用图卷积捕捉网络的拓扑结构从而得到空间特征,利用门控循环单元捕捉客流序列的变化规律从而得到时间特征。利用上海地铁一年的客流数据进行研究,应用随机森林提供的不纯度减少方法进行影响因素特征选择,预测结果表明,组合模型GCGRU的预测精度明显优于传统时间序列预测模型HA、ARIMA,循环神经网络变体LSTM、GRU,以及神经网络组合模型CNGRU,说明GCGRU能够同时捕捉城市轨道客流的空间依赖性和时间依赖性,预测效果较好。全网客流预测结果可识别最大客流断面,为管理者调整列车运行组织方案、制定应急管控措施提供依据,同时也为出行者提供轨道线网客流拥挤预警信息,从而合理选择出行时间及路径。