曾 诚,吴佳媛,罗 霞
(西南交通大学 交通运输与物流学院,四川 成都 611756)
随着城市轨道交通网络的健全,客流强度逐渐攀升,掌握未来短期内客流动态变化趋势尤为重要。一方面能给出行者提供实时有效的信息,有利于交通方式与路径的选择,实现客流诱导;另一方面有助于指导运营单位及时调整运输方案,精准匹配运能,做好大客流预警应急工作,提高出行体验与安全性。
城市轨道交通短时客流预测相关研究从2010年起步[1-2],10年内国内外相关文献100余篇,且超过60%为近3年发表,呈现出爆炸式增长的趋势。
考虑到城市轨道交通短时客流预测的研究对象、指标选取、模型算法及预测效果的多样性,一直以来没有经过较为系统的梳理与总结,导致许多概念不明晰,研究方法缺乏横向比较,不利于新进学者的研究和该领域的发展。因此,研究针对城市轨道交通短时客流,从研究对象分类、影响因素、组合预测模型等角度展开文献综述研究。
城市轨道交通是以电能为动力、采取轮轨运转方式的快速大运量公共交通的总称,包括地铁、轻轨、有轨电车、跨座式单轨、磁浮列车和城际列车等。
2019年我国城市轨道交通全年累计完成客运量约237.1亿人次,相比2018年增长26.4亿人次[3]。截至2020年末,我国大陆地区拥有地铁城市45座,城市轨道交通运营线路244条,线路总长7 969.7 km。2020年全国重点城市城市轨道交通数据如表1所示。
表1 2020年全国重点城市城市轨道交通数据Tab.1 Urban rail transit data of key cities in China in 2020
城市轨道交通短时客流预测即未来5 ~ 15 min的客流量预测,多以历史AFC数据为基础,以地铁为研究对象。
短时客流也常被称为“实时客流”[4-6],两者虽然都没有明确的定义,但前者一般指粒度为5 ~ 15 min的客流,后者专指粒度为5 min的客流。研究认为“短时客流”相比“实时客流”表述更为准确,建议采用前者。考虑到AFC数据的采集、传输和预测模型运算过程,想要真正达到“实时”,预测粒度的提升空间与必要性都很小。“实时客流”与“短时客流”文献比较如图1所示。
图1 “实时客流”与“短时客流”文献比较Fig.1 Comparison between papers on “real-time” and “short-term”passenger flow
从客流属性分析,城市轨道交通短时客流预测可以分为4类,包括短时进站客流预测、短时出站客流预测、短时OD客流预测和短时客流分布预测。短时换乘客流、站内客流、断面客流等都可以归纳为短时客流分布研究的范畴。城市轨道交通短时客流预测分类如图2所示。
图2 城市轨道交通短时客流预测分类Fig.2 Classification of short-term passenger flow forecast of urban rail transit
城市轨道交通可以看作一个部分信息确定、部分信息不确定的灰色系统,城市轨道交通灰色系统示意图如图3所示。该系统具备确定的网络节点与路径,但未来的输入和输出未知,客流在网络上的路径未知。
图3 城市轨道交通灰色系统示意图Fig.3 Diagram of urban rail transit as a gray system
(1)短时进站客流预测。进站客流应交通需求而生,短时进站客流预测的目的在于掌握乘客数量的变化情况,协助运营部门制定调度方案、优化车辆发车间隔、保持运输供需平衡。短时出站客流、OD客流、客流分布的预测效果也很大程度上依赖于进站客流的预测精度。短时进站客流的特点是易受外界干扰、波动性大、时空特征明显、难预测、应用价值高,受到轨道交通运营部门的广泛关注,因而其研究频率也最高。
(2)短时出站客流预测。出站客流是城市轨道交通对外输出的人流量,其特征是波动性大,未来到站乘客人数难预测,具体数值取决于全网进站人数、OD分布、列车到站时刻等。出站客流未得到地铁等运营部门的重视,但从更高层面来看,短时出站客流预测具有以下重要意义。①有助于在突发大客流的情况下做好客流预警、客流控制和应急疏散等举措,特别是在大型活动举办期间。该研究也能提高城市轨道交通常态化管理下的安全保障力度。②有助于合理调度周围其他交通方式与交通设施,提高交通接驳效率。③有利于深入分析该车站的客流来源,研究客流的OD结构。
(3)短时OD客流预测。城市轨道交通网络中存在许多由2个车站构成的OD对,短时OD客流即为2个特定站点之间的单向客流,其研究意义在于:①是城市轨道交通系统线网客流动态分配的基础;②是城市轨道交通系统动态运输组织策略制定的重要依据;③为乘客出行提供实时的参考信息;④是客流管控的数据基础。短时OD客流一定层面上反映的是D点周围兴趣点(Point of Interest,POI)的吸引度变化,特别是在轨道交通站点的商业性质、住宅性质、娱乐性质较为明显时。短时OD客流的预测思路有2种:一是基于历史OD量进行预测,这种方法采用的模型与短时进站客流预测无异;二是考虑进站客流量的大小和客流分配比例,这种方法需要以短时进站客流预测为基础,容易因为误差的传递导致预测精度不佳。
(4)短时客流分布预测。如图3中黑色部分所示,由于换乘站的存在,OD对之间可能存在多条路径。短时客流分布的预测可以分为2步。①在短时OD客流预测的基础上,将OD客流量分配到不同路径上。分配比例的确定通常采用优化后的Logit模型,这一步称为“客流分配”或“路径分配”,其研究结果对于城市轨道交通清分系统设计也具有重要意义(清分是指根据客流量将运营收益合理分配给各条线路)。②精细化客流分配,进一步将客流分配到车站、站台与列车上。这项研究难度较大,目前还处于起步阶段。其难点在于对乘客“行为模式”的学习:一是由于客观拥挤程度和主观习惯的不同引起的步行时间不同;二是由于面临拥挤车辆的上车选择不同,乘客存在一定的滞留概率。短时客流分布预测属于城市轨道交通的前沿课题,但也有一些学者取得了研究成果,如徐瑞华、胡志赛、周玮腾等[5-7]。
研究将影响因素分为“纵向因素”和“横向因素”2类:纵向因素是从时间序列的角度来看,轨道交通短时客流预测会受自身历史值的影响;横向因素是从回归分析的角度来看,信令数据和天气等外部因素会影响未来客流的变化。
由于客流历史数据能反映未来客流趋势,时间序列模型被广泛应用于客流预测。严格来讲,“客流历史数据”又分为2类:一是预测点前若干时段的客流数据;二是以往同一时间段的客流数据。由于城市轨道交通短时客流的随机性高、波动大,因而一般采用第1种“客流历史数据”作为影响因素。而历史数据对未来数据的影响也并非完全稳定,其相关性强弱受到时间粒度和客流强度的影响。通常情况下,时间粒度越小、客流强度越大、客流越平稳,则短时客流与前一段时间客流的正相关性越强。李若怡[8]在研究短时OD客流预测的过程中,对OD客流量与预测点前若干时段客流量的Pearson相关系数进行计算,当前OD量与历史OD量的Pearson相关系数如表2所示。
表2 当前OD量与历史OD量的Pearson相关系数Tab.2 Pearson correlation coefficient between current and historical OD passenger flow
研究对“前5 min客流量”的Pearson相关性进行补充,发现不同OD对所计算出的相关系数在0.48至0.75之间,而进站客流预测与历史数据的相关性分析如图4所示。
图4 进站客流预测与历史数据的相关性分析Fig.4 Correlation analysis of inbound passenger flow and historical data
综上所述,历史数据对城市轨道交通客流预测有显著影响。这种效应在短时客流预测中更加明显(时间粒度为5 min或15 min),并且客流越是保持高强度输入,预测客流与历史客流的相关性越强,如春熙路站和天府广场站等。
手机信令数据或定位数据可以反映站点周围的人口流动情况,进而研判出进站客流的变化或站点的吸引度。目前手机数据在短时客流预测领域的应用较少,现有研究成果总结如下。
倪嘉琦[9]利用AFC数据和电信用户信令数据设计实现了一套短时客流预测系统,但没有介绍信令数据的应用过程。随着信令数据的初步开放,对信令数据的理解、处理与应用成为前沿问题。胡永恺[10]将信令数据应用于乘客出行行为研究,详细阐述信令数据的产生机理与处理步骤,最终计算出短时进出站客流、换乘客流和断面客流,验证了信令数据在客流预警和客流诱导中的辅助决策作用,受到广泛参考与引用,同时该研究也是目前少有的不考虑AFC数据的短时客流预测研究。此外,李若怡[8]、丁敬安[11]等分别将信令数据用于城市轨道交通短时OD客流预测和路径分配研究,但效果都不十分理想。
信令数据应用研究不足,基于定位数据的客流预测更是零基础,究其原因如下。①作为运营商的宝贵数据资源,手机信令数据或定位数据一般需要通过机构购买获得。通过爬虫获取的定位数据受到时空和精度的限制,也无法应用于短时客流预测。②手机信令数据或定位数据均处于“被瓜分”格局,前者由电信、移动、联通3大运营商所有,后者由腾讯科技有限公司、高德软件公司、百度在线网络技术有限公司持有,因而几乎不可能获得所有用户的数据。③即便运营商愿意提供部分数据,也不能满足短时客流预测的时效性要求。
多指标、高采样率的天气数据可以通过爬虫或申请获取,因而一些学者将天气作为影响因素进行短时客流预测研究[12-13]。但是,天气对客流的影响并不稳定:极端恶劣天气对地铁客流的影响较大,如雨雪天气、雾霾天气、极寒极热天气等,而其他天气状况对乘客出行或交通方式的影响几乎可以忽略不计。其次,天气突变需对短时客流影响较大,否则很难引起客流明显波动,且天气对于不同出行目的的城市轨道交通乘客影响效果也不同,如通勤旅客对天气不敏感,旅游性质的乘客对天气较为敏感,因而周末和节假日的天气数据参考性更强。
研究建议在天气变量前引入一个0-1变量kt
式中:t表示时刻。
以文艺活动、商业演出、体育赛事、展览展销为代表的短时性大型活动,无疑会对城市轨道交通短时客流产生显著影响。但目前没有将大型活动作为影响因素的短时客流预测研究,原因在于面对大型活动产生的突发大客流,人工获取活动信息(时间与规模)并制定应对方案是目前最可行有效的手段。
学者们更加倾向于将大型活动作为研究场景来预测短时进出站客流[14-16]或制定运输组织方案[17-18]。
从预测模型的分类来看,城市轨道交通短时客流预测分为以时间序列为主的线性模型和以神经网络为主的非线性模型,而目前广泛采用的是“组合预测”的建模理念。组合预测模型由Bates和Granger在1969年提出[19],其将不同模型的预测结果进行组合,产生残差互补效果以提高预测精度。其中,最常用的组合方式是求平均值,常见模型有ARIMA-BP模型等,研究将其称为“传统”组合预测模型。传统组合预测模型在道路交通流的短时预测中应用较多,误差水平在5%左右[20-21]。传统组合预测模型的残差互补效应难以在理论上给予证明,导致最佳组合权重没有确定依据,进而使得“广义”组合预测模型逐渐得到运用。研究将广义组合预测模型分为3类,分别为模型优化类、分解重组类、误差修正类。组合预测模型的分类如图5所示。
图5 组合预测模型的分类Fig.5 Classification of combined forecast models
(1)模型优化类:通过模型A对模型B的参数、结构进行优化设计。这一类的组合模型应用最为广泛,其中模型A一般为启发式优化算法,模型B为神经网络类预测模型。常见组合有PSOBP模 型、GA-BP模 型、PSOWNN模型等。采用这种组合形式的初衷一般是经典神经网络预测模型存在一些缺陷,如在求解过程中遇到求解时间过长、学习能力不足、易陷入局部最优等问题时。此类模型的优点在于自适应能力较强,往往是根据样本特征生成合适的初始解或初始参数,让机器学习过程中的迭代次数更少、寻优能力更佳。此外,优化算法也可以替代梯度下降算法作为模型A的新优化器。
(2)分解重组类:通过模型A对序列进行分解,再通过模型B对各分量分别预测,最后重构形成预测结果。该类模型主要基于经验模态分解理论,模型很好地提升了小波分析和时间序列分解 (Seasonal and Trend decomposition using Loess,STL)的分解性能与实用性。机器学习算法可以通过依次预测各分量的方法,增强模型对时间序列的理解能力和预测精度。序列分解模型演进过程如图6所示。
图6 序列分解模型演进过程Fig.6 Evolution process of the sequence decomposition model
(3)误差修正类:利用模型A初步预测,通过模型B对残差进行预测并校正。该类模型比较小众,其不直接预测研究对象的取值,而是学习预测误差产生的模式。模型A一般为时间序列模型,且模型B常采用极限学习机算法(Extreme Learning Machine,ELM)。
误差修正类模型很难确定误差大小的影响因素,因而仅有少数模型的误差具备较强的可预测性,不建议采用。无论是非线性模型还是组合预测模型,都涉及机器学习领域,其中以神经网络类的模型居多。城市轨道交通短时客流预测模型总结如表3所示。
表3 城市轨道交通短时客流预测模型总结Tab.3 Summary of the short-term passenger flow forecast model for urban rail transit
(1)短时客流预测的模型应紧跟机器学习研究进展,尤其是近2年来得到广泛关注与应用的注意力机制,具体算法如深度残差收缩网络[32]、Transformer[33]、基于注意力机制的LSTM改进模型[34]等。而目前最常用的传统LSTM网络模型实则存在一定缺陷或局限性[35]。
(2)轨道交通短时客流预测的平均绝对百分比误差(MAPE)一般在10%~35%之间,变化幅度较大的原因是研究对象不同,未来希望有权威机构能够公开并统一数据集,在同一数据环境下更利于模型的比较与提升。
(3)以往研究的对象多为进站客流,针对短时OD客流、换乘客流和出站客流的较少。此外,短时客流预测如何辅助决策也有待深入探讨,如运输方案动态调整、交通资源调度、大客流预警、客流控制与诱导等。
(4)无论是手机数据、天气数据,还是大型活动,都是围绕着地铁周围环境选取特征,未来短时客流预测可以借鉴“态势感知”理论,建立地铁站周围环境态势的评价体系,综合考量其影响效应。例如,考虑轨道交通站点周围私家车、公交车、网约车、共享单车的运转情况等,并作为特征进行机器学习。
(5)AFC数据是短时客流预测的核心基础,但以往只利用了其中的时间和站点信息,缺乏对持卡类型的利用。以火车站附近地铁为例,单程票和一卡通的持票比例很大程度上能反映外地乘客与本地乘客的占比,可以更好地反映该站的OD结构。
随着智能交通技术的发展,精确的短时客流预测能力不仅能提升城市轨道交通的安全系数与智能化管理水平,同时可以改善乘客的旅行体验和运输效率。研究通过对城市轨道交通短时客流预测研究的综述,明确了部分概念与分类标准,对影响因素进行了应用层面的分析,并横向对比了各类组合预测模型的特点与应用情况,期望有助于轨道交通短时客流预测研究方向的学者整理思路,提出更好的预测方法。