基于历史数据的轨道交通站内客流预测模型

2023-01-11 13:26沈永发刘辉冉房志明
关键词:进站客流站点

沈永发,郑 煜,刘辉冉,房志明,张 俊

(1.上海理工大学 管理学院,上海 200093;2.中国科学技术大学 火灾科学国家重点实验室,安徽 合肥 230026)

作为公共交通的一种,轨道交通因其准时、高效等特点备受欢迎,已成为我国大、中型城市最主要的出行方式。依据中国轨道交通协会发布的《城市轨道交通2021年度统计和分析报告》,截至2021年底,我国大陆地区共有50个城市开通城市轨道交通,总里程达到9 206.8 km,在建线路总长度达到6 988.3 km,其中上海市总线路里程达到936.2 km[1]。得益于现代信息技术的快速发展,利用自动售、检票等设备可以实现出行相关数据的采集。我国大型城市如北京、上海、深圳等,人口密度高、城市功能区结构复杂,每天会产生海量的、基于不同出行目的的交通数据。此外,为实现高城市交通覆盖率、满足不同区域不同人群的便捷出行,轨道交通的站点数量多、分布密度高,站点每天采集到的交通信息量也十分丰富。据统计,上海市1号线一天的交通数据量为150万,单一站点如人民广场站、莘庄站等的日均交通数据量为13万。目前,对于收集到的轨道交通数据的处理大部分还停留在初步的统计分析阶段,更深入的机理分析还有所欠缺,海量的轨道交通数据并未得到充分利用。笔者基于上海市轨道交通大数据,结合交通出行行为理论,反演轨道交通站内的交通流变化过程,构建数据与模型双重驱动的轨道交通站内客流量预测方法。

现阶段国内外对客流变化的研究,根据研究的方法和出发点可以分为对单站点客流预测、对短时OD(origin-destination)客流预测和全局交通网络的流量预测。

在单个站点客流预测方面,李明敏等[2]利用修正的ARIMA模型对以徐泾东站为例的展会客流特征的地铁站点作为研究,并与常规算法进行对比研究。郭文等[3]利用粒子群优化的支持向量机模型对苏州汾湖路地铁客流量进行预测。赵阳阳等[4]利用经验模态分解法将时间序列转化为本征模函数及残差,再结合长短时记忆神经网路对站点的进(出)站进行预测。XIA等[5]以北京西直门站为例,利用LSTM NN和CNN模型对节假日和高峰期客流进行预测研究。张惠臻等[6]结合天气因素和高峰期等因素,利用LSTM和GRU对不同站点进行短时客流预测。

在短时OD客流预测方面,现有研究多针对固定OD之间的客流变化。从预测对象来看,针对轨道交通,BHATTACHARJEE等[7]首次将卡尔曼滤波器应用于动态OD预测中。LENG等[8]通过概率树模型从历史OD信息中学习获得每种OD对出现的概率,根据实时的起点预测终点的位置,并累加计算出预测的OD客流。除了对轨道交通的OD研究,还有大量学者对公交、出租等OD流量进行研究。LI 等[9]结合非负矩阵分解(NMF)算法和自回归(AR)模型,基于北京市出租车 GPS 数据来预测 OD 矩阵。LIU等[10]利用北京公交刷卡数据,运用卡尔曼滤波预测公交客流量,并对公交线路的客流量进行分配,以实现对公交线路的OD预测。另外,手机的信令数据也可用于对OD预测,如孙卓等[11]基于手机信令大数据,通过数据挖掘分析人群的家庭位置、短暂驻留地点和工作地点,以此预测居民不同时间段的出行OD矩阵。从预测方法来看,ZHAO等[12]利用小波分解的方法对全天的客流进行分解,以解决客流的混沌特征,根据分解结果对不同尺度下的序列进行预测。蔡昌俊等[13]剔除客流的周期性和趋势特征,构建ARIMA模型进行预测。CHAN等[14]等利用神经网络提出了一种适用于小样本数据的城市轨道交通短时预测模型。

在全局交通网络的流量预测方面,邱世崇等[15]分析交通流空间相关性,并结合时间相关性,利用最小二乘动态加权融合算法将利用时间序列数据预测结果和空间回归估计预测结果进行融合,从而输出最终结果。WANG等[16]提出新的数据表示结构—超图,用来模拟高阶数据之间的关系,融入了站点间隔、运行时间和车辆数量等特点,代替现有流量预测算法中的数据建模方法。LV等[17]将路网中的空间、时间、语义关联与各种全局特征联合,建立了T-MGCN交通流预测深度学习框架,通过多图卷积网络对关联性进行建模,再利用循环神经网络学习交通流的动态模式,以捕获时间相关性,最后利用全连接神经网络融合时空相关性和全局特征。

以往研究大多集中在对站点进出站客流的预测,忽略了乘客出行过程中其时空轨迹对中间站点的客流的影响,且这个影响是根据时间连续变化的。笔者利用反推演的思维方法,根据乘客进出站信息反推演出乘客时空轨迹和轨道交通网络客流变化过程。从历史AFC数据中挖掘出每个站点的分时段OD客流分布规律与OD出行时长规律,并结合实时AFC数据估计当前OD客流分布,对未来每个站点的客流变化进行预测,建立站内客流实时预测模型,并与实际数据进行对比,以证实模型的科学性和准确性,为后续的地铁应急管理和疏散提供参考。

1 站内客流预测模型

结合轨道交通网格图分析轨道交通的站内客流主要由以下4部分组成:i站点进站客流oi,i站点出站客流Di,i站点未上车客流pi,由i站点的周围站点流往i站点的客流ui。因此i站点的站内总客流Wi可表示为:

Wi=oi-Di+pi+ui

(1)

但是根据AFC刷卡数据,可以捕获到的乘客信息有限,主要包含以下几个信息:乘客id号、进出站站点、进出站时间、花费金额等,如表1所示。

表1 AFC数据样例

通过原始AFC数据可以得到进站客流oi和出站客流Di,但出站客流Di在时间维度存在一定的滞后性,乘客刷卡进入闸机后,只能获取乘客进站站点和进站时间,无法立刻获取乘客出站站点和出站时间,这些信息只有当乘客出站后才能获取,这就为实时监测站内客流增加了一定的困难,故为了实现对站内客流实时监测需要对每个站点的客流OD分布进行预测。笔者通过对历史AFC数据的分析和提取,利用数据挖掘的方法提取历史AFC数据中的规律和特征,结合轨道交通实时进站数据对去向进行预测,可得乘客出站站点。

1.1 分时段OD客流分布估计方法

乘客特征存在着较多不确定性,并且乘客众多特征具有离散性,但轨道交通站点数量固定,特征可挖掘性高,与单一乘客的出行数据相比站点的数据较丰富,而且当城市轨道交通网络足够完善时,乘客的乘车趋势在时间和空间维度上具有规律性和一致性。但车站早晚的客流去向具有较大差别,基于历史数据分时段对不同站点OD客流分布进行挖掘统计,将一个时段视为一个时间粒度t,ta为第a个时间粒度,挖掘每个站点在每个时间粒度t内客流选择终点站的比例。

定义进站量为O(ta),表示时间段ta内各个车站的进站客流。

O(ta)=[o1(ta),o2(ta),…,on(ta)]

(2)

式中:oi(ta)表示车站i在时间段ta内的进站客流。

定义OD矩阵为E(ta),表示时间段ta内各个车站的进站后分别去往不同车站的客流。

(3)

式中:eij(ta)表示在时间段ta内从车站i选择到达车站j的客流。

定义客流去向趋势矩阵为A(ta),表示在时间段ta内各个车站进站乘客去往不同站点的比例。

(4)

根据上述方法,结合历史数据可以得到分时段客流趋势,某站点某时段OD客流分布如图1所示。从图1可以看出,每个站点的OD客流分布服从幂律分布规律,体现重尾效应,即大部分的客流集中在主要的几个站点,少部分客流分布在其他站点,且这少部分客流的终点站选择具有一定的随机性。同时,相同站点虽然不同日期之间的客流去向趋势具有一定的差别性,但主要站点具有一致性,故定义重要站点数量为m,其他为非重要站点,车站i客流趋势矩阵ci(ta)可简化为式(5)的形式,其中importantm表示车站i的第m个重点去向车站,others为非重点去向车站。在模拟时,对去往非重点车站的客流采用随机的方式,对去往重点站的客流根据历史数据中的比例进行预测。

图1 某站点某时段去向趋势图

ci(ta)=(important1,important2,…,importantm,others)

(5)

1.2 基于历史数据的乘客出行时间估计

乘客出行时间具有较大不确定性,笔者从历史数据中挖掘不同起点和终点之间出行所需要的时间。

定义时间矩阵T,记录不同起点和终点所需花费的时间。

(6)

式中:θij表示从起点i到终点j所需要的平均时间。

对历史AFC数据进行预处理,剔除旅行时间明显过长和过短的数据,对乘客的历史出行取时间算术平均,可得到出行时间矩阵。

1.3 站内客流预测模型

轨道交通网络错综复杂,存在较多站内换乘情况,所以无法确定式(1)中未上车客流pi和周围站点流向客流ui。但轨道交通与其他交通不同,具有交通网络固定、列车运行速度与时间稳定的特点,乘客的出行线路和到达时间具有较强规律性,故乘客出站站点决定了可能经过的中间站点。根据小节1.1和1.2的内容,可得乘客终点站选择,再结合反推演的思维得到站内客流的变化。基于实时AFC数据的站内客流预测流程图如图2所示。

图2 站内客流反推演过程设计

(1)基于时间最短出行路线原则,根据起讫点预测乘客出行线路。根据实时AFC数据,依照乘客id、进站站点和时间,通过式(5)推算乘客出站站点。进站站点与出站站点之间可能存在多条乘车线路,乘客出行时多选择时间成本最小的路线,所以以出行时间最短的原则计算乘客乘车路线。具体操作如下:①建立时间成本为权值的有权图代表地铁网络;②考虑地铁换乘时间成本,为换乘站点(同一站点不同线路之间)设定时间成本权值;③结合最短路径FLOYD[18]算法,得出进站站点与出站站点之间固定线路。

(2)基于乘客出行时间和出行路径预测乘客出行的时空轨迹。为了量化乘客出行的时空轨迹,给出以下假设:①乘客按时间成本最小的路径出行,且全天进出站时间成本一样,记为Δt;②轨道交通网络上所有列车匀速运行;③乘客无等车时间;④列车的负载量无上限;⑤将所有乘客统计分析到各个站点,即使乘客在列车上,也就近原则统计到各个站点。

基于以上假设,将乘客出行时间减去乘客进出站所花费时间Δt,再平均到每个站点(换乘也视为一个站点)得到乘客的出行时空轨迹,即时间段-站点位置。如表2所示,乘客在时间in由Lin进入,经过LB+at、LB+(a+1)t等站点,最终在Lout出站。其中B表示轨道交通运行起始时间,in表示乘客进入轨道交通网络时间,LB+at表示乘客第B+at时间点所在站点,Lin表示进站站点,Lout表示出站站点。

表2 乘客出行时间轨迹

(3)统计预测站点内人数变化。①为每个站点设定一个一维数组记录动态的人数,数组下标为时刻值,数组内容为每个时刻该站点的人数;②根据步骤(2)得到的时间段-站点位置结果,找到相应站点的一维数组,并将相应时间段对应的下标范围的数值加1;③分析统计每个乘客即可得到每个站点内动态人数变化情况。

1.4 模型实现

结合基于历史数据的分时段OD、乘客出行时间矩阵及站内客流预测模型,对轨道交通网络各站点的站内客流进行实时预测,分析站内客流动态变化,模型算法步骤具体如下:

(1)生成动态空数组N,表示每个时间点地铁网络每个站点客流,B表示起始时间,Wi(B+at)表示车站i在B+at时间点站内客流,初始值都为0。

(7)

(2)由实时AFC进站数据,计算时间粒度t内车站i累计进站客流,得到进站客流oi(B+at),更新车站i站内人数,判断时间是否到预设终点时间,若到则结束循环。

(3)根据t时间粒度内去向比例矩阵A(t)获得车站i的去向趋势矩阵ai(t),根据去向比例取出前m个重点站比例,计算出ta时间粒度内到达站点j的客流Dj(ta),剩余客流随机选择出站站点。

(4)更新乘客数据。根据步骤(3)得到出站站点,再根据时间矩阵,得到出站时间,补全乘客进站与出站数据,生成ODdata。

(5)根据ODdata中的进站与出站数据,在路径表中获取路径,得到完整的路径序列。

(6)根据进出站时间,得到全程时间,根据步骤(5)中的路径,将时间平均到路径序列中站点,得到乘客在每个站点的持续时间,并在数组N内根据站点与持续时间找到对应位置加1。

(7)判断ODdata是否取完,若取完,则输出N,并转到步骤(2),若未取完转到步骤(5)继续。

1.5 模型公式

Wi(ta)=Wi(ta-1)+Di(ta)-oi(ta)

(8)

(9)

(10)

2 模型验证与结果分析

2.1 模型验证

由于站内客流无法精准统计,将实际AFC数据中记录的OD数据替换ODdata,代入模型计算后,作为实际客流结果,并将所提模型的预测结果与其对比,进行模型验证。将2015年4月份13个工作日数据作为历史数据,分析提取分时段OD与乘客出行时间矩阵;重点站个数取30,即m为30;时间粒度为15 min,即t为15。对上海市2015年4月某日轨道交通网络客流进行预测,并用实际客流对比验证,选取部分站点展示,如图3所示。从图3可以看出,大客流站点(换乘站)真实值曲线与预测值曲线具有较好的拟合度,在客流数值维度与实际值相符合,并且在时间维度上的早晚高峰也分别对应,对小客流站点部分客流峰值具有一致性,但在客流数值维度具有一定的偏差。

图3 上海市某日轨道交通网络客流预测结果

2.2 预测模型评价指标

为了衡量预测模型的效果,选用MAPE作为评价指标,并引用2012年伦敦举办的保障乘客疏散研讨会中提及的验证指标ERD(euclidean relative difference)和EPC(euclidean projection coefficient)[19],具体公式如下:

(11)

(12)

(13)

式中:Xi为预测值;xi为实际值;n为预测总数;MAPE表示预测值与真实值的绝对百分比误差;ERD和EPC表示预测曲线和真实曲线的拟合度。MAPE与MRD值越接近0,EPC越接近1时,模型越符合实际情况。

基于模型预测结果,分早高峰(7:00-11:00)、晚高峰(16:00-20:00)和全天3个阶段进行误差分析,具体结果如表4所示。由于MAPE指标在数据较小时失真,全天只选用ERD和EPC作为评价指标。从表4可以看出,对于大型站点(换乘站点),如南京东路站、人民广场站,预测误差较小,有良好的预测效果;对于小型站点,如复兴岛站,预测误差较大,预测效果一般。因此,基于历史AFC数据进行轨道交通站点客流数据进行预测,对于大型关键站点具有良好的预测效果。

表4 典型站点预测误差

3 结论

(1)结合轨道交通网络特点,利用历史数据得到具有日期属性的乘客分时段出行规律,结合分时段出行规律对进站客流OD分布进行估计,再基于出行时间成本最小原则,求出不同起讫点乘客出行路径,运用反推演思维得到乘客出行时空轨迹,从而构建形成轨道交通站内客流实时预测模型,得到轨道交通网络中每个站点站内客流变化。

(2)基于上海市轨道交通历史客流数据,模拟轨道交通实时进站过程,结合站内客流实时预测模型,对全轨道交通网络站点站内客流预测问题进行验证和对比,结果表明考虑不同站点分时段客流OD分布规律和乘客出行轨迹的预测模型,其对大型站点(换乘站点)的预测误差较小,对数据量较少、客流变化随机性较大的小型站点,预测误差较大。

(3)笔者未考虑列车的负载量和列车的发车运营情况,后续研究可加入列车的实时运行状态,来提高站内客流预测的准确性。

猜你喜欢
进站客流站点
客流增多
城市轨道交通节假日期间大客流行车组织思考与实践
基于系统动力学的城市轨道交通车站客流控制仿真与优化
进站口上下行载频切换时引起ATP制动问题分析
基于Web站点的SQL注入分析与防范
春运期间北京西站共有154.8万人次刷脸进站
地心游记(四)一位向导
积极开展远程教育示范站点评比活动
怕被人认出
基于自学习补偿的室内定位及在客流分析中的应用