基于区间估计的城市轨道交通客流波动性分析

2023-09-21 09:58饶文明
现代城市轨道交通 2023年9期
关键词:波动性工作日客流

刘 钊,贾 萌,陈 丹,饶文明

(南京工程学院汽车与轨道交通学院,江苏南京 211167)

1 背景

城市公共交通系统对于轨道交通的依赖性呈增长趋势,特别是一线大城市,城市轨道交通客运量占城市公共交通客运总量出行比率已超过50%。深入分析和挖掘城市轨道交通客流的变化规律,对于进一步提升其客流组织、运力配置和短时客流预测等工作的精准性具有至关重要的作用。

目前,国内外学者对于城市轨道交通客流变化规律的分析已取得众多的研究成果,而对于客流变化的波动性关注还较少。从变化趋势来看,城市轨道交通客流通常具有明显的周期性特征,例如在工作日呈现“双峰”特征,在周末呈现“单峰”特征,而在城市郊区可能会呈现“无峰”特征,城市轨道交通客运组织、运力配置和客流预测等方面的运营管理工作很大程度上依据上述客流变化趋势规律展开。文献[1]认为客流的波动性是客流在微观层面上的重要特性,主要由平均水平变化和离散变化2种特征组成。相比较而言,针对客流波动性特征分析的研究较少,目前已有文献大多是利用客流估计值与观测值之间的偏差来反映客流的波动性,而客流的估计值很大程度上与客流拟合的模型有关,如基于神经网络的客流预测[1-3]、基于深度学习的客流预测[4-5]、基于支持向量回归的客流预测[6]和混合预测[7-8]等。值得注意的是,城市轨道交通客流的变化规律与城市道路交通流十分相似,而城市道路交通流变化呈现出异方差特性,文献[9-10]采用随机时间序列进行建模取得了较好的拟合结果,文献[11]在分析交通流异方差特性时进一步提出了基于置信区间的判断方法。在其他研究领域,如电力储能[12]、风电功率[13]和故障诊断[14]等,四分位法也被广泛应用于时间序列的区间分析。总体而言,受乘客出行、天气情况或突发事件等因素的影响,城市轨道交通客流在遵循一定变化趋势的同时,也必然会呈现出一定的波动性,然而目前有关城市轨道交通客流波动性尚未有专门的定义以及具体的量化标准。

为此,针对城市轨道交通客流变化的波动性特征,本文提出基于四分位法和基于时间序列分析的区间估计建模方法,通过估计客流可能的变化范围,探索客流变化的波动性特征,并提出区间覆盖率、区间绝对宽度和区间相对宽度3个评价指标,以量化反映客流波动性。

2 城市轨道交通客流变化波动性特征

以苏州地铁相门站的客流数据为例分析客流变化波动性特征,具体的数据来源说明见“4 实例分析”章节。时间汇集度为15 min尺度下工作日和周末客流变化的分布情况如图1所示,由图可知,客流在工作日和周末分别呈现“双峰”和“单峰”的变化趋势,工作日客流围绕变化趋势特征所呈现出来的波动范围比较均匀,而周末客流呈现出来的波动范围更大、更分散,尤其是在16 : 00左右,周末客流的振动幅度在100~300人次 / 15 min,远远大于工作日客流的振动幅度。尽管城市轨道交通客流的变化具有明显的趋势特征,但围绕这种趋势特征客流还会呈现出不同幅度的波动。为此,定义城市轨道交通客流的波动性为:在遵循一定变化趋势下呈现出来的振动幅度或范围。

图1 城市轨道交通客流变化特征

3 基于区间估计的客流波动性建模

3.1 基于四分位法的客流区间估计建模

假设城市轨道交通客流数据表示为X= [X1,X2,X3,…,Xt],其中Xt表示t时刻的客流值,而Xt= [xt1,xt2,xt3,…,xtn],其中xtn表示第n天t时刻的客流值。采用四分位法对连续多天t时刻的客流值Xt进行统计分析,首先按照从小到大的顺序对Xt进行排序,得到新的序列Yt= [y1,y2,y3,…,yn],则下四分位数和上四分位数在序列yt中的位置计算如下:

式(1)、式(2)中,q1和q3分别表示下四分位数和上四分位数在序列中的位置。那么,序列Yt的下四分位数Q1和上四分位数Q3分别为:

式(3)、式(4)中,qZ1和qX1分别表示q1的整数部分和小数部分;qZ3和qX3分别表示q3的整数部分和小数部分。在此基础之上,可以计算四分位距IQR为:

依据四分位距IQR,可以计算序列Yt的区间估计范围:

3.2 基于 ARIMA-GARCH 的客流区间估计建模

假设城市轨道交通客流的时间序列表示为X= [x1,x2,…,xt],其中xt表示t时刻的客流值。应用差分整合滑动平均自回归模型(ARIMA)和广义自回归条件异方差模型(GARCH)进行建模,即ARIMA - GARCH,城市轨道交通客流时间序列xt可以表示为:

式(7)中,xt为t时刻的客流;B为延迟算子;εt为时间t时的干扰;ht为条件方差;et为均值为0、方差为1的白噪声;αi=1,2,…,v为ε2t-i的非负系数;βi=1,2,…,u为ht-i的非负系数;φ(B)= 1 -φ1B-φ2B2- … -φpBp,为非季节自回归多项式,其中p为阶数;θ(B)= 1 -θ1B-θ2B2- … -θq Bq为非季节滑动平均多项式,其中q为阶数;(1 -B)d为差分,d为差分次数。因此,ARIMA -GARCH模型又可以表示为ARIMA(p,d,q) -GARCH(v,u)。

结合式(7),客流波动区间的范围可以表示为:

3.3 评价指标

理想的城市轨道交通客流估计区间应该遵循2个原则:一是客流估计区间的覆盖范围应该尽可能的小,即在同一时刻客流最大估计值与最小估计值之间的差最小;二是客流的观测值应该尽可能落在估计区间中。满足上述2个条件的客流估计区间,可以认为包含了足够的客流变化信息。为此,提出客流波动性量化指标,包括客流区间覆盖率(CR)、客流区间绝对宽度(AMW)和客流区间相对宽度(RMW),具体如下式所示。

式(9)~式(11)中,xt为t时刻的客流观测值;和分别为t时刻客流估计区间的上限值和下限值;N为客流观测的时间长度或观测的客流数据数量。值得注意的是,对于最佳客流估计区间的确定尚未有统一的标准。参考文献[16],可以以95%的客流区间覆盖率,作为最佳客流估计区间的确定标准,即最佳的客流估计区间应该覆盖95%的客流观测值。

4 实例分析

4.1 数据来源

本文选用的客流数据来自苏州地铁自动售检票系统(AFC),选取了6个车站,依次为相门站、星海广场站、广济南路站、乐桥站、石湖东路站和苏州火车站。按照5 min的时间间隔对乘客进站记录进行汇集,客流数据的采集时间为2015年6月29日至2015年8月30日,共9周合计63天,其中工作日45天,周末18天,每天的客流数据采集时间为7 : 00 — 22 : 00共15 h。

4.2 基于四分位法的客流区间估计

采用四分位法进行客流区间估计建模,关键是确定客流区间估计系数。以相门站为例,设置客流区间系数范围为[0.1,2.5],以0.1的步长测试区间系数对客流区间覆盖率的影响,分析结果如图2所示。

图2 基于四分位法的客流区间系数敏感性分析

由图可知,随着区间系数从0.1增加到2.5,客流区间覆盖率从60%逐渐增加到接近100%,并且在这一过程中没有明显的拐点存在。当区间覆盖率达到95%之后,其增加幅度越来越小。以95%的客流区间覆盖率作为最佳客流估计区间的判断标准,那么所选择的6 个车站客流区间估计系数如表1所示,表中依次列出了每一个车站在工作日和周末最佳的客流区间系数,以及对应的客流区间覆盖率。

表1 基于四分位法的客流区间估计系数

4.3 基于 ARIMA-GARCH 的客流区间估计

构建基于ARIMA-GARCH的客流区间估计模型,首先依据客流时间序列数据的自相关特性和偏自相关特性确定ARIMA的模型阶数,然后检验ARIMA模型残差是否具有显著的自相关性(ARCH效应),如果存在ARCH效应则进一步建立GARCH模型,并标定GARCH模型的阶数,最终结合客流的均值和条件方差构建客流区间。有关ARIMA-GARCH模型的确定、检验标准、流程可以参考文献[16-17]。

按照工作日和周末的时间划分,在随机时间序列分析过程中,所选6个车站的客流时间序列均值建模部分,模型结构均为ARIMA(1,0,1),而在条件方差部分则不尽相同,具体的建模结果如表2所示,依次列出了每一个车站在工作日和周末的模型结构,可以表示为ARIMA(1,0,1)-GARCH(u,v),以95%的客流区间覆盖率作为确定最佳客流估计区间的标准,GARCH模型的参数u、v以及对应的最佳客流区间覆盖率如表2所示。

表2 基于ARIMA-GARCH的客流区间估计建模

4.4 不同区间估计方法的比较

统计每小时客流区间绝对宽度和客流区间相对宽度2个指标,比较基于四分位法和基于ARIMAGARCH得到的客流估计区间差异,具体结果如图3所示。结合城市轨道交通客流的变化趋势特征,可以看出在 10 : 00 — 20 : 00时间段,客流估计区间的绝对宽度会随着客流量的增加而增大,而客流估计区间的相对宽度则会随着客流量的增加而降低。值得注意的是,在客流量较小时,即早高峰之前和晚高峰之后,基于四分位法和基于ARIMA-GARCH得到的客流估计区间存在较大的差异。

图3 基于四分位法与基于ARIMA-GARCH的客流估计区间比较

4.5 不同时段客流波动性比较

统计工作日和周末的客流估计区间评价指标,具体的分析结果如图4所示。在图4a中,10 : 00之前工作日的客流估计区间绝对宽度大于周末客流估计区间绝对宽度,而10 : 00之后,则是周末客流估计区间绝对宽度大于工作日客流估计区间绝对宽度。在图4b中,工作日和周末的客流估计区间相对宽度呈现出一致的变化趋势,呈现出先快速下降,然后保持稳定,逐渐上升的变化特征,并且在10 : 00之前周末客流估计区间相对宽度明显高于工作日客流的相对宽度,而在10 : 00 — 18 : 00之间则是工作日客流的相对宽度略高于周末客流区间相对宽度,在18 : 00之后二者没有明显差异。这表明城市轨道交通客流波动性随时间的变化而改变,整体上而言早高峰之前及晚高峰之后的客流变化波动性较大,而早晚高峰之间时段的客流波动性相对较小。

图4 不同时段客流波动性比较

5 结论与讨论

本研究针对城市轨道交通客流变化的随机性和不确定性展开研究,为此定义了客流变化的波动性,构建了基于四分位法和基于ARIMA-GARCH的2种客流区间估计模型,并提出了客流区间覆盖率、客流区间绝对宽度和客流区间相对宽度3个评价指标。依据来自于苏州地铁AFC系统的客流数据,对工作日和周末客流的波动性进行了比较分析,分析结果表明,整体而言工作日客流变化的波动性小于周末客流的波动性,并且从一天内客流变化情况来看,早高峰之前及晚高峰之后的客流变化波动性较大,而早晚高峰之间时段客流量较大时波动性反而较小。

客流的波动性特征反映了客流量在一定时间范围内的变化情况,包括高峰期和低谷期的出现、工作日与非工作日的差异、季节性变化以及特殊事件等因素的影响。通过对客流波动性进行分析,可以建立客流的基准模式或预期范围,识别出与正常波动性模式明显不符的异常情况,从而有助于检测客流异常值。当客流量偏离预期范围较大或出现异常波动时,可能预示着影响客流的特殊情况,如突发事件、设备故障、突发大客流等,也可能是由于数据采集错误或其他异常情况导致的。需要注意的是,仅仅依靠波动性特征分析可能无法确定具体的异常原因,但它可以作为一种预警机制或初步筛选方法,帮助运营人员或分析师识别潜在的异常情况,并进一步进行调查和深入分析。

猜你喜欢
波动性工作日客流
客流增多
关于休闲的量的问题的考察
基于人民币兑欧元的马尔科夫机制转换的外汇汇率波动性研究
基于沪深300指数的价格发现及波动性研究
基于SV模型的人民币理财产品收益率波动性研究
基于自学习补偿的室内定位及在客流分析中的应用
人工免疫算法在电梯客流时段划分的应用
金融摩擦、金融波动性及其对经济的影响
城市轨道交通运营客流数据分析缺陷及应对
对《资本论》中工作日问题的哲学思考