光志瑞, 牛燕斌, 石 旭, 吴雁军, 陈 冉
(1.北京市地铁运营有限公司技术创新研究院, 北京 100044; 2.地铁运营安全保障技术北京市重点实验室, 北京 100044; 3.北京市基础设施投资有限公司, 北京 100101)
新冠肺炎疫情爆发后,我国各级政府采取了一系列措施,通过有效隔离病患、增加物理距离、阻断病毒传播,对控制新冠肺炎疫情的蔓延起到了明显的作用[1]. 城市轨道交通作为城市交通的骨干,具有速度快、容量大、客流密集、空间密闭的特点,北京城市轨道交通采取了一系列积极防控措施,在防止城市轨道交通成为疫情传播场所的同时,维持着城市的基本运转. 为应对复工复产客流,北京地铁按照最大运输能力编制列车运行图,实时监测客流情况,针对客流量较大、断面满载率较高的线路,在按照最小间隔运行的基础上,采取适时增发临客、区间车等措施,降低列车满载率[2],最大限度保障人们的出行需求.
为了解重大公共卫生事件对城市轨道交通运输需求的影响,本文采用大数据可视化的方法,尝试从不同层面挖掘2020年上半年北京城市轨道交通数据,分析客流受疫情影响的程度及时空分布特征. 在此基础上,对疫情影响下的客流恢复情况建立了基于ARIMA的客流预测模型,为灵活调整客运组织和行车组织方案提供理论支撑.
本文通过大数据可视化方法分析疫情影响下的客流时空特征. 其中,空间维度包括路网、线路、车站(含组团)各层级,时间维度包括年、月、日和0.5 h,研究指标主要为客运量和进出站量.
1.1.1 路网月客运量趋势
为了直观把握疫情对客流的影响,对2020年与2019年上半年各月日均客运量进行对比分析(如图1). 2019年各月日均客运量主要受天气、温度、节假日等因素影响,2月份路网日均客运量最低,4月份最高. 受疫情影响,2020年1月日均客运量较去年有所下降,同比减少26.85%. 2月下降幅度最大,同比减少89.08%,之后以136%、81%、48%的环比增长速度逐步回升,5月份恢复程度最高,6月份受新发地疫情影响,恢复程度略低于5月份,见图1.
图1 2020年上半年路网月均客运量同比图
1.1.2 路网日客运量趋势
受新冠疫情影响,北京城市轨道交通客流呈现先突降后缓慢上升的趋势,如图2所示. 2020年1月20日,钟南山在接受央视采访时表示,新冠肺炎有人传人的现象,随后北京城市轨道交通客流突降,下降幅度约16.7%. 1月24日(除夕),北京市启动突发公共卫生事件一级响应机制,与往年春运“V”字客流恢复趋势[3]不同的是,客流在之后较长时间内维持在低谷水平. 2月2日(正月初九),客流只有2019年同期的7.23%. 由于各级政府采取严格的防控措施,疫情得到有效缓解,随着企业复工复产,城市轨道交通客流缓慢上升. 4月30日,北京市将响应机制调至二级,客流达往年同期的42.63%. 6月6日,北京市将响应机制由调至三级,客流达往年同期的67.06%. 按此趋势推算,预计2~3个月内客流可达去年均值水平. 然而6月11日,北京新发地疫情爆发,6月13日、14日客流下降幅度达18.71%、31.95%,见图2.
疫情前,2019年12月工作日日均客运量为1 223万人次. 2020年的春运因新冠疫情而呈现出与以往不同的特点,城市轨道交通作为城市内部大运量骨干交通工具,兼负疫情防控与满足人们基本生活出行、保障城市基本运作的双重职责[4]. 图3通过对比2020年与2019年春节后客流恢复率(与前一年12月客运量均值的比例),量化分析春节后客流恢复情况. 2019年节后第1日(正月初七)路网客运量恢复率为71.33%,节后第1周工作日平均恢复率达84.62%;正月十四客运量恢复率超过100%,第2周工作日平均恢复率达104.52%,人们已经恢复正常的工作、生活秩序. 受疫情影响,2020年节后2周恢复率始终低于10%,第1周工作日平均恢复率仅为5.84%,第2周工作日平均恢复率仅为5.89%. 由此可得,疫情大幅抑制了城市轨道交通出行需求,严重影响了人们的工作、生活节奏,见图5.
图2 2020年上半年路网日均客运量趋势
图3 2020年与2019年春运期间客运量对比分析/%
1.1.3 路网分时进站量变化
图4 2020年与2019年非工作日分时进站量对比折线图/%
图5 2020年与2019年工作日分时进站量对比折线图/%
2020年与2019年非工作日相比(如图4),全天各时段减少程度相当,平均减少量为3.6万人次,平均减少率为66%. 2020年与2019年工作日相比(如图5),日均分时进站量整体走势基本一致,都在07:30—08:30达到上午进站高峰,在17:30—18:30达到下午进站高峰. 2020年上半年05:00—23:00期间每0.5 h平均同比减少58%,其中,早高峰07:00—09:00期间每0.5 h平均同比减少20万人次,平均减少率为51%;午平峰平均同比减少7万人次,平均减少率为61%;晚高峰17:00—19:00同比减少18万人次,减少率为54%. 由此可看出,与2019年相比,2020年工作日早晚高峰路网进站减少量更大,平峰路网进站减少率更大,即疫情对工作日全天各时段均有较大影响见图4、图5.
1.2.1 线路日客运量变化
在路网宏观分析的基础上,从线路层面分析疫情对城市轨道交通客流的影响(见图6). 2020年线路日均客运量排名与2019年基本一致,日均客运量由高到低排名第1位的是10号线达34.07万人次,
同比下降58.78%. 24条线路中仅4条线上半年日均客运量下降幅度低于50%. 首都机场线下降幅度最大达74.74%,大兴机场线为今年新开通线路,客运量为所有线路最低. 由此可看出疫情对航空业的严重冲击.
图6 2020年线路日均客运量同比图
1.2.2 线路早晚高峰最大进出站时间分布
图7为2020年上半年线路早高峰最大小时进站发生时间分布图晚高峰最大小时出站发生时间分布图,从图中可看出:线路早高峰小时进站量发生时间比较集中,基本分布在07:00—08:45不到2 h内,其中,发生时间最早的是燕房线、大兴机场线、房山线、昌平线等郊区线;大部分骨干线早高峰小时进站量发生在07:30—08:30;首都机场线最晚,为08:55—09:55. 晚高峰小时出站量发生时间差异略大,从17:00一直持续到19:45,接近3 h,其中,晚上出站最大值发生最晚的线路是昌平线、S1线、8号线、八通线等线路. 由此可见,远郊区线通勤乘客出行距离和时间均最长,见图7.
图7 2020年上半年线路早晚高峰最大进出站时间分布
1.3.1 车站月进站量变化
从车站层级看,通过对车站进站减少量进行时空维度分析(见图8),可看出:与2019年同期相比,1月份大部分车站月日均进站量减少程度在20%~30%,占全部车站数量的53%;2、3月份超90%的车站影响程度高达70%以上;随着北京疫情的缓解,4月份大部分车站影响程度在50%~70%;5、6月份一半以上车站影响程度在30%~50%. 综上,各站进站量正随着疫情的有效控制向恢复态势发展.
图8 2020年上半年月进站量变化注:颜色表示减少程度,条形长短表示车站数量.
1.3.2 车站日进站量变化
从图9车站日均进站量减少程度分布图可看出:受疫情影响,2020年几乎所有车站上半年日均进站量低于2019年,超过80%的车站进站量下降幅度过半. 其中,减少程度最大的主要是对外枢纽类车站(T2航站楼-76.04%、北京站-73.28%等)和地标性景点类车站(天安门东-82.61%、前门-77.88%、什刹海-77.66%等),同比减少70%以上.
图9
疫情期间提倡居家办公[5],通勤客流减少[6],通过分析北京五大商务区同比减少程度(如图10),研究疫情对办公类车站的影响. 从进站量来看,北京五大商务区工作日进站量减少程度大于全路网车站均值,其中,金融街商务区减少程度最大,其次是中关村商务区和第三使馆区,可能是由于金融与计算机行业更便于远程办公;从出站量来看,中关村商务区和望京商务区出站量减少程度大于全路网均值,CBD商务区低于全路网均值,金融街与第三使馆区与全路网均值持平. 总体来看,上半年从居家隔离到逐渐复工复产,疫情对办公类车站影响较大.
图10 2020年首都商务区工作日进出站量同比减少百分比注:金融街商务区(复兴门、阜成门等)、中关村商务区(中关村、海淀黄庄等)、第三使馆区(将台、枣营等)、CBD商务区(国贸、大望路等)、望京商务区(望京、将台等)
时间序列分析根据时间序列数据及序列之间的互相依赖关系,通过曲线拟合和参数估计建立数学模型的统计分析方法. 对于疫情下客流恢复情况的预测,可充分考虑季节效应、长期趋势效应和随机波动之间的复杂影响关系,建立乘积差分自回归移动平均(Auto Regressive Integrated Moving Average ARIMA)模型进行预测. 乘积季节ARIMA模型公式及分析预测过程[7]如下:
ARIMA(p,d,q)×(P,D,Q)S
(1)
(2)
Θ(B)=1-θ1B-…-θqBq
Φ(B)=1-φ1B-…-φpBp
ΘS(B)=1-θ1BS-…-θQBQS
ΦS(B)=1-φ1BS-…-φPBPS
y=-3×10-6x2+0.003 6x+0.765 3(R2=0.88)
(3)
图11 ARIMA流程图
本文通过构建ARIMA模型,对北京市2020年上半年的路网客运量恢复情况进行预测. 采用2020-02-05—2020-05-30数据作为训练集,预测2020-06-01—2020-06-12客运量,通过计算预测结果和实际值的平均误差百分比对模型进行精度检验.
模型构建过程如下:
1)绘制2020年上半年北京轨道交通路网客运量的时序图(如图12),其中清明节、五一劳动节的客流做了插值替代处理. 整个客运量呈现明显的趋势变化、周期变化和随机变动.
图12 2020上半年路网客运量时序图
2)通过自相关函数图和偏自相关函数图对北京市2020年上半年路网客运量的周期性和平稳性进行检验. 由图13可知,自相关系数(ACF)不截尾,说明客运量时间序列不稳定,表现出明显的周期性,以7 d为1个周期. 同时,偏自相关系数(PACF)不截尾.
图13 自相关函数和偏自相关函数图
3)对客运量时间序列数据进行1阶7步差分以消除周期性和长期趋势性. 从图14中可看出,1阶7步差分后的客运量已经没有明显的周期性和趋势性. 图15的自相关函数图和偏自相关函数图中可看出差分后的序列还具有短期相关性.
4)根据以上分析,本文建立ARIMA(p,d,q)模型,提取时间序列中的周期性、趋势性和季节性. 由于进行了1阶7步差分,经反复尝试验证,ARIMA(1,1,1)拟合效果较好,拟合参数结果见图16.
图14 1阶7步差分后时序图
图15 1阶7步差分自相关函数图和偏相关函数图
图16 ARIMA(1,1,1)模型参数
图17 新冠肺炎疫情影响下客流预测
以疫情影响下的客流预测为例,通过分析2020-02-05—2020-05-31路网客运量时间序列,对ARIMA模型参数进行标定,并采用标定后的模型ARIMA(1,1,1)对2020-06-01—2020-06-12客运量进行动态预测. 通过计算预测结果和实际值的平均百分误差(MAPE)对模型进行精度检验[8],结果表明:北京城市轨道交通路网客运量的平均误差百分比为2.9%,预测效果良好(如图17). 从结果可看出,6月7日路网客运量预测误差较大,平均误差百分比达到13.5%. 通过分析,6月7日为周日,最高温由前一天20 ℃骤升到35 ℃,极有可能受突发高温天气的影响,造成客流预测误差较大. 除6月7日外,客流预测平均误差百分比为1.98%,预测效果较好.
本文采用北京市轨道指挥中心2020年上半年地铁运营数据,通过可视化方法,直观展现了新冠肺炎疫情影响下的客流时空分布特征,并构建了疫情影响下的客流恢复预测模型,得到以下结论:
1) 受疫情影响,以1月23日为界分为2个阶段,1月23日之前客流特征与往年类似,1月23日之后,城市轨道交通客流大幅下降,节后返程恢复缓慢,上半年最高恢复到去年同期的67%;
2) 从线路层级可看出疫情对航空业的严重冲击;
3) 从车站层级可看出2月份疫情最为严重,之后持续向好,疫情极大抑制了出行需求,对交通行业、旅游业影响巨大;
4) 随着疫情的有效控制,客流恢复向好,通过建立时间序列ARIMA(1,1,1)模型对客流恢复情况进行预测,预测误差率为3.1%.
受时间和精力所限,本文疫情影响的城市轨道交通分析的维度和深度有待进一步提高,下一步工作中将在分析时增加研究指标(OD分布、断面客流等)以及其他影响因素(如恶劣天气). 大数据技术在城市轨道交通运营中仍有很大应用空间,应以疫情防控为契机,建立科学、稳定、规范的大数据分析挖掘平台,推动城市轨道交通管理体系和能力的现代化,为智慧城市、智慧地铁的建立奠定基础.