基于客流特征的城市轨道交通站点分类
——以青岛市为例

2023-12-13 10:24杜光远谭桂菲赵向宇张晓悦
交通运输研究 2023年5期
关键词:工作日客流量高峰

杜光远,吴 瑞,谭桂菲,赵向宇,王 昌,张晓悦

(1.交通运输部科学研究院,北京 100029;2.交科院技术咨询(北京)有限公司,北京 100029)

0 引言

近年来,我国城市轨道交通取得了快速发展,运营总里程和客运量均持续增长[1],但不少城市存在轨道交通与常规公交的衔接效率不高、公共交通系统整体吸引力较弱等特点。因此,提高两网衔接服务能力,促进二者融合发展,已成为城市交通亟须解决的问题。轨道交通站点作为交通网络节点,是两网融合衔接的关键点。由于轨道交通站点在区域位置、功能定位、客流需求等方面存在差异,需结合多方面因素对站点进行分类,并针对性提出常规公交接驳服务要求。

截至目前,国内外学者从多个角度对轨道交通站点分类进行了研究,主要集中在以下几个方面。1)基于站点客流量的形态特征、结构特征和客流强度对站点进行分类。如,尹芹等[2]通过提取站点进站客流量的极大值点、偏度和峰度对北京市轨道交通站点进行分类;陈艳艳等[3]以站点进站客流量高峰小时系数将轨道交通站点分为4 类。但这类研究主要基于专家知识选取客流宏观特征对站点分类,对反映乘客个体微观出行特征考虑不足,难以满足精细化分类要求和需要。2)基于站点周边建成环境对轨道交通站点分类。如,王焕栋等[4]通过获取轨道交通站点空间影响范围内兴趣点(Point of Interest,POI),计算各类POI 比例、优势度和均匀度,确定轨道交通站点类型;李清嘉等[5]通过获取站点周边人口密度、土地利用特征、交通条件特征以及站点自身特征等15 个变量,将武汉市轨道交通站点分为6类。但相关研究需要海量的网络POI 数据对分类进行支撑,而网络数据来源杂乱,无法确保数据的准确性,此外详细的区域人口密度为政府非公开信息,数据获取成本较高。3)基于站点时间序列客流特征对站点进行分类。如,杨兴[6]以15 min 为时间粒度,提取每个站点运营时间内的进(出)站平均客流量,并采用高斯混合模型(Gaussian Mixture Model,GMM)聚类算法对站点进行类型识别;蒋阳升等[7]将进站客流量数据处理为时间序列数据,并采用K-Means++算法对各个站点的客流量进行聚类。但相关研究数据大多使用周一至周五的客流量,未考虑非工作日客流特征对站点分类的影响。

为提高轨道交通站点分类的科学性与客观性,需充分考虑客流宏观与微观特征因素以及客流时间变化规律。本文将基于客流时间序列,对比周中、周末[8]乘客出行规律,从宏观、微观不同角度提取站点客流分布特征和乘客出行特征,应用层次聚类法、K-Means、DBSCAN 算法等8种聚类算法对轨道交通站点进行分类,选取最优聚类算法结果。最后,通过分析不同类别轨道交通站点客流特征,提出相应的常规公交出行接驳服务建议,为提高城市轨道交通与常规公交衔接服务能力提供支撑。

1 轨道交通站点特征指标构建及处理

1.1 站点特征指标提取

为明确轨道交通站点特征,通过分析乘客OD 出行数据,根据站点微观、宏观客流特征,构建三级轨道交通站点特征指标体系[9],其中选取2 个一级指标、4 个二级指标、10 个三级指标(见表1)。微观方面考虑轨道交通站点乘客出行特征,参考文献[9],通过计算高(低)概率轨道交通出行人群占比,探索轨道交通出行人群稳定性;宏观方面考虑轨道交通站点客流分布特征,通过计算进(出)站客流占比[10]、进(出)站熵值[11]、车站客流时间序列特征[12],探索客流时间分布规律。表1中,高峰时段指工作日7:30—9:30和17:30—19:30,其余为平峰时段。

表1 站点特征指标

1.2 乘客出行特征分析

通过确定高(低)概率轨道交通出行人群,计算高(低)概率轨道交通出行人群占比,量化乘客出行特征。

1)高(低)概率轨道交通出行人群划分

基于贝叶斯理论[13],计算不同时空条件下乘客在站点的出行概率,划分高(低)概率轨道交通出行人群。依据文献[9],将出行概率≤0.4 的乘客划分为低概率轨道交通出行人群(一周内最多2 天利用轨道交通出行);出行概率>0.7 的乘客划分为高概率轨道交通出行人群(一周内至少4 天利用轨道交通出行);0.4<出行概率≤0.7的乘客划分为中概率轨道交通出行人群(一周内3 天利用轨道交通出行)。相比中概率轨道交通出行人群,高(低)概率轨道交通出行人群的客流量特征更能直观反映车站乘客出行规律性,因此本文主要针对高(低)概率轨道交通出行人群展开研究,不考虑中概率轨道交通出行人群。乘客出行概率计算公式见式(1)~式(3):

式(1)~式(3)中:P(E|T,S)为t时段内乘客针对s站点的出行概率;S为轨道交通站点s的合集;P(M|T) 为乘客在t时段内乘坐轨道交通的概率;P(E|S,T,M)为乘客在t时段内由s轨道交通站点进(出)站的概率;T为t的合集,分为早高峰、平峰、晚高峰;Dmetro为乘客在统计周期内t时段内乘坐轨道交通的天数;Dall为统计周期内乘客乘坐轨道交通的总天数;Ro为乘客在统计周期内t时段在s站点进(出)站频数;Rall为统计周期内乘客在s站点进/出站总频数。

2)高(低)概率轨道交通出行人群占比计算

为判断站点客流规律特征,计算高(低)概率轨道交通出行人群分别占进出站总客流的比例,计算公式见式(4):

式(4)中:P(E|T,S,F)表示在t时段内s站点中,f类进(出)站客流占总进(出)站客流的比例;T和S含义同前;F是f类客流的合集,指高概率、低概率轨道交通出行人群;Qf为t时段内在s站点进(出)站的f类客流量;Qall为t时段内在s站点进(出)站的全部客流量。

1.3 客流分布特征分析

通过测算进出站客流占比、进(出)站熵值和车站客流时间序列特征,量化站点客流分布特征。

1)进(出)站客流占比

进出站客流占比能反映轨道交通站点的服务功能,包含高峰进(出)站客流与全天进(出)站客流的比值、高峰进站客流与高峰进出站客流比值、非工作日与工作日日均进(出)站客流量比值5 个三级指标。高峰进(出)站客流与全天进(出)站客流比值越大,表示该站点进(出)站客流时间越集中,站点可在高峰时段为乘客提供更多服务;高峰进站客流与高峰进出站客流比值越接近0.5,表示高峰时期该站进站客流量与出站客流量越接近平衡状态,该站点的服务功能越均衡;非工作日与工作日日均进(出)站客流量比值越大,表示非工作日与工作日的客流量差异越明显,该站点在非工作日时服务更多的出行人群。

2)进(出)站熵值

轨道交通站点进(出)站熵值可用来度量站点全天客流分布的均衡性。熵值越接近1,表示站点的全天客流在早高峰、平峰、晚高峰3 个时段内分布越均衡。进(出)站熵值的计算公式[14]见式(5):

式(5)中:H(X)为轨道交通站点进(出)站熵值;X为刷卡状态,分进站和出站;Qt为t时期客流量;Qday为全天内客流量;T含义同前。

3)车站客流时间序列特征

为了判断车站客流随时间的集聚程度,以30 min 作为时间粒度,计算s车站在工作日(非工作日)运营时间内进(出)站的平均客流量,其计算公式见式(6):

1.4 特征降维

为了降低算法运算成本,实现聚类结果的可视化,本文采用主成分分析法对数据进行降维处理。计算不同主成分个数对应的累计贡献率(如图1 所示),最后选取累计贡献率达到85%的3 个主成分。

图1 主成分累计贡献率

2 轨道交通站点分类方法

2.1 聚类算法选择

为了对不同轨道交通站点进行分类,需对降维后的特征指标值进行聚类处理。常用聚类算法有K-Means[15]、DBSCAN[16]、层次聚类法[17]和GMM[18]等。以青岛市轨道交通站点为例,基于其乘客刷卡数据,分别利用GMM-EM 聚类、KMeans 聚 类、Mean shift、DBSCAN 以 及4 类层次聚类共8 种算法对青岛市轨道交通站点的客流特征进行聚类。用CH 系数、轮廓系数、DB 指标[19]来检验聚类结果的优劣性。聚类算法结果对比如表2 所示。从该表可以看出,与GMM 聚类和Mean shift 聚类相 比,K-Means 算法的CH 系数分别高55.1 和54.6,轮廓系数分别高0.21 和0.05,表明K-Means 聚类结果优于GMM 聚类和Mean shift 聚类算法。同时,从不同聚类算法分类结果(见图2)可以看出,K-Means 能将轨道交通站点较明显地分为4 类;DBSCAN 聚类算法分类结果较为杂乱;Mean shift和层次聚类算法几乎将站点分为1 类或2 类,不能很好地区分不同站点之间的特征。因此,本文采用K-Means 算法对轨道交通站点进行分类。

图2 不同聚类算法分类结果

表2 聚类算法结果对比

2.2 K-Means聚类数的确定

由于K-Means 聚类算法在聚类前需要确定最优聚类数k,为避免人为设定聚类数造成数据解释和结论偏差,本文采用手肘法选择最优聚类数,即通过计算聚类所得划分簇的最小化平方误差和确定k值。k值越小,表示簇内样本越紧密,k取值越合理。

计算不同聚类数下K-Means 算法聚类结果的误差平方和(如图3 所示),当聚类数为4 时,误差平方和的下降幅度逐渐减小,因此选择4 作为K-Means 算法最终的聚类数,将轨道交通站点分为4类。

图3 误差平方和随聚类数变化曲线

3 实例分析

3.1 样本数据

为了验证本文方法对于轨道交通站点分类的有效性,本文以青岛市轨道交通站点为例进行实例分析。

采集青岛市2022 年5 月10 日—5 月16 日6 条轨道交通线路的128 个轨道交通站点的进出站刷卡数据,剔除乘客逃票、错误刷卡、反复刷卡、同站进出等数据,共获取有效数据766 万条,部分数据示例如表3所示。

表3 轨道交通刷卡数据(部分)

3.2 轨道交通站点分类

根据2.2 节中确定的聚类数,将1.4 节中降维后的主成分应用于K-Means 聚类算法。根据聚类结果(见图2(b)),将青岛市128 个轨道交通站点分为4 类,第1、2、3、4 类站点数量分别为90、29、7和2,具体如表4所示。

表4 青岛市轨道交通站点聚类结果

3.3 轨道交通站点客流特征分析

通过分析工作日进出站客流时间分布、非工作日与工作日日均进(出)站客流比值、早晚高峰高(低)概率轨道交通出行人群占比、不同类型站点通勤客流量,明确不同类型轨道交通站点的交通流特征。

1)工作日进出站客流时间分布特征

工作日进出站客流时间分布特征可反映出客流随时间的变化规律。4 类站点客流时间分布如图4 所示,从客流整体分布情况来看,早高峰相比于晚高峰,进出站客流量更为集中。但第3 类站点,早高峰进站客流量小于晚高峰;第4 类站点,早高峰出站客流量小于晚高峰。从进出站客流均衡性方面来看,第2 类站点高峰时段进站与出站客流量基本持平。

图4 4类站点客流时间分布

2)非工作日与工作日日均进(出)站客流比

非工作日与工作日日均进(出)站客流比可反映非工作日与工作日的客流变化情况。4 类站点非工作日进(出)站客流量分布如图5 所示。从该图可以看出,非工作日客流中,第4 类站点客流量最多,进出站日均总客流量平均在25 000人次以上,客流量主要集中在具有旅游性质的站点和对外客运枢纽性质的站点等。4 类站点非工作日与工作日日均进(出)站客流比如图6所示。从该图中可以看出,第4 类轨道交通站点和第1类个别站点的客流比明显高于其他站点,在崂山景区、黄岛旅游区及台东商业区等热门区域,周末客流量变化明显,周末日均客流量是周中的3倍以上。

图5 4类站点非工作日进(出)站客流量分布

图6 4类站点非工作日与工作日日均进(出)站客流比

3)早晚高峰高(低)概率轨道交通出行人群占比特征

高概率轨道交通出行人群占比情况可反映站点客流的稳定性。4 类站点早晚高峰高概率轨道交通出行人群出行占比分布如图7所示,整体上,早高峰较晚高峰的高概率轨道交通出行人群出行占比大,表明早高峰站点客流比较稳定。第3 类站点早高峰高概率轨道交通出行人群出站占比和第2类站点的早高峰高概率轨道交通出行人群进站占比均超过70%,表现出第3类站点很强的出站客流稳定性和第2类站点很强的进站客流稳定性。

图7 4类站点早晚高峰高概率轨道交通出行人群占比分布

图7 (续)

3.4 站点类别特征分析

基于3.3 中轨道交通站点客流量特征,分析青岛市4 类轨道交通站点特征。青岛市不同类型轨道交通站点分布如图8所示。

图8 不同类型轨道交通站点分布

第1 类:居住导向型站点。站点客流时间分布图(图4(a)、(e))具有突出的进站早高峰和出站早高峰特征。相比其他站点来说,该类型站点日均进(出)站客流量最少,但非工作日客流量与工作日日均进站客流比值较大,表明非工作日时,乘客出行需求反而增多。这与该类型站点周边存在大型居住社区事实相符,如青岛二中地铁站点周边具有大型居住社区,并配套学校、超市等便民设施。

第2 类:职住混合型站点。站点客流时间分布图(图4(b)、(f))存在明显的左单峰形态,周中早高峰进(出)站客流都较为突出,与第1类站点类似,但其工作日高峰进站客流与高峰进出站客流比值接近0.5,表明此类站点的服务功能较为均衡,同时服务工作类客流和居住类客流。这与该类型站点周边既存在办公场所又存在居住区的事实相符,如万年泉路地铁站周边既有研究所、医院、学校、政府办公区以及各类有限公司等办公场所,又有各式住宅小区。

第3 类:就业导向型站点。站点客流时间分布图(图4(c)、(g))具有早高峰出站人数较多,晚高峰进站人数较多的特点,符合通勤人员早高峰出站上班,晚高峰进站下班的情况。相比其他站点类型,该类站点晚高峰进站的人员和早高峰出站的人员中,高概率轨道交通出行人群占比最多,表明该类型站点出行规律性较强,车站服务通勤类客流的特征较明显,这与该类型站点附近存在金融商务办公区和行政办公中心的实际相符。

第4 类:娱乐购物型站点。站点周中日均入(出)站客流量均小于周末,表明周末客流量更大。相比于其他类型站点,该类站点周中晚高峰出站客流量大(图4(h)),高峰值接近2 000 人次/d,表明晚上该类型站点较吸引人流量。这与该类型站点附近存在步行街和商圈,晚上和周末吸引客流的事实相吻合。站点客流时间分布图也具有突出的早高峰进站客流(见图4(d)),表明该站点周边也具有一定的居住属性。

3.5 不同类型轨道交通站点常规公交出行接驳服务建议

1)对于居住导向型站点,针对其整体客流量小、乘客出行时间随机的特点,建议提高小区周边公交站点步行可达性,将步行到公交站点的时间控制在5 min 以内,在固定区域范围内,以现有公交站点为基础,为市民提供1 分钟响应、动态发班的“区域巡游定制公交”服务,发展“灵活接驳轨道交通站点”的业务模式,在保障公共服务的基础上,提升公交运营效率。

2)对于职住混合型站点,由于早高峰进站客流中高概率轨道交通出行人群较多,对常规公交存在准点和快速到达轨道交通站点的要求,建议采用早高峰定制接驳公交形式,整合出行起止点、出行时间、服务水平相似的个体出行需求,设计个性化公交运行线路和站点,满足该类人员快速直达轨道交通站点的出行需求。

3)对于就业导向型站点,由于早高峰出站客流中通勤人员占比较多,对候车时间容忍度较低,建议以总换乘距离最短为目标,对接驳常规公交站点进行空间布局优化;以乘客总换乘时间最短为目标,优化接驳公交运营时刻表,减少乘客等待时间。采取准点到站的运营模式,将到站时间精确到±3 min 以内,实现从“赶公交”“等公交”到“准点上车”“掐点乘车”。

4)对于娱乐购物型站点,相比工作日,非工作日进出站客流量更多,大部分为娱乐购物人群,因此建议在保证与轨道交通站点接驳的同时,综合考虑乘客的出行时间、游玩、购物需求,串联起各大热门景点商圈和“打卡点”,形成休闲微循环线路,在每周六至周日、法定节假日以及旅游旺季等运营,以满足乘客出行需求。

4 结束语

本文利用轨道交通刷卡数据,基于乘客出行特征和客流分布特征,对轨道交通站点特征进行提取,应用K-Means 聚类算法将轨道交通站点分为就业导向型、职住混合型、居住导向型、娱乐购物型等4 类,并结合站点特征提出常规公交出行接驳服务建议。研究成果可为轨道交通站点功能分类提供参考,为优化常规公交接驳服务提供支撑。

由于数据可获取性,本文仅基于客流特征对轨道交通站点进行了聚类,未考虑其他非客流因素,如周边土地利用情况、居住人口数和就业岗位数等,而这些因素对站点分类精细度具有一定影响,在未来研究中,将考虑这些因素对轨道交通站点类型的影响,进一步提高站点功能分类的科学性。

猜你喜欢
工作日客流量高峰
病毒病将迎“小高峰”全方位布控巧应对
石庆云
基于嵌入式系统的商场客流量统计算法
关于休闲的量的问题的考察
雨天早高峰,自在从容时。
基于AFC数据的城轨站间客流量分布预测
从客流量推算公交出行PA矩阵的方法
新建旅游项目客流量分析方法初探
对《资本论》中工作日问题的哲学思考
郑州局办理业务全程提速