袁发涛,陈通箭,魏剑波
(重庆交通大学交通运输学院,重庆 400074)
截至2018年年底,我国共35个城市建成投运城轨线路185条,总运营里程5 761.4 km.城市轨道交通运营里程的不断增加和网络化的初步形成,使得轨道交通在城市公共交通的骨干作用日益明显.轨道站点是构成轨道交通网络的基本单元,是承载城市各种社会经济活动的聚集场所.轨道站点内部设施布局、功能定位、周边用地性质等都与轨道站点客流息息相关,为充分发挥轨道交通骨干作用,需要对轨道站点客流数据进行挖掘,精细化研究轨道站点客流特征.
国外对轨道站点客流特征研究较早,Robert Cervero[1-2]基于我国香港地铁数据,结合地铁站点周边房价波动信息,将地铁网络站点分为5类;Wei等[3]提出一种对客流量评分的公式,基于指标评分法将地铁站点分为3类.国外对于轨道站点研究往往基于成熟的轨道线网和接驳环境,对于我国轨道线网不完善的公共交通状况适应性有待考证.
近年来,国内对轨道站点及其客流特征研究逐渐兴起.吴娇蓉等[4]按照站点区位条件、站点周边地区土地利用性质、开发规模和强度等数据,将郊区轨道交通站点划分为7大类,并结合客流调查数据分析了客流分布规律.傅搏峰等[5]在此研究基础上,运用客流聚集效应函数曲线,界定郊区轨道站点影响范围,定义并计算不同类别用地的优势度指数,构建郊区轨道站点功能分类体系.李向楠等[6-7]综合轨道交通站点自身特点和站点周边环境特征,选取聚类分析变量,通过主成分分析法提取关键因子,对站点在各因素因子上的相似程度做定量计算,得到站点分类结果.戴子文等[8]参考我国相关规范,并分析总结国内外关于城市轨道交通车站等级划分研究,将车站分类归结于节点导向性和场所导向性2大类.结合客流量数据,提出车站分类及分类指标和相应的指标标准,将车站划分为2类3级.邓评心等[9-10]基于AFC数据,结合站点周边用地属性占比,定性分析与定量分析相结合,采用聚类算法并运用多元线性回归分析验证,将轨道交通站点分为多类.
已有相关研究多集中于轨道站点自身特性和周边环境对站点进行分类分级研究.本文基于AFC数据,多维度选取聚类变量,对轨道站点客流数据进行挖掘分析,探讨站点客流时空特性,并分析不同站点客流模式形成机理.
截至2018-10-30,重庆市主城区已开通运营轨道线路1号线、2号线、3号线、5号线、6号线(含6支线)、10号线,共计142座轨道站点(换乘站点不重复计算).本文分别采集重庆市主城区轨道线网2018年1月和10月(非节假日)乘客刷卡数据,平均每天大约有500多万条出行记录,每条出行记录包含进出站时间、站点编号、卡种等出行属性,具体信息如表1所示.
表1 重庆市主城区轨道刷卡数据
利用Python编程对原始数据进行清洗、处理,结合重庆市主城区轨道交通实际运营情况,得到每日06:00—24:00的乘客进出站出行记录.以轨道站点为基本单元统计分析单位时间粒度下的进出站客流量,分别得到进站客流矩阵A和出站客流矩阵B,完整而准确的乘客刷卡数据有利于对站点层面客流展开数据特征挖掘与客流模式识别.
依托轨道客流数据,针对轨道站点层面客流时空特征展开研究.分时段划分站点客流量,提取变量因子,根据变量因子选择合适方法,挖掘轨道客流特征、识别客流模式.聚类算法可有效挖掘数据内部特征,根据数据相似性将时空特性高度一致的站点客流归类分析.常见的聚类算法有划分法、层次法、基于密度的方法、基于网格的方法以及基于模型的方法.划分法基于“距离”对数据集进行相似性划分,使得同一簇中元素尽可能相近或相似,不同的簇中的元素尽可能远离或不同.K-means方法计算速度快,可解释性强,对大数据集的处理效率较高,本文采用K-means算法能对站点客流模式快速识别,适用于挖掘站点客流时空特征.
K-means聚类算法根据选取的初始聚类中心,将数据集中剩余元素,按照规则划分至各类别中,通过迭代算法对各聚类中心不断转移更新,直到满足迭代要求,得到最佳的划分结果.算法计算步骤如下.
步骤1对于给定包含m个元素的数据集,任意从该数据集中选取k个元素,作为初始聚类中心yi,i=1,2,…,k;
步骤2依次计算每个元素到初始聚类中心的距离d(xj,yi),j=1,2,…,m,i=1,2,…,k将各个元素xj按照“欧氏距离”最短原则划分到相应的聚类中心;
步骤4计算误差平方和准则函数G:
(1)
步骤5判断前后两次聚类中心是否满足迭代要求ε,若满足要求则迭代结束,若不满足要求,则返回步骤2.
K-means聚类算法虽计算简单,效率较高,但对初始聚类中心k值确定鲜有研究,为了判断聚类有效性,在对聚类算法结果的评估中使用了Dunn指数(D)、Xie-beli指数(XB)2个指标,计算式如下:
(2)
(3)
式中,n为数据集中元素个数;Ci为第i个类别;ci为Ci的聚类中心;d(x,y)为x和y的欧氏距离.D指数是不同类别中任意2个元素的最短距离与同一类别中任意2个元素的最大距离的比值,D值越大,说明类间差别越大,且类内差别越小,此时聚类结果最佳.XB是每个元素与其聚类中心均方距离与聚类中心之间最小平方聚类的比值,XB取值越小,聚类效果更好.D指数、XB指数旨在评判聚类中心k值数目的合理性.
通过采集重庆市主城区轨道全网2018年10月某1天的刷卡数据,利用Python 编程得到各站点全日进出站客流数据.分别选取进站、出站客流数据为聚类变量,将每日06:00—24:00共18 h客流数据按0.5 h划分,则每条站点数据包含36个变量,共获得5 112个(142个站点×36)变量用于聚类,结合初始聚类中心值评价指标,确定聚类数k值为6,聚类结果如表2、表3所示.
表2 进站客流聚类结果
表3 出站客流聚类结果
以进出站客流数据为聚类变量,以进站数据在前,出站数据次之的顺序排列,得到进出站客流矩阵C(A,B)142×72,则每条站点数据包含72个变量,共获得10 224个(142个站点×72)变量用于聚类,结合初始聚类中心值评价指标,确定聚类数k值为6,聚类结果如表4所示.
为探究不同轨道站点类型随轨道交通建设规模的发展和周边建筑环境变化对聚类结果的影响,本文利用相同数据处理方法对重庆市主城区轨道全网2018-01-01乘客进出站刷卡数据进行聚类分析,聚类结果如表5所示.
由表2~表4不同输入变量聚类结果可知:进站客流数据能较好反映住宅密集区域轨道站点;而出站客流数据则较好地刻画商务娱乐、工作岗位密
表4 进出站客流聚类结果
表5 2018年1月某日进出站客流聚类结果
集区域轨道站点,进出站客流数据能更好地挖掘不同轨道站点的客流模式.由聚类结果可知,进站客流与出站客流在聚类结果上有偏差,但出站客流与进出站客流聚类结果更接近,更能反映基于数据的不同类型轨道站点乘客出行特征.
由表4~表5聚类结果可知,2018年1月与2018年10月刷卡数据进出站客流聚类结果有所差异,主要体现在类别Ⅳ、Ⅴ、Ⅵ较小客流站点上,聚类结果变化站点主要位于重庆轨道5号线、10号线,这2条轨道线路于2017年年底开通运营.分析该部分站点不同时期客流量指标如图1、图2所示,该类站点日进站客流总量和各时段客流量均有所上升,结合实际分析可知,随着轨道交通建设规模扩大、线网不断完善、新线接入等都会对站点分类结果造成一定影响.
图1 站点单日进站客流总量
图2 站点各时段进站客流量
由表4聚类结果可知,类别Ⅰ唯一代表站点是光电园,进出站客流变化如图3所示,图中正负仅代表进出站含义,客流量均为正数.全天早高峰以出站客流为主,晚高峰以进站客流为主,除早晚高峰其他时段客流稀少,是一个典型的工作岗位密集的非商圈区域.光电园是重庆规模最大、高精尖领域最为集中的地区,高新科技产业丰富,且居住人口较少,因此该区域全天客流量呈现明显单峰潮汐现象.
类别Ⅱ代表站点为观音桥,进出站客流变化如图4所示.全天客流有明显早晚高峰,早晚高峰进出站客流量较大,平峰时间段客流明显高于其他站点,无低谷状态,且夜晚20:00—22:00客流出现小高峰.这是典型的工作岗位密集商圈地区,与观音桥、小什字轨道站点连接的重庆最重要的两大商圈观音桥步行街和解放碑商圈现状相吻合.
图3 类别Ⅰ代表站点
图4 类别Ⅱ代表站点
图5 类别Ⅲ代表站点
图6 类别Ⅳ代表站点
类别Ⅲ代表站点为大坪和南坪,进出站客流变化如图5所示.全天客流有明显早晚高峰,各时段进出站客流不及类别Ⅱ多.与类别Ⅰ、Ⅱ相比,进出站客流潮汐现象较弱,而进出站客流呈显著同步性,是居住人口密集的城市组团商圈地区.该类站点主要分布于南坪、沙坪坝、大坪等城市次级商圈附近.
类别Ⅳ代表站点为长生桥和花卉园,进出站客流变化如图6.客流变化与类别Ⅰ相反,虽不及类别Ⅰ峰值,但仍具有明显潮汐现象,早高峰以进站客流为主,晚高峰以出站客流为主.此类站点为居住人口密集型-换乘便捷型区域,主要分布于大中型住宅区以及公交-轨道换乘集中区域附近.
图7 类别Ⅴ代表站点
类别Ⅴ代表站点为重庆北站南广场和江北机场T2航站楼,进出站客流变化如图7所示.全日各时段客流较平均,无明显客流高峰和低谷,但客流相对较大.此类站点多为轨道站点与城市对外交通枢纽接驳站点,以及轨道站点与大型公交换乘接驳站点.
类别Ⅵ代表站点为刘家坝和曹家湾,进出站客流变化如图8所示.全日进出站客流量较少,早晚高峰不明显,此类站点分布于轨道线网两端城市郊区地带,与一般公交途经站点接驳,站点辐射区居住人口稀少,就业岗位缺乏,为一般性轨道途经站点.
图8 类别Ⅵ代表站点
本文提出一种基于AFC数据的不同站点分类研究方法,该方法采用K-means算法,按照不同聚类变量,对轨道站点进出站客流数据进行挖掘,将重庆市主城区142个轨道站点分为6种乘客出行特征,并探讨随轨道交通建设规模的发展和新线接入对聚类结果的影响,最后分析不同类型站点时空特性.在今后的研究中,笔者将从更多维度对客流数据进行挖掘分析,寻求客流内部关联,为精细化研究轨道站点客流提供更为准确的理论方法与推广应用.