张铁岩 高洪振 禚保玲 胡 倩
(青岛市城市规划设计研究院,青岛 266071)
公交客流出行调查难度较大,随着公交IC卡收费系统和车辆运行调度管理系统的发展普及,产生了大量公交客流和车辆运行数据,基于IC卡数据的公交非集计分析手段在国内外各城市中得到广泛研究和应用[1-3],通过采用公交IC卡数据融合技术,推算整个公交系统乘客出行起讫点,可以更加准确掌握公交客流的时空分布特征及公交运力供需关系,同时也将节省大量人工调查时间和成本。
由于各城市在公交刷卡收费模式和车辆运行调度管理系统完善程度上存在差异,造成了IC卡数据分析方法差别较大。对于分段计价线路,乘客上下车均需要刷卡,通过关联车辆GPS数据和简单的聚类排序则可以得到完整公交出行链信息。而目前国内公交运行系统主要采用的是单一票制,乘客仅在上车时刷卡,且刷卡记录本身不包含上、下车站点位置信息。
在公交系统的IC卡分析技术研究中,CHUKKA[1]提出前期数据处理质量对融合结果有重要影响;PAEZ[2]、TREPANIER[3]从公交底层数据存储、IC卡数据深度应用角度对公交数据提出规范化要求;Chu[4]、LEE[5]、Barry[6]等人分布利用GPS数据和IC卡数据,提出融合分析方法;吴子啸[7]以郑州为例详细阐述了公交数据与交通模型之间关系和应用;Takahiko[8]、马晓磊[9]在公交IC卡分析中提出贝叶斯算法,以弥补信息缺失问题;陈绍辉等[10]利用禁忌搜索算法对系统偏差数据进行二次匹配,提升了匹配精度;刘文芳[11]、胡郁葱[12]、吴祥国[13]、杨万波[14]等人分别针对成都、广州、重庆、佛山数据特点进行了针对性的分析研究;陈学武及其合作者[15-17]针对不同的数据场景,分别阐述了公交IC卡数据融合方法。
青岛公交收费系统采用的是单一票制,同时拥有较为完善的GPS数据和运营调度数据,本文结合青岛公交系统数据特点,上车站点识别方法采用IC卡数据与GPS数据关联推算,下车站点识别方法采用出行链算法。并利用交通宏观需求分析软件EMME,对模型参数进行标定和交通分配,将分析结果与手机信令数据和建筑数据进行相关性分析,证明了结果有效性。
青岛市公交IC数据主要字段包括线路名称、卡号、刷卡时间、POS机编号、卡类型等,GPS数据主要字段包括线路名称、车辆编号、到站时间、离站时间、站点编号。结合站点、车次信息表,将公交IC卡数据与GPS数据进行时间匹配,从而确定每位乘客上车刷卡线路和站点。本次采集公交数据为青岛市2015年9月14日-20日一个完整周的IC卡和GPS数据,其中IC卡数据共计1361万条记录,日均记录194万条,平均每秒约22.5次刷卡记录,共包含334条公交线路刷卡数据。GPS数据共计1396万条记录,日均记录199万条。公交IC卡刷卡数据样表、公交GPS数据样表分别见表1、表2。
为方便管理各类数据表,基础数据存储采用SQL Server、算法处理采用Python语言编程、交通分配采用EMME4中5.11模块(Prepare for standard traffic or transit assignment)和5.31模块(Standard transit assignment)。数据处理总流程如图1所示。
上车站点推算流程如图2所示,首先对GPS数据进行预处理,主要包括剔除重复报站、统一线路编号、规范时间格式及空值记录清洗等工作,将处理好的公交车辆到离站位置信息表同IC卡数据按照车次和时间进行匹配,并记录各线路原始刷卡量,进而对上车站点初始匹配数据再次进行数据清洗,包括剔除一次刷卡记录数据,将数据按照卡号、时间排序,形成预处理后上车站点数据。
表1 公交IC卡刷卡数据样表
表2 公交GPS数据样表
图1 数据处理流程
图2 公交IC卡数据上车站点处理流程
下车站点推算采用的出行链算法,并且基于以下两个假设条件:假设1:公交出行者第一次刷卡站点也是其当日出行终点;假设2:上一次刷卡线路中,离下一次刷卡上车站点最近的站即为上一次公交乘车下车点。
另外,对于换乘乘客来说,上一次公交乘车距离或路况不同会导致前后两次刷卡时间差存在较大差异,单纯采用两次刷卡时间差或换乘距离作为判别换乘的约束参数,势必会造成对部分长距离出行者误判。基于以上考虑,本文采用换乘距离和速度两个约束参数作为换乘点判别参数。即作为换乘点需满足两个条件:上一次乘车的下车点和下一次乘车上车点距离应在一定阈值范围内,用Δl表示;上一次乘车出行距离和前后两次乘车刷卡时间差比值应在合理范围内,公式表示为:
l/(T-Δt)≤v临界
式中,l为上一次乘车距离,T为两次乘车刷卡时间差,Δt为换乘等待时间,v临界为速度阈值。
下车站点推算具体步骤如下:
(1)基于以上假设,将上车站点数据按卡号、时间排序后,每次提取同一卡号相邻两条刷卡记录。
(2)根据下一条记录上车点B,搜索上一条记录中对应线路的最近站点A2,作为上一次乘车下车点,并计算上一条记录中上车站点A1和站点B站点间距离lA1B。
(3)若lA1B>Δl则无法判断下车点,转(5)。
(4)若lA1B≤Δl则计算上一次出行距离l,若l/(T-Δt)≤v临界则标记为一次出行,否则标记为换乘点。
(5)重复上述操作,直至最后一条记录。
公交IC卡数据下车站点处理流程如图3所示。
图3 公交IC卡数据下车站点处理流程
众所周知,公交出行量与公交站点和线路布设关系密切,而在便捷公交出行条件下,则与该区域的建筑规模及人口、岗位数量有直接关系,基于以上理解,选取中心城区范围内有公交站点的1平方公里网格聚合数据,与相同网格范围内手机信令数据、建筑地块数据进行相关性分析,对公交IC卡分析结果开展多源数据校验。
青岛市手机信令数据基于2015年9月数据分析结果[18](与公交IC卡数据时间一致),信令数据字段包括手机号伪码、手机号前七位、信息采集时间、LAC区号、基站编号、基站经纬度;建筑数据为2015年青岛市中心城区建筑地块集合,共计14.9万个建筑物,附带建筑基底面积、层数、用地性质等属性。
将青岛市中心城区按照1km×1km网格划分,分别统计各网格单元内公交IC卡乘降量、手机信令人口岗位数、建筑面积,并基于ArcGIS,采用自然断点分级法(Natural Breaks),对比各指标整体空间分布特征,如图4所示,各指标均总体呈现由南部沿海核心区向外围递减趋势。
采用SPSS对上述网格数据指标进行Pearson 相关性分析,每类指标均包含576个有效样本。结果表明:手机信令人口岗位数、建筑面积均与公交IC卡乘降量在0.01水平(双侧)上显著相关,相关系数分别为0.778、0.736,属于强正相关关系(表3),即手机信令人口岗位数或建筑面积越高,公交乘降量越高;反之,手机信令人口岗位数或建筑面积越低,公交乘降量越低(图5)。通过对多源数据校验表明:公交IC卡数据分析结果具有较高可信度,可以清晰反映城市人口分布、用地开发强度与公交客流规模关系,为精细化城市公交规划、建设、管理提供科学决策依据。
图4 青岛中心城区1km网格公交乘降量、手机信令人口岗位、建筑面积空间分布
图5 公交乘降量与手机信令人口岗位、建筑面积相关关系散点图
表3 公交乘降量与手机信令人口岗位、建筑面积相关系数
表4 客流指标汇总
工作日公交总体客流早高峰集中在7:20-8:20时段,占全日客流的12.3%;晚高峰集中在17:10-18:10,占全日客流的10.2%,晚高峰低于早高峰。学生卡和普通卡有明显早晚高峰,符合通勤、通学的出行特点。普通卡刷卡量约占全部样本的66%,决定了全部刷卡人口的总体趋势。学生公交客运量占比最低,仅占总客运量的5%,受学生上下课时间制约,学生卡早高峰出现在6:30-7:30,明显早于其他两种卡类型,晚高峰出行时段在17:20-18:20,与普通卡时间叠加,且学生出行高度集中,早晚高峰两个小时出行量占学生总出行量的50%,早晚高峰之间几乎没有出行。老年卡持有者出行时间聚集度低,且早高峰较滞后,晚高峰提前,说明老年人对出行时间要求较低,体现出老年人退休生活特点。客流指标汇总见表4;工作日不同卡类型客运量变化如图6所示。
图6 工作日不同卡类型客运量变化
从公交客流集散量空间分布上看,东岸城区李村商圈、台东商圈、火车站周边、香港路沿线、四流路-人民路-威海路沿线、延安路沿线都是客流集散量比较大的区域;北岸城区集散量较大的区域集中在正阳路沿线和汽车北站周边,但单个站点集散量明显低于东岸城区。排名前十位公交站点日集散量均在3万人次以上,其中最大的客流集散点为台东,日集散量达5.2万人次;其次是维客广场,日集散量为5万人次(图7),公交客流集散点前十位见表5。
图7 公交客流集散点空间分布(单位:次/日)
表5 排名前十位公交客流集散点
基于交通宏观需求分析软件EMME对公交OD进行交通流量分配,得到公交流量分布图(图8),东岸老城区内客流十分密集,由南向北客流量逐步减少,客流总体分布呈偏心辐射式。其中,辽阳路以北客流以南北向运动为主,辽阳路及以南客流东西向运动也很明显;北岸城区内部公交客流以正阳路为中轴向外辐射;西岸城区受地理因素的影响,公交客流总体呈现侧“U”型分布特点。
青岛中心城区围绕胶州湾分别形成东岸城区、北岸城区、西岸城区三大组团,同青岛城市空间发展格局一致,常规公交在三大组团中自成体系。结合线网和站点布局发现:北岸城区建成区范围线网密度为1.9 km/km2,高于西岸城区的1.5 km/km2,同时北岸城区300m半径站点覆盖率为50.8%,高于西岸城区的46.8%,可见北岸城区公交覆盖水平高于西岸城区,且两城区人口规模接近,但北岸城区公交客运量远低于西岸城区,表明北岸城区公交出行比例仍处于较低水平(2015年公交方式结构仅为12.08%),公共交通在城市交通中的重要作用尚未得到很好的发挥。随着机动化水平的快速提升,北岸城区要使城市交通可持续发展,需要进一步加强引导,强化居民公交出行理念,增强公交对居民出行的吸引力。
本文以青岛市为例,介绍了公交IC卡数据融合分析方法,并对结果进行了校验和展示。公交IC卡收费系统已经在国内得到普及和应用,相对于传统公交调查,基于该系统的数据融合分析技术,具有样本量大、低成本见效快、长期持续检测等优势。在对公交需求深入分析的基础上,通过整合公共交通系统的路网、线路、站点及各类运营信息,对公共交通系统供需关系进行建模和仿真,寻找公交服务在时空上的薄弱环节,可以为线网规划和优化等实际工作提供决策支持。
图8 公交客流分布图