基于公交IC卡与GPS数据的公交客流可视化分析

2018-10-09 08:43李文锋林艳玲林小伟王桦泉
交通科技与经济 2018年5期
关键词:候车IC卡刷卡

李文锋,林艳玲,程 远,林小伟,王桦泉

(厦门卫星定位应用股份有限公司,福建 厦门 361000)

随着城市化建设的不断加快,日益增长的交通需求同相对滞后的交通供给之间的矛盾越发突出,交通拥挤、环境污染、交通安全事故等问题普遍存在于各个城市之中。发展方便快捷的城市公共交通,使其成为广大出行人群的首选是解决上述问题的关键。科学的公交调度与合理的线网规划促使公共交通系统高效运营,而公交调度和线网规划都依赖于对客流全面、准确的分析和预测。因此,基于公交IC卡刷卡大数据,结合公交GPS数据对客流进行精准预测分析具有重要意义。

国内外研究学者已经对交通领域客流预测算法展开深入研究,如对地面公交和轨道交通的客运总量、区间断面流量和车站进出站客流等客流指标进行研究和预测,郭娟等提出了“四阶段法”对交通需求进行预测,通过居民的出行调查,掌握居民全方位的出行分布;谢英豪等提出了有向图方法统计断面客流;周高卫等运用TransCAD计算机仿真进行客流量分配和客流计算,得到预测年各项客流指标;杨军等利用灰色马尔科夫算法模型对大型活动客流特征进行预测分析。

不同的学者考虑到的客流因素不尽相同,提出的算法虽然在一定程度上达到分析预测效果,但针对的客流分析点大多单一,未能利用多元的数据对客流进行多点综合分析。本文将多元的公交IC卡刷卡数据与公交车辆的GPS数据相结合,优化目前现有的客流分析算法,结合概率论模型、聚类分析模型、回归分析模型、平滑预测模型对公交站点客流、客流OD、乘客候车时长、公交运力、客流堆积以及公交发车间隔进行多维度的客流综合分析和预测,从多方面体现公交客流特征与规律。

1 原始数据采集与预处理

1.1 原始数据采集

原始数据主要有海量公交IC卡刷卡数据、公交车GPS定位数据,以及辅助中间表,如站点信息表、线路信息表、终端设备信息表等。

1.1.1 公交IC卡刷卡数据采集

随着公共交通系统的日益完善,公交线路延长、覆盖范围扩大,一票制已逐渐不能满足需求,通过乘客上车刷卡与下车刷卡的方式来计价的无人售票分段收费制将成为主要手段。本文提出的研究针对乘客上车刷卡与下车刷卡的无人售票分段制,不包括没有下车刷卡的数据处理。本文的研究方法采集分段收费制的IC卡刷卡数据,数据来源为公交集团及城市公交卡相关公司,一手数据保证数据来源的可靠性。公交IC卡原始刷卡数据主要字段包括:卡号、交易额、网点号、终端号、交易类型、交易时间。采集而来的原始刷卡数据如表1所示。

表1 公交IC卡数据

1.1.2 公交车GPS数据

GPS数据来源于公交车台上报的实时定位数据,精准记录了车辆的运行轨迹,主要字段包括终端号、GPS时间、进出站类型、线路编号、站点序号、上下行。

表2 公交车GPS数据

1.2 数据预处理

1.2.1 数据清洗

为更好地提高数据分析结果的准确度,适应模型构建和分析,必须将采集而来的数据进行清洗、融合、变换和归约等预处理操作,矫正异常数据。

由于城市公交线路繁多且数量庞大,公交的运营由不同公交公司分管,采集而来的数据缺乏统一规范,加上乘客使用的城市IC卡多种多样,包括普通卡、老人卡、异型卡、学生卡等,这些IC卡的卡号又包括卡内号和卡面号,需要使用IC卡固有的卡号转换规则对卡号统一,规范数据,将IC卡的卡号转换成同一类型。

公交IC卡刷卡数据可能因为刷卡动作和终端环境等方面的影响而产生异常数据,这些数据如果不清洗排除,可能对分析结果的准确性造成影响,数据异常包括:噪音数据、不完整数据、冗余数据、错误数据等。

冗余数据和错误数据会对结果产生误导影响,不能作为分析数据,如内部员工的刷卡数据、同站进出刷卡数据等,系统通过进出站点筛选同站进出刷卡数据、卡类型匹配筛选出内部员工数据,给予删除操作;不完整数据是由于数据上传过程中信号偏差而导致关键字段不完整,无法确认其真实性,如只有上车站点刷卡或下车站点刷卡记录,此类记录只保留作为客流统计,不做OD匹配。

1.2.2 IC卡数据与车辆GPS数据匹配

本文获取以及研究的IC卡刷卡数据为先进站刷卡再选择车辆上车的计费模式,如BRT、轨道交通的刷卡模式。刷卡设备终端与车辆没有匹配,乘客上哪一辆车是未知的,所以需要对数据进一步处理。

首先将IC卡号归类并按刷卡时间排序,根据刷卡时间和进出站类型匹配出乘客的OD数据,匹配后的主要字段有卡号、进站刷卡时间、出站刷卡时间、进站站点、出站站点、可乘坐线路。

OD数据匹配完成后,通过GPS数据匹配乘客的乘坐车辆。首先,按日期遍历每天乘客OD数据,筛选出当天的OD数据,对于每条OD数据,根据乘客的上车刷卡时间、下车刷卡时间筛选出在这两个时间前到达站点的车辆GPS数据,将与乘客上下车时间最接近的车辆作为乘客的乘坐车辆,可以得到乘客每一次出行与车辆的对应关系,存储入库备用,一天数据的具体匹配流程如图1所示。

2 客流大数据分析建模与可视化技术

2.1 站点客流热力分析

车站客流对行车调度指挥、车站运营组织、客流疏导和安全管控具有重要指导意义。本文运用聚类模型对公交车站的站点客流进行统计分析,云计算中心获取到数据之后,每天实时根据乘客的上车站点聚类,按小时段统计每个公交站点的客流量,数据以增量的方式存储入库,同时将数据接入自主开发的可视化系统,生成公交站点客流热力分布图,利用GIS技术将公交站点客流量热力图层与地图图层叠加,以热力图的方式展示站点客流分布,并支持分时段的统计查询,便于分析站点的乘客分布规律。

图1 OD数据与车辆匹配流程

图2是以厦门公交客流数据为基底,经过客流可视化技术处理后的结果,展示了厦门公交早高峰和晚高峰的客流分布特征,从图2可以看出客流潮汐分布特点,早高峰时段客流从岛外涌入岛内,晚高峰时段客流由岛内流出岛外。可根据客流分布的潮汐特点,调整公交不同时段的运力部署,使其更能适应乘客需求。

图2 厦门市高峰期客流热力分布

2.2 客流OD需求分析

公交客流OD是指公交乘客出行的起止点分布,反映了公交乘客的出行偏好规律。公交客流OD是城市公共交通网络规划和管理的基础决策参考数据,为公交运营调度、公交线网优化、公交出行预测提供最可靠的数据支持,精确的客流OD 才能保证运营计划的科学制定和人、车资源的合理调配。

本文建立客流OD聚类模型,在云计算中心每天获取到预处理完的客流OD数据后,对乘客上下车站点采用聚类方法归约,将同一上下站的乘客数据分时段统计,得到每一天每时段的客流OD统计数据,存储入库,同时将数据接入可视化系统,通过颜色分级和箭头导引的方式直接展示客流OD分布情况,并支持分时段查询,便于挖掘乘客的出行规律,为线网优化提供科学依据。图3是以厦门市BRT客流数据为基底,经过客流可视化技术处理后的客流OD展示结果。

图3 厦门市BRT客流OD分布

2.3 站点候车时长分析

公交乘客的候车时长很大程度上反映了公交的服务水平,本文根据乘客IC卡刷卡数据与公交车GPS到离站数据的精准匹配,结合对乘客候车行为的抽样调查,计算得出每个乘客每个出行站点的候车时长。

在对数据进行预处理后,云存储中心已存储每位乘客每次出行的OD数据,包括进站刷卡时间Ti、进站刷卡站点S、出站刷卡时间To、出站刷卡站点、乘坐车辆等。由于乘客从刷卡闸机到达候车地点需要一定的时间,设这个时间参数为ts,则在S站点单个乘客的候车时长Ts可表示为

Ts=Ti-ts-To.

首先对公交车站类型进行分类,相似建筑结构的车站归为一类,使用同一个时间参数。对于不同类型的公交车站,本文采用随机抽样调查的方式,确定大样本容量,n点的估计量等于样本乘客从刷卡闸机到达候车地点的时间平均值,用样本估计整体,得到每一个车站的时间参数ts。

获得每一个乘客的候车时长后,根据进站站点对乘客聚类,求得每个站点的乘客平均候车时长,经过可视化分析系统处理,展示乘客候车时长信息,并支持按日期和时间段查询。图4是以厦门BRT客流数据为基底的某条BRT线的候车时长分析结果,右下角小窗口展示候车时长最长的10个站点数据,经数据可靠性测试,候车时长的统计误差在可接受范围内,通过可视化结果。可直观看出每个站点乘客的候车时长情况,对于候车时长异常站点,可及时做出调整方案,提高公众的乘车体验。

图4 厦门市BRT站点候车时长分析

2.4 断面客流分析

公交断面客流是指在单位时间内通过公交线路某一区间的客流量。断面客流是线路能力配置和网络能力协调的基础,本文将公交站点编号并抽象为向量集合,通过分析乘客出行轨迹站点向量集合及出行时间,建立断面客流算法模型,以0.5 h为时间粒度,分析得到每0.5 h断面客流量,并可通过选择任意两个站点计算其断面客流量。

步骤1:将每一条线路上的站点按顺序编号v1,v2,…,vn,确定所选断面之间的站点向量集合V={v1,v2,…,vn}。

步骤2:选出符合所选时间段内出行的乘客集,根据每位乘客所乘坐的车辆,匹配乘客所乘坐的线路,从而匹配出每位乘客出行站点ID向量集合Ki={k1,k2,…,ki}。

步骤3:求V与Ki的交集Ei,若card(Ei) > 2,即V与Ki有两个以上的站点ID相同,则判断该名乘客途经该断面,统计所有符合条件的乘客数量,得到所选时间段内的断面客流量。计算步骤如图5所示。

图5 断面客流算法流程

断面客流算法模型是将一天划分为48份,每0.5 h为一个时间粒度,计算公交线路任意两个站点之间的断面客流,并将结果可视化,可以查询任意时间段内任意断面之间的客流量,为公交线网优化提供有效的决策依据。如图6所示,以厦门BRTK1线路的断面客流为例,展示每一相邻站点的断面客流情况,双击断面可查看断面的具体客流数据。

2.5 站点客流堆积分析

公交车站的客流滞留情况关系到公交客流运载输送力与乘客出行体验,公交车站客流过度拥挤可能还会造成安全事故,所以,对公交站点客流的滞留情况监控尤为重要。本文通过实时统计车站滞留的客流量达到对站点客流堆积情况的分析。

图6 厦门市BRT K1线路断面客流

在数据的预处理过程中,已匹配好乘客和所乘坐的车辆,已知乘客进站刷卡时间To,所乘坐车辆离站GPS时间T,客流堆积时间长度系数t(可自主配置)。车站滞留的客流量等于上一时段未上车的客流量Ni-1加上当前时段刷卡进站的客流量Count(To),再减去当前时段上车的客流量Count(T)。

从每一天的凌晨4:00开始计算,在4:00—4:00+t时间段内滞留在车站候车的乘客数量:N1=0+Count(To)-Count(T),其中,4:00<=To< 4:00+t,4:00<=T<4:00+t。在ti~ti+t时段内滞留的客流量Ni=Ni-1+Count(To)-Count(T),其中,ti<=To

图7 厦门市BRT K1线路站点客流堆积分析

3 结 语

本文基于公交IC卡刷卡数据与GPS数据,主要针对上下车刷卡的分段收费制数据,建立公交客流大数据可视化分析模型,针对公交站点客流、客流OD、站点候车时长、断面客流、站点客流堆积等方面进行精准分析,并将分析结果可视化,通过地图显示,支持条件查询。本文所阐述的方法不仅仅局限于公交IC卡刷卡数据,同样适用于移动支付的数据,只要符合上下车的刷卡模式,都适用本文的分析方法。

通过客流可视化综合分析系统,以历史客流大数据为参考,实现对短期内公交客流量的预测,公交站点客流分析有助于对客流拥挤的站点进行客流疏导和安全管控;客流OD分析结合断面客流分析,反映了乘客出行轨迹规律,为公交线网优化与调整提供科学参考依据。站点候车时长结合站点客流堆积反映了公交运送能力和乘客出行体验,分析的结果可辅助公交运营调度决策;通过历史数据的变化趋势,可以预测未来短期内的公交客流情况,对于不合理的运营,可提前做出调整。总之,基于现有研究易于获得公交IC卡大数据以及GPS数据,本文研究成果可作为线路设计、场站规划、线路调整、运营调度的决策辅助工具。

猜你喜欢
候车IC卡刷卡
工商业IC卡控制器改造为物联网控制器实践
无限追踪
铁路客运站候车区运用多目标优化模型研究
隔着坐
在用电梯加装外接式IC卡运行控制系统设计改进
刷卡
长春开通公交IC卡充值平
刷脸就可以购物
湖北省高速公路IC卡管理系统浅谈
候车大厅