公共汽((电))车乘客上下车站推算方法

2018-12-20 06:11郑海星朱海明
城市交通 2018年6期
关键词:IC卡刷卡换乘

郑海星,朱海明,蒋 寅,陈 锋,葛 涵

(1.天津市城市规划设计研究院,天津300201;2.天津市市政工程设计研究总院,天津300201;3.中国地铁工程咨询有限责任公司,北京100037;4.天津市公安交通管理局,天津300201)

0 引言

客流特征是公共汽(电)车线网规划、运营组织优化的重要依据。全面、系统的客流特征挖掘与分析对于提高行业决策、管理水平,推动行业准入、监管、补贴等制度的建立和完善,促进城市经济的可持续、健康发展具有重要意义[1]。获取公共汽(电)车客流特征的传统技术手段主要是人工调查,包括人工计数和问卷调查等。受技术手段及成本等条件限制,人工调查数据存在样本量较少、随机性较大甚至样本偏差等问题,难以对公共汽(电)车网络的客流特征进行全面、深入的客观评价。公共交通行业规划与管理亟须得到科学化、信息化技术手段与方法的支撑。

近年来,公交IC卡(以下简称“IC卡”)收费系统在各城市得到广泛应用。IC卡交易数据详细记录了卡号、公共汽(电)车或轨道交通线路、车辆、交易时间、交易费用等乘客使用公共交通系统的相关信息,为城市公共交通系统的客流分析提供了宝贵的数据资源。然而,由于IC卡收费系统建设时未充分考虑交通分析方面的需求,数据中缺少一些关键的出行信息。如一票制公共汽(电)车线路的IC卡数据缺少乘客上下车站、下车时间等关键信息,给客流分析带来不便,难于进行深度的数据挖掘[2]。为了弥补上述不足,国内外研究人员通过IC卡数据与车辆GPS数据的融合处理分析,针对乘客上下车站信息推算开展了一系列研究。

上车站推算方面,文献[3]将IC卡数据进行时间聚类后,通过每类的时间标签与车辆经过站的估计时间进行上车站匹配。文献[4-5]利用GPS数据和IC卡数据融合,通过车辆到站时间和乘客刷卡时间进行匹配,实现上车站的推算。文献[6]根据GPS和IC卡数据时间上的匹配性,以及相邻站间GPS到站间隔时间与相邻IC卡聚类间隔时间的相似性,进行上车站推算。文献[7]在GPS和IC卡数据融合处理分析的基础上,以单个用户为基本处理单元进行上车站推算,并进一步考虑了GPS系统与IC卡系统时钟差等问题。

下车站推算方面,文献[8]以单个乘客为基本分析单元,通过乘客上车站与下车站之间的空间关系确定下车站。文献[4]利用GPS数据和IC卡数据融合,通过通勤乘客往返起终点相呼应的特点,推断其下车站。文献[9]在GPS信息缺乏情况下,仅依靠上车时间数据,通过换乘分析和聚类分析,确定乘客下车站。文献[10]结合出行链的概率模型,判断随机下车站。文献[7]提出基于首末次出行(同一线路)、连续换乘、历史出行概率等推算下车站。

上述算法或未考虑时钟差和乘客滞后刷卡问题,或推算规则不完善而容易发生误判与漏判,或基于单个用户处理而影响效率等。鉴于此,本文提出一种基于聚类相似度和数据融合的公共汽(电)车乘客上下车站推算方法。将IC卡数据进行时间聚类后,以聚类为基本分析单元,根据其中值与对应车辆GPS到站时间区间的关系处理乘客滞后刷卡问题。通过不同平移量下IC卡聚类时间标签向量与车辆GPS推算开门时间向量的相似度,分析处理IC卡数据时钟差问题。综合考虑换乘关系、首末次出行关系(含当日首次与末次出行、当日末次与次日首次出行)、通勤往返关系以及乘客乘坐公共汽(电)车线路的选择多样性等实现下车站的有效推算。选取天津、深圳两个城市进行应用,从宏观、微观两个层面进行验证,并探究公共汽(电)车客流与轨道交通的一体化衔接关系,为进一步提升天津滨海新区公共交通服务水平提供支持。

1 数据准备

1.1 数据概况

数据主要包括动态营运数据与公共汽(电)车、轨道交通线路车站基础数据等。

1)GPS到离站数据:通过对原始GPS数据进行预处理,生成车辆的GPS到离站时间信息表,主要包括线路ID、线路名称、车牌号、趟次ID、行车方向、站序、车站ID、进站时间、离站时间等信息。

2)IC卡数据:包括公共汽(电)车与轨道交通刷卡数据。通过对IC卡明细数据进行预处理,生成IC卡信息表,主要包括卡号、刷卡时间、车载刷卡终端设备、车牌号码(或轨道交通车站)、刷卡费用等。

图1 站组聚类分析Fig.1 Station clustering analysis

3)线路日客运量:分线路、分方向、分日期统计客运量,含刷卡客流与现金客流,用于线路车站推算客流的扩样分析。

4)线路车站基础数据:主要包括线路ID、线路名称、方向、站序、车站ID、车站名称、车站经纬度等。

为提高推算效率,对线路车站数据进行预处理。针对同一车站不同站台进行空间聚类,形成站组。聚类条件为:公共汽(电)车站名字相同或相似,且距离小于150 m(如图1所示)。平均站台间距在100 m以内的车站约占89%,在120 m以内的约占92%,在150 m以内的约占95%。

图2 换乘时间可达性阈值分析(公共汽(电)车之间换乘)Fig.2 Threshold of time accessibility(transfer between buses)

图3 换乘空间可达性阈值分析(公共汽(电)车之间换乘)Fig.3 Threshold of space accessibility(transfer between buses)

1.2 换乘识别参数敏感度分析

算法主要影响参数包括换乘时间可达性阈值Δt(相邻两次上车刷卡的间隔时间)和换乘空间可达性阈值Δd(前一次乘车下车站与本次乘车上车站的距离)。为进一步合理确定参数取值,以天津滨海新区公共汽(电)车下车站推算结果为例,对不同参数取值对推算结果的影响敏感程度进行分析。

1)换乘时间可达性。

如图2所示,随着换乘时间可达性阈值Δt的增加,初步识别(仅满足时间可达性条件)的换乘系数不断增加,且当Δt>90 min时,初步识别的换乘系数的变化趋于稳定。

2)换乘空间可达性。

如图3所示,随着换乘空间可达性阈值Δd的增加,下车站推算率逐渐增加,且当Δd>1 km时,下车站推算率趋于稳定。

2 模型建立

2.1 基于聚类相似度的上车站推算

1)选取单车单天GPS到离站数据、IC卡数据,并分别按时间排序。

2)基于时间对IC卡数据聚类。聚类条件为相邻时间间隔<Δt(一般情况下,同车站上客刷卡间隔时间小于72 s[9])。对于乘客滞后刷卡或者其他原因造成的同站上车乘客刷卡时间超过72 s的,表示为多个聚类。另外,将聚类对应刷卡时间的最小值作为其时间标签。

3)计算GPS到离站时间均值,作为推算的车辆开门时间,并以该时间作为与IC卡刷卡时间匹配的基础。

4)考虑时钟差问题的IC卡刷卡时间最佳平移量确定。选取目标车辆的GPS推算开门时间向量M与对应IC卡聚类的时间标签向量N(该聚类第一条记录的刷卡时间),分别对向量M与第k次平移后的IC卡聚类的时间标签向量N进行相似度检验,并选取相似性最好(即相似度评价指标F值最小)时的平移量作为最佳平移量(见图4)。

式中:Mj为车辆在第j个车站的推算开门时间;Nk,j为该车辆IC卡聚类在第k次平移后匹配至车站j的IC卡聚类的最小时间标签;n为车站数/个。结合数据实际,前后最大平移量均取15 min。

5)以各车站的GPS到站时间为分割点进行区间划分,将选取的单车单天IC卡数据按最佳平移量时间整体平移后,再以IC卡聚类为单元,根据其中间值落入GPS区间情况确定对应的上车站(见图5)。

2.2 基于换乘、通勤和往返关系的下车站推算

1)基于换乘关系推算下车站。

换乘关系识别应同时满足时间临近性和空间临近性两个条件:

①乘客先后两次乘车的刷卡时间差≤Δt。据调查,公共汽(电)车乘客平均单次出行时间约为30 min。因此,当出行方式为公共汽(电)车换乘地铁或公共汽(电)车,且先后两次乘车线路不同时,Δt取90 min(分析见表1);当出行方式为地铁换乘公共汽(电)车时,考虑到步行换乘时间,Δt取20 min。

②乘客第一次乘车的下车站存在与第二次乘车的上车站位于同一站组范围内或相距不超过1 km,且两次乘车的线路不同。

如图6所示,情景a中,第1次乘车下车站即为第2次乘车上车站A;情景b中,第1次乘车下车站为与第二次乘车上车站A位于同一站组且距离最近的车站C;情景c中,第1次乘车下车站为与第二次乘车上车站A距离最近且小于1 km的车站E。

2)基于通勤与首末次出行往返关系推算下车站。

根据通勤乘客早晚高峰往返出行特征,早高峰首次出行的下车站与晚高峰末次出行的上车站一般应位于同一站组(或1 km区域内),晚高峰末次出行的下车站与早高峰首次出行的上车站一般也应位于同一站组。根据乘客常规的总体出行特性,一般情况下,如果次日与当日首次出行的上车站位于同一站组,则当日首次出行的下车站与末次出行的上车站也应位于同一站组,当日末次出行的下车站与首次出行的上车站应位于同一站组。

如图7所示,情景d,f中,首次出行的下车站为距离末次出行的上车站B2最近且相距小于1 km的车站B1,末次出行的下车站为与首次出行的上车站A1最近且相距小于1 km的最近车站A2;情景e中,末次出行下车站为与首次出行上车站A1最近且相距小于1 km的最近车站A2。

另外,对于其他无明显规律的出行,考虑到其随机性较大,不再针对单个用户根据历史推算下车站的出现概率进行下车站推算,而是根据实际分析需求,从线路或线网层面进行扩样处理。

图4 最佳平移量确定Fig.4 Procedures of optimal shifting value

表1 上下车站推算计算结果Tab.1 Results of on-and-off volumes at transit stations

图5 上车站推算Fig.5 Estimating the boarding passengers at stations

图6 基于换乘关系的下车站推算Fig.6 Estimating the off-volumes at stations based on transfer relationship

图7 基于首末次出行与通勤往返关系的下车站推算Fig.7 Estimating off-volumes based on the first and last trips and commuting relationship

图8 M352路上下车站推算结果验证Fig.8 Verification of the estimated on-and-off volumes at stops along bus M352 route

3)扩样处理。

根据各线路上下车客流的推算率、线路刷卡率,对推算上下车客流分别进行扩样处理。

3 结果与验证

3.1 计算结果

根据换乘识别敏感性分析,建议换乘时间可达性阈值Δt取90 min,换乘空间可达性阈值Δd取1 km。以深圳市和天津滨海新区为例,对公共汽(电)车客流上下车站进行推算。如表1所示,深圳市上车推算成功比例约98%,下车推算成功比例约61%;由于天津滨海新区的IC卡数据中不含地铁数据,致使上下车推算成功比例略低,上车推算成功比例约93%,下车推算成功比例约58%。

3.2 算法验证

3.2.1 微观层面:试验线路调查

以深圳市为例,选取M352路公共汽(电)车(新百丽—深圳北方向),将跟车客流调查结果(共15个趟次)与同天IC卡数据推算结果(按照线路推算成功比例、刷卡率进行统一扩样)进行对比分析(见图8和图9),二者的车站客流分布趋势一致,且具有良好的相关性。

为进一步评估算法精度,选用GEH进行误差检验,

式中:C为推算值;V为实际值。一般认为,当GEH<5.0时推算值序列与实际值序列没有明显差异,可接受。与相对误差相比,GEH能更好地评估误差,其取值仅与真值偏离程度有关,而与偏离的正负无关,且对较小的值的误差敏感度较低。

基于式(2)计算M352路上下车站推算结果的GEH平均值分别为1.65和1.99,均可接受。因此,IC卡数据分析结果与人工调查结果无明显差异,算法精度较高。

3.2.2 宏观层面:客流特征对比分析

天津滨海新区在地理空间上与深圳市相似,均为沿海的狭长带状区域。深圳市公共汽(电)车客流空间分布与其地理空间布局相呼应,沿着东西向主城区(南山区—福田区—罗湖区)呈现明显的带状特征,且主城区外围的宝安区、龙华区、龙岗区与主城区的客流联系密切(见图10)。而天津滨海新区公共汽(电)车高客流密度集中于核心区,且核心区与西片区间客流联系相对比较密切(见图11)。

图9 M352路上下车站推算误差分析Fig.9 Calculation errors in the estimated on-and-off volumes at stops along bus M352 route

图10 深圳市公共汽(电)车客流空间分布Fig.10 Spatial distribution of bus passenger flow in Shenzhen

图11 天津滨海新区公共汽(电)车客流空间分布Fig.11 Spatial distribution of bus passenger flow in Binhai New District of Tianjin

公共汽(电)车与轨道交通一体化发展方面,深圳市主要的公共汽(电)车客流集中车站基本均有轨道交通覆盖,轨道交通与公共汽(电)车的一体化衔接程度相对较高,尤其是位于轨道交通线路末端的车站(地铁宝安机场东站进出客流中,约47.5%来自公共汽(电)车换乘,见图12)。而天津滨海新区仅开通津滨轻轨9号线,轨道交通车站与公共汽(电)车客流集中车站间的距离较远(见图13)。

图12 深圳市公共汽(电)车与轨道交通一体化衔接Fig.12 Integration of bus and rail transit in Shenzhen

图13 天津滨海新区公共汽(电)车与轨道交通的一体化衔Fig.13 Integration of bus and rail transit in Binhai New District of Tianjin

4 结语

在总结以往公共汽(电)车乘客上下车站推算相关研究基础上,利用公共汽(电)车GPS数据与IC卡数据,提出基于公共交通大数据融合的公共汽(电)车乘客上下车站推算方法,并在天津、深圳两个城市进行应用分析。结果表明,该算法具有推算成功比例高、准确度高、通用性强等特点。在此基础上,可从车站、线路、区域等多个空间维度实现公共交通运行情况的全面感知,并可应用于各城市公共交通规划、政策评估、线网规划等领域,为相关工作提供科学、量化的决策依据。

猜你喜欢
IC卡刷卡换乘
工商业IC卡控制器改造为物联网控制器实践
在用电梯加装外接式IC卡运行控制系统设计改进
天津地铁红旗南路站不同时期换乘客流组织方案研究
刷卡
城市轨道交通三线换乘形式研究
长春开通公交IC卡充值平
刷脸就可以购物
湖北省高速公路IC卡管理系统浅谈
重庆轨道交通换乘站大客流组织探索
北京地铁最复杂换乘点——军博站启用