基于出行模式的公交IC卡乘客下车站点判断方法

2018-05-08 01:45吕玉坤崔美莉
关键词:乘车公交站点

陈 君,吕玉坤,2,崔美莉

(1.西安建筑科技大学 土木工程学院,陕西 西安 710055;2.中铁四局集团设计研究院,安徽 合肥 230023)

公交IC卡收费系统在运行过程中产生大量的刷卡交易数据,其数据具有采集方便、样本量大、连续记录等优点,对这些数据进行分析和挖掘,能够为城市交通系统的规划和管理提供丰富的决策信息[1-2].公交IC卡收费系统有一票制收费和分段收费两类收费制式,其中一票制收费是国内、外最普遍的收费方式.一票制系统仅在上车刷卡,乘客下车站点信息无法直接得到,成为应用公交IC卡数据分析公交出行特征和规律的障碍.

现有方法是利用公交出行链的特征进行下车站点判断.出行链是指以家为起点和终点将居民一天当中各种目的出行按发生顺序联接起来所形成的若干闭合链[3].基于出行链的下车站点推算方法最早用来分析轨道交通乘客的出站站点.国外大部分城市轨道交通系统只在进站刷卡,乘客的出站站点没有记录,为了获得轨道交通乘客的出行OD,纽约市城市公交机构[4]利用轨道交通乘客出行形成的出行链来推算乘客的出站站点.推算采用了2条假设:(1)同一乘客上一次乘车的终点,为下一次乘车的起点.(2)同一乘客一天最后一次出行的终点,为同一天第一次出行的起点.Jinhua Zhao[5]在纽约地铁2条假设基础上,对地铁客流的OD估计方法进行改进,利用地铁与公交的前后乘车站点之间的空间关系、乘客出行模式的对称关系推算芝加哥市地铁乘客的出站站点.Janine M.Farin[6]以巴西圣保罗市为案例,对圣保罗市交通小区间的普通公交OD矩阵进行了推算.Martin Trépanier 等[7]应用加拿大Gatineau 市居民出行调查数据(HHT)与相同时段的公交Smart Card 数据(SC)分析结果进行了比较分析,证明SC数据更为精确.Takahiko Kusakabe 等[8]从轨道交通中长期大量的数据中,对乘客的上下车站点进行了判断,并对乘客的出行行为进行了分析.Chen Jun[9]将出行链方法应用到常规公交系统站点间公交出行OD的推算.

这种利用公交出行链特征推算公交卡乘客下车站点的方法一般基于以下3个假设:

(1)“下一次出行(Next Trip)”假设:同一乘客在同一天中公交乘车的终点大多接近下一次乘车的起点.

(2)“最后一次出行(Last Trip)”假设:同一乘客在同一天中最后一次乘车的终点接近同一天第一次乘车的起点.

(3)“返程出行(Return Trip)”假设:同一乘客在同一天中如果连续两次乘车的线路相同,方向(上行和下行)相反,则第一次乘车的终点为第二次乘车的起点,第一次乘车的起点为第二次乘车的终点.

以上3个假设均需要同一乘客全天公交出行2次以上才能够应用.同时,如果乘客的公交出行链不闭合,则可能出现判断错误.出行链方法只能够判断部分公交卡乘车的下车站点,这成为应用公交卡数据分析公交出行行为特征和规律的制约因素.

本文根据公交乘客长期出行具有时空规律性,提出利用公交乘客长期的出行模式进行公交卡乘客下车站点的判断,对方法进行算法实现,并应用大规模实际数据对算法进行了实验和验证.

1 研究数据描述

本文采集了某市57条智能公交线路的系统运营数据,包括公交IC卡数据、公交GPS数据、公交站点坐标数据和公交运行记录数据,公交IC卡数据来自公交自动收费系统,其他3种数据来自公交智能调度系统,4种数据源主要字段之间的关联关系,如图1所示.

图1 4种数据源的关联关系[10]Fig.1 Association of four data sources[10]

在SQL-Server数据库导入原始数据并进行数据预处理,将智能调度系统数据与公交IC卡数据关联确定出5个工作日(周一~周五)公交IC卡乘客的上车站点[10],计算过程限于篇幅不再赘述.将5个工作日的899 174条已知上车站点信息的公交卡数据作为本文的基础研究数据,其字段描述见表1.

表1 研究数据字段描述Tab.1 Fields description of research data

2 基本思想

公交乘客的出行行为具有很强的时空规律性,即大部分人都是在家和工作单位两点之间展开出行,而出行时间和地点呈现24 h周期性,公交乘客长期的出行规律是在其活动的空间尺度和时间尺度的制约下形成的[11].根据公交乘客长期出行的时空规律性,本文分别提出基于通勤出行模式和关联出行模式两种判断下车站点的思路.

2.1 基于通勤出行模式的下车站点判断思路

通勤交通是指居民在居住地和工作地(学校)之间的往返过程.在居民的日常公交出行中,通勤出行占了很大的比重.从居民长期公交出行的上车站点信息可以判断出其早、晚高峰经常性的乘车站点,从而能够确定出乘客的居住地站点和工作地站点.判断公交卡乘客的通勤OD,一般基于以下3条假设:

(1)工作日早、晚高峰经常性乘坐公交的乘客为公交通勤乘客;

(2)公交通勤乘客早高峰经常性的乘车站点为居住地站点;

(3)公交通勤乘客晚高峰经常性的乘车站点为工作地站点[12].

根据得到的公交通勤乘客居住地和工作地站点信息,可能对通勤出行的下车站点进行判断.按照是否为直达通勤出行,具体分为以下2种情况讨论.

(1)直达公交通勤出行的下车站点判断

直达的公交通勤出行指乘客乘坐的是居住地站点和工作地站点之间的直达公交线路,不需要换乘其它线路或其他交通方式就可以完成通勤出行.对于直达通勤出行,若乘客在工作日早高峰首次乘坐的站点为居住地站点或附近站点,且乘坐线路下游存在工作地站点或附近站点,则可判定该下游站点为本次乘车的下车站点;若乘客在工作日晚高峰首次乘坐的站点为工作地站点或附近站点,且乘坐线路下游存在居住地站点或附近站点,则可判定该下游站点为本次乘车的下车站点.

(2)非直达公交通勤出行的下车站点判断

非直达公交通勤出行是指乘客需要通过换乘其他公交线路或其他交通方式完成通勤,主要有4种模式:

1)公交+公交;

2)其他交通方式+公交;

3)公交+其他交通方式;

4)其他交通方式+公交+其他交通方式.

对于模式1和模式2的最后一次乘车,若该次乘车线路下游方向存在某站点为工作地站点或居住地站点或附近站点,则此可将此站点判断为下车站点.对于模式3和模式4,其公交乘车的下车站点距离工作地与居住地较远,根据通勤OD信息无法判断.

2.2 基于关联出行模式的下车站点判断思路

公交乘客除了在通勤出行上具有高度的规律性以外,在其他目的公交出行上也表现出一定的时空规律.例如,在不同日期,公交乘客经常在相近时间的相近站点上车,在相近时间的相近站点下车.对于公交乘客当天的出行,可能从该乘客往日的出行数据中找出具有时空关联性的出行进行匹配来判断当日出行的下车站点.根据对乘客长期公交出行时空规律的观察,提出以下4条假设进行下车站点判断.

假设1:(同线路同方向匹配)同一乘客当日和往日的两次公交乘车,如果乘车线路、乘车方向相同,上车站点相同或接近,则当日的下车站点与往日的下车站点相同或接近.

假设2:(同线路反方向匹配)同一乘客当日和往日的两次公交乘车,如果乘车线路相同而乘车方向相反,那么当日乘车的下车站点是往日乘车的上车站点或附近站点.

假设3:(不同线路同方向匹配)同一乘客当日和往日的两次公交乘车,如果乘车线路不同,乘车方向相同,且上车站点相同或接近,则当日乘车线路下游与往日乘车线路下车站点相同或接近的站点为当日乘车的下车站点.

假设4:(不同线路反方向匹配)同一乘客当日和往日的两次公交乘车,如果乘车线路不同,乘车方向相反,则当日乘车线路下游与往日乘车上车站点相同或接近的站点为当日乘车时的下车站点.

3 算法实现

集成以上两种判断思路,提出基于出行模式的公交IC乘客下车站点判断算法.

Step1:依次应用出行链方法的“返程出行”、“下一次出行”和“最后一次出行”3条假设推算同1个星期5个工作日的公交卡乘客下车站点,算法详见文献[9].

Step2:应用公交通勤OD估计方法识别该星期的通勤乘客卡号,并判断其居住地和工作地站点,将其作为通勤出行模式判断下车站点的匹配数据,算法详见文献[12].

Step3:将Step1无法推算下车站点的公交出行数据提取出来,采用通勤出行模式进行判断.

Step4:取出其中1条数据,如果该条数据的公交卡号为通勤乘客卡号,且刷卡时间为高峰时段,则判断此次出行为通勤出行.

Step5:若该次通勤出行的公交线路下游方向存在工作地站点或居住地站点或两者附近站点,则判断该站点为下车站点,并且若该次出行上车站点为居住地站点或工作地站点或两者附近站点,则判定该次出行为直达通勤出行,否则为非直达通勤出行.

Step6:将Step4、Step5未能判断出下车站点的数据提取出来,采用关联出行模式判断下车站点.

Step7:将Step1出行链方法已判断出下车站点的记录作为应用关联出行模式判断下车站点的匹配数据.

Step8:取出其中1条数据,依次应用关联出行模式的假设1~4推算下车站点.

以上算法,采用VB.NET语言编程实现.

4 算法实验

4.1 运算环境

算法程序运行的计算机硬件环境为:8核2.4 GHz CUP;16GB内存;2TB硬盘.软件环境为:Windows Server2008操作系统;Visual Studio 2008开发环境;SQL Server 2008数据库.

4.2 出行链方法运算结果

运行算法Step1,计算5个工作日全天出行2次以上的公交乘客的下车站点.计算前将重复刷卡数据剔出,并将上车站点不能全部判断的数据剔出.以周五为例,处理后的数据为155 815条,对其中全天出行2次以上的118 103条记录进行运算,判断出下车站点104 493条,比例为88.43%,占全部实验数据155 815条的67.03%,计算过程详见参考文献[9],限于篇幅不再赘述,计算结果详见表2.

表2 出行链方法计算结果统计Tab.2 Statistics of trip chain method calculation results

4.3 通勤OD判断方法运算结果

以周一~周五5个工作日的182 007个公交卡号,共计899 174条公交IC卡记录作为算法Step2的计算数据判断通勤乘客卡号及其居住地站点和工作地站点,计算过程详见文献[12],运算结果详见表3.

表3 通勤OD运算结果统计[12]Tab.3 Statistics of commuting OD calculation results[12]

4.4 出行模式方法计算结果

运行算法Step3~Step8判断周五出行链方法无法判断记录的下车站点,共计51 376条数据,其中包括全天出行1次的记录37 712条和Step1无法推算的记录13 664条.以算法Step1得到的周一~周四的出行链方法计算结果和算法Step2得到的通勤OD计算结果作为周五判断下车站点的匹配数据.

算法运行结束,周五全天出行1次的记录37 712条,出行模式方法判断出下车站点的记录为13 279条,比例为35.21%,运算结果如图2所示.算法Step1采用出行链方法推算失败的记录13 664条,应用出行模式方法判断出下车站点的记录5 627条,比例为41.18%,运算结果如图3所示.

基于出行模式方法推算出周五下车站点的记录18 906条,推算成功的比例为36.80%.其中,关联出行模式的假设1判断成功的比例最高,其次为通勤出行模式中的直达出行,其他假设条件判断的比例较低,算法实验结果见表4.

图2 刷卡1次记录的判断结果Fig.2 Calculation results of the records that only used once in a single day

图3 出行链方法推算失败记录的判断结果Fig.3 Calculation results of the records that cannot be estimated by trip chain method

表4 出行模式方法计算结果统计Tab.4 Statistics of travel pattern method experiment results

5 算法验证

5.1 验证思路

根据纽约城市公交机构的研究结果,出行链方法推算下车站点的准确率在90%以上[4-5].将周五利用出行链方法推算出下车站点的记录提取出来,再次应用出行模式的方法判断这部分记录的下车站点,然后比较两种方法推算结果的一致性(距离小于1 000 m认为一致).假设出行链方法的正确率为90%,若两种方法推算下车站点的一致率为A,则可认为出行模式判断方法的精度为A/90%.

5.2 验证结果

提取周五由出行链方法判断出下车站点的记录104 439条,应用出行模式方法再次判断得到66 869条公交出行记录的下车站点,经过比较,两种方法推算结果一致的记录为52 893条,一致率为79.10%,则可出估计出行模式方法的准确率为87.90%(79.11%/90%).其中,采用通勤出行模式判断的准确率很高,达到了97.54%,采用关联出行模式判断的准确率达到81.66%,算法验证的详细结果见表5.

表5 算法验证结果Tab.5 Verification results of the algorithm

6 结论

现有方法只能判断出部分公交卡乘车的下车站点,成为应用公交卡数据分析公交系统出行行为特征和规律的瓶颈.本文根据公交出行具有的时空规律性,提出了基于出行模式判断公交IC卡乘客下车站点的方法.

(1)本文研究证明能够根据历史出行模式对公交乘客的下车站点进行估计.对于出行链方法不能判断的32.97%的公交卡乘车记录,采用本文提出的出行模式方法能够判断出其中36.80%的下车站点,出行模式方法使得能够判断公交卡乘车下车站点的比例提高了12.13%,达到79.16%.

(2)采用通勤出行模式判断的准确率为97.54%,采用关联出行模式判断的准确率为81.66%,出行模式方法总体准确率达到87.90%,精度能够满足实际公交系统规划和管理工作的需要.

(3)本文限于数据条件,仅采用了5个工作日、部分公交线路的数据进行了算法实验.随着智能公交系统的普及,应用更长时段、城市全部公交线路数据进行计算时,出行模式方法能够判断的比例和准确率还能够得到进一步提高.

参考文献References

[1] BAGCHI M, WHITE P. The potential of public transport smart card data[J].Transport Policy, 2005(12):464-474.

[2] PELLETIER M, TREPANIER M, MORENCY C. Smart card data use in public transit: a literature review[J]. Transportation Research Part C,2011, 19 : 557-568.

[3] 褚浩然, 郑猛, 杨晓光,等. 出行链特征指标的提出及应用研究[J].城市交通,2006, 4(2):64-67.

CHU Haoran, ZHEN Meng, YANG Xiaoguang, et al. A study on trip-chain indices and their application[J]. Urban Transport of China, 2006, 4(2):64-67.

[4] BARRY J, NEWHOUSER R, RAHBEE A, et al. Origin and destination estimation in New York city using automated fare system data[J]. Transportation Research Record, 2002, (1871):183-187.

[5] ZHAO J H, RAHBEE A, WILSON N. Estimation a passenger trip origin-destination matrix using automatic data collection systems[J]. Computer-Aided Civil and Infrastructure Engineering, 2007, 22(5):376-387.

[6] FARZIN J M. Constructing an automated bus origin-destination matrix using farecard and GPS data in Sao Paulo, Brazil[J]. Transportation Research Record,

2008, 2072: 30-37.

[7] CHU K K, CHAPLEAU R, TREPANIER M. Driver-assisted bus interview (DABI): passive transit travel survey using smart card automatic fare collection system and its applications[J]. Transportation Research Record, 2009, 2105: 1-10.

[8] KUSAKABE T,IRYO T, ASAKURA Y. Estimation method for railway passengers′ train choice behavior with smart card transaction data[J]. Transportation, 2010, 37(5):731-749.

[9] CHEN J, WANG Z F. Algorithm of estimating alighting bus stops of smart card passengers based on trip-chain[C]. 2nd International Conference on Civil Engineering and Transportation. Guilin: TTP, 2012: 1918-1921.

[10] 陈君,杨东援.基于智能调度数据的公交IC卡乘客上车站点判断方法[J].交通运输系统工程与信息,2013,13(1):76-80.

CHEN Jun, YANG Dongyuan. Method of estimating smart card commuters OD distribution based on APTS data[J].Journal of Transportation Systems Engineering and Information Technology, 2013,13(1):76-80.

[11] 刘靓. 普适计算环境下居民交通行为特征研究[D].上海:同济大学, 2008.

LIU Liang. Research on inhabitant travel behavior under pervasive computing environment [D].Shanghai: Tongji University, 2008.

[12] 陈君,杨东援.基于APTS数据的公交卡乘客通勤OD分布估计方法[J].交通运输系统工程与信息,2013,13(4):47-53.

CHEN Jun, YANG Dongyuan. Method of estimating smart card commuters OD distribution based on APTS data[J]. Journal of Transportation Systems Engineering and Information Technology, 2013, 13(4):47-53.

猜你喜欢
乘车公交站点
一元公交开进太行深处
这一次优步乘车,让我感动了
乘车的问题
基于Web站点的SQL注入分析与防范
等公交
积极开展远程教育示范站点评比活动
首届欧洲自行车共享站点协商会召开
怕被人认出