基于智能调度数据的公交IC卡乘客上车站点判断方法

2013-09-25 13:13杨东援
交通运输系统工程与信息 2013年1期
关键词:IC卡刷卡南宁市

陈 君,杨东援

(1.西安建筑科技大学土木工程学院,西安 710055;2.同济大学 交通运输工程学院,上海 201804)

1 引 言

近年来公交智能调度系统在国内外开始广泛应用,为判断公交卡乘客的上车站点提供了新的数据来源.本文以南宁市为例,研究在公交智能调度条件下,判断公交卡乘客上车站点的方法.

2 研究数据采集与组织

2.1 数据采集

智能公交系统的原始数据为系统运行所产生,具有多源和海量的特点.笔者对南宁市智能公交系统的运营管理进行了调研,并采集了南宁市公交IC卡收费系统和公交智能调度系统运营的原始数据,包括公交IC卡数据、公交GPS数据、公交站点坐标数据和公交运行记录数据.

2.2 数据组织

数据组织是按照一定的方式和规则对数据进行归并、存储、处理的过程[5].本文采用数据仓库技术完成这一过程,建立研究工作的数据分析平台,如图1所示.在此平台上,开发程序来测试和验证提出的算法.

图1 智能公交数据分析平台建立Fig.1 Establishment of APTS data analysis platform

3 判断方法的基本步骤

本文通过将公交 IC卡数据、公交 GPS数据、公交站点坐标和公交运行记录4种数据进行关联来判断公交卡乘客的上车站点.这4种数据源主要字段之间的关联关系,如图2所示.

图2 4种数据源的关联关系Fig.2 Association of four data sources

本文提出的公交卡乘客上车站点判断方法包括3个基本步骤.

那岩鹰翼展过丈,黑羽灰斑,带着岩石般的厚重纹路,看上去身躯极为结实。它抓着一条黑蟒,那黑蟒有成人手臂粗细,七八尺长,在钢钩般的鹰爪下一动不动地耷拉着,颇为瘆人。

Step 1确定刷卡时公交车辆的坐标.

(1)初步筛选.

将公交IC卡数据与公交GPS数据进行关联,筛选刷卡时公交车辆的可能坐标.

南宁市公交IC卡数据的“刷卡时间”字段精确到“分”,没有“秒”的记录.例如“08:35:45”记录为“08:35:00”,采用了截尾记录方式.公交GPS数据的“时间”字段值精确到“秒”,这样在刷卡这1 min的第0~59 s之间的GPS数据,以及刷卡这1 min前后时间最接近的GPS数据,都可能是与刷卡时间相匹配的GPS数据.

将IC卡数据的线路编号、车辆编号、刷卡日期、刷卡时间4个字段与公交GPS数据进行匹配,得到备选的公交GPS数据.

(2)最终确定.

由于每条公交IC卡记录可能对应几条备选的公交GPS数据,这样需要在这几条备选数据中,确定出与刷卡时间最接近的公交GPS数据.公交车停靠在站点时,速度为0,在离站点较近时车速较低.因此,可以通过比较备选公交GPS数据的“瞬时车速”值,来确定最接近刷卡时间的公交GPS数据.取备选数据中瞬时车速最小这一条数据的“经度”和“纬度”值作为刷卡时公交车辆的坐标.如果备选的几条GPS数据中,出现相同的最小瞬时车速时,取与刷卡这1 min第30 s最近的GPS数据.

Step 2公交车辆运行上、下行方向的确定.

将公交IC卡数据与运行记录数据关联确定刷卡时公交车辆运行的上、下行方向(从主站驶向副站为下行,反之为上行).

Step 3刷卡时公交车辆的坐标与站点坐标匹配.

用已得到的刷卡时公交车辆坐标与相应线路、相应方向的公交站点坐标进行匹配,最终得到刷卡时的公交站点,也就是上车站点.

4 判断方法的精度影响分析

4.1 公交GPS数据时间间隔的影响

公交智能调度系统每隔一定的时间间隔接收一条公交车辆的GPS坐标数据.公交GPS坐标数据的时间间隔长度将影响上车站点的判断精度.如果公交GPS数据的时间间隔过大,得到刷卡时公交车辆坐标超出上车站点与相邻站点之间间距的1/2时(图3中的允许误差范围L),将会出现上车站点判断错误,如图3所示.

图3 公交GPS数据坐标允许误差范围示意Fig.3 Schematic of allowable error scope of bus GPS data coordinates

因此,有必要对影响判断上车站点精度的公交GPS数据时间间隔长度进行分析.假设城市公交站点平均间距为500 m,公交GPS坐标数据的精度在10 m范围以内.这种条件下,允许的误差范围为480 m(500-10×2).公交车按照25 km/h平均车速行驶480 m需要69.12 s.假定公交在站点的平均停站时间为20 s,则公交GPS数据的时间间隔t超过89.12 s(69.12+20)时,允许误差范围L以内可能出现没有GPS数据可以匹配的情况.时间间隔超过89.12 s的1倍时,则一定会出现.由此可知,在一般情况下,89.12 s为公交GPS数据的最大允许时间间隔T.

4.2 公交IC卡数据“刷卡时间”单位的影响

南宁市公交IC卡数据的刷卡时间记录精确到分,而实际刷卡时间在这1 min的第0~59 s之间.最有利的情况是刷卡时间恰好是这1 min的第0 s,这时公交GPS数据的时间间隔只要小于最大允许时间间隔T(89.12 s),就不会产生匹配错误.最不利情况是公交IC卡数据的“刷卡时间”值与实际刷卡时间相差60 s,这时公交GPS数据的时间间隔小于29.12 s(89.12-60)才不会产生上车站点的判断错误.以下分别对最不利情况和最有利情况的上车站点判断正确率进行计算.

随机抽取南宁市2008年12月1日2路公交“001151”号公交车全天的GPS数据进行时间间隔长度的统计分析,时间间隔t在29.12 s以内的时间间隔总时长占所有公交GPS数据总时长的比例为68.45%,这部分数据全部能够正确匹配.公交GPS数据的时间间隔t大于29.12 s时,仍能够正确匹配到上车站点的概率为29.12/t,经过计算能够正确判断的比例为21.57%.因此,在最不利情况下,上车站点判断的正确概率为90.02%(68.45%+21.57%).以此方法,再求出最有利情况下判断的正确率.GPS数据时间间隔在89.12 s以内的时间间隔时长占公交GPS数据总时长的比例为99.3%,大于89.12 s时的公交GPS数据仍能够正确判断的概率为0.15%.在最有利情况下,上车站点判断正确的概率为99.45%(99.3%+0.15%).

以上分析可知,公交IC卡数据的刷卡时间精确到秒时,上车站点判断的准确率为最有利情况的准确率,即为99.45%;公交IC卡数据的刷卡时间精确到分,且不采用瞬时车速进行辅助判断时,上车站点判断的准确率为最有利和最不利情况的平均值,即为94.74%.

4.3 瞬时车速辅助判断的影响分析

考虑到南宁市公交IC卡数据的刷卡时间精确到分,对判断上车站点的准确率有一定影响.本文提出采用“公交车停靠在站点时,瞬时速度为0”这一特征进行辅助判断来提高上车站点的判断精度.以下对瞬时车速辅助判断的影响进行分析.

首先对公交GPS数据瞬时车速本身的数据质量进行分析,通过将公交GPS数据的相邻坐标点之间的行程车速值与这两个相邻坐标点的瞬时车速均值进行比较来确定.随机抽取了2008年12月1日下午14时南宁市2路公交“001147”号公交车的GPS数据,分别计算行程车速与瞬时车速均值.对两种车速值进行相关性分析,两者的相关性系数为0.90,样本均值相差仅为5.24%,说明瞬时车速与行程车速值整体上很接近,可以推断瞬时车速的总体数据质量很高.

考虑瞬时车速的数据质量及其它影响因素,假设采用瞬时车速进行辅助判断后,有80%的IC卡数据最终能够匹配到与刷卡时间最接近的公交GPS数据.这样有80%的IC卡数据判断的正确率为99.45%(与3.2节中最有利条件下的正确率相同),剩余20%的正确率取3.2节中最有利和最不利情况的平均值,为94.74%.因此,采用瞬时车速进行辅助判断后,上车站点判断的准确率为98.45%(99.45%×80%+94.74%×20%).

5 算法提出

以南宁市智能公交系统数据环境为例,提出基于智能调度数据的公交IC卡乘客上车站点判断算法如下.

Step 0 取出1条IC卡数据,按IC卡数据的“线路编号”和“车辆编号”字段值查找相应线路、车辆的公交GPS数据.

Step 1将该条IC卡数据时间与相应线路和车辆的GPS数据的时间进行比较,找到该条IC卡数据刷卡时间1 min内的GPS数据,以及这1 min前、后时间最接近的各1条GPS数据,作为备选GPS数据.

Step 2取备选GPS数据中瞬时速度最小的数据为刷卡时的GPS数据.如果存在备选GPS数据中的瞬时车速最小值相同,则取相同最小值中最接近刷卡时间这1 min第30 s的数据.

Step 3根据IC数据的线路编号、车辆编号、刷卡时间,在运行记录数据表里查找刷卡车辆的所属班次,根据班次确定上行、下行方向.

Step 4计算刷卡时公交车辆坐标与相应线路、相应方向(上行或下行)所有站点坐标的空间直线距离,距离最小的站点为上车站点,将站点编号和站点名称作为新的字段值写入到IC卡数据表中.

Step 5重复Step0~Step4,直到所有刷卡记录全部获得上车站点.

以上算法采用VB.NET语言编程实现[6].

图4 部分计算结果Fig.4 Partial computing results

6 算法试验

以南宁市2008年12月1日(星期一)~12月5日(星期五)57条智能调度线路的978 077条公交IC卡数据为算例,对本文提出的算法进行测试和分析.算法程序运行的计算机硬件环境为双核2.8 GHz CUP,1 GB内存,300 GB硬盘.每个工作日的公交IC卡数据(约20万条)约8 h完成运算.算法程序的部分运算结果,如图4所示,字段描述如表1所示.

本算例5个工作日共计978 077条公交IC卡数据中,最终判断出上车站点的记录为899 174条,比例为91.93%.8.07%的公交IC卡数据未能判断出上车站点,经过分析是由于公交GPS信号受到干扰、公交GPS设备出现故障及少量时段公交智能调度系统未使用,从而导致公交GPS数据或运行记录数据缺失.5个工作日的运算结果统计,如表2所示.

表1 运算结果数据字段描述Table 1 Fields description of computing results

表2 运算结果统计Table 2 Statistics of computing results

7 研究结论

本文提出对智能公交系统的4种原始数据进行关联来判断公交卡乘客上车站点.通过分析,公交IC卡数据的刷卡时间精确到秒时,应用这种方法判断公交卡乘客上车站点的准确率为99.45%;公交IC卡数据的刷卡时间精确到分,且不采用瞬时车速进行辅助判断,准确率为94.74%;公交IC卡数据的刷卡时间精确到分,并采用瞬时车速进行辅助判断,准确率达到98.45%.本文对提出的算法进行了程序实现,并以南宁市57条智能公交调度线路的5个工作日的海量数据对算法进行了测试,有91.93%的公交卡数据成功确定出了上车站点.未能判断出上车站点的原因是公交GPS数据或运行记录数据缺失.随着公交智能调度系统性能的完善,运营数据缺失情况会进一步减少,能够判断出公交卡乘客上车站点的比例还能得到继续提高.

[1]Bagchi M,Gleave S D,White P.Use of public transport smart card data for understanding travel behavior[C].Strasbourg, France: European Transport Conference,2003.

[2]陈学武,戴霄,陈茜.公交IC卡信息采集、分析与应用研究[J].土木工程学报,2004,37(2):105-110.[CHEN X W,DAI X,CHEN Q.Approach on the information collection,analysis and application of bus intelligent card[J].China Civil Engineering Journal,2004,37(2):105-110.]

[3]戴霄.基于公交IC信息的公交数据分析方法研究[D].南京:东南大学,2006.[DAI X.Research on transit data analysis based on bus intelligent card information[D].Nanjing:Southeast University,2006.]

[4]Chen Jun.Validity research of Judging boarding stop by cluster analysis smart card data[C]//The International Conferenceon Remote Sensing,Environmentand Transportation Engineering,2011.

[5]朱德利.SQL Server 2005数据库管理与应用高手修烧炼指南[M].北京:电子工业出版社,2007.[ZHU D L.SQL Server 2005 database management and application ofpractice guidelines[M]. Beijing:Electronics Industry Press,2007.]

[6]Schneider D.Visual Basic 2005程序设计[M].北京:清华大学出版社,2007.[Schneider D.Visual Basic 2005 programming[M].Beijing:Tsinghua University Press,2007.]

猜你喜欢
IC卡刷卡南宁市
工商业IC卡控制器改造为物联网控制器实践
Sam’s Family
在用电梯加装外接式IC卡运行控制系统设计改进
关 公
一种新的无触点IC卡的检测方法
刷卡
刷脸就可以购物
湖北省高速公路IC卡管理系统浅谈
南宁市核心区旧桥景观改造
创新南宁市社会组织的管理模式