蔡文学,陈广文,罗伟海
(1.华南理工大学 经济与贸易学院 ,广东 广州 510006;2.佛山市南海区环境运输和城市管理局,广东 佛山 528299)
基于多源数据的精确公交出行时间自动计算
蔡文学1,陈广文1,罗伟海2
(1.华南理工大学 经济与贸易学院 ,广东 广州 510006;2.佛山市南海区环境运输和城市管理局,广东 佛山 528299)
提出基于基站定位轨迹、公交线网、公交车GPS轨迹的多源数据精确公交出行时间自动计算方法:第一,利用智能手机采集基站定位轨迹;第二,使用基于滑动时间窗的算法,清除基站定位轨迹中因基站切换“乒乓效应”造成的扰动数据;第三,将基站定位轨迹与公交线网进行空间关联匹配,获得乘客上下车地点;最后,将基站定位轨迹与公交车GPS轨迹进行序列对比,获得乘客公交出行时间。在佛山市南海区进行的公交出行实验表明,该方法获得的公交出行时间误差在1 min以内,能满足公交线网调整与优化的精度要求。
交通工程;出行调查;公交规划;多源数据;基站定位;GPS定位
公交出行时间包括步行到站用时,候车用时,下车后步行用时,车内用时和换乘用时,在公交调整与优化中均起到重要的作用,目前一般通过居民出行调查(OD调查)获得。但传统居民出行调查依靠出行者的事后回忆得到调查结果,精度较低,在公交优化或规划时会造成较大的误差,因此利用定位技术进行居民出行调查是交通工程领域的研究热点之一[1-2]。
基于定位技术的居民出行调查可分为两类:基于GPS技术及基于基站定位技术。GPS设备的定位精度高,基于GPS技术开展的研究有自动匹配GPS轨迹与传统出行日记记录、使用GPS轨迹评估传统人工调查的有效性、使用GPS进行调查的尝试等[3-7]。但一方面,专用GPS设备的成本较高,无法大规模应用;另一方面,手机自带的GPS模块不能满足居民出行调查所需的至少一天的持续时间。基于基站定位技术的调查技术能满足居民出行调查长时间、大规模的要求,已在一些城市有较大规模的使用[8-11]。但单纯使用基站定位不能反映居民精确、实时的移动,只能获得大致移动方向与时间,不能据此计算公交出行时间,特别是换乘用时。
因此,笔者结合乘客的基站定位轨迹数据、公交线网数据与公交车的GPS轨迹数据,研究了自动计算精确公交出行时间的方法。
如图1,乘客的公交出行过程一般可划分为以下阶段:步行到站、起点站候车、首次乘车、换乘、再次乘车、步行离站,其中换乘及再次乘车可发生0次或多次。公交出行时间中的步行到站用时,候车用时,下车后步行用时分别是步行到站、起点站候车、步行离站3阶段所用的时间,车内用时则是首次乘车与再次乘车阶段的时间之和,换乘用时是各次换乘所用时间之和。因此,计算公交出行时间,关键在于获取乘客的出发时刻、到达时刻和每次乘车的上下车时刻。
图1 公交出行各阶段
2.1 采集原始出行轨迹
为获得更好的通讯质量,当乘客移动时,手机会不断地切换到信号强度更强的基站[12]。通过采集公交乘客出行中的基站切换序列,并使用包含基站信息与对应定位位置的外部数据库得到对应的定位信息,即可得到乘客的原始出行轨迹,具体采集方式见3.1节。在我国,采用微蜂窝的市区,基站定位精度可达到100 m,而使用多层小区结构的繁华商业中心,定位精度甚至可以小于50 m[13]。
2.2 预处理原始出行轨迹
在对乘客的出行轨迹与公交数据进行匹配前,需要先进行预处理,消除原始出行轨迹中包含因“乒乓效应”造成的虚假移动及明显地偏离真实轨迹的定位点等扰动数据。
2.2.1 消除“乒乓效应”
乘客在两个蜂窝小区边缘附近时,因建筑物对无线电信号传输的影响,手机可能会在两个基站间频繁切换,造成“乒乓效应”[14]。当这种基站切换序列转化成出行轨迹时,会造成乘客在两点之间频繁来回虚假移动。使用滑动时间窗算法能去除“乒乓效应”。根据经验值,滑动时间窗的宽度取3。
算法步骤如下:
Step2:若k+2≤r,进入Step3;否则进入Step4。
Step5:若k+1≤n,进入Step6;否则输出P,结束。
Step6:若tk与tk+1相同,把pk+1从P中删除,回到Step5;否则记k=k+1,回到Step5。
2.2.2 消除明显偏离点
乘客的原始出行轨迹也有可能明显地偏离真实轨迹,这是由于外部数据库的定位数据不够准确或非最新导致的。基站定位轨迹点间距较短,且正常定位轨迹与实际轨迹基本相符,使用两点间的直线距离计算平均速度与公交车实际平均速度相近,而偏离点平均速度往往明显大于正常值。因此通过计算各点的平均速度,排除速度值过高点,能除去部分定位错误点。出行轨迹中正常的高速部分一般是在乘车时产生的,参照现有的南海区公交车GPS数据,以实际运营时的最高时速作为限制阀值,取91km/h。
定义pi与pj间的平均速度vij,如式(1):
(1)
定义速度限制阀值vmax。
算法步骤如下:
Step1:记k=1。
2.3 匹配对比乘客出行轨迹与公交数据
从乘客的出行轨迹中只能得到出发时刻与到达时刻,要获得上下车时刻,还需要知道乘客所乘坐的公交车,以该辆公交车在乘客上下车地点的进出站时刻近似地作为乘客的上下车时刻。为此,需要将乘客的出行轨迹与公交线网、公交车GPS轨迹进行匹配。公交线网数据包含公交站点的位置,以及公交线路途经哪些站点。
首先,对乘客出行轨迹与公交线网数据进行空间匹配,得到乘客可能的上下车地点列表。然后,对可能的上下车地点附近有停站的公交车进行空间搜索,筛选出乘客可能乘坐的公交车。最后,对乘客出行轨迹与候选公交车的GPS轨迹进行序列对比,判断乘客实际乘坐的公交车,以该辆公交车的进出站时刻近似地作为乘客的上下车时刻。
一次公交出行往往由“步行-乘车-步行”组成,因此上下车地点通常出现在出行轨迹的两头。得到可能的上下车地点列表后,应从采集时间间隔最大的组合开始分析,直到找到乘客实际乘坐的公交车为止。
2.3.1 得到可能的上下车地点列表
只有当乘客的出行轨迹中某两个基站定位点附近的公交站点有相同的线路途经时,即理论上可从一点乘坐公交车到达另一点时,才认为这两点是乘客可能的上下车地点。
(2)
算法步骤如下:
Step2:将P里的点两两组合,保存到L。
2.3.2 筛选乘客可能乘坐的公交车
定义点pk的有效时间范围fk。fk指从tk开始,到tk+1为止的时间。
定义乘客可能乘坐的公交车集合G=[g1,g2,…,gv],其中每一个gk为一辆公交车,v为集合内总公交车数。
算法步骤如下:
Step1:记k=1。
2.3.3 获得乘客的上下车时刻
(3)
算法步骤如下:
Step2:按式(3)计算G内每一辆公交车gk的轨迹与乘客出行轨迹P的相似度S,记相似度最高的公交车为gs。
2.4 计算公交出行时间
获得乘客上下车时刻列表T后,即可计算公交出行时间。
定义步行到站及候车用时twalk1;定义下车后步行用时twalk2;定义车内用时tincar;定义换乘用时ttransfer。
各时间信息计算公式如式(4)~式(7):
(4)
(5)
(6)
(7)
实验用的手机型号为HTC G6(Legend),操作系统为Android OS 2.1;服务器端电脑配置为Intel Xeon(R) CPU E5520 2.27GHz×2,4 G内存,操作系统为Windows Server 2008,数据库为Microsoft SQL Server 2008 R2。
3.1 公交出行轨迹的采集
在佛山市南海区采集的14条公交出行原始基站定位轨迹如图2。具体采集方式为编写采集程序并安装到智能手机上,出发前开启采集软件,选择开始记录,由软件自动记录出行中的基站切换序列,到达目的地后选择完成记录,并上传到服务器端,服务器端自动转换为原始出行轨迹。为方便研究,出行中同时通过人工记录实际上下车时刻,并使用手机GPS模块记录实际的GPS定位轨迹。
图2 采集的基站定位轨迹
3.2 基站出行轨迹的预处理
图3(a)是一条原始基站定位轨迹。粗实线是手机GPS模块所记录的GPS轨迹,细实线是基站定位轨迹,正方形是基站定位点。经过预处理后的轨迹如图3(b),基站定位点改由三角形表示。从图上可看出,轨迹开头受“乒乓效应”影响的部分及中部两个明显偏离真实轨迹的点均被修正。
图3 预处理前后的基站定位轨迹对比
3.3 公交出行时间的计算
表1显示了实际上下车时刻与估计值的对比,表2显示了实际公交出行时间与估计值的对比。其中所记上车记录时刻为从上车至在车厢中坐下之间的某一时刻,下车时刻为从车辆到站至下车之间的某一时刻,与精确的上下车时刻误差约在±10 s以内。公交线网、公交车GPS轨迹等数据由佛山市南海区环境运输和城市管理局提供。
表1 上下车实际时刻与估计时刻对比
表2 公交出行实际时间与估计时间对比
(续表2)
轨迹编号1234567891011121314换乘时间实际————————11——173—估计————————10——172—误差————————1——01—下车后步行时间实际25334443467421估计14324333367421误差11010110100000
从表1、表2中可看出,使用公交车GPS日志数据获取的公交出行时间误差大部分在1 min以内,笔者提出的公交出行时间计算方法足以满足公交调整与优化的精度需求。
公交出行时间在公交调整与优化中均起到重要的作用,但现有的研究并不能精确计算公交出行时间。笔者结合乘客的基站定位轨迹、公交线网与公交车的GPS轨迹,提出了一种精确计算公交出行时间的方法。通过智能手机采集基站定位轨迹,并针对原始基站定位轨迹中扰动数据的特征,进行相应的预处理,在此基础上匹配乘客基站定位出行轨迹与公交线网数据,判断乘客上下车地点,再将乘客基站定位出行轨迹与公交车GPS轨迹进行序列对比,获得乘客上下车时刻,据此计算公交出行时间。实验结果表明,经过预处理的基站出行轨迹与真实出行轨迹数据基本一致,在此基础上获得的公交出行时间误差在1 min以内,能满足公交调整与优化的精度要求。下一步将研究计算换乘距离、换乘比例的方法,为公交调整与优化提供更为充足的数据支撑。
[1] Stopher P,Fitzgerald C,Xu M.Assessing the accuracy of the sydney household travel survey with GPS[J].Transportation,2007,34(6):723-741.
[2] 杨飞.基于手机定位的交通OD数据获取技术[J].系统工程,2007,25(1):42-48. Yang Fei.Traffic OD data collection based on cell phone location technology[J].Systems Engineering,2007,25(1):42-48.
[3] 黄美灵,陆百川.基于手机定位的交通OD数据获取技术[J].重庆交通大学学报:自然科学版,2010,29(1):162-166. Huang Meiling,Lu Baichuan.Traffic OD data collection technology based on mobile phone location[J].Journal of Chongqing Jiaotong University:Natural Science,2010,29(1):162-166.
[4] Mavoa S,Oliver M,Witten K,et al.Linking GPS and travel diary data using sequence alignment in a study of children’s independent mobility[J].International Journal of Health Geographics,2011,10(1):64.
[5] Stopher P,Shen L.In depth comparison of global positioning system and diary records[J].Transportation Research Record:Journal of the Transportation Research Board,2011(2246):32-37.
[6] Bricka S G,Sen S,Paleti R,et al.An analysis of the factors influencing differences in survey-reported and GPS-recorded trips[J].Transportation Research Part C:Emerging Technologies,2012,21(1):67-88.
[7] Greaves S,Fifer S,Ellison R,et al.Development of a global positioning system web-based prompted recall solution for longitudinal travel surveys[J].Transportation Research Record:Journal of the Transportation Research Board,2010(2183):69-77.
[8] Pu J,Xu P,Qu H,et al.Visual analysis of people's mobility pattern from mobile phone data[C]//Proceedings of the 2011 Visual Information Communication-International Symposium.Hong Kong:ACM,2011:13.
[9] Sevtsuk A,Ratti C.Does urban mobility have a daily routine? Learning from the aggregate data of mobile networks[J].Journal of Urban Technology,2010,17(1):41-60.
[10] Calabrese F,Colonna M,Lovisolo P,et al.Real-time urban monitoring using cell phones:A case study in Rome[J].IEEE Transactions on Intelligent Transportation Systems,2011,12(1):141-151.
[11] Becker R A,Caceres R,Hanson K,et al.A tale of one city:Using cellular network data for urban planning[J].Pervasive Computing,IEEE,2011,10(4):18-26.
[12] 赖见辉,陈艳艳,钟园,等.基于手机定位信息的地铁乘客出行路径辨识方法[J].计算机应用,2013,33(2):583-586. Lai Jianhui,Chen Yanyan,Zhong Yuan,et al.Travel route identification method of subway passengers based on mobile phone location data[J].Journal of Computer Applications,2013,33(2):583-586.
[13] 朱鲤,孙亚,胡小文.基于手机定位的动态行程时间探测 [J].计算机工程与应用,2007,43(10):244-248. Zhu Li,Sun Ya,Hu Xiaowen.Realization of dynamic travel time collection technology based on mobile phone[J].Computer Engineering and Applications,2007,43(10):244-248.
[14] 杨涛.基于基站切换的交通信息采集技术应用研究[J].现代电子技术,2012,35(15):145-147. Yang Tao.Application of traffic information collection technology based on base station handover[J].Modern Electronics Technique,2012,35(15):145-147.
Accurate Bus Travel Time Automatic Calculation Based on Multi-Source Data
Cai Wenxue1, Chen Guangwen1, Luo Weihai2
(1.School of Economics & Commerce, South China University of Technology, Guangzhou 510006, Guangdong, China;2. Environment, Transport and Urban Administration of Nanhai, Foshan 528299, Guangdong, China)
An accurate bus travel time automatic calculation algorithm was proposed based on multi-source data, including the cell tower location trajectory, public transit network and buses’ GPS trajectories. First, the cell tower location trajectory was collected by a smart phone. Second, a sliding time window based algorithm was applied to remove the disturbance data in the cell tower location trajectory caused by cell towers switching “ping-pong effect”. Third, the cell tower location trajectory was matched with the public transit network by their spatial correlation, to obtain locations where the passenger gets on and off the bus. Finally, the cell tower location trajectory was sequence compared with buses’ GPS trajectories, to obtain the passenger’s bus travel time. The experiment of bus travels in Nanhai, Foshan shows that, the error of the bus travel time obtained by the algorithm is within 1 minute, which can satisfy the precision requirement of public transit network adjustment and optimization.
traffic engineering; travel survey; public transit planning; multi-source data; cell tower location; GPS location
10.3969/j.issn.1674-0696.2015.03.25
2013-12-29;
2014-02-20
广东省交通运输厅科技项目(2010-02-050)
蔡文学(1968—),男,湖北荆州人,教授,博士,主要从事智能交通系统,物流信息化方面的研究。E-mail:ctwxcai@scut.edu.cn。
U491
A
1674-0696(2015)03-122-05