杨永平 陈红顺 汤 健
(北京师范大学珠海分校信息技术学院 珠海 519000)
一种基于历史数据与实时信息的公交路段行程时间预测*
杨永平陈红顺汤健
(北京师范大学珠海分校信息技术学院珠海519000)
摘要在分析公交车的运行过程及影响因素基础上,根据公交车行驶的周期性特点,提出了根据行驶中公交车过站时刻的历史数据分类方式,为了反映当前的行驶状况,引入了最近邻车次在目标区段即时行驶信息对历史数据预测结果进行调节。实验结果表明,此种预测方法与典型的回归分析方法相比减少了需要的数据量和复杂度,与历史数据统计法相比对偶发性情况有更好的适应性。
关键词公交到站时间; 行驶时间预测; 时间周期性; 实时路况; 变化趋势
Class NumberTP311
1引言
随着我国机动车保有量的增多,拥堵在大中城市已经成为常态,加上停车难等问题,公交出行成为了减少拥堵、绿色出行的优先方式。理论上,公交车辆运行有固定的班次与时间间隔和行驶时间,具有与轨道交通相同的到站准确性,则乘客可以合理地规划自己的出行。然而实际公交运行过程中,受到天气、交通流量、人员流量、路况、交叉路口等因素的影响,公交运行实际情况与预计差别很大。珠海70路公交车共有24站,8辆车,某时刻的过站情况如图1所示。
可以看到车辆行驶分布非常不均匀,根据一个工作日在梅溪牌坊站的实际测量,70路车同方向车辆到达间隔时间最快为3min,最大达25min,从梅溪牌坊到一六八医院行驶时间在38min~80min之间,这样大范围的变动给公交公司的管理和公交乘客都造成了困扰。随着公交系统引入GPS卫星定位、移动通信技术、地理信息系统技术等,可以实时获取公交车位置,测定距离和速度。进行更加准确的到站时间预测和运行时间预测,可以给乘客提供更好的服务。
图1 珠海70路公交车实时过站信息
国内外的一些学者提出了一些公交行驶预测技术,如历史数据模型、回归分析法、神经网络模型、卡尔曼滤波、动态交通分配模型等[1],这些方法在预测公交运行较平稳的郊区或者非拥堵区,结果比较可靠,但对于平峰高峰变化期,有突发事件等情况,则预测效果往往不理想,有些方法还存在数据量过大,数据获取不容易,可行性不高,参数和模型不通用,移植性不好等问题。本文在实际调查公交运行数据的基础上,仅仅使用GPS和无线通信技术获取数据,结合历史与即时数据进行一种新型的公交行驶时间非参数预测。
2公交车运行时间的特点与影响因素
影响公交运行的因素,有道路条件、速度限制、交通路口、停站时间、天气、司机、车辆、站点上下车人数、等候进站时间、突发事件等,它们的改变都可能对公交行驶时间造成影响,这些因素并不独立影响行驶时间,有的因素还存在着影响随机性大,如果采用多因素参数模型进行估计,存在量化描述困难和影响程度难以确定等问题,实际应用中准确性并不高。已有学者研究表明,多变量模型预测效果往往不如单变量模型[4]。
公交车的行驶线路固定,人流、车流变化比较规律,如工作日的人员的流动,主要是上班、下班、上学、放学,稳定性很强,时间和人车数量都比较固定,周末的出行人流、车流也有相似的时间变化性。实际调查显示,公交车的运行具有很强的周期性,以一星期为周期,则描述通用型很高。数据显示,在同一天中,不同时间段的流量符合统计规律,如从7:00~9:00为峰时,下午17:30~20:30为峰时,一周工作日里周五和周一与其它三天有一些区别,峰时较长,时间也有一点错位。而节假日的峰时、平时与工作日又有很大的不同,另外举行大型活动、交通管制、施工等会导致交通有明显变化。公交车辆与普通的车流相比,历史趋同性更高,在不出现突发意外情况下,使用历史同期数据进行预测的准确性很高。非参数回归模型认为所有固定的、随机的因素的影响都反应到了历史数据中,只要观察结果就可发现内在规律,直接根据历史数据来考察行驶情况,相当于综合考虑了各种因素影响的叠加。
格斗开始。威尔和艾尔在场上面对面站开,空气中泛着杀气。只见他们抬起手护住头部——就像老四教的那样——面对面在场上跨步绕圈。艾尔比威尔高约十五厘米,块头却要大两倍。盯着他看的时候,我才发现他的五官也都那么突出——大鼻子,厚嘴唇,大眼睛。我觉得这场比赛不会太持久,谁胜谁负显而易见。
T[S,D)= ∑mi=1(∑n-1i=0Tstop(S+i)
T[S,D)= ∑n-1i=0Tstop(S+i)
整个区段历史行驶平均时间等于各站点平均停留时间之和与所有相邻站点段平均行驶时间之和相加。时间和位置数据的测定简单易行,传输成本低可靠度高,可以采用GPS和移动通信结合的方式获得数据,数据库保存每个站点的停站时间和相邻站点间的行驶时间。
3预测模型
历史周期法非参数回归模型建立在人流和车流有周期性的基础上,交通数据在总体趋势上比较符合以天为单位变化,但节假日和工作日有差别,周一周五也有些差别,以星期为单位的周期性模型可以适合大多数时间,有很强的通用型。对于某些特别的时间交通会有较大的变动,比如交通临时管制,举办大型活动,天气变化等非周期性事件的发生,有些路段在某个时段还会偶尔突发拥堵,这些情况都会导致车辆真实通行时间和使用历史同期数据预测有较大的误差。为了消除偶发波动性,还需要同时考虑当前道路行驶状况。相邻的两个班次之间,外部条件变化有一定的相似性,交通有一定的惯性和连续性,可近似认为相邻的两个班次之间,路况具有相同幅度的变化[2],例如上一个班次的运行时间与历史同期运行时间相比有一个明显的提升,则认为当前班次与历史同期也具有相同的相对变化性;而如果上一个班次与历史同期相比明显变慢,如临时交通管制双行变单行导致通行效率下降,当前班次的预测时间可进行相同幅度的调整。假定周期性的固定条件、数据不变,则波动性由一个周期性数据叠加了一个随机值,以待预测路段当前运行的同车次车辆行驶数据作为随机值的决定依据。
假设当前公交班次是第K次,待预测班车L刚刚经历的站点为S,目标站点为S+n,则使用最近运行于S和S+n之间的m个K班次车辆的到站离站数据,取得它们的历史偏差加权平均值,预测当前车次车辆与历史同时刻平均耗时的偏差。
3.1历史数据的获取
图2 某时刻K次公交L…L+m车辆与站点S…S+n之间的关系
下面是周二9:30从梅溪牌坊到一六八医院的历史花费时间,同期历史数据为周二9:25~9:35经过梅溪牌坊站点的公交的实际耗费时间。共花费8周采集得到10个样本时间:
36,40,40,34,36,38,35,37,38,39
以星期为周期对数据进行分类是一种静态分类方式,其它分类方式有基于数据挖掘的聚类分析方法,属于动态分类方式,需要对数据进行大量分析且需采集更多数据才有代表性,测量维度多,有新数据加入时模型也要变动,实施代价高,实时预测较为困难。静态分类也可以进行一定的数据压缩,如星期二,星期三,星期四具有高度相似的运行特点,将其归为一类即可,工作日9点~10点运行情况无波动,则将前后取得数据的区间从10min延长为1h,根据实际统计,长假可归为假初、假中、假尾三种类型。实际运行效果显示,此种人工干预分类的方式比自动学习聚类分类的方式更加有利于系统长期工作和稳定运行。
只选取本车次(如K次车)的数据作为当前预测的历史数据,是由于即使有多个车次有部分路段经停站完全相同,但客流或策略等可能有很大的差别,造成数据较大的差异。
数据采集和保存格式如表1。
表1 数据采集和保存格式
类型的取值为星期一,星期二,…,假始,假中,假终等。车辆每进入一个站和驶出一个车站,都给数据中心发送进站出战、站名、位置和时间信息。
3.2最近行驶情况的反映
对下一路段真实行驶情况的反映,可选的现有数据有本车过往运行速度,本车最近运行速度,前车运行数据等,它们能在一定程度上反映路况、车况。经过实际调查,待预测区段S-D之间最近通行状况更能反映下一阶段的行驶效果。当前待预测车辆编号为L,最近经过或到达S+n站点的车辆编号为L+m,则在它们之间的车辆编号为(L+1,L+m-1)。为了简化预测模型,采用m次车的历史耗时偏差的距离加权平均值反映当前路况与历史路况的差别,第i号车最近驶出的站点S+j距离S站点的距离为Li,j为编号为i的车辆最近驶出的车站,偏差系数表示为
t为当前时刻,T[k,S]为当前待预测公交车离开S站的时间,如果还未出站则取0。即时数据采集格式:
车次车牌号站名入站时间出站时间方向
4预测方法验证
1) 选取70路车梅溪牌坊到一六八医院进行验证。工作日闲时,没有异常情况发生。
图3 某工作日预测时间与实际花费时间
如图3所示,预测值和实际值都与历史数据很相近,引入最近m次车运行信息之后的预测数据对历史数据的修正较小,但是对结果还是有一定的改善,直接采用历史同期数据预测结果平均偏差2.5min,本文方法预测平均偏差1.6min,偏差都在10%以内。
2) 选取70路车梅溪牌坊到一六八医院进行验证。交通有一定的异常的预测。
从图4可以看出,引入了最近m趟公交的实际行驶信息后,预测值与历史周期均值预估相比要更接近真实值,更准确,路况的变化能够及时反映。本次测试使用历史数据预测平均偏差6.5min,引入最近m趟车的数据进行预测平均偏差为2.5min,结果的到明显提升。70路车路况较好,变化周期性明显,因此本方法预测效果很好。对于一些市内拥堵更多,交叉路口和红绿灯更多的车次,此种预测方法的效果还需要进行检验,对影响系数进行调整。
图4 下雨导致交通与历史数据有一定差距下的预测
5结语
准确、可靠的公交车区段运行时间预测是一项复杂的工作,影响因素众多,各因素影响效果不确定,各因素不完全独立,因此建立包含各种影响因子的模型较困难,获取各影响因素的准确描述也很困难。比如突发降雨对交通影响很大,而连续间歇降雨对交通的影响要小一些,但对不同的线路影响也不一样。历史数据加实时信息综合预测的方法,采用历史数据为基础,考虑了人流、车流的周期性特点,加上当前行驶信息修正预测结果,仅需获得车辆出站入站相关信息,数据获取简单可靠,采用近邻m次车的运行偏离期望值来反映行驶的变化,和其它模型相比,容易实施。仅依赖历史和实时的运行数据的数据采集和计算特点,模型通用性好计算量小,可实时预测,经过验证,预测结果也比较接近实际值。
参 考 文 献
[1] 向红艳,彭学文.公交到站时间预测研究现状与发展趋势[J].交通信息与安全,2014,32(4):57-61.
XIANG Hongyan, PENG Xuewen. Current Study and Development Trend of Bus Arrival Time Prediction[J]. Journal of Transport Information and Safety,2014,32(4):57-61.
[2] 周雪梅,彭昌溆,宋兴昊,等.基于前车数据的动态公交车辆到站时间预测模型研究[J].交通与运输,2011,(2):52-56.
ZHOU Xuemei, PENG Changxu, SONG Xinghao, et al. Prediction Model of Dynamic Bus Arrival Time Based On the Front Bus Data[J]. Traffic and Transportation,2011(2):52-56.
[3] 陈巳康,詹成初,陈良贵.基于路段行程时间的公交到站预测方法[J].计算机工程,2007,33(21):281-282.
CHEN Sikang, ZHAN Chengchu, CHEN Lianggui. Prediction Method of Bus Arrival Time Based On Link Travel Time[J]. Computer Engineering,2007,33(21):281-282.
[4] D. Angelo M. AI-Deek H. Wang M. Tavel Time Prediction for Freeway Corridors[J]. Transportation Research Record,1999(1676):184-191.
[5] 于滨,杨忠振,林剑艺.应用支持向量机预测公交车运行时间[J].系统工程理论与实践,2007,27(4):160-165.
YU Bin, YANG Zhongzhen, LIN Jianyi. Bus Arrival Time Prediction Using Support Vector Machines[J]. Systems Engineering Theory and Practice,2007,27(4):160-165.
[6] 牛虎.公交车辆到站时间预测研究[D].北京:北京交通大学,2010.
NIU Hu. Research on Bus Arrival Time Prediction[D]. Beijing: Beijing Jiaotong University,2010.
[7] 谢玲,李培峰,朱巧明.一种动态和自适应公交到站时间预测方法[J].计算机科学,2015,42(1):253-256.
XIE Ling, LI Peifeng, ZHU Qiaoming. Adaptive Medhod of Predicting Arrival Time of Buses on Dynamic Traffic Information[J]. Computer Science,2015,42(1):253-256.
[8] 计晓昕,关伟.组合非参数回归和卡尔曼滤波的公交到站时间预测[J].科学技术与工程,2013,13(32):9581-9586.
JI Xiaoxin, GUAN Wei. Bus Arrival Time Prediction Combining Non-parameter Regression Method and Kalman Filtering Method[J]. Science Technology and Engineering,2013,13(32):9581-9586.
[9] 邵健,李彦明,苗玉彬,等.智能公交系统中的信息采集与处理技术[J].计算机工程,2008,34(12):274-276.
SHAO Jian, LI Yanming, MIAO Yubin, et al. Information Collection and Processing Technology in Intelligent Transportation System[J]. Computer Engineering,2008,34(12):274-276.
[10] Liu Hao, Henk J van Zuylen, Hans van Lint, et al. Prediction of urban travel times with intersection delays[C]//Vienna, Austria: Intelligent Transportation Systems, Proceedings of the 8thInternational IEEE Conference on Intelligent Transportation Systerms, date: 13-16 September.2005:1062-1067.
Prediction of Travel Time Based on Historical Data and Real Time Information
YANG YongpingCHEN HongshunTANG Jian
(College of Information Technology, Beijing Normal University Zhuhai Branch, Zhuhai519000)
AbstractOn the basis of analyzing the running process and the influencing factors of the bus, the cyclical characteristics of the bus running are pointed out. A data classification method based on the arrival time is proposed in order to reflect the current travel situation. The same serial number buses driving informations on the trips recently between the current site and the target site are used to adjust forecast data. Experimental results show that this method reduces data amount and data complexity compared with the typical regression analysis method, and it has better adaptability compared with the method of historical data statistics.
Key Wordsbus arrival time, travel time prediction, time periodically, real-time traffic, variation tendency
* 收稿日期:2015年11月7日,修回日期:2015年12月19日
作者简介:杨永平,男,硕士,讲师,研究方向:计算机算法、网络与信息安全。陈红顺,男,博士,讲师,研究方向:遥感与GIS应用,信息技术系统集成开发。汤健,男,硕士,工程师,研究方向:网络工程、网络安全。
中图分类号TP311
DOI:10.3969/j.issn.1672-9722.2016.05.017