基于浮动车数据的城市道路行程时间估计

2018-06-20 06:51李演洪
交通运输工程与信息学报 2018年2期
关键词:浮动路段偏差

罗 霞,曹 阳,刘 博,李演洪



基于浮动车数据的城市道路行程时间估计

罗 霞,曹 阳,刘 博,李演洪

(西南交通大学,交通运输与物流学院,成都 610031)

为提高城市道路行程时间估计模型的准确度和有效性,本文利用浮动车数据,依据对传统模型思路的总结分别建立了基于路段长度比例和点速度调和平均值的两种行程时间初阶估计模型,并利用统计学中的同分布融合思想建立了行程时间融合模型,以修正初阶模型结果的精度,弥补传统估计模型中准确度低、效率不高的缺陷。最后选取成都市具有代表性的路网区域为算例,验证了初阶模型假设分布的正确性,同时计算出融合模型路径总时间的平均偏差仅为12%,说明了融合模型的准确度和有效性。

交通工程;行程时间估计;同分布融合;浮动车数据

0 引 言

行程时间作为评价道路运行性质的关键信息参数之一,能够为出行者路径的选择及交通部门管理措施的制定提供决策依据,有助于提高交通流时空分布的合理性。浮动车数据凭借其精度高、覆盖广、成本低的特点已经成为估计行程时间常用的数据源之一[1]。目前国内外提出的方法主要有两大类,分别是理论解析法和实际工程模型[2]。

理论解析法主要是利用数学理论方法计算道路行程时间。Yang等人利用卡尔曼滤波方法构建了行程时间的预测模型[3,4],该方法自适应性较差,要得到较准确的结果需要考虑交通流环境的影响因素,对输入参数的类别要求较高;Zheng结合卡尔曼滤波模型提出了集成的扩展指数平滑方法[5];杨立娟同样利用指数平滑方法,并融合了神经网络模型和ARMA(自回归滑动平均模型)[6],这两类方法对数据量的要求都较高,数据量不够多时无法得到较准确的结果;Hofleitner等人基于贝叶斯方法实现了行程时间的估计[7];Rahmani利用统计学方法提出了非参数估计模型,利用计算得到的平均值作为行程时间结果[8]。虽然贝叶斯方法和非参数估计模型可以求得较准确的路段行程时间结果,但当车辆GPS(Global Positioning System)数据量较多时算法的运行效率会显著降低。

实际工程模型则是将研究重心放在了更微观的层面,即从单车行程时间分析入手,一般是通过对一定时间内特定路段中记录的瞬时速度进行分析计算获得行程时间。如武小云利用不同时间间隔内的车辆平均速度计算行程时间,最终以行程时间序列标准差离散程度最小为取值标准[9],这一类方法完全忽略了交叉口延误,得出的路段行程时间结果误差较大。为弥补这一缺陷,充分考虑车辆在交叉口的延误,一些学者不再将速度作为主要研究对象,而是利用相邻数据点间记录的时间、速度以及行驶距离等参数推断车辆经过路段节点的时刻,进而通过数理分析方法得到相应的路段行程时间结果。如王志建总结了低频数据在交叉口附近相邻数据点的四种分布,并根据车辆运行特征计算了通过交叉口的时刻[10],但该方法仅着重分析了车辆在交叉口的延误,未考虑车辆在非交叉口区域的速度变化。

为提高行程时间估计精度,本文综合上述两类方法思想,提出了一种基于路段长度比例和点速度调和平均数的同分布融合模型。模型解决了理论解析法中的算法结构复杂的问题,效率得到了较大的改善。同时,充分考虑了交叉口延误和车辆速度变化,准确度相较于实际工程模型有了明显的提高。最后,本文还选取成都市部分有代表性的路网进行了行程时间计算,并以一条特定路径实际行程时间为基准,对结果准确性进行了分析。

1 行程时间初阶估计模型

利用地图匹配方法,可以重建车辆行驶轨迹[11],得到车辆经过的轨迹矩阵和各GPS点对应的真实匹配点矩阵,其中包含了轨迹经过的所有路段信息,包含了GPS点的实际位置、时间及速度信息。以获得的信息为基础,本文提出了两种行程时间的初阶估计模型思路:思路一是依据路段长度占轨迹总长度的比例制定各路段权重,进而将路径时间分配到各路段上;思路二是根据匹配到各路段上的GPS点记录的点速度进行路段行程时间估计。这两类方法各有利弊,第一种考虑了节点(交叉口)延误但并不精确,而且没有分析车辆速度的变化;第二种考虑了车辆速度的变化但是得到的结果并没有完全包含节点延误时间。基于这两类方法在一定程度上可以互相补充,本节先分别利用这两种模型初步计算路段行程时间,在下一节中进一步建立融合模型,同时考虑车辆速度的变化和节点延误,提高估计结果的准确度。另外,由于不同时段交通情况可能会出现较大的改变,如平峰期和高峰期,因此下文建模时仅选择同一时段的浮动车数据。

1.1 基于长度比例的行程时间估计模型

图1 轨迹匹配示意图

通过模型建立的过程可以发现,在以路段长度比例为权重计算节点时刻时,由于对整条轨迹的行程时间进行了划分,得出的路段行程时间结果包含了车辆在节点处的延误,但是这一延误被均匀分配到了路段上,结果并不能保证完全准确。同时,该方法没有考虑车辆的速度变化,默认车辆记录的GPS点与点之间的速度不变,这对于低频数据来说误差将变大。

1.2 基于点速度调和平均值的行程时间估计模型

用式(2)计算出来的路径总行程时间与实际总时间相比往往会存在偏差,如图2所示。

图2 实际行程时间与计算所得时间偏差示意图

采用上述方法即可得到分布均值和方差。可以发现,基于点速度调和平均值来估计行程时间能够充分体现出车辆在行驶过程中的速度变化,但是车辆的GPS点往往都没有完全定位到节点上,对于节点处的延误这一方法并不能准确计算,甚至会完全忽略,因此存在误差。

2 同分布融合估计模型

为保证最终结果的合理性,将拒绝概率的界限值设为0.7,即,说明原假设不成立,接受计算出来的路段行程时间分布;否则,说明计算结果不理想,需按照步长继续用M-H方法从剩余样本量中抽取,直至更新得到拒绝或者该路段的样本量已全部计算完。为了提高效率以及充分利用样本,可将取值为2。综上所述,路段行程时间估计的算法流程如图3所示。

3 算例分析

以成都市2014年11月9日7:30~9:00早高峰时段的浮动车数据为例进行计算,该浮动车为出租车,原始数据量较大这里不再列出。选取市内具有代表性的路网进行算例分析,路网边界由金房苑路、群星路、九里堤路、一环路、红星路等构成,其经度范围为104.042 45°~104.101 56°,纬度范围为30.658 64°~30.710 57°。选取该区域作为研究对象的原因有两点:首先,区域包含学校和CBD地区,出行量较大,从而能获得足够多的浮动车数据量来支撑计算;其次,本研究实验室位于西南交通大学,前往CBD地区的人员和次数都较多,便于实际行程时间的获取进而实现模型验证。选取的路网如图4所示。

3.1 假设分布检验

以西体北路路段作为示例,来验证基于长度比例(模型1)和基于点速度(模型2)计算行程时间的结果是否分别服从所假设的对数正态分布和标准正态分布。两种计算结果均随机选取40个样本量,其中基于路段长度比例思路中需要对计算结果作对数,再作正态分布检验。通过SPSS软件的非参数检验中K-S方法进行分析,假设分布检验的结果如表1和图5所示。

表1 初阶估计模型的假设分布检验参考值

Tab.1 The reference values of the hypothesis distribution test of the initial estimation models

从上表中看出,两种方法的偏度和峰度值均小于1,且渐进显著性均大于0.05。同时,从图5也可近似看出两种数据类型服从正态分布,因此证明了这两种思路的原假设是成立的。

图5 两种思路的假设分布检验

3.2 结果对比分析

进一步对两种初阶模型进行融合,进而得到路网中各路段最终的行程时间结果,如图4所示。为验证结果合理性,以西南交通大学北门至天府广场为例进行分析验证,见图4加粗显示路径。以7:30~9:00坐出租车的实际出行时间为参照,连续试验3天,并将这3天的数据进行平均作为最终所得数据,判断该路径上的上述几种思路的效果以及融合方法所计算路段行驶时间的准确程度。

以所选的路径为例,将初阶估计模型和同分布融合模型的结果与实际路段的行程时间结果进行对比,如表2所示。根据结果进一步分析偏差,得到如图6所示的偏差对比图。

表2 三种行程时间估计结果对比

Tab.2 The comparison of estimation results of the three times

图6 三种模型偏差结果

从图6中可以发现,基于长度比例和基于点速度的模型所得结果偏差波动较大,并且偏差在30%以上的结果较多,有的甚至高达40%以上,因此可以说明初阶模型估计的结果并不准确。而融合后的模型偏差值大大降低,并且比较稳定,只有少数路段偏差大于20%,说明融合后路段行程时间估计值的准确度有了大幅提升。其中发现偏差较大的有路段行程时间过长的九里堤北路和过短的武都路,九里堤北路是拥堵较为常发的路段,其车辆行程时间变化幅度较大;而武都路,并不是由于变化量大,而是由于本身基数较小的原因导致的。另外,由于实测数据的时间与所采用的GPS数据日期不同,交通条件在不断变化,也是误差的来源之一。

对三种模型计算平均偏差,可以发现基于长度比例的行程时间估计方法偏差最高,平均值达30%,而基于点速度的行程时间估计方法偏差次之,平均值达21%。这是因为后者不仅以速度区别各路段,在计算的过程中也考虑了路段长度,并由路径总行程时间作了总量控制。而融合方法的平均偏差为12%,相对较低。综合以上分析,与前初步估计模型的计算结果比较,融合方法的计算结果偏差更小,路段行程时间更为精准。若采用的GPS浮动车数据的规模更大,其他软硬件设施更加完备的情况下,相信所获取的结果将更贴合实际的路网情况。

4 结束语

本文对传统的实际工程模型加以改进,提出了利用路段长度比例和点速度调和平均数初步估计路段行程时间的方法,并在这一基础上,结合统计学思想,对初步估计模型的结果加以融合,得到更加准确的城市道路行程时间。与传统方法相比,不仅提高了结果的精确度,还降低了算法的复杂程度,使得估计过程更加易于实现。通过分析实际算例结果,可以发现行程时间估计模型得出的各路段时间值与真实值存在一定的偏差,但大部分在可接受的范围内,整条路径的行程时间偏差较小,因此说明本文提出的时间估计模型具备有效性。

由于基于路段长度比例和基于点速度的两种模型对于交叉口延误的计算都不完全准确,因此融合后的算法在这一方面仍考虑得不够完善,如何合理有效地估计交叉口延误需要在下一阶段研究中进一步深入探讨。

[1] SHALABY A S, ABDULHAI B, BYON Y J. GISTT: GPS-GIS integrated system for travel time surveys[D]. England: University of Toronto, 2006.

[2] 李慧兵, 杨晓光, 罗莉华. 路段行程时间估计的浮动车数据挖掘方法[J]. 交通运输工程学报, 2014, 14(6): 100-116.

[3] YANG J S. Travel time prediction using the GPS test vehicle and Kalman filtering techniques[C]// American Control Conference, Portland: IEEE, 2005: 2128-2133.

[4] HAGE R M, BETAILLE D, PEYRET F, et al. Unscented Kalman filter for urban network travel time estimation[J]. Procedia-Social and Behavioral Sciences, 2012, 54(2290): 1047-1057.

[5] ZHENG F, WAN Y, WU P. Link travel-time prediction using extended exponential Smoothing and Kalman filter in dynamic networks[C]// Eighth International Conference of Chinese Logistics and Transportation Professionals. Chengdu: ASCE, 2009: 3753-3759

[6] 杨立娟. 基于浮动车的城市道路行程时间采集与预测方法研究[D]. 长春: 吉林大学, 2007.

[7] HOFLEITNER A, HERRING R, ABBEEL P, et al. Learning the dynamics of arterial traffic from probe data using a dynamic bayesian network[J]. IEEE Transactions on Intelligent Transportation Systems, 2012, 13(4): 1679-1693.

[8] RAHMANI M, JENELIUS E, KOUTSOPOULOS H N. Non-parametric estimation of route travel time distributions from low-frequency floating car data[J]. Transportation Research Part C Emerging Technologies, 2015, 58: 343-362.

[9] 武小云. 基于GPS浮动车的城市交通路段行程时间实时估算方法研究[D]. 广州: 华南理工大学, 2010.

[10] 王志建, 马超锋, 李梁. 低频GPS数据和交叉口延误下的行程时间估计[J]. 西南交通大学学报, 2015, 50(2): 361-367.

[11] CHANDIO A A, TZIRITAS N, ZHANG F, et al. An approach for map-matching strategy of GPS-trajectories based on the locality of road networks[J]. Lecture Notes in Computer Science, 2015, 9502(1): 234-246.

[12] 渐猛. 基于浮动车的道路交通状态判别方法研究[D]. 淄博: 山东理工大学, 2013.

(中文编辑:李愈)(英文审改:胡路)

Travel Time Estimation for Urban Roads Based on Floating Car Data

LUO Xia,CAO Yang,LIU Bo,LI Yan-hong

(School of Transportation and Logistics, Southwest Jiaotong University, Chengdu 610031, China)

To improve the accuracy of the model for estimating travel time of urban roads, based on we develop two kinds of initial estimation models of travel time based on the length ratio of the road and the mean value of the point velocity respectively. The two models employ the floating car data and the traditional model idea. Then a travel time fusion model is developed based on the same-distribution fusion ideas in statistics, which corrects the accuracy of the initial estimation models. This also improves the accuracy and efficiency of the tradition models. Finally, a representative road network area in Chengdu is selected as an example. The correctness of the hypothetical distribution of the initial estimation models are verified and the average deviation of the total path time of the fusion model is calculated to be only 12% , demonstrating the accuracy and validity of the fusion model.

traffic engineering; travel time estimation; same-distribution fusion; floating car data

1672-4747(2018)02-0001-08

U491.1

A

10.3969/j.issn.1672-4747.2018.02.001

2017-04-07

成都市科技项目(2015-RK00-00208-ZF)

罗霞(1962—),女,四川乐至人,西南交通大学交通运输与物流学院教授,研究方向为智能交通。

罗霞,曹阳,刘博,等. 基于浮动车数据的城市道路行程时间估计[J]. 交通运输工程与信息学报, 2018, 16(2): 1-8.

猜你喜欢
浮动路段偏差
电连接器柔性浮动工装在机械寿命中的运用
冬奥车道都有哪些相关路段如何正确通行
50种认知性偏差
如何走出文章立意偏差的误区
论资本账户有限开放与人民币汇率浮动管理
基于XGBOOST算法的拥堵路段短时交通流量预测
高速公路重要路段事件检测技术探讨
一种用于剪板机送料的液压浮动夹钳
基于元胞自动机下的交通事故路段仿真
基于元胞自动机下的交通事故路段仿真