考虑轨迹数据的公交运行状态识别

2023-03-14 03:50邓红星白伊杨
关键词:增加率单程路段

邓红星,白伊杨

(东北林业大学 交通学院, 哈尔滨 150004)

0 引言

大力发展公共交通是解决“城市交通拥堵”问题最重要的途径之一,常规公交目前仍然是我国多数城市公共交通系统的主体。在此背景下,如何提高公交的运行效率和服务水平,需要交通管理者对公交运行状况和线路存在的问题有整体把握。为此,对常规公交实际轨迹状况进行研究[1],分析公交运行可靠性、识别线路拥堵高发路段对于决策者评价公交运行效果,解决城市规划中公交系统存在的问题具有重要参考价值。

识别公交运行状态离不开公交轨迹数据,利用公交GPS数据进行交通研究已经成为新趋势[2]。随着智能交通的应用,配有全球定位系统(GPS)和无线通信模块的公交车辆能记录到高精度、易获取、低成本的轨迹数据。在公交轨迹数据与线路匹配算法选择方面,Lin等[3]基于公交GPS数据提出了3种车辆与线网匹配的算法,从稳定性、精确度和鲁棒性等方面评价3种算法预测公交车到站信息的能力,并选择出最佳的预测算法。Hsueh等[4]基于GPS数据提出了车辆与路网匹配的STD-Matching算法,计算出道路速度约束及车辆行驶路径,为交通拥堵识别提供了建模和数据可视化条件。在公交运行指标的选取方面,对于公交行程时间可靠性分析及影响因素研究较多。王玲等[5]基于上海市所有公交线路运行GPS数据,分析影响公交线路行程时间可靠性的显著因素和影响规律,并构建逻辑回归模型定量分析影响因素与公交线路可靠性间的关联。王殿海等[6]基于公交轨迹的地图匹配算法提取公交区间行程时间,建立行程时间可靠性的计算模型,并根据实测数据定量分析交通条件、道路条件及采样间隔等因素对公交行程时间可靠性指标的影响。Ehsan等[7]基于公交GPS数据分析公交运行时间在不同时段的分布特征,探究了影响时间变化的因素。在拥堵指标的研究方法选择方面,包括基于拥堵里程比例、出行时间和综合评价等方法。WANG等[8]基于GPS数据提出一种拥堵时空关联性的交互式可视化分析方法,用拥堵蔓延图可视化了交通拥堵。张俊涛等[9]总结车辆运行的4种通行状态,提出了一种基于轨迹分段的拥堵检测的可视化方法,能较好估计城市拥堵状况。陈鼎等[10]基于轨迹数据采用ST-Matching算法对车辆轨迹和路网数据进行匹配融合,通过概率密度分段函数构建具有自适应调节的拥堵指数模型,并对交通运行状态进行识别应用。邬群勇等[11]基于车辆轨迹数据计算出城市道路拥堵指数.提出一种拥堵指数异常判别和基于区域连续性修正方法。

本文中借助Python数理分析库处理公交轨迹数据完成了地图匹配,刻画公交实际运行状况,进而统计出车辆单程耗时和早晚高峰及平峰时段的车辆到站时间间隔。计算公交单程准时度和单程准时稳定度运行指标值,对公交运行可靠性进行评估,并提出一种基于运行时间增加率的拥堵高发路段识别方法。可为公交运行效果评估工作提供借鉴,为提高公交运行效率、优化线路拥堵高发路段提供参考依据。本文中以哈尔滨84路公交轨迹数据为例,对该线路拥堵的时空特征进行分析。

1 基于轨迹数据公交运行图获取

1.1 数据预处理及地图匹配

公交GPS数据(即轨迹数据)记录了车辆ID、GPS时间、经纬度、速度、上下行方向等关键信息,是分析公交运行状态及识别线路拥堵高发路段的重要数据源。对于该数据集是否适合本研究主题,其采样时间间隔、坐标转换、异常数据筛选需格外关注。

步骤1采样间隔。公交轨迹数据采样间隔频率越高,识别运行轨迹越精准。若采样间隔足够精细,公交车辆的加减速状态可清晰描述;若采样间隔较粗糙,公交车辆的到离站特征行为不能准确刻画。因此研究公交运行状态的轨迹数据采样间隔不宜高于30 s。本数据集的采样间隔密度概率分布如图1所示,采样间隔集中在5 s左右,属于高频采样,连续性较好,极少出现缺失点,可用数据的占比率高,具有较高的精度与可信度,适用于公交运行状态识别。

图1 采样间隔密度概率分布曲线

步骤2坐标转化。将线路、站点GIS数据和公交GPS数据三者坐标系进行统一,由地理坐标系转换到投影坐标系,便于实现数据可视化,保证后续地图匹配的精确度及适配性。

步骤3地图匹配。公交轨迹数据与线路的匹配是公交运行状态识别的核心环节。公交车在行驶过程中受到设备设施、卫星信号等干扰因素影响,导致设备记录的GPS数据和当时公交所处位置准确值存在一定误差。为了减少轨迹数据的误差,将公交车辆行驶轨迹与线路GIS信息进行匹配并加以修正,排除异常点。即将公交GPS点和站点匹配到公交线路上,确定出每个GPS点处于公交线路的具体位置,进而判断出公交运行具体位置。现有的地图匹配算法多应用在浮动车与路网匹配,类比浮动车和路网匹配思想,本文中的地图匹配的具体思路如下:

1) 设原始点G=(g1,g2,…gi,…gn)。利用project函数以半径r检索每个gi点距离线路l最近位置点(即匹配点),得到每个匹配点与线路起点o的距离D=(d1,d2,…di,…dn),并把距离集合输出。距离检索的规则可表示:

(1)

3) 绘制原始点G=(g1,g2,…gi,…gn)和匹配点P=(p1,p2,…,pi,…pn)相差距离值diff=(df1,df2,…,dfi,…dfn)的距离核密度概率分布曲线,如图2所示。原始点和匹配点距离差值主要集中在500 m以内,故建议设定距离阈值diff<500 m,将距离差超过500 m的视为异常距离,筛选掉远距离的异常点,使数据更具有可靠性。

图2 距离核密度概率分布曲线

1.2 公交运行图绘制

基于地图匹配结果,绘制每辆公交车运行轨迹,从运行图上识别公交到离站信息,进而得出公交的运行指标值。如图3所示,彩色线条代表84路所有公交车的运行轨迹,纵坐标表示地图匹配后站点位置,用灰色线标注。在绘制运行图时,存在某辆车GPS数据长时间缺失引起的轨迹线横穿了多条线,导致无法识别其运行轨迹的异常情况,应予以排除。对于异常数据,处理思路是如果某辆车长时间未采集到数据,且时间间隔大于30 min,则下次出现时认为是一辆新车,设定时间阈值30 min,从而消除长时间无数据情况的影响。

2 公交运行指标分析

2.1 到离站信息识别原理

通过公交运行图提取公交车的到站和离站信息,识别原理如图4(a)所示,横坐标表示时间,纵坐标表示距离。先提取出某辆车的运行轨迹(红色线条表示)和某一个站点位置(灰色线条表示),运行轨迹和站点的交集即为公交车辆的到、离站时间信息。由于站点存在车辆排队或其他外界因素干扰,公交停车位置和站点位置会存在一定距离偏差,故在站点前后设置一个50 m或100 m的Buffer缓冲区面,如图4(b)所示。将运行轨迹线与缓冲区第1个交点视作公交车辆的到站时间,最后一个交点视作离站时间。

图3 公交车辆运行曲线

图4 到离站时间识别原理示意图

由于现实交通情况的复杂性,车辆在某些站点存在停车再启动现象,此时车辆运行轨迹和缓冲区面有多个交点,短时间内在同一个站点出现车辆多次到离站的异常情况。针对此异常情况的处理思路如图4(c)所示,通过设置时间阈值确定异常情况的到离站时间间隔,排除短时间多次到离站的情况。一般常规,公交车到站停靠时间在5 min内,故根据经验值设时间阈值为5 min。若同一站点公交车辆在5 min内识别出多个到离站时间,则将车辆轨迹与缓冲面第一个交点横坐标值视作该站点真正到站时间,最后一个交点视作离站时间。

2.2 公交运行指标

根据公交运行图数据,统计得到每辆公交车的单程耗时(即公交车从起点到终点的耗时时长)、到站时间间隔(同一方向两辆车到达相同站点的时间间隔)。在统计到站时间间隔时需区分该到站记录是属于上行到站还是下行到站,标记此到站记录是处于早高峰、晚高峰还是平峰时段。基于单程耗时和到站时间间隔数据,量化分析公交行程时间可靠性,通过计算公交单程准时度和单程准时稳定度2个指标评价公交线路行程时间可靠性,为提升公交服务可靠性提供参考依据。

单程准时度[12-13]表示公交车从O点到D点间的平均时间距离与设计的标准单程时间的相对误差与1的差值。用来衡量公交车单程行驶过程的准时程度,描述一条公交线路一个方向上从出发点到终点行驶时间与设计的标准单程时间的偏差程度,且OWPI值越接近1,表明该方向的准时程度越高。

(2)

式中:OWPI为单程准时度;stdtow为设计的标准单程时间;distow为公交路径从O到D的平均时间。

单程准时稳定度[12-13]用来描述线路在一个方向上的准时度的变化程度,SOWPI越小则表明准时的变化程度越小。

(3)

3 考虑行程时间增加率的拥堵指标分析

(4)

(5)

(6)

abs(Δtij)的本质是行程时间增加率。行程时间增加率指的是单位距离内车辆增加的行程时间。若多辆车通过同一个路段,其行程增加率非常高,说明此路段经常产生延误,属于拥堵高发路段。通过分析该指标识别线路上存在的延误路段。行程时间增加率的计算原理如图5所示,将图5(a)公交运行曲线的横、纵坐标交换位置,则新曲线表示距离-时间的关系,如图5(b)所示。曲线斜率越平缓,说明路段的行程增加率越低,表示交通畅通;曲线斜率越陡峭,说明路段的行程增加率越高,表示交通拥堵。根据斜率的变化表征交通状况,对图5(b)的函数求导,导函数曲线如图5(c)所示,即公交车辆行程时间增加率分布情况。根据行程时间增加率数值分布识别线路中存在的拥堵高发段。

图5 行程时间增加率原理图

选取30 m的间隔长度计算整条线路的拥堵指标值ω,定义为以30 m的固定距离对各个路段im的运行时间增加率绝对数值abs(Δtij)进行权重计算。该值可反映公交线路总体的拥堵情况。ω值越大,说明该线路存在的拥堵高发路段较多。

(7)

式中:m为线路分割个数;L为线路总长度。

4 实例分析

采用哈尔滨市2022年3月17日84路公交GPS数据、线路和站点GIS数据进行案例分析。通过Python的数值分析库Pandas及地理空间分析库GeoPandas对数据进行统计分析,包括数据预处理、地图匹配、公交运行状态刻画,公交运行指标分析,以及拥堵高发路段的可视化。

4.1 公交GPS数据与路网匹配结果分析

根据轨迹数据处理步骤对84路公交GPS数据进行预处理,预处理前后的字段、数据类型、数据行数结果如表1所示。其中,满足模型计算要求的有效数据占比达到原数据的百分之84.5%。

表1 公交GPS数据预处理前后情况

线路信息:① 首末班时间:05∶30-20∶30;② 线路长度:27 439.279 848 781 93 m;③ 上行方向:仁里街-新三中公交首末站;下行方向:新三中公交首末站-仁里街 ;④ 方向类型:1=上行;0=下行;⑤ 站点数:49个。

地图匹配前后结果如图6所示,红色点代表公交站点,黑色点代表GPS点,匹配后的轨迹点走势和公交线路走势方向一致。原始轨迹点如图6(b)所示,根据图2设定的距离阈值500 m,筛选掉diff值大于500 m的轨迹点,并进行线路匹配,结果如图6(a)所示。

图6 公交轨迹数据与线路匹配前后结果示意图

84路当天共有40辆公交车辆运营,其中第一辆公交车1 d的运行轨迹见图7(a),横坐标代表时间,纵坐标表示站点名称,可以清晰判断出车辆任一时刻的所在位置。利用数据集ToDir列信息对所有公交的运行轨迹进行上、下行方向分类,如图7(b)所示,黑色代表上行方向,蓝色代表下行方向。

图7 公交车的运行轨迹曲线

4.2 运行评价指标分析

依据公交运行图,统计出公交车辆的单程耗时、运行速度、站点的到站时间间隔。单程耗时为公交车从起点站到终点站耗时时长,到站时间间隔为同一方向的2辆车到达相同站点的时间间隔。先区分出每辆公交车的上、下行驶方向,将同一方向每辆车起点和终点的时间信息提取后合并,排序后统计出每趟的出行时间(即单程耗时)。按每h进行分组,标识出该趟运行时间段,绘制上、下行耗时分布的箱型图如图8(a)所示,横坐标表示时间,纵坐标表示单程耗时,84路单程耗时多分布在75~100 min。运行速度箱型图如图8(b)所示,上、下行各时段运行速度分布在16~22 km/h,11—12点时间段下行方向速度较低,存在速度低于15 km/h的情况,说明该时段可能存在拥堵。根据哈尔滨绿色出行创建行动方案,早晚高峰期的公交车平均运行速度大于15 km/h,符合规定值。后续可进一步分析此情况产生的原因。

图8 单程耗时和运行速度箱型图

对到站时间间隔进行统计,先区分出到站方向,分别计算出在同一站点相邻车辆的到站时间间隔,并标记该到站记录属于早高峰、晚高峰还是平峰时段。根据哈尔滨交通运行特征,早高峰段为6时30分至9时,晚高峰段为16时30分至19时,其余时段为平峰时段。

在运行轨迹和到、离站时间信息的基础上,按照式(2)和(3)计算当天84路公交运行可靠性指标。总体单程准时度为88.33%,其中上行方向单程准时度为88.06%,下行方向单程准时度为93.85%。总体的单程准时稳定度为61.55%,其中上行单程准时稳定度为55.28%,下行单程准时稳定度为67.28%,上行和下行的行程时间可靠性不同,且上行方向比下行方向准时稳定度波动大。由于3月17日哈尔滨因疫情处于交通管控态,对公交运行的效率产生一定影响,且84路线路站点数目较多,超过30个站点,会降低公交时间可靠性,因此导致线路单程准时度较低。在公交线路规划时应尽量避免单程站点数过多。后续将进一步分析影响公交可靠性的影响因素。

4.3 拥堵高发路段识别

根据图5提出的拥堵高发路段识别原理思路,84路的两两站点间的交通拥堵指标值变化情况如图9所示,可以清晰观测到上、下行站点间行程时间增加率的变化情况。由于站点存在停车特征,运行时间增加率激增。而站站间的运行时间增加率大,说明存在拥堵路段,反之说明道路畅通。

为了更直观地掌握84路的拥堵常发路段,排除站点和交叉口停车导致的假拥堵现象,用热力图将行程时间增加率可视化。如图10所示,绿色代表畅通,红色代表拥堵。

图9 运行时间增加率分布曲线

图10 84路拥堵可视化热力图

图10(a)表示84路上行方向(仁里街至新三中公交首末站)交通拥堵状况,图10(b)表示84路下行方向交通拥堵状况。从热力图可知,84路部分路段存在拥堵路段,且、下行拥堵空间分布不均匀,下一步将分析造成拥堵路段的原因并提出改善方法。如对84路公交线路的拥堵区采取拓宽车道、设置公交专用道或提高公交运行高峰时段的车辆分流效率等缓解拥堵路段交通压力的方法。后续将结合多天数据深入研究如何降低线路拥堵持续时间、改善公交运行状态。本文中提出的基于运行时间增加率识别拥堵高发路段的方法可应用在频繁出现拥堵的路段,分析城市规划中的问题,辅助城市规划决策[15]。

5 结论

借助公交GPS数据分析城市公交运行状态,分析公交线路可靠性评价指标,提出了基于行程时间增加率识别拥堵高发路段的方法,可作为优化常发性拥堵段的参考依据。针对哈尔滨市2022年3月17日工作日的公交轨迹数据展开试验论证,分析了单条线路的运行状态。下一步工作将结合周、月轨迹数据细化研究多条线路,容纳时间周期性、空间区域性、政策干预性和突发性等特殊因素对公交运行轨迹进行研判,进一步分析影响公交可靠性的原因,改善和精细计算线路拥堵指标,拓展方法的应用场景范围,保证城市交通平稳运行。

猜你喜欢
增加率单程路段
冬奥车道都有哪些相关路段如何正确通行
部、省、路段监测运维联动协同探讨
A Survey of Evolutionary Algorithms for Multi-Objective Optimization Problems With Irregular Pareto Fronts
基于XGBOOST算法的拥堵路段短时交通流量预测
也为你摘星
简析小说《单程票》中叙事视角的变换
5.7万内地人去年赴港定居
按封育类型进行封山育林试验初报
莴笋超声波辅助渗透脱水工艺研究
基于响应面分析的刺参渗透脱水工艺