公共汽电车到站时间预测质量评价研究

2020-11-04 01:31陈玥祺孙亚朱昊
交通与港航 2020年5期
关键词:首站时刻表准点

陈玥祺,孙亚,朱昊

上海城市综合交通规划科技咨询有限公司

0 引 言

公交信息服务是指为乘客提供乘坐公共汽电车出行所需的各类信息服务。近些年随着公交信息化的快速发展,大数据、云平台和移动互联网等技术的逐步普及,公交信息服务已由传统的站牌、地图手册等静态服务发展为以互联网和手机APP为主、涵盖公交出行全过程的动态信息服务[1]。

国外发达国家的公交站点除了提供预计到站时间等动态信息服务外,还提供静态信息服务例如公交首末班发车时间、公交运行线路图、途经本站点的时刻表等。近几年国内很多城市通过电子站牌提供了动态信息服务,主要是针对离站点最近的一辆公交车。如何对到站预测信息服务质量进行评价显得越来越重要。目前到站信息服务质量评价主要集中在定性分析和乘客满意度评价等方面[2],由于缺乏量化依据,很难对到站预测信息服务质量进行客观准确的评价。

1 研究必要性

国内的到站预测信息服务逐渐从传统的静态信息向动态信息转变,面向公众的公交实时到站预报服务成为公交信息化建设的重点。目前站点提供的到站预报服务以到站时间预测和站级预测为主,到站时间预测即在电子站牌显示下一班车到本站的时刻或剩余时间。到站时间预测的准确不仅与预测算法有关,还受时间、天气、设备精度、运营调度等因素影响,预测难度相对较大。站级预测为显示下一班车距离本站的站级数,由于以站级为单位,预测较前者简单,但对乘客的实用性不强。此外随着智能手机的普及和移动互联网的发展,基于手机APP发布的公交实时信息服务逐渐增多,乘客多了一种获取信息的途径[3]。

虽然到站信息服务发布方式众多,但对于核心的到站时间预测,由于没有统一的评价量纲,因此很难对其服务质量进行准确评价。而公交线路临时改线使得站点信息来不及更新发布、道路突发拥堵导致到站时间预测准确度下降,市民针对公交信息服务的投诉也有越来越多的趋势[4]。

在国家层面同样缺少对到站信息服务质量评价的标准,如何确定评价指标,如何设定评价阈值,以达到公众和行业都能接受的程度。对此,本文将结合以上问题,研究建立一个公交到站预测信息服务质量的评价体系。

2 研究思路

研究将分为两部分,第一部分对公交线路到站时间预测的准确率进行分析,第二部分对时刻表线路的到站准点率进行分析。

公交到站时间预测准确率是利用公交车辆实际到站时间(GPS到离站数据)和公交车辆预测到站时间,基于客观的大数据,分析距离站点最近一辆公交车的到站预测精度。通过对应的评价指标,对到站预测准确率进行评价。

时刻表线路是指在各站点(包括首末站和中途站)的站牌上张贴静态时刻表的公交线路。该静态时刻表显示各个班次到达该站的时间,乘客可通过该时刻表大致了解公交车的到站时间,以方便安排出行时间[5]。对于时刻表线路的准点率,利用站点静态时刻表与公交GPS实际到离站数据的比对,通过对应指标,对时刻表线路的到站准点率进行评价。时刻表虽然是静态公交信息服务,但比起动态的到站预测信息,其变量因素更多,预测难度也更大。

图1 技术路线

3 评价指标

3.1 到站预测准确率指标

对于到站时间预测准确率,预测的偏差程度为评价重点,本文将从相对偏差和绝对偏差两方面对预测准确率进行评判。

一、相对偏差准确度

在统计时段内,预测信息的准确率大等于80%的预测次数占全部预测次数的比例,即为相对偏差准确度[6]。

对某一次预测的准确率,计算公式如下:

式中:

Ci—第i次预测的准确率。偏差小于120s为100%准确,偏差大于实际行程时间,准确率为0。其它情况则在0-100%之间线性插值计算。

Infr—实际行程时间。

Inff—预计行程时间。

二、绝对偏差准确度

某次预测到站时刻和实际到站时刻偏差n分钟之内认为该次预测准确。在统计时段内,预测准确的次数占全部预测次数的比例,即为绝对偏差准确度[6]。

3.2 时刻表线路准点率指标

时刻表线路准点率分为首站准点率和中途站准点率。

时刻表线路需重点考虑静态时刻表显示的到站时刻与公交车辆实际到站时刻之间的偏差,即时刻表的准点率。

静态时刻表和实际到站时刻的绝对偏差n分钟之内认为该班次时刻表准确。在统计时段内,准确班次的数量占总班次数量的比例即为时刻表线路准点率[6]。

4 评价方法

基于上述评价指标,计算公交线路到站预报相对偏差准确度、到站预报绝对偏差准确度以及时刻表线路到站准点率。对于这些分析数据如何进行分类并确定阈值,是本文研究的重点。由于计算结果是针对公交线路各站点各班次,属于相同类型的数据,因此本文将采用聚类分析的方法对分析数据进行分类评价。

聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。聚类分析的目标就是在相似的基础上收集数据来分类,它是统计学中研究“物以类聚”问题的多元统计分析方法。聚类分析在统计分析的各应用领域得到广泛的应用[7]。

常见的聚类方法有层次聚类和非层次聚类。层次聚类又称系统聚类,其基本思想是:先将各样品看成一类,然后规定类与类间的距离,选择距离最小的一对合并成新的一类,计算新类与其他类之间的距离,再将距离最近的两类合并,直至所有样品合为一类[8]。

层次聚类主要有两种类型:合并聚类和分裂聚类。合并聚类是一种自底向上的聚类算法,从最底层开始,每一次通过合并最相似的聚类来形成上一层次聚类,不断重复直至所有数据点合并到一个聚类或达到某个终止条件结束。分裂聚类采用自顶向下的方法,从一个包含全部数据的大类开始,将大类中最疏远的个体分离出去,形成两类,然后再依据相似程度不断重复进行分解,直到所有个体都自成一类为止。大部分层次聚类采用合并聚类[9]。

本文通过系统聚类可得到分类的个数,通过聚类分析中各算法科学性和适用性的比较,最后采用K-means算法作为确定评价阈值的方法。

K-means算法属于非层次聚类算法,是典型的基于原型的目标函数聚类方法的代表,它以数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧拉距离作为相似度测度,算法采用误差平方和准则函数作为聚类准则函数[10]。欧拉距离公式如下:

K-means算法的核心步骤如下:

1.指定聚类数目K;

2.确定K个初始类中心点

3.根据距离最近原则进行分类,若数据样本与初始类中心点的距离满足

4.重新确定K个类中心点,新中心点

5.判断是否已经满足终止聚类分析的条件。

聚类分析终止的条件有两个,第一是迭代次数,当迭代次数到达指定次数时将终止聚类;第二是类中心点偏移程度,新确定的类中心点距上次迭代所形成的类中心点的最大偏移量小于指定的量时终止聚类[11]。

K-Means聚类算法的优点为:1.算法快速、简单;2.对大数据集有较高的效率并且是可伸缩性的;3.时间复杂度近于线性,而且适合挖掘大规模数据集[10]。

5 案例研究

通过上海市某公交公司2018年1月(包括工作日和双休日)的公交车辆GPS到离站数据和公交车辆到站预测数据,进行到站时间预测准确率和时刻表线路准点率分析。其中包括500多条公交线路和近70条时刻表线路,公交GPS到离站数据日平均327万条记录,车辆预测到站时间数据日平均2亿3 800万条记录,大致日数据量为20G,数据量较大。

5.1 数据结构

表1 公交车辆GPS到离站数据表结构

表2 公交到站预测数据表结构

GPS到离站数据记录了各条线路各个班次的车辆到达和离开各站点(包括首末站和中途站)的情况,表结构如表1所示:

车辆到站预测数据为公交公司运营调度系统中根据车辆当前的行驶情况,综合多因素影响,通过到站预测算法,计算得出的到站预测时刻。数据表结构如表2所示。

5.2 数据处理

首先通过ORACLE数据库的客户端软件PL/SQL以及数据编程软件Python,将GPS到离站数据与车辆到站预测数据通过线路名、方向、站级数和车牌号进行关联。

然后对车辆实际到站时刻进行处理,由于GPS到离站数据中的到站时刻实际上只是车辆进入车站范围的进站时刻,而非真正的到站时刻,因此需要进行数据清洗。

接着对到离站数据进行筛选,由于整个班次的行程为从首站发车至抵达终点站,而运营系统预测的时刻仅为到站时刻,因此GPS到离站数据将筛选首站的发车时刻以及后续站点的到站时刻。

完成上述各项工作后,将计算预测时间偏差。预测时间偏差=预测到站时间—未来实际到站时间,单位为分钟。

然后将偏差统计结果,通过数据处理软件SPSS进行聚类分析,得出分类数量及分类阈值,最终完成到站预测信息服务质量评价的具体分级标准。

5.3 公交线路到站预测准确率

根据上文3.1的到站预测准确率指标,将公交线路到站预测准确率分为相对偏差准确度和绝对偏差准确度进行分析研究。

图2 数据处理流程图

5.3.1 公交线路到站预报相对偏差准确度

1)聚类分析

由于公交行业规定最小的发车间隔为20分钟,因此乘客的平均候车时间为10分钟。本次研究以10分钟为标准,计算10分以内的各班次各站点的到站偏差准确度。

首先按到站相对偏差准确度大小依次排列,将准确度出现重大变化的数据作为最差分类先剔除,对剩余数据进行聚类分析。利用系统聚类算法进行拐点分析,确定分类数量。

当聚类数量为3时,类间距离突然增大。因此认定数据较好的相对偏差准确度分为三类。

然后通过数据处理软件SPSS,利用K-means聚类算法指定聚类数目K=3进行计算,得到如下结果:

图3 聚类碎石图

表3 聚类中心

表4 K-means聚类结果

图4 三类聚类区间分布

三类不同的聚类区间分布如图4所示,横坐标为各条线路,左侧纵坐标为到站预测准确度,右侧纵坐标为聚类编号。

表4中,聚类结果F较大,聚类结果组间差大,组内差小,说明聚类结果合理。

2)分类结论

结合上文聚类所得的三类,加上被剔除的一类较差数据,10分钟内的公交线路到站相对偏差准确度分类如下:

表5 公交线路到站预报相对偏差准确度分类

5.3.2 公交线路到站预报绝对偏差准确度

1) 聚类分析

按照公交行业“快一慢三”的准点原则,以3分钟为偏差区间,计算各班次各站点的到站预测偏差情况,然后按到站绝对偏差准确度依次排列,将偏差出现重大变化的数据作为最差分类先剔除,再进行聚类分析。聚类方法及过程同5.3.1,确定分类数量为三类。

2)分类结论

结合聚类所得的三类,加上被剔除的一类较差数据,3分钟偏差区间下的公交线路到站绝对偏差准确度分类如下:

表6 公交线路到站预报绝对偏差准确度分类

表7 综合评价分类

5.3.3 综合评价

为了保证评价和分级结果的可靠性,综合两个关键指标(相对指标和绝对指标),进行综合评价。

综合两个评价指标,500多条公交线路的总体综合评价分布如下表所示。

表8 综合评价结果

由表8可见,目前70%的公交线路到站预测准确率在B级以上,预测方法整体上较为真实可信。

5.3.4 预测误差分析

对公交到站时间预测数据的分析,特别是D类公交线路,总结了以下4类主要误差原因:

① 车辆GPS数据部分时间段缺失;

② 车辆GPS数据站点序号错乱;

③ 公交线路招呼站站点过多;

④ 首站计划发车和实际发车不符。

前两类部分由于终端设备、通讯等方面原因,也有公交线路周边建筑高处定位信号遮挡原因。后两类则属于公交公司营运管理的问题,需要公交公司在今后加强营运调度的监管。

5.4 时刻表线路到站准点率

时刻表线路准点率分为首站准点率和中途站准点率。首站准点率是分析首站发车时刻与时刻表首站发车时刻的偏差情况,中途站准点率是分析中途站到站时刻与时刻表中途站到站时刻的偏差情况。

5.4.1 首站准点率

首先提取所有时刻表线路的首站发车时刻信息。与上文类似,将首站发车准点率依次排列,将准点率出现重大变化的数据作为最差分类剔除,再进行聚类分析,确定分为三类。聚类方法及过程同5.3.1。

3分钟偏差区间下时刻表线路首站准点率分类如下:

表9 首站准点率分类

5.4.2 中途站准点率分类

与首站方法类似,将中途站到站准点率依次排列,剔除最差分类数据,接着进行聚类分析,确定分为三类。

3分钟偏差区间下时刻表线路中途站准点率分类如下:

表10 中途站准点率分类

5.4.3 准点率误差原因分析

结合时刻表线路到站准点率数据的分析,总结了以下两类主要误差原因:

① 首站,实际发车时刻与时刻表发车时刻偏差较大。

② 中途站,站站间的实际行程时间间隔与时刻表行程时间间隔偏差较大。

对于公交公司,一方面在首站要确保发车时刻与时刻表时刻一致,减少首站的误差;另一方面中途站的站间行程时间间隔的预测要考虑历史数据、不同时段、不同路段及天气状况等多种因素,尽量减少与实际情况的误差,从而提高时刻表的准点性。

5.4.4 未实施时刻表线路的推广分析

对于未实施时刻表的公交线路,通过计算其班次行程时间均值、行程时间标准差、变异系数等指标,分析线路运行的稳定性,将稳定性好的线路作为储备线路,为下一步推广时刻表化运营提供数据支持。

6 建议和结论

到站预测信息服务质量的核心即提高公交到站时间预报的准确性。对于到站时间预测可通过三个方面进行改进:

① 到站预测算法的建议:针对早高峰预测中车辆晚到的情况,建议算法进一步优化逻辑和相应参数,减少预测偏差,以改善乘客体验。

② 调度管理改进建议:线路首站实际发车和计划保持一致,计划发车时刻更新应及时,并与预报算法同步。

③ 调度设备改进建议:特别是中心城外地区的调度设备改进,减少公交GPS定位数据的丢失、错误等情况,减少设备对预测误差的影响。

对于时刻表线路有四方面的改善建议:

① 对于线路,分析非时刻表线路和时刻表线路的运行稳定性等运行特征,对时刻表线路的基础条件进行分类分析,将条件较好的非时刻表线路作为线路储备。

② 对于首站,改善调度管理,提高实际发车时刻与时刻表发车时刻的相符性。根据长期历史实际客流数据(APC等),优化首站发车计划时刻表,尽量与客流相符。

③ 对于中途站,根据长期历史GPS数据,制定并定期优化中途站时刻表,与驾驶行为、道路路况等变化因素相适应。

此外对于时刻表线路还可以采取组合策略,例如周末结合工作日,全天结合平峰,全站结合大站等方式,从条件好的着手,从易到难。

猜你喜欢
首站时刻表准点
乘“风”驭“龙”访江城
——十佳评选走进企业首站圆满落幕
城市赛首站
——广州站精彩呈现
城市轨道交通时刻表调整服务器故障分析及探讨
准点
令你误车的列车时刻表
准点率前十,日本机场占五席
RTI杯智能家居设计大赛 首站(广州站)培训顺利举行
签约42家 中国珐琅盛典首站告捷,成功起航!
JAL获得世界航空公司准点率三冠王
短文改错