肖 梅,王海明,边浩毅,颜建强
(1. 长安大学 运输工程学院,陕西 西安 710064;2. 浙江机电职业技术学院,浙江 杭州 310053;3. 西安市交通信息中心,陕西 西安 710065)
公交车辆在交叉路口的等待时长是公交车辆站点区间行程时间的重要组成部分之一,是评价公交运行整点率与服务水平,进行公交行程时间预测的重要指标。由于我国机动车保有量众多,各路口路况复杂,公交车辆在交叉路口的运行往往会受到非机动车、行人、天气、高峰时段、节假日等诸多因素的影响,从而导致公交行程时间波动较大,降低了公交服务水平。因此,分析交叉路口公交等待时长的分布拟合和影响因素(包括提高公交车辆运行时间,尤其是站间运行时间的预测精度[1]),优化公交发车时刻表,以提升公交到站的准时性和服务可靠性,提高公交对乘客的吸引力,为基于公交优先的交叉路口的信号配时、交叉口几何设计提供支持,对于运输系统的优化提升具有重要意义。
围绕研究内容,就公交运行数据分布拟合和交叉口延误影响因素分析方面,对国内外研究现状进行了总结。在公交行程时间分布拟合方面,许多研究使用不同的参数分布对车辆行程时间进行拟合,得出对行程时间有影响的因素。Pu[2]和Polus[3]的研究表明正态分布和对数正态分布对不同交通流下的车辆行程时间拟合效果更好,这些拟合参数有助于对车辆运行时间进行分析。陈娇娜[4]使用对数正态分布拟合了车辆的行程时间数据,分别使用最大似然估计法及最小二乘法估计了分布参数,通过实例分析发现,出行距离及出行时段对车辆的行程时间均有影响。Wu等[5]使用Kolmogorov-Smirnov 检验获取了公交行程时间的分布及参数,并分析了时间段和节假日对行程时间分布的影响。张琦等[6]使用混合高斯模型拟合了OD行程时间,并通过拟合参数分析了降雨对行程时间的影响。王殿海等[7]采用混合高斯分布模型对公交站点区间行程数据进行拟合,并建立了相应的评价指标,由拟合参数值及评价指标值,分析了对公交行程时间具有影响的因素。
对于车辆在交叉口延误时长的影响因素分析方面,孙祥龙等[8]发现信号周期设置对于公交在交叉口延误具有显著影响。曲大义等[9]发现增加绿信比、提高车速可减少公交车辆在交叉口的延误,且红灯时长越长,延误数据的峰数越多[10]。为了探究高峰时段对交叉口延误影响的异质性,Hellinga等[11]使用蒙特卡洛模拟,得出在高峰时段,至少需要7 d的延误数据才能估计交叉口平均延误,估计误差为平均真实值的30%。Li 等[12]使用离散事件系统模型TPNs分析了驾驶行为对于交叉口延误的影响。赵晨等[13]提出了一种预信号控制的交叉口渠化方式,发现能够有效减少车辆在交叉口的延误。也有人分析了综合等待区对车辆在交叉口延误的影响,发现综合等待区并非始终能减少交叉口的延误,只有在交通流较大的情况下,或车辆在合适时机进入等待区才能减少延误[14-15]。宋现敏等[16]分析了公交专用道对交叉口延误的影响,并提出使用公交和右转混合型专用道的车道组织形式,可保证在社会车辆延误不明显增加的情况下,降低公交的等待时长。上述方法都是从技术层面(交通需求、道路几何、信号控制等)对交叉口延误进行的分析,然而却忽略了非技术层面(天气、能见度等)因素的影响。Qiao等[17]发现模糊逻辑的方法可同时考虑二者,并通过试验的方式验证了这一模型的有效性。
目前,使用各类分布拟合公交行程时间研究较多,但对于公交在交叉口等待时长的拟合分析较少。对于交叉口延误的影响因素分析,大多数研究采用仿真方式仅对某些因素进行分析。考虑到混合高斯分布能较好地描述车辆在交叉口的多次等待过程,可以使用混合高斯拟合交叉口等待时长数据。一方面,仿真结果与真实情况可能存在差异,使用公交GPS数据进行分析,结果可信度较高;另一方面,公交在交叉口的等待时长往往会受多种因素影响,需要进行更全面的考虑。
本研究以西安市公交车辆运行的GPS数据为基础,提出计算交叉路口公交等待时长的一种方法,再使用混合高斯分布模型对样本数据进行拟合,由模型参数值对可能影响公交车辆在交叉路口等待时长的因素进行分析,同时结合U检验对数据进行显著性检验,使用r2值及VCR值表示影响程度,由检验结果为交叉口优化提供建议。
交叉路口公交等待时长指公交车辆在交叉口进道口前因等待信号灯或排队而静止的时长。一般而言,公交车辆在交叉路口前的运行轨迹包括4类关键时间点[18]:车辆减速时间点、车辆停车时间点、车辆启动时间点、车辆恢复正常行驶速度时间点。当车辆需要等待超过1个信号周期时,则在停车时间点及启动时间点之间还会有1次或多次启动停车过程。以车辆驶离交叉口前的最后一次启动时间点与到达交叉口时的第1次停车时间点之差作为公交车辆在交叉口的等待时长,对GPS数据进行计算。
采用西安市7月及8月的公交GPS数据,数据格式见表1,其中BUS_ID为公交车的ID号;TIME为车辆终端设备上传的终端设备时间,即记录GPS数据时的时间;SPEED为车辆速度;MILE为车辆当日当前时刻行驶的总里程;DIRECTION为车辆的行驶方位角,即车辆当前位置的指北方向线沿顺时针方向转至行驶方向线所转过的角度,其取值为0°~360°,0°表示正北方向; LONGITUDE和LATITUDE分别为车辆经纬度。SATELLITE为数据采集时接收到的卫星数目。
表1 GPS原始数据格式Tab.1 GPS initial data format
对随机抽取的GPS数据样本进行分析,发现定位精度在0~20 m之间。为保证交叉口范围内的数据都能采集到,在划定交叉口经纬度范围时,应当加上20 m的裕度。此外,需要对数据集中出现的异常数据进行清洗,清洗原则包括:
删除信号弱的数据。数据采集时接收到的卫星数目可以反映出定位的精度[19]。分析发现,当卫星数目小于5颗时,出现坐标偏移,速度异常等情况的概率较高,因此删除数据中卫星数目小于5颗的数据。
删除缺失数据。数据字段中经纬度、方向、里程、速度,时间任何一项缺失时,对其删除。
删除车速异常的数据。对于一系列的GPS数据点,可能会出现其中某瞬间车速与前后数据的车速不匹配的情况(如车速骤减至0,或骤增几倍,而后又立刻恢复的情况),需要对这类车速异常点进行删除。
删除行驶里程异常的数据。对车辆行驶里程随时间增长反而减少的异常数据进行删除。
删除时间间隔异常的数据。2个连续的GPS数据点间隔超过30 s以上时不利于等待时长分析,需对其删除。
GPS原始数据无法直接获取交叉路口公交等待时长。本研究选择典型的交叉路口,以交叉口停车线的上游路段作为观测路段,分析公交车辆在该路段的运行状态,进而计算出交叉路口公交的等待时长,步骤如下。
(1)观测路段长度的确定。考虑到城市公交车辆的速度为0~30 km/h,GPS数据的采样频率为10 s,为保证采集到车辆运行数据,确定观测路段长度为150 m。
(2)车辆路口等待时长的计算。公交车辆在交叉口的行驶车速变化如图1所示。A为观测路段采集到的第1个数据点,B为实际的停车时间点(未采集到),C为采集到的停车时间点,D为采集到的启动时间点,E为实际启动时间点(未采集到)。B,C,D,E点对应的车速满足VB=VC=VD=VE=0 km/h。F为观测路段采集到的最后一个时间点。tA,tB,tC,tE分别对应数据点A,B,C,E的时刻。LA,LC分别对应数据点A,C的当日当前时刻的行驶总里程。当GPS采样频率很高时,车辆在路口的等待时长(tE-tB)可近似为(tD-tC),然而实际中GPS的采样频率在10 s左右波动,采集到的停车时间点、启动时间点对应的时间tC,tD和未采集到的实际停车时间点、启动时间点tB,tE会有误差ΔE,0≤ΔE≤10,此时近似的等待时长tD-tC=(tE-ΔE)-(tB+ΔE)=tE-tB-2ΔE,和真实的等待时长(tE-tB)相比,有0~20 s的误差。
车辆在交叉口范围运行速度较低(20 km/h左右),因此可假定公交车辆减速停车和加速驶离的过程保持匀减速或匀加速,点A到B间减速度的计算式为:
(1)
式中,VA和VB分别为数据点A,B的车速,VB=0;a为车辆的减速度;LA和LB分别为点A,B的行驶里程,由图1(b)可得LB=LC。
又由于:
(2)
式中tA和tB分别为数据点A,B的时间。
由式(1)~(2),推导可得:
(3)
同理,可推导车辆加速驶离的起始时刻为:
(4)
式中,tE和tF分别为数据点E,F的时间;LE和LF分别为数据点E,F的行驶里程,由图1(b)可得LE=LC。
因此可得车辆在交叉路口的等待时长T为:
T=tE-tB=tF-tA-
(5)
图1 交叉路口公交运行曲线Fig.1 Curves of bus operation at intersection
使用不同变加速情况模拟频率为1 s的公交运行数据,经比较,提出的计算方法可将误差减少至0~4 s,考虑到大多数等待时长数据均值在30 s以上,因此可以显著提高结果的准确度。
选取建西-雁塔北、吉祥路-含光路南段、友谊东路-雁塔北路及小寨西-含光路南交叉路口为研究地点,路口附近无大型客流集散点,南北双向车流密集且对称。提取不同时间段、不同天气等因素影响下的共11组数据进行分析,数据属性特征见表2。车辆在路口等待时长的统计特性见表3。为探究不同因素对交叉路口公交等待时长的具体影响,需要对数据做进一步分析。
表2 采样数据的属性特征Tab.2 Attribute characteristics of sampled data
表3 车辆等待时长的统计特性Tab.3 Statistical characteristics of bus waiting time
以周内平峰时段(10:00—12:00点)及高峰时段(07:00—09:00点)D1和D4的数据为例,分析不同时段交叉路口公交等待时长的分布拟合,平峰和高峰等候时长数据频率分布直方图如图2所示。数据具有明显的多峰分布和长尾特性,可见公交车辆在交叉路口等待时长往往会超过1个以上的信号周期。
图2 平峰/期公交等待时长频率分布直方图Fig.2 Histograms of bus waiting time at peak/off-peak period
将等待时长数据的组距进一步细分,分别使用正态分布、威布尔分布、伽马分布、二元高斯及三元高斯分布对等待时长数据的概率密度函数进行拟合,并使用最小二乘法计算相关参数,最小二乘法算式为:
(6)
式中,xi和yi分别为第i组数据的等待时长及概率密度,1≤i≤m;wij为第i组数据的第j个权重;uij为第i组数据的第j个均值,j=1, 2, 3。
得到的平峰和高峰时段的概率密度函数曲线如图3所示。可以看出,无论是平峰时段还是高峰时段,常规的分布都无法很好地拟合等待时长数据;二元高斯分布在拟合高峰时期的数据时无法拟合第3峰;三元高斯分布在拟合各时段的数据时拟合效果最佳。
图3 公交等待时长分布拟合曲线Fig.3 Fitting curves of distribution of bus waiting time
选取误差平方和(SSE) 作为分布拟合优度检验的评价指标,其计算式为:
(7)
式中,n为概率密度点的数目;yi为拟合分布中等待时长ti对应的概率密度值;Yi为原始数据中等待时长ti对应的概率密度值。SSE越接近于0,说明拟合效果越佳。5种分布对公交等待时长数据的拟合结果见表4。结合图3及表4可知,5种分布的拟合优度由强至弱依次为:三元高斯分布、二元高斯分布、正态分布、威布尔分布、伽马分布。由此可见多元高斯分布拟合效果最优,故根据数据特征,采用二元或三元高斯对数据进行分布拟合。
表4 拟合结果Tab.4 Fitting result
本部分主要探讨客流高峰、晴雨天气、工作日、节假日、车道数目、信号配时及公交专用道7种因素对交叉路口公交等待时长的影响。首先使用多元高斯分布对原始数据进行拟合,通过分析拟合后的混合高斯分布参数值(见表5),可分析公交车辆不同等待时长的均值及比例。随后对数据进行检验,鉴于等待时长数据不服从标准正态分布且数据总体参数未知,故采用非参数检验方法(Mann-Whitney U检验)对不同影响因素作用下的交叉路口公交等待时长数据进行显著性检验,检验结果见表6。
Mann-Whitney U检验可以使用r2值计算效应量[20],其值越大,说明该因素影响作用越大。r2值算式见式(8),计算结果见表6。
(8)
式中,z为标准化检验统计量;N为样本量。
在公交行程时间评价指标体系中,变异系数[4](Coefficient of Variable,CV)表示数据离散程度,其值越小,代表数据相对集中,异常情况越少。
对于m元高斯分布,CV计算式为:
(9)
表5 混合高斯分布参数Tab.5 Mixed Gaussian distribution parameters
表6 影响因素检验及计算结果Tab.6 Test and calculation result of influencing factors
图4为不同影响因素作用下公交等待时长分布曲线。
图4 不同影响因素作用下公交等待时长分布曲线Fig.4 Curves of bus waiting time distribution under different influencing factors
因此,基于CV,提出变异系数变化率CVR[6],以反映不同因素作用下CV的变化情况,其值越大,代表该因素影响作用越大,其表达式为:
(10)
式中,CVE为试验组的变异系数;CVC为对照组的变异系数。
结合图4及表5、表6,可以得出以下结果。
(1)影响因素检验结果分析
由检验值,在显著性水平α=0.1时,认为客流高峰、天气、节假日、车道数及红灯时长5类因素对交叉口公交等待时长具有显著影响,而工作日与公交专用道并非显著因素。由r2值和CVR得出的结果一致。5类因素对等待时长的影响由大到小分别为:红灯时长>客流高峰>车道数>天气>节假日。
(2)高峰时段对等待时长的影响
高峰时段,交叉路口公交车辆等待时长的第1、第2类高斯分布均值较平峰时分别增加了68.5%,22.7%,且第3峰特征明显(占比7.7%),其均值比总体均值上升了156%,说明高峰时段车流量大时,车辆在交叉口等待多个信号周期的情况较为显著。总体来看,高峰时车辆整体平均等待时长比平峰时上升了约33%。
(3)天气对等待时长的影响
公交车辆在雨天时存在第3峰情况,其第3类高斯分布均值较总体均值增加了41.4%。相比于晴天,雨天平均等待时长增加了18.9%。
(4)工作日对等待时长的影响
无论是工作日或周末,公交等待时长均只存在2类高斯分布,尽管周末的第2类高斯分布均值较工作日增加了约18%,但其权重也相应下降了约13%,二者总体均值几乎一致。
(5)节假日对等待时长的影响
非节假日的等待时长数据有3类峰值,但其第1、第2类高斯分布的均值均在1个信号周期内,且第2类分布的权重较小(7.5%)。节假日尽管只有2类高斯分布,但其第2类高斯分布均值和非节假日时第3类高斯分布均值接近,同时权重高出了12.48%,说明节假日虽然没有特别极端的等待情况,但其总体等待时长较长且集中,见图4(d)。
(6)车道数目对等待时长的影响
5车道和4车道情况下均有3类高斯分布,但5车道时3类高斯分布较为均匀,比例均在33%左右,均值较4车道也小得多。极端情况下,第3类高斯分布的均值较总体均值增加了60%。而4车道时约73%的车辆都需要等待66秒左右(超过1个信号周期)才可通过路口,且其第3类高斯分布均值较大,较总体平均值上升了107%。4车道时总体平均等待时长较5车道增加了19.5%。因此,在交叉口设计时,应尽量通过增加进道口数目等方式,减少公交在交叉口的等待时长。
(7)红灯时长对等待时长的影响
红绿灯时长固然会显著的影响车辆在交叉口的等待时长,但就D1及D10的数据来看,当红灯时长为30 s时,约69%的公交车辆平均等待时长为35 s,仅需等待1个信号时长左右即可通过路口,而当红灯时长为71 s时,54%的车辆需要等待82 s左右才可通过路口,即信号周期变长时,公交车等待比信号周期更长时间的概率相应增加。同时,对于D7~D11红灯信号长的情况,等待时长均存在第3峰,这与Ramli等[10]的研究一致,即信号周期越长,交叉口等待时长数据峰数越多。因此在基于公交优先的交叉口信号设计时,不应设置过长的红灯信号。
(8)公交专用道对等待时长的影响
由拟合参数值及检验结果看,专用道对等待时长无显著影响。有公交专用道时,容易出现等待时长过短或过长的现象,其一元高斯分布的比例较无公交专用道时上升了22.27%,但第3类高斯分布均值较无公交专用道增加了44.7 s。整体而言,有、无公交车道情况下的总体平均等待时长分别为63.31 s 和63.76 s,几乎一致。原因是西安市内大多公交专用道在进道口前100~150 m即中止,随后与社会车辆混行等待。因此,目前的公交专用道设置对缩短交叉口公交等待时长并无显著作用,这与宋现敏等[15]的研究一致。为了减少公交在交叉口的等待时长,应当重新考虑公交专用道组织形式。
为提高公交准时性,以西安市公交车辆GPS数据为研究对象,分析了天气类型、客流高峰、工作日、节假日、车道数目、红灯时长及公交专用道等因素对交叉路口公交等待时长的影响。
(1)对原始GPS数据进行清洗/筛选等操作,得到了反映车辆具体位置的准确GPS数据。提出了一种计算交叉路口公交等待时长的算式,将处理后的GPS数据代入算式得到了等待时长数据样本。
(2)使用正态分布、威布尔分布、伽马分布及混合高斯分布对样本数据进行拟合,以SSE值作为拟合优度检验指标,结果显示混合高斯分布对等待时长数据拟合效果最佳,随后使用三元高斯分布对7种因素作用下的交叉路口公交等待时长数据进行拟合,通过分析分布参数值及分布曲线之间的差异得出车辆等待时长的波动,并结合Mann-Whitney U非参数检验方法对样本值做进一步检验,使用r2及CVR值表示效应值,结果表明对交叉路口公交等待时长具有影响作用的因素按照影响程度由大到小排序为:红灯时长>客流高峰>车道数>天气>节假日,而工作日和公交专用道不是影响等待时长的关键因素。
(3)红灯时长越长,公交等待时长的峰数越多,即车辆等待多个信号周期的概率上升。高峰时段或车道数目较少时,公交等待时长易出现极端值。天气和节假日对等待时长亦有影响,但影响作用相对较小。
交叉路口公交的等待时长和波动性常常受到时间、空间、运行等诸多因素的共同影响,以各影响因素对应的参数值为输入向量,对应的等待时长作为变量来研究预测复杂交通环境下的公交车辆的等待时长是下一步研究工作的重点。