张诗, 杨子邈, 黄杰, 徐进,3*
(1.重庆交通大学交通运输学院, 重庆 400074; 2.重庆高速公路集团有限公司南方营运分公司, 重庆401300; 3.重庆交通大学山区复杂道路环境“人-车-路”协同与安全重庆市重点实验室, 重庆 400074)
受到特殊地质地貌和自然环境等条件的限制,中国山区高速公路道路组合复杂,形成了较多的连续纵坡路段,在人-车-路-环境多因素的不协调作用下,连续下坡路段已成为道路交通安全的重灾区[1]。近年来,高速公路大型轿车、轻型货车和重型货车发展迅猛,由于车辆的轮廓尺寸和载重量不同,各车型的运行特征受到道路几何指标和惯性等因素影响存在显著差异性,对山区高速公路通行效率和安全造成较大影响,因此亟需对车型进行合理分类,选择不同轴重的车型作为典型车型,研究不同几何线形路段各车型的车速特征和差异性,为提升连续下坡路段行车安全性提供理论依据。
行车速度是高速公路安全评价和效率的重要指标之一。Sil等[2]评估了平曲线几何结构对车速分布的影响并且建立了基于平均车速和标准差的预测模型。Chen 等[3]通过仿真驾驶试验分析山区高速公路货车速度变化行为,构建基于递归神经网络(recursive neural network,RNN)的速度预测模型。徐进等[4]分别采集了车辆断面速度和行程速度,明确了山区高速公路典型车型的速度分布特征并建立了基于速度特征值的区间限速阈值模型。崔洪军等[5]研究了不同车型在重载公路信号交叉口处跟驰行为的差异性,得出了加速阶段和稳定阶段的车流运行特性。
车辆在连续纵坡路段的行驶状态一直是山区交通管理的重点。Hou等[6]基于大量全球定位系统(global positioning system,GPS)数据集分析比较了下坡路段理论运行速度和实际车速的异同。Jiang等[7]提出了大型车辆在长陡下坡路段安全和高效的速度控制系统。万远航等[8]构建人-车-路协同仿真系统,分析了重载货车在不同坡度下挂挡运行车速的变化范围,提出了长大下坡路段车辆运行速度安全仿真模型。张驰等[9]收集了西南地区某高速公路连续长大下坡路段断面车速,建立了货车运行速度预测模型。
车型分类是交通管理重要的部分。Chen等[10]使用高斯混合模型算法对视频录像中的大量车辆进行了定位、提取和分类。Javadi等[11]基于模糊C均值聚类算法,利用每辆车的尺寸和速度特征对相似外观的不同类型的车辆进行了聚类分析。徐进等[12]通过分析一般路段和连续上坡路段不同车型的速度分布特征并对不同路段进行了车型聚类分析。陈涛等[13]分析了交通事故数据和区间车速的相关性并利用K-means聚类对不同车型进行了分类研究。侯树展等[14]基于高速公路车辆运行速度与车辆轴距之间的关系,利用聚类分析技术提出了基于轴距的车型分类方法。
车辆速度研究目前倾向于通过GPS系统、路侧测速仪、实车试验等途径来获得瞬时车速,但采集数据困难数据量有限,电子不停车收费(electronic toll collection,ETC),系统可以在不新增交通检测设备的情况下,通过挖掘大量数据来分析车辆行程速度的特征。现有车型分类研究都是基于车辆动力特性、车辆外廓尺寸和车辆轴距等方面得到的,还应结合不同车型在不同道路条件下的实际运行状况进行分类分析。
为此,现获取包茂高速水江至南彭段主线ETC数据,分析山区高速公路平缓路段和连续下坡路段不同车型的行程速度分布特征,并利用K-means聚类方法对车型进行分类,提出基于ETC系统中全车型实际运行速度的分类方法,结果可为山区高速公路路线设计车型的选择、全车型精细化管理以及速度控制措施的评价提供数据支撑和借鉴。
选取G65包茂高速公路水江至南彭段(K3+500-K61+750),设计速度为100 km/h,包含6个互通立交、4条隧道和1个服务区,年平均日交通量为13 714 veh/h,货车占比为32.1%。该路段组成结构复杂,存在大量小半径曲线路段、陡坡和长下坡路段,是常见的典型山区高速公路。主线路段共设置有6处ETC门架,分别为“水江K3+500”“南川K25+100”“大观K33+000”“石龙K46+150”“接龙K58+970”和“南彭K61+750”,如图1所示。
将水江-南川区段和石龙-接龙区段作为研究对象,其中水江-南川区段为平缓路段,全长21.60 km,圆曲线半径等于1 000 m的有8处,最小圆曲线半径为1 000 m;最大纵坡坡度为3.5%,纵断面只有短距离上下坡。石龙-接龙区段为连续下坡路段,全长12.82 km,小客车限速100 km/h,小客车除外其他车型限速80 km/h,区段内隧道限速80 km/h,圆曲线半径小于1 000 m的有2处,最小圆曲线半径为700 m,最大纵坡坡度为4.0%,坡度为4.0%的路段占路段总长的24%,坡度为3.0%的路段占路段总长的54.9%。
图1 研究路段示意图Fig.1 Schematic diagram of the research section
ETC系统(电子不停车收费系统)通过安装在高速公路主线位置上、高速公路出入口处的ETC门架来获取通行车辆信息。客车按车型轮廓尺寸和载客人数划分为一~四型,货车根据车辆轴数、车长和最大载重质量划分为一~六型。研究主线路段ETC门架在2020年8月采集的车辆通过数据,原始数据为ETC电子交易数据记录表,该表包括以下字段:门架编号表示计费当前门架标号(通行方向)、小时批次号、车牌号+颜色、交易时间表示通过当前门架对应的瞬时时间、计费车型、轴数、交易金额等,如表1所示。
选择天气晴朗、路面条件良好、车辆处于相对自由流状态时的ETC数据作为研究对象,共提取出25 d的有效ETC数据,能够反映不同车型在同一路段的实际运行状态。ETC收费数据具有字段丰富、内容充实、数据量大等特点,但往往也会出现数据丢失、数据不一致、数据冗杂重复以及数据字段缺失等大量异常数据[15]。数据预处理则是对异常数据进行剔除和清理来获得高价值性信息。剔除的数据主要是短时间内同1辆车在同1个门架连续通过2次及以上的数据即同架进出、同1辆车通过前1个门架的交易时间晚于后1个门架的交易时间的数据、车辆通过门架时交易失败的数据以及一段连续时间内所有车辆速度异常的数据即拥堵情况数据和超速情况数据。
通过ETC门架运营桩号计算相邻门架的距离,对比相邻门架的ETC数据,确定同1辆车通过相邻门架的时间差,车辆的行程速度即为门架距离与相邻门架时间差的比值,计算式为
Tij=(ti-tj)×86 400
(1)
Vij=(Lij×1 000)/Tij×3.6
(2)
式中:Tij为通过门架i与门架j的时间差,s;ti为1辆车通过门架i的瞬时时间;tj为同1辆车通过门架j的瞬时时间;Vij为ETC门架i与j之间的行程速度,km/h;Lij为ETC门架i与j之间的距离,km。式中,一天24 h换算成以秒为单位即为86 400 s,将ETC原始数据时间格式乘以86 400转换成以秒为单位的数值格式。
将水江—南川区段和石龙-接龙区段全车型行程速度进行汇总,为保证组数在20组左右,选择3 km/h为区间大小进行频数分布计算,样本数据出现在各个小区间的频率与区间大小的比值即为相对频率,用Origin软件中Gauss函数对频率分布直方图进行拟合,所有车型拟合的R2均大于0.9。部分典型车型(一型客车、三型客车、四型客车、一型货车、三型货车、六型货车)行程速度频率分布直方图如图2和图3所示,从中可得到:
表1 ETC原始数据字段信息Table 1 ETC raw data field information
图2 平缓路段部分车型行程速度频率分布直方图Fig.2 Histogram frequency distribution diagram of travel speed of some types of vehicles in the gentle section
(1)一型客车行程速度在水江—南川区段和石龙-接龙区段都近似正态分布,但在石龙-接龙区段更为集中,平缓路段一型客车由于汽车性能较好速度较高,连续下坡路段,一型客车受到其他重型车辆阻滞,在保证安全行驶条件下低速车辆较多。
(2)三型客车和四型客车速度在水江—南川区段表现为中间高度集中,两侧分布较少,在石龙-接龙区段呈现出中间较为集中,两侧分布较多,由于三型客车和四型客车为大型载客营运车辆,驾驶员由于个体差异性导致车辆速度存在较快和较慢这种离散性的影响。
(3)货车在石龙—接龙区段高速车辆的比例逐渐降低,速度在50~60 km/h和40~50 km/h区间的低速车辆比例逐渐增加,表现为中间速度分布较少两侧速度分布较多。相较于平缓路段,货车在连续下坡路段一般会低档位行驶且需频繁制动,行程速度整体表现为低速行驶,但高速公路任有大部分货车速度低于60 km/h,诱发安全风险。
将水江—南川区段和石龙—接龙区段全车型行程速度频率分布直方图拟合曲线汇总,可看出在平缓路段和连续下坡路段不同车型之间的速度分布存在明显差异。
图3 连续下坡路段部分车型行程速度频率分布直方图Fig.3 Histogram frequency distribution diagram of travel speed of some types of vehicles in the continuous downhill section
如图4所示,在平缓路段时,一型客车速度分布较分散,三型客车和四型客车速度分布高度集中,四类客车相对频率峰值点对应的速度差值最大为8.1 km/h,说明大型客车与一型客车速度差异很大。除一型货车以外其他五类货车行程速度分布差异较小,一型货车和六型货车相对频率峰值点对应的速度差值最大,为6.1 km/h。如图5所示,在连续下坡路段时,四类客车速度分布较为分散,四类客车相对频率峰值点对应的速度差值最大为6.4 km/h,说明大型客车与一型客车速度差异较小。六类货车行程速度分布呈现出阶梯型变化,一型货车行程速度分布较分散,六型货车与三型货车行程速度分布接近,其他三类货车分布相似,一型货车和六型货车相对频率峰值点对应的速度差值最大,为7.7 km/h。
由此可得:平缓路段客车速度分布差异较大,货车速度分布差异较小,而连续下坡路段客车速度分布差异减小,货车速度分布差异增大,说明路段线形和车辆类型对车辆行程速度分布有较大影响,尤其是大型货车。
图4 平缓路段车辆行程速度相对频率分布Fig.4 Probability distribution of vehicle travel speed in the gentle section
图5 连续下坡路段车辆行程速度相对频率分布Fig.5 Probability distribution of vehicle travel speed in the continuous downhill section
由频数分布得出每个速度区间对应的累计频率分布值,用Origin软件中高斯函数对散点值拟合,所有车型拟合的R2均大于0.9,拟合是成功的。绘制水江-南川区段和石龙-接龙区段所有车型行程速度的累计频率分布拟合曲线,如图6和图7所示,部分车型行程速度累计频率曲线几乎重合,说明部分车型速度分布有较大的相似性。
平缓路段三型客车和四型客车速度分布差异较小,二型~五型货车速度分布十分相似;连续下坡路段二型客车和三型客车速度分布几何重合,三型货车和六型货车速度分布差异较小。连续下坡路段一型客车由于其他慢行车辆阻滞故行程速度会受到较大影响;三型客车和四型客车属于大型营运客车,驾驶员技术熟练、经验丰富且路线确定熟识道路环境,受到线形的限制较小,倾向于将速度维持在1个稳定的幅值且不断向期望车速靠近。由于连续下坡,货车司机为了保证行车安全会采取频繁制动,货车速度不断降低,尤其三型货车和六型货车明显降低,载重货车在连续下坡路段由于超载、满载和空载条件下速度有所不同。
图6 平缓路段车辆行程速度累计频率分布Fig.6 Cumulative frequency distribution of vehicle travel speed in gentle road section
图7 连续下坡路段车辆行程速度累计频率分布Fig.7 Cumulative frequency distribution of vehicle travel speed in continuous downhill section
不同线形路段下,全车型行程速度的特征值如表2所示,数据可为路段不同车型限速值的确定提供数据支撑。平缓路段平均速度在66.36~82.19 km/h,标准差在6.53~12.90 km/h,连续下坡路段平均速度在59.17~74.53 km/h,标准差在8.1~11.61 km/h。同一线形路段下,客车和货车行程速度百分位值变化近似为直线变化,说明部分车型的百分位速度差异较小。在连续下坡路段,客车的百分位速度值依次低于对应平缓路段的百分位速度值,而货车百分位速度值有所交错,三型货车和六型货车在连续下坡路段的85分位速度值V85低于在平缓路段的50分位速度值V50,说明三型货车和六型货车在连续下坡路段受到道路线形影响更为明显。
各车型间的速度分布特征值呈现出差异性,部分车型的平均值和标准差表现出一定的聚集性。第85%分位速度V85指观测路段一种车型的行程速度中,有85%车辆速度都低于或等于该值,常用作道路最高限速;第15%分位速度V15则是指15%车辆速度都低于或等于该值,多用为道路最低限速。交通流中各车之间的行驶速度与车流平均速度差值越大,车速分布越离散,事故发生概率越高[16]。用第85%分位速度V85与第15%分位速度V15差值可表示车速离散度,相较于平缓路段,连续下坡路段车速离散度增大,事故发生率增大。
通过分析行程速度分布特征,发现不同线形路段下ETC系统中各车型之间行程速度有一定差异性和聚集性。由此,采用基于欧式距离的K-means聚类方法对ETC系统中现有车型进行聚类分析,根据不同线形路段速度特征分布实现不同线形路段下车型的再分类。
K-means聚类是基于划分算法聚类的,对大数据样本有较高的效率,根据计算样本与初始簇类中心的欧式距离来归纳各簇类下的所属样本,不断迭代,以实现计算样本与其归属的簇类中心的距离平方和最小为目标,表达式为
表2 全车型行程速度分布特征值Table 2 Characteristic value of whole vehicle travel speed distribution
(3)
(4)
式中:d()为计算样本与簇类中心的欧式距离;(xi,yi)为簇类中心;(xj,yj)为计算样本;Emin为簇内样本距离平方和最小值;k为簇类个数;Ci为第i个簇类的中心点。
由3.1节分析,速度平均值能较稳定地表征不同车型的整体速度分布,速度标准差可以表示车辆速度偏离平均速度的程度,不同线形路段下各车型行程速度的平均值和标准差表现为一定的差异性和聚集性,将其作为聚类指标。
为保证最终聚类的实现,根据各车型交通量动态选择各车型聚类点数量,确定各车型的分组步长。将每种车型的速度值进行等量分组来计算每组速度值的平均值和标准差作为1个聚类点,将所有车型分组之后得到的聚类点汇总如表3所示。
K-means聚类方法以簇内样本距离平方和最小化为目标,用簇内方差作为聚类准则函数,方差越小,聚类效果越准确。首先用SPSS中系统聚类方法得到指标聚类谱系图,根据谱系图得到聚类数k值大致范围:水江-南川区段为[2,5], 石龙—接龙区段为[2,4]。将不同的k值作为聚类数进行聚类,经过比较,水江-南川区段当簇内样本距离平方和为8.593时为最小,此时k值取4;石龙-接龙区段当簇内样本距离平方和为13.044时为最小,此时k值取3。确定平缓路段各车型聚类为四类、连续下坡路段各车型聚类为三类较为合理。
平缓路段各车型聚为4类,连续下坡路段各车型聚为3类,聚类结果如图8和表4所示。
在平缓路段,一型客车与其他车型分布差异较大;三型客车和四型客车分布较为集中且更靠近货车,由于这类大型营运车辆在道路线形较好的平缓路段,驾驶员技术熟练、经验丰富且熟悉路线环境将速度保持为一个稳定的幅值;货车整体表现为速度向降低发展,离散性不断增大。
连续下坡路段车辆速度较平缓路段有所降低,多数驾驶员更倾向于控制速度以安全通行,由于路段为双向四车道一型客车受到其他慢行车辆阻滞,速度呈现向低速发展,整体速度离散性降低。三型客车和四型客车分布靠近一型客车,大型营运客车由于驾驶员驾驶风格的差异,部分驾驶员仍倾向于向期望车速靠近[17],部分驾驶员则保持低速行驶,整体速度离散性增大。一型客车与大型客车混行严重,超车需求增加,换道频繁,易引发追尾等交通事故。货车整体表现为速度往增大方向发展,离散性不断增大,三型货车和六型货车车辆速度低于60 km/h较多,诱发安全风险。二型客车包括营运性和非营运性,驾驶员驾驶风格不同,速度分布较分散车辆之间离散性较大。轻型货车(一型货车和二型货车)速度分布与其他车型差异较大,是城市间和短途货运使用较广泛的车型,速度分布离散性偏大。
表3 全车型聚类分组结果Table 3 Whole vehicle clustering grouping results
图8 车型聚类结果散点Fig.8 Types of vehicles clustering results scatter plot
表4 车型聚类结果Table 4 Types of vehicles clustering results
该分类结果可为连续下坡路段运行速度研究提供理论基础,同时对山区高速公路不同线形路段所有车型的精细化管理、同类别车型限速值选择提供一定理论依据和数据支撑。
通过收集包茂高速水江至南彭段主线ETC数据,分析了水江—南川区段(平缓路段)和石龙-接龙区段(连续下坡路段)ETC系统中全部车型的行程速度分布特征,利用K-means聚类方法对两种线形路段下的全部车型进行了分类,结论如下。
(1)同种车型在不同线形路段上的行程速度分布有明显差异,三型客车和四型客车在平缓路段倾向于维持一个稳定的速度幅值,而在连续下坡路段部分驾驶员仍向期望车速靠近,部分驾驶员则保持稳定车速;货车在连续下坡路段整体为低速行驶,但有部分车辆速度低于60 km/h,造成安全隐患。因此在山区高速公路对于不同线形路段应该有不同的安全速度管理。
(2)不同车型在同种线形路段上的行程速度分布差异较大,客车在平缓路段速度分布较分散,在连续下坡路段则分布相对集中;货车在平缓路段速度分布相对集中,而在连续下坡路段速度分布较分散,说明在山区高速公路上对车辆分车型进行速度管理是有必要的。
(3)较平缓路段,除三型客车和四型客车外其他车型在连续下坡路段的行程速度和标准差都有所降低,说明连续下坡路段速度离散性比平缓路段更大,增加了事故发生的概率,说明在山区高速公路对连续下坡路段进行不同车型进行速度管理和分类是有需要的。
(4)不同车型之间速度分布存在差异性,部分车型行程速度的平均值和标准差有较大的相似性和聚集性,选择两者作为聚类指标,用K-means聚类方法对山区高速公路平缓路段和连续下坡路段的ETC系统中全部车型进行车型分类。平缓路段的车型分为四类:一型客车;二型客车和一型货车;三型客车和四型客车;二~六型货车。连续下坡路段的车型分为三类:一型客车和三型客车和四型客车;二型客车和一型货车;二~六型货车。基于ETC系统中全车型的行程速度分布特征对车型进行分类分析得到的结果,可为山区高速公路设计车型的选择和不同线形路段车辆精细化管理提供参考和借鉴。