基于门架数据的高速公路拥堵识别研究

2023-12-25 12:42苏跃江韦清波
科技和产业 2023年22期
关键词:门架时段路段

余 畅, 苏跃江,2, 韦清波

(1.广州市交通运输研究院有限公司, 广州 510635; 2.华南理工大学 土木与交通学院, 广州 510614;3.广州市公共交通数据管理中心有限公司, 广州 510620)

近年来,随着机动车保有量的迅猛增长,高速公路拥堵愈发频繁发生,已成为影响交通安全和运行效率的主要问题。有效识别高速公路拥堵情况,准确掌握高速公路交通运行状态,是对高速公路进行科学的交通管理控制以及建设规划的关键前提,对于改善高速公路拥堵状况、提升运行效率和交通安全具有重要意义。

关于高速公路的交通拥堵识别分析,国内外学者对于拥堵识别算法进行了大量研究,主要可以归纳为直接检测算法和间接识别算法两大类。直接检测算法主要是基于各类视频图像识别技术对交通拥堵事件进行检测[1-3],该类算法可以从微观角度开展交通拥堵识别分析,但在实际应用中成本较高。间接识别算法主要根据拥堵对交通流的影响来识别拥堵,主要包括基于交通流模型的算法以及基于智能算法的算法[4],其中交通流模型中常用于拥堵识别的度量参数有道路交通流车辆速度、车辆密度、占有率、车流量和行程时间等[5-7],交通流模型能够定量分析交通运行情况,但部分交通流模型参数较多导致复杂度较高;智能算法主要包括深度神经网络[8]、支持向量机[9]、梯度提升[10]、聚类分析[11]等,智能算法能够从数据层面准确识别交通运行状态,但无法探究交通内部的运行机理。

数据源方面,目前被应用于高速公路拥堵识别的数据来源多样,主要包括车检器数据[12]、视频数据[13]、收费站流水数据[14]、移动信令数据[15]及多源数据融合等类型[16]。张腾月[17]基于高速收费流水数据,分匝道和主线两部分对行程时间进行估算并求取交通流参数,从而进行交通状态识别,但由于收费站流水数据颗粒度较粗,对于细分路段的分析精确度不高;韩坤林[18]提出一种决策级融合算法对车检器数据和收费数据进行融合,以判别高速公路的交通异常状态,但国内高速公路现有检测设施布设稀疏,数据检测率有待提高;陈子瑜[19]提出了基于电子收费(electronic toll collection,ETC)交易数据的区段交通拥堵检测方法,从区段交通流量和行程时间速度两个指标进行检测分析,但其仅根据相关技术标准来设定指标阈值,设定方法主观性较强,不够精细。

随着ETC系统技术的发展成熟, ETC门架系统已广泛应用于高速公路,其生成的门架流水数据体量大、覆盖范围广、颗粒度细、采集处理方便,为高速公路的拥堵识别分析提供了新的路径。本文基于海量高速公路门架数据,全面获取所有车辆出行信息,结合交通流参数和智能算法的优势,提出通过聚类算法获取各路段拥堵行程时间阈值的拥堵识别方法,能够快速实现对高速公路全网全路段全时段的拥堵识别分析,具有较强的普适性以及应用可行性。

1 研究方法

本文提出了一套基于门架数据的拥堵识别分析方法,研究框架如图1所示。第一,通过数据清洗及预处理流程,过滤错误及异常数据,并对缺漏数据进行补全;第二,以门架对应路段为单位组织数据,提取所有车辆在各门架路段上的行程时间集合。第三,基于目标路段所有的行程时间样本统计来定义合适的参数特征,利用DBSCAN (density-based spatial clustering of applications with noise)聚类算法,对目标门架路段的行程时间集合进行聚类分析,根据聚类结果的类别特征对路段的拥堵行程时间阈值进行标定;第四,对于各个门架路段进行以上聚类分析流程,形成各门架路段的拥堵行程时间阈值经验库;第五,对于目标时段路段,将路段对应行程时间阈值与目标行程时间样本集的统计特征进行对比分析,实现对任意时段的路段拥堵情况进行判别,从而掌握高速公路的拥堵时空分布特征。

1.1 数据清洗与预处理

为实现路段级别的精细化拥堵识别,采用门架数据作为基础数据,门架数据主要包括车辆信息(车牌号、车辆类型、门架路段、所在高速、通过时间等)和交易信息(通行介质、计费里程等),如表1所示。由于高速电子不停车收费(electronic toll collection, ETC)门架系统存在的不完善,采集到的门架数据会出现出行漏检(过车时无识别)、错检(过车时被对向门架检测到)的情况。为了提高原始数据的质量,提升车辆出行信息获取的准确度,需要对原始数据进行以下数据清洗及预处理流程。

表1 门架数据示例

第一步:异常及冗余数据剔除。针对车牌号识别失败、计费里程为0 km等异常数据,以及同一车辆被同一门架检测多次产生的冗余数据,直接筛选出来进行剔除。

第二步:错检数据修正。针对通过车辆被对向门架检测而产生的错检数据,将门架路段信息融入高速路网模型,根据路网模型中的门架路段拓扑关系梳理出对向门架对应关系以及门架路段序列,判断异常过车逻辑;对于被对向门架检测的错误数据,将其替换为正确的门架路段。

第三步:漏检数据补充。针对通过车辆未被门架有效识别或数据异常导致的门架数据缺失,利用均值插补法进行补全。根据高速路网模型中的相邻门架对应逻辑关系及门架路段序列,补全缺失的门架路段,对于相邻门架之间的通行时间,则统计同时段在该路段(相邻门架之间)所有同车型通行车辆的平均通行时间,依次倒推各个缺失门架的过车时间,从而对缺失门架数据进行补全。

1.2 路段行程时间聚类

路段行程时间是一个能反映路段交通运行状态的重要指标。基于门架数据统计分析所有相邻门架对之间所有小客车(货车运行速度差异较大,本文研究暂不考虑)的行程时间,得到相邻门架路段在全天不同时段的行程时间集合;该集合中包含多个不同车辆样本在全天不同时段(包含高峰时段和空闲时段)的行程时间,基本能反映路段在不同交通状态下对应的行程时间情况。为科学准确地从中提取出用于判别交通拥堵的行程时间阈值,利用DBSCAN聚类算法[20]对行程时间集合进行聚类,提取其中大部分小客车在不同交通状况下行驶所需的行程时间,从而实现对路段的拥堵行程时间阈值的标定。

DBSCAN算法优点在于不需要定义聚类个数,对于不同特征的路段可以适应性地划分交通状况类别数量,并且可以有效剔除数据集中的异常点。DBSCAN算法根据区域点密度的不同来定义聚类集群,该算法包含最大密度可达距离ε和最小样本点数minPts两个全局参数。如果在一个样本点周围半径为ε的范围内,有至少minPts个样本点(密度足够高),那么这个点可以被标定为一个聚类中心点ic,表达为

|Nε(ic)|≥minPts

(1)

式中:Nε(ic)为到ic的距离d(ic,i)小于ε的样本点的数量。

在利用DBSCAN算法对行程时间集合进行聚类流程前,首先需要对聚类的两个关键参数进行定义。最大密度可达距离ε为相同交通状态下允许不同车辆样本的行程时间差值,表示合理控制聚类个数,将该参数定义为

(2)

最小样本点数minPts用于判别聚类类别的有效性,排除个别噪声数据干扰,该参数定义为

minPts=μi/βn

(3)

式中:μi为门架路段i对应的过车样本数量;n为划分拥堵等级的最多个数;β为允许样本量偏差的修正系数。

为了科学地设定参数中的修正系数取值,采用不同的修正系数取值对聚类结果进行了敏感性测试,最终将可达距离的修正系数α设为4,样本量偏差的修正系数β设为10。

利用DBSCAN算法进行路段行程时间聚类的具体流程如下:

1)按门架对应路段提取相应的行程时间样本集合。

2)对目标路段的行程时间集合中随机提取一条未访问样本,形成一个簇并将该样本标记为已访问。

3)以递归的方式,遍历获取下一条未访问样本与当前各个簇的中心的是否密度可达(距离小于ε)。

4)若存在密度可达的类则将该样本扩展这个簇的密度区域,若不存在与该样本密度可达的簇,则将这条样本形成一个新的簇。

5)重复3)步直到集合中所有样本都访问过,对于每个簇,如果总样本数少于minPts,则该簇中的样本标记为噪声,否则确认为一个有效聚类。

6)将各个聚类中心点的样本平均值按大小排序,得到目标路段的不同拥堵等级对应的行程时间。

7)按1)~6)步处理所有门架路段的行程时间集合,形成全路段的不同等级拥堵的行程时间阈值经验库。

1.3 路段拥堵判别

对所有路段进行以上行程时间聚类流程,形成各路段的拥堵行程时间阈值经验库。对于需要分析的目标时段及路段,首先获取该路段的行程时间阈值集合{P1,P2,…,Pn},对于某行程时间值i对应的拥堵等级Ci划分标准如下:

(4)

“互联网+”教育深入融合的当今时代,微课等形式作为新的教学模式在教学课堂中如火如荼进行着。为解决成人继续教育学员的工学时间矛盾的突出问题,提高教学效果和学员的学习质量为教学目标,我们将微课理念融入继续教育课程建设中,我们尝试在“C语言程序设计”这门课的继续教育中引入微课为基础的翻转课堂教学,探究其在“C语言程序设计”中的应用效果。

2 实例分析

2.1 路段拥堵识别分析

采用2021年5月10日至5月16日一周的广州市高速公路门架数据作为研究基础数据集,数据集规模达到2.84亿条,平均每日4 059万条。按照前文提出的研究方法对数据集进行处理,展开对广州市高速公路的拥堵识别及分析。以广州北环高速S81上的相邻门架对“沙贝立交虚拟拆分点-广清”和“广清-广花”之间对应路段为例,在一周时段内共提取27.8万条小客车过车的行程时间样本。对样本集进行了DBSCAN聚类流程,最终的聚类分类结果如图2所示。

图2 路段行程时间样本聚类结果

根据聚类结果将该路段划分为4个拥堵等级,分别为:“顺畅”等级,对应行程时间阈值为254 s,在该阈值以内路段处于顺畅的自由流状态下,行程时间样本呈现近似正态分布特征;“轻度拥堵”等级,对应行程时间阈值为453 s;“中度拥堵”等级,对应行程时间阈值为655 s;“重度拥堵”等级,对应行程时间阈值为858 s;拥堵等级越高,行程时间偏离越大,样本量呈现逐渐减少的趋势;而对于行程时间大于858 s的等级,由于样本量未达到聚类参数的最小样本点数,被判定为噪声。

基于路段各拥堵等级对应的行程时间阈值,可对该路段的不同时段的拥堵情况进行判别。利用门架数据,对该路段在不同出行日不同时段的平均行程时间进行统计,如图3所示。

图3 各时段平均行程时间分布情况

经过路段拥堵判别流程,将各时段的行程时间统计特征与对应的阈值进行对比,最终对该路段的拥堵等级判别情况如图4所示。从拥堵时段分布情况来看,该路段工作日的早高峰时段拥堵情况较为严重,08:00—11:00都处于中度及以上拥堵的状态,拥堵持续时间较长;周末的上午时段基本处于顺畅状态,拥堵主要出现在下午时段以及夜间21:00—22:00点时段。

图4 各时段拥堵等级判别情况

2.2 路网拥堵特征分析

利用以上方法,对广州市所有高速公路门架路段进行拥堵判别分析。根据相邻门架对划分路段,共计划分出1 307个有效路段,对全网所有路段的全天各个时段进行拥堵判别,即每天对应31 368个路段样本。统计一周不同出行日内的路段拥堵等级分布情况,如表2所示。

表2 全路段时段拥堵等级日分布情况

从分布情况来看,全网在周五出现拥堵的路段时段最多,其次为周六,而周日出现拥堵的路段时段最少;总体而言,一周内有80%的路段时段处于顺畅状态,20%的路段时段处于拥堵状态,其中大部分为轻度拥堵,整体运行状态良好。

从拥堵路段分布来看,全周累计发生拥堵的路段时段达到43 093段次,其中累计拥堵段次超过1 000次的高速公路达到17条,如表3示。发生路段拥堵最多次的5条高速分别是S4华南快速、S41机场高速、S81北环高速、G1508北二环高速、S73南沙港快速。

表3 常发拥堵的主要高速公路

结合门架流水数据以及高速收费站流水数据,根据车辆在各门架路段的通过时间以及进出站时间,可对各收费站匝道进行拥堵判别分析。从收费站匝道拥堵情况来看,进站上高速匝道全周累计发生拥堵8 876段次,表4所示为上高速匝道常发拥堵的收费站;出站下高速匝道全周累计发生拥堵22 595段次,表5所示为下高速匝道常发拥堵的收费站。对于常发拥堵的收费站匝道,后期可考虑通过改扩建工程以及交通引导等措施进行优化治理。

表4 上高速匝道常发拥堵的收费站

表5 下高速匝道常发拥堵的收费站

3 结论

1)通过对行程时间样本聚类进行拥堵等级划分的结果呈现以下特征:顺畅状态下路段处于自由流状态,行程时间样本呈现近似正态分布特征;拥堵状态下拥堵等级越高,行程时间偏离越大,样本量呈现逐渐减少的趋势。

2)从拥堵时段分布来看,工作日的早高峰拥堵情况较为严重,且持续时间较长;周末的上午基本处于顺畅状态,拥堵主要出现在下午时段。

3)从全路网拥堵的出行日分布来看,全网在周五的拥堵情况最为严重,其次为周六;总体而言,广州市高速路网一周内80%的路段时段处于顺畅状态,出现拥堵的大多数为轻度拥堵,整体运行状态良好。

4)本文的拥堵识别方法能够有效识别全网范围内常发拥堵的路段以及收费站匝道,基于各路段的拥堵行程时间阈值经验库来判别拥堵,易于实际应用。

本文的研究能帮助全面掌握和有效评估高速公路的交通运行状况,为高速公路的改扩建规划以及优化提升提供有效的决策支撑。

猜你喜欢
门架时段路段
冬奥车道都有哪些相关路段如何正确通行
基于新能源技术的高速公路ETC门架供电系统
ETC门架防雷技术浅析
部、省、路段监测运维联动协同探讨
A Survey of Evolutionary Algorithms for Multi-Objective Optimization Problems With Irregular Pareto Fronts
基于XGBOOST算法的拥堵路段短时交通流量预测
四个养生黄金时段,你抓住了吗
3200/1600t溜尾门架
傍晚是交通事故高发时段
分时段预约在PICC门诊维护中的应用与探讨