刘冬杰,陈卫东
(上海市政工程设计研究总院(集团)第七设计院有限公司,青岛 266005)
城市道路的服务水平、拥堵程度需借助交通量、通行能力、车速等指标衡量,传统的交通运行指标调查方法包括人工观测法、摄像法、跟车法、试验车法、浮动车法等[1],消耗较大的人力、物力,且调查样本量小,不确定性较高,对研究成果影响较大。
随着大数据技术的发展及智能交通技术的普及,道路交通调查手段也逐渐丰富,交通电子设备被广泛应用,道路卡口系统逐渐成为交通调查研究的主要手段[2]。卡口摄像头遍布城市道路,无间断记录车辆信息,为城市道路研究提供充足的基础数据[3]。畅玉皎等[4]通过卡口数据对城市道路分析,得到城市通勤数据。龙小强等[5]通过车牌识别数据,从个体出行及车辆职住地角度对广州市道路网运行状态进行分析。王蓓等[6]基于卡口数据,从宏观、中观和微观三个层面对道路交通进行分析。韩国华等[7]基于车牌识别数据,研究居民的出行特征,进而分析城市静态交通。刘聪等[8]基于车牌识别数据,分析交通拥堵状态。基于卡口数据分析得到的道路交通指标可应用于交通工程的多个方面,分析结果为城市道路交通系统规划、道路交通设计和道路交通管理等提供重要参考。
本文在交通流理论基础上,结合车辆出行特征,提出交通运行状态分析框架,如图1所示。①对车牌识别数据进行预处理,生成车辆初始运行数据;②根据车辆初始运行数据获取单车运行轨迹及速度;③基于单车运行速度,获得路段及路网平均运行速度;④根据平均运行速度判断路网运行状态,对交通拥堵路段有针对性地提出优化建议。
图1 交通运行状态分析框架
在大量的交通运行数据中,存在着较多的错误数据、丢失数据、重复数据,不利于准确分析路网运行状态,需对过车数据、点位数据和行程时间数据进行预处理,提高分析结果的质量。
1) 卡口过车数据预处理。卡口过车数据包含所有车辆的过车数据,是多运行属性的汇集,本文仅选取部分属性数据,通过算法剔除冗余的数据,以提高算法的运行效率。算法利用到的属性数据为车辆牌照、检测时段、设施点位位置、设施点位编号等。
在车牌数据收集过程当中,因设施识别率、信号传输影响、套牌车等问题的存在,导致卡口过车数据存在异常情况,主要包括数据漏检、乱码、错误及车辆时空关系不合理等。数据处理主要包括:①车牌信息漏读,信息显示为空;②车牌信息错误,与正常车位数不一致。
2) 点位数据预处理。点位数据即监控设施所在的位置,通常以经纬度表示,点位数据存在偏差或缺失,大多因为设备回传存在问题。为避免点位数据错误影响研究成果的可靠性,本文借助ArcGIS生成点位位置图,核查点位数据准确性,修正错误点位信息,建立正确的点位数据表。
3) 行程时间预处理。车辆依次经过相邻道路交叉口,得到的时间差即为行程时间。通过跟踪记录行驶车辆,提取车牌及时间信息,得到逐车行程时间数据。由于存在车辆绕行、识别错误等问题,行程时间同样存在异常值,处理方法参考李晓莉等[9]的研究方法,采取上下限值及循环检测判断阈值的方式剔除异常数据。
1) 单车平均运行速度采集。车辆行驶在道路上,先后经过设置的检测截面,根据车辆通过检测截面的时间差,可计算出车辆在路段中的运行速度。在运行速度计算中,城市道路车速不存在超过120 km/h的情况,若存在此类数据,本文将视为无效数据,予以剔除。根据卡口采集数据,提取卡口坐标数据和过车时间数据,根据式(1)求解车辆平均运行速度。
(1)
式中:Vi为车辆i的运行速度;(xj,yj)为卡口j的坐标;(xj-1,yj-1)为卡口j下游卡口j-1的坐标;tj,tj-1分别为车辆i经过卡口j、卡口j-1的时间。
单车平均运行速度计算流程如图2所示。
图2 车辆平均运行速度流程
2) 区域平均运行速度采集。区域平均运行速度可衡量整个路网的运行状态,分析路网服务水平,针对不同道路出现的拥堵问题提出不同的治理措施,对于路网通行能力改善意义重大。根据单车平均运行速度计算方法,利用式(2)可计算区域平均运行速度。
(2)
交通状况是驾驶员的一个主观认识。国外对于交通拥堵状态的量化界定主要包括以下3种方式:① 日本道路公团。将交通速度作为判别标准,确定高速公路是否处于拥堵状态;② 美国芝加哥运输部。将车道占有率作为判别道路拥堵状态的标准;③ 美国德克萨斯运输部。将交通延误作为判别拥堵状态的标准。
国内对交通拥堵状态判别标准的相关研究较少,主要根据交通速度进行判别。本文以交通速度作为路网交通状态判别标准,借鉴梅朵等[10]基于MR-FCM的区域交通状态识别的研究成果,将路网运行状态分为畅通、拥堵和严重拥堵3种状态,交通状态判别指标阈值如表1所示。
表1 路网交通状态判别指标阈值
潍坊市作为山东省内经济较强的城市,市区车辆较多,高峰时段交通拥堵状况较为严重,尚无基于车牌识别数据进行交通运行状态分析的案例。依据《潍坊市城市总体规划(2011—2020)》,潍坊城市建成区在2009年的道路面积率为11.9%,平均路网密度为3.64 km/km2。
为提供交通运行状况的基础研究数据,给予交管部门决策依据,本文以Python爬取的潍坊市高新区路网为研究区域,以区域内60 km主干路、67 km次干路、70 km支路和773处卡口(见图3),1759.6万条车辆出行数据作为研究对象,进行交通出行特征分析。
图3 潍坊市高新区卡口点位
通过提取连续一周全天交通流量,绘制出交通流量时变图(图4),根据交通量变化曲线,总结出路网交通流量存在周期性、时间相关性和重复性3种特点。
1) 周期性。日交通量变化呈现出波浪形式,工作日波浪幅度强于周末,交通流量呈现较强的日周期性变化现象。早晚高峰出现时间均为7:00—8:00和17:00—18:00,周末全天交通量变化相对较小,交通量随时间变化呈现出一定的周期性,周期性变化强度工作日整体强于周末。
2) 时间相关性。交通流量时变图呈现马鞍形,具体表现为0:00—5:00最小,6:00骤增,7:00—8:00达到波峰,9:00骤减,10:00—15:00趋于稳定,16:00骤增,17:00—18:00达到波峰,19:00—23:00迅速降低至最低点,具有明显的时间相关性。
3) 重复性。路网交通流量表现出较强的重复性,日早晚高峰出现时间高度一致,日高峰小时交通量差距相对较小,可根据其重复特性进行交通分析。
通过对工作日早高峰(7:00—8:00)区域路网进行分析,发现工作日出行车辆数差距较小,出行交通总量基本保持在27万辆左右。周一早高峰出行交通总量最多,达到27.42万辆,周五早高峰出行交通总量最小,为26.55万辆。整个区域工作日的早高峰出行交通量较为均衡,便于进行整体化分析。
通过对工作日晚高峰(17:00—18:00)区域路网进行分析,发现工作日出行车辆数集中在23万~27万辆。周五晚高峰出行交通总量最多,达到26.75万辆,周四晚高峰出行交通总量最小,为23.57万辆。整个区域晚高峰出行交通量存在一定的浮动,浮动率达到12%,可针对路网不同的交通流量提出差异化的交通管控措施,保证路网整体通行效率最优。
周末白天(7:00—18:00)交通量整体趋于稳定,总体来看,周六路网交通流量高于周日。
在提取每辆车运行轨迹的基础上,依据车辆经过的卡口坐标和过车时间,进而求出车辆运行速度信息。借助车辆运行速度,得到路段平均运行速度,进而获得路网平均运行速度。基于卡口数据得到各时间段路网平均运行速度如图5所示。
图5 路网平均运行速度时变
区域路网白天平均运行速度为30~40 km/h,路网整体处于畅通状态,运行状态良好。其中,7:00—9:00路网运行速度为30 km/h以下,处于轻微拥堵状态,与早高峰居民集中出行有关。17:00—19:00路网平均运行速度为30~40 km/h,晚高峰路网运行状态相对较好。从晚上20:00至凌晨5:00,路网平均运行速度提升至40 km/h以上,夜间路网处于畅通状态。
根据2019年12月高新区某一周的车牌识别数据,共采集到97.6万辆机动车的行驶轨迹,外地车占比高达25.49%,其中,省外车辆共5.7万辆,占比约5.85%。
2.4.1 省外车辆分析
通过筛选、提取、整理、归类分析省外车辆数据,依据个体车辆出行特征得到各省比例如图6所示。
根据图6,省外车辆中以浙江省车辆最多,占比近40%,浙江、四川、河北、江苏、广东等经济发达省份总占比接近70%,与高新区经济高度开放、普惠的招商引资政策有关。
图6 省外车辆占比
2.4.2 省内车辆分析
通过筛选、提取、整理、归类分析省内车辆数据,依据个体车辆出行特征得到省内比例如图7所示。
图7 省内(潍坊除外)主要城市车辆占比
根据图7,省内的外地车辆以青岛、济南等经济发达地区为主。青岛的车辆占省内车辆(潍坊除外)1/5以上,主要原因是青潍两地同处山东半岛蓝色经济区,经济往来紧密,且距离较近,居民之间联系密切。
以潍坊市高新区车牌识别数据为研究对象,通过数据筛选、处理、提取等车辆出行分析方法,得出如下结论:
1) 路网交通流量呈现出周期性、时间相关性和重复性特征,可根据居民出行特点,提出有针对性的交通改善措施;
2) 路网总体运行状况良好,除早高峰时段路网出现拥堵状态外,其他时间段路网均处于畅通状态;
3) 区域内通行的车辆中,外地车占比较高,可根据路网中的拥堵节点制定高峰时段外地车限行措施。
卡口车牌识别数据作为一种新型出行数据,蕴含了城市路网运行车辆全面持续的出行信息。本文通过对车牌识别数据的挖掘,提出了能够有效提取车辆出行信息的分析方法。该方法具有处理数据规模大,运算精度高等特点。借助车牌识别数据得到的路网交通流量、路网平均运行速度及车辆归属地等分析结果,对于掌握城市道路网的交通分布特征,为城市交通运行规律研究、交通拥堵缓解措施分析,以及交通需求管理政策制定提供辅助决策信息。