刘宇峰,孙 贝,王保生
(1.山西交通控股集团有限公司,山西 太原 030006;2.山西省交通科技研发有限公司,山西 太原 030032)
全国取消高速公路省界收费站,ETC门架系统作为实现电子无感计费的重要设施,架设在高速公路上方,实时采集车辆通行、交易、标签等数据,实现车辆快速不停车通行计费,具备分段计费、流量调查、视频监控等功能[1-2]。随着路网规模日益扩大,偷逃费、超速、违停、随意变换车道等危险驾驶行为频发,尤其是疲劳驾驶极易诱发交通事故,交通事故与车辆行为分析、行驶轨迹密切相关。
本文提出一种基于多源时空数据融合的车辆行为分析与评价方法,融合车道收费数据、ETC门架计费数据、ETC门架牌识数据等拟合车辆行驶轨迹,深入挖掘疲劳驾驶等行为,提出一种多参量车辆驾驶行为信用动态评价方法,有助于ETC业务办理时规范引导和稽核偷逃费,提供共享数据参考[3],达到规范车辆驾驶行为、提高路网管理效率的目的。
车辆行驶过程受车速、天气、路侧监测及车载设备影响,收集到的车道收费数据、ETC门架计费数据、ETC门架牌识数据等信息存在噪声和数据缺失,需要对数据进行整理,补充缺失数据、剔除无效数据并捕获异常数据。针对异常数据,本文通过比对取值范围、门架及基础信息表进行过滤,如:数据类型不正确、数据超出范围等,若数据被判定为异常数据,将其值置为空,再根据缺失数据处理方法进行补充[4]。不同单元缺失数据处理方法基本相同,本文以ETC门架系统数据缺失为例进行介绍。
ETC门架实时采集通过车辆的基础数据和行驶信息,具体包括入口时间、入口收费站名称、出口时间、出口收费站名称、收费路段编号、收费路段名称、收费路段限速、收费路段长度、收费单元编号、收费单元名称、收费单位时间、收费单元坐标、车牌+颜色、收费车型、收费车道。
当入口时间、入口收费站名称、出口时间、出口收费站名称等字段缺失时,根据“车牌+颜色”搜索当天收费站通行数据,匹配则根据式(1)所示进行有效性验证,只有车辆行驶平均速度在合理范围内,此数据有效并补充。
式中:Ses表示收费站与门架之间的里程;te为门架通过时间;ts为通过收费站时间;vmin为途径路段最低限速;vmax为途径路段最高限速。
当字段“收费单位时间”缺失时,若为单个门架数据缺失,则根据该车辆通过前后门架的时间采用线性插值法进行缺失数据处理,因为正常行驶条件下行驶时间仅与行驶距离呈现紧密相关性。若出现连续多个门架数据丢失,则采用均值替换法进行缺失数据处理,具体方法如下:
a)查询车辆N0有通行时间记录的最后一个门架Elast、重新有通行时间记录的第一个门架Efirst的具体时间 Tlast和 Tfirst。
b)选择与该车辆行驶路径相同且通过时间顺序相连的N台车辆,即同时通过门架Elast和门架Efirst,其中N/2车辆通过时间在Tlast之前,N/2车辆通过时间在Tlast之后,记录N台车辆依次通过车辆N0缺失门架E1、E2......Em的时间t1、t2......tn。
c)则车辆通过门架Ei的时间可表示为:
d)使用ti填充车辆N0的缺失值。
其他缺失字段,根据基础信息表与门架牌识数据进行查询补充。
车道收费数据、ETC门架计费数据、ETC门架牌识数据等单元数据预处理后,即可开展多源数据融合工作。本文将各单元的行驶数据基于车牌号码、时间和空间信息进行融合,形成收费站入口为起点、ETC门架数据信息为节点、收费站出口为终点的完整车辆轨迹,为车辆行驶行为分析与挖掘建立数据基础。
入口收费站数据是车辆进入高速公路时产生的数据,用于记录车辆基础信息和行驶信息,具体包括入口时间、收费站名称、车牌+颜色、收费车型、收费站坐标。
出口收费站数据是车辆驶离高速公路时产生的数据,用于记录车辆行驶信息及车辆基础信息,具体包括入口时间、入口车牌、入口车型、收费车型、车牌+颜色、收费时间、入口收费站名称、出口收费站名称、出口收费站坐标。
门架交易数据和牌识数据是车辆高速公路正常行驶过程中,经过高速公路门架系统,用于记录车辆经过门架位置、时间等信息,具体包括经过时间、车牌+颜色、车型、上下行以及门架坐标等信息。
基于时空特性的车辆轨迹拟合算法包含以下步骤:a)关联各单元数据,基于车牌号码筛选出有车辆行驶信息记录的单元车辆流水数据;b)提取车辆在各单元的通行时间并将数据按照时间戳进行排序[5],获取车辆当日在高速公路行驶的时间集合;c)确定数据有序性后提取各单元地理坐标信息,并换算为数学坐标系中的二维坐标点集;d)形成以车牌为融合条件,包含单元名称、通行时间和通行坐标的车辆轨迹。
根据疲劳驾驶界定原则,连续驾驶时间与停车休息时间是疲劳驾驶行为判定主要指标。本文结合数据总体特征基于车辆行驶轨迹数据集分析车辆疲劳驾驶行为,同时深入挖掘疲劳驾驶行为发生次数,具体流程如图1所示,达到为驾驶行为信用评价提供数据支撑的目的。
图1 疲劳驾驶判定流程图
a)计算车辆在高速公路上行驶总时间Ht,表达式如式(3):
式中:Tin为车辆驶入高速时间;Tout为驶离高速时间。
b)若 Ht<4 h,无需判断是否存在疲劳驾驶行为;若Ht≥4 h,则需根据车辆行驶时间间隔判断车辆是否驶入服务区,间隔行驶时间Hn表达式如式(4):
式中:Tin(n+1)为驶入第n个服务区的时间;Tout(n)为驶离第n-1个服务区的时间;m为车辆行驶全过程驶入服务区的数量。
c)当Hn>4 h时,表示车辆连续驾驶时间超过4个小时,即可判定为疲劳驾驶,且其次数f等于Hn>4 h情况出现的个数。
d)若Hn均小于4 h,则计算车辆实际休息时间Tact与理论休息时间Ttot,表达式分别为式(5)、式(6):
式中:ceil()表示向上取整。
e)比较实际休息时间与理论休息时间大小,若Tact 式中:round()为就近取整函数。 本文采用扣除与动态系数结合方式对车辆驾驶行为进行评价,即根据失信行为发生次数及其对交通安全和收费的影响程度扣除分数,若车辆连续多月未发生失信行为时则根据调整系数提升信用分数,每月最后一天更新分数。笔者所述信用评价体系包含9个指标,具体含义如表1所示。疲劳驾驶行为次数挖掘方法见本文第3节,其他8项指标发生次数通过路侧摄像头、雷达等设备进行采集,直接调用即可,不再赘述。 表1 信用评价指标定义 信用评价算法实施步骤具体如下: a)令wi为当月第i类行为权重值,xi为当月第i类行为出现次数,f(xi)为当月第i类行为出现次数的效用函数,权重wi根据各类行为对逃费和事故的影响程度获得,第一个月驾驶行为信用值Cdrb的表达式为: 式中:信用基础分为600;wi∈[0,1]。 b)效用函数f(xi)采用最大次数估算法进行选取,具体表达式为: 式中:ximax基于历史月份出现过的最大次数估算获得。 c)若第m+1月车辆失信行为xi>0,在第m月基础上累计扣减,表达式为: d)考虑到驾驶员会根据信用评价分数规范其驾驶行为,引入动态调整系数vj,其数值随着零失信行为累计产生月数增加而增加,表达式为: 式中:n为“月失信行为等于零”事件连续发生月数。 e)当第m+1月车辆各类型失信行为xi=0时,vj根据式(11)取值,更新驾驶行为信用值Cdrb分数,表达式为: f)车辆连续12个月不发生失信行为,车辆驾驶行为信用分即可恢复为600。 针对当前交通驾驶异常行为频发的现状,融合车道收费数据、ETC门架计费数据、ETC门架牌识数据等对车辆驾驶行为信用进行动态评价,通过动态调整车辆信用值,有效分析车辆驾驶行为,有助于研究交通事故发生的规律,对交通路网规划等具有指导意义。4 多参量驾驶行为动态信用评价方法研究
5 结语