数据驱动的公路典型风险场景聚类与特征分析

2024-04-01 09:45胡伟超陈艳艳于鹏程于士杰牛世峰
科学技术与工程 2024年8期
关键词:路段典型聚类

胡伟超, 陈艳艳, 于鹏程, 于士杰, 牛世峰*

(1.北京工业大学城市交通学院, 北京 100124; 2.公安部道路交通安全研究中心, 北京 100062; 3.长安大学汽车学院, 西安 710064)

近年来,中国公路里程和机动车保有量不断增加,公路交通事故因严重程度高、对国民经济影响大等原因,逐渐成为政府、企业和研究机构关注的重点。如何预防公路交通事故的发生成为亟需解决的难题,而公路交通典型事故场景是开展交通事故致因分析、智能辅助驾驶设备测试、车辆运行风险评估等关键预防预控问题研究的基础,对其进行研究具有非常重要的意义。

目前,关于典型风险场景的研究主要集中在城市道路典型风险场景风险分析和自动驾驶测试场景设计两个方面[1]。一些研究者针对部分城市道路典型场景的风险进行了深度分析,如人车碰撞危险场景[2-4]、丁字路口车辆与车辆碰撞危险场景[5]和特定道路环境场景[6]。自动驾驶测试场景研究主要针对自动驾驶测试场景选取和设置依据进行研究,如无人驾驶典型测试场景构建[7-10]、无人驾驶汽车安全测试方法[11-12]等。总体来看,上述研究对于城市道路和自动驾驶领域的典型风险场景进行了一定程度的探索,而目前专门针对公路交通进行典型风险场景研究与交通风险分析的文献相对较少,基于海量真实交通事故数据开展公路交通典型风险场景研究尚鲜见报道,严重制约了无人驾驶公路场景测试及公路交通安全分析和改善研究。

针对这一问题,基于6个典型区域近5年海量真实公路交通事故数据,筛选确定场景分类变量,形成公路交通事故场景数据集,针对不同路段和路口公路交通环境,基于交通主体不同运动状态进行聚类分析,确定16种典型的公路 “动态”风险场景,并对典型风险场景“静态”安全特征进行分析,为后续智能车辆测试场景构建和车辆运行风险评估提供场景依据和风险特征基础。

1 数据基础

1.1 公路交通事故原始数据说明

考虑到天气、经济、地形、环境等都会对场景风险度特征形成影响,选取东北、华北、西北、华东、华南、西南六大区域代表性省份5年内约60 000条公路交通事故数据作为数据源,其中隧道、急弯、桥梁和陡坡路段数据为全部交通事故数据,其他公路路段为死亡事故数据。

1.2 公路交通事故场景数据数据库获取

为了获取合理有效的场景事故数据,首先对原始数据进行预处理,然后筛选确定场景分类关键因素,通过关键因素合并同类场景,计算风险度指标,形成公路交通事故场景数据库。

1.2.1 场景分类变量筛选

原始交通事故数据属性较多,并非所有因素都对场景分类具有显著影响。而场景分类变量太多,会导致分类场景事故数较少,代表性变弱。在参考已有研究成果的基础上,从自车因素、交通冲突方因素、道路因素、环境因素4个方面筛选确定14个危险场景分类变量,如图1所示。

图1 危险场景分类变量

1.2.2 分类变量数据获取

分类变量数据都是从原始数据获取,但从获取方式来看,分类变量还可以分为直接获取变量和间接获取变量两类。前者为数据库本身具有变量,变量包含属性值较多,需根据变量对风险的影响大小,对属性值进行合并和赋值,包括环境、道路和自车状态因素所有变量和冲突方交通方式。后者为数据库不直接具有,但可通过其他属性值进行推断的变量,包括冲突方行驶状态、相对运行方向两个变量。两个变量主要通过车辆运行状态、违法行为和事故简易描述获取。

1.2.3 公路交通事故场景数据集构建

通过原始数据进行分析计算获得场景分类变量,将场景分类变量完全相同的数据进行合并,共获得10 603条包含不同分类变量的危险场景的数据集。该数据集是后续研究的基础,其分类变量分布情况如图2所示。

图2 危险场景分类变量分布

2 公路交通典型风险场景聚类分析方法

为了能够获得公路交通的典型风险场景,在对已有文献进行分析的基础上,将公路分为7类典型路段和路口,其中路段包括桥梁路段、陡坡路段、普通路段、隧道路段、急弯路段,路口包括三枝分岔口和四枝分岔口两类。为了获得不同典型路段和路口发生事故的典型交通冲突形式,基于前述公路交通事故场景数据集,利用K-means算法构建了不同路段典型交通冲突方式聚类方法。

2.1 基于K-means的路段路口典型交通冲突方式聚类方法

以K-means算法为核心构建不同公路路段和路口典型交通冲突方式聚类方法,选取聚类变量包括自车交通方式、自车行驶状态、冲突方交通方式、冲突方行驶状态、相对运动方向5个分类变量,分别针对7类典型路段和路口进行聚类分析。

首先,利用5个分类变量构建h个m×5数据集Xp,其中,m为每类典型路段发生事故的数量,h=7。聚类目标是使得各类的聚类平方和最小,即最小化,可表示为

(1)

结合最小二乘法和拉格朗日原理,聚类中心为对应类别中各数据点的平均值,同时为了使得算法收敛,在迭代过程中,使最终的聚类中心尽可能地不变。本文聚类方法的K值通过手肘法确定,其核心指标是误差平方和(sum of the squared errors,SSE)。

(2)

式(2)中:Ci为第i个分类;p为Ci中的样本点;mi为Ci的质心(即Ci中所有样本的均值);SSE为所有样本的聚类误差,反映聚类效果的好坏。

2.2 路段路口典型交通冲突方式聚类结果

通过聚类分析,桥梁、陡坡、普通、隧道、急弯5类路段的最佳聚类数K值分别为2、2、3、2和3,三枝分岔口和四枝分岔口两类路口的最佳聚类数K值都是2,具体聚类结果如表1所示。

表1 公路典型风险场景库

3 公路交通典型风险场景风险特征分析

在公路安全分析和测试场景构建中,通常需要保证选取和构建场景风险度分布符合一定规律,因此需要明晰不同场景的平均风险程度以及不同道路和环境因素对场景风险度的影响。基于不同典型风险场景的交通事故数据对典型场景风险度进行分析,然后深入分析道路和环境分类变量对场景风险度的影响特征,便于后续其他研究使用。

3.1 公路交通典型场景风险特征分析

选用事故数、死亡事故平均死亡人数和平均死亡人数3个指标对典型风险场景导致事故的可能性和严重程度进行分析。由于原始数据源限制,平均死亡人数指标只计算桥梁、隧道、陡坡和急弯4类路段的指标,结果如表2和图3所示。

表2 典型场景危险度分析

图3 典型场景危险度指标变化趋势

从事故数量角度看,P3场景发生事故数达到3 749起,可能因为普通道路在公路中的占比大导致,但也从侧面说明驾驶员在公路交通驾驶中面临P3典型风险场景的概率最高。发生事故数在200~400起的场景包括SI1、SI2和S1,可见在公路交通中路口风险场景也较为普遍风险场景,尤其十字交叉口典型场景。发生事故数在100~200起的典型场景包括Q2、J2、S2和P1,分别表示桥梁路段同向追尾或刮擦冲突、急弯路段车辆和行人冲突、三枝分岔口同向追尾或刮擦冲突以及普通路段大客车与大客车追尾或刮擦冲突,其他典型场景发生事故数都在100起以内。

从事故严重程度看,典型风险场景J3、Q2和P2的死亡事故平均死亡人数较大,分别达到1.4、1.2和1.17,这3种典型风险场景中J3和P2场景发生事故数较少,分别是6起和13起,平均死亡人数代表性会受到一定影响,而Q2典型风险场景发生事故数达到122起,其平均死亡人数具有较好的代表性。从最大死亡人数看,Q2、D1、J3、P1、P2、P3和SI1场景都发生过3人及以上事故,说明发生较大事故的可能性较高。总体来看,J3、D1、Q2、P1、和P2 典型场景在平均死亡人数和最大死亡人数两个指标都较大,需特别重点关注。

3.2 道路和环境因素对典型危险场景风险的影响特征

在测试场景构建和道路安全分析时,为了丰富和明确典型场景的风险特征,不仅需要明晰典型风险场景的平均风险程度,还需明确各道路和环境因素对典型风险场景风险度的影响关系。因此,基于道路交通事故数据,对道路和环境因素影响典型风险场景风险度的特征进行分析。

为了更好地表征各因素对场景风险度的影响,设计场景事故数相对基准变化率和死亡事故平均死亡人数两个指标对场景风险度变化进行度量,如式(3)和式(4)所示。其中,事故数相对基准变化率主要考量各因素条件下特定场景事故所占比重相对于不考虑影响因素条件下特定场景事故所占比例的增长率。

(3)

(4)

3.2.1 道路因素对典型场景危险度的影响特征

分析的道路因素包含的路面状况、路表情况、交通信号方式和防护设施类型4个因素,结果如图4~图7所示。其中平均死亡人数为0的场景是由于该场景下发生事故数为0导致。

图4 路面状况对典型场景风险度的影响

(1)路面状况对典型场景风险度的影响特征。由图4可知,路面完好与否对大部分场景事故数量比重影响不大,缺陷和施工条件下只有SU1和J1场景发生事故比重大幅增加。从平均死亡人数指标看,路面完好条件下Q2、P2和J3场景下平均死亡人数相对较高,缺陷和施工条件对平均死亡人数指标影响较小。

总体来看,路面状况因素对场景风险度影响较小,在测试场景设计和安全分析时,可以不做重点关注。

(2)路表情况对典型场景风险度的影响特征。从事故发生数量来看(图5),路表情况对于部分场景的事故数量比重具有较大影响,潮湿路面条件下, P2、SU1和SU2场景的事故数量比重相对基准出现较大幅增加;漫水和积水路面条件下,D1和S2场景的事故数量比重相对基准出现大幅增加;冰雪路面条件下,SU2和SI2场景的事故数量比重相对基准会大幅增加。

图5 路表情况对典型场景风险度的影响

从事故严重程度看,干燥路面条件下,Q2和J3场景的平均死亡人数较高;潮湿路面条件下,D1和P2场景的平均死亡人数较多;积水和冰雪条件下,平均死亡人数影响不大。

总体来看,路表情况对典型场景风险度影响较大,在测试场景构建和公路安全分析时,需重点关注。

(3)防护设施类型对典型场景风险度的影响特征。从事故发生数量来看(图6),无防护条件下,各典型场景的事故数量分布与基准分布较为相似,但在有物理隔离设施时,Q2、P2、SU2、J3场景的事故数量比重相对于基准出现大幅增加,这可能和物理隔离措施限制部分交通冲突方形式发生有关。在装设护栏条件下,大部分典型场景的事故比重相对于基准出现了下降,SI1和SI2场景的事故率相对于基准有小幅上升。

图6 防护设施类型对典型场景风险度的影响

从事故严重程度来看,在无防护条件下,Q2和J3 两个场景的平均死亡人数较多;物理隔离设施条件下,D1和P2 两个场景的平均死亡人数较多;装设护栏条件下,D1、P1和SI1 场景的平均死亡人数稍高于其他场景。

总体来看,道路防护措施对场景风险度影响较大,尤其是物理隔离设施影响较大,在设计测试场景和安全分析时,需做重点考虑。

从事故发生数量来看(图7),无控制条件下,P3场景事故数量比重较基准增加;有信号灯和标线条件下,P1、SU2、SI1和SI1 场景的事故数量比重会大幅增加;只有标志标线条件下,只有P2场景的事故数量比重有较大幅增加。

图7 交通信号方式对典型场景风险度的影响

从事故严重程度相比,无控制条件下D1和J3场景的平均死亡人数较高;有信号灯和标线条件下,P1场景的平均死亡人数较高;只有标志标线条件下,Q2和P2场景下的平均死亡人数较高。

总体来看,在交通控制方式中是否同时具有信号灯和标线对场景的风险分布有较大影响,在测试场景设计和公路安全分析时,需做重点关注。

3.2.2 环境因素对典型场景危险度的影响特征

分析的环境因素包括照明条件、天气和能见度,分析结果如图8~图10所示。

图8 照明条件对典型场景风险度的影响

(1)照明条件对典型场景风险度的影响特征。从事故发生数量比重(图8)来看,白天条件下,场景P1发生事故的比重较基准会大幅增加,场景Q1和J2发生事故的比重较基准会较大幅下降;夜间有路灯的条件下,Q1、D2、P1、P2、J1、J2和J3发生事故的比重较基准会一定幅度的下降;夜间无路灯条件下,P2场景发生事故的比重较基准会有非常大幅度增加,Q1、D2、P1、P2、SU2和SI1发生事故的比重较基准会一定幅度的下降。从事故严重程度来看,白天条件下,场景J3的平均死亡人人数较高;夜间有路灯条件下,D1、P1和J1场景发生事故的平均死亡人数较高;夜间无路灯条件下,Q2和P2场景发生事故的平均死亡人数较高。总体来看,照明条件对各场景发生事故数量和严重程度都有较大影响,尤其是夜间无路灯条件影响尤其明显,在设计测试场景和安全分析时,需做重点关注。

(2)天气条件对典型场景风险度的影响特征。从事故发生数量角度来看(图9),晴天和阴天条件下各场景的事故比重和基准比重较为一致,影响较小;雨天条件下, SU1场景的发生事故比重会大幅增加;雪天条件下,D2、S2和SU2场景发生事故的比重大幅增加;雾天条件下,Q1和S1场景的发生事故比重会大幅增加。从事故发生严重程度来看,晴天条件下,P2场景的平均死亡人数较高;阴天条件下,D1和P1场景的平均死亡人数较高;雨、雪和雾天对平均死亡人数影响不大。总体来看,天气因素中雨、雪、雾天气对事故发生数量比重影响较大,晴天和阴天对特定场景的平均死亡人数有较大影响,后续使用中需注意。

图9 天气对典型场景风险度的影响

(3)能见度条件对典型场景风险度的影响特征。从事故发生数量角度来看(图10),能见度为50 m以内条件下,J3场景发生事故比重会大幅增加;能见度为50~100 m条件下,P2、SU1和SU2场景发生事故比重会较大幅增加;能见度为100~200 m条件下,Q2、J1和J3场景发生事故比重会较大幅增加;能见度为200 m以上条件下,S2、P1和SI1场景发生事故比重会有小幅增加。从发生事故严重程度看,能见度为50 m以内对场景的平均死亡人数影响较小;能见度为50~100 m以内条件下,Q2场景的平均死亡人数较多;能见度为100~200 m条件下,P2场景的平均死亡人数会非常大幅的增加,需特别注意。能见度为200 m以上条件下,J3场景的平均死亡人数会非常大幅的增加。总体来看,能见度对各场景风险程度的影响较大,其中,低能见度对特定场景的事故发生率影响较大,较好的能见度对特定场景的事故严重程度影响较大。

图10 能见度对典型场景危险度的影响

4 结论

以6个典型区域代表性省份近五年公路交通事故大数据为源,从自车因素、交通冲突方因素、道路因素、环境因素4个方面筛选14项场景表征指标,设计典型交通方式聚类方法,分别针对桥梁路段、陡坡路段、普通路段、隧道路段、急弯路段五类路段和三枝分岔口、四枝分岔口两类路口进行典型冲突方式聚类,获得16种典型场景。为了方便测试场景设计和安全分析使用,对16种典型场景的风险度特征和道路和环境因素对典型场景风险性的影响特征进行分析。

猜你喜欢
路段典型聚类
用最典型的事写最有特点的人
冬奥车道都有哪些相关路段如何正确通行
多项式求值题的典型解法
部、省、路段监测运维联动协同探讨
A Survey of Evolutionary Algorithms for Multi-Objective Optimization Problems With Irregular Pareto Fronts
典型胰岛素瘤1例报道
基于XGBOOST算法的拥堵路段短时交通流量预测
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
一种层次初始的聚类个数自适应的聚类方法研究