戢晓峰,詹换勤,普永明,覃文文
(昆明理工大学,交通工程学院,昆明 650504)
随着我国公路网快速发展,公路穿村镇路段里程不断增加,且其交通量不断增大,导致过境交通与城镇内部交通冲突加剧[1]。调查显示,2017—2019年我国山区公路事故数量占比约85%。因此,山区公路穿村镇路段过境车辆事故防治,成为交通安全领域迫切需解决的现实问题。
过境车辆为本辖区境内道路上行驶的非本(县、市、省)籍车辆,对于驾驶人而言,即属于异地行驶[2]。驾驶员在穿村镇路段行驶,需要根据地形条件和周围环境改变驾驶行为。过境车辆驾驶员相比当地驾驶员,缺少行车经验。有研究表明,驾驶员因素与事故严重程度显著相关。Susana等[3]基于机器学习探讨司机违章行为对交通事故严重程度的影响,发现驾驶员不安全操作行为是交通事故的直接影响因素。乔建刚等[4]分析村镇道路会车与驾驶员心理变化关系发现,驾驶员在会车过程中会明显紧张,且紧张程度受具体道路条件和周围环境影响较大。Delen 等[5]揭示了与交通事故严重程度显著相关的因素有驾驶员年龄、性别、是否酒后驾驶、是否采取安全措施、车辆用途等。
近年来,山区公路交通安全研究逐步成为热点。戢晓峰等[6]构建双变量冲突极值(BTCEV)模型,预测山区双车道公路货车碰撞的发生率。杨文臣等[7]采用部分优势比模型与有序Logit模型对比,尝试揭示山区公路不同类别机动车碰撞事故严重度的形成机理。Ahmed等[8]基于贝叶斯层次模型对山区高速公路段的碰撞频率建模发现,山区高速公路连续长下坡路段、急转弯路段和隧道路段更容易发生碰撞。上述文献主要关注山区高速路段及双车道公路的事故发生机理,未能关注穿村镇路段的安全隐患。与此同时,山区公路穿村镇路段的事故治理问题成为重大现实需求。张铁军等[9]应用负二项模型研究山区公路穿村镇段的事故形态特性发现,交通量、混杂率和道路横坡度影响显著。尹心怡等[10]构建事故推演模型,分析穿村镇路段各类安全设施对事故发生过程产生的影响。然而,山区公路穿村镇路段事故研究多为经验描述,缺少定量研究,且忽略了各因素之间的关联。此外,车辆异地行车普遍增多,过境车辆事故防治成为预防道路交通事故的重要内容。
鉴于此,为解释道路线形、驾驶员属性、车辆类型、事故形态等因素对山区公路穿村镇路段过境车辆事故严重程度的影响。同时,考虑到异地行车对驾驶员的操作考验。本文以典型山区公路穿村镇路段过境车辆事故为研究对象,采用社会网络分析法对事故重要影响因素进行筛选,得到178起过境车辆事故数据,并构建贝叶斯网络模型对过境车辆事故严重程度进行推理分析;分析驾驶员行为联合其他影响因素对事故严重程度的共同影响机制,以期为山区公路事故治理提供理论依据。
本文采集事故数据,使用社会网络分析以及贝叶斯网络探讨影响过境车辆事故严重程度的重要因素。模型构建及分析包含因素筛选、网络结构构建、网络参数学习、结果验证和推理分析这5 个步骤。
为对过境车辆事故贝叶斯网络结构的构建做准备,使用社会网络分析法筛选重要影响因素。社会网络分析在清晰解释复杂事故问题的同时,可获取事故的关键原因。同时,度中心性可衡量节点的中心性,也能反映当前节点与其他节点的联系强度。度中心性值越高,该节点在事故网络中的重要性就越大[11]。因此,选用度中心性值来筛选过境车辆事故的重要影响因素,具体步骤如下。
Step 1 构建共现矩阵。统计数据中的每一行数据为一起具体事故信息,每个字段为储存事故信息的基本单元。当2个字段在同一事故中出现时,视为共现1次,基于此建立字段间的共现矩阵。
Step 2 计算度中心性。将共现矩阵导入Ucinet软件计算度中心性,并按度中心性大小排序。公式为
Step 3 因素筛选。按照度中心性大小选取影响力较大的因素,以便后续网络结构图的构建。
考虑到贝叶斯网络模型具有强大的对不确定问题的处理能力,同时在学习和推理中蕴含了网络节点变量之间的因果关系和条件相关关系,本文采用贝叶斯网络开展过境车辆事故严重程度研究,其学习内容包括结构学习和参数学习。按以下步骤构建贝斯网络模型并进行推理分析。
Step 1 因素分类。结合社会网络分析法筛选因素以及相关文献对过境车辆事故的致因因素进行分类和符号约定。
Step 2 网络结构图构建。依据原始数据及有关特征对事故进行分类汇总,分析各因素与事故类型的相关性与显著性水平,基于SPSS Modeler和专家经验获取因素间的因果关系,确定贝叶斯网络结构图。
Step 3 网络参数学习。基于事故数据,利用Natica软件训练各节点的条件概率;基于训练集和测试集,验证参数学习的有效性。
Step 4 推理分析。利用Natica软件完成贝叶斯网络推理分析。
本文以典型的山区公路——云南省元双二级公路(元谋—牟定段)穿村镇路段作为研究对象,采集获取2012—2017年事故数据。依据车牌归属地筛选过境车辆事故数据,将事故影响因素分为驾驶员行为、车辆类型、道路情况、天气情况和事故形态;将交通事故类型分为财产损失事故和伤人事故。
按照社会网络分析共筛选出15 个影响因素,如表1所示。其中,驾驶员行为分为操作不当、违规行驶、判断失误和未保持安全距离;依据货车车辆相关标准,将车辆类型归类为3 类,即货车(重型货车、中型货车和轻型货车)、客车(中型客车和小型客车)和非机动车;根据原始数据,将天气情况分为阴雨天和晴天;事故形态分为冲出路侧、碰撞和侧翻。对各因素做符号约定,事故数据分类统计如表2所示。
表1 影响因素的度中心性排序Table 1 Degree centrality ranking of influencing factors
表2 事故数据分类统计表Table 2 Statistical table of accident data classification
根据度中心性分析可知,穿村镇路段过境车辆交通事故的基本特征为:事故原因方面,主要为驾驶员操作不当行为;涉事车辆方面,交通事故频发的涉事车辆类型排序依次为客车、货车、非机动车;在事故路段方面,平直路段事故占比更高。
将事故类型作为分析过境车辆事故严重程度的表征指标,基于事故类型分析山区公路穿村镇路段的交通安全影响因素,探究不同影响因素与过境车辆事故类型的相关程度,为构建贝叶斯模型提供支撑。由表3可知,车辆类型、驾驶员行为、道路线形、事故形态和天气情况与事故类型的相关性系数分别是0.329、0.316、0.457、0.236、0.414,且显著性水平均低于0.05,即过境车辆事故严重程度与各影响因素存在相关性,对山区穿村镇路段的交通安全状况存在影响。
表3 各影响因素与事故类型相关性分析Table 3 Correlation analysis between influencing factors and accident types
基于因素筛选结果构建训练集及测试集,并利用SPSS Modeler 软件进行结构学习。在模型构建中选取马尔科夫覆盖作为结构类型,专家设置中采用Pearson 卡方检验进行独立测试,显著性水平设置为0.05,完成具有符合基本逻辑认知有向边的贝叶斯网络结构图。模型中178条事故数据集、80条事故测试集准确率分别为88.76%和87.5%。贝叶斯网络一共包括6个节点和7条边,如图1所示。
图1 贝叶斯网络结构图Fig.1 Bayesian network structure diagram
由于Netica软件具有可便捷定义节点变量、数据训练等优点,本文利用Netica 软件进行参数学习。首先,根据贝叶斯网络结构,构建各节点的因果关系图;再选择训练模块,导入参数学习训练集进行学习,获得各个节点的概率分布,就此完成贝叶斯网络参数学习,具体学习情况如图2所示。同时,基于训练集和测试集,利用Error rate和ROC值验证参数学习准确率。通过Netica软件测试功能,验证参数学习训练集和测试集的Error rate 分别为11.24%、10%,ROC值分别为93.25%、94.82%。
图2 贝叶斯参数学习Table 2 Bayesian parametric learning
Logistic回归模型是一种用于研究事故影响关系、分析事故危险因素及发生概率的方法,因此本文引入该方法与贝叶斯网络方法预测结果进行对比。其中,以事故类型为因变量,15 个因素为自变量,并基于SPSS Modeler 软件搭建Logistic 回归模型。结果显示训练集和测试集准确率分别为84.27%、83.75%。由前文可知,相对于Logistic 回归模型,基于贝叶斯网络构建的推理模型准确率更高。综上说明,贝叶斯网络模型学习效果更好,更能体现事故变量的影响关系,可用来进行穿村镇路段过境车辆事故严重程度推理分析。
由于Netica软件可进行多变量证据推理分析,且具有可视化的优点,故利用其对不同证据变量与驾驶员行为共同作用情况进行推理。基于构建的网络结构图和节点参数学习,输入各节点参数,然后设置各节点状态,便可对过境车辆事故严重程度进行推理分析。例如,将驾驶员行为“DRI”中的证据变量“D1”操作不当和事故形态“ACC”中的证据变量“A1”侧翻的概率同时置为100%,则可观察事故类型的变化,如图3所示。图3 推理结果为不同事故类型的事故率,将高于平均值的结果用*进行标记。为方便推理,主要分析伤人事故率,推理数值越大代表证据变量在该状态时发生的交通事故越严重。
图3 贝叶斯为网络模型推理分析Fig.3 Inference analysis of Bayesian network model
根据推理结果得出事故形态与驾驶员行为对事故类型的影响,如表4所示。
表4 事故形态与驾驶员行为共同作用的推理结果Table 4 Inference result of accident pattern and driver behavior
表4事故形态单一证据变量推理结果显示,伤人事故排序为:侧翻、冲出路侧、碰撞。由表4可以发现,事故形态为侧翻的推理结果大于均值。不同驾驶行为下,各事故形态的推理结果相差较大。在操作不当、违规行驶、未保持安全距离行为下,侧翻的伤人事故推理结果均大于判断失误导致的交通事故,侧翻导致的交通事故比较严重。由于操作不当行为造成侧翻事故而导致伤人事故概率为60.7%;由于违规行驶、未保持安全距离造成侧翻事故而导致伤人事故概率为50%。在判断失误、违规行驶、未保持安全距离行为下,发生冲出路侧事故形态也容易导致伤人事故发生。另外,未保持安全距离容易导致财产损失事故的发生,在此行为下因碰撞导致事故发生概率为77.8%。
根据推理结果,得出车辆类型与驾驶员行为对事故类型的影响,如表5所示。
由推理可知,车辆类型的单一证据变量推理结果排序:非机动车、货车、客车。由表5 可知,货车和非机动车的推理结果均大于平均值。在操作不当和未保持安全距离共同作用下,驾驶货车导致的交通事故较严重。特别要注意的是,在各种不安全驾驶行为下,非机动车伤人事故发生概率均高于均值;在判断失误行为下,涉及非机动车造成伤人事故的概率为58.4%。因此,在事故防治中要重点关注货车和非机动车的车辆类型。
表5 车辆类型与驾驶员行为共同作用的推理结果Table 5 Inference result of vehicle type and driver behavior
根据推理结果得出道路线形与驾驶员行为对事故类型的影响,如表6所示。
表6 道路线形与驾驶员行为共同作用的推理结果Table 6 Inference result of road alignment and driver behavior
由推理可知,不同道路线形的单一证据变量推理结果排序:纵坡路段、弯坡组合路段、平直路段。由表6可知,发生在纵坡路段和弯坡组合路段事故较为严重,平直路段的推理结果最小。平曲路段是事故频发路段,由于不安全驾驶行为,极容易造成财产损失事故。其中,由于未保持安全距离驾驶行为,造成财产损失事故的概率为81.6%。值得注意的是,在纵坡路段行驶时,各类不安全行为都会使得交通事故更加严重。
根据推理结果得出天气情况与驾驶员行为对事故类型的影响,如表7所示。
表7 天气情况与驾驶员行为共同作用的推理结果Table 7 Inference result of weather condition and driver behavior
由推理可知,天气情况的单一证据变量推理结果排序:阴雨天、晴。由表7可知,天气为阴雨天的推理结果大于均值。在操作不当、判断失误、违规行驶、未保持安全距离的驾驶行为下,阴雨天驾驶易导致事故形态更加严重。当天气情况为阴雨天时,由于判断失误造成的伤人事故率为60.5%。
本文以山区公路穿村镇路段过境车辆事故严重程度为研究对象,基于社会网络分析筛选因素,构建了贝叶斯网络模型和Logistic模型。模型比较发现,贝叶斯网络模型的预测效果更好,因此用于本研究。由贝叶斯网络模型推理分析,得出结论如下:
(1)由贝叶斯网络图可知,驾驶员行为、车辆类型、道路线性、天气情况以及事故形态是山区公路穿村镇路段过境车辆事故的关键致因,根据概率大小各致因导致事故类型的严重程度不尽相同。
(2)由于驾驶员违规行驶,当涉及非机动车时,造成伤人事故概率为52.0%;发生侧翻和冲出路侧事故时,造成伤人事故概率均为50.0%;在纵坡路段行驶时,有57.8%的概率造成伤人事故。
(3)由于驾驶员操作不当,当天气情况为阴雨天时,55.6%的概率会造成伤人事故;当涉及货车时,造成伤人事故率为55.5%。
本文系统分析了人、车、路、环境对山区公路穿村镇路段过境车辆事故严重程度的影响,但未能涉及雪、雾等恶劣天气情况,后续研究将尝试分析更多影响因素。