基于有序Logit模型的高速公路追尾事故持续时间分析*

2024-03-07 03:01陈喆巫立明杨恒旭温惠英赵胜
公路与汽运 2024年1期
关键词:交通流持续时间车道

陈喆, 巫立明, 杨恒旭, 温惠英, 赵胜

(1.广东联合电子服务股份有限公司, 广东 广州 510075;2.华南理工大学 土木与交通学院, 广东 广州 510640)

高速公路由于车辆运行速度快、交通流量大,存在较大的事故隐患和风险。相关研究显示,高速公路的受伤率、死亡率及百公里事故率是普通公路的3倍以上[1]。高速公路交通事故在造成人民群众生命财产损失的同时,还会导致高速公路交通拥堵甚至路网瘫痪[2]。在高速公路交通事故中,常见的事故类型有追尾、翻车、撞击护栏、货物洒落、侧面碰撞等,追尾作为发生频率最高的高速公路事故类型之一,其处置时间过长,容易造成二次事故的发生,进而导致更大的生命财产损失与通行能力下降。

交通事故发生后,第一时间对其持续时间进行预测评估有利于后续相关救援疏散工作计划制定。近年来,众多学者开展了交通事故持续时间预测研究,形成了两类主要方法,分别为基于人工智能的方法和基于统计的方法。在人工智能学习模型方面,姬杨蓓蓓等采用贝叶斯方法建立决策树预测模型,对交通事故持续时间进行了预测[3];何珂等基于山西省2 115起高速公路隧道交通事故数据,使用主成分分析和随机森林组合模型对隧道交通事故持续时间进行了预测[4];纪柯柯等结合多种文本分类算法,构建V-Fisher有序聚类模型,提升了对交通事故持续时间的预测效果[5];Tang J. J.等基于华盛顿事件系统中2 565起交通事故数据,建立K-Means和XGBoost算法进行了事故持续时间预测[6]。基于人工智能学习模型的事故持续时间预测具有较好的性能,但可解释性较差,且对样本量的要求较高,需要丰富的数据样本及标签。基于统计方法的交通事故持续时间预测模型主要分为概率分布模型、线性回归模型和基于风险的模型。Hou L.等建立非比例风险模型,基于西雅图2 584起高速公路交通事故样本,分析了事件、时间、地理、交通和运营对事件清除时间的时变影响,发现涉及重型卡车、夜间、周末等18个因素对清除时间有显著影响[7];Ding C.等分别针对事故响应时间、清除时间建立二元概率模型和切换回归模型,分析了事故类型、时间、环境等因素的影响[8];夏正丰应用多元回归方法建立了高速公路交通事故持续时间预测模型[9];Zou Y. J.等利用分位数回归方法和Copula模型分析了美国西雅图高速公路交通事故持续时间的影响因素[10];Wali B.等对固定参数回归、随机参数回归与基于分位数回归的事故持续时间模型进行对比,结果显示随机参数模型的预测结果更准确[11]。以往的研究多是基于历史事故数据对高速公路交通事故持续时间进行分析,较少考虑不同事故类型的事故持续时间的差异,且受限于数据采集难度,未充分考虑事故发生前后短时交通流参数变化对高速公路追尾事故持续时间的影响。基于高速公路追尾事故持续时间的有序性,本文将追尾事故持续时间分为3个等级,综合考虑追尾事故信息与事故前后短时交通流运行状况,运用有序Logit模型和边际效应分析高速公路追尾事故持续时间的影响因素,为高速公路交通管理部门制定追尾事故救援及事故后交通疏散方案提供依据。

1 数据描述

研究数据来自广东省高速公路主线ETC(电子不停车收费系统)门架数据及交警记录的交通事故数据,基础数据结构完整、字段齐全,具有良好的精度。通过数据匹配与数据挖掘进一步提取交通流数据与事故信息,其中交通流数据主要字段包括高速公路ETC门架监测的交通流量、交通密度、区间速度等,交通事故数据主要字段包括事故类型、涉事车辆类型、涉事车辆数、事故持续时间、占据车道情况及事故发生地点车道数、上下游路段交通设施布局等。通过对上述交通流数据、事故数据及道路数据进行匹配,得到925起高速公路追尾事故数据及发生前后短时交通流参数,为高速公路追尾事故持续时间分析及预测提供数据基础。

如表1所示,所选数据集中高速公路追尾事故持续时间最大值为721.00 min,最小值为14.00 min,平均值为88.25 min,均方根为107.37 min。其中事故持续时间为50~100 min的追尾事故数量最多,约占全部追尾事故的52%(见图1)。

由于存在多个难以观测的变量影响事故持续时间,准确的追尾事故持续时间往往难以预测。高速公路交通管理部门在进行事故救援及事故后交通疏散时并不需要获知事故准确的持续时间,而是需要根据预测的追尾事故持续时间长短将事故进行分级,以制定不同的事故处置方案。鉴于此,区别以往按照伤亡人数、财产损失对交通事故的分类,依据采集的925起追尾事故持续时间的分布及追尾事故对道路交通的影响,将追尾事故分为轻微追尾事故(事故持续时间小于100 min)、一般追尾事故(事故持续时间为100~200 min)和严重追尾事故(事故持续时间大于200 min)。

表1 高速公路追尾事故持续时间统计

图1 高速公路追尾事故持续时间频数分布

高速公路追尾事故的持续时间与事故发生时间、涉事车辆类型、涉事车辆数、伤亡人数、占据车道情况及交通流状况等密切相关[11]。因此,以追尾事故持续时间的3个等级为因变量,从事故发生时间、涉事车辆类型、伤亡情况、车道情况、事故发生前后交通流运行状况五方面选取12个自变量进行分析,变量定义见表2。

表2 变量编码及描述

续表2

由表2可知:因变量是三分类的有序变量,且持续时间逐渐递增,而自变量中既有连续变量又有分类变量。其中二分类变量为事故发生日期、昼夜划分、时段划分及占据路肩情况,多分类变量是指多于2种选择的变量,将涉事车辆类型划分为仅小车、仅货车、货车与小车、有客车、有特种车五类。事故信息中,涉事车辆数、受伤人数及占据车道数为连续变量。考虑到事故发生前后交通流运行状况可能对事故清理造成影响,将事故发生前后10 min内路段平均速度及到达上游门架的车辆数也作为自变量,探究其对追尾事故持续时间的影响。交通流影响因素中,追尾事故发生前后10 min内路段平均速度及到达事故发生点上游门架的交通量均为连续变量。

2 模型构建

多项Logit模型可视为二元Logit模型的拓展,二者的差异在于,二元Logit模型的被解释变量只有0和1两个取值,而多项Logit模型涉及被解释变量有多个取值的情形。多项Logit模型基于效用理论拟合自变量与包含多个类别的分类变量间的内在关系。假定事故影响因素相互独立,且服从Gumbel分布(Ⅰ类广义极值分布),对于任一交通事故i,事故持续时间等级的效用函数为:

Si,k=βkXi+εi,k(k=1,2,3)

(1)

式中:Xi为事故i对应的影响因素观测值组成的向量;βk为这些因素对应事故持续时间等级k的回归系数组成的向量(包括常数项);εi,k为随机项。

有序Logit模型主要用于处理因变量为有序变量的多分类结果,属于多项Logit模型的拓展[11],在多分类的交通事故等级预测中表现出较好的性能。传统有序Logit模型中,假定解释变量的系数是固定的,高速公路追尾事故持续时间第j个等级的有序Logit模型为:

(2)

式中:Yi为第i起追尾事故的持续时间等级;X为自变量向量;β为回归系数向量;αj为第j追尾事故等级的截距;J为高速公路追尾事故持续时间划分的等级数量。

本文将因变量(追尾事故持续时间)分为3个等级,有序Logit模型为:

(3)

P(Y=2|X)=P(Y≤2|X)-P(Y≤1|X)

(4)

P(Y=3|X)=1-P(Y≤2|X)

(5)

式中:xk为第k个自变量,k=1,2,…,K;βk为第k个自变量的回归系数。

边际效应可用于定量分析不同因素对因变量影响的强弱程度与变化趋势[12],其表达式为:

(6)

3 实例分析

3.1 参数结果分析

以广东省某高速公路2020—2022年925起追尾事故的持续时间为研究对象,考虑到事故持续时间划分等级具有有序性,通过回归分析建立追尾事故持续时间的有序Logit模型。采用统计分析软件Stata16.0进行求解,取显著性水平为0.10,通过最大似然估计法估算得到有序Logit模型的参数结果(见表3)。

由表3可知:1) 受伤人数、占据车道数、追尾事故发生时间为工作日还是节假日、追尾事故发生时间为夜晚还是白天、事故发生后10 min内路段平均速度及涉事车辆类型对高速公路追尾事故持续时间具有显著影响。占据车道数、受伤人数越多及追尾事故发生于节假日和白天都会导致追尾影响交通的持续时间更长。2) 占据车道数、受伤人数每增加一个单位,追尾事故持续时间等级上升的概率分别增加38%和46%,验证了前人的研究成果[13]。节假日发生的追尾事故持续时间等级更高的概率是工作日的1.321倍,白天发生的追尾事故持续时间等级更高的概率是夜晚的1.788倍。3) 相较于涉事车辆类型均为小车,涉事车辆中含有大客车、货车及特种车往往会造成更长的事故持续时间,这点与高速公路交通事故规律相吻合,即有大型车辆参与的交通事故往往伴随着更大的事故影响范围与事故严重程度。而随着追尾事故发生后10 min内路段平均速度的增加,追尾事故持续时间等级更有可能下降,这可能是由于事故发生后上游驾驶员提高行车速度在短时间内驶离事故现场,以减少对现场交通的影响,为事故现场清理及应急救援提供良好条件。

表3 基于有序Logit模型的参数估计

表4为Pearson统计量和Deviance统计量拟合优度检验结果。Pearson和Deviance统计量的p值均大于0.1,表明在显著性水平α=0.10的条件下模型的拟合效果较好。有序Logit模型平行性检验结果原假设是各回归方程互相平行,平行性检验p=0.271>0.10,接受原假设,模型通过平行性检验,可进一步对高速公路追尾事故持续时间的影响因素进行分析。

表4 有序Logit模型的拟合优度检验

分别计算有序多分类Logit模型和无序多分类Logit模型的赤池信息量(Akaike Information Criterion,AIC)和贝叶斯信息量(Bayesian Information criterion,BIC),结果见表5。有序多分类Logit模型的AIC与BIC均低于无序多分类Logit模型,表明有序Logit模型的拟合优度更高。

表5 模型对比

3.2 边际效应分析

结合边际效应对表3中显著的自变量进行参数解释,结果见表6。

表6 边际效应分析

由表6可知:1) 在90%置信水平上,受伤人数每增加1人,追尾事故为一般事故、严重事故的概率分别增加4.8%、1.3%,而轻微追尾事故的概率降低6.1%;占据车道数每增加1条,一般追尾事故、严重追尾事故的概率分别增加5.6%、1.5%,轻微事故概率降低7.1%;事故发生后10 min内路段平均速度每增加一个单位,一般追尾事故与重大追尾事故的概率分别降低0.2%、0.1%。2) 相较于工作日和夜晚,节假日与白天容易发生持续时间更长、严重程度更大的追尾事故。节假日期间一般追尾事故、严重追尾事故的概率分别增加4.1%、1.1%,白天时段一般追尾事故、严重追尾事故的概率分别增加8.6%、2.3%。这是由于节假日和白天高速公路交通量更大,给事故清理与应急救援带来更大干扰,造成更长的事故持续时间。3) 在涉事车辆类型方面,涉事车辆中含有大客车、货车及特种车会增加追尾事故的持续时间。

4 结论

(1) 以广东省某高速公路2020—2022年925起追尾事故为研究对象,从事故发生时间、涉事车辆类型、伤亡情况、车道情况、事故发生前后交通流运行状况5个方面选取12个自变量,以事故持续时间为特征将追尾事故划分为3个等级,并将其作为因变量,分别构建无序多分类Logit模型和有序多分类Logit模型。结果表明,相较于无序多分类Logit模型,有序多分类Logit模型对高速公路追尾事故持续时间的拟合效果更优。

(2) 高速公路追尾事故占据车道数、受伤人数、事故发生时间、事故发生后10 min内路段平均速度及涉事车辆类型对事故持续时间具有显著影响。

(3) 占据车道数和受伤人数越多、追尾事故发生于节假日和白天及涉事车辆中含有大客车、货车及特种车辆会增加追尾事故的持续时间。

(4) 追尾事故持续时间随着事故发生后10 min内路段平均速度的增大而减少,事故发生后10 min内路段平均速度每增加一个单位,一般追尾事故与重大追尾事故的概率分别降低0.2%、0.1%。

猜你喜欢
交通流持续时间车道
北斗+手机实现车道级导航应用
避免跟车闯红灯的地面车道线
浅谈MTC车道改造
交通流随机行为的研究进展
路内停车对交通流延误影响的定量分析
The 15—minute reading challenge
低速ETC/MTC混合式收费车道的设计与实现
基于SVD的电压跌落持续时间检测新方法
具有负压力的Aw-Rascle交通流的Riemann问题
极寒与北极气压变动有关,持续时间不确定