刘强,严修,谢谦,3,解孝民
(1.中山大学,智能工程学院,广东 深圳 518107;2.中山大学-广汽研究院智慧交通与人工智能联合实验室,广州 510006;3.广东省海洋工程施工与水上应急救援工程技术中心,广州 510006;4.广东玛西尔电动科技有限公司,广东 肇庆 523268)
作为交通系统的重要组成部分,城市公交的安全性备受关注。道路公交系统是由人、车、路、环境等多个因素组成的复杂系统,其安全性与多方面因素相关。因此,探究公交安全事故的影响因素对保障公交安全具有重要意义[1]。
国内外学者针对公交安全事故影响因素展开了相关研究[2]。Celik等[3]将公交事故严重程度分为有死亡、受重伤、受轻伤和仅财产损失这4类,采用有序Logit模型分析环境特征和道路特征等因素对加纳公交事故严重程度的影响发现,夜间、交叉口等因素增加了更严重事故发生的概率。Reuben等[4]将公交事故严重程度分为有死亡、受重伤、受轻伤和仅财产损失这4类,采用随机参数模型分析驾驶员特征、环境特征和道路特征等因素对发展中国家公交事故严重程度的影响发现,夜晚和酒驾易导致更严重的事故。顾宏艳等[5]将公交事故严重程度分为致命事故、严重事故和轻伤事故这3 类,采用有序Logit 模型分析驾驶员特征、环境特征和车辆特征等因素对英国公交事故严重程度的影响发现,事故严重程度与是否工作日和白天等因素显著相关。林庆丰等[6]将公交事故分为有人员死亡和无人员死亡,采用二元logistic模型分析驾驶员特征、环境特征和事故特征等因素对广东省公交事故严重程度的影响发现,是否高峰期和路口路段类型对车辆事故严重程度具有显著影响。
综上所述,国内外学者在分析公交事故严重程度的影响因素中取得了丰富成果,发现驾驶员特征、环境特征、道路车辆特征和事故特征等因素对公交事故严重程度具有一定影响。另外,合理的事故严重程度分类是探索其影响因素的重要基础,然而这些研究往往直接根据是否死亡或受伤对事故严重程度进行定性分类,通常分为2类(有死亡和无死亡)[6]、3 类(有死亡、仅受伤和无伤亡)[2]或4 类(有死亡、受重伤、受轻伤和无伤亡)[4,7]。这种定性分类方法未考虑死亡受伤的人数和财产损失数目,显然存在一定局限性。在定性分类基础上寻求更合理、精确的事故严重程度量化和分类方法值得探索。
针对此问题,本文以佛山市2021 年全年的公交事故数据为例,尝试采用事故综合强度评价法量化公交事故严重程度,并运用K-means对事故严重程度进行聚类,以将其进行有序分类。运用有序Logit 回归算法对公交事故严重程度进行建模分析,探究公交事故严重程度的显著影响因素。
基于佛山市某公交企业提供的2021 年全年记录的事故数据,将预处理后的156起事故数据作为本文样本数据。每条事故数据包括公交车驾驶员信息、车辆特征、道路环境特征、事故特征、人员伤亡情况和财产损失情况等信息。
道路公交系统是由人、车、路和环境等多个因素组成的复杂系统,许多方面的因素都可能导致交通事故的发生[8]。根据相关文献研究,结合公交运行特点[9-10],选取环境特征、驾驶员特征、道路车辆特征和事故特征这4 个方面共17 个因素作为自变量。为便于后续Logit 建模,对各变量的不同分类进行赋值,如表1所示。
表1 自变量的定义和赋值Table 1 Definitions of variables
合理的公交事故严重程度分类是探索其影响因素的重要基础。传统四分类方法直接定性地将事故严重程度分为有死亡、有重伤、有轻伤和仅财产损失,存在一定局限性。鉴于此,本文采用交通工程学领域中事故综合强度法定量计算公交事故严重程度,事故综合强度法公式[11]为
式中:V为事故综合强度指标;M为当量死亡人数(人);R为人口数(人);C为当量小汽车数(辆);L为不同道路条件下的修正系数;nd为死亡人数(人);ns为重伤人数(人);nm为轻伤人数(人);e为直接经济损失(万元)。
由于样本数据涉及的事故均发生在佛山市境内,故人口数保持一致,可不予计算;道路修正系数难以准确标定且差距较小,未予以计算,后续应进行改善。部分公交事故的基本情况和事故综合强度计算结果如表2所示。
表2 部分公交事故情况及事故综合强度Table 2 Information of some bus accidents and comprehensive intensity of accidents
基于事故综合强度,运用K-means聚类对事故严重程度进行分类。K-means 聚类算法因其简便高效的特点在聚类领域得到广泛应用。常见的K-means聚类效果评价指标为平均轮廓系数,其计算公式[12]为
式中:a(w) 为样本w与同类别中其他样本的平均距离;b(w)为样本w与它距离最近的不同类别中所有样本的平均距离。
K值(分类簇的数量)是K-means聚类算法的关键参数,其对K-means 的聚类效果有显著影响[12]。为探究合适的K值,分别取K值为3、4、5对事故综合强度进行分类,并计算对应平均轮廓系数,结果如表3所示。3种K值下平均轮廓系数均接近1,表明采用K-means聚类对样本数据分类效果较好;同时K取值为4 和5 时,平均轮廓系数较大且接近。因此,为便于计算,取K值为4。
表3 不同K 值下的STable 3 Value of S under different values of K
K值为4 时的分类结果如图1 所示。由图1 可知,4 类公交事故综合强度的均值、中值和25%~75%范围均具有显著差异且逐渐增大,表明达到了分类目的。
图1 事故严重程度分类Fig.1 Classification of accident severity
事故综合强度+K-means分类结果与传统四分类法结果的对比情况如图2 所示。由图2 可知,事故严重程度为极严重和严重的事故数量差距较小,而事故严重程度为一般严重和不太严重的事故数量差距较大。一方面,人员受轻伤可能不比造成大量财产损失的事故更严重,因此传统方法对一般严重和不太严重的事故分类结果存在较大偏差;另一方面,事故综合强度+K-means分类结果中,严重程度越高的事故数量越少,符合事物的普遍规律。因此,事故综合强度+K-means 分类结果与实际情况更相符。
图2 两种方法分类结果对比Fig.2 Comparison of classification results by two methods
选取合适的Logit回归模型是有效分析公交事故严重程度影响因素的关键[13]。区别于其他Logit模型,有序Logit 模型考虑了因变量的序次特征。在2.2节中,公交车事故严重程度被分为4类,即分类后的公交车事故严重程度具备明显的序次特征。因此,有序Logit 模型适合用来建立公交车事故严重程度模型,分析不同因素对公交车事故严重程度影响情况。有序Logit模型为
式中:xi为第i个影响因素;y为公交事故严重程度;pj为y取值小于等于j的概率;αj为y取值为j的回归常数项;βi为xi的回归系数;β为βi构成的向量;x为xi构成的向量;n为影响因素的个数。
由于选取的影响因素较多,为排除因素之间存在强相关性而对模型准确性造成影响,需对选定的影响因素进行共线性检验[14]。方差膨胀因子VIF是衡量自变量X引起多重共线性程度的常用指标。采用SPSS26 对选取的17 个自变量进行多重共线性检验,结果如表4所示。
表4 多重共线性检验Table 4 Multicollinearity test
研究表明,当VIF 大于等于10 时,认为变量之间存在明显的多重共线性[14]。从表4 结果可以看出,17 个自变量的VIF 均明显小于10,即它们之间不存在多重共线性,均可用作模型的自变量。
分别将事故综合强度+K-means分类法和传统四分类法结果作为因变量进行有序Logit 回归建模,采用SPSS26 对模型求解,并进行平行线检验。检验得到两模型的显著性水平均大于0.05,即符合平行线检验,因此两模型都是有效的。同时,计算得到两模型的拟合优度,结果如表5所示。根据表5可知,两个模型的两种拟合优度检验指标的显著性水平均为1>0.05,故两个回归模型拟合效果较优。而基于事故综合强度+K-means的有序回归模型的Person显著性水平远大于传统四分类法,说明前者具有更高的拟合优度。
表5 模型拟合优度Table 5 Model goodness-of-fit
3.4.1 模型参数估计
两个模型下每个自变量的回归参数结果如表6所示。表6中,显著性水平P值小于0.05时,表示该自变量对公交车事故严重程度具有显著影响;β值为正表明该自变量能增大因变量的值,β值为负表明该自变量能减小因变量的值。
表6 有序Logit回归模型结果Table 6 Results of ordered Logit regression model
将事故综合强度+K-means分类法的结果作为因变量的有序Logit回归结果显示,是否高峰期、是否白天、天气、是否换道、是否超速、是否加速度过大和是否进出站等因素是影响公交事故严重程度的显著因素。而将传统四分类法结果作为因变量的有序Logit回归结果显示,只有高峰、区域和是否超速对公交事故严重程度具有显著影响,其余因素均无显著影响。
根据相关研究结果[1-10],天气、超速和换道行为等因素确实会对事故严重性造成显著影响。按照传统四分类方法的回归结果明显不符这一结论,而采用事故综合强度+K-means 分类方法的回归结果与之相符。因此,进一步验证了事故综合强度+K-means 分类方法的合理性,并且进一步表明基于事故综合强度+K-means 分类法的有序Logit模型具有更好的拟合优度。
3.4.2 模型计算结果验证
为进一步验证有序Logit模型的有效性并直观分析各显著影响因素的特点,统计包含各显著影响因素的事故中严重程度为1、2和3、4事故数量的占比,结果如图3所示。由图3可知,包含高峰、换道、超速、注意力分散和进出站等因素的事故中,严重程度为3、4的事故数量占比远高于50%,表明这些因素确实容易造成严重程度更高的事故。相反,包含白天和晴天因素的事故中,严重程度为3、4的事故数量低于50%,表明晴天和白天会减少严重程度更高的事故发生。因此,统计分析的结果与有序Logit 回归模型结果相一致,进一步验证了采用事故综合强度+K-means法分类结果作为因变量建立有序Logit模型的有效性。
图3 各显著影响因素中两种严重程度事故占比Fig.3 Proportion of accidents of two severities among significant influencing factors
基于3.4 节分析得到的显著影响因素结果,采用STATA16 进一步计算各显著因素对事故严重程度影响的平均边际系数以分析各显著因素对公交事故严重程度的影响程度[15],具体结果如表7所示。
表7 各显著影响因素的边际效应Table 7 Marginal effects of each significant influencing factor
高峰会增大严重程度为3和4的公交车事故的发生概率,增大的概率分别为9.16%和11.57%;高峰期发生的事故中严重程度为3和4的事故占比高达70%。高峰期间,车及行人的流量和密度均显著增加,常发生交通拥堵现象,容易发生更严重的事故。因此,交通管理部门应注意高峰时期的安全管理。
白天会减小严重程度为3和4的公交车事故的发生概率,减小的概率分别为17.65%和22.31%;白天发生的事故中严重程度为3和4的事故占比只有44%。这是因为白天光线充足,驾驶员警惕性高,不易发生严重事故。相反地,夜晚光线不足,驾驶员警惕性不高,同时伴有精神状态欠佳等情况,导致夜晚容易发生更严重的事故。因此,公交车驾驶员夜晚行车时应提高警惕。同时,应加强路灯的建设工作。
晴天会减小严重程度为3和4的公交车事故的发生概率,减小的概率分别为9.77%和12.34%;晴天发生的事故中严重程度为3和4的事故占比只有40%。晴天路面状况良好,不易发生更严重的事故。相反,雨天路面状况较为恶劣,导致夜晚更容易发生严重程度更高的事故。因此,公交车驾驶员雨天行车时应提高警惕。
换道会增大严重程度为3和4的公交车事故的发生概率,增大的概率分别为22.99%和29.06%;换道发生的事故中严重程度为3和4的事故占比高达85%。若公交车有换道行为,会导致被超车车辆反应时间不足,造成严重的事故发生。因此,公交车驾驶员应谨慎选择是否换道,并在换道前仔细观察周围路况。
超速会增大严重程度为3和4的公交车事故的发生概率,增大的概率分别为18.97%和23.98%;超速发生的事故中严重程度为3和4的事故占比高达63%。公交车速度越大,因安全距离不足越易导致事故的发生;同时,速度越快,发生碰撞时公交车包括乘客吸收的能量越大。因此,公交车车速应控制在合理范围内,同时应注意和前车保持足够的安全距离。
加速度过大会增大严重程度为3和4的公交车事故的发生概率,增大的概率分别为13.55%和17.13%;加速度过大发生的事故中严重程度为3和4 的事故占比高达63%。公交车加速度越大,车内乘客越容易受到惯性的作用,故容易出现摔倒的情况,发生事故;同时,加速度过大也容易与其他车辆避让不及而发生严重事故。因此,公交车应控制加速度在合理范围内,注意车内乘客的乘坐安全。
注意力分散会增大严重程度为3和4的公交车事故的发生概率,增大的概率分别为24.50%和30.97%;注意力分散发生的事故中严重程度为3和4 的事故占比高达81%。驾驶员注意力分散,会导致对路况的感知能力以及遇到紧急状况时的反应能力降低,容易发生严重程度更高的事故。因此,公交企业应加强教育驾驶员在驾驶过程中保持高度集中,同时应注意公交班次安排和司机调度的合理性。
进出站会增大严重程度为3和4的公交车事故的发生概率,增大的概率分别为9.71%和12.27%;同时,进出站发生的事故中严重程度为3 和4 的事故占比高达67%。进出站时,公交车会进行制动和加速行为,部分乘客在车厢内行走,故更容易发生严重程度更高的事故。因此,驾驶员进出站时应注意,制动踏板开度和加速踏板开度不宜过大,也应注意车内乘客的安全状态。
本文提出基于事故综合强度+K-means分类法的公交事故严重程度影响因素分析模型。获得的主要结论如下:
(1) 基于事故综合强度+K-means 的公交事故严重程度分类法结果与实际情况更相符;
(2) 基于事故综合强度+K-means 分类法的有序Logit模型具有更好的拟合优度;
(3)高峰期、换道、超速、加速度过大、注意力分散和进出站会增大发生极严重公交车事故的概率,增大的概率分别为11.57%、29.06%、23.98%、17.13%、30.97%和12.27%;
(4)白天和晴天会减小发生极严重公交车事故的概率,减少的概率分别为22.31%和12.34%。