基于因子分析的交通事故影响因素及其机理研究

2024-11-02 00:00:00李洪星张治国
科技创新与应用 2024年31期

摘 要:该研究采用因子分析和聚类分析方法,深入探讨城市交通事故的成因及其影响机理。通过对交通事故数据的细致清洗和信息挖掘,分析事故时间特征及驾驶员特征。研究结果揭示早晚高峰时段事故高发的现象,并指出影响事故的主要因素。此外,还发现中雨天气下事故高发,以及外市车辆在事故中占有一定比例。研究提出针对性的预防措施,如发展公共交通、错峰上下班政策、加强驾照审核和提高驾驶员安全意识等,旨在为交通管理部门提供科学依据,以降低事故发生率。

关键词:交通事故;因子分析;聚类分析;成因分析;预防措施

中图分类号:U491.3 文献标志码:A 文章编号:2095-2945(2024)31-0100-05

Abstract: The study used factor analysis and cluster analysis methods to deeply discuss the causes and impact mechanisms of urban traffic accidents. Through careful cleaning and information mining of traffic accident data, YcpNoyoAibZyrAdH3pzkC1Kk8oudKeqg5J0vA24jBnc=the accident time characteristics and driver characteristics are analyzed. The research results reveal the high incidence of accidents during morning and evening peak hours, and point out the main factors affecting accidents. In addition, it was also found that accidents were high in moderate rain, and vehicles from other cities accounted for a certain proportion of accidzOhNx3Kngy5fzQRRlnBv4dTaMPrIUvrrEyXUtb64Dg0=ents. The study proposes targeted preventive measures, such as developing public transportation, off-peak commuting policies, strengthening driver's license review and improving driver safety awareness, aiming to provide scientific basis for traffic management departments to reduce accident rates.

Keywords: traffic accident; factor analysis; cluster analysis; cause analysis; preventive measures

城市化与机动化进程的快速推进,使得交通事故成为全球性的城市公共安全问题。交通事故不仅威胁着人们的生命财产安全,还对城市的可持续发展构成阻碍。系统地分析交通事故的成因,对于制定有效的交通管理策略、降低事故发生率具有重要的理论和实践意义。

传统的交通事故成因分析方法主要包括统计分析、专家调查、事故调查等。郑来等[1]通过融合T-S模糊故障树和贝叶斯网络对重特大交通事故进行深入分析,确定了操作不当、超速等为主要致因。此外,王俊美等[2]利用数理统计和交叉分析方法,对事故类型、事故天气等因素与交通事故的关系进行了研究。

随着大数据和计算机技术的发展,数据挖掘技术在交通事故成因分析中的应用日益广泛。李虹燕等[3]基于数据挖掘对道路交通事故成因进行了分析,采用多元Logistic回归模型和有序多分类Logistic回归模型,探究了照明条件、能见度等因素的影响。

一些研究开始关注特定类型的交通事故,如王霄等[4]基于关联规则对酒醉驾交通事故进行了成因分析。在山区高速公路这一特殊路段,由冰玉等[5]通过故障树和贝叶斯网方法分析了事故致因因素,并找出了最敏感的事件。

然而,现有大多数研究仍集中于单一因素或特定区域的分析,缺乏对事故成因多维度、系统性的探讨。此外,在事故责任归类和定义上也存在一定的模糊性,这对于事故责任的明确和预防措施的针对性构成了阻碍。

本研究旨在采用更为综合的分析方法,对贵阳市交通事故数据进行深入挖掘。通过因子分析和聚类分析,不仅探索影响交通事故发生的共性因素,还尝试对事故类型进行更为精确的分类。此外,本研究还将考虑驾驶员的社会责任感对事故责任判定的影响,以期为交通事故的预防和干预提供更为科学的依据。

1 统计分析

在本研究中,对贵阳市交通事故数据集进行了细致的数据清洗和信息挖掘,以确保分析的准确性。

1.1 事故时间特征分析

事故数据的时间跨度从2015年1月2日至2015年12月26日,一共包含56 624条记录。按照月份进行统计,结果如图1所示。

由于记录缺失,本研究对2025年3月至11月完整的交通事故数据进行分析。对一周中各天所发生的事故总数进行统计,发现工作日(周一至周五)的平均事故数高于休息日(周六、周日),且周五最高。基于数据发生时刻的统计如图2所示。贵阳市本市早高峰为7:30—9:00,晚高峰为16:30—19:00[6],早晚事故数峰值基本与贵阳市早晚高峰时段相对应。

数据中事故原因包括追尾、逆行、倒车、停车时车辆滑行、开关车门、违反交通信号、未按规定让行,以及依法应负全责的其他情形等,其中,让行引起的事故所占比例最高,达到了40%以上,追尾和倒车引起的事故也分别达到了29%和9%以上。

1.2 驾驶员特征分析

驾驶员特征也是事故成因的重要的因素之一。事故数据中,近92%的事故当事人是男性。男性在追尾、逆行、倒车和让行等方面事故的比例较大,而女性在停车、车门、信号灯或其他事故上的比例较大。

当事人双方的性别组合也有一定的统计规律,当事人双方都是男性时,追尾及让行的事故比例较高,当有女性参与之后比例明显下降,双方女性在这两项事故类型上的比例减少了近7%。图3展示了事故数量与驾驶人年龄分布图,事故主要集中在25~45岁,最年长者为74岁,最年轻者仅为13岁,而法定驾照获取年龄为18岁,因此,对于驾照获取者年龄的审查需要进一步加强。

2 因子分析

2.1 数据特征

首先进行变量的处理,将字符变量赋值,删除缺失数据,变量说明见表1。

首先,将数据标准化,并计算数据集各变量的相关系数及相关系数显著性,结果见表2和表3,可知多个变量间存在显著相关关系。通过因子分析帮助梳理变量间相关关系,整理归纳交通事故的主要影响因子。

2.2 因子分析适合度检验

在相关系数检验的基础之上,进行巴特利球形检验和KMO(Kaiser Meyer Olkin)检验,结果见表4和表5。

巴特利球形检验得到Bartlett's K-squared为45 778.749,在自由度为231时显著拒绝原假设,因此,适合进行因子分析。KMO检验得到进行因子分析适合度为0.539,通过检验,可对该数据集进行因子分析。

2.3 因子提取

本研究采用主成分法进行因子提取。经多种因子提取法求解并对比后,确定合理因子个数为10,主成分法得到地因子提取结果见表6。

为了更好地解释因子的实际意义,本研究采用最大方差旋转法对因子载荷矩阵进行旋转,得到新的因子载荷矩阵,见表7。

得到各因子在不同变量上有不同的荷载。因子1和因子2在涉事驾驶员年龄和驾龄上有较大荷载,因此因子1和因子2反映驾驶员经验因素;同样,因子3和因子4在车辆归属地上有较大荷载,反映道路熟悉程度因素;因子5在车辆颜色上有较大荷载,因子6在天气、晚高峰、夜晚变量上有较大荷载,因子7在工作日、早高峰上有较大荷载,因此,因子5、6、7反映驾驶中能见度、天气、交通等环境因素;因子8和因子9在违章次数和驾照获得类型上有较大荷载,因子10在事故责任上具有较大荷载,这3个因子反映驾驶员社会责任感因素。

综上所述,经过因子分析,可将贵阳交通事故的主要影响因素探索性概括为:①驾驶员经验因素;②道路熟悉程度因素;③驾驶环境因素;④驾驶员社会责任感因素。

3 聚类分析

求得每次事故记录的各因子得分,并使用该因子得分进行聚类分析,剖析不同事故类型的主要影响因素。采用K-mean聚类方法,聚类中心数为9,得到收敛后的聚类中心见表8。

整理因子得分汇总见表9。

从表8、表9可知,类1及类7中,第9类事故的比例极高,而显著因子分别为因子4、因子9、因子10,因此可断定事故类型9的主要影响因素为社会责任感因素。而2、3、4、5、6、8、9聚类中心第7种类型事故(未按规定让行)居多,这些类受驾驶员经验因素、道路熟悉程度因素、驾驶环境因素的影响较大。

4 结论

本文针对贵阳市交通事故数据的影响因素及机理分析得出如下结论。

1)早晚高峰是事故高发时段,追尾事故和未按规定让行而产生的事故较多。据此提出了针对性预防措施:①可通过大力发展公共交通的方式降低早高峰交通事故发生数量;②政府部门应鼓励当地企业单位制定错峰上下班政策。

2)男性和女性在驾驶行为上的差异与其生理心理上的差异有一定的关系,所以,在学习驾照过程中应该尽可能地有针对性学习。

3)相关部门首先需要注重驾照考取的难度与门槛(年龄),让新司机能够得到充分的锻炼,其次对于一定驾龄(4年及8到10年)的驾驶员应提高驾照审核要求。

4)获得驾照的途径说明了驾驶员是否通过了应有的测验,自培取得驾照的驾驶员可能并不能得到系统的练习,在之后实际驾驶过程中存在潜在隐患,因此,相关部门应严格核检驾驶员驾驶证,取消自培驾照。

5)能够针对违章次数较多的情况加大处罚力度,必须让驾驶员有一定的危机意识,这样才能为事故的发生减少隐患。

6)贵阳市交通事故数据中,外市车辆占据相当比例,应在事故高发区域设置警示标志,高峰时设置限行区,可有效减少外市车辆事故发生概率。

7)中雨天气是事故高发的天气类型,在今后的交通管理中需要对此天气类型下的出行车辆提供警示信息,注意交通安全。

8)事故类型缺乏明确的定义和归类,事故责任无法明确,因此,针对交通事故类型的明确定义和归类是追究事故责任、控制事故发生数量中必不可少的环节。

参考文献:

[1] 郑来,顾鹏,卢健.基于T-S模糊故障树和贝叶斯网络的重特大交通事故成因分析[J].交通信息与安全,2021,39(4):39-48.

[2] 王俊美,张超,李晨阳,等.交通事故成因分析[J].黑龙江交通科技,2022(11):153-155.

[3] 李虹燕,朱龙波,任宪通,等.基于数据挖掘的道路交通事故成因分析[J].山东交通学院学报,2023,31(2):20-27.

[4] 王霄.基于关联规则的酒醉驾交通事故成因分析[J].广东公安科技,2021,29(1):44-47.

[5] 由冰玉,廉福绵,孟祥海.基于故障树贝叶斯网的山区高速公路事故成因分析[J].交通信息与安全,2019,37(4):144-151.

[6] 贵阳城区主要道路早高峰车流量将增加20%左右[EB/OL].http://www.gywb.cn/content/2016-02/28/content_4666,616.htm.