马 柱,陈雨人,张兰芳
(同济大学 道路与交通工程教育部重点实验室,上海 200092)
随着交通量的迅速增长导致交通事故率明显上升,这给交通安全带来了不可估量的影响。研究如何降低交通事故的严重程度是交通安全研究的重要内容。影响交通事故严重程度的因素很多且比较复杂,如何从中筛选出相关性比较大的因素,不仅对降低交通事故的危害程度有重要的意义,而且对道路交通基础设施规划设计,运营管理和驾驶行为研究等方面都有很好的指导作用。
近年来,有很多学者分析了交通事故严重程度与人的特性、道路条件和交通环境的关系,特别是运用Logistic 回归模型分析交通事故严重程度。比如,Kim,等[1]分别用对数线性模型和Logistic模型分析事故类型与交通事故严重程度之间的关系;Ghamdi[2]使用Logistic模型分析了利雅得市事故严重程度影响因素,得到了事故严重程度与事故位置及事故原因间的关系;Yau,等[3-4]利用Logistic模型分别对单车碰撞和多车碰撞事故的影响因素进行了分析。马壮林,等[5-6]用Logistic回归模型分别进行了公路隧道交通事故严重程度影响因素分析和公路交通事故严重程度时空分析;H.Kirolos,等[7]分别使用了Probit模型、二项Logistic模型和多项Logistic模型对三路无信号交叉口和四路无信号交叉口事故严重程度的影响因素进行了分析;S.Kaplan,等[8]采用Logistic模型研究分析了性别、年龄、限速以及驾驶员注意力对公共汽车事故严重程度的影响。
综合以上分析,这些学者对城市道路事故严重程度的影响因素分析比较少。在现有研究中,对城市道路事故影响程度研究中考虑的影响因素也比较少。由于城市道路的情况较为复杂,需要考虑更多因素,需要涉及到更多更复杂的自变量,并且需要把它们有效地筛选出来并组织在一起。因此,笔者将城市道路交通事故分为严重事故和非严重事故后。因变量交通事故严重程度就是一个二元分类变量,根据乌鲁木齐市2006—2010年的3 505条事故资料,初步选择13个候选自变量,通过相关性分析,筛选出合适的自变量,建立与城市交通事故严重程度之间关系,分析各影响因素对交通事故严重程度的影响程度,为降低交通事故严重程度提供支持。
Logistic回归模型, 是国外于20世纪上半叶逐渐发展起来的一类离散选择模型,其在生物学、经济学、心理学、政治学和交通运输等学科中都得到了广泛的应用[8]。
当对数线性模型中的一个二分类变量被当作因变量并定义为一系列自变量的函数时。对数线性模型就变成了Logistic回归模型, 如式(1)。
(1)
事件发生概率P与事件不发生概率(1-P)之比称为事件的发生比(Odds)。将Odds取自然对数就能够得到线性函数,如式(2):
(2)
Logistic回归模型检验主要包括: 回归系数的显著性检验、Logistic回归模型的拟合优度检验和Logistic回归模型的预测准确度检验。
1.2.1 回归系数的显著性检验
由于并不是所有的候选自变量都对因变量有显著的影响。因此,需要挑选出对因变量有显著影响的自变量。目前,常用的自变量筛选方法有正向逐步选择法、反向逐步选择法和混合逐步选择法。
1.2.2 拟合优度检验
Logistic模型拟合优度检验主要有皮尔逊χ2检验、偏差(Deviance) 统计量和信息测量指标。
1.2.3 预测准确度检验
常用评价指标有Gramma,Somers’D,Tau-a,c。
2.1.1 因变量
城市道路事故数据库中的事故类型分为死亡事故、受伤事故和财产损失事故3 类。考虑到事故救援在事故类型中的作用。在文中,将事故严重程度分为严重事故和非严重事故。对死亡事故和有重伤的伤亡事故认为是严重事故,而轻伤事故和财产损失事故认为是非严重事故,编码如表1。
表1 因变量编码 Table 1 Description of dependent variable
2.1.2 自变量
道路交通系统是一个由人、车、路、环境构成的动态系统。任何一个环节出现问题都可能产生交通安全问题。在交通事故分析中,因责任认定问题,常将事故原因归为人的主观因素,而忽视了客观因素在交通事故中的作用[6]。因此,笔者从客观因素中初步选取13个候选自变量参与分析与交通事故的严重程度之间的关系,分别为:是否为节假日、天气、道路横断面、能见度、交通信号方式、照明条件、道路类型、道路线形、路口路段类型、道路物理隔离、路侧防护设施类型、道路横断面和道路横断面位置等。其中天气、能见度、照明条件、道路类型采用哑变量方式。对分类变量进行编码如表2、表3。表2、表3中“*”表示通过通过混合逐步选择法得出的对事故严重程度具有显著影响的自变量。
表2 自变量编码 Table 2 Description of independent variable
表3 分类哑变量编码
Table 3 Description of dummy variable
2.2.1 变量选择
混合逐步选择法是将正向选择和反向选择结合起来,根据所设的显著性标准分别将变量加入到模型中去或删除掉。笔者采用混合逐步选择法对自变量进行筛选得出在0.05的显著性水平下的自变量有:天气、道路线形、能见度、路侧防护、道路横断面、地形、横断面位置、道路类型。
2.2.2 参数估计
对乌鲁木齐市2006—2010年的3 505条事故数据进行分析,得出拟合结果如表4。
表4 方程中的变量 Table 4 Variables in the equation
从表4 可知:
1)在不同的天气下,阴天发生严重事故的概率最大,为恶劣天气的1.049倍,相差不大,而晴天发生严重事故的概率只有恶劣天气的0.676。说明良好天气下发生严重事故的概率比较低。
2)丘陵和山区发生严重事故的概率非常低,只有平原地带的0.262。
3)分车、分向的道路横断面发生严重事故的概率反而比混合式横断面高,是其的1.564倍。因为的道路横断面下,路况比较复杂,驾驶员的安全意识比较高。
4)其他道路上发生严重事故是平直道路的2.378倍。说明道路线形对事故的严重程度影响非常大。
5)快速路、主干路和次干路上发生严重事故的概率相对于其他道路要小很多,分别只有其他道路的0.483,0.377和0.443。这主要是因为这些道路整体车速比较低。
6)机动车道发生严重事故的概率是其他位置的1.385倍。在分车道的情况下,机动车间的事故要明显严重很多,这和其他位置的车速较低有很大关系。
7)能见度在50~100 m范围类时,发生严重事故的概率最高,是见度在200 m以上情况下的2.204倍。这和驾驶员的安全意识有很大关系。
8)有路侧防护的情况下发生严重事故的概率高,是没有路侧防护的1.497倍。
由Logistic回归系数的显著性检验结果可知:当天气情况不佳,且能见度在50~100 m时,发生严重事故的概率最高。在这种情况下,应该及时通过电视广播等媒体发布恶劣天气注意行车安全的警示信息,以提高驾驶员的注意力。而在平原地带、分车分向式道路横断面、城市公路、机动车道位置时发生严重事故的概率比较高的原因是这些地方行驶条件较好,平均车速相对较高甚至出现超速违法驾驶行为;对于这些路段有条件应安装电子警察、雷达测速等设备。平直道路的发生严重事故的概率最低,因而在规划设计阶段应该尽量使用平直道路线形,在线形不好的地方设置警示标志。路侧防护与事故严重程度也有很大的相关性,因而在必须设置路侧防护的地方应该考虑到路侧防护对事故发生后的影响,在材料和路侧防护的类型方面都需要考虑。
2.2.3 模型检验
模型整体拟合程度见表5。由LR、Score、Wald统计量值及P值可以看出在0.05的显著性水平下模型的整体拟合效果比较好,自变量的解释作用显著。Deviance统计量和χ2统计量见表6。
表5 模型整体拟合程度参数 Table 5 Model fitness coefficients
表6 拟合优度检验 Table 6 Test of goodness-of-fit
从表6可以看出,Deviance 统计量、皮尔逊χ2统计量的P值均大于0.05,所以在显著性水平A= 0.05 的条件下,χ2检验不显著, 认为模型拟合数据比较好。
表7 是信息测量指标的拟合优度检验的结果。从表7可以看出,加上变量的模型较优。
表7 信息测量指标 Table 7 Information measures index
表8是序次相关指标的准确度检验结果。从表8 可以看出,本研究有71.3%的数据对为和谐的, 有21.9% 为不和谐的。除了Tau-a指标外, 其余3个指标值都不小于0.5。说明建立的Logistic模型的预测能力较好。
表8 预测准确度检验
Table 8 Test of forecasting accuracy
1)交通事故的发生是人-车-路-环境相互作用的结果,但主观因素很大程度上受到了客观因素的影响。将事故严重程度分成严重事故和非严重事故,在客观因素方面选取了是否为节假日、天气、道路横断面、能见度、交通信号方式、照明条件、道路类型、道路线形、路口路段类型、道路物理隔离、路侧防护设施类型、道路横断面和道路横断面位置13个自变量,分析自变量与因变量之间的关系。Logistic模型在处理二分类变量与其他变量之间的关系上具有很大的优势。
2)采用混合逐步选择法分析候选自变量与因变量是否显著相关。研究发现,天气、道路线形、能见度、路侧防护、道路横断面、地形、横断面位置、道路类型与事故严重程度显著相关,而是否为节假日,交通信号方式、路口路段类型、道路物理隔离与事故严重程度的相关性不大。
3)采用Logistic回归模型,分析各自变量与事故严重程度的影响程度并对模型进行了检验。结果表明,Logistic 回归模型的拟合效果和预测能力还是比较好的。
4) Logistic回归模型结果表明,在不同的天气下,晴天发生严重事故的概率明显小很多,同样,能见度在200 m以上发生严重事故的概率最低,说明事故的严重程度与视线有很大的关系,视线越好,发生严重事故的概率越低。丘陵和山区发生严重事故的概率非常低,分车、分向的道路横断面发生严重事故的概率反而比混合式横断面高,表明在驾驶条件差的地方,发生严重事故的可能性反而比较低,说明这些地方驾驶员的安全意识起了主导作用。平直道路发生严重事故的概率比较低。而其他道路发生严重事故的概率明显比城市快速路、主次干路高。同样,机动车道发生严重事故的概率最高,有路侧防护的情况下发生严重事故的概率最高。研究分析结果可以为道路交通基础设施规划设计,运营管理和驾驶行为研究以及事故救援等提供很好的指导作用,并为提高城市道路交通系统安全性能提供决策依据。
5)笔者假设自变量对因变量是线性的、可加的,但是,很有可能存在非线性和非加性作用。鉴于调研条件所限,没有将车速、交通流量等引入自变量,这是今后需要研究的重要方向之一。
[1] Kim K,Nitz L,Richardson J,et al.Analyzing the relationship between crash types and injury severity in motor vehicle collisions in Hawaii [J].Transportation Research Record, 1994,1467:9-13.
[2] Al-Ghamdi A S.Using logistic regression to estimate the influence of accident factors on accident severity [J].Accident Analysis & Prevention,2002,34(6):729-741.
[3] Kelvin K W Y.Risk factors affecting the severity of single vehicle traffic accidents in Hong Kong [J].Accident Analysis and Prevention.2004,36 (3):333-340.
[4] Kelvin K W Y,Lo H P,Sherrice H H F.Multiple-vehicle traffic accidents in Hong Kong [J].Accident Analysis and Prevention,2006,38(6):1157-1161.
[5] 马壮林,邵春福,李霞.基于Logistic模型的公路隧道交通事故严重程度的影响因素[J].吉林大学学报:工学版,2010,40(2):423-426.Ma Zhuanglin,Shao Chunfu,Li Xia.Analysis of factors affecting accident severity in highway tunnels based on logistic model [J].Journal of Jilin University: Engineering and Technology,2010, 40(2):423-426.
[6] 马壮林,邵春福.基于累积Logistic模型的交通事故严重程度时空分析[J].中国安全科学学报,2011,21(9):94-99.Ma Zhuanglin,Shao Chunfu.Temporal-spatial analysis model of traffic accident severity based on cumulative Logistic model [J].China Safety Science Journal,2011,21(9):94-99. [7] Kirolos H,Abdel-Aty M.Examining traffic crash injury severity at un-signalized intersections [J].Journal of Safety Research,2010,41(4):347-357.
[8] Kaplan S,Prato C G.Risk factors associated with bus accident severity in the United States:A generalized ordered logit model [J].Journal of Safety Research,2012,43:171-180.
[9] 王济川,郭志刚.Logistic 回归模型—方法与应用[M].北京:高等教育出版社,2001.Wang Jichuan,Guo Zhigang.Logistic Regression Model-Methods and Applications [M].Beijing:Higher Education Press,2001.