基于Ordinal Logistic模型的事故严重性影响因素分析
——以翻车事故为例

2018-04-13 08:52:36闫章存卢小钊张敏捷胡万欣
关键词:严重性安全带交通事故

胡 骥,闫章存,卢小钊,王 鹏,张敏捷,胡万欣

(1.西南交通大学 交通运输与物流学院,四川 成都 610031; 2.建筑与交通工程学院 宁波工程学院,浙江 宁波 315211; 3.武汉铁路职业技术学院,湖北 武汉 430205)

0 引 言

随着我国社会经济的发展,生活质量的改善,人们对小汽车的依赖度越来越高,交通事故却频频发生。近年事故总量虽有所下降,但因事故所造成的损失仍居高不下。为了有效预防交通事故减少人员伤亡和财产损失,需要准确的把握事故原因,从而因地制宜做好事故预防措施。因此,有必要对影响事故严重性的因素进行科学的分析。

由于交通事故是在交通活动中由人、车、路、环境等因素相互耦合失调导致的不幸事件,事故类型千变万化,原因错综复杂,很难用一个固定的模式或者方程来精确解释,目前较为常用的是基于计量经济学模型、统计分析模型、事故树法、因果分析法等分析手段。例如,F. H. AMUNDSEN等[1]对挪威公路隧道交通事故进行研究,利用因果分析法分析隧道长度、天气、交通量以及公路条件等因素对事故严重性、事故发生位置的影响关系;M. W. KNUIMAN等[2]研究美国伊利诺斯州和犹他州道路中央隔离线与碰撞率之间的关系,并发现当中央隔离线较宽时车辆正面碰撞、刮擦以及单车事故率都会下降;J. K. KIM等[3]依据事故死亡人数将交通事故严重程度分为4个级别,建立预测事故态势的多项Logistic模型;C. LEE等[4]依据事故死亡人数将交通事故严重程度分为5个级别,建立了分析影响严重程度要素的有序响应模型。国内这方面的研究相对较少,宗芳等[5]应用Ordered Probit模型分析受伤人数的影响因素,计算各影响因素的边际贡献,并进行了受伤人数的预测;马壮林等[6]对京珠高速公路韶关段4个隧道的交通事故数据,利用Logistic模型分析事故发生时段、碰撞类型、天气等因素对事故严重性的影响,经检验表明Logistic模型在事故严重性影响因素分析中具有较好的适应性和实用性;李世民等[7]调查北京周边无信号三路交叉口交通事故数据,并建立Logistic模型分析,得出交叉口转弯车辆比例、控制方式和土地开发强度对无信号三路交叉口交通事故的严重性有显著影响。

1 模型选择

一般认为交通事故的严重程度存在顺序的内涵特性,且严重程度与事故变量之间关系是非线性的,简单的使用多项式Logit模型并不能准确的分析交通严重程度的影响因素。对于存在一定次序的变量分析通常选用Ordinal Logistic和Ordinal Probit模型,它们是基于连续的、分类的变量的分析模型,且可以利用相关因素来预测可能性的模型。笔者选用Ordinal Logistic模型,建立翻车事故严重性顺序值的回归模型,分析各个因素对事故严重性影响的程度,力图提高影响翻车事故严重程度的因素分析的准确度。

2 建立模型

2.1 Ordinal Logistic 模型

(1)

式中:τ={γ0,γ1,…,γj,…,γJ}表示被解释变量(严重程度)分界点的向量,且(γ0<γ1…<γj…<γJ,γ0=-∞,γJ=+∞)。

模型中被解释变量(因变量)的观测值y表示排序结果或分类的结果,解释变量(自变量)X是影响解释变量排序的各种因素,也可以是多个解释变量的集合。Ordinal Logistic模型的一般形式为

(2)

B={β0,β1,…,βk,…,βK}

Logistic模型中假设εi的概率密度函数为f(εi),累积分布函数为F(εi),Eεi=0由式(1)和式(2)可得到第i个观测对象的严重性为j的概率为

(3)

当εi有一个标准的逻辑分布[i.e.,f(εi)=eεi/(1+eεi)2,F(εi)=eεi/(1+eεi),Var(εi)=π2/3] 时,严重性“j(或者更低)”相对于“高于j”概率的比值可以表示为

(4)

从式(4)可以看出某一具体变量Xk改变一个单位对严重程度所产生的数量化影响,可以通过概率比exp(-βk)来表示。

2.2 参数估计

(5)

这里是指标函数δyi=jXi,B,Γ等于0或1,通过式(5)的最大化给参数估计值:

3 模型解释变量筛选方法

常用筛选变量的方法包括向后删除变量法、向前删除变量法和逐步回归法3种,这3种方法在估计标准误差和通过判定P值是否合理来删除临界变量方面有优越性,更为重要的是在分析的过程中不用考虑变量的独立性。一般要求选入变量的显著性检验水平αs小于或等于变量删除的显著性水平αe,实际应用中常取αs=αe,αe常取值0.05。

相比这3种方法而言,K. P. BURNHAM等[8]提出一个更好的方法:通过使用统计学方法比较由相同数据所建立的不同模型的结果、合理性、拟合优度来进行模型拟合优良性的衡量标准。常用的统计参数有赤池信息准则[9]AIC(the Akaike information criterion)和贝叶斯信息准则BIC(Bayesian information criterion)。AIC指标在对数似然值的基础上,考虑统计模型中的解释变量个数。AIC的定义式为

AIC=2K-2lnL

(6)

式中:K为模型需要估计的总体参数(包括截距项和解释变量)个数;L为极大似然值。

由于K越小模型约简洁,而且对数似然值越大模型约精确,因此模型的AIC越小越好。

BIC指标也是建立在对数似然值的基础之上,且与AIC指标密切相关,同时BIC对自由变量的惩罚效果更加明显。BIC的定义式为

BIC=AIC+K·(lnN-2)

(7)

式中:N为样本大小;其他参数同上。

BIC信息准则对解释模型有较好的简约性,即当其他参数相等时,对于两个似然估计值相等的模型,BIC较小的模型被认为是更好的。

然而,在自由变量数量相对样本的规模较多时,信息准则的惩罚效果不是很好。对这一问题N. SUGIURA[10]提出了一个被广泛应用于小样本的精确指标AICC,其表达式为

(8)

式中:参数同上。

因此模型中的AIC值、BIC值及AICC值越小表示模型越接近真实模型。

4 回归模型评价与参数检验

对于所建立模型优劣的评估,需要对模型进行平行线假设的检验和似然比检验。

1) Ordinal Logistic模型平行线假设检验[11-13]:在累积概率的j-1个有序多分类的Logistic模型中仅有临界点γj变化外,而回归系数保持不变,称之为平行线假设。同时不同等级的解释变量的效应始终一致,不会随着等级的改变而不同,因此平行线假设又称比例优势假设(proportional odds assumption)。例如一个4分类有序结果变量可以表示成如下的3个方程[11]:

(9)

假设只有一个解释变量的情形,图1表示其概率曲线。

图1 累积概率曲线Fig. 1 Cumulative probability curve

由于平行线假设3个方程回归系数保持不变,因此图1中的3条曲线形状相同,仅仅因为临界点yi的不同而导致了曲线向右或向左平行移动。

2) Ordinal Logistic模型似然比检验[15]。对事故的严重程度分类后,需要对Ordinal Logistic回归模型的“比例性”假设条件进行检验,通过该假设条件检验建立模型的拟合是否可靠。

Ordinal Logistic模型“比例性”假设条件需通过构造统计量G并采取χ2检验计算公式为

G=-2(lnLP1-lnLP2)

(10)

式中:LP1为模型P1的对数似然值;LP2为模型P2的对数似然值,模型P1和模型P2是所得到的不同严重程度的Ordinal Logistic回归模型。

通常显著性水平低于0.05,说明χ2值统计性不够显著,表明Ordinal Logistic回归模型是适用的,符合“比例性”的要求。

5 案例分析

5.1 变量说明

考虑到数据获取的方便与质量,笔者选用美国HSIS(Highway Safety Information System)中北卡罗莱纳州2010—2014年的交通事故数据,选择乡镇两车道公路上的翻车事故数据作为研究对象。参考相关翻车事故分析的文献结合实际经验选择出13个变量作为讨论变量,其中包括驾驶员、道路、环境3个类型的变量,具体如表1。根据所需变量的特征在数据库中进行数据整合与筛选,最终选择出385个满足要求的完整事故样本。

表1 翻车事故严重程度的影响因素和变量设置Table 1 Influence factors of rollover accident severity and variables setting

5.2 模型的建立与检验分析

利用SAS软件进行Ordinal Logistic回归处理,并得到相关的估计参数和检验系数,采用向后删除变量法剔除影响相对较小的变量,逐步处理并得到最后的结果,如表2。

模型A-1包含是否使用安全带这一变量的p值小于0.000 1,并且在后面的6个模型中一致,可以判断驾驶员是否系安全带这一因素对翻车事故的严重性具有重大影响。然而在该模型中驾驶员的身体状况变量的p值(0.616 2)和变量驾驶员性别的p值(0.573 1)相对较大,且现实中两者对交通事故的严重程度的影响也相对较小,因此在模型A-2中将其排除。在模型A-3中驾驶员酒精浓度、驾驶员年龄、安全带、路面状况、光照条件、道路线形、地形、限速等8个变量的置信度在90%的水平,只有AADT、路面宽度两个变量的p值大于0.1。经过进一步的变量排除过程可以得到所有变量置信度均大于90%的模型A-4。且模型A-1到模型A-4,AIC、BIC和AICC值也在降低,这说明模型的简约性在不断地提高。

在模型A-5中的由于地形变量和道路线形变量具有一定的相关性,因此分别选择其中一个进入最终的模型。对比结果发现变量“地形”进入模型时,模型AIC值为690.838、BIC值为710.604,均大于变量“道路线形”进入模型分析所得的结果,并且所得模型中所有变量的置信度均在95%水平。同时模型评估参数BIC值也在减小,因此确定A-6为最终模型。A-6的表达式如下:

(11)

(12)

式中:P1表示轻微事故,P2表示严重事故,P3表示恶性事故;x1表示安全措施,这里主要分析事故发生时是否系安全带(系安全带其值为0,未系安全带其值为1);x2表示发生事故时的道路路面状况(路面干燥其值为0,路面有结冰、雨水、碎石其值为1);x3表示事故地点的道路线形(直线线形其值为0,曲线线形其值为1)。

解方程得发生预测概率为

(13)

(14)

(15)

P1+P2+P3=1

(16)

对模型A-5的平行线假设进行得分检验得(p=0.115 1,df=3),验证了原假设累积Ordinal Logistic是平行的。由此可得:模型A-5非常适合这一数据;同时似然比检验得(p<0.0001,df=3),显著性水平为0.000 1,远低于0.05水平,统计性显著,原假设目标是被拒绝的,说明模型A-5中的变量对翻车事故严重程度具有实质性的影响。

根据显著变量估计效应检验所得的结果可以看出,使用安全带和不使用安全带的比值比为exp(1.520 6)=4.575,这一结果说明相同的环境下驾驶员不使用安全带的事故严重程度比使用安全带的事故严重程度将会增加357.5%,即表明在翻车事故发生时不使用安全带将会造成非常严重的后果。同理分析可得:发生翻车事故时,良好的路面环境对事故的严重程度,相比恶劣的路面环境所产生的影响较少55%;不良道路线形对翻车事故的严重程度比良好的道路线形对翻车事故的严重程度的影响相比增加76.4%。

6 结 论

通过以上研究,形成以下主要结论:

1) 采用Ordinal Logistic模型对翻车事故的严重程度进行分析,以事故的严重程度作为因变量,选取驾驶员特性、道路特性、环境特性3个方面的13个因素作为自变量。研究过程中采用美国一州的交通事故,筛选出385个满足条件的样本数据,建立了影响翻车事故严重程度要素分析的逻辑模型。

2) 利用最大似然估计法对模型参数进行估计;运用AIC、BIC、AICC以及对数似然估计进行模型变量的精简;同时运用比例优势假设和似然比检验以及比值比效应检验的方法对模型做了检验,得到符合检验假设条件的最优模型。该模型中包含3个显著变量,且置信度水平为95%。

3) 通过笔者分析确定影响翻车事故严重程度的主要因素为安全带的使用、路面状况及道路线形,且3者中变量“安全带”在模型简化的过程中其p值一直小于0.000 1。其对翻车事故严重程度具有最为明显的影响,很好的印证了安全带的重要性。

总体而言,笔者提出的翻车事故分析模型能够较为准确的反映翻车事故严重程度,但对于模型中变量的独立性尚未进行完整的检验。在将来有必要深入分析变量之间的独立性检验,进一步完善模型。

参考文献(References):

[1]AMUNDSEN F H,RANES G.Studies on traffic accidents in Norwegian road tunnel[J].TunnellingandUndergroundSpaceTechnology,2000,15(1):3-11.

[2]KNUIMAN M W,COUNCIL F M,REINFURT D W.AssociationofMedianWidthandHighwayAccidentRates[R].Washington,D. C.:Transportation Research Record,1993.

[3]KIM J K,KIM S,ULFARSSON G F,et al.Bicyclist injury severities in bicycle motor vehicle accidents[J].AccidentAnalysis&Prevention,2007,39(2):238- 251.

[4]LEE C,ABDEL-ATY M.Comprehensive analysis of vehicle pedestrian crashes at intersections in Florida[J].AccidentAnalysisandPrevention,2005,37(4):775-786.

[5]宗芳,许洪国,张慧永.基于Ordered Probit模型的交通事故受伤人数预测[J].华南理工大学学报(自然科学版),2012,40(7):41-45.

ZONG Fang,XU Hongguo,ZHANG Huiyong.Forecast injury number due to traffic accident based on Ordered Probit model[J].SouthChinaUniversityofTechnology(NaturalScienceEdition),2012,40(7):41-45.

[6]马壮林,邵春福,李霞.基于Logistic模型的公路隧道交通事故严重程度的影响因素[J].吉林大学学报(工学版),2010,40(2):423-426.

MA Zhuanglin,SHAO Chunfu,LI Xia.Analysis of factors affecting accident severity in highway tunnelsbased on logistic model[J].JournalofJilinUniversity(EngineeringandTechnologyEdition),2010,40(2):423-426.

[7]李世民,孙明玲,关宏志.基于累积Logistic模型的交通事故严重程度预测模型[J].交通标准化,2009(3):168-171.

LI Shimin,SUN Mingling,GUAN Hongzhi.Prediction model cumulative logistic for severity of road traffic accident[J].TransportStandardization,2009(3):168-171.

[8]BURNHAM K P,ANDERSON D R.ModelSelectionandMultimodelInference[M].New York:Springer,2002.

[9]AKAIKE H.Information theory and an extension of the maximum likehood principle[J].InternationalSymposiumonInformationTheory,1973,1:610-624.

[10]SUGIURA N.Further analysis of the data by Akaike’s information criterion of model fitting[J].CommunicationinStatistics-TheoryandMethods,1978,7(1):13-26.

[11]赵晋芳,范月玲,曾平,等.多分类有序logit模型资料平行线假设及检验方法[J].中国卫生统计,2009,26(1):11-13.

ZHAO Jinfang,FAN Yueling,ZENG Ping,et al.The parallel line assumption of ordinal logit regression model and its test the department of health statistics[J].ChineseHealthStatistics,2009,26(1):11-13.

[12]REES H.RegressionModelsforCategoricalandLimitedDependentVariables[M].3rd ed.Texas:StataCorp LP,2014.

[13]MCCULLAGH P.Regression models for ordinal data[J].JournaloftheRoyalStatisticalSociety,1980,42(2):109-142.

[14] WOLFE R,COULD W.AnApproximateLikelihood-RatioTestforOrdinalResponseModels[M].Texas:StataCorp LP,1998.

[15] 刘梦涵,于雷,张雪莲,等.基于累积Logistic 回归道路交通拥堵强度评价模型[J].北京交通大学学报,2008,32(6):52-56.

LIU Menghan,YU Lei,ZHANG Xuelian,et al.Cumulative logistic regression-based measurement models of road traffic congestion intensity[J].JournalofBeijingJiaotongUniversity,2008,32(6):52-56.

猜你喜欢
严重性安全带交通事故
严重性
不同寻常的交通事故
预防交通事故
能救命的安全带和安全气囊
浅谈无线电干扰及其常用的预防、排查方法
Let’s Go for a Ride
最甜蜜的安全带
一起高速交通事故院前急救工作实践与探讨
安全带测试装置
汽车文摘(2015年11期)2015-12-02 03:02:52
血清及滑液中CCL13的水平与膝关节骨关节炎放射学之间的关系