胡宗品,骆仁佳,于淑君
(合肥工业大学 汽车与交通工程学院,合肥 230009)
城市作为人流、物流、车流的汇聚中心,交通主体密集多样、交通环境复杂多变、交通冲突高度集中[1]。伴随着近年来中国城镇化的快速发展,城市道路交通事故死亡人数逐年上升,年均增长率高达5.6%,上升比例高于户籍人口的城镇化率,一定程度上反映了城市道路交通安全风险的增大趋势[2]。城市道路交通事故频发,严重威胁着人们的生命财产安全[3],因此,有必要对城市死亡交通事故开展针对性研究,以提升城市道路交通安全。
研究表明,不同形态交通事故的发生机理和影响因素具有显著差别,识别风险因素对事故的影响有利于深入理解不同形态事故的发生机制[4]。Chen等[5]通过分别构建二项和多项Logit模型,分析道路、车辆等因素对中国特大道路交通事故形态的影响;Christoforou等[6]基于高速公路实时交通数据,采用多项Probit模型分析天气、能见度、时间等因素对交通事故形态的影响;Ghazizadeh等[7]通过多项Logit模型,对驾驶员分心行为下的交通事故形态进行预测;Polders等[8]基于多项Logit模型,分析交叉口位置与事故形态的关系。相较于多项Probit模型,多项Logit因计算简单,在交通事故形态影响因素分析中得到广泛应用。然而,由于多项Logit存在无关选择独立性假设(IIA)限制,这种假设不同事故形态间干扰相互独立的情形在真实情况下并非总是存在[9]。为降低IIA的限制,Ardakani等[10]基于嵌套Logit模型分析不同分心行为对事故形态的影响。嵌套Logit模型的本质是将多层Logit模型嵌套在一起,一定程度上克服了IIA的限制[11],通常比多项Logit模型具有更好的拟合优度[12]。
然而,由于个人偏好的差异,即使在相同或相似的情况下,不同驾驶员也可能导致不同类型的交通事故,即事故数据的异质性[13]。上述多项Logit、Probit和嵌套Logit模型参数均为固定值,难以反映交通事故数据的异质性[14]。忽略这种未观测到的异质性,常导致有偏差的参数估计和错误的交通安全推论[15-16]。研究表明,在模型中考虑未观察到的异质性可以使模型在统计学上更为优越[17-18]。在考虑未观察到异质性的各种离散选择模型[19-20]中(随机效应Logit、混合Logit、潜在类Logit等模型),混合Logit模型通过允许变量的影响在个体间变化,既完全克服了IIA假设的限制,又能够刻画参数效应中未观测到的异质性,在以往交通事故严重度影响因素分析中得到广泛应用,并取得良好效果[21-22]。然而,基于混合Logit模型探讨事故形态影响因素分析的研究仍较为匮乏。
综上,离散选择模型虽已被广泛应用于交通事故形态的影响因素分析,但现有研究多采用固定参数离散选择模型,无法反映参数效应中未观测到的异质性影响。文中以深圳市2014—2016年死亡交通事故数据为例,创新性地采用能够刻画数据异质性的混合Logit模型,并基于弹性分析,讨论各影响因素对交通事故形态概率的影响。研究结果有利于深入理解城市死亡交通事故中不同事故形态的发生机理,为提升城市交通安全提供参考依据。
深圳市死亡交通事故数据由道路交通安全研究信息共享平台提供。因事故数据中包含深圳市2014—2016年各种事故严重度的道路交通事故,为提取死亡交通事故数据,首先,依据事故编号从原始数据中筛选出至少1人死亡的交通事故。其次,依据事故责任认定,提取交通事故责任驾驶人的人员和车辆信息,当机动车与非机动车承担同等责任时,将机动车驾驶员作作为事故责任人。再次,根据事故编号提取交通事故发生地的道路和环境信息。最后,根据事故发生时间,得到可能影响事故形态的时间特征。
剔除部分数据不全的事故案例,得到1 110起死亡事故数据。交通事故形态是指事故发生的具体情形,由现场勘查确定,通常被划分为车辆间事故、车辆与行人事故和单车事故三类。常见的车辆间事故包含正碰、侧碰、追尾等形式,车辆与行人事故多为刮撞行人或碾压行人,单车事故则多为侧翻、坠车、失火、撞击固定物等形式。从事故责任驾驶员、车辆、道路、环境、时间5类特征中选取了18个潜在影响事故形态的自变量,其中车辆类型是指事故责任驾驶人的交通方式,具体可分为载货汽车、载客汽车和摩托车。变量分类如表1所示。
表1 自变量分类
混合Logit模型是多项Logit模型的拓展,两模型都是基于效用最大化原则推导出来的离散选择模型。在多项Logit模型中,变量系数为固定值,对于一起特定的交通事故n,其事故形态为i的效用函数可表示为[23]
Uin=βinxin+εin
(1)
式中:βin为当事故n的事故形态为i时参数向量,xin为当事故n的事故形态为i时自变量向量,εin为服从1型极值分布的随机误差。
基于效用最大化原则,对于交通事故n,其事故形态为i的概率Pn(i)可表示为[24]
(2)
不同于多项logit模型,在混合logit模型中,βi可被设定为服从某种概率分布的随机参数,随机参数的概率密度函数为f(βi|φ),其中φ为密度函数的参数向量(包含均值和方差)。此时,对于混合Logit模型,事故n的事故形态为i的概率Pn(i|φ)可表示为[25]
(3)
混合Logit模型的回归系数值虽然可以定性描述显著因素对交通事故形态概率的影响,但并不能定量描述各因素对事故形态概率的影响[26],为解决这一问题,引入弹性分析作为边际效应的评价和量化指标。由于所有自变量均已转换为0/1形式的指示变量,因此,以伪弹性值作为弹性分析的量化指标,通过伪弹性值来量化自变量对事故形态概率的影响。伪弹性值是当指示变量从0变为1时,事故形态概率变化的百分比,伪弹性值算式为
(4)
基于深圳市2014—2016年死亡道路交通事故数据,采用最大似然估计法对混合Logit模型参数进行估计。在90%置信水平下,采用逐步回归法对混合Logit模型的参数进行筛选,应用软件为SAS 9.4。最初随机化所有参数,检查参数的统计学显著性,当参数均值和方差的检验p值均小于0.1时,认定该参数为随机参数;否则,设该参数为固定参数继续检验。混合logit模型的参数估计结果如表2所示。
表2 混合Logit模型的参数估计结果
由表2可知,混合logit模型的McFadden值大于0.2,表明模型拟合优度良好。为分析显著因素对事故形态概率的影响,基于表2混合Logit模型的参数估计结果,计算显著因素的伪弹性值,从而以伪弹性值作为自变量对事故形态概率影响的边际效应。显著影响因素的伪弹性值如表3所示。
表3 显著影响因素的伪弹性值
由表2可知,驾驶员年龄、车辆类型、道路有无隔离、路面是否干燥、是否道路交叉口、道路线形、照明条件、能见度、事故发生时间9个因素与交通事故形态显著相关。其中,能见度>200 m为服从正态分布的随机参数,表明由于未观察到异质性的影响,该参数对事故形态的影响在事故个体间存在差异。为定量描述各因素对事故形态概率的影响,以下结合表3,分析各因素对深圳市死亡交通事故形态的影响。
如表3所示,驾驶员特性方面,相较于25岁以下的年轻驾驶员,25~45岁驾驶员发生单车事故概率降低至63.51%。相较于25岁以下的年轻驾驶员,25~45岁驾驶员的驾驶经验更为丰富,能够对道路上的突发情况做出快速反应,从而降低单车死亡事故概率。
车辆特性方面,车辆类型是事故形态的显著影响因素。相对于载货汽车,载客汽车发生车辆与行人事故、单车事故的概率均增加44.18%。潜在原因为:深圳市部分区域对载货汽车实行限时驶入,从而降低了车辆与行人事故和单车事故的概率。此外,载客汽车的部分驾驶员由于驾驶经验和技能欠缺,易因误操作导致车辆与行人事故、单车事故的发生。
与载货汽车相比,当驾驶员驾驶摩托车时,发生单车事故的概率增加了994.03%。相对于载货车辆,摩托车缺少对驾驶员应有的保护,易导致单车死亡事故的发生。此外,摩托车驾驶员也更易表现出高风险的驾驶行为(如超速、饮酒等),从而导致摩托车单车死亡交通事故频发[27]。
道路特性方面,道路有无隔离、路面是否干燥、是否为道路交叉口、道路线型等也与深圳市死亡交通事故形态显著相关。相较于有隔离道路,无隔离道路发生车辆与行人事故、单车事故的概率分别增加59.89%。潜在原因为:无隔离的道路往往道路等级更低、行驶条件较差,从而增加了车辆与行人事故和单车事故的概率。通过限速、完善道路隔离等措施,可有效改善无隔离道路的交通安全状况。
相对于干燥路面,非干燥路面下单车事故的概率增加30.29%。非干燥路面下,车辆速度虽然有所下降,但车辆制动性能显著降低,总体上仍会增加侧滑、驶出道路等单车死亡事故概率。
与道路交叉口相比,路段发生单车事故的概率增加536.51%。潜在原因是:与道路交叉口不同,路段车速更大,且常伴随弯、坡等道路线型,易诱发侧翻、撞击固定物等单车死亡事故的发生。同理,相对于平直道路,非平直道路下单车事故的概率也增加了124.46%。
在环境特征中,照明条件、能见度为死亡交通事故形态的显著影响因素。相对于夜间无路灯,白天和夜间有路灯都有利于降低车辆与行人事故的概率。在白天或夜间有路灯的良好照明条件下,车辆和行人更容易发现彼此,共同采取积极的预防措施,从而降低车辆与行人死亡交通事故的概率。
如表2所示,能见度200 m以上为服从正态分布的随机参数,均值为-1.004 7,标准差为1.449 8。由正态分布曲线的积分可知,在200 m以上能见度条件下,68.44%的驾驶员会降低单车事故概率,31.56%的驾驶员反而会增加单车事故概率。由此说明,能见度200 m以上对不同驾驶员的影响存在显著差异。潜在原因为:良好的能见度条件有利于驾驶员更早地感知道路上的危险信息,并能够获得足够的反应时间,从而避免单车死亡事故的发生。然而,良好的能见度也易使部分驾驶员产生分心、超速等危险驾驶行为,反而增加了单车死亡事故的概率。
时间特性分析方面,相对于00:00—08:00,08:00—16:00单车死亡事故概率降低92.78%,16:00—24:00单车事故概率降低93.36%,间接表明,00:00—08:00是单车死亡交通事故的高发时段。考虑到深圳市较为年轻的年龄结构,普遍存在夜间加班、晚睡的特点,而00:00—08:00与疲劳驾驶高发时段高度重合,所以,驾驶员可能处于疲劳驾驶状态,导致单车死亡交通事故的发生[28]。
文中基于深圳市2014—2016年的死亡交通事故数据,将死亡交通事故划分为车辆间、车辆与行人、单车三类事故形态,建立了能够反映数据异质性的混合Logit模型,并引用弹性分析理论定量讨论显著影响因素对城市死亡交通事故形态产生的影响。结果表明驾驶员年龄、车辆类型、道路有无隔离、路面是否干燥、是否为道路交叉口、道路线型、照明条件、能见度及事故发生时间都与城市死亡交通事故发生显著相关。其中,能见度200 m以上为服从正态分布的随机参数,即在200 m以上能见度条件下,68.44%的驾驶员倾向于降低单车事故概率,而31.56%的驾驶员反而增加单车事故的概率,由此表明,能见度200 m以上对不同驾驶员的影响存在显著差异。