基于负二项分布的高速公路交通事故影响因素分析*

2022-03-20 14:42陈昭明徐文远
交通信息与安全 2022年1期
关键词:纵坡路段均值

陈昭明 徐文远

(东北林业大学土木工程学院 哈尔滨 150040)

0 引 言

高速公路的快速发展极大地提升了公路运输水平,但其高事故率也愈发引起广泛关注,对高速公路交通事故的预防研究具有重要意义。

在影响事故的众多因素中,道路条件扮演着重要角色。国内外针对道路因素,尤其是几何线形与事故的关系进行了较多研究。平面线形中,多数研究表明交通安全水平随平曲线半径的减小而降低[1-4],但也有学者发现随着平曲线半径的减小,驾驶员警觉性提高,事故数反而有所降低[5-6]。纵断面线形中,纵坡坡度与事故次数正相关[7-8],且下坡路段比上坡路段具有更高的行车危险性[4,8-9]。同时,李明等[9]及孟祥海等[10]指出弯坡组合路段的安全性低于单纯的曲线路段或纵坡路段。道路横断面方面,增加硬路肩宽度或中间带护栏横向偏移量可为驾驶员提供更多的侧向净空,因此可减少事故的发生[5,11]。然而,增加车道数对交通安全的影响尚存争议,Abdel-Aty等[12]和Naike等[13]研究表明随着车道数的增加,车辆变道频率提高,进而导致更多的交通事故,而Rusli等[6]和Montella等[8]研究却表明,增加车道数能提升交通安全状况。

作为道路交通环境的重要组成部分,路面状况对交通安全的影响愈发引起学者关注,尤其是路面自动化检测设备的普及,为该方向研究提供了准确而全面的数据支持。国内外近几年研究表明事故数随着车辙深度的增加而增多[5,14],但亦有研究表明一定深度的车辙可有效警惕驾驶员减速慢行,进而降低事故风险[15];增加路面摩擦力系数可为车辆提供更大的附着力,提高行车稳定性(尤其是弯道和湿滑路面状况下)和安全性[8,16-18];路面平整度不仅影响行车舒适性,还对事故风险存在显著影响,但该因素对交通安全的影响尚存争议,Anastasopoulos等[5]、Cafiso等[19]研究表明粗糙的路面铺装可导致更多事故,而Buddhavarapu等[14]却指出粗糙路面条件下驾驶员更加谨慎,反而能降低事故发生风险。此外,路面破损状况跟事故风险亦存在相关关系,Hussein等[20]和胡思涛等[21]研究表明事故率随着路面破损程度的增加而升高,但亦有学者指出轻微的路面破损(如破损率<1%)可为驾驶员起到警示作用,反而有利于降低事故风险[22]。

研究方法方面,由于事故数具有随机、离散和非负特性,因而泊松及负二项模型是应用最广泛的事故建模方法[2,8]。然而,传统的负二项模型假定事故影响因素的作用效果在时(不同时间t)空(不同路段i)上是不变的。然而,由于事故的发生是极其复杂的,建模时不可能涵盖所有事故影响因素,当未观测因素与已纳入模型的变量间存在相关关系时,将导致已纳入模型变量的安全作用效果在时空上并非是一成不变的,即各因素对事故风险影响的异质性[5-6,16]。Chen等[23]和Bhat[24]的研究均表明,建模时忽略异质性将导致模型参数估计出现偏差,甚至导致错误的研究结论。传统的负二项模型中各变量参数均是固定值,导致其不能有效刻画异质性,而随机参数建模方法允许各变量参数进行随机变化,故可充分刻画异质性并已成为近几年道路交通事故建模领域的研究热点[25]。

梳理国内外在道路条件对交通安全影响的研究可知:①有些因素对事故的影响效果尚未形成定论,如平曲线半径及车道数等;②部分因素对交通安全影响的研究依旧较少,尤其是针对我国高速公路而言,道路横断面指标及路面性能对事故的影响机理尚不清楚,远不足以指导实践;③传统模型不能有效解析各因素对事故风险影响的异质性,进而影响研究结果及推论的准确性;④随机参数建模方法可有效刻画异质性,但该方法的实际应用效果仍需进一步验证,且目前的随机参数模型通常难以揭示各因素对事故风险的交互影响。本文通过构建随机参数负二项模型并进一步探究各因素对随机参数分布特性的影响,从高速公路交通特性、几何线形以及路面性能方面,识别影响交通事故的因素并确定各因素对事故的作用规律,从而为高速公路线形优化设计以及路面养护管理提供理论支持。

1 数据准备

1.1 数据来源

数据来源于黑龙江省和辽宁省内的5条高速公路(绥满、哈同、沈大、沈山和沈丹高速),总长度2 131 km。从高速公路路政管理部门收集到5条高速公路2014年1月—2018年12月的交通事故数据。由于本研究是针对高速公路主线的,因此,剔除了收费站及互通式立交匝道上的事故,经筛选共得到12 097起事故数据。

从高速公路流量观测站获得了各区间历年交通量数据,包括年平均日交通量(annual average daily traffic,AADT)及货车交通量。从道路设计部门获取了高速公路施工图表,得到了相应的平纵线形以及横断面设计数据。从高速公路养护管理中心收集到了历年路面检测原始数据,包括路面破损率、车辙深度、国际平整度指数、横向力系数及结构强度系数等。由于高速公路设计、施工及运营过程中均采用不同的桩号系统,本研究在处理数据时,均已按照对应关系统一转化为了运营桩号;此外,经与高速公路管理部门核实,高速公路各区段在分析时段内均未经历改扩建或长时间封闭。

1.2 建模样本组织

为得到建模所需样本,利用同质法原理,依据高速公路交通运行及道路特征等指标将各高速公路划分成不可再分的路段,具体步骤为:从各条高速公路起点开始,在各指标数值变化处将高速公路断开,直至高速公路终点,进而得到一系列路段单元。由于同一高速公路横断面特征变化不大(立交和服务区路段除外),因此,决定路段划分的道路特征主要是平纵线形指标(如平曲线曲率和纵坡坡度)。此外,为提高分析准确性,路段最短长度限定为0.16 km[4,12]。将长度小于0.16 km的路段,按照加权平均方式合并至前后路段中。经上述过程后,共得到3 946个同质路段。

由于交通量以及路面性能数据均是以年为单位进行观测或储存的,为充分反映这些因素对交通事故的影响,同时也为了提高建模样本量,本文以年为单位组织数据,据此共得到了19 730(3 946×5)个建模样本。之后,需将各年的交通事故数据以及路面性能数据匹配至各个样本中。

根据每起交通事故发生的时间及桩号,可统计各样本所在的路段上历年发生的事故次数,即可将事故数据匹配至各样本上。历年的路面性能检测原始数据中,路面破损率、车辙深度均是以10 m或20 m为单位存储的,因此可根据各样本对应的路段起终点桩号,计算上述5项路面性能指标的加权平均值,进而完成路面性能数据与样本的匹配。

最终模型中的显著变量及其统计特性见表1,其他变量不再展示。

表1 建模变量的统计特性Tab.1 Statistics of considered variables for modeling

2 研究方法

2.1 基于随机参数的事故模型

2.1.1 模型结构

泊松模型中,路段i在时间t内发生nit次事故的概率P(nit)为

式中:m为路段数量;T为数据分析年限;λit为路段i在时间t内事故次数的期望,常表达为

其中:X it为事故影响因素向量,β为其参数向量。

然而,泊松模型要求方差等于均值,但由于事故数据普遍存在过离散性,即方差大于均值,导致泊松模型拟合效果不佳。为此,通过引入随机误差项εi t,将均值λit表示为

式中:exp(εit)服从均值为1、方差为α的伽马分布。此时,泊松模型可拓展为负二项模型,即

式中:Г(•)表示伽马分布。

负二项模型中变量的参数表征了该因素对事故风险的影响,因此,为刻画各因素对交通事故影响的异质性,可将模型中任一变量Xit的参数β由固定值设置为服从正态分布的随机变量,进而将传统的固定参数负二项模型改进为随机参数负二项模型,此时变量参数可表示为

式中:βit为事故影响因素Xit在路段i、时间t内的参数向量,服从均值为β、方差为σ2的正态分布;πij为服从标准正态分布的随机项;若σ等于0,表明Xit的参数为固定参数,即该因素对事故的影响不存在时空异质性。

然而,式(5)所示的随机参数分布的均值在各样本上是固定不变的(均为β),然而,由于各因素对交通事故存在潜在的交互影响,导致随机参数分布的均值可能受其他因素的影响。因此,可进一步将随机参数分布的均值设置为其他因素的函数形式,此时参数βit可进一步改写为

式中:βit为服从均值为β+δM it、方差为σ2的正态分布;M it为影响βit均值的事故影响因素向量,δ为其系数向量;若δ不等于0,则表明因素M it的大小对βit的均值有显著性影响,即M it和Xit存在交互作用(因参数分布均值表征了该因素对事故风险的综合作用,当某因素影响该参数的均值大小时,表明这些因素对事故风险存在交互影响)。

随机参数负二项模型均值及似然函数为

式中:L为模型的似然函数值;φ(•)为标准正态分布的概率密度函数;λit为路段i在时间t内事故次数的均值;P(nit|πit)为路段i在时间t内发生nit次事故的条件概率。模型的参数估计采用基于Halton序列的模拟极大似然估计方法[5]。

2.1.2 拟合优度检验

采用AIC准则(akaike information criterion)和ρ2系数评价模型的整体拟合优度,其中AIC值越小、ρ2系数越大模型拟合效果越好。

式中:A为AIC值;p为模型中参数数量;L0为模型中仅包含常数项时的似然函数值。

此外,为从统计学角度对比分析2个模型的拟合优劣,构造如下统计量

式中:χ2为服从卡方分布的统计量,自由度为模型C与模型B中参数数量之差;L(B)和L(C)分别为模型B和模型C的似然函数值。

2.2 敏感性分析

通过计算事故次数对各影响因素的敏感性,可分析各因素对事故的相对影响程度。事故次数对连续变量的敏感性可用弹性系数Ek度量,计算方法为

式中:Ek的物理意义为当变量增加1%时,事故次数的平均变化百分比;为路段i在时间t内事故次数对该连续变量的弹性系数。

对于离散变量,其增加1%是不符合基本事实的,故其敏感性分析方法与连续变量有本质区别。采用边际效应系数Dl评价事故次数对离散变量的敏感性,计算方法为

式中:Dl的物理意义为相对于基准变量事故次数的平均变化值;为路段i在时间t内事故次数对该离散变量的边际效应系数。

3 模型标定结果

分别标定了固定参数负二项模型及随机参数负二项模型,见表2。2个模型的对数似然值(越大越好)、AIC值(越小越好)以及ρ2系数(越大越好)表明,随机参数负二项模型的拟合优度高于传统的固定参数负二项模型。此外,构造的χ2统计量取值为220,自由度为9,即在99.9%的置信水平下(χ2临界值为27.88),随机参数负二项模型的拟合效果更优。

表2 模型标定结果(剔除不显著变量)Tab.2 Estimation results for models(excluded non-significant variables)

由于上述指标均是评价模型的整体拟合优度,为进一步验证随机参数模型对各变量的拟合效果,计算得到了模型累计残差与各连续变量的关系,结果表明,对所有的显著性连续变量而言,随机参数模型的累计残差均未超出其95%置信区间[26],表明模型对各变量也具有较好的拟合效果。其中,累计残差与交通量AADT的关系见图1,累计残差与其他连续变量的关系不再展示。

图1 累计残差与AADT的关系Fig.1 Cumulative Residuals versus AADT

在95%置信水平下,固定参数模型和随机参数模型中显著变量分别为11个和12个,即随机参数模型能识别出更多的事故影响因素。其中,与事故次数正相关的变量有:AADT、路段长度、货车比例、车道数_3、车道数_4、平曲线曲率、纵坡坡度、纵坡方向_下坡、车辙深度;与事故次数负相关的变量有:路缘带宽度_0.75 m、路面破损率及结构强度系数。

此外,随机参数模型识别出5个变量的参数为服从正态分布的随机参数,分别为:路缘带宽度_0.75 m、平曲线曲率、纵坡方向_下坡、车辙深度以及结构强度系数,反映出这些变量对交通事故影响的时空异质性。其中,路缘带宽度_0.75 m、车辙深度以及结构强度系数的参数均值在各样本上均是保持不变的;而平曲线曲率和纵坡方向_下坡的参数均值分别受纵坡坡度和货车比例影响,表明这些因素对交通事故的影响存在交互作用。

4 事故影响因素分析

随机参数负二项模型中,事故次数对各变量的敏感性见表3。

表3 事故次数对各显著变量的敏感性Tab.3 Sensitivities of crash for significant variables

暴露变量AADT和路段长度均与事故次数正相关,其参数分别为0.299和1.029(由式(12)~(13)推导可知,暴露变量的参数即为其弹性系数),表明事故次数随着交通量的增加而增加;事故次数与路段长度呈近似线性关系。交通量和路段长度每增加1%,事故次数将分别平均增加0.299%和1.029%。货车比例与事故次数正相关且货车比例每增加1%,事故次数将增加0.093%,潜在原因是:随着货车比例的增加,车辆间速度差增大,变道及超车等危及交通安全的行为增多,进而导致更多交通事故。

单向3车道和4车道路段比单向2车道路段事故次数分别多了0.041次和0.142次,潜在原因是:车道数越多,车辆变道频率越高,从而引发更多交通事故。

路缘带宽度_0.75 m的参数服从均值为-0.270、标准差为0.057的正态分布,即在绝大多数情况下(>99.99%),路缘带为0.75 m的路段比0.5 m的路段更安全,潜在原因是:增加路缘带宽度可在一定程度上降低内侧车道驾驶员的紧张和焦虑情绪,同时也为车辆偏离内侧车道中心线提供更多的侧向净空,进而有利于提升交通安全水平。

平曲线曲率的参数服从正态分布,表3表明平曲线曲率每增加1%,事故次数平均增加0.079%,即整体上平曲线曲率越大(即半径越小),事故数越多。此外,该参数的均值与纵坡坡度正相关(由表2可知,该参数均值为“0.192+0.031×纵坡坡度”),表明纵坡坡度的增加将显著增加平曲线曲率的参数均值,即弯坡组合路段的事故风险明显高于单纯的平曲线路段,其符合交通安全的基本理论,同时也从侧面证明了本文构建的随机参数模型的合理性。

由表2和表3可知,事故次数与纵坡坡度成正比,且下坡路段事故次数总体上高于上坡路段。上坡和下坡路段的纵坡坡度每增加1%,事故次数将分别增加0.068%和0.094%。此外,纵坡方向_下坡的参数服从正态分布,且其均值与货车比例正相关(由表2可知,该参数均值为“0.046+0.102×货车比例”),即货车比例高的下坡路段事故风险尤其高。

路面破损率与事故次数成反比,弹性系数表明其每增加1%,事故次数反而减少了0.011%,潜在原因是:样本中路面平均破损率仅为0.06%,最大破损率也仅为4.57%,且99.8%的样本路面破损率小于1%,如此小的路面破损率远不足以导致车辆失控,反而,个别路段上路面的轻微破损会提高驾驶员的警惕性,一定程度上降低了事故风险。

车辙深度的参数服从均值为0.019、标准差为0.010的正态分布,即在97%的情况下,车辙深度的增加会导致更多的交通事故,弹性系数表明车辙深度每增加1%,事故次数平均增加0.054%,潜在原因是:车辙越深,车辆越难以保持预定的行车轨迹,尤其是在高速行驶或变道时,驾驶员的操作不当可能使车辆产生较大的横向偏移,不利于行车安全。但在少数情况下(3%),车辙深度反而降低了事故风险,潜在原因是:部分驾驶员(尤其是熟悉路面状况的驾驶员)警惕性较高,从而提前减速和谨慎驾驶,一定程度上降低了事故风险。

结构强度系数的参数服从均值为-0.020、标准差为0.044的正态分布,即多数情况下路面结构强度越高越有利于行车安全,且其每增加1%,事故数平均降低0.064%,潜在原因是:结构强度越高,其对车辆,尤其是重型车的承载能力越强,从而保证了车辆的稳定性。

5 结束语

1)构建了随机参数负二项模型用以分析高速公路交通事故的影响因素。结果表明:相比于传统的固定参数负二项模型,随机参数负二项模型能识别出更多事故影响因素,且能更合理地揭示各因素对交通事故的影响机理;此外,由于随机参数模型能有效刻画各因素对事故影响的异质性和交互作用,因此具有更好的拟合效果和较广泛的应用前景。

2)从交通特性、几何线形以及路面性能方面分析了交通事故的影响因素,结果表明:交通量、路段长度、货车比例、车道数、平曲线曲率、纵坡坡度、纵坡方向和车辙深度总体上均与事故次数显著正相关;而路缘带宽度及结构强度系数均与事故次数显著负相关;此外,由于各路段路面破损率普遍较低,个别路段路面的轻微破损可提高驾驶员警惕性,从而降低了事故次数。

3)引入了弹性系数和边际效应系数,以分别量化连续变量和离散变量对事故风险的影响,结果表明:交通量、路段长度、货车比例、平曲线曲率、纵坡坡度、车辙深度和结构强度系数每增加1%,事故次数将分别增加0.299%,1.029%,0.093%,0.079%,0.068%和0.054%;路面破损率以及结构强度系数每增加1%,事故次数分别降低0.011%和0.064%;此外,路缘带由0.5 m增加至0.75 m可使事故次数降低0.159次,单向3车道和4车道路段比单向2车道路段的事故次数分别多0.041次和0.142次,下坡路段比上坡路段事故次数平均多0.026次。

研究成果可为高速公路线形设计、养护和管理提供依据和指导,亦可为交通安全相关规范的修订或编制提供参考。依据本文研究结果可知:①货车比例较高的路段,尤其是下陡坡路段,宜通过合理分配各车道功能,降低货车与其他车辆的交互;②车道数的增加会导致更多的交通事故;③路缘带由0.5 m变为0.75 m能显著提高行车安全性;④急弯、陡坡及其组合线形均明显不利于交通安全;⑤路面养护对交通安全的影响不容忽视,将路面状况维持在较好状态可有效提升交通安全水平。

猜你喜欢
纵坡路段均值
重载交通纵坡路面结构受力分析及病害预估模型
半柔性复合路面在重交通长大纵坡路段的应用
常虎高速公路路段拥堵治理对策探析
基于XGBOOST算法的拥堵路段短时交通流量预测
高速公路重要路段事件检测技术探讨
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
基于元胞自动机下的交通事故路段仿真
基于元胞自动机下的交通事故路段仿真
浅谈均值不等式的应用