高速公路合流区冲突极值建模与交通事故预测

2022-11-26 02:49侯芹忠郭延永杨晓冬
公路交通科技 2022年10期
关键词:合流极值贝叶斯

郑 来,侯芹忠,郭延永,杨晓冬

(1. 哈尔滨工业大学 交通科学与工程学院, 黑龙江 哈尔滨 150090;2. 哈尔滨工业大学(威海) 汽车工程学院,山东 威海 264209;3. 东南大学 交通学院,江苏 南京 210096;4. 哈尔滨职业技术学院, 黑龙江 哈尔滨 150081)

0 引言

合流区是高速公路的重要组成部分,同时也是高速公路运行安全的薄弱环节。车辆合流过程中,驾驶员需进行加速、选择可接受间隙、变道等一系列复杂操作,容易出现操作不当从而引发交通事故。统计表明,合流区交通事故占高速公路事故总数的比例一直居高不下,约为高速公路基本路段交通事故的4~6倍[1-2]。

在对高速公路合流区交通安全的研究中,交通冲突技术得到了越来越多的应用。交通冲突是指车辆在时间和空间上相互接近至一定程度,以至于若不改变其运动状态,就会发生碰撞的交通事件[3]。车辆合流过程中会出现较为频繁的侧向冲突和追尾冲突,可为开展高速公路合流区交通安全研究提供比交通事故更为充足的数据支撑。为了识别合流区的交通冲突,学者们多采用后侵入时间(Post Encroachment Time, PET)作为冲突严重程度的衡量指标,通过选取合适的后侵入时间阈值界定交通冲突,进而通过冲突数(率)分析高速公路合流区的安全性[4-6]。相关研究发现,交通流量、冲突车辆速度差、加速车道长度、重型车比例等因素对合流区交通冲突有显著影响[5-9]。

虽然交通冲突技术为高速公路合流区交通安全研究提供了新的手段,但交通冲突作为合流区安全分析指标的有效性尚未被充分证明[10]。本研究旨在通过极值理论建立合流区冲突与交通事故之间的关系模型,在验证交通冲突技术有效性的基础上更好地开展高速公路合流区交通安全研究。极值理论作为一种分析极小概率事件分布的理论,能够通过短时段内常见事件(如降水量、交通冲突)发生的概率外推长时段内罕见极值事件(如洪水、交通事故)发生的概率,已被应用于交叉口冲突-事故关系研究[11-13]、高速公路基本路段冲突-事故关系研究[14-15]、高速公路合流区冲突-事故关系研究[16]。然而,已有研究主要针对单个研究对象分别建立冲突极值统计模型,虽然证明了该模型在交通事故预测方面的可行性,但都存在单个研究对象冲突极值样本数量较少的问题,在很大程度上影响了事故预测精度。比如,Zheng等[16]针对15个高速公路合流区分别构建了冲突极值统计模型,研究发现模型预测事故数与观测事故数的误差最高可达55.9次/a。

为了解决单个合流区冲突样本数量有限的问题,也为了更有效地利用合流区交通冲突预测交通事故,本研究将结合贝叶斯层级超阈值理论,构建能融合多个合流区冲突数据的极值统计模型并据此预测合流区交通事故,以期拓展交通冲突极值统计建模的方法体系,也为基于交通冲突的高速公路合流区交通安全研究提供新思路。

1 合流区交通冲突判别

1.1 数据采集与处理

本研究共采集了7个高速公路合流区的交通运行数据,分别为葫芦岛、绥中、兴城、高升、五龙背、通远堡和本溪。前4个合流区来自于沈山(沈阳至山海关)高速公路,双向8车道,设计速度为120 km/h;后3个合流区来自于沈丹(沈阳至丹东)高速公路,双向4车道,设计速度为100 km/h。

数据采集采用录像法,共采集了白天晴好天气情况下53 h的视频。其中,葫芦岛、兴城、本溪的视频时长均为7 h,其他4个合流区的视频时长均为8 h。基于录制的视频,采用人工观测法进行了分车道、分车型的交通流量统计,具体结果见表1。

表1 交通流量与合流冲突统计情况一览表

交通事故数据来自于沈山高速和沈丹高速的路政管理部门,时间跨度为2010年1月至2012年12月,该时段与视频采集时间相近,且在2010—2013年间所调查合流区的道路、交通、环境条件无显著变化。基于事故发生时间、地点桩号、上下行方向等信息,得到了合流区影响范围内白天时段的交通事故,共54次,具体见表1。

1.2 合流冲突判别

高速公路合流区的合流车辆主要影响主线最外侧两车道的交通运行[4]。因此,本研究重点关注合流车辆与主线最右侧两车道上车辆间的交通冲突。交通冲突严重程度衡量指标选用后侵入时间(PET),即后车头部到达冲突区域的时间与前车尾部离开冲突区域的时间差[3]。

合流过程中的PET是指跟随车辆的头部到达侵入线的时间与先导车辆的尾部离开侵入线的时间之差,其中一辆车为合流车辆。侵入线指垂直于车道分界线并经过车道分界线与车辆变道轨迹交点的虚拟直线[17]。PET的具体测量如图1所示,合流过程中,合流车辆(S)可能与每条车道上的前车(L)和后车(F)产生交通冲突,因此,每一辆合流车辆最多可测出4个PET值,为了保证极值样本的独立性,本研究选取其中的最小值作为该合流行为的PET。实际测量利用VirtualDub软件逐帧播放视频并计算PET,测量精度为0.04 s(每25帧为1 s)。

图1 合流冲突PET测量示意图

由于部分车辆合流时,视频视野范围内主线上并未出现其他车辆,故此时不存在合流冲突。最后,共识别得到合流冲突898次,其中PET最小值为0.20 s、最大值为11.24 s。各合流区的冲突次数及对应PET均值见表1。

2 基于冲突极值模型的事故预测

交通冲突与交通事故具有过程相似性,并且交通事故可视为交通冲突的极值事件,即时空接近度趋近于0的交通冲突为交通事故。因此,可通过冲突极值建模外推交通事故发生的概率。本研究以超阈值极值理论为基础构建冲突极值模型并预测交通事故。

2.1 贝叶斯层级超阈值极值模型

2.1.1 超阈值极值模型

(1)

式中,G(y)为GPD分布;σ>0,为尺度参数;ξ为形状参数。

2.1.2 贝叶斯层级结构

为了表征冲突极值的非稳态特性,在超阈值极值模型的基础上引入贝叶斯层级结构,将影响冲突极值的相关因素融入模型中。层级模型包括数据层、过程层和先验知识层。其中,数据层采用超阈值模型对冲突极值进行建模,其形式如下:

(2)

式中,G(yik|φik,ξik)为广义极值分布;yik为合流区i上的第k个极值(i=1,…,s;k=1,…,ni;其中s为合流区数量,ni为第i个合流区上的冲突极值个数);σik和ξik分别为GPD的尺度参数和形状参数。过程层则是利用潜高斯过程将GPD模型参数与影响冲突极值的变量进行关联,关联函数选用恒等关联函数,具体如下:

(3)

式中,φik=logσik,为变换后的尺度参数,以保证尺度参数的非负性;αφ0和αξ0分别为尺度参数和形状参数的常数项;X为影响冲突极值非稳态特性的协变量集合,为向量;αφ为对应的参数向量;εφi和εξi分别为各合流区尺度参数和形状参数的随机误差项,以表征各合流区未观测因素导致的冲突极值异质性。需要说明的是,由于超阈值极值模型对形状参数的敏感性以及形状参数精准估计的难度,一般不考虑相关变量对形状参数的影响[18]。将常数项和随机误差项结合,简化得到随机截距过程层模型:

(4)

式中,αφ0i和αξ0i分别为合流区i的形状参数和尺度参数常数项。

先验层为过程层模型参数分配先验分布。假设所有模型参数相互独立,由于现阶段没有可靠的先验信息,所以参数αφ0i和αφ均采用无信息先验概率分布,具体为采用0均值大方差的正态分布作为其先验分布,即αφ0i,αφ~N(0,106)。同样,由于超阈值极值模型对其形状参数的敏感性,不恰当的先验分布容易导致模型不收敛,所以借鉴了已有冲突极值模型研究中有关形状参数的先验信息。在已有研究中,估计得到的形状参数均位于(-1, 1)之间[11, 13],因此本研究选用均匀分布作为其先验分布,即αξ0i~N(0, 0.25)。

2.2 阈值选取方法

超阈值模型构建首先需要确定合理的阈值u,才能估计参数σ和ξ。如果阈值选取不合理,将会导致错误的模型估计。常用的阈值选取方法包括平均剩余寿命图及阈值稳定性分析图等图解方法和均方差法等数值方法[18],然而这些方法所确定的均为稳态阈值,并未考虑外在因素对阈值的影响。为克服这一缺陷,本研究选用分位数回归方法确定阈值[19]。从直观上看,高分位数对应的阈值一般都能保证所对应的超阈值样本服从GPD分布。

分位数回归模型的具体形式如下:

Q(τ|X)=X′τβτ,

(5)

式中,τ∈(0,1),为分位数;Q(τ|X)为分位数τ对应的因变量值(即qτ);Xτ为影响阈值非稳态特性的协变量集合为向量;βτ为参数向量。分位数回归模型参数的标定可通过求解式(6)所示的优化问题解决:

(6)

式中,x′τβτ为式(5)向量集合中的一个变量。

在分位数回归确定的阈值基础上,进一步采用阈值稳定性分析图验证所选取分位数的合理性。该方法的基本原理为:如果超出阈值u0的样本服从GPD(σ0,ξ),则对任意阈值u>u0,其阈值u超出值同样服从GPD(σu,ξ),且GPD对应的修订后的尺度参数σu和形状参数ξ在理论上是恒定不变的,其中:

σu=σ0+ξ(u-u0),

(7)

式中,σ0为超出阈值u0的GPD分布的尺度参数。

2.3 模型求解与比选

采用贝叶斯方法对贝叶斯层级超阈值极值模型进行估计。在确定阈值、模型结构和先验分布的基础上,模型参数集合θ(向量)的后验概率密度函数为:

(8)

式中,Y为输入数据集合,为向量;p1,p2,p3分别为数据层,过程层和先验层的概率密度函数,由参数θj(j=1,2)决定,其中θ1=[φ,ξ]T,θ2=[αφ0,αφ,αξ0]T。p1,p2,p3的具体计算公式如下:

(9)

(10)

p3(θ2)=pαφ0(αφ0)×pαφ(αφ)×pαξ0(αξ0),

(11)

在具体构建贝叶斯层级冲突极值模型时,考虑不同变量对冲突极值的影响,即将不同变量引入式(4)可形成一系列模型。最优模型的选取采用方差信息准则(Deviance Information Criterion, DIC)[20]。方差信息准则权衡了贝叶斯模型的拟合优度和复杂度,计算公式为:

(12)

2.4 交通事故预测方法

PET衡量的交通冲突严重程度表征了事故发生的风险或交通冲突与交通事故的接近程度。PET值越小,交通冲突与交通事故越接近,当PET≤0时意味着交通事故必然发生。考虑到超阈值极值模型仅适用于大于某一阈值的极值事件,对PET取负变换为NPET(NegatedPET),此时NPET≥0(即PET≤0)即意味着会发生交通事故。根据上述方法标定得到基于NPET的GPD分布,进而可推导出交通事故的发生概率,即:

R=Pr(NPET≥0)=1-Pr(NPET<0)=

(13)

式中,R为对应冲突观测时段t的交通事故发生概率。假设冲突观测时段能够代表更长时段T的交通运行状况,那么该时段内的交通事故数NT为:

(14)

3 建模结果分析

利用高速公路合流区PET数据进行贝叶斯层级冲突极值模型构建,其中,考虑的冲突极值非稳态特性影响因素包括加速车道长度(LEN,m)、合流车辆类型(MVT,1,2,3分别代表小、中、大型车)、主线车辆类型(TVT,1,2,3分别代表小、中、大型车)、加速车道小时平均交通量(MVV,veh/h)、主线小时平均交通量(TVV,veh/h)。模型估计时,分位数回归通过R软件包quantreg实现,贝叶斯估计通过WinBUGS软件实现。

3.1 阈值选取结果分析

为保证阈值足够大从而使超阈值样本服从GPD分布,本研究首先分别选取了80%,85%和90%这3个分位数,并将LEN,MVT,TVT,MVV,TVV这5个协变量代入分位数回归模型中进行参数估计,结果表明:3个分位数模型中的显著变量均为LEN,MVT,TVT,MVV,对应的参数估计结果见表2。

针对每一个分位数进行了GPD分布的参数估计,结果表明:在85%和90%分位数上满足阈值稳定性要求,即估计得到的修正后的尺度参数和形状参数基本不变,但在90%分位数上对应的估计值方差较大。考虑到模型估计方差和偏差的平衡,本研究选取85%分位数对应的值为最终阈值,即u=-0.518-2.815×LEN+0.148×MVT-0.150×TVT-0.003×MVV。

3.2 模型标定结果分析

通过向后逐步回归法构建贝叶斯层级冲突极值模型,即首先将5个变量均通过关联函数与GPD的尺度参数连接,对应的模型称为非稳态全模型;进而逐步减少变量的数量直至变量数量为0,此时对应的模型为稳态模型;期间构建的仅包括显著变量(p<0.05)的模型称为非稳态显著模型。

采用Winbugs14软件对上述模型进行标定时,构造2条包含100 000次迭代的MCMC链进行贝叶斯推理。通过检查2条链的迭代历史图可确定MCMC算法是否达到收敛;此外,也可以通过BGR(Brooks-Gelman-Rubin)值进行收敛判断,一般认为BGR值小于1.2时为收敛[22]。将前50 000次迭代视为燃烧样本,不参与模型参数的估计,利用后50 000 次迭代值进行模型参数估计。稳态模型、非稳态显著模型、非稳态全模型的估计结果见表3。3个模型均达到收敛,其中非稳态显著模型中仅有MVT,MVV为显著变量,对应的迭代历史和BGR值如图2和图3所示。

图2 非稳态显著模型迭代历史图

图3 非稳态显著模型BGR图

由表3可知,稳态模型、非稳态显著模型和非稳态全模型的DIC值分别为6 567.1,6 549.3和6 557.3。相较于稳态模型,非稳态模型的DIC值明显更小,这说明考虑协变量对冲突极值的影响明显提高了贝叶斯层级极值模型的拟合优度。此外,两个非稳态模型中,仅包含显著变量的非稳态显著模型的DIC值更小,并且其与非稳态全模型的DIC值之差为8.0。因此,非稳态显著模型为最优模型。

表3 贝叶斯层级极值模型估计结果

3.3 事故预测结果分析

3.3.1 事故预测精度分析

根据标定的最优模型并结合式(13)、式(14),计算得到各合流区的预测年均事故数。式(14)中,T=365 d×12 h/d=4 380 h,t=8 h(绥中、高升、五龙背和通远堡合流区)或7 h(葫芦岛、兴城和本溪合流区)。预测事故数与观测事故数之间的关系如图4所示。

由图4可以看出,预测事故数与观测事故数间具有明显的正相关关系(计算得出相关性系数ρ=0.820 1,显著性水平sig=0.023 9),线性拟合优度值R2=0.670 4。为进一步量化事故预测精度,计算了预测事故数与观测事故数间的平均误差(Mean Error,ME)和平均绝对误差(Mean Absolute Error,MAE),计算公式为:

图4 观测事故数与预测事故数关系

(15)

(16)

式中,Pi为第i个合流区的预测事故数;Oi为第i合流区的观测事故数。计算结果见表4,模型预测事故数与观测事故数之间的平均误差和平均绝对误差均较小,分别为1.0次/a和2.1次/a,这说明基于贝叶斯层级冲突极值统计的事故预测方法具有较高的预测精度。此外,平均误差为正,表明模型在总体上高估了事故发生次数。

表4 事故预测精度

3.3.2 事故影响因素分析

建模发现,加速车道长度(LEN)、合流车辆类型(MVT)、主线车辆类型(TVT)、加速车道小时平均交通量(MVV)为显著变量,但这些变量并不直接影响交通事故的风险,而是影响GPD分布的阈值和尺度参数。阈值和尺度参数决定了大部分极值事件的集中度,不同阈值和尺度参数对应的GPD分布示意如图5所示。当尺度参数和形状参数保持不变时,阈值越小,GPD分布整体上越偏离事故风险区域(即越安全);但阈值和形状参数不变时,尺度参数越大,GPD分布跨度越大,分布曲线的右尾部越可能进入事故风险区域(即越危险)。

图5 不同阈值和尺度参数对应的GPD分布示意

上述4个显著变量中,LEN和TVT仅对阈值有显著影响,其系数均为负值(分别为-2.185和-0.150)。为了量化分析其对合流安全性的影响,假设其他变量均取其均值,计算得到某一变量值逐渐增大时的事故发生概率,如图6(a)和图6(b)所示。由图可知,LEN和TVT值越大,阈值越小,对应的合流区越安全。即加速车道长度较长时,发生交通事故的风险更低,因为加速车道较长时,合流车辆驾驶员有更为充足的时间完成加速和可接受间隙选择,因而降低了合流事故风险,但当加速车道长度增加至一定值时,其继续增加的安全边际效益则会降低,这也说明加速车道长度并不是越长越好。此外,当主线上有大型车时,合流车辆驾驶员往往更加谨慎,因而合流事故风险会降低。

图6 变量对合流事故风险的影响

变量MVT和MVV对阈值和尺度参数均有显著影响,且MVT值越大,阈值越大,尺度参数值越小;MVV值越大,阈值越小,尺度参数值越大。为了综合分析这些变量对合流安全性的影响,同样假设其他变量均取其均值,计算得到某一变量值逐渐增大时的事故发生概率。对MVT而言,保持LEN,MVV,TVT不变时,不同合流车型对应的事故发生概率变化如图6(c)所示,随着车型的增大交通事故发生概率逐渐降低。由于大型车的尺寸和性能与小型车差异较大,一般认为大型车比例增高会导致交通事故数增加,这与本研究发现存在相悖之处。潜在原因是本研究使用的冲突样本中车辆类型分布不均衡,合流车辆主要是小型车。对MVV而言,保持LEN,MVT,TVT不变时,合流车流量增加时对应的事故发生概率变化如图6(d)所示,随着合流车流量增加,事故发生概率增大。

4 结论

(1)提出了贝叶斯层级冲突极值建模方法,一方面融合了不同地点的冲突极值进行联合建模,解决了冲突极值的稀少性问题;另一方面引入了协变量和随机误差项,解决了冲突极值的非稳态性和异质性问题,显著提升了模型拟合优度。该方法可实现基于短期观测冲突数据的交通事故预测,且相较于传统的基于冲突极值统计的交通事故预测方法更为可靠。

(2)采用贝叶斯层级冲突极值建模方法构建了高速公路合流区交通事故预测模型,结果表明该模型具有较高的预测精度,模型预测事故数和观测事故数的平均误差仅为1.0次/a,平均绝对误差为2.1次/a。

(3)加速车道长度、合流车辆类型、主线车辆类型、加速车道小时平均交通量对冲突极值有显著影响,进而影响交通事故发生概率。其中,加速车道越长、主线车辆车型越大,交通事故发生概率越小;合流车辆类型越小、加速车道小时平均交通量越大,交通事故发生概率越大。

(4)本研究主要从模型的角度改进了传统的冲突极值建模方法,但受冲突数据采集时间较短的限制,个别合流区事故预测结果并不理想,下一步将增加采集时间以提升冲突样本的代表性,收集合流区线形数据以更全面揭示冲突极值的非稳态性,从而进一步验证贝叶斯层级冲突极值建模方法的优越性。

猜你喜欢
合流极值贝叶斯
极值点带你去“漂移”
基于贝叶斯解释回应被告人讲述的故事
高速公路合流区信号灯限流策略优化与仿真——以虎门大桥为例
极值点偏移拦路,三法可取
昭君戏中王昭君与刘文龙故事合流现象研究
一类“极值点偏移”问题的解法与反思
快速路合流区加速车道长度计算方法
借助微分探求连续函数的极值点
基于贝叶斯估计的轨道占用识别方法
基于互信息的贝叶斯网络结构学习