陈永恒 陶楚青 白乔文 熊 帅 刘芳宏 奇兴族
(吉林大学交通学院,长春 130022)
城市快速路合流区车辆的汇入行为会对主线交通流的运行产生重要影响.合流区车辆微观行为分析可用来评价快速路的控制策略和渠化措施(如匝道信号控制和可变隔离设施等),对快速路合流区的几何设计进行指导.然而,合流区车辆的汇入过程是一个与交通条件、道路环境密切相关的复杂过程,传统的间隙接受[1-2]或间隙选择[3]模型对这一过程进行了假设和简化,不能体现快速路合流区车辆真实的动态决策过程,因此基于车辆的实际汇入行为来建立描述驾驶员动态选择过程的间隙模型尤为重要.
Wang等[4]把车辆的汇入行为分为成功换道和非成功换道,成功换道又分为自由换道和非自由换道,并用支持向量机进行归类,与其他的分类方法相比获得了较高的精度,但其研究重点在于是否接受间隙,没有研究拒绝间隙情况下车辆如何对间隙进行选择.Chu等[5]的研究重点是间隙选择,假设车辆汇入时存在一个固定的决策点,车辆在决策点处进行3种间隙选择:让行汇入(yield)、直接汇入(direct)与超车汇入(chase).后来,Chu等[6]又比较了3种基于Logit的离散选择模型(多项Logit模型(ML)、嵌套Logit模型(NL)、潜在选择集模型(LCS))的效果,结果表明LCS模型能够取得较高的精度.然而,在实际行驶过程中决策点并不是一个固定的位置,并且车辆有时需要多次决策才能汇入主路,模型仍与实际情况有一定出入.Wan等[7]建立的快速路合流区车辆决策模型与实际情况较为接近,把合流过程分为5部分:候选间隙检查、间隙选择、接近间隙加速、合并过程加速、到达期望合流点.该模型能够实时检测最佳间隙从而达到动态决策的目的,但其用于间隙选择的二项Logit模型较为简单,导致模型预测精度比Chu等[6]略低.
本文基于长春市快速路实测数据进行研究,结合部分车辆需要多次超车才能汇入主线的现象,建立合流区车辆多次决策的间隙选择模型,模型通过支持向量机(SVM)对车辆行为进行分类.建模过程借助MATLAB的LIBSVM工具箱编程实现.
本次调查地点选取长春市西部快速路南湖广场入口匝道和南部快速路亚泰大街入口匝道,合流区由3条主车道和1条平行式加速车道构成,两入口匝道结构如图1所示.采集时间为2017年10月和2018年4月期间的部分工作日,拍摄范围从硬隔离末端开始直至加速车道末端结束.
实际观测发现,匝道车辆驾驶员通常不能严格遵守主路优先规则,从而导致合流区主路车辆有减速倾向,并且城市快速路匝道出入口距离较近,主路车流车速偏低,因而导致让行汇入发生情况较少,直接汇入与超车汇入的情况较多,甚至经常出现多次超车的情况.
(a) 南湖广场匝道入口结构
(b) 亚泰大街匝道入口结构
多次超车行为指从匝道驶入的车辆经过2次或2次以上超车才能实现汇入的情况,这种行为的发生说明汇入过程是一个多次决策的动态过程,通过观测发现主路流量会对这种行为产生重要影响.图2中3条曲线分别表示每5 min间隔内主路外侧单车道流量、主路外侧和中间双车道的流量以及多次超车发生次数.可看出多次超车发生次数随着主路流量的增大而逐步增加,其变化趋势与双车道流量的变化趋势更加相近,二者相关性更大,说明2个车道的流量都会对合流车辆的汇入产生影响,在下文采集主路密度参数时应当兼顾.
图2 车道流量与多次超车次数曲线
本文通过绘制散点图来研究双车道流量与多次超车次数的关系.图3中曲线是拟合的指数函数(R2=0.815),可看出流量超过46 veh/min时,多次超车发生次数开始猛增,说明流量达到一定值后,主路车辆之间的间隙较小,很难给合流车辆提供机会,导致车辆不得不多次超车.此外,较大的流量环境下主路车速也有所降低,因而更容易发生多次超车行为.
合流车辆到达每个间隙决定汇入、超车或让行时,在加速车道上所处的位置称为决策点,决策点的选取会对研究结果产生重要影响.Chu等[6]将决策点定义在软隔离末端的固定位置,这显然与实际情况不符,因为决策点与驾驶员的性格特点和所处的道路环境都有关.然而,仅通过视频很难直接观察到驾驶员内心何时进行决策,只能根据车辆在合流过程中的速度特征变化来间接判断.Liu等[8]在研究无信号交叉口直行与左转车辆的合流行为时,将司机的行为分为3个时段:从感知信息到做出理想轨迹决策称为决定期T1;司机的反应时间和车辆操作系统的延迟称为反应期T2;司机不断修正轨迹直到合并过程完成称为操作修正期T3.T2期间的环境参数将直接影响T3期间驾驶员的修正操作,决定驾驶员的决策结果,即决策点应当存在于T2期间.由于T3期间的速度波动相比前2个时段较大,因此可根据合流车辆的速度特征来判断T2与T3的临界点,进而找出决策点.
图3 双车道流量与多次超车次数关系
本文通过视频处理软件采集合流车辆分别在汇入、超车及让行过程中的速度轨迹,为了更好地将3个时段与车辆所处真实位置相对应,描述决策点所处的位置,需要在合流过程中寻找一个标志性的位置作为参照点.如图4所示,汇入过程的参照点定义为合流车辆左前轮压线位置,超车过程的参照点定义在与前车相遇的位置,让行过程的参照点定义在与后车相遇的位置.显然,3种行为的参照点都应处于操作修正期T3中.
图5是合流车辆3种行为的速度变化曲线,合流车辆位于参照点的时刻定义为时间轴的零点.在零点之前,超车过程有明显的加速行为,而让行与汇入过程有减速倾向,让行过程的减速度要大于汇入过程.区域2的速度呈现较大的波动,这说明区域2应处于操作修正期T3内,而在区域1内速度比较稳定,合流车辆保持了一段时间的速度同步,说明区域1包含决定期T1和反应期T2,即合流车辆的决策点应处于区域1的末端,参照点之前的1.2 s左右.因此,本文将3种合流行为的决策点均定义在各自参照点之前的1.2 s处.
图4 3种行为的参照点
图5 合流车辆速度变化
建立支持向量机模型需要采集交通流参数进行训练,本研究在采集参数时遵循以下原则:
1) 采集数据时将车辆看作质心在左前轮的质点.
2) 合流车辆在汇入时不受加速车道前方车辆的影响,即采集数据时若有一组车流(车头时距在4 s以内定义为一组车流[9])到达,只采集头车的合流数据,以排除跟驰行为的影响.
3) 数据均在决策点处采集,决策点定义方法参照1.3节.
如图6所示,在决策点处采集的交通流参数主要包括:合流车辆(MC)的速度VM,主路前车(LC)的速度VL,主路后车(FC)的速度VF,合流车辆与前车的间距DL,合流车辆与后车的间距DF,合流车辆距离加速车道末端的长度D以及主路车流密度K.主路车流密度用图6中密度采集区2条车道上存在的车辆数与区域长度之比表示.
利用视频处理软件对车辆轨迹数据进行提取.
图6 决策点处参数定义
南湖广场入口匝道采集121个超车行为数据,123个汇入行为数据以及56个让行行为数据;亚泰大街入口匝道采集98个超车行为数据,125个汇入行为数据以及43个让行行为数据.
两入口匝道的几何结构存在较大差异,主要体现在合流区的长度上.根据1.4节采集的汇入行为决策点所处的位置数据(用加速车道长度与D之差表示),绘制决策位置累计频率分布曲线(见图7),以研究不同合流区长度对车辆汇入的影响.
图7 汇入行为决策位置累计频率分布曲线
南湖广场入口匝道的合流区长度比亚泰大街短70 m左右,从图7可看出,南湖广场80%的车辆汇入决策点位置在35 m以内,在此距离内车辆汇入较为集中,亚泰大街80%的车辆汇入决策点位置延长至60 m,曲线相对平缓,说明较长的合流区长度能够缓解车辆在汇入时的压力.但亚泰大街220 m的合流区仅被利用120 m左右,说明合流区过长也会造成道路空间资源的浪费.此外,图中实线的出现要早于虚线,这可能是由于亚泰大街的软隔离导流线较短,车辆从匝道驶入角度大,因此会造成汇入行为提早出现的情况.综上,合流区长度与软隔离长度都会对汇入行为的决策位置产生不可忽视的影响.
车辆驶出软隔离末端后在第1个相邻间隙处进行初始决策,每当超车之后到达新的间隙车辆会重新决策,图8中所表示的超车循环过程正是体现了这种多次超车行为.在间隙选择的过程中总是先对主路车辆进行超车与否的判别,一方面有驾驶员自身特点的原因,更重要的是主路外侧车流速度偏低,超车行为发生频率较高.通过超车/非超车判别模型(模型1)来判断合流车辆是否超车,选择超车将进入下一个间隙重新决策,拒绝超车后将进入让行/汇入判别模型(模型2)来判别汇入还是让行.根据长春市西部快速路实际观测的数据,连续2次让行出现的情况几乎为零,绝大部分车辆经过一次让行后即可汇入,这可能是后车为避免与让行车辆发生冲突而故意减速所致,因此对于让行后到达新间隙的情形,本文暂不进行判别分析.
图8 间隙选择模型框架
由于在合流时经常出现主路前方或后方没有车辆的情况,因此在车辆行为关系判别之前先判定前后有无车辆存在.假设主路车辆在一定距离内会对合流车辆产生影响,超出这个距离S则视为没有主路车辆存在.本文采用紧急减速的碰撞概率指标P来计算影响距离,该指标曾被Suzuki等[10]用于研究城市快速路合流区碰撞风险评估.它被定义为当前方车辆紧急减速时,跟随车辆经过短暂的反应延迟时间后开始减速,最后紧急减速至停止后,前方车辆与跟随车辆之间的距离,负值则意味着发生了碰撞.计算公式为
(1)
式中,a1,a2为前车和后车的紧急减速度,均取0.3g(g为重力加速度);Δt为反应时间,取1 s;L为车辆长度;V1,V2为前车和后车的速度,取主路车流和匝道车流的平均速度.当紧急减速碰撞概率指标为零时,计算出距离S约为35 m,即超出这个距离将不再考虑主路车辆的影响.
2个支持向量机模型所用到的参数是不同的,在对采集的交通流参数进行训练之前,首先进行关键参数分析.由于车辆的间隙选择结果是离散值,本文采用Spearman相关系数进行检验,结果如表1所示.可看出,合流车辆与主路前后车辆的速度差都具有显著的相关性,但模型1中合流车辆与前车速度差(VM-VL)的相关性明显高于后车速度差(VM-VF)的相关性,模型2中恰恰相反.为便于模型的构建,每个模型只选取相关性较强的速度差参数.此外,合流车辆与前车的距离DL只在模型1中表现出显著相关,合流车辆与后车的距离DF只在模型2中表现出显著相关,主路车流的密度K与2个模型都显著相关.
表1 关键参数相关性检验
注:*表示在置信度(双侧)为 0.01 时,相关性是显著的.
通过Spearman相关系数的符号还可看出关键参数与间隙选择行为之间的关系.DL与DF的系数值都为负数,说明合流车辆与前后车的距离越近,越容易拒绝间隙而选择超车或让行.位置D在模型2中表现为正的相关性,说明让行行为多发生在加速车道的前端.密度K在模型1中为正值,在模型2中为负值,说明主路车流密度较大时,合流车辆倾向于超车,反之则倾向于让行.
SVM是一种基于结构风险最小化原理的机器学习算法[11].SVM的基本思想是将低维特征空间中的非线性输入向量转换到高维特征空间,建立一个将数据集分隔开的超平面,即分类的决策边界.如果数据点离决策边界越远,预测的结果也就越可信.这个决策边界被定义为
ωx+b=0
(2)
为寻找支持向量到超平面的最大间隔,给定m个训练样本(xi,yi),i= 1,2,…,m.xi为第i个样本的多维特征向量(决策点处的交通流参数),yi为第i个样本的分类标签(合流车辆的间隙选择结果).对于线性不可分情况,最优分类超平面描述为
s.t.yi(ωTφ(xi)+b)≥1-ξi
ξi≥0;i=1,2,…,m
(3)
式中,c为惩罚函数的系数,它控制对错分样本的惩罚程度;ξ为将约束条件放宽的松弛项.式(3)的对偶表达式为
(4)
式中,α为拉格朗日乘数法的系数;K(xi,xj)为核函数.由于向量特征维数较少,本文选用如下高斯核函数进行实验:
(5)
通过以下决策函数来判别最终的分类结果:
(6)
SVM模型建立后,将数据集分成2部分,一部分通过LIBSVM工具箱中的C-SVM算法进行训练,剩余部分作为测试集,检验训练过程中获得的模型精度.在训练前,需要寻找SVM模型中最优的惩罚函数的系数c及高斯核函数的系数g.以南湖广场入口匝道为例,本文选用机器学习中常用的十折交叉验证来进行参数寻优.结果如图9和图10所示,其中x轴为惩罚函数的系数c,y轴为高斯核函数的系数g,z轴为十折交叉验证的平均精度.2个模型分别在点(1,6)与点(12,1)处获得最高的精度,分别对应最优的参数值.
图9 南湖广场模型1参数寻优结果
最优参数确定后,通过训练的SVM模型可得到训练集与测试集的精度.图11和图12是2个支持向量机模型的训练与测试结果.
图10 南湖广场模型2参数寻优结果
图中圆圈表示实际的分类结果,星号表示预测的分类结果,两者重叠说明预测正确,分开则说明预测错误,错误的情况用尖峰状的凸起标出.
(a) 训练结果
(b) 测试结果
模型1训练集和测试集的精度分别为94.67%和92.00%,模型2训练集和测试集的精度分别为95.56%和91.01%,训练集与测试集精度比较接近,过度拟合现象并不明显,这说明之前的关键变量分析与交叉验证确定最优参数效果较好.训练与测试结果表明,SVM模型在快速路合流区间隙选择上能够取得较好的精度.然而,从模型2的测试集结果中可看出,让行行为更容易预测出错,这可能是由于让行与汇入的判别情景较为接近,因而受驾驶员主观因素的影响较大,保守驾驶的司机可能会在条件允许的情况下放弃汇入而选择让行.不同的性格与驾驶习惯会对间隙选择产生重要影响,在以后的研究中将会予以考虑.
(a) 训练结果
(b) 测试结果
利用Logistic回归进行分类的主要思想是根据现有数据对分类边界线建立回归公式,以此进行分类.机器学习中通过使用梯度上升算法[11]求解损失函数极值,找到最佳回归系数,即拟合出Logistic回归模型的最佳参数.
2种算法的结果对比如表2所示,无论是模型1与模型2进行比较,还是训练集与测试集进行比较,Logistic回归模型的精度明显低于SVM模型.尤其是在2个模型的测试集中,SVM模型的精度能够达到91%以上,而Logistic回归模型无法达到.可见在描述快速路合流区车辆动态间隙选择上,SVM模型在2项分类中能够达到较好的效果.这同时也说明模型对不同的渠化设计(合流区长度)的适应性较好.
表2 SVM与LR结果对比 %
1) 从长春市2种快速路入口匝道车辆的汇入行为观测入手,发现匝道车辆的多次超车现象与主路流量之间存在较强的相关性,根据合流车辆速度的微观变化特性,将间隙选择的决策点定义为参照点前的1.2 s.
2) 通过2种不同渠化设计的匝道对比,合流区长度与软隔离长度都会对汇入行为的决策位置产生影响,较长的合流区长度能够缓解车辆在汇入时的压力,较短的软隔离长度会造成汇入行为提早出现.
3) 通过十折交叉验证寻找最优的惩罚函数系数以及高斯核函数系数,2个SVM模型的预测精度能够达到91%以上,均优于Logistic回归模型的精度,且对不同的渠化设计(合流区长度)的适应性较好.
4) 本文在进行参数提取时只考虑了客观的交通流参数,但实际上驾驶员的主观因素也会影响间隙选择行为,对分类精度也会产生干扰,今后的研究中将考虑主客观因素的双重影响.