考虑紧急程度的机器学习仿真变道模型

2020-07-27 03:43:30徐大林

指挥控制与仿真 2020年4期

李捷,李韬,徐大林

(江苏自动化研究所,江苏连云港 222061)

车辆变道是驾驶员的基本行为,当车辆行驶在多车道道路上,车辆往往会因为不同动机变道至其他车道。变道模型是微观交通仿真中重要的模块,用于描述车辆根据周围交通环境变道至其他车道的行为。车辆变道行为会严重影响交通的畅通与安全,进而影响交通流量，车辆速度等,影响交通仿真的真实性和有效性,因此如何在交通仿真中模拟出更加真实的变道行为成为研究的热点。

变道行为是一个非常复杂的过程,驾驶员在变道过程需要考虑大量的因素如道路情况、周围车辆的相对速度与间距,然后制定变道决策。邹智军[1]、王崇轮[2]、陈晶[3]根据驾驶员思维对变道行为进行了建模。

这些模型主要运用车辆运动学建立运动方程,根据安全间距做出变道决策。然而,由于这些模型中考虑的变道因素相互作用关系十分复杂,此类模型很难精确捕捉到驾驶员在决策过程潜在的决策模式和考虑的影响因素。

进入21世纪以来,机器学习受到了越来越多的关注并且被广泛应用于数据分析中。机器学习是一种数据驱动的方法,通过从数据或以往的经验中学习给定的任务。由于机器学习能够挖掘出数据中各变量之间的相互关系,因此有人将机器学习用于变道模型中。邱小平[4]提出了基于贝叶斯网络的车辆变道模型,张叠[5]针对车辆变道行为受交通环境影响较大而难以识别和预测的问题,基于支持向量机提出了变道决策模型并使用网格搜索求解模型最优参数。Yi Hou[6]通过投票规则组合决策树和贝叶斯分类器变道结果,减少了错误变道的概率。Huikun Bi[7]使用随机森林作为建模方法,考虑了相邻车道中多个间距,使得提出的模型更加符合实际。李青林[8]基于驾驶员操纵特性和交通环境状态分析,引入二元Logistic模型,提出了一种有效预测变道行为的方法,能够排除变道过程中存在的交通安全隐患。

然而,这些模型都只考虑了车辆之间的相对距离、相对速度等因素。未考虑变道紧急程度对于变道决策的影响并且模型精度较低。但是在不同紧急程度下,驾驶员做出的变道决策往往不同。如车辆到路口的距离越近,离目标车道越远,此时变道越紧急,即使车辆间的相对距离较小,驾驶员也会选择强行变道。当变道紧急程度较低时,驾驶员会选择更加安全的距离进行变道。因此紧急程度对变道决策过程十分重要。因此,本研究提出了考虑紧急程度的机器学习变道模型。首先,使用聚类算法划分变道紧急程度,然后将变道决策模型建模为分类问题,利用机器学习算法梯度提升决策树训练出不同紧急程度下的变道模型。最后将提出的变道模型与常用的机器学习变道模型进行对比,验证了提出的模型的有效性,并基于决策树的特征重要性分析了变道决策过程中影响因素,验证了紧急程度在变道决策的重要性。

1 数据集介绍

机器学习是一种数据驱动的方法,根据训练集学习到数据之间的相互关系,因此数据集对于机器学习至关重要。本研究采用次时代仿真(Next Generation Simulation, NGSIM)数据集训练变道模型。NGSIM数据集由美国联邦公路局收集,目的是为了支持微观交通仿真建模。NGSIM数据集包含通过摄像机收集的详细车辆轨迹数据。数据采集频率为10 Hz,包含车辆的速度、加速度、所处车道信息、目的地和起始地等信息。从上述数据集中共提取了2040个直行样本、990个左转样本、970个右转样本。80%的样本用于模型训练,另外20%的样本用于模型测试。所研究区域如图1所示。

图1 研究区域示意图

2 GBDT算法简介

梯度提升决策树(Gradient boosting decision tree, GBDT[9])是一种用于回归、分类和排序任务的机器学习技术,将多个弱学习器(分类回归树,CART[10])组合成强学习器,迭代的学习弱学习器从而减少真实值与预测值间的误差。

2.1 分类回归树

一个数据集中每个样本具有多维特征,决策树通过构建一个树形结构实现对数据的划分,其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性上在某个值域上的数据划分,类似if-then的结构,而每个叶节点保存划分后数据的类别或预测值;决策树迭代的选择不纯度最小或信息增益最高的特征属性来构建非叶节点,直至不纯度或信息增益为0。

分类回归树(Classification and regression tree, CART)是决策树的一种,选用Gini指数描述不纯度来构建节点。分类过程中,假设有K个类别,样本点属于第K个类的概率为pk,则概率分布的Gini指数定义为:

(1)

根据Gini指数定义,可以得到样本集合D的Gini指数,其中Ck表示数据集D中属于第k类的样本子集:

(2)

如果数据集D根据特征A上进行分割,得到D1,D2两部分后,那么在特征A下集合D的Gini指数如下所示:

(3)

分类回归树的构建,对于特征A循环计算不同属性值下划分后Gini指数,选取其中的最小值,对于所有数据特征计算最小的Gini指数,并选取当前特征作为本次节点。循环迭代,直至树的深度达到所设定的最大深度或Gini指数为0。

2.2 梯度提升决策树

梯度提升是机器学习中提升方法的一种,将多个弱学习器的预测结果加权得到最终预测结果Fm(x),每个决策树hm(x)是对上一阶段的残差y-Fm-1(x)的拟合,逐渐减少模型预测结果与真实值的误差。Friedman提出使用损失函数的负梯度作为残差的近似值,减小了决策树优化的难度。

梯度提升决策树算法的步骤如下:

1)计算负梯度作为残差:

(4)

2)使用决策树hm(x)拟合rim;

3)计算加权系数使得损失函数极小化:

(5)

4)更新模型:

Fm=Fm-1+αm·hm

(6)

3 基于K-means算法的变道紧急程度划分

3.1 变道紧急程度定义

变道紧急程度定义:当车辆所处的车道不能继续行驶,必须变道至其他车道时,留给车辆的变道时间由当前车辆到路口的距离(D)、与目标车道的车道数差(L)、车辆速度(V)与加速度(ACC)四个变量决定。紧急程度由变道时间决定,也由上述四个变量决定,当车辆离路口的距离越短，与目标车道数差越大；速度，加速度越大,变道越紧急。t时刻的变道紧急程度如下表示:

Et=(Vt,ACCt,Dt,Lt)

(7)

通常,变道越紧急时,驾驶员往往会采取一些冒险的措施,车辆间距不足以变道也会强制变道,当变道紧急程度较低时,驾驶员会选取更加安全的时机进行变道。因此,在变道决策模型中考虑变道紧急程度是十分有必要的。

3.2 基于紧急程度的数据集划分

K-means[11]算法属于无监督学习,根据输入特征向量,将输入数据划分到K个类别中。

本研究将紧急程度E作为聚类算法的输入特征向量,设置类别个数K=3,分别表示一般紧急、中等紧急和特别紧急,将数据集根据紧急程度划分三个子集。

K-means算法描述:已知观测集(x1,x2,…,xn),k-means算法要把这n个观测值划分到k个集合中,使得组内平方和最小。即:

(8)

表1为划分结果,中等紧急程度样本数量最多,占44%,其次是一般紧急,然后是特别紧急。

表1 基于变道紧急程度的数据集划分

4 基于GBDT的变道决策模型

变道场景描述:如图2所示,变道场景通常可用三车道场景描述,目标车辆Target首先评估周围的环境,然后执行变道或者保持直行。驾驶员根据与周围车辆的相对速度和相对距离来判断变道条件是否满足。

t时刻,变道场景特征向量St定义如下:

(9)

(10)

St=(ΔVt,Gt,Et)

(11)

其中,ΔV表示当前车辆与周围车辆的速度差,G为当前车辆与周围车辆的间距差,E为上节中提出的变道紧急程度。

变道决策模型可以表示为机器学习中的分类问题:输入表示车辆所处交通状态的特征向量S,分类器输出变道决策结果Y⊆(left,straight,right),变道决策结果下文简称l,s,r。

变道决策模型:根据已划分的数据集,本研究分别训练了在不同紧急程度下的GBDT模型,试图描述不同紧急程度下驾驶员决策过程。变道决策模型工作流程如图3所示。首先根据变道紧急程度E特征向量,使用聚类算法对车辆变道紧急程度进行划分,根据不同的紧急程度选用相应的GBDT变道决策模型,GBDT变道决策模型根据车辆所处的交通场景特征向量S进行决策推断,预测是否变道。

图3 考虑紧急程度的变道模型

5 实验结果与分析

5.1 评价指标定义

真正例(True Positive,TP):真实类别为正例,预测类别为正例。

假正例(False Positive,FP):真实类别为负例,预测类别为正例。

假负例(False Negative,FN):真实类别为正例,预测类别为负例。

真负例(True Negative,TN):真实类别为负例,预测类别为负例。

定义精度(Precision,P)、召回率(Recall,R)、准确率(Accuracy,A)如下:

(12)

(13)

(14)

精度表明预测的某类样本中,有多少是被正确预测的。召回率表示有多少正确的样本被预测出来。准确率表示对于给定的测试集,分类正确的样本数与总样本数之比。

5.2 模型性能对比

本研究对比了机器学习中常用的几种分类方法(GBDT, SVM, KNN)。如表2中所示,P、R、A分别表示精度、召回率、准确率,P(s)表示类别为直行的精度。本研究提出的考虑紧急程度的变道模型准确率达到了81%,较直接使用GBDT的变道模型提升了2%。同时,本研究所提模型在三个类别的精度都是最高的,分别为83%,80%,79%,表明了紧急程度在变道决策过程中十分重要。

表2 变道决策模型性能对比

5.3 特征重要度分析

特征重要度分析常用于机器学习中的特征工程中,常被用于减少特征数量、降维,使模型泛化能力更强,减少过拟合,增强对特征和特征值之间的理解。

本研究中,使用特征重要度分析变道决策中交通场景的影响,并分析紧急程度的重要性。

特征j的全局重要度VIMj通过特征j在单棵树中的重要度VIMij的平均值来衡量:

(15)

特征j在决策树i上的特征重要度使用Gini指数衡量:

(16)

L为决策树i包含特征j的非叶节点个数。

变道场景特征变量在变道决策过程中重要性如图4所示。影响变道决策最重要的三个因素为车辆速度、到路口的距离、以及与前车的速度差。本研究引入的变道紧急程度E四个变量的重要程度排名分别为1,2,5,7,同样说明了变道紧急程度在决策过程中十分重要。

图4 变道决策特征重要度分析

6 结束语

变道模型在交通仿真中十分重要,对其研究具有重要的意义。随着人工智能的发展,机器学习成为一种重要的建模工具,本研究考虑了紧急程度对变道决策模型的影响,提出了基于K-means和GBDT的变道决策模型,实验结果表明,本研究所提模型比GBDT、SVM和KNN算法性能好,较GBDT模型提高了2%的精度。本研究最后分析了变道决策中影响因素,结果表明紧急程度对变道决策十分重要。

考虑紧急程度的机器学习变道决策模型,摆脱了传统的基于驾驶员思维建模方式的缺点,以数据驱动为导向,能够挖掘出更符合实际的变道模式,增加变道预测的精确度,能够使得交通仿真更加真实。在后续研究中,将驾驶员属性与车辆属性加入模型会进一步提升模型精度,同时,机器学习方法发展迅速,将最新的算法用于变道模型将是后续研究的重要内容。