王博洋, 龚建伟, 高天云,2, 张瑞增, 陈慧岩, 席军强
(1.北京理工大学 机械与车辆学院, 北京 100081; 2.中国北方车辆研究所 兵器地面无人平台研发中心, 北京 100072)
驾驶员与车辆的交互控制系统是一个典型的人机交互系统,驾驶员在上述系统中可以被看作是一个自适应优化控制器[1]。离合器转向机虽然具备结构简单、成本低廉以及使用维护方便等优点,但由于车辆系统转向过程中的不确定性,导致其转向运动可控性差。虽然上述车辆特性为路径跟踪控制带来了挑战,但熟练的人类驾驶员在长期与车辆的交互过程中,实现了对车辆动力学特性的深入了解,能够依据不同的驾驶任务,下发车辆纵向与横向协同控制指令,实现对期望路径的精确跟随。因此,如何利用试验过程中的真实驾驶数据,构建驾驶员跟踪控制经验的数学模型,对于实现无人行驶条件下的车辆路径跟踪控制具有重大意义。
目前对于无人车辆路径跟踪控制的研究受到国内外许多研究机构的重视,并取得了一些成果。这些成果从实现方式上可以分为两类:一类是以车辆模型为基础[2-5],另一类是以驾驶员模型构建为基础[6-10]。文献[2]在构建轮式车动力学模型基础上,利用模型预测控制,实现了车辆运动轨迹的规划与跟踪。文献[3]在构建速差转向车辆动力学模型基础上,通过对滑移率的估计,完成对六轮独立驱动轮胎作用力的优化分配,并最终实现了速差转向车辆对期望轨迹的跟踪控制。文献[4]以统计学分布规律表征地面参数,实现对地面参量不确定性的描述,继而利用模型预测控制实现问题的求解。文献[5]利用高斯回归模型,构建重复轨迹条件下的车辆扰动模型,实现对越野环境下速差转向车辆模型不确定性的表述。虽然上述方法能够从最优控制的角度解决车辆路径跟踪问题,但对于履带车辆而言,其转向模型的不确定性极大地限制了车辆轨迹预测的精度,继而影响到路径跟踪控制的效果[11-12]。
借助驾驶员“预瞄- 跟随”理论,文献[6-8]分别通过离散数表描述道路和车速关系,基于预测的自适应寻优以及强化学习算法,实现期望路径中最优预瞄点的选取。文献[9]基于模糊控制器表征驾驶员的横向操控经验,并利用遗传算法实现优化。文献[10]利用统计学建模方法实现车道保持过程中驾驶员个性化跟踪经验的表述。但上述驾驶员模型主要针对基于阿克曼转向的轮式车辆,对于基于离合器转向机的履带车辆研究较少,普遍缺少对于车辆转向不确定性以及多模态转向模式切换问题的考虑。
本文针对基于离合器转向机的履带车辆路径跟踪控制问题,提出了一种基于双层驾驶员模型的纵向与横向协同路径跟踪方法。以高斯混合隐马尔可夫模型(GMM-HMM)[13]和模糊逻辑,分别表征驾驶员的转向模式选择切换经验以及纵向与横向协同操纵经验,实现对转向模式操控序列的预测,并生成纵向、横向控制量,最终实现在特定场景下轨迹跟踪误差小于1 m的路径跟踪控制。
纵向与横向协同控制系统各控制器的功能以及控制器之间的信息传递关系,如图1所示。
由图1可知:跟踪控制模块根据规划模块所下发的期望路径与限制速度,结合车辆自身的定位及状态信息,解算离散控制量转向模式与自动变速箱(AMT)挡位以及连续控制量期望转向角度与期望行驶车速;上述跟踪控制参量经由综合控制器解析后,分别向转向控制器与AMT控制器下发纵向、横向执行器控制参量;转向控制器以两侧操纵杆位置为依据控制底层伺服液压转向机构;AMT控制器以期望挡位为依据实现AMT的挡位控制,并向发动机控制器转发期望发动机转速控制指令,实现对电子调速柴油机的控制。
离合器转向机的结构形式如图2所示,图2中L1、L2分别代表左离合器和右离合器,T1、T2分别代表左制动器和右制动器。依据离合器与制动器状态所划分的行驶工况如表1所示。
表1 各行驶工况下内侧转向离合器与制动器工作状态
表1中直线行驶工况与制动转向工况属于两类较为确定的转向工况,分别对应直驶模式与原地转向模式,本文不对这两种转向模式的具体控制算法做详细介绍。部分结合转向工况、分离转向工况以及部分制动转向工况同属行进间转向模式,此转向模式下的纵向与横向协同控制方法是本文讨论的重点。
文献[13]已经完成了驾驶员操控经验以及车辆特性的统计学描述,并利用基于GMM-HMM的驾驶员横向控制模型实现了跟踪控制过程中期望转向模式的预测输出。但纵向与横向协同控制系统无法仅依靠转向模式的预测序列,输出实现车辆的路径跟踪控制指令,主要有以下两点原因:
1)转向模式输出为离散量,对应的是操纵杆动作区间,并非连续的位置数值,但控制系统需要精确的期望位置进行引导。
2)转向模式仅约束了控制量操纵杆位置的搜索区间,并未给出当前状态下的期望航向校正偏差,控制算法无法实现闭环。
因此本文提出一种基于双层驾驶员模型的纵向与横向协同路径跟踪控制方法,如图3所示。
图3中:
第1层驾驶员模型以航向变化偏差序列与速度序列联合表述的轨迹序列点为输入,利用经过驾驶数据训练得到的GMM-HMM,生成基于驾驶员经验的转向模式预测序列;以高斯混合模型(GMM)这一统计学建模手段,表征当前跟踪状态下操纵杆期望位置分布区间,并给出第2层驾驶员模型的操纵杆位置寻优初值。
第2层驾驶员模型以Stanley跟踪控制算法为基础,生成路径跟踪过程中的期望航向校正偏差;以车辆横摆角速度等状态参量作为反馈,实现各转向模式下的协同控制。其中,在行进间转向模式下,利用模糊逻辑表征驾驶员油门与操纵杆横向与纵向协同控制配合规律,并生成控制量,实现行进间操纵杆与油门的自适应寻优控制。
双层驾驶员模型以基于车辆横摆角速度的反馈校正为基础,利用第1层驾驶员模型生成转向操纵杆的寻优控制起始值;以此为初值,在第2层驾驶员模型中,根据实际横摆角速度与期望横摆角速度的偏差,生成操纵杆位置与油门控制增量,解决行进间转向模式控制过程中转向系统的不确定性问题。
第1层驾驶员模型利用GMM的聚类结果作为转向操纵杆的基本行进间转向基元,继而依据期望轨迹输入,利用隐马尔可夫模型(HMM)预测生成的前向转向基元概率,在线实时更新多变量GMM中单个高斯转向基元的概率值,动态生成当前概率下操纵杆位置区间的概率密度分布函数,并选取概率值为50%的操纵杆位置作为行进间转向模式下操纵杆的初始位置值,如图4所示。
多变量GMM为
(1)
基于真实驾驶数据对模型进行训练后,可以得到各挡位下的操纵杆区间概率分布,该概率分布表明了整个驾驶过程中操纵杆位置的分布情况,以1挡左侧为例,其分布结果如图5所示。
但上述概率密度反映的是整个驾驶过程中1挡左侧操纵杆位置区间的概率密度分布情况,为了得到面向任一时刻动态的操纵杆位置分布规律,需要引入HMM.
HMM可以被定义为1个五元组,具体为
λ=(X,O,π,A,B),
(2)
式中:X与O为HMM状态参量与观测参量,X(t)={ll(t),lr(t)},O(t)={v(t),θ(t)},ll(t)为左侧操纵杆状态序列,lr(t)为右侧操纵杆状态序列,v(t)为车辆速度序列,θ(t)为航向变化偏差序列;π为初始状态概率矩阵;A为状态转移矩阵;B为混淆矩阵。
任一状态参量输入条件下,第i个转向基元能够与其相对应的概率值为
(3)
式中:Xi为隐含第i个状态;Ot为t时刻的观测量;λ为模型参数。
以上述概率值αi(Ot)分别替换(1)式中多变量高斯混合模型的先验概率值pi,可以实现操纵杆区间概率密度的在线实时更新:
(4)
以1挡左侧转向为例,当输入的期望轨迹序列为v(t)=3 km/h、θ(t)=0.5°/s时,对应的操纵杆概率密度分布如图6所示。
在得到上述分布的基础上,求解概率值为50%处所对应的操纵杆位置,作为行进间转向操纵杆寻优初值,如图6所示。
第2层驾驶员模型以第1层的转向模式以及行进间转向模式下的操纵杆寻优初值为输入,结合Stanely路径跟踪控制算法,生成纵向、横向控制量。由于直驶模式与原地转向模式都只涉及油门的控制,操纵杆位置不会发生变化,控制算法较为简单,在此不展开说明。
Stanely路径跟踪控制模块如图7所示。以车辆行驶速度v,与最近点的横向偏差Δxi,以及路径点航向与车辆行驶航向的偏差角度φi作为输入,生成期望航向校正偏差角度值[14]为
(5)
式中:δi为当前状态下期望航向校正偏差角度;ke为横向偏差敏感度增益参数。
行进间转向模式下基于驾驶员经验的模糊控制逻辑框图如图8所示。
行进间转向纵向与横向协同控制器包含油门增量与操纵杆增量两个模糊控制器。两个模糊控制器的输入量均为横摆角速度差值ε以及横摆角速度差值变化率εc;模糊控制器的输出分别为操纵杆增量εs与油门控制增量εa,分别在第1层驾驶员模型生成的操纵杆寻优初始值,以及直驶模式下的油门初值上实现叠加,生成最终的纵向、横向控制量。
横摆角速度差值的连续取值范围是[-10°/s,10°/s],其论域为[-20,20];横摆角速度差值变化率的连续取值范围是[-5°/s2,5°/s2],其论域为[-20,20];油门控制增量的连续取值范围是[-10,5],其论域为[-3,1];操纵杆位置控制增量的连续取值范围是[-7,7],其论域为[-5,5]。采用如图9所示的隶属度函数和如表2、表3所示的模糊规则表,利用重心解模糊化法,最终求得油门控制增量与操纵杆位置控制增量。
表2 操纵杆增量模糊规则表
图9中横坐标均为无量纲参数,参量NB、NM、NS、ZE、PS、PM、PB分别表征负大、负中、负小、零、正小、正中、正大。
表3 油门增量模糊规则表
试验所使用的基于离合器转向机无人速差转向车辆试验平台如图10所示。车辆参数及传感器参数如表4所示。
表4 无人车辆系统参数
试验中经离线数据训练的HMM-GMM正向求解过程以及Stanely跟踪控制指令生成由搭载Intel Core i7-6820EQ@2.8 GHz 4核处理器以及32 GB内存的ADVANTECH研华工控机在50 ms的控制周期内完成解算。基于模糊逻辑的横向与纵向协同控制算法由时钟主频为16 MHz的MPC5644A飞思卡尔单片机,在10 ms控制周期内生成控制量。
试验场景如图11所示。共进行了两组测试,车辆的行驶挡位分别为1挡和2挡。其中,期望轨迹以基于运动基元的搜索算法生成[15],实际轨迹由车辆所搭载的即时定位与地图构建(SLAM)模块输出。此外,为了便于后续试验结果的讨论,将整个路径跟踪试验分为3个阶段。第1阶段(t1~t2)为避障前的直线行驶阶段,主要验证了车辆在进行直线段路径跟踪时,小幅度的直驶纠偏跟踪控制效果;第2阶段(t2~t3)为换道过程中的转向校正阶段,主要验证车辆进行大幅度航向校正跟踪控制的稳定性以及转向模式切换的合理性;第3阶段(t3~t4)为换道完成后的直线行驶恢复阶段,主要验证车辆进行小幅度航向校正跟踪控制的稳定性。
1挡和2挡工况下跟踪控制纵向与横向协同操控特性如图12和图13所示。
1挡工况下跟踪控制第1阶段的时间区间为0~40 s,左侧操纵杆进行了多次间歇性动作,操纵杆位置峰值为70%,使得车辆实现了0.8°的航向校正;第2阶段的时间区间为40~57 s,车辆经历了行进间转向模式和原地转向模式的顺次更迭,以及操纵杆位置的稳步寻优过程,实现了车辆的换道动作;第3阶段的时间区间为57~65 s,车辆经过多次小幅度行进间转向修正后,实现了1.1°的航向校正,车辆恢复直驶状态,稳定跟踪直线。
2挡工况下跟踪控制第1阶段的时间区间为0~26 s,右侧操纵杆进行了3次间歇性动作,操纵杆位置峰值为42%,使得车辆实现了0.5°的航向校正;第2阶段的时间区间为26~49 s,车辆经历了行进间转向模式的顺次更迭,实现了车辆的换道动作;第3阶段的时间区间为49~55 s,车辆经过多次大幅度行进间转向修正后,实现了4°的航向校正,车辆恢复直驶状态,稳定跟踪直线。
1挡和2挡工况下车辆实际跟踪控制效果如图14所示。两种工况下车辆的轨迹跟踪偏差对比如图15所示。
如图14所示,相对于仅基于Stanely算法未引入驾驶员模型的原有跟踪控制逻辑,改进后的基于双层驾驶员模型的跟踪控制算法,在实现1挡和2挡换道工况下的跟踪控制时,超调量分别下降14%和11%,换道最终完成纵向偏移量分别减少17%和13%,换道过程开启纵向偏移量分别缩短9%和15%. 改进后的跟踪控制算法从跟踪精度以及响应延迟两个方面实现了跟踪效果的提升。
如图15所示,无论是1挡工况还是2挡工况,在第1阶段和第3阶段直线跟踪过程中,改进后的控制算法能够将控制误差限制在0.3 m以内,在第2阶段换道过程中将误差限制在1.0 m以内。
1)基于HMM-GMM统计学习方法所建立的转向模式预测模型,能够为纵向与横向协同跟踪控制系统提供基于驾驶员操控经验的预测转向模式以及行进间转向操纵杆位置搜索区间和搜索初值,缩短了系统的响应延迟。
2)基于模糊逻辑表征的驾驶员行进间转向纵向与横向配合规律,以期望横摆角速度为目标,可以实现行进间转向时油门与操纵杆的配合调整。
3)本文所提出的基于双层驾驶员模型的纵向与横向协同跟踪控制方法具有良好的跟踪控制效果,能够在特定场景下实现跟踪误差不大于1.0 m的跟踪控制。