彭金柱,卞英楠,周树亮(郑州大学 电气工程学院,河南 郑州 450001)
在轮式机器人系统的轨迹跟踪控制中,对系统中非线性不确定性的处理,提出了诸如PID[1]、自适应、鲁棒控制[2-3]、滑模控制[4]等不同的单一方法.但是,单一的控制策略无法取得理想的结果.因此,近年来,国内外学者开始提出混合控制的方案.例如,在不校准摄像机视觉参数的前提下,孙妍等[5]利用视觉反馈信息并结合模糊控制的方法对移动机器人线速度和角速度进行控制,仿真结果证明了该方法的有效性.Spandan等[6]构思了一种将滑模控制与延时控制相结合的方法,将二者取长补短,最后基于仿真与单一的滑模控制对比,显示了不错的效果.为了使误差在有限时间内收敛,张扬名等[7]先采用有限时间控制方法,设计连续状态反馈角速度的控制律,在前向角误差趋于零时,结合反演设计的滑模控制技术,给出平面坐标跟踪误差线速度的控制律并取得不错的跟踪效果.基于切换灰色预测的方法,Wong等[8]设计了模糊跟踪系统.在处理不确定环境下的机器人应用上具有不错的灵活性.为了减弱滑模控制的抖振,Yi[9]将情感学习算法与滑模控制算法结合,同模糊滑模控制及一般滑模控制对比,验证了所提算法的优良性.考虑到机器人位置难以测量,Wang等[10]将视觉监督系统与自适应算法相结合,设计了一种能满足机器人实时轨迹跟踪的控制器.考虑机器人速度不可测量的情形,Shojaei等[11]利用动态表面控制方法减少了设计的复杂性,同时结合状态观测器,针对存在建模不确定性的机器人系统提出了新的控制规律.针对包含参数和非参数不确定性下的非完整机器人系统,一种鲁棒自适应时变控制方法被Shojaei等[12]设计出来.
虽然上述研究取得了不错的跟踪效果,但都要求系统的惯性矩阵、重力矩阵以及哥氏力矩阵的精确模型全部已知,或者至少知道其中两个.而笔者所提的混合控制策略仅仅需要知道系统的精确惯性矩阵.当考虑外界干扰存在的情况下,Hwang等[13]提出了一种最优H∞控制并取得较好的效果.考虑外扰是有上界的情形,Khalaji等[14]结合了鲁棒控制与自适应控制设计了新的控制器,与反馈线性化动态控制器对比,取得了更好的效果.
彭金柱等[15]设计了一种结合递归模糊神经网络和鲁棒H∞控制的方法,并将其用于完整约束的机械臂跟踪控制.借鉴该设计思想,笔者提出了一种将对角递归神经网络(DRNN)和鲁棒H∞控制相结合的方法,并将其应用于非完整约束的轮式移动机器人轨迹跟踪控制.在系统仅仅满足惯性矩阵是标称的而其他标称矩阵未知的情形下,利用DRNN神经网络逼近系统的非线性项.而且,鲁棒H∞控制方法能够保证系统在外界扰动仅仅积分有界的情形下仍能满足特定的跟踪性能.基于Lyapunov稳定性理论证明了所设计的控制系统闭环稳定.此外,与上述文献中基于小车的动力学研究不同,笔者从小车的左右轮转角度考虑.
递归神经网络(RNN)的最大特点是网络中有一个或多个反馈回路,这使得网络具有良好的动态性能.笔者采用的对角递归神经网络(DRNN)是将ELMAN网络的反馈层和隐含层简化为对角阵形式,因而网络结构得到极大简化,同时提高了网络实时性,加快了学习速度,更有利于系统在线学习,它的基本结构如图1所示.由图1可知,这是一个m维输入n维输出的DRNN网络,它的输入/输出向量的动态映射关系为:
(1)
式中:xm(t)是网络的第m个输入;sj(t)是隐含层第j个神经元的输入;hj(t)是输出层第j个神经元的输出;yn(t)是输出层第n个神经元的输出.令W1、Wh及W分别代表输入层、隐含层及输出层的连接权值矩阵.并将W1、Wh矩阵元素全部设为1,即输入层与隐含层的连接权重全部取为1,反馈层的权重也全部取为1.网络隐含层的激活函数取Sigmoid函数以及平移后的Sigmoid函数,输出层函数为线性函数.设H(·)=[h1(t),h2(t),…,hm(t)]T,Y=[y1,y2,…,yn]T,则DRNN神经网络的输出可以表示为:
Y=WTH(·),
(2)
图1 DRNN神经网络Fig.1 DRNN neural network
对于一个两轮非完整约束移动机器人系统,考虑外扰的情况下,它的动力学方程:
(3)
(4)
(5)
(6)
如果不考虑系统建模误差及外扰的存在,根据控制力矩法(CTC方法),可以设计如下控制律:
(7)
(8)
选择合适的Kv、Kp即可保证系统闭环稳定,然而实际系统不可能精确建模和忽视外扰的存在,因此有,
(9)
假设移动机器人系统中,只有惯性矩阵的标称模型已知,而其他部分则未知.然后,利用DRNN神经网络快速逼近能力来逼近Τ(xe),即
Τ(xe)=W*TH(·)+ε,
(10)
式中:W*表示最优值矩阵;H(·)表示DRNN神经网络的隐层输出;ε表示网络的逼近误差项.假设存在ΩW并满足ΩW={W∈Rm×n:‖W‖≤MW},且最优网络权值W*能落在紧集ΩW中,可表示为W*=argmin{sup|Τ(xe)-WTH(·)|}.针对移动机器人系统,现设计如下控制器:
(11)
其中,u为鲁棒控制项,用来补偿系统的外部扰动及神经网络逼近存在的误差.将式(10)、(11)代入式(5),化简后得,
(12)
(13)
系统的状态空间方程为:
(14)
定理1对于机器人系统式(5),若满足假设1,且存在正定对称矩阵P=PT>0,满足如下Riccati方程
(15)
式中:R=RT>0为H∞控制增益;Q=QT>0为正定对称矩阵;In×n为单位矩阵;γ>0为干扰抑制指标.对于式(12),令
(16)
DRNN神经网络参数的自适应学习算法为:
(17)
其中,Γ为正定对角增益矩阵.那么系统可以满足如下两个目标:①所设计的鲁棒混合控制系统中的状态变量一致有界.②系统能够满足如下H∞跟踪性能:
(18)
证明选取如下Lyapunov函数,
(19)
对上式两边进行微分,并将式(14)代入后得
(20)
(21)
对上式两边从t=0到t=T积分得
(22)
(23)
因此,式(18)所提的H∞跟踪性能得以满足.根据假设1,存在σd>0使得‖δ‖≤σd,则有
(24)
(25)
因此,闭环系统的所有状态变量一致有界.
结论2在大多数已有的文献[13-15]中,干扰是假设有确切上界的,此时可以通过选择合适的增益矩阵,利用变结构控制、自适应控制等鲁棒控制算法即可保证系统稳定.然而,实际情况中干扰的上界确切值可能无法精确获知.因此,笔者假设干扰是满足能量有界的,通过文中所提的算法可以在干扰上界未知的情况下使得系统能满足特定的跟踪性能.
(26)
仿真结果如图2、3、4所示.
由图2、3可知,设计的新方法在从t=0s到t=30 s的整个跟踪过程中,左轮右轮的转角跟踪误差是小于CTC方法的.尤为突出的是,从图2、3可以明显看出期望轨迹在t=10 s和t=20 s左右处发生变化时,所设计的方法与CTC方法的跟踪误差发生了变化,但设计的新方法误差抖动明显小于CTC方法,具有更好的鲁棒适应性.同时,从图4可知,DRNN神经网络的权值最终能稳定在最优值.而且在面对同样的外扰下,所设计的方法能满足特定的跟踪性能.
图2 小车两轮的转角跟踪曲线Fig.2 Tracking curve of two wheels
图3 小车两轮的转角跟踪误差曲线Fig.3 The tracking errors of two wheels
图4 DRNN网络权重的变化曲线Fig.4 The curve of weight in DRNN network
针对非完整约束的轮式移动机器人,笔者提出了一种具有全局稳定性能的鲁棒跟踪控制结构.它结合了DRNN神经网络和H∞控制方法.理论分析表明它对逼近误差的强鲁棒性以及对能量有界但不可测量的外扰具有抑制作用.此外,闭环系统所有的状态变量能够保证有界.仿真结果表明,所提算法比控制力矩法具有更好的跟踪性能.而如何提高实际的硬件仿真效果是下一步研究的内容.