打滑状态下的多移动机器人编队自适应控制

2020-04-11 13:52滔陆群苏春翌
控制理论与应用 2020年2期
关键词:有界领航移动机器人

彭 滔陆 群苏春翌

(1.重庆理工大学两江人工智能学院,重庆 400054;2.盐城工学院电气工程学院,江苏 盐城 224003;3.康考迪亚大学Gina Cody工程与计算机科学学院,加拿大 魁北克蒙特利尔H3G 1M8)

1 引言

因移动机器人编队具有广泛的应用前景,使其在近几十年成为机器人领域中的研究热点[1–2].经过多年的研究,现已形成了领航跟随法[3–5]、基于行为法[6–8]和虚拟结构法[9–10]3种最常用的控制策略,其中领航跟随法因具有数学分析简单,编队运动安全高效和易于形成及保持队形等优点,已被广泛地应用于移动机器人编队的各研究领域中.通常,系统中会存在因噪声、扰动、摩擦、负载变化等引起的未知信息和不确定性.为此,研究者利用神经网络提出了许多自适应控制方法[11–13].这些结果,只研究了机器人在二维平面内的运动情况.对三维未知流场中的编队协调问题,Ge 等利用径向基函数神经网络(radial basis function neural networks,RBF NN),提出了一种鲁棒自适应控制方法[14].在已有的研究结果中,调用的RBF NN只更新了线性权值,而未研究高斯函数的中心和方差这两个非线性参数的更新,这使得中心和方差选取不当时,将影响控制器的自适应性,智能性和实用性.

上述研究少有考虑车轮打滑的情况,打滑会造成机器人线速度与车轴形成一个偏离角而产生轴向和侧向速度分量,并引发一个附加的角速度,从而不满足非完整约束条件,使得针对不打滑设计的控制器性能将受到极大的影响,甚至失效.在文献[15]中,Wang等分析了单个轮式机器人在打滑情况下的运动规律,为后续研究打滑情况建立了模型基础.在现有的文献中,许多研究者为打滑状态下的单机人轨迹跟踪控制提出了多种控制方法,而研究打滑状态下的机器人编队控制成果还较少[16–17].文献[17–19]对打滑情况的机器人编队,分别运用自适应,输入输出线性化和二阶滑模技术设计了控制器.

本文利用领航跟随法协调编队运动,建立了“距离–角度”编队误差控制模型.通过分析控制模型,发现不打滑状态可视为系统的一种特殊情况,并在该模型的基础上,利用RBF NN设计了自适应控制器设计.控制器中调用的RBF NN能自适应打滑和不打滑两种状态,且对权值、中心和方差3个参数设计了在线调整的非线性更新律.因此,能有效地这提高控制器的自适应性,智能性和实用性.

2 系统模型

轮式移动机器人的车轮在只滚不滑的相对运动时,满足非完整约束条件,其运动学模型为[20]

其中:q=[x y θ]T为位姿向量(上标T 表示转置),(x,y)表示后轴中点在全局坐标系中的坐标,θ为方向角;υ和ω分别为线速度和角速度.

当运动平面比较光滑或轮子受到挤压而发生变形时,轮子会出现打滑状态,而造成线速度v发生偏离,并引发一个附加的偏离角速度ωs.这造成机器人不满足非完整约束条件,使得其运动学模型变为[15]

其中va和vb分别是v的径向和侧向分量,且在不打滑时有v=va,各速度关系如图1所示.

对多个移动机器人构成的机器人编队,利用领航跟随控制策略来协调编队运动,则可将编队分解成多组如图2所示的领航–跟随机器人对.为了方便表示,下文中用下标1和2分别表示领航机器人(Leader)和跟随机器人(Follower),则领航机器人和跟随机器人的位姿分别为q1=[x1y1θ1]T和q2=[x2y2θ2]T.本文研究在编队运动过程中,领航机器人不打滑而跟随机器人存在打滑状态的编队自适应控制,则1和2分别满足式(1)–(2).

图1 机器人打滑状态的速度关系示意图Fig.1 Speed relationship of a robot under slipping condition

图2 领航–跟随机器人编队结构示意图Fig.2 Leader-Follower formation sketch

从图2中可知,跟随机器人的位姿q2可由领航机器人的位姿q1及两机器人间的距离l和角度ψ唯一确定,且l和ψ满足[20]

其中:θl为两机器人连线l与水平轴的夹角,d为机器人后轴到前端的距离.

因此,编队控制目标是控制距离l和角度ψ分别收敛到期望的距离ld和角度ψd,即和因此,可以通过l和ψ表达编队控制模型.

对式(3)–(5)求导,并根据式(1)–(2)化简可得

其中:γ=θe+ψ,θe=θ1−θ2.

注1因l为两机器人间的距离,所以l >0.

定义编队误差e=[leψe]T=[l −ldψ −ψd]T为系统控制状态量,u=[v2aω2]T为控制输入,则可将式(6)–(7)表示成如下的矩阵形式:

注2在式(8)中,因v2b和ω2s是跟随机器人打滑所产生的,且难以准确获知.如果记

则h为系统的未知信息,这给控制器设计带来了挑战.当不打滑时有v2b=0和ω2s=0,即h=0.因此,式(8)能通过h是否为零,统一地表达打滑和不打滑两种情况.

3 未知信息的非线性逼近

对于系统未知信息h,文献[21–22]中证明了RBF NN满足Stone-Weierstrass定理,能在紧集上对任意的非线性未知函数逼近到任意精度.文献[23]中,证明了RBF NN有最佳逼近性质,有

其中:z=[l ψ]T;W∗,ζ∗和δ∗为最佳常值参数;ϵ∗为最佳逼近误差.本文中,选用高斯函数为RBF NN的激活函数S(z,ζ,δ)=[s1(z,ζ1,δ1)···sn(z,ζn,δn)]T,高斯函数si(z,ζi,δi)为

因为最佳常值参数W∗,ζ∗,δ∗是未知量,不能直接应用.因此在控制中,用估计值构建估计神经网络并记参数误差为=

根据文献[24]中的定理1,利用S∗在ζ∗和δ∗的泰勒展开式,可求得未知函数h与估计神经网络TŜ的误差为

并且|ϵh|ϕ∗Ψ,其中ϕ∗∈是一个有界的最优常值向量,Ψ=

4 控制器设计

为了在下文的控制器设计过程中表示方便,记

由于det(g)=≠0,所以g是可逆矩阵,有

为自适应系统(8)中的未知信息h,设计如下嵌入RBF NN的自适应控制器

其中:ki ∈R2×2(i=1,···,5)是正的对角形控制参数矩阵,sgn(·)为符号函数,为ϕ∗的估计值,记=ϕ∗−

注3因f和g与系统编队误差e无关,能在控制器中直接使用,不涉及鲁棒性.

定理1考虑如图2中所示的利用领航跟随法协调编队运动的多移动机器人编队,对式(8)描述的编队运动学控制误差模型,应用自适应控制器(10)和RBF NN参数非线性更新律(11)–(14).当ω1有界时,能选择合适的控制参数ki(i=1,···,5),使得系统编队控制误差e渐近稳定和方向角误差θe有界.

证将式(10)代入式(8),可得

将式(9)代入式(15)有

对式(16),考虑如下的李雅普诺夫函数:

对式(17)两边微分,并代入式(11)–(12)和式(16),化简可得

将控制器(10)中的ω2分量代入式(19),因为e渐近稳定,并经过三角函数的同类项合并与简化可得

对上式利用三角函数的积化和差化简,可得

可将ω1视为系统(20)的扰动项,其标称系统为

由于标称系统(21)稳定,且ω1有界,根据文献[25]中的引理9.2和引理9.3可知,有界扰动系统(20)的解有界,即θe有界.

注4在实际情况中,ω1的有界性是容易得到保证的.

注5因式(8)通过h是否为零,统一地表达了打滑和不打滑两种状态,并且嵌入控制器(10)中的RBF NN通过非线性更新律(11)–(12)调整参数对h进行自适应,这使得本文提出的控制方法对打滑和不打滑两种状态均有效,在很大程度上提高了控制器的自适应性,智能性和实用性.

5 仿真研究

本部分运用MATLAB进行仿真研究,以验证本文所提出的控制方法的正确性和有效性.

设期望距离和角度分别为ld=1 m,ψd=120◦.机器人的d=0.1 m,领航机器人(Leader)和跟随机器人(Follower)的初始位姿分别为q1=[5.5 m 0.5 m 90◦]T和q2=[5 m 1.5 m 60◦]T.

对横向打滑速度v2b和角速度ω2s分别设置如下Case 1和Case 2,以分别代表跟随机器人处于打滑和不打滑两种状态.

表1 两种状态Table 1 Two states

在仿真研究中,考虑了领航机器人走曲线和直线两种情况,并通过设置v1=0.5 m/s,角速度分别为ω1=0.2 rad/s和ω1=0 rad/s来实现.

选择控制参数为k1=I2,kj=0.5I2,其中:j=2,···,5,I2为2阶单位矩阵;编队误差初值为e(0)=[3 m 60◦]T;RBF NN 节点数n=5,各参数的初值利用MATLAB的RAND函数产生为

仿真结果如图3–10所示,其中图3–6和图7–10分别是领航机器人走曲线和走直线的仿真效果,各图分别是编队距离l、角度ψ、方向角误差θe随时间变化的曲线,以及编队运动轨迹曲线.

图3 编队距离误差曲线(ω1=0.2 rad/s)Fig.3 Formation distance error curve(ω1=0.2 rad/s)

图4 编队角度误差曲线(ω1=0.2 rad/s)Fig.4 Formation angle error curve(ω1=0.2 rad/s)

图5 编队方向角误差曲线(ω1=0.2 rad/s)Fig.5 Formation direction angle error curve(ω1=0.2 rad/s)

图6 编队运动轨迹曲线(ω1=0.2 rad/s)Fig.6 Formation trajectory curve(ω1=0.2 rad/s)

图7 编队距离误差曲线(ω1=0 rad/s)Fig.7 Formation distance error curve(ω1=0rad/s)

图8 编队角度误差曲线(ω1=0 rad/s)Fig.8 Formation angle error curve(ω1=0 rad/s)

图9 编队方向角误差曲线(ω1=0 rad/s)Fig.9 Formation direction angle error curve(ω1=0 rad/s)

图10 编队运动轨迹曲线(ω1=0 rad/s)Fig.10 Formation trajectory curve(ω1=0 rad/s)

从图3–10中可以看出,本文提出的自适应控制方法在打滑和不打滑两种情况下,均能使编队距离l和角度ψ收敛到期望值的较小误差范围内,并保持编队方向角误差θe有界,实现编队控制目标.分别对比图3、图4、图7和图8中Case1和Case2两条曲线,可以看出,在不打滑状态下,编队距离l和角度ψ在3 s后收敛到目标值的0.01误差范围内,并一直保持;在打滑状态下,编队距离l和角度ψ在5 s后收敛到目标值的0.05的误差范围内,并一直存在振荡.这与图6和图10中所展示的跟踪轨迹曲线吻合.

从上述分析可知,本文提出的控制方法对打滑和不打滑两种状态,均有很好的响应速度,控制精度和自适应能力.

6 结论

本文针对运用领航跟随法协调编队运动的多机器人编队,在跟随机器人打滑状态下,依据李雅普诺夫稳定性理论设计自适应控制器和RBF NN参数非线性更新律.因建立的控制模型能统一表达打滑和不打滑两种状态,通过嵌入控制器中的RBF NN能自适应打滑和不打滑两种状态,保证了闭环控制系统状态的收敛和有界,使得控制器对打滑和不打滑两种状态均有效,这提高了控制器的自适应性,智能性和实用性.因本文未考虑领航机器人存在打滑的情况,所以为了更好地适应实际情况,对领航机器人和跟随机器人均存在打滑的情况将在后续研究中进行.

猜你喜欢
有界领航移动机器人
移动机器人自主动态避障方法
领航
移动机器人路径规划算法综述
对数Bloch空间上某些算子有界的充要条件
领航
指数有界双连续n阶α次积分C群的次生成元及其性质
模糊赋范空间中的有界性与算子的紧性
领航海外
室内环境下移动机器人地图构建与路径规划技术
领航海外