基于收缩反步的不确定机械臂轨迹跟踪控制

2022-06-21 08:10孟宪洋尤海荣果李

控制理论与应用 2022年5期

孟宪洋尤海荣何平张果李恒

(1.四川轻化工大学自动化与信息工程学院,四川自贡 643000;2.人工智能四川省重点实验室,四川自贡 643000;3.东北大学信息科学与工程学院,辽宁沈阳 110819;4.华中农业大学工学院,湖北武汉 430070;5.香港理工大学智能建造实验室,香港九龙 999077)

1 引言

随着机器人技术的发展,机械臂作为机器人的核心部件,其应用领域正在迅速拓宽[1].如代替人类从事重复且持久(工业流水线)、恶劣且危险(涉及核及化学武器)等性质的任务.这些任务都需要对期望轨迹进行高精度的轨迹跟踪.但是,由于机械臂是一个具有时变、强耦合性质的非线性系统[2],存在模型不确定、未知外部干扰和测量误差等问题.因此,实现不确定机械臂的轨迹跟踪控制非常具有挑战性.

针对机械臂的轨迹跟踪问题,国内外许多学者进行了大量的研究,提出了许多有效的方案.当前主流的控制方法有:滑模控制法[3]、自适应控制法[4]、模糊控制法[5]、神经网络控制法[6]等.滑模变结构控制作为常用的控制方案,对参数变化及匹配不确定性、未知外部干扰和时滞等方面都具有强鲁棒性,核心是利用尽可能大的切换增益来减少扰动的影响.但也造成了严重的抖振敏感问题,从而导致机械臂的磨损.基于自适应反演非奇异快速末端滑模控制可以很好的解决机械臂的扰动和不确定性问题,不仅瞬时响应快而且可以有效的减小抖动[7].针对机器人的高精度运动控制,采用样本延迟测量单元来消除机械臂的非线性和不确定性,非奇异终端滑模自适应无模型控制方法展现出良好的跟踪性能[8].此外,采用延时估计方法对系统模型和外部干扰进行估计,并把时延估计误差看作外部干扰也能够实现机械臂的轨迹跟踪[9].虽然自适应控制法在面对受控系统参数变化时,可以通过及时的辨识以调整控制规律.但需要严格的实时性,否则无法实现轨迹跟踪控制目标.在无干扰的情况下,利用自适应反演控制策略,可以使得机械臂的轨迹跟踪误差是全局渐进一致稳定的[10].基于任务空间分布的自适应控制策略对解决电机发热可能引起参数漂移的问题具有良好的效果[11].此外,还可以利用神经网络、模糊逻辑等方法逼近系统的不确定性[12],并将学习到的结果与常规的控制方法相结合,从而实现对机械臂的轨迹跟踪.基于自适应模糊滑模控制策略就是将模糊逻辑与滑模控制相结合来解决具有未知非线性动力学的机械臂轨迹跟踪控制问题[13].而基于神经网络的滑模自适应控制方法就是神经网络与自适应滑模控制相结合,不仅实现了机械臂的轨迹跟踪控制,而且减弱了滑模引起的抖振问题[14].将神经网络模型与终端滑模相结合,以径向基神经网络来逼近机械臂模型中各个元素,可以实现无模型控制[15].但是,这些控制方案需要实时在线学习模型的参数信息,且设计复杂.

近年来,收缩理论伴随着黎曼几何的发展[16]而提出,且在非线性控制方面进行了一定的应用[17].其中收缩反步控制是以收缩理论为基础引入反步法的一种收缩分析控制方法.JOUFFROY等人首次设计了基于收缩稳定性理论的反步控制器[18].此外,基于收缩分析的状态反馈控制方法可以用来解决不确定参数和外部干扰的全驱动机械系统的跟踪问题[19].与滑动面的滑模控制方法相结合,则可以解决具有不确定性的非线性系统的稳定性问题[20].更进一步,利用收缩理论来研究水下航行器的增量稳定性[21].本文从四旋翼无人机的跟踪控制命令中得到启发[22],将基于连续介质力学和微分几何的收缩理论[23],即增量稳定收敛分析方案[24]运用到机械臂的轨迹跟踪控制.相比已有的研究成果,本文的创新之处在于:1)本文设计了非线性干扰观测器,实现对未知干扰的有效观测;2)扩展了收缩反步控制方法的应用范围,解决了机械臂的轨迹跟踪控制问题.最后,在二连杆机械臂上进行对比仿真实验,不仅证明了本算法具有良好的鲁棒性,而且具有结构设计简单、计算效率高的优点.

2 收缩理论

考虑以下非线性系统

其中:x是系统(1)的n维状态,f是非线性向量场且各阶偏导数存在.此外,进一步假设系统是光滑的.收缩理论[23]的概念与微分几何密切相关,粗略地讲,就是对状态进行参数化以观察任意两条轨迹距离的变化.

则系统(1)是收缩的,任意给定两条轨迹上两点的距离L将会指数收敛到零.这里M(x,t)是对称正定矩阵,也称度量矩阵.λ是正常数,也称收缩率.

引理2考虑如下具有扰动形式的动力系统:

3 机械臂动力学模型

考虑图2所示的二连杆机械臂,其拉格朗日模型为

图1 距离收缩图示Fig.1 Distance contraction illustration

图2 2-DOF机械臂Fig.2 2-DOF robot manipulator

因此,不确定二连杆机械臂动力学方程可以表示为

4 基于干扰观测器的收缩反步法控制设计

机械臂系统控制设计主要目标是使实际角度qs跟随到期望角度qd.由于未知干扰信号ds的存在,在设计控制器时,首先,使用干扰观测器对干扰进行观测得到观测信号.然后,对机械臂系统采用收缩反步法进行控制设计,得到最终控制力矩τ,从而实现对整个系统的控制.其控制系统结构框图如图3所示.

图3 控制器结构框图Fig.3 Block diagram of controller

4.1 扰动观测器设计

假设1假设未知干扰ds的时变方程有界,令其表示为=φ.这里φ是未知的有界函数,即存在正标量ς,使得‖φ(t)‖≤ς.常见的摩擦、饱和、平滑周期不确定性因素等不确定性扰动均属于此类情形.

为了实现对有界不确定性干扰的有效观测并增强系统的鲁棒性,可以设计干扰观测器

定义干扰观测的误差为

由于假设1界定的扰动项φ为时变有界的数,式(6)的虚拟动力学可表示为1https://zhuanlan.zhihu.com/p/71717022.

4.2 控制器设计

基于收缩理论的反步控制的详细设计过程如下:

5 稳定性分析

注2此处测地线γ(s)=s(·)+(1−s)(·)⋆为直线,对式(21)进行路径积分得到式(23)时,当指定误差系统的初始轨迹γ(0)=w⋆=0,则对于系统实际产生的任意轨迹γ(1)=w.故而由以上分析可知:一旦证明系统收缩即可得出系统轨迹与期望轨迹之间的距离是有界的结论.

引理3当且仅当对任意一个正定对称矩阵Q,存在一个正定矩阵P满足Lyapunov方程

则矩阵A是Hurwitz的.此外,如果A是Hurwitz矩阵,则存在唯一正定解P[30].

若考虑无扰动估计环境,那么由式(14)和式(2)组成的系统可表示为

将跟踪误差e和辅助变量z1带入上式并化简整理得

计算特征值λ(A ⊗I2)=−1±i,可知矩阵A ⊗I2是Hurwitz的.令Q=I4,由引理3求得其唯一正定解为P ⊗I2,其中,

综上所述,在无扰动的情况下,选取适当的参数可使矩阵A ⊗I2是Hurwitz的,证明本文所设的收缩反步控制律可使系统稳定.

6 数值仿真

6.1 二连杆机械臂模型参数

为了验证上述所提方法的有效性,考虑动力学模型如下所示的二连杆机械臂[29]

从花馍的制作工艺及流程来看，花馍制作需要复杂的工序，长期以来，闻喜花馍都是由当地妇女亲手一个一个捏出来的，各种捏形都没有教材可以参照，每逢有人家中办事，都是全村妇女集体到一家来蒸馍，这样主要由人来操作造成花馍的规模化生产很有难度，机器花生产有难度，而要想获得经济利益，必须要扩大生产规模，闻喜花馍的制作非常讲究。这就面临了一个特别实际的问题，在这个过程中如何处理好花馍的生产数量和口感质量的关系，这个也是在确定市场定位时，需要考虑的，是侧重花馍的食用性还是它的观赏性，这个是急需解决的问题。

其中g=9.8 m/s2是重力加速度.Js1和Js2分别表示每个连杆的转动惯量.ms1和ms2分别表示每个连杆的质量.ls1和ls2分别是每个连杆的长度.其动力学参数如表1所示.

表1 二连杆机械臂的参数Table 1 Parameters of two-link manipulator

6.2 可靠性验证

为了验证本文控制算法的有效性、可行性和可靠性,不失一般性,二连杆机械臂的初始状态拟定为q0=[0.6 0.5]T,v0=[0 0]T,二连杆机械臂的期望轨迹分别拟定为q01=sin(0.5πt),q02=cos(0.5πt).控制器参数为kq=1,kv=3,与式(24)相一致.

在传统滑模控制上引入指数趋近律可以有效的减弱抖振问题,但只要控制中含有符号函数sgn(·),抖振现象在控制输出中就不可避免,利用饱和函数连续变化的特征,用饱和函数中的双曲正切函数

其中:控制器参数选取为Λ=diag{1,1},ε=0.8,k1=5.跟踪误差被定义为e=qs−qd,滑模面被设计为σ=+Λe.其实质就是利用饱和特性减弱切换的不连续特性.

通过对本文所提方法(14)和基于指数趋近律的滑模控制策略(25)进行数值仿真,分别从位置轨迹跟踪、位置轨迹跟踪误差和控制输入等3个方面来进行对比仿真实验,其仿真结果如图4-9所示.

对比图4和图5的位置轨迹跟踪曲线,可以看出,大约在3 s左右时,二关节机械臂的每个关节位置跟踪到了预定的轨迹曲线.因此,本项实验表明,通过收缩反步法设计的控制力矩能够有效的实现二连杆机械臂的轨迹跟踪.

图4 关节1位置跟踪曲线Fig.4 Position tracking curves of joints 1

图5 关节2位置跟踪曲线Fig.5 Position tracking curves of joints 2

分析图6和图7所呈现的位置跟踪误差曲线,调整时间约为5 s.随后,位置跟踪误差曲线的波动逐渐平稳并趋向于零.两种控制策略在稳定误差的调整时间段内没有明显的差异.因此,本项实验结果表明在收缩反步法的输入控制力矩的作用下,可以保持被控对象“稳”、“快”、“准”的特性,其跟踪误差能够有效的收敛到稳定状态,使得机械臂能够快速且稳定的跟踪到期望参考轨迹.

图6 关节1位置跟踪误差曲线Fig.6 Position tracking error curves of joints 1

图7 关节2位置跟踪误差曲线Fig.7 Position tracking error curves of joints 2

分析图8和图9,其为输入力矩的动态响应变化曲线,其控制力矩是光滑的控制输入曲线,同时产生周期性的输入现象.而且从控制力矩中看出基于收缩反步控制策略与用于抑制抖振的改进指数趋近的滑模控制策略相一致,保证了机械臂系统对期望轨迹的良好的趋近和收敛特性.

图8 关节1控制输入Fig.8 Control input for joint 1

图9 关节2控制输入Fig.9 Control input for joint 2

从理论角度来看,一方面,由于滑动模态需要在工程实践中现场设计,而系统的滑模运动又与被控制对象的参数变换和外界干扰无关,另一方面,滑模变结构控制对具有外界干扰和未建模动态的非线性系统具有很强的鲁棒性.因此,滑模变结构控制比较适合机械臂的控制.然而,滑模控制作为一种不连续的控制方法,其控制输出的抖振现象是不可避免的.而改进后的指数趋近滑模控制方法已经具备良好的趋近特性和收敛特性,是一种较为成熟的机械臂控制方案.基于连续介质力学与微分几何的收缩理论,本文将增量稳定收敛分析方法运用到机械臂的轨迹跟踪控制,通过与常规且成熟的机械臂控制方案进行实验对比,充分说明了本算法不仅具有良好的鲁棒性,而且具备设计机构简单,计算效率高的优点.

6.3 鲁棒性验证

为了验证本文控制算法的鲁棒性,在前述相同的初始状态q0=[0.6 0.5]T,v0=[0 0]T,和相同的期望轨迹q01和q02的条件下,考虑未知的外界干扰为ds=[ds1ds2]T=[−e−t−cost −e−t+sint]T,与假设1相一致.此时控制器参数为kq=1,kv=3.干扰观测器参数为ks=999.

通过图10和图11的响应曲线可以看出,当系统中引入非线性干扰观测器后,系统的输出受干扰的影响进一步减小,不仅使得机械臂关节角位置跟踪性能有所改善,而且证明了干扰观测器能很好的观测到未知干扰,以便于减小干扰对系统的影响.

图10 关节1位置跟踪曲线(含干扰观测器)Fig.10 Position tracking curves of joints 1(disturbance observer)

图11 关节2位置跟踪曲线(含干扰观测器)Fig.11 Position tracking curves of joints 2(disturbance observer)

图12是引入非线性观测器后,实现对未知有界干扰有效观测后的关节位置跟踪误差曲线.与图10和图11相对应,可以看出通过选取足够大的收缩率,其跟踪误差曲线能收敛到稳定状态.

图12 关节位置跟踪误差曲线Fig.12 Position tracking error curves of joints

通过图13的实验结果可以看出,通过选取足够大的收缩率(如ks=999),干扰观测误差能够收敛到原点附近的小邻域内.干扰估计误差ed(t)的近似值使其误差不超过10−3.因此,本项实验证明了此非线性观测器能实现对未知干扰的有效观测.

图13 干扰观测误差曲线Fig.13 Disturbance observation error curve

在选取足够大的收缩率(如ks=999)情况下,控制力矩的动态响应如图14所示.关节1的输入力矩在10单位左右,关节2的输入力矩在2单位左右.可以看出,控制力矩的输入仍然是符合工程实践需求的,不会引起过负荷现象.

图14 关节控制输入Fig.14 Control input for joint

图15和图16是外界干扰向量ds在收缩率参数逐渐增大过程中所对应的干扰观测误差变化曲线.其中,观测误差ei(i=1,2,3,4)是依次对应的收缩率参数值分别为ks1=9,ks2=99,ks3=599,ks4=999的响应曲线.且观测误差e4变化曲线与图13的曲线相对应.因此,从上图的实验结果可以看出,通过选择足够大收缩率ks,系统的稳态估计误差能收敛到原点附近.

图15 干扰观测误差ds1变化曲线Fig.15 Disturbance ds1 observation error curve

图16 干扰观测误差ds2变化曲线Fig.16 Disturbance ds2 observation error curve

图17呈现了二轴连杆机械臂在三维空间坐标系下(t,qs1,qs2)的运动跟踪轨迹.可以看出,通过收缩反步控制原理,二轴连杆机械臂可以在三维空间坐标系下完美的跟踪期望轨迹.

图17 三维形式轨迹图Fig.17 Three-dimensional form of trajectory figure

本文以不确定二连杆机械臂系统为被控制对象,以收缩理论为核心设计收缩反步控制器,将有界外部干扰的实际值与估计值误差限定在特性收缩区域内,验证了在干扰外界干扰的情况下的鲁棒性,证明了本算法设计结构简单、高效的特性.

7 总结

本文针对一类存在模型不确定、未知外部干扰的机械臂设计了收缩反步跟踪控制器,该控制器包括收缩理论、反步法和干扰观测器三部分.通过控制机械臂的关节角度使其跟踪到期望轨迹.对于二阶反馈联接闭环系统,以给定轨迹为中心的恒定半径球开始并始终包含在收缩区域中的任何轨迹保持在该球中,并指数收敛到给定的轨迹.但由于采用的是反步控制技术,因此系统受到了严格的反馈形式约束.后续将继续对增量稳定性进行研究,扩展其应用范围.例如,将相关控制算法与七自由度冗余手术型机器人相结合,实现远程手术的人机协同控制[32].亦或是将相关理论推广到机器人编队[33]和多智能体一致性[34].