樊雕,姚建勇,邓文翔
(南京理工大学机械工程学院,江苏南京 210094)
液压作动器由于功重比大、抗负载刚性强、输出力矩大等特点,在工业上应用广泛,尤其是在液压机器人领域取得了卓有成效的成果[1-2]。多自由度空间机械臂是一个多输入多输出、强非线性、强耦合的机电液复杂非线性系统,因此对液压机械臂精确控制是极富挑战的任务。为解决这些问题,多年来国内外学者开展了很多研究,提出了多种算法,如滑模控制[3-5]、自适应鲁棒控制[6-9]、反步控制[10-12]、神经网络控制[13]、虚拟分解控制[14-16]等。其中,反步控制主要是将反步设计的思想融入到其他控制理论的控制器设计过程中[10-12]。而神经网络算法本质是非线性系统,可以实现任意非线性映射,作为一种万能逼近算法,与其他非线性控制算法相结合,可以达到某些出人意料的控制效果[13]。一般常用的基于模型的非线性控制算法,如滑模控制、自适应鲁棒控制等,其控制思路为采用拉格朗日方程建立机器人的动力学方程模型,然后基于模型进行非线性控制算法设计[1,4,13]。由于机械臂动力学模型的计算复杂度与运动自由度的四次方成正比[14],当机械臂自由度过多时,无论是机械臂动力学模型和控制器的推导,还是最后的仿真或实验,都将变得极富挑战。作为对比,虚拟分解控制VDC(Virtual Decomposition Control)是面向高自由度的复杂机器人系统建模和控制方法[14],它通过设置虚拟分割点VCP(Virtual Cutting Point)的方式将高自由度机械臂分解为若干子系统,基于子系统展开控制设计。同时定义虚拟功率流VPF(Virtual Power Flows)——速度误差和力误差的乘积,来处理各子系统动力学之间的相互作用,实现解耦、降低建模复杂度。MATILLA教授团队针对某两自由度液压机械臂负载4 750 N情况下,基于虚拟控制的思想进行了一系列研究,包括位置运动控制[15]、节能控制[16]等。陈光荣等[17]利用虚拟分解对液压足式机器人单腿稳定阻抗控制进行了研究等。
然而基于三维模型的机械臂虚拟分解未必百分百准确,具有一定的参数不确定性,与实际真实物理系统存在误差。正如文献[15]研究的液压机械臂未融入参数自适应律,控制效果尚未达到最佳。因此,针对子系统设计控制器时虚拟分解的不准确性带来的时变动态使得液压机械臂渐近稳定跟踪性能难以实现。XIAN等[18]针对光滑干扰的鲁棒控制问题,提出一种误差符号积分鲁棒(Robust Integral of the Sign of the Error,RISE)控制器,可以处理足够平滑的有界干扰,并实现渐近跟踪性能,同时由于该方法设计的控制律中包含误差符号的积分项,所以控制器是连续的,避免了抖振的产生。YAO等[19-20]通过反演设计的方法将RISE设计和自适应控制器设计相结合,用于处理液压伺服系统中的建模不确定性和参数不确定性,保证了渐近跟踪性能。综上,若结合虚拟分解的强大建模能力和RISE控制器优越的鲁棒性用于液压机械臂的控制当中,似乎是一种较好的解决方案。
某液压机械手腕腕部结构如图1所示,每一个关节由伺服阀控制液压摆动马达转动可实现三自由度空间运动。
图1 机械手腕结构
考虑固联于刚体上的三维正交坐标系{A},建立Av∈R3和Aω∈R3分别表示三维线速度和角速度矢量,二者在坐标系{A}中统一表示为六维广义速度矢量:
(1)
在坐标系{A}中建立Af∈R3和Am∈R3分别表示三维力和力矩矢量,同式(1),此力和力矩矢量可以表示为
(2)
(3)
AF=AUBBF
(4)
其中:AUB为广义力矢量从坐标系{B}到坐标系{A}的映射矩阵,具体定义参见文献[14]。
定义1:在坐标系{A}中,将广义速度矢量误差和广义力矢量误差的内积定义为虚拟功率流,即
PA=(AVr-AV)T(AFr-AF)
(5)
其中:AVr∈R6和AFr∈R6分别表示AV∈R6和AF∈R6所需的广义速度矢量和广义力矢量。
若坐标系{A}固定在某刚体上,则此刚体自由运动的动力学方程在{A}中可表示为
(6)
其中:MA∈R6×6表示质量矩阵;CA(Aω)∈R6×6表示科氏力和向心力矩阵项;GA∈R6代表重力项。若AVr∈R6代表AV∈R6所需的广义速度矢量,式(6)参数化表示为
(7)
其中:回归矩阵YA∈R6×13和参数矩阵θA∈R13的具体表达式见文献[14]。
机械手腕坐标定义及关节转动方向如图2所示。
图2 机械手腕坐标定义
定义一组向量:
(8)
注意到底座速度为0,即B0V=[0 0 0 0 0
0]T∈R6,则由图2可得各物体速度如下:
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
若机械手末端与环境无接触,即GF=0,则机械手各物体的动力学方程为
(17)
O3F*=O3UB5B5F
(18)
B5F=B5UO3O3F*
(19)
B4F=B4UB5B5F
(20)
(21)
O2F*=O2UB3B3F-O2UB4B4F
(22)
由式(22)得:
B3F=B3UO2O2F*+B3UB4B4F
(23)
B2F=B2UB3B3F
(24)
(25)
O1F*=O1UB1B1F-O1UB2B2F
(26)
由式(26)得:
B1F=B1UO1O1F*+B1UB2B2F
(27)
3个关节马达的输出力矩分别为
(28)
(29)
(30)
跟踪的是4个关节运动轨迹,则四自由度机械臂各关节需求速度定义为
(31)
(32)
⋮
(33)
当获得了整个系统各连杆、物体或者关节处等的需求速度后,定义一个新的向量——需求节点力/力矩向量:
(34)
(35)
⋮
(36)
阀控液压马达系统如图3所示,液压马达因两腔压力产生的作用力为
图3 阀控液压马达
τip=τi+τif
(37)
式中:τif为摩擦力,进一步有τipr=τir+τif。
液压马达(见图3)两腔压力动态方程为
(38)
(39)
式中:Dm代表液压马达排量;θ为马达转角;l0为液压马达最大行程;Ct为液压马达内泄漏系数;βe为液压油弹性模量;Q1和Q2分别为由伺服阀进入、流出液压马达高低压腔的流量。忽略伺服阀阀芯动态,则阀芯的控制输入u和阀芯位移xv成比例关系,即xv=kvu,则Q1和Q2与伺服阀阀芯位移xv的关系为
(40)
液压马达的输出力矩为
τp=Dm(p1-p2)=DmpL
(41)
对式(41)求导有:
(42)
式中:
(43)
液压系统工作在一般工况下,即液压马达高低压两腔压力满足0 (44) 式(44)意味着对于一个给定的uf可以得到一个唯一确定的控制电压u: (45) 进一步地,设计uτ为uτd: (46) 式中:kτp和kτ为正的反馈增益,则式(45)转化为 (47) 定义物体O3的非负伴随函数: vO3=1/2(O3Vr-O3V)TMO3(O3Vr-O3V) (48) 对式(48)求导有: (49) 证明:式(35)减去式(17)得: (50) 对式(48)求导并考虑式(50)有: ≤-(O3Vr-O3V)TKO3(O3Vr-O3V)+(O3Vr-O3V)T· =-(O3Vr-O3V)TKO3(O3Vr-O3V)+(O3Vr-O3V)T· O3UB5(B5Fr-B5F) =-(O3Vr-O3V)TKO3(O3Vr-O3V)+(B5Vr-B5V)T· (B5Fr-B5F) (51) 同理,定义物体O2的非负伴随函数: vO2=1/2(O2Vr-O2V)TMO2(O2Vr-O2V) (52) 对式(52)求导有: (53) 定义物体O1的非负伴随函数: vO1=1/2(O1Vr-O1V)TMO1(O1Vr-O1V) (54) 对式(54)求导有: (55) 液压马达的虚拟稳定性分析: 定义液压马达1的非负伴随函数为 (56) 式中:τ1pr为τ1p的需求力。根据文献[14],式(56)的微分满足: (57) 再定义: v=vO1+vc/k1τ (58) 对式(58)求导有: pB2-kτp(τ1pr-τ1p)2 (59) 则根据文献[14]中的Definition 2.17,物体O1和液压马达1组成的子系统满足L2和L∞虚拟稳定性。同理,物体O2与液压马达2组成的子系统和物体O3与液压马达3组成的子系统同样满足虚拟稳定性。进一步,根据文献[14]中Theorem 2.1,整个机械手系统满足虚拟稳定性。 机械手腕各子系统物体动态方程可写为 (60) 其中:piL=pi1-pi2为负载压力差;Bi为黏性摩擦系数;Ji为每个物体绕各自转动轴的转动惯量。因机械手腕为多自由度运动系统,各物体之间存在动态耦合,当考虑单个物体时,以fi(t)表征各个物体转动轴方向的外部干扰力,其余方向的作用力通过结构去承受,根据1.3节,转动轴方向上的可建模外部干扰力可表示为 (61) 定义 (62) 则伺服阀流量方程(40)可改写为 (63) 定义系统状态变量为 (64) 由式(38)(39)(41)(60)(64)可得系统非线性模型的状态空间形式为 (65) 其中:i=1,2,3,bi=Bi/Ji;di(t,x1,x2)=fi(t,x1,x2)/Ji;Δi为未建模干扰;Vi为马达腔体容积。为简化设计,省略下标i,非线性方程(65)写成归一化形式为 (66) 在设计鲁棒控制器前,先做如下假设: 假设1 系统的外部未建模干扰三阶连续可微且均有界,即 (67) 并假设 (68) 式中:ξN2、ξN3为已知界。 假设2 系统的参考指令信号xd(t)是三阶连续的,且系统期望位置指令、速度指令、加速度指令以及加加速度指令都是有界的。 定义如下误差变量: (69) 式中:k1、k2和k3均为正的反馈增益。由式(69)可知: (70) (71) 在误差变量的定义中,各个误差信号之间的传递均经过稳定的可设计的滤波器。因此,若可以设计一个鲁棒控制器,使得高阶的误差信号,如r趋近于0,则系统实际的跟踪误差e3、e2和e1也趋于0。根据式(71),可设计鲁棒控制器为 (72) 式中:kr>0为控制器增益;κ>0为鲁棒增益。由式(72)可知,控制器中除了含有系统的模型补偿项,还含有一个与误差信号e3的符号积分有关的鲁棒项μ,即RISE鲁棒项。将式(72)代入式(71)得: (73) 从式(73)可以看出,在控制器中引入RISE鲁棒项的目的是镇定子系统的未建模外干扰。对式(73)微分得: (74) (75) 为便于分析控制器[式(72)]的性能,在介绍其性能定理前,先给出如下引理: 引理1 定义变量L(t)及辅助函数P(t)为 L(t)=r[N-κsign(e3)] (76) (77) 如果鲁棒增益κ满足如下不等式,即 (78) 则辅助函数P(t)恒为正值。证明:参见文献[19-20]。 由引理1可知,辅助函数P(t)的微分为 (79) 基于引理1,有如下性能定理。 定理1 对于非线性系统(65),若控制器(72)的控制增益κ满足不等式(78),且其反馈增益足够大使得定义的矩阵Λ为正定矩阵: (80) 则闭环系统中所有信号均有界,且鲁棒控制器(72)可获得渐近跟踪性能,即当t→∞时,e→0,其中e定义为e=[e1,e2,e3,r]T。 证明:定义如下李雅普诺夫函数 (81) 其时间微分为 (82) 并由误差动态方程(69)(74)(79)及矩阵Λ的正定性,可推导出: (83) 采用数值仿真方式验证文中提出的基于虚拟分解的符号积分鲁棒控制器的有效性和优越性。3个关节的期望跟踪轨迹曲线设置为 (84) 此外,3个关节初始角度为1、0、1 rad。系统主要物理参数如表1所示。 表1 主要物理参数 为充分验证基于虚拟分解的符号积分鲁棒控制在机械手腕上应用的优越性,仿真对比验证如下4种控制器: (1)PI:工业上广泛应用的比例-积分控制器。 (2)VFPI:同样在工业上广泛运用的速度前馈比例-积分控制器,VFPI控制器可表示为 (85) (3)VDC:即文中研究的虚拟分解控制方法。 (4)VD-RISE:即文中提出的基于虚拟分解的符号积分鲁棒控制方法。 各关节控制参数选取见表2。 表2 关节控制参数 采用以下4个性能指标来评估所对比的3种控制器的性能,即最大跟踪误差Me、平均跟踪误差μ、跟踪误差的标准差σ和最大误差速度比ρ,其定义分别为 (86) (87) (88) (89) 关节位置轨迹跟踪效果如图4—9所示,稳态跟踪性能指标在表3—5中给出。如图4、6、8所示:在VDC和VD-RISE控制器的作用下,关节的转动角度可以很好地跟踪期望的位置指令。表3—5中的性能指标对比及图5、7、9中的跟踪误差对比揭示了所提出的VD-RISE控制器在评价指标上优于其他3种控制器。具体来分析,PI控制器的控制精度一般,效果最差。而VFPI在采用相同kp和ki反馈增益的情况下,施加一定的速度前馈补偿使得跟踪性能比PI控制器要好。在VDC控制中,融合了液压马达的需求力和实际测量到的力作为力反馈,3个液压马达的需求力和实际出力分别如图10—12所示。可以看出,液压马达的需求力矩和实际作用力矩二者大致接近,体现了虚拟分解较好的合理性和有效性,但是仍然具有一定的误差,所以力反馈增益kf在控制输入中将取得较小,如表2所示。同时也反映出基于机械臂3D模型的虚拟分解存在一定的参数不确定性。尽管如此,VDC控制器较PI和VFPI也体现出了更为出色的控制性能,相信通过文献[14]中提到的参数自适应算法可进一步提高控制性能。 表3 关节1最后两周期跟踪性能 表4 关节2最后两周期跟踪性能 表5 关节3最后两周期跟踪性能 图4 关节1轨迹跟踪 图7 关节2轨迹跟踪误差 图10 关节1需求力矩与实际作用力矩 图11 关节2需求力矩与实际作用力矩 图12 关节3需求力矩与实际作用力矩 图13 干扰力矩 图14 伺服阀输入电压 文中通过结合虚拟分解和积分鲁棒反馈,提出了基于虚拟分解的误差符号积分鲁棒控制(VD-RISE)方法用于液压机械手系统的高精度跟踪控制。所设计的基于虚拟分解的积分鲁棒控制器具有优异的鲁棒能力,可以使液压机械手电液伺服系统获得渐近跟踪性能。通过对比仿真,验证了所提出的控制器的有效性,VD-RISE控制在最大误差Me、平均误差μ和误差标准差σ方面的控制性能优于PI、VFPI和VDC。此外VD-RISE方法的最大误差速度比ρ较其他3种控制方法也显著提高。综上,本文作者在已有方法基础上进一步研究高精度跟踪控制方法,取得了较好结果,对多自由度液压机械臂跟踪控制方面研究有一定的推动指导作用。2.4 虚拟分解控制稳定性分析
3 虚拟分解-符号积分鲁棒控制
3.1 虚拟分解-符号积分鲁棒控制器设计
3.2 虚拟分解-符号积分鲁棒控制器稳定性分析
4 仿真验证
5 结论