王元生,杨书根
(1.盐城工业职业技术学院 汽车工程学院, 江苏 盐城 224005;2.江苏大学 机械工程学院,江苏 镇江 212013;3.江苏高精机电装备有限公司,江苏 盐城 224053)
随着现代科技的不断发展,高端数控机床在装备制造业领域发挥越来越重要的作用。现代数控机床已向高精度和高速化的方向不断发展,但是想要实现高精度运动控制并不容易,由于X-Y数控工作台广泛用于机械制造过程中,系统总是受到多种非线性影响,如非线性摩擦、输入饱和、齿隙和外部扰动等,其中以摩擦非线性对系统的运动控制的影响最为明显,因此,研究设计一种高效的控制器来实现摩擦补偿,对提高X-Y工作台的控制性能具有重要意义[1-5]。
摩擦导致伺服系统在零速附近表现出很强的非线性特征,会使系统的控制效果在低速和速度转向时恶化。学者们研究了多种摩擦补偿的方法[6-7]。文献[8]提出了一种基于输出反馈的自适应反步控制器。文献[9]设计了基于滑模观测器的自适应控制器,采用滑模观测器估计LuGre模型内部的摩擦状态,再基于估计的摩擦状态,设计自适应控制器来实现未知的摩擦和负载转矩的补偿。文献[10]设计自适应鲁棒控制器来实现摩擦补偿。除了非线性摩擦的影响外,其他不确定非线性包括外部扰动等都对高精度的系统设计带来困难和挑战,因此需要同时考虑这些问题。对于文献[10],当外部扰动逐渐增大时,设计强增益的非线性鲁棒反馈项来补偿扰动,这种控制器的保守性就会逐级暴露出来,越强的外部扰动会导致越差的跟踪性能,最终会带来系统的失稳。
由于神经网络的设计不需要被控对象的数学模型,且具有很强的自学习和自适应能力,故在不确定性补偿上面取得了很好的效果[11-13];同时,神经网络可以对任意未知非线性函数进行任意精度的逼近。因此,可设计神经网络观测器用来补偿外部扰动。本文结合自适应鲁棒控制和神经网络的在线学习能力的思想,提出一种基于非线性双观测器的自适应神经网络控制器,以显著提高伺服系统的跟踪性能;通过设计非线性双观测器用来逼近LuGre模型内部不可测量的摩擦状态,同时设计神经网络观测器用来补偿外部扰动;通过李雅普诺夫函数验证了系统的稳定性和对位置和速度的期望信号的渐近跟踪。为验证这种方法的有效性,对伺服系统进行跟踪仿真,通过仿真结果验证所提出的控制策略的高性能。
本文所考虑的X-Y数控工作台的结构示意图如图1所示,主要由控制器、伺服驱动器、伺服电机、编码器和执行机构等组成。
图1 X-Y数控工作台系统示意图
根据牛顿第二定律,X-Y工作台的动力学方程如下:
(1)
其中,j是转动惯量;x是电机输出轴的位置;U是控制量;F是摩擦力矩;TL是负载扭矩;d是模型的其它不确定项,包括外部扰动。
采用动态LuGre摩擦模型,能够比较全面的描述摩擦力现象,故摩擦力矩表示如下:
(2)
(3)
(4)
定义新函数N(x2)=α(x2) |x2|,将方程(2)、(3)代入到方程(1)中,因此X-Y工作台的系统模型可表示为:
(5)
假设1:给定所期望的运动轨迹x1d(t)是有界的,且有二阶有界导数。
假设2:参数θ和时变扰动d分别满足:
θ∈Ωθ={θ:θmin≤θ≤θmax}
(6)
|d|≤δ
(7)
其中,θmin=[θ1min,…,θ5min]T,
θmax=[θ1max,…,θ5max]T是已知的;δ是已知的有界正函数。
(8)
其中,i=1、2、3、4、5,·i代表矩阵·的第i项。设计参数自适应律为:
(9)
(10)
(11)
由于LuGre模型中的鬃毛平均变形状态Z不可以测量,为了观测到状态Z以及处理其非线性, 设计非线性双观测器估计摩擦状态。非线性双观测器方程设计如下:
(12)
定义投影映射为:
(13)
其中,观测器的范围为:Zmax=Fs,Zmin=-Fs。上述观测器具有以下性能:
(14)
(15)
(16)
一个典型的RBF神经网络的结构如图2所示。
图2 RBF神经网络的结构图
由于神经网络的万能逼近特性,设计RBF神经网络观测器去估计时变扰动,其网络算法为:
(17)
(18)
式中,x为网络的输入,j为网络隐含层第j个节点,h=[hj]T为网络的高斯基函数输出,W*为网络的理想权值;εapprox为网络的逼近误差,
(19)
网络输入取xv=[x1,x2]T,则网络输出为:
(20)
设计权值自适应律为:
(21)
(22)
步骤1:定义期望的位置信号x1d,e1=x1-x1d表示位置跟踪误差信号。e2=x2-x2eq表示输入误差,由此可得:
(23)
根据方程(23),设计虚拟控制函数x2eq为:
(24)
其中,k1是正的反馈增益。将(24)带入(23)中,则可得误差动力学方程为:
(25)
步骤2:在这一步中设计实际的控制律u。e2的导数可以表示为:
(26)
则设计系统的控制量u为:
(27)
其中,u为所设计的控制量,u2为非线性鲁棒项。将上述方程带入方程(26)中,e2的导数可以表示为:
(28)
步骤3:在这一步中,非线性鲁棒反馈项U2被设计为:
(29)
其中,hs是所有误差的上限,且是满足下列条件的任何光滑函数:
(30)
εs是一个正实数,它具有以下性质:
(31)
e2·U2≤0
(32)
定义Lyapunov方程V1(t)为:
(33)
由方程(28)我们可以得到:
(34)
由不等式(31)上述方程可以简化为:
(35)
(36)
其中,λ=2k2/θ1min,故当e→∞,V1(t)=εs/λ,且:
(37)
(38)
因此,基于非线性双观测器的自适应神经网络控制器能够保证规定的输出跟踪瞬态性能和最终跟踪精度。一段有限的时间后,通过减小参数可以将跟踪误差调整到规定的范围内。
结论1:对于X-Y数控工作台的系统(5),可以通过使用双观测器(12)来估计内部摩擦状态;自适应控制器(27)保证了位置和速度信号渐近跟踪期望的轨迹,且跟踪误差是有界的。
因为系统只存在参数的不确定性, 设计以下的李雅普诺夫函数:
(39)
由前述V1(t)的导数,可以得到:
(40)
由方程(11)、(15)和(32)化简的导数得:
(41)
基于双观测器的自适应神经网络控制器,可以在系统只存在参数不确定性存在下,实现渐近输出跟踪。
结论2:如果一段有限时间后,系统只存在参数不确定性,d=W*Th(x)即一段有限的时间后εapprox=0除了在结论1的结果,还可以实现渐进输出跟踪。即e→0ast→∞,其中e=[e1,e2〗T。
本文设计的控制器参数选取为:自适应控制器的参数k1=160,k1=50,自适应率的参数Γ1=diag{0.04,0.2,0.03,0.005,0.005}。双观测器的参数选取为:γ1=0.05,γ2=0.04。神经网络参数:c=0.5[-2-1012]T,b= 3,Γ2=0.03。而PID控制器的参数选取为:kp=250,ki=80,kd=30。
为了证明所提出的控制器的有效性,对基于双观测器的自适应神经网络控制器(ARCDO)和PID控制进行了比较。外部扰动是时变的,即扰动d=0.004x1x2,仿真结果如图3~图6所示。图3表示系统分别在ARCDO和PID这两个控制器下的位置跟踪误差。图3a显示,PID控制器的跟踪误差约为0.032rad,而图3b显示,ARCDO控制器的跟踪误差为1×10-4rad。显而易见,使用ARCDO控制器的最终跟踪误差和瞬态性能比PID控制要好得多,并且系统对外部扰动以及摩擦力矩变化的抑制能力非常强,稳态跟踪误差几乎不受外部扰动和摩擦力矩变化的影响。采用非线性双观测器估计摩擦状态,其估计值和实际值如图4和图5所示。图6为外部扰动的估计值和实际值。
(a)PID控制器的位置跟踪误差
(b)控制器的位置跟踪误差
图4 摩擦状态的实际值和估计值
图5 摩擦状态的实际值和估计值
图6 外部扰动的实际值和估计值
本文提出一种基于双观测器的自适应神经网络控制器,以补偿非线性摩擦和扰动对伺服系统的影响。设计非线性观测器估计LuGre模型内部不可测量的摩擦状态,神经网络用来补偿外部扰动,同时设计自适应控制器以估计系统中不确定的参数。通过李雅普诺夫函数验证了闭环系统的稳定性。研究结果表明,利用基于双观测器的自适应神经网络控制方法可以满足X-Y工作台在摩擦和扰动的影响下具有较高的跟踪精度要求,同时使系统具有较好的鲁棒性能。仿真结果验证了所设计控制器的有效性。