不确定离散线性系统的鲁棒单调收敛迭代学习控制*

2013-08-16 05:47李致富胡跃明
关键词:鲁棒单调增益

李致富 胡跃明

(1.华南理工大学机械与汽车工程学院,广东广州510640;

2.华南理工大学精密电子制造装备教育部工程研究中心,广东广州510640)

迭代学习控制[1-2](ILC)利用系统以前的控制信息不断地修正控制输入,使得被控系统产生期望的运动轨迹.迭代学习控制因不需要精确的系统模型信息而受到了众多学者的关注,已经发展成为最主要的智能控制方法之一[3-5].然而,目前绝大部分的迭代学习收敛算法都是针对标称系统设计的[6-9].从工程应用角度来看,在迭代学习控制中,不确定系统的鲁棒性和输出误差的单调收敛性尤为重要,因此,近年来,迭代学习控制的鲁棒单调收敛性问题逐渐成为迭代学习控制研究中的热点[10].文献[11]中基于μ分析方法对不确定性系统设计了鲁棒单调收敛的有限时间区间迭代学习控制算法.文献[12]中采用超级向量法对带有马尔可夫参数区间不确定性的系统设计了鲁棒单调收敛的迭代学习控制算法.而采用线性矩阵不等式(LMI)方法来研究鲁棒单调收敛问题的文献较少.尽管文献[13]中基于二维(2D)方法对带有参数不确定性的时延线性系统设计了鲁棒单调迭代学习控制算法,并得出了基于LMI的充分条件,但该算法需满足初始状态值等于期望初始状态值的ILC复位条件.

文中基于LMI研究一类带有初始状态误差的不确定离散线性系统的迭代学习单调收敛问题,提出了一种采用简单P-型学习律的鲁棒单调收敛的迭代学习控制策略.首先把鲁棒单调迭代控制问题转化为一维系统的H∞干扰抑制问题,然后给出系统的稳定性分析和用LMI表示的鲁棒单调收敛的充分条件,该LMI条件还可用于确定学习律的增益.最后,通过仿真实验验证了该鲁棒单调迭代学习控制策略的有效性.

1 问题的提出

考虑如下带有参数扰动的不确定离散线性系统:

式中:时间变量 t=0,1,…,N;xk(t)∈Rn、uk(t)∈Rm和yk(t)∈Rp分别为系统在第k次迭代运动中的状态向量、输入向量和输出向量;A、B、C为合适维数的标称系统的实矩阵,不失一般性,假设B和C为满秩矩阵;ΔA(t)和ΔB(t)为t时刻与矩阵A、B对应的不确定扰动,满足

W、F1、F2为合适维数的实常数矩阵,Σ(t)为未知的时变矩阵,且满足ΣT(t)Σ(t)≤I,I为单位矩阵.

在系统(1)的迭代学习过程中,令其期望输出为yd(t),对应的期望状态为xd(t),输出误差定义为ek(t)=yd(t)-yk(t),且作如下假设:

(1)矩阵A是稳定的;

(2)对于预先给定的期望输出yd(t),存在唯一的输入序列 ud(t),t∈[1,N],使得系统(1)成立;

(3)在迭代学习控制过程中,迭代初始状态满足xk(0)=x0,其中x0为有界的任意给定点.

考虑如下的P-型迭代学习律:

系统(1)在假设(1)-(3)成立的情况下,采用学习律(3)寻找合适的学习增益K,使得

(i)当 k ∞时,输出误差 ek(t)趋于0(t∈[1,N]);

(ii)输出误差2-范数单调收敛,即满足

式中,γe∈(0,1],范数定义为

2 鲁棒单调收敛控制

首先,考虑系统(1)不带参数扰动时的情况,即ΔA(t)=ΔB(t)=0.

定理1 系统(1)不带参数扰动时,在假设(1)-(3)成立的情况下采用学习律(3),如果存在标量0<γ≤1、正定矩阵 P=PT>0和矩阵X,使得如下LMI成立:

式中,*表示对称矩阵中的对称部分.那么,当k ∞时,输出误差 ek(t)趋于 0(t∈[1,N]),且式(4)单调收敛.此外,当LMI(5)满足时,增益K为

证明 定义 ηk(t)=xk+1(t-1)-xk(t-1),当ΔA(t)=ΔB(t)=0时,由式(1)和(3)可得

从传统一维系统的输入-输出角度,将式(7)和(8)中的t视为离散时间,ηk(t)视为状态向量,ek(t)视为扰动输入,ek+1(t)视为输出向量.将系统的传递函数记

为G(z),由无穷范数定义可知由假设(3)可知,ηk(0)=0,再由假设(1),根据文献[14]的引理4.1可知,的充要条件是:存在正定矩阵P1=>0,使得

成立.对式(10)分别左乘和右乘矩阵diag{■γP1,,可得

记P1=γP-1,X=K,并对式(11)分别左乘和右乘矩阵 diag{P/γ,1,P,1},则式(11)可转化为等价的LMI(5).因此,由式(5)成立可得

由式(9)和(12)可知式(4)成立,而且

注意到系统在第一次迭代运行(即k=0)时,其初始控制输入u0(t)是有界的,而且系统是稳定的,因此也是有界的.由式(13)可得,当成立.因此易知,当k ∞时,输出误差 ek(t)趋于0(t∈[1,N]).证毕.接下来讨论系统(1)带有参数不确定性的情况.引理1[15]给定合适维数矩阵 Q=QT、H、R,对任意满足ΔTΔ≤I的Δ,使

成立的充分必要条件是:存在ε>0,使得

定理2 系统(1)带有参数扰动(2)时,在假设(1)-(3)成立的情况下采用学习律(3),如果存在标量0<γ≤1、ε>0、正定矩阵 P=PT>0和矩阵X,使得如下LMI成立:

则k ∞时,输出误差ek(t)趋于0(t∈[1,N]),且式(4)单调收敛.此外,当LMI(5)满足时,增益K=X.

证明 首先由式(1)和(3)可得和

式中,AΔ=A+ΔA,BΔ=B+ΔB.同理,把式(17)和(18)视为一维离散不确定系统,由定理1和文献[14]的定义4.1可知,系统是二次稳定的,而且对于扰动输入具有H∞干扰抑制度γ的充要条件是:存在正定矩阵P=PT>0和矩阵X,使得

同理,在假设(1)-(3)成立的情况下采用学习律(3),式(19)成立是系统(1)带有参数扰动(2)时式(4)单调收敛的充分条件.

引理1可知,ψ<0成立的充要条件是:存在ε>0,使得

成立.式(21)可改写为

式中,

应用Schur补引理,由式(22)可得到式(16).其余部分的证明省略,因为其证明和定理1相似.

说明1 文献[16]中推导出系统(1)在没有参数扰动和采用学习律(3)时,输出误差一致收敛的充要条件:矩阵I-CBK是稳定的.但文献[16]中的ILC方法仅能保证系统的输出误差是渐近稳定的,而不是单调收敛的.

说明2 由式(5)可知

成立,整理可得

因为0<γ≤1且P为正定矩阵,由式(6)和(23)可知,矩阵I-CBK不仅是稳定的,而且还要满足式(23).换句话说,式(5)比“矩阵I-CBK是稳定”的约束更强,这样才能保证系统(1)在没有参数扰动和采用学习律(3)时的输出误差是单调收敛的.

说明3 在定理1和2的证明过程中,定义ηk(t)=xk+1(t-1)-xk(t-1),同时从传统一维系统的角度来考虑二维系统,并将ηk(t)视为一维系统的状态向量,这是文中基于LMI的迭代学习控制策略能满足假设(3)的一个关键点.

3 仿真研究

初始状态值为,∀k≥1.显然,xk(0)不等于期望的初始状态值,存在初始状态误差.此外,矩阵A是稳定的,满足假设(1).采样时间Ts=1ms.

使用Matlab的LMI工具箱对LMI(16)进行求解,当 γ =0.9、ε =5 时,式(16)可解.因为 tmin=-0.026,满足LMI有解的充要条件 tmin<0.此外,可得到X=0.2962,因此学习增益 K=X=0.2962.不确定离散线性系统应用ILC学习律(3)、期望轨迹为式(24)时的仿真结果如图1所示.显然,基于LMI(16)求解得到的学习增益,可以保证带有初始状态误差和参数不确定离散系统的输出误差2-范数是鲁棒单调收敛的,当迭代到第13次时,输出误差2-范数开始趋近于0.

图1 不确定离散线性系统迭代学习控制的仿真结果Fig.1 Simulation results of ILC for uncertain discrete linear system

将文献[16]中的控制策略与文中的控制策略分别应用到标称系统中进行仿真实验.其中参数的扰动设置为 0,即 Σ(t)=diag(0,0).文献[16]中只要求I-CBK稳定即可,文中取K=0.5,满足渐近稳定的要求.由定理1,通过Matlab的LMI工具箱,取γ=0.9,解 LMI(5)可得 K=X=0.1487(tmin=-0.048).这两种策略的仿真结果如图2所示.显然,文中的迭代学习律可以保证系统的输出误差是单调收敛的;对于文献[16]的学习增益,系统的迭代过程是渐近稳定而不是单调收敛的,迭代到第398次时,系统的输出误差2-范数达到一个极大值.产生此种现象的原因是K=0.5时LMI(5)是不可解的.

图2 两种控制策略的仿真结果比较Fig.2 Comparison of simulation results between two control schemes

4 结语

文中采用简单的P-型迭代学习律研究带有参数不确定性和初始状态误差的离散线性系统的鲁棒单调收敛迭代学习控制问题,通过将鲁棒单调迭代控制问题转化为一维系统的H∞干扰抑制问题,推导出一个基于LMI的鲁棒单调收敛的充分条件,该LMI条件还可用于确定学习律的增益.文中最后通过仿真实例验证了该鲁棒控制策略的有效性.文中研究的迭代控制算法虽然可以达到初始状态与期望状态不一致的要求,但在迭代过程中还需要满足初始状态一致的条件,因此,将此条件放宽到“迭代过程中初始状态误差可在一个小的有界邻域内任意变化”的条件是下一步研究的方向.

[1]Arimoto S,Kawamura S,Miyazaki F.Bettering operation of bobotics by learning [J].Journal of Robotic Systems,1984,1(1):123-140.

[2]Bristow D A,Tharayil M,Alleyne A G.A survey of itera-tive learning control:a learning-based method for highperformance tracking control[J].IEEE Control Systems Magazine,2006,26(3):96-114.

[3]Ahn H S,Chen Y Q,Moore K L.Iterative learning control:brief survey and categorization [J].IEEE Transactions on Systems,Man,and Cybernetics,Part C:Applications and Reviews,2007,37(6):1099-1121.

[4]Li X D,Chow Tommy W S,Ho John K L,et al.Iterative learning control with initial rectifying action for nonlinear continuous systems[J].IET Control Theory and Applications,2009,3(1):49-54.

[5]Xu J X.A survey on iterative learning control nonlinear systems [J].International Journal of Control,2011,84(7):1275-1294.

[6]田森平,谢胜利,傅予力.一种新的迭代学习控制快速算法[J].华南理工大学学报:自然科学版,2002,30(5):37-40.Tian Sen-ping,Xie Sheng-li,Fu Yu-li.Fast algorithm of iterative learning control[J].Journal of South China University of Technology:Natural Science Edition,2002,30(5):37-40.

[7]Tayebi A,Zaremba M B.Exponential convergence of an iterative learning controller for time-varying nonlinear systems[C]∥Proceedings of the 38th Conference on Decision and Control.Phoenix:IEEE,1999:1593-1598.

[8]毛祖永,李晓东.具有迭代初始误差的高相对度线性离散系统的迭代学习控制[J].控制理论与应用,2012,29(8):1078-1081.Mai Zu-yong,Li Xiao-dong.Iterative learning control for linear discrete systems with high relative degree and iterative initial error[J].Control Theory and Applications,2012,29(8):1078-1081.

[9]Moore K L,Chen Y,Bahl V.Monotonically convergent iterative learning control for linear discrete-time systems[J].Automatica,2005,41(9):1529-1537.

[10]阮小娥,朴光贤,卞增男.迭代学习控制技术回顾与长期学习控制展望[J].控制理论与应用,2012,29(8):966-973.Ruan Xiao-e,Park Kwang-hyun,Bian Zeng-nan.Retrospective review of some iterative learning control techniques with a comment on prospective long-term learning[J].Control Theory and Applications,2012,29(8):966-973.

[11]Wijdeven J V D,Donkers T,Bosgra O.Iterative learning control for uncertain systems:robust monotonic convergence analysis[J].Automatica,2009,45(10):2383-2391.

[12]Ahn H S,Moore K L,Chen Y Q.Stability analysis of discrete-time iterative learning control systems with interval uncertainty[J].Automatica,2007,43(5):892-902.

[13]Meng D,Jia Y,Du J,et al.Monotonically convergent iterative learning control for uncertain time-delay systems:an LMI approach[C]∥Proceeding of the American Control Conference.St Louis:IEEE,2009:1622-1627.

[14]Xie L H.Output feedback H∞control of systems with parameter uncertainty[J].International Journal of Control,1996,63(4):741-750.

[15]吴敏,桂卫华,何勇.现代鲁棒控制[M].2版.长沙:中南大学出版社,2006:54-56.

[16]Fang Y,Tommy W S C.2-D analysis for iterative learning controller for discrete-time systems with variable initial conditions[J].IEEE Transactions on Circuit and Systems I:Fundamental Theory and Applications,2003,50(5):722-727.

猜你喜欢
鲁棒单调增益
单调任意恒成立,论参离参定最值
基于增益调度与光滑切换的倾转旋翼机最优控制
数列的单调性
数列的单调性
基于单片机的程控增益放大器设计
对数函数单调性的应用知多少
基于学习的鲁棒自适应评判控制研究进展
基于Multisim10和AD603的程控增益放大器仿真研究
目标鲁棒识别的抗旋转HDO 局部特征描述
基于Cauchy鲁棒函数的UKF改进算法