金 奎,孙明轩
(浙江工业大学 信息工程学院,浙江 杭州 310023)
输入限幅下的迭代学习控制
金 奎,孙明轩
(浙江工业大学 信息工程学院,浙江 杭州 310023)
基于Lyapunov-like方法,提出在有限作业区间上实现跟踪的带限幅的迭代学习控制器设计.针对含有非参数化及部分参数化不确定性的非线性系统,设计鲁棒迭代学习控制器,但该方法不要求已知不确定特性的范数界.针对参数化不确定非线性系统,设计自适应迭代学习控制器.在系统满足有界输入有界状态(BIBS)假设条件及控制输入饱和限幅作用下,统一对上述三类系统进行分析.理论分析结果表明:该方案可保证闭环系统中所有变量的有界性,并且跟踪误差能够在整个作业区间上收敛到零,实现完全跟踪.仿真验证了该算法的有效性.
迭代学习控制;输入限幅;有界输入有界状态
迭代学习控制(ILC)适于有限区间[0,T]上完成重复作业的被控对象,利用系统先前的控制经验和输出误差修正当前的控制作用,使系统在[0,T]上实现输出完全跟踪期望的控制任务[1].二十多年来,因其能达到常规反馈控制所不能的控制品质,已越来越多地受到人们的关注.早期的迭代学习控制理论以压缩映像方法进行收敛性分析.近年来兴起的基于Lyapunov-like方法的学习控制,能有效结合其他主流控制方法.到目前为止,已发表文献大多要求非线性不确定动态特性能够被参数化.Sadegh N 和 Kuc T 等[2-3]较早引入 Lyapunov-like函数,将满足全局Lipschitz连续条件放宽为局部Lipschitz连续条件;French M等[4]则采用微分学习律处理常参数扰动,被学习参数前一次的终值与后一次初值相同,此方法又被称为自适应迭代学习控制;Dixon W E 等[5]针对一类周期系统,基于 Lyapunov-like函数设计重复控制律分析系统的稳定性与收敛性;Sun Ming-xuan等[6]研究了重复学习控制,它不要求初始定位操作,也不要求被学习量满足周期性要求,回避了迭代学习控制中初始定位误差问题;陈为胜等[7]针对周期时滞非线性参数化系统设计自适应学习控制方案.但对于非参数化不确定非线性系统的学习控制研究成果不多.Xu Jian-xin等[8]设计变结构迭代学习控制,保证了系统的有界性与收敛性,但所设计的控制器中包含符号函数;Ham C等[9]基于Lyapunov直接方法设计鲁棒迭代学习控制;文[10]利用状态反馈线性化的方法研究其在无限时间区间上周期作业的跟踪控制问题;陈彭年等[11]提出了跟踪周期信号的自适应控制律,保证闭环系统所有信号有界和跟踪误差趋于零;刘丽等[12]利用控制器中的鲁棒部分保证系统稳定性,利用学习控制部分有效消除系统跟踪误差.
实际中,执行器饱和特性广泛存在,它在很大程度上影响着控制系统的性能,甚至破坏系统的稳定性.特别对于迭代学习控制系统,信号沿迭代轴的积分特性以及一些不可重复性因素存在,使得执行器饱和特性对控制系统性能的影响尤为突出.因此,对输入进行限幅对改善系统的性能是非常有必要的.Xu Jian-xin等[13]针对控制输入矩阵已知的非线性不确定系统,设计带饱和的迭代学习控制器,实现系统完全跟踪;孙明轩等[14]针对较为广泛的一类在有限作业区间上重复运行的非线性系统,提出重复学习控制方法,分别针对部分限幅和完全限幅学习两种情形,证明系统的有界性和收敛性.
基于Lyapunov-like方法,分别针对非参数化,部分参数化及参数化三种情形,设计鲁棒迭代学习控制器及自适应迭代学习控制器,其中所给出的鲁棒迭代学习律不需利用非参数化不确定特性的范数界.在假定系统有界输入有界状态下,考虑带限幅的控制输入,将控制输入限制在一预先给定的范围内,从而使得系统的状态保持有界.所设计的带输入限幅的迭代学习控制器,既保证了闭环系统的有界性,同时实现了在有限区间[0,T]上完全跟踪.
考虑下述输入限幅下不确定非线性时变系统,即
式中:k为系统运行的重复次数;xk(t)=[x k,1(t),x k,2(t),…,x k,n(t)]T∈Rn为可测系统状态;uk(t)∈R1为限幅的控制输入,其幅值可预先给定;f(xk(t),t),g(xk(t),t)∈R1为未知的光滑非线性连续函数.
考虑系统在区间[0,T]上重复作业.给定的期望轨迹xd(t)=[x d,1(t),x d,2(t),…,x d,n(t)]T∈Rn有界,它满足
理想控制输入ud(t)在预定的限幅范围内.记各个状态分量误差ei,k(t)=x d,i(t)-x k,i(t),i=1,2,…,n状态误差为
要实现的控制目标是寻找合适的控制输入uk(t),使得在其作用下的状态误差ek(t)在整个作业区间[0,T]上收敛于零.为方便叙述,将略写函数,例如,f k(t)=f(xk(t),t),f d(t)=f(xd(t),t).
引入误差函数为
其中:αi(i=1,2,…,m,αm=1)为 Hurwitz系数,记α=[α1,α2,…,αm-1,1]T.
对于系统(1),我们作如下假设:
假设1 在每次迭代开始时,系统满足初始定位条件xk(0)=xd(0).
假设2 系统满足BIBS条件.
假设3 控制输入矩阵g k(t)关于xk(t)满足局部Lipschitz条件
定义标量a的饱和函数为
式中,a*为饱和函数的幅值.
为更好地分析系统收敛性,首先给出关于饱和函数的性质P1.
P1 对于等式ν=sat(μ)+d,满足
性质P1的证明可参见文献[13]性质2.
注2 实际系统的能量总是有限的,会满足有界输入有界状态这一条件.
假设2可得系统的有界性.本节分别针对含非参数化,部分参数化及参数化不确定性的非线性系统进行讨论,给出了在输入限幅下迭代学习控制的收敛性证明.
为更好分析闭环系统的收敛性,给出如下引理.
引理 对于系统状态误差ek及误差函数σk,满足不等式
证明可参见文献[15]引理3.该引理将状态误差与误差函数联系起来,从而为系统的性能分析带来方便.
假设4f k(t)满足局部Lipschitz条件.
本小节包含假设1-4.根据假设2,存在未知常数l f>0,满足
根据式(3),并对误差指标函数σk进行求导,得
选取被学习量为ud(t),通过不断对理想控制输入进行学习,使得系统的跟踪误差收敛于零.为此,提出以下学习律为
假设5fk可被参数化,fk=,未知函数φk满足局部Lipschitz条件,且时变函数θ 的上界为θ*.
本小节包含假设1-3.根据假设5,存在未知常数lφ>0,满足
类似地,系统的控制输入为
本小节包含假设1-3及假设6,根据式(4)得逆系统方程,得
定理 对于系统(1),给定期望轨迹(2),当满足结论C1时,系统状态误差在区间[0,T]上收敛于零,即
针对f k(t)非参数化与g k(t)非参数化及f k(t)参数化与g k(t)非参数化情形下,设计全饱和的鲁棒迭代学习控制器,使得输出限定在预先设定的幅值u*范围内;而在f k(t)参数化及(t)参数化中,分别对两被学习参数采取限幅措施,将输出限定在范围内.实际中,运行系统的执行器都会受到饱和限制.因此,在设计控制器时,考虑控制输入饱和限幅,可确保控制系统性能.
选取一单级倒立摆系统作为被控对象.倒立摆的动态方程[16]为
式中:xk,1,xk,2分别为摆的角位移和角速度;g=9.8 m/s2为重力加速度;mc为小车的质量;m为摆的质量;l为摆长的一半;uk为小车的推力(控制输入);Δfk为该系统的干扰部分.控制目标是使系统输出yk在[0,2π]内跟踪上目标y d=0.1sin(t).选取,mc=1 kg,m=0.1 kg,l=1 m及干扰部分d=sin(t).
采用控制律式(17),对该系统进行仿真,记指标J k=supt∈[0,T]|σk|.为使指标Jk≤0.001,系统需经过k=13次迭代.参数u*和γ1分别为5和10,系统初值xk(0)=[0,0.1]T.
图1-3为系统在式(17)的仿真结果.图1表明,指标Jk随着迭代次数增加而减小;由图2知,在第13次迭代时,系统输出误差δy k=y d-y k精度的数量级达到10-5;图3为第13次迭代时系统的控制输入;由仿真结果表明:指标Jk关于k单调递减,且在第13次迭代时系统的跟踪误差精度数量级达到10-5,从而可得收敛性结论(limk→∞ek(t)=0,t∈[0,2π]);系统的控制输入被限制于预先设定的范围内(-5~5).仿真结果与理论分析结果相符,表明所提方法是可行的.
图1 输入限幅下的迭代学习控制的J k轨迹Fig.1 Performance index Jk by iterative learning control with input saturation
基于Lyapunov-like方法设计了带饱和限幅的鲁棒和自适应迭代学习控制器.分别针对含有非参数化,部分参数化及参数化不确定特性的非线性系统,讨论了限幅学习下系统的稳定性与收敛性..所提方法要求系统满足BIBS假设条件,如何放松这一假设条件是一个需要进一步研究的问题.我们只研究了带饱和限幅的迭代学习问题,如何将结论推广到重复控制及重复学习控制中也是我们今后的工作之一.
[1]ARIMOTO S,KAWAMURA S,MIYAZAKI F.Bettering operation of robotics by learning[J].Journal of Robotic Systems,1984,1(2):123-140.
[2]SADEGH N,HOROWITZ R,KAO W W,TOMIZUKA M.A unified approach to design of adaptive and repetitive controllers for robotic manipulators[J].ASME Journal of Dynamic Systems,1990,112(4):618-629.
[3]KUC T,NAM K,LEE J.An iterative learning control of robot manipulators[J].IEEE Journal of Robotics and Automation,1990,6(7):835-841.
[4]FRENCH M,ROGERS E.Nonlinear iterative learning by an adapative Lyapunov technique[J].International of Control,2000,73(11):840-850.
[5]DIXON W E,ZERGEROGLU E,DAWSON D M,et al.Repetitive learning control:a Lyapunov-based approach[J].IEEE Transactions on Robotics,2002,32(4):538-545.
[6]SUN Ming-xuan,GE S S.Adaptive repetitive learning control of robotic manipulators without the requirement for initial repositioning[J].IEEE Transactions on Robotics,2006,22(3):563-568.
[7]陈为胜,王元亮,李俊民.周期时变时滞非线性参数化系统的自适应学习控制[J].自动化学报,2008,34(12):1556-1560.
[8]XU Jian-xin,QÜZhi-hua.Robust iterative learning control for a class of nonlinear systems[J].Automatica,1998,34(8):983-988.
[9]HAM C,QÜZhi-hua,Kaloust J.Nonlinear learning control for a class of nonlinear systems[J].Automatica,2001,37(3):419-428.
[10]MARINO R,TOMEI P.An iterative learning control for aclass of partially feedback linearizable systems[J].IEEE Transactions on Automatic Control,2009,54(8):1991-1996..
[11]陈彭年,秦化淑.不确定非线性系统的周期信号自适应跟踪[J].系统科学与数学,2009,29(10):1343-1352.
[12]刘丽,孙明轩.不确定时变系统的鲁棒学习控制算法[J].控制理论与应用,2010,27(3):323-328.
[13]XU Jian-xin,TAN Ying,LEE T H.Iterative learning control design based on composite energy function with input saturation[J].Automatica,2004,40:1371-1377.
[14]孙明轩,王郸维,陈彭年.有限区间非线性系统的重复学习控制[J].中国科学,2010,40(3):433-444.
[15]XU Jian-xin,CAO Wen-jun.On functional approximation of the equivalent control using learning variable structure control[J].IEEE Transactions on Automatic Control,2002,47(5):997-1006.
[16]CHIEN J C.A combined adaptive law for fuzzy iterative learning control of nonlinear systems with varying control tasks[J].IEEE Transactions on Automatic Control,2008,16(1):40-50.
Iterative learning control with input saturation
JIN Kui,SUN Ming-xuan
(College of Information Engineering,Zhejiang University of Technology,Hangzhou 310023,China)
Based on Lyapunov-like approach,an iterative learning controller with input saturaiton for tracking in the limited time interval is proposed.For a class of nonlinear systems with nonparametric and partially parametric uncertainties,a robust iterative learning controller is designed.But this method does not require the known of the uncertain norm bounds.An adaptive iterator learning controller is designed for the nonlinear system with parametric uncertainties.The three kinds of systems above are analyzed under the systems to meet the bounded input bounded state(BIBS)assumptions and limiting the role of control input saturation.The results show that the proposed learning algorithm can guarantee boundedness of all variables in closedloop system.The tracking error can be guaranteed to converge to zero over entire time interval and perfect tracking can be achieved.The simulation result shows the algorithm is effective.
iterative learning control;input saturation;bounded input bounded state
TP391.41
A
1006-4303(2011)05-0579-07
2010-04-28
国家自然科学基金资助项目(60474041,60874041)
金 奎(1985-),男,浙江嵊州人,硕士研究生,研究方向为迭代学习控制,E-mail:zjszjk@163.com.通信作者:孙明轩教授,E-mail:mxsun@zjut.edu.cn.
book=5,ebook=113
(
刘 岩)