刘芬, 张克军
(1.西北工业大学 航海学院, 陕西 西安 710072; 2.延安大学 数学与计算机科学学院, 陕西 延安 716000;3.徐州工程学院 数理学院, 江苏 徐州 221111)
迭代学习控制(ILC)[1]是一种简单有效的学习控制策略,适用于在固定有限时间间隔内重复运行的被控系统。在足够的学习时间,可以用较少的先验模型知识和较少的在线计算来提高系统的跟踪性能。基于其优势,ILC已经成为研究热点,广泛应用于移动机器人、工业过程控制、交通信号控制等多个领域[2-4]。2001年,Chen等[5]首次提出了PDα-型分数阶迭代学习控制算法,在频域内讨论了算法的收敛性,并将迭代学习控制的应用范围推广到分数阶系统,即分数阶迭代学习控制(FOILC)。FOILC除了具有传统迭代学习控制的优点外,还可以提高具有分数阶特性的被控系统的性能。近年来,FOILC在时域方面取得了丰硕的成果,Lazarevic等[6-7]证明了PDα-型、开闭环PDα-型分数阶迭代学习算法的收敛性和稳定性。Li等[8-9]提出了几种分数阶迭代学习算法,并讨论了其收敛性和稳定性。lan等[10]研究了Dα-型分数阶迭代学习算法的收敛性问题。
在上述FOILC设计过程中,一般都是假定所研究被控系统在每一次的迭代过程中初态都与期望初态一致。但是在实际问题中,系统的期望初始状态通常是未知的,不可能保证初始状态值等于期望的初始状态值。因此,研究具有初始状态偏差的系统控制算法的鲁棒性是非常重要的。迄今为止,关于分数阶系统的初态问题的研究还很少。对于一类具有固定初始状态误差的分数阶线性定常系统,文献[11]首次提出了一种具有初始状态学习的开闭环P型ILC算法,得到了算法收敛的充分条件。文献[12]设计了具有初始状态学习的开环和闭环P型ILC方案。文献[13]将上述算法应用于一类分数阶非线性时滞系统。文献[14]针对一类具有初始状态漂移的分数阶线性定常系统,提出了一种新的修正PDα-型FOILC算法。
目前对分数阶系统的跟踪控制研究中,主要是利用λ-范数对跟踪误差进行测量。与λ-范数相比,Lebesgue-p范数更适合分析控制算法的学习行为[15-18]。
基于上述问题,本文针对一类具有任意初始状态的分数阶线性时不变系统,提出了具有初始状态学习的开环和开闭环PDα-型FOILC算法,并在Lebesgue-p范数意义下分析了算法的收敛性。
本节首先给出一些相关的数学知识。
定义1对于连续时变向量函数
f:[0,T]→Rn,(f(t)=[f1(t),f2(t),…,fn(t)]T)
则λ-范数和Lebesgue-p范数分别为
引理1[18]设函数g(t),h(t)(t∈[0,T])为勒贝格积分,若函数g(t)与h(t)的卷积
存在,则卷积积分的广义Young不等式为
‖(g*h)(t)‖r≤‖g(t)‖q‖h(t)‖p
‖(g*h)(·)‖p≤‖g(t)‖1‖h(t)‖p
定义2Riemann-Liouville′s(R-L)的左侧和右侧分数阶积分的定义为
式中,α>0,Γ(·)为Gamma函数。
Caputo左侧和右侧分数阶微分的定义分别为
式中,α∈R+,[α]是α的整数部分。
性质1[19]如果f(t)∈C[t0,∞),则
定义3[19]双参数的Mittag-Leffler函数的定义为
特别地,当β=1时,单参数的Mittag-Leffler函数的定义为
引理3[15]设Φα,β(t)=tβ-1Eα,β(Atα),t∈[0,+∞),其中,α>0,β>0,A∈Cn×n,则
引理4[21]初值问题
等价于下面的积分方程
式中,A∈Cn×n,B∈Cn×p,0<α<1。
考虑一类分数阶线性时不变系统
(1)
式中,t∈[0,T],α∈(0,1);xk(0)∈Rn,uk(t)∈Rp和yk(t)∈Rq分别为系统第k次重复操作的状态向量、控制输入向量和输出向量;A∈Rn×n,B∈Rn×p和C∈Rq×n都为常数矩阵。
下面给出了分数阶系统的一些基本假设。
(t∈[0,T])存在,且只存在期望的控制输入和理想状态,使得
(2)
假设2CB为行满秩矩阵。
对于分数阶系统(1),首先考虑具有初始状态学习的一阶开环PDα-型分数阶迭代学习控制算法
(3)
式中:Γp1和Γd1分别为比例和微分学习增益矩阵;ek(t)=yd(t)-yk(t)为系统第k次迭代时的跟踪误差。
众所周知,系统运行中的反馈信息可以加速学习过程的收敛速度。因此,本文进一步研究了具有初始状态学习的开闭环PDα-型分数阶迭代学习控制算法。其表达式如下
(4)
式中,L=(Γp2+Γd2),Γp2,Γd2分别为比例和微分反馈增益矩阵。
显然,当Γp2=Γd2=0时,控制算法(4)退化为具有初始状态学习的一阶开环PDα-型算法(3)。
定理1设分数阶系统(1)满足假设1~2,当控制律(3)作用于系统(1)时,若
ρ1=‖I-CBΓd1‖+
‖Φα,α(t)(BΓp1+ABΓd1)‖1<1
证明:根据引理4,系统(1)的状态有如下表达式
(5)
因此
(6)
由引理2和引理3可以得到
(7)
把(7)式带入(6)式,得
(8)
在(8)式两边同时取Lebesgue-p范数,采用卷积积分的广义Young不等式,可以得到
(9)
利用定理1的条件,取k→∞得到
因此,跟踪误差单调收敛到零,系统的输出在Lebesgue-p范数意义下当k→∞时的[0,T]区间内收敛到期望输出。
定理证毕。
定理2假设分数阶系统(1)满足假设1~2,当控制算法(4)应用于系统(1)时,若满足条件:
1)ρ0=‖I-CBL‖<1,L=Γd1+Γd2,
2)ρ2ρ1<1
式中
则
证明将(4)式与(5)式结合,得到
(10)
与(7)式的推导类似,可以得出这样的结论
(11)
和
(12)
将(11)式和(12)式代入(10)式可得
(13)
将t=0代入(12)式可得
(14)
在(14)式两边同时取范数,可得
‖ek+1(0)‖≤ρ0‖ek(0)‖
(15)
式中,ρ0=‖I-CBΓd1-CBΓd2‖。
因此,根据条件1),可以得出结论
(16)
因此,表达式(13)采用这种形式
(17)
根据假设2可知,存在反馈增益微分矩阵Γd2,使得矩阵I+CBΓd2是非奇异矩阵。因此,在(17)式的两边左乘(I+CBΓd2)-1,两边同时取Lebesgue-p范数,采用卷积积分的广义Young不等式,可得
(18)
进一步
(19)
式中
γ=
(20)
根据定理2和引理5的条件,取k→∞,可以得出以下结论
(21)
定理证毕。
注3定理2的收敛条件ρ2ρ1<1不要求满足ρ1<1或ρ2<1。因此,在控制算法(4)中,学习增益矩阵有了更多的选择。
注4观察定理1和定理2的证明,控制算法的收敛条件是充分的和不必要的。即当不满足收敛条件时,在控制算法的作用下,系统的跟踪误差仍可能趋于零。
注5根据定理1和定理2的收敛条件,当满足条件ρ2ρ1<ρ1<1时,开闭环PDα-型算法(4)的收敛速度比开环PDα-型算法(3)的收敛速度快。
考虑如下分数阶线性连续时不变系统
(22)
系统(22)的重复操作区间设为[0,1]:所期望的输出为yd(t)=0.8tsin2πt,t∈[0,1]。第一次迭代的初始状态x1(0)是随机选择的,但不等于期望的初始状态xd(0)。此外,初始控制输入u1(t)(t∈[0,1])由Rand函数随机生成。
设置控制算法(3)的相关参数为:Γp1=0.9,Γd1=1.6,计算可得ρ1=0.893 7<1,满足定理1的收敛条件。
为了更好地说明所提出的具有初始状态学习的开环PDα-型算法的性能,通过对比,采用了传统的一阶开环PDα-型算法。将传统PDα-型算法应用于具有任意初始状态的系统(22)时,系统(22)在第4次和第12次迭代时的输出以及从第1次迭代到第30次迭代的跟踪误差曲线分别如图1和图2所示。很明显,随着迭代次数的增加,系统输出与期望输出之间存在偏差。也就是说,系统的实际输出不能准确地跟踪给定的期望输出,只能渐进地落在期望输出的一个小邻域内。此时,在Lebesgue-2范数和上确界范数的意义下,系统在整个区间[0,1]的跟踪误差都是收敛有界的。
图1 一阶PDα-型控制算法跟踪曲线 图2 一阶PDα-型控制算法的跟踪误差变化趋势 图3 初态学习的一阶PDα-型控制算法跟踪曲线
将提出的PDα-型算法(2)应用于任意初始状态的系统(22)时,系统(22)第4次和第12次迭代的输出如图3所示,跟踪误差如图4所示。
图4 初态学习的一阶PDα-型控制算法的跟踪误差变化趋势
显然,系统的输出可以完全跟踪期望输出,并且跟踪误差随着迭代次数的增加单调收敛到零。以上结果表明,对于具有任意初始状态的系统(22),所提出的算法(3)是可行和有效的。
控制算法(4)的相关参数设置为:Γp1=0.9,Γd1=1.9,Γp2=0.3,Γd2=2。计算可得ρ1=0.860 1<1,ρ2ρ1=0.670 2<1,ρ2ρ1<ρ1<1。显然,满足定理1和定理2中的收敛条件。
在上述条件下,将本文提出的PDα-型算法(3)和(4)分别应用于任意初始状态的系统(22),系统的跟踪误差如图5所示。
图5 算法(3)和算法(4)跟踪误差比较
可以看出,在Lebesgue-2范数意义下,随着迭代次数的增加,本文算法(3)和(4)的跟踪误差单调地趋于零。此时,当算法(4)迭代7次时,跟踪误差达到误差范围0.004,而算法(3)需要11次迭代才能达到上述效果。因此,在给定适当的学习增益下,算法(4)比算法(3)具有更快的收敛速度和更高的控制精度。
本文针对一类具有任意初始状态的分数阶线性连续系统,为了消除任意初始状态对系统的影响,提出了带初始状态学习的开环和开闭环PDα-型FOILC算法。在Lebesgue-p范数意义下,利用卷积积分的广义Young不等式,讨论了PDα-型算法的收敛性。理论分析和数值仿真表明,该PDα-型算法应用于任意初始状态系统时,随着迭代时间的增加,跟踪误差单调收敛于零。
随着迭代学习控制和分数阶系统理论的进一步发展,还可以将分数阶迭代学习控制应用于分布参数系统、多智能体系统和切换系统的控制之中。