基于伪逆模型的线性系统自适应迭代学习控制

2021-07-13 02:14:06高艳芳贺兴时

纺织高校基础科学学报 2021年2期

高艳芳,贺兴时,耿燕

(西安工程大学理学院,陕西西安 710048)

0 引言

迭代学习控制 (iterative learning control,ILC)是智能控制的一个重要分支,是跟踪控制领域一种高效的控制策略,适用于具有重复运动特性的被控系统[1-3]。ILC策略的机理是通过应用先前实验获得的输入-输出数据和系统跟踪误差不断修正当前次的控制输入,以改善跟踪性能,最终实现有限区间上的完全跟踪[4-5]。自1984年Arimot等针对机械手在某一有限时间区间内重复跟踪给定的期望轨迹，首次提出ILC算法以来,该算法被广泛应用到半连续化学反应堆、感应电动机、链板输送机系统和快速热处理过程等[6-10].

学习律的研究是ILC的核心内容,目前常见的控制律有D-型(derivative-type)、P-型 (proportional-type)、PI-型(proportional-integral-type)、PD-型、PID-型[11-16]等传统的学习控制律，范数最优、参数最优、梯度型、拟牛顿型等最优学习控制律[17-20]，以及自适应控制律[21-23]等。文献[11]研究了具有非重复不确定因素的离散线性系统的D-型ILC的鲁棒性问题。理论分析表明,如果所有的不确定性因素是收敛的,那么ILC的跟踪误差也是收敛的。这里收敛性条件依赖于精确的系统参数。文献[18]针对一类线性离散时不变系统,分别研究了2种具有确定学习增益和通过参数最优化方法获得的非线性学习增益的基于梯度的ILCs策略,所提的基于梯度的ILCs算法具有单调性和鲁棒性；文献[19]讨论了基于逆模型的ILC算法的稳定性、单调性和鲁棒性。但是，如果文献[11,18-19]中系统参数未知或者不确定,那么基于矩阵模型或者逆模型的ILCs算法将不可再用,且收敛性条件不可获取。

本文针对参数未知的线性离散时变系统,提出一种基于伪逆模型的自适应迭代学习控制 (adaptive interative learning control based on pseudo inverse model,PIM-AILC) 策略。利用范数原理分析了该算法的收敛性,通过数值仿真验证了控制策略的可行性和有效性.

1 系统描述

考虑如下重复性单输入单输出线性时变系统:

(1)

式中：t∈S={0,1,…,N-1},t∈S+={1,2，…,N}代表离散时间点,N是离散点的总个数;k=1,2,…表示系统重复指标,即迭代次数；xk(t)∈Rn,uk(t)∈R,yk(t)∈R分别表示n维状态向量,单输入和单输出变量;矩阵A(t)表示未知的且具有适当维数的矩阵；B(t)和C(t)分别表示具有适当维数的列向量与行向量。

假设1对于任意给定期望轨迹yd(t),t∈S+,存在期望控制信号ud(t)和恰当的期望状态xd(t),满足

假设2对于重复系统 (1),初始状态是可以重置的。不失一般性,令xk(0)=0,k=1,2,…。

输入uk∈RN,输出yk∈RN和期望轨迹yd∈RN的超向量形式表示如下:

uk=(uk(0),uk(1),…,uk(N-1))Τ

yk=(yk(1),yk(2),…,yk(N))Τ

yd=(yd(1),yd(2),…,yd(N))Τ

因此,系统 (1) 可改写为

yk=Huk

(2)

其中,H∈RN×N是由系统的参数形成的下三角矩阵：

由于系统参数矩阵A(t),列向量B(t)和行向量C(t)是未知且有界的,因此下三角参数矩阵H是未知且有界的。

为了进一步研究算法,拟对系统下三角参数矩阵H给出自适应估计算法,将矩阵H左下角的每一行表示为维数可变的向量的形式,hi∈Ri,t∈S+,即

所以系统 (2) 被改写为

(3)

2 线性系统的自适应迭代学习控制

(4)

(5)

(6)

因此,一种基于梯度技术的自适应估计算法构造如下:

(7)

(8)

式中:λmin(·)是最小特征值,σ1和σ2是2个比较小的正数。

基于伪逆模型的自适应迭代学习控制策略设计如下:

(9)

显然,基于伪逆模型的线性系统自适应迭代学习控制策略,即PIM-AILC,实际上是系统参数矩阵的自适应估计算法(7),重置算法(8)和控制律(9)的一个结合体。

3 主要结果

3.1 跟踪误差

(10)

式(10)两边取范数,得

(11)

根据向量的2-范数理论,可得

(12)

式(3)减去式(4),可得

(13)

将式(13)带入到式(12)，有

(14)

(15)

因此,由重置算法(8)、式(13)和式(14)易知,存在常数0<θ<1,使如下不等式成立：

所以有

(16)

即

(17)

3.2 估计误差

定理2将基于伪逆模型的自适应迭代学习控制算法,即式(9),应用到系统(2)或(3)中，通过适当地选取参数ε，满足

(18)

则跟踪误差ek+1单调收敛到零。

证明由式(2)和式(9)可以推出

(19)

(20)

不等式(20)右边第一项为

(21)

由于ε>0,显然存在最小的εmin,当ε>εmin时,有如下不等式成立:

(22)

其中,0<τ1<1。

从式(17)可推出,对于任意充分小的τ2>0,存在正整数N1,当k>N1时,使得

‖ΔHk‖2<τ2

(23)

(24)

其中,0<τ2<1-τ1。

式(22)加上式(24),可以得到

(25)

其中,K=max{N1,N2}。

由式(19)和(25)可推出

‖ek+1‖2≤τ‖ek‖2

(26)

其中,τ1+τ2=τ<1。表明

(27)

即证得跟踪误差ek+1单调收敛到零。

虽然定理的单调收敛条件(18)看似与系统参数矩阵H有关,但是,从证明过程中的式(21)～(25)可以看出,PIM-AILC算法的收敛性条件与系统参数矩阵H并无关系。这是PIM-AILC算法与传统的和P-型ILC的不同之处。

4 数值仿真

为了验证基于伪逆模型的线性系统自适应迭代学习控制(PIM-AILC)的有效性和理论分析的正确性,引入文献[24]中一个间歇性快速热处理过程的实例,该离散时间系统模型如下:

(28)

其中S={0,1,…,99},S+={1,2,…,100},迭代时间最大值N=100。

则收敛性条件为

将PIM-AILC算法应用到线性系统(28)中,并与式(29)表示的P-ILC算法作对比,仿真结果如图1～3所示。

uk+1=uk+λek

(29)

其中λ是常数学习增益。

图1给出了PIM-AILC算法和P-ILC算法的跟踪误差对比,其中P-ILC的学习增益分别为γ=0.2和γ=0.6。从图1可以看出，PIM-AILC算法和P-ILC算法都是有效的且跟踪误差的2-范数均单调收敛到零,但是PIM-AILC有较快的收敛速度。

图 1 PIM-AILC算法和P-ILC算法的跟踪误差Fig.1 Tracking error of PIM-AILC algorithm and P-ILC algorithm

图2描述了PIM-AILC算法的输出结果。从图2可看出第4次迭代输出轨迹与期望轨迹吻合,表明随着迭代次数的增加，实际输出轨迹会和期望轨迹重合。

图 2 PIM-AILC算法的输出Fig.2 Output of PIM-AILC algorithm

图3(a)～(b)分别给出了算法PIM-AILC和算法P-ILC (γ=0.6)的跟踪误差ek(t)沿迭代方向和时间方向的三维立体图。通过对比可发现,PIM-AILC的收敛性比P-ILC的收敛性好。

(a) PIM-AILC跟踪误差

(b) P-ILC跟踪误差(γ=0.6)图 3 PIM-AILC与P-ILC跟踪误差Fig.3 Tracking error of PIM-AILC and P-ILC

5 结语

本文针对一类参数未知的单输入、单输出离散线性时变系统,利用估计的系统矩阵的逆矩阵,提出基于伪逆模型的自适应迭代学习控制策略。通过范数理论分析所提算法的收敛性。引入一个间歇性快速热处理过程测试该策略,结果表明PIM-AILC算法是有效的、可行的。