具有状态时滞的非线性抛物型偏差分系统迭代学习控制

2018-03-15 08:42郭亚君

山西电子技术 2018年1期

郭亚君

(山西工程职业技术学院，山西太原 030009)

0 引言

众所周知，在实际系统中常存在时滞性和非线性等不确定因素。再加上负载的变化以及外部扰动等不确定性的影响有可能对系统造成性能指标下降甚至系统不稳定的问题。特别是在系统的结构与参数均未知的情况下，其控制将更加困难。迭代学习控制[1-5]是人工智能技术应用到控制领域的一种智能控制方法，它的优势在于其开放式、分布式的结构特点，以及学习算法不需要精确的模型建立和辨识系统的参数，尤其适用于处理模型具有不确定性、非线性、复杂的控制任务，通过学习和调整控制规律，就可达到系统稳定和维持良好性能指标的目的。因此在对含有时滞的非线性系统的研究上具有着重要的理论意义和应用价值。

本文针对具有状态时滞的非线性抛物型偏差分系统的迭代学习控制问题，设计了开环P型迭代学习控制律，给定适当的初边值条件及学习控制算法收敛的充分条件，对输出跟踪误差的收敛性进行了分析，并用仿真实例验证了算法的有效性。

1 系统建立

考虑如下具有状态时滞的非线性偏差分系统

(1)式即为本文建立的具有状态时滞的非线性偏差分系统(下文简称系统)，其中i,j是空间和时间的离散变量,1≤i≤I，0≤j≤J，I,J为整数。a(j),h(j)是不确定的有界实数序列，且a(j)>0。q(j),u(j),y(j)∈R分别是系统的系统状态，控制输入和控制输出。τ≥0是延迟时间，设初始状态函数φk(·)。当j∈[-τ,0]时，qk(i,j)=φk(i,j)，f,g是非线性函数，并且满足下面一直全局Lipschitz条件：

‖f(q1(i,j-τ),u1(i,j),j)-f(q2(i,j-τ),u2(i,j),j)‖
≤lf(q1(·,j-τ)-(q2(·,j-τ)‖+
‖u1(·,j)-u2(·,j)‖) .

(2)

‖g(q1(i,j),j)-g(q2(i,j,),j)‖≤
lg(‖q1(·,j)-q2(·,j)‖) .

(3)

其中，lf，lg为常数。

对(1)式中的差分形式定义如下：

对建立的系统考虑相应的初边值条件，即

q(0,j)=0=q(I+1,j) 1≤j≤J.

(5)

q(i,0)=φ(i,0) 1≤i≤I.

(6)

对所给出相应的期望输出yd(i,j)，需要求与之相对应的理想输入ud(i,j)，即

uk+1(i,j)=uk(i,j)+γ(j)ek(i,j) .

(7)

其中，k为迭代次数，γ(j)为学习增益。

注1：本文研究的偏差分系统，对比文献[7],[8]，具有两大显著的特点：1)(1)式是非线性系统；2)(1)式具有状态时滞，证明过程更为复杂，更具一般性。

2 收敛性分析

下面的引理将在算法收敛性分析中用到。

引理1[6]设{v(i)}，{B(i)}，{D(i)}为实数序列，且i≥0，由

v(i+1)≤B(i)v(i)+D(i),i≥0 .

(8)

那么有：

(9)

下面的定理1给出了P型学习律算法下系统的收敛性充分条件。

定理1 若算法(7)式中学习增益γ(j)满足|1-h(j)γ(j)|2<0.5，0≤j≤J，则当迭代次数k→∞时，(1)式的输出误差ek(i,j)在下面意义下收敛为零，即

(10)

证明：由算法(7)，可以得到第k+1次迭代使得输出误差

ek+1(i,j)=ek(i,j)+yk(i,j)-yk+1(i,j)=
[1-h(j)γ(j)]ek(i,j)-[g(qk+1(i,j),j)-
g(qk(i,j),j)] .

(11)

对(11)式两边同时平方并从i=1到I求和，利用Lipschitz条件和有界性得：

(12)

(13)

差分形式为：

(14)

对上式两边同时平方并同时从i=1到I求和，由(a+b+c)2≤3a2+3b2+3c2并运用Lipschitz条件，得：

(15)

运用边界qk(0,j)=0=qk(I+1,j)，0≤j≤J，则(15)式中∑1为：

(16)

把(16)式代入(15)式得：

(17)

(18)

由式(7)算法可知：

(19)

(20)

对(20)式左右同乘λj(0<λ<1)，

(21)

(22)

(23)

把(23)式代入(21)式得：

(24)

由λ(0<λ<1)充分小，知0<1-M1λ<1，整理(24)式得：

(25)

先对(12)式并左右同乘λj(0<λ<1)，得：

(26)

把(26)式代入(25)式：

(27)

记ρ2=2λhγ+2lg，由定理1的条件知2λhγ<1，因此ρ2<1，则(27)式为：

(28)

(29)

那么，对有限的J由夹逼准则可得：

(30)

定理1证明完毕。

3 仿真

以下的仿真实例将说明本文所用算法的有效性。

设时滞非线性偏差分系统为：

并设系统的期望输出为：

yd(i,j)=
0.5(sin(j-1))2(i-1)(I+1-i)(1-e-2.5(I+1-i)) .

(31)

下面的图1～图4为仿真结果：

图1 期望输出曲面

图2 迭代35次后的输出曲面

图3 误差曲面(k=35)

图4 迭代-误差最大值变化曲线

图1是期望输出曲面，图2是相应的迭代35次后的输出曲面，图3是迭代35次的输入误差跟踪曲面，从图中可以看出随着迭代次数的增加，输出跟踪误差的收敛性越来越好，迭代35次后的误差收敛到4.076 3×10-6，图4是误差最大值收敛轨迹。从图4可以看出，在迭代接近15次时，输出对期望轨迹已经基本实现了精确的跟踪，因此仿真结果验证了算法对本文系统的可适用性。

4 结论

本文研究了一类具有状态时滞的非线性抛物型偏差分系统的迭代学习控制问题。采用P型算法进行迭代学习控制设计，在满足给定假设条件下，保证了系统的控制品质不受时滞的影响而变差,证明了输出误差沿迭代方向收敛，并用仿真实例验证了其有效性。在今后的工作中，除了进一步发展和完善已有的成果和方向外，还可进一步在具有控制时滞和多状态时滞等问题上进行探索研究。

[1] Uchiyama M. Formation of High-speed Motion Pattern of Mechanical Arm by Trial[J].Transactions of the Society of Instrumentation and Control Engineers,1978,19:706-712.

[2] Arimoto S，Kawamura S,Miyazaki F. Bettering Operation of Robots by Learning [J]. Journal of Robotic System, 1984，1(2):123-140.

[3] 谢胜利,田森平,谢振东.迭代学习控制的理论与应用[M].北京:科学出版社, 2005.

[4] 孙明轩,黄宝键.迭代学习控制[M].北京:国防工业出版社,1999.

[5] 林辉,王林.迭代学习控制理论[M].西安:西北工业大学出版社,1998.

[6] Xie Shengli，Cheng SS. Stability Creteria for Parabolic Type Partial Difference Equations[J]. Jouranl of Computational and Applied Mathematics, 1996，75(1):57-66.

[7] DAI Xisheng，TIAN Senping,GUO Yajun. Iterative Learning Control for Discrete Parabolic Distributed Parameter Systems[J].International Journal of Automation and Computing,2015,12(3):316-322.

[8] 戴喜生,郭亚君,田森平，等.非线性抛物型偏差分系统迭代学习控制[J].控制理论与应用，2015, 32(12):1607-1612.