采用Smith预估器模型的时滞系统自适应控制

2021-04-08 07:44郑仰东
控制理论与应用 2021年3期
关键词:参考模型适应控制时滞

郑仰东

(三菱电机(中国)有限公司研究开发部,上海 200336)

1 引言

控制过程中的时间滞后现象广泛存在于各个应用领域的自控系统中,比如包含用传送带运送货物、产品、零部件及生产原材料的系统,带有时间延迟的能源、介质和传感器测量信号的传输系统等.典型的例子有钢铁厂大型炼钢炉的温度控制,化工厂的大规模化学反应的过程控制,大型冷链仓库的中央空调和冷冻冷藏室的温度控制等.

时滞现象在被控对象的传递函数中可被表示为一个时滞环节.该时滞环节的存在导致控制效果在一定的时间延迟后才能到达目标被控对象,这可能引起对被控系统的控制特性的劣化甚至引发输出信号的振荡和发散.例如对于1阶被控系统,当延迟时间因子和时间常数的比<0.3时是常规时滞系统,而当>0.3时可视为大时间滞后系统.时滞系统的闭环自动控制是一个广泛存在的问题,但由于带有时滞环节的闭环传递函数包含无限多个极点,所以难以很好地解决.特别对大时间滞后系统,即使使用最先进的基于经典原理设计的控制器也很难实现有效的控制.

Smith预估器是一种熟知的广泛应用于时滞系统的控制方法,其基本原理是预测时滞系统或被控对象的延时影响并进行抵消和补偿,适用于被控对象的模型参数可以被精确预测且不随时间变化的场合[1-5].但实际的被控系统并非总能满足以上条件,选取的预估器模型的参数和被控对象的参数经常不能很好地匹配,因而大大限制了Smith预估器的应用范围[4].本文首先演示了采用Smith预估器方法来控制时滞系统并指出了其问题点,然后提出了一种基于李雅普诺夫(Lyapunov)稳定性理论的模型参考自适应控制(model reference adaptive control,MRAC)[6-13]方法用以解决以上问题,并推导了作为自适应律的方程.文中阐述了该方法的基本原理并进行了理论分析推导,同时通过数值仿真计算验证了其有效性.理论分析和仿真计算的结果表明Smith预估器和MRAC方法的结合有效地改善了当预估器模型和被控对象参数不匹配时对时滞系统的控制性能,防止了系统的不稳定性.为简单明了地阐明这种方法的思路和原理,本文选用了1阶时滞系统(传递函数)来进行理论公式推导和仿真计算.由于这是一种结合Smith预估器和自适应控制各自特点的全新方法,因而完全不同于以往文献记载的其他方法[14-21].

事实上在近期出版的有关时滞系统控制的综述报告和技术书籍中[21-23],都论述了目前用于实际工业生产中的时滞系统控制的较先进的技术有两种,即死区时间补偿器(dead-time compensator,DTC)和模型预测控制器(model predictive controller,MPC).DTC实际是基于传统的Smith预估器的方案,主要包含滤波式Smith预估器(filtered Smith predictor,FSP)、干扰观测器型DTC(disturbance observer DTC,DO--DTC)、2自由度Smith预估器(two-degree-of-freedom Smith predictor,2DOF--SP)等类型,而MPC则是利用控制算法去预估被控对象的将来的输出,主要包含动态矩阵控制器(dynamic matrix controller,DMC)、广义预测控制器(generalized predictive controllers,GPC)等类型.本研究的不同之处在于,尝试去寻求一种结合上述两种技术的新方法以期进一步改进时滞系统的控制效果,同时本文采用的李雅普诺夫设计方法也具有能有效保证所设计的控制系统稳定性的优势.

本文构成如下:第2节首先阐述了Smith预估器在时滞系统控制中的应用并指出了其问题和不足;然后在第3节提出了Smith预估器和MRAC相结合的方法用于改善Smith预估器参数失配时对时滞系统的控制特性,进而推导了自适应律;第4节对数值计算方法进行了说明,提供了仿真计算结果并做了讨论;最后第5节总结并给出了本研究的结论,同时对一些遗留问题进行了探讨.

2 Smith预估器模型方法

2.1 Smith预估器的预测补偿原理

时滞被控对象的时间连续传递函数如式(1)所示,包含一个常规的传递函数带一个纯时间滞后项

其中:kp是比例系数,Tp是时间常数,τp是延迟时间.

Smith预估器是一种面向纯时滞系统的超前预测控制器,由O.J.M.Smith[1]于20世纪50年代发明提出.利用Smith预估器方法,分母中的时滞项(亦即无限多个极点)可以被完全抵消.采用Smith预估器方法对时滞被控对象Gp(s)进行反馈控制的典型系统构成如图1所示[24].

图1 用Smith预估器方法对时滞被控对象进行反馈控制的典型系统构成Fig.1 The typical structure of feedback control systems using the Smith predictor method for the time-delay plant

图1中Smith预估器由虚线框内两部分传递函数、即作为补偿单元的Gmp(s)和作为控制单元的Gm0(s)组成,其表达式由式(3)给出.向前通道中的传递函数Gc(s)为PID控制单元,而反馈通道中的传递函数Fc(s)为反馈控制单元.信号r(s),ec(s),uc(s),y(s),ymp(s),e(s),ymo(s)和yf(s)分别代表输入参考信号、控制误差信号、控制信号、输出信号、Smith预估器补偿用输出信号、Smith预估器补偿后误差信号、Smith预估器控制用输出信号和反馈信号.由来自PID控制单元的控制信号

和输出信号之间的关系y(s)=Gp(s)uc(s),不难得到控制信号和闭环传递函数的表达式分别为式(4a)和式(4b).当预估器模型参数和被控对象的参数精确相等时(km=kp,Tm=Tp和τm=τp),闭环传递函数式(4b)分母中含时滞项的Gp(s)将被Gmp(s)所抵消,时滞系统的闭环传递函数简化为式(4c),为通常的非时滞系统闭环传递函数的形式乘以一个纯时滞项,消除了原来分母中的无限多个极点.

2.2 Smith预估器方法存在的问题

如上节所述,如果Smith预估器模型是被控对象的一个相当好的近似,则利用Smith预估器方法,人们可以采用传统的控制技术实现对时滞系统的控制.然而模型始终能和被控对象完美匹配是不现实的,因为有关被控对象的相关知识和信息的不全或者其本身的复杂性将导致结构和参数估计的偏差,控制过程中被控对象的参数也可能随时间发生变化产生动态偏离.这些因素带来的预估器模型和被控对象的结构和参数的不匹配将引起系统控制特性的急剧劣化甚至发生系统的不稳定[4].

3 Smith预估器的自适应控制

本节提出一种基于李雅普诺夫稳定性理论的自适应控制方法,用以补偿Smith预估器模型和被控对象之间的参数偏差,从而可以有效改善采用Smith预估器方法时对时滞系统的控制性能,防止系统的不稳定性.

3.1 模型参考自适应控制方法

MRAC是一种应用于时变和非线性系统的自适应控制方法[7].在MRAC控制方案中,设计者通过对被控对象和必须满足的控制性能要求的深入理解构想出一个模型,被称为参考模型,其描述了实现闭环控制后所希望的被控对象的输入输出特性.MRAC的目标是找到需要的反馈控制方法,即自适应律,用以改变被控对象的结构和动态特性,这样其输入输出特性将和参考模型特性保持完全一致[9-10].

自适应控制中的在线参数预估器经常被看成是自适应律,而自适应律的设计是最关键重要的,因其事关自适应控制系统的稳定性特性.本研究采用了基于李雅普诺夫稳定性理论的自适应控制方案[11-13],自适应律的设计问题实际上定式化为一个稳定性设计问题,一般是用微分方程的形式表示自适应律,这样依据李雅普诺夫理论,某些稳定性条件也同时得到满足.

3.2 基于李雅普诺夫设计理论的一阶系统的自适应控制律的推导

本节用李雅普诺夫设计方法对MRAC控制方案进行理论定式化和公式推导.以Smith预估器为参考模型的MRAC控制方案的构成如图2所示.本文把Smith预估器模型的传递函数分割为非时滞部分Gm0(s)和时滞部分Gmd(s)(即e−τms),并取出非时滞部分的输出信号ym0(t)作为自适应控制时的反馈信号,Kp(s)和Fm(s)分别是自适应控制的比例功能单元和反馈功能单元,Cp(s)是自适应控制器用于产生自适应控制的更新规则,ua(s)是自适应控制信号.

图2 以Smith预估器为参考模型用于时滞被控系统的MRAC控制方案的构成Fig.2 The structure of the MRAC control scheme for timedelay systems using the Smith predictor reference model

自适应控制系统的整体状态方程如式(5)所示:

其中的参数:

而kp,Tp和τp(被控对象)以及km,Tm和τm(参考模型)分别是第2节中定义的被控对象以及Smith预估器参考模型传递函数中的各项系数,Kap和Fam分别是自适应比例控制参数和反馈控制参数.

假设被控对象和参考模型的延迟时间相等τm=τp=τ,由于

则误差信号的导数可写成

李雅普诺夫函数的定义式为

其中的常数a,b >0.α和β被称为自适应控制变量.李雅普诺夫函数V(t)的导数由下式给出:

由此本文得到自适应控制的更新规则

由于参数kmp和kmi是常数,而kpp和kpi是常数或随时间非常缓慢地变化,它们的导数可以近似地看成是0,这样自适应控制的更新规则,亦即自适应律可以写成式(11)的形式:

从上式可以看出,自适应参数Kp和Fm被自适应律实时地优化更新,这样被控对象的输出信号yp(t)就能实时精确地跟踪参考模型(Smith预估器)的输出信号ym(t).自适应参数Kp和Fm的更新过程由自适应控制器Cp(s)通过数字处理技术来实现.

3.3 结合Smith预估器和MRAC方法对时滞系统的自适应控制

由于运用上述MRAC控制技术,被控对象的输出信号可以实时精确地跟踪Smith预估器模型的输出信号,当控制过程中被控对象的参数预估值有偏离,或随时间发生变化时,本文考虑在Smith预估器的基础上引入MRAC方法去解决传统Smith预估器方法应用于上述时滞系统时所产生的问题.结合Smith预估器和MRAC方法对时滞被控对象进行反馈控制的系统原理框图如图3所示,图中各功能单元和信号的符号表示和图1-2中的相同.

图3 结合Smith预估器和MRAC方法对时滞被控对象进行反馈控制的系统原理框图Fig.3 The block diagram of the feedback control systems for time-delay plants combining the Smith predictors and MRAC scheme

由图3可以看出,这种方法是把图1中的被控对象单元(Gp(s))和Smith预估器单元(Gmp(s))部分替换成图2的李雅普诺夫类型的MRAC控制单元,而原来的PID控制结构保持不变.这样本文可以认为,即使Smith预估器和被控对象的结构和参数存在偏差,效果上Smith预估器的匹配条件依然能够得到满足.因此在Smith预估器方法应用于实际控制系统时,运用此方案即能有效地改善对时滞系统的控制性能,防止系统的不稳定性.

4 数值仿真

4.1 数值计算方法

本文把上两节中时间连续的函数和微分方程转化为离散的形式用于下面的数值仿真计算,也可用于实际控制器中的数字控制算法和程序.

一些有用的离散计算公式归纳如下[25-26]:

式中的∆t是采样时间间隔.

离散的PID数字控制信号uc可按以下递推式计算:

而式(11)的自适应控制的更新规则,即自适应律的递推计算则可由下式给出:

其中M对应延迟时间τ,a∗,b∗>0是常数,可以在计算中设定.

利用以上这些离散化的公式,本文可以完成数值仿真所需要的循环递推计算.

4.2 仿真结果和讨论

本文利用MATLAB[27]程序执行Smith预估器和MRAC控制的数值仿真计算,本节给出仿真结果并进行讨论.以下的计算中,1阶被控对象的相关参数设定为kp=2 s,Tp=10 s和τp=20 s.本文采用PI控制器实现反馈控制,并画出相关信号的阶跃响应曲线来评价检验上两节提出的各种方法的控制特性和效果,下面图中(除图5(c))的黑色、红色和蓝色信号曲线分别代表输入参考信号、被控对象输出信号和Smith预估器模型输出信号(yr(t),yp(t)和ymp(t)或ym(t)).

4.2.1 Smith预估器

用Smith预估器方法对1阶时滞系统进行PI控制的数值仿真结果如图4所示.作为比较,本文首先在图4(a)-4(b)中绘制了未使用Smith预估器时的响应曲线,图4(a)是开环状态下的阶跃响应,而图4(b)是引入常规的PI控制后闭环状态下的阶跃响应,这时由于时滞环节的存在(闭环传递函数位于右平面的极点的存在),阶跃响应不稳定呈发散趋势.

在图4(c)-4(d)中绘制了使用Smith预估器方法时的响应曲线.Smith预估器取与被控对象匹配的模型参数(km=2,Tm=10 s和τm=20 s)时的阶跃响应如图4(c)所示,得到了满意的控制特性.

图4 用Smith预估器方法对1阶时滞系统进行PI控制的数值仿真结果Fig.4 The numerical simulation results of PI control for the first order time-delay systems making use of the Smith predictor method

当模型参数偏离不匹配(km从2配变为1.5)时的阶跃响应如图4(d)所示,可以看到控制特性变差,验证了第3.2节所指出的,预估器模型和被控对象的结构和参数的不匹配将引起系统控制特性的劣化.

4.2.2 Smith预估器的自适应控制

以Smith预估器为参考模型、基于李雅普诺夫稳定性理论的MRAC控制方案的数值仿真结果如图5所示.图5(a)-5(b)分别显示了在模型参数为km=2,Tm=10 s,τm=20 s(匹配)和km=1.5,Tm=10 s,τm=20 s(不匹配)的条件下,被控对象和Smith预估器参考模型的阶跃响应,本文看到参考模型的输出信号能够迅速地跟踪被控对象的输出信号,说明推导的基于李雅普诺夫理论的自适应律能适用于Smith预估器参考模型.参考模型补偿后误差信号e(t)、自适应控制的比例功能单元输出信号Kap(t)和反馈功能单元输出信号Fam(t)的阶跃响应如图5(c)所示,分别用红色、蓝色和绿色的信号曲线表示,e(t)和Fam(t)趋向于0,而Kap(t)则趋向于一个小于1的常数.图5(d)显示了图5(a)条件下的脉冲响应曲线.

图5 以Smith预估器为参考模型的用于时滞被控系统的MRAC控制方案的数值仿真结果Fig.5 The numerical simulation results of the MRAC scheme for the time-delay systems using the Smith predictor reference model

4.2.3 Smith预估器结合MRAC方法对时滞系统的控制特性的改善

在参考模型和被控对象参数失配条件下,用Smith预估器方法在结合和未结合MRAC控制方法时对时滞系统进行PI控制的数值仿真结果的比较如图6所示.图6(1a)-6(4a)分别显示了结合MRAC控制方法时,在不同失配参数条件:1a)km=1,Tm=10 s;2a)km=4,Tm=10 s;3a)km=2,Tm=20 s;4a)km=1,Tm=5 s之下(未列出参数同被控对象参数),被控对象和Smith预估器参考模型的阶跃响应.

图6 用Smith预估器方法在结合((1a)-(4a))和未结合((1b)-(4b))MRAC控制方法时对时滞系统进行PI控制的数值仿真结果的比较Fig.6 Comparison of the numerical simulation results of PI control for the time-delay systems using the Smith predictor method combined((1a)-(4a))and not combined((1b)-(4b))with the MRAC scheme with the mismatching model parameters

作为比较,图6(1b)-6(4b)分别显示了未结合MRAC控制方法时(仅使用Smith预估器方法),在以上相同参数条件下图6((na)和图6(nb)参数相同),被控对象和Smith预估器模型的阶跃响应.

以上仿真结果表明,传统的Smith预估器方法如结合MRAC方法,将显著有效地改善对时滞系统的控制性能,防止了系统的不稳定性.

5 结论

Smith预估器作为一种广泛应用于时滞系统闭环控制的有效方法,存在预估器模型和被控对象参数不匹配时控制特性的急剧劣化和系统不稳定的问题.对此本文提出了一种基于李雅普诺夫稳定性理论的模型参考自适应控制(MRAC)方案,结合Smith预估器方法来解决以上问题.本文阐述了其基本原理,具体对一阶系统的情况进行了详细理论分析,并推导了李雅普诺夫类型的自适应律方程.同时本文也进行了数值仿真计算用以验证这种方法的有效性.需要特别指出的是,与一般的非时滞条件下的MRAC不同,作为参考模型的Smith预估器带有时滞环节Gmd(s),本文的方案的关键点是自适应控制时的参考模型的反馈信号取自非时滞部分的输出信号ym0(t),而非一般采用的参考模型的最终输出信号ym(t)(见图2),这样才能构成有效的李雅普诺夫函数并推导出自适应律.理论分析和仿真计算结果均表明,Smith预估器和基于李雅普诺夫理论的MRAC方法的结合显著有效地改善了对时滞系统的控制性能,防止了系统的不稳定性,在一定程度上解决了Smith预估器的上述问题和难点,有望在实际时滞系统设备的过程控制中得到具体广泛的应用.较大的系统层面的应用场景有:作为冷链物流行业能源管理系统重要组成部分的大型冷冻/冷藏仓库的温度控制,绿色建筑内部的空气环境质量检测和新风调控系统、智能制造中的在线质量分析和实时生产控制系统等.

尽管上述Smith预估器和MRAC方法的结合在时滞系统的闭环控制中取得较为满意的结果,但依然存在以下一些问题:

1) 对时滞系统的控制特性还未达到较高的水准以满足像对常规非时滞控制系统那样的要求(如存在较大的超调量、较长的调节时间等问题),能否进一步提高值得探讨.事实上这取决于自适应系统是如何实时精确地跟踪参考模型(Smith预估器)的,其跟踪的动态特性决定了能多大程度改善单独用Smith预估器时的控制特性以及改善的极限范围.理论上通过对非线性微分方程式(6)的数学分析能取得一定的结果,作者即将在后续研究中做这方面的尝试;

2) 本文未考虑预估器模型和被控对象延迟时间参数不匹配的情况.考虑这个问题可能通过在李雅普诺夫函数中增加一个代表延迟时间偏差的自适应变量,并推导出相应的新自适应律从而求得该变量的方法得以解决,这将是作者下一步的研究内容;

3) 本文未包含在高阶系统情况下的理论分析和推导,主要因为虽基本原理大致相同,但自适应变量和自适应律等都变成矩阵形式,处理过程比较冗长和复杂,这方面的扩展会在后续论文中讨论.

最后必须指出的是,自适应律的导入实际上也引入了多重非线性因素,因而可能额外导致闭环系统的非线性化和时变性,所以可以说,分析和理解自适应控制方法在应用于时滞系统时的稳定性和鲁棒性将更具挑战性.

猜你喜欢
参考模型适应控制时滞
基于改进的模型参考自适应的飞行控制律设计
基于事件触发的船舶航向逻辑切换自适应控制
时滞非线性复杂动态网络的牵引自适应控制同步性
随机时滞微分方程的数值算法实现
变时滞间隙非线性机翼颤振主动控制方法
不确定时滞奇异摄动系统的最优故障估计
适用于汽车燃料电池系统中气流管理的自适应控制
中立型随机时滞微分方程的离散反馈镇定
适应性学习支持系统参考模型研究现状及发展趋势
自适应学习模型体系结构分析与研究