臧玉萍 张 洋 孙 博
(长春工业大学 a.人文信息学院;b.基础科学学院,长春 130122)
基于神经网络的非线性时变对象自适应控制方法研究
臧玉萍a张 洋a孙 博b
(长春工业大学 a.人文信息学院;b.基础科学学院,长春 130122)
针对工业控制中的非线性、时变和滞后被控对象,将神经网络辨识器和PID控制技术有机结合,构建自适应PID控制器,并引入知识先导学习算法,提高时间效率。仿真分析表明:该自适应PID控制器能够自动辨识被控对象模型、自整定控制参数,在辨识误差、响应时间及超调量等指标上均有良好表现。
自适应PID控制 单神经元 神经网络辨识器 知识先导学习算法 系统辨识 参数自整定
在工业过程控制中,许多被控对象随负荷、环境的改变或不确定扰动的影响,表现出非线性、时变及滞后等特征,过程参数甚至模型结构都会发生变化。传统PID控制器方法简单,可以解决工程实践中大量的一般性问题,但缺点是无法辨识被控对象模型变化,参数整定依赖于对象的数学模型,缺乏在线调整能力,因此限制了其在具有非线性、时变及滞后等特征的工业过程控制领域中的应用。人工神经网络具有较强的非线性映射、信息综合、学习记忆和自学习自适应能力,已经在非线性时变系统辨识和控制问题上得到了研究与应用[1~5]。在此,笔者将神经网络和PID有机结合,利用三层前向神经网络自动辨识被控过程参数,采用知识先导学习算法提高时间效率,利用单神经元自适应PID技术自动整定控制参数,构建一个具有自适应能力的PID控制系统,并以燃油加热器为例进行仿真实验分析。
1.1 系统描述与神经网络模型
离散非线性系统可描述为:
y(k)=f[y(k-1),y(k-2),…,y(k-ny),
u(k-1),u(k-2),…,u(k-nu)]
(1)
式中f[·]——非线性函数;
nu、ny——u、y的阶次;
u(k)、y(k)——由第k次采样得到的系统输入、输出。
1.2网络权值学习算法
(2)
可建立指标函数:
(3)
并由此得到权值系数的调整算法:
(4)
α——动量系数,α∈[0,1];
η——学习速率,η∈[0,1];
在此,引入动量系数是为了加快搜索过程,使其快速收敛于全局最小。
1.3知识先导学习算法
对于实时在线辨识的应用目标而言,时间效率的提高具有重要意义。神经网络辨识器工作过程中,首先需要对网络权值系数进行初始化赋值。通常情况下,可采用一组非零的随机数作为网络权值系数的初值,显而易见,由随机起点收敛到接近次优解(或满意解)所在位置需要一段时间,考虑到导致部分系统模型变化的主要原因为外部环境条件的变化,而一般情况下此时变过程为缓变过程,因此笔者提出一种利用前次辨识得到的系统模型参数作为先验知识来初始化网络权值系数的知识先导学习算法,即在辨识器上增加一个用于保存前次辨识得到的系统模型参数的知识库模块,如图1所示。
图1 具有知识先导学习算法的辨识器结构
2.1单神经元神经网络PID控制器
经典增量式离散PID控制模型可以表述为:
Δu(k)=KPΔe(k)+KIe(k)+KD[Δe(k)-Δe(k-1)]
(5)
构建一个具有参数自整定能力的PID控制器的核心问题是实现对控制参数KP、KI和KD的实时在线调整,此问题本质上是一个优化搜索问题,因此必须建立一个具有搜索能力、可以自动调整控制参数的控制模型。神经网络模型为解决此问题提供了一种有效途径。图2所示为一种由一个神经元组成的三输入神经网络模型。
图2 单神经元组成的三输入神经网络模型
该模型由一个输入向量、一个累加器和一个传输函数组成,其输入、输出关系为:
a=f(wp+b)
p={x1,x2,x3}
w={w1,w2,w3}
(6)
式中a——网络输出;
b——偏值系数;
f(·)——传输函数;
p——输入向量;
w——权值系数向量。
将式(6)中累加器输出改写成标量形式,有:
n=w1x1+w2x2+w3x3+b
x1(k)=Δe(k)
x2(k)=e(k)
x3(k)=Δe(k)-Δe(k-1)
(7)
式(5)可改写为:
Δu(k)=KPx1(k)+KIx2(k)+KDx3(k)
(8)
比较式(7)、(8)可见,单神经元三输入神经网络模型的累加器输出与增量式离散PID控制模型具有相同的输入、输出关系。由此可得单神经元神经网络PID控制器模型[6,7]:
Δu(k)=w1x1(k)+w2x2(k)+w3x3(k)+b
(9)
式中b——神经网络控制器偏置系数;
w1、w2、w3——神经网络控制器权值系数;
Δu(k)——PID控制器增量输出。
2.2单神经元PID控制器权值系数学习算法
控制系数的调整过程本质上是一个优化搜索过程,即在一个由无穷组解构成的w1、w2、w3三维解空间中搜寻一组可以对当前目标系统实行有效控制的满意解的过程。最小均方(Least Mean Square,LMS)算法是最简捷有效的搜索算法之一[8]。
LMS算法采用二次型性能指标,即:
(10)
式(10)中常数1/2的引进是为了求导后消除导数中的常系数。权值系数wi(k)的调整应沿着Jc减小的方向,即对wi(k)的负梯度方向进行搜索调整。由此可得权值系数的调整量为:
(11)
2.3神经网络自适应PID控制器
神经网络自适应PID控制器(图3)主要由给定单元、调节单元、系统辨识单元及输出与执行单元等组成。核心技术是NNI和NNC两个模块。NNI的主要功能是实时在线辨识被控目标系统,并以辨识器输出预报值对辨识器输入偏导数的形式提供辨识结果,供神经网络控制器调整修正控制参数用。NNC是一个具有自适应能力的PID控制器,可以根据被控目标系统的变化情况,实时在线整定控制器的比例、微分、积分控制参数,同时实施对被控目标系统的控制。
图3 神经网络自适应PID控制器结构
3.1神经网络辨识器的仿真分析
以某燃油加热器为被控对象,其特性随负载、环境温度变化而变化,具有典型的非线性、时变和滞后特征。图4所示是在-10℃未开车内暖风条件下的某燃油加热器的开环输入、输出响应曲线,具有S形特征,用三阶函数描述为:
(12)
图4 燃油加热器开环输入、输出响应曲线
表1 辨识器Simulink仿真结果
(续表1)
图5 辨识器输入、输出曲线
图6 辨识误差曲线
分析NNI仿真数据可知,NNI辨识器可以很好地实现对燃油加热器的系统辨识任务,最大辨识误差不大于1%,优于加热器设计精度要求。
两种初始化条件下的辨识误差曲线如图7所示。由图7可知,基于知识先导学习算法的网络权值系数初始化模型对辨识器性能有明显改善作用;知识先导模型的最大辨识误差降低至随机模型的30%左右;辨识响应速度明显提高。
a. 随机算法初始化网络权值系数
b. 知识先导学习算法初始化网络权值系数
3.2单神经元自适应PID的仿真分析
a. 经典PID控制器
b. 单神经元自适应PID控制器
3.3神经网络自适应PID控制器的仿真分析
构建神经网络自适应PID控制器Matlab-Simulink,仿真过程中,由随机函数发生器产生周期为5s、幅值为[0,5]的随机阶跃信号作为NNC系统的输入。图9所示为6组自适应PID控制器的输入、输出响应曲线,表2为该组实验数据的分析结果。最大超调量σ为阶跃响应曲线中稳态值的最大超出量与稳态值之比;峰值时间tp为阶跃响应曲线超过其稳态值第一次达到峰值的时间;调节时间th为阶跃响应曲线进入稳态值±5%误差带而不再超出的最小时间。结果表明,控制器超调量平均不大于10%,峰值时间、调整时间不大于2s,技术指标表现良好,均满足系统设计要求。
图9 神经网络自适应PID控制器输入、输出响应曲线
序号最大超调量σ%峰值时间tps调节时间ths112.401.631.82210.731.421.5434.221.211.4245.341.331.5255.471.151.3465.661.251.45
笔者将神经网络辨识器NNI和单神经元自适应PID控制器有机结合,并引入知识先导学习算法,实现了对非线性、时变、时滞对象的参数在线辨识和PID控制参数自整定。仿真分析结果表明,该控制器辨识精度高,响应速度快,超调量小,是实现非线性、时变、时滞对象自适应控制的一种有效方法。
[1] 于开平,牟晓明.基于前向神经网络的非线性时变系统辨识改进EKF算法[J].振动与冲击,2010,29(8):5~8.
[2] 宋哲,陈文卿,徐志伟.基于神经网络的悬臂梁在线辨识与振动主动控制[J].振动与冲击,2013,32(21):204~208.
[3] 韩冰,韩敏.基于动态BP算法的非线性滞后系统辨识[J].大连理工大学学报,2010,50(5):777~781.
[4] 田一鸣,黄友锐,高志安,等.基于GA与CSA-RBF神经网络辨识的自适应PID控制器[J].系统仿真学报,2008,20(17):4618~4621.
[5] Mazalan N A,Malek A A,Wahid M A,et al.Review of Control Strategies Employing Neural Network for Main Steam Temperature Control in Thermal Power Plant[J].Jurnal Teknologi,2014,66(2):73~76.
[6] Zheng Z Q,Wang X J,Zhang Y H,et al.Research on Neural Network PID Quadratic Optimal Controller in Active Magnetic Levitation[J].The Open Mechanical Engineering Journal,2014,8:42~47.
[7] He Y,Fei S,Li J L,et al.Multi-motor Synchronous Control Method Based on Single Neuron Adaptive PID Controller[J].Journal of Computational Information Systems,2012,21(8):8917~8927.
[8] 修海燕,闫德勤.基于神经网络控制的LMS算法及其仿真[J].微型机与应用,2011,30(5):103~106.
ResearchonSelf-adaptiveControlMethodforNonlinearTime-varyingObjectBasedonNeuralNetworks
ZANG Yu-pinga, ZHANG Yanga, SUN Bob
(a.CollegeofHumanities&Information; b.SchoolofBasicSciences,ChangchunUniversityofTechnology,Changchun130122,China)
Aiming at the nonlinearity, time-varying and delay of the controlled object in the industrial control, having neural networks and PID control combined to build an adaptive PID controller was proposed, including the introduction of knowledge leading learning algorithm to improve time efficiency. The simulation result indicates that this controller can identify the controlled object’s model automatically and self-tune the controller parameters together with better performance in the error identification, quick response and overshoot.
self-adaptive PID control, single neural element, neural networks identifier, knowledge leading learning algorithm, system identification,self-tuning parameter
TH862+.6
A
1000-3932(2016)01-0006-06
2015-12-18(修改稿)基金项目:吉林省教育厅“十二五”科学技术研究项目(吉教科合字[2013]第525号)