基于稳定Hammerstein模型的在线软测量建模方法及应用

2015-08-20 07:31丛秋梅苑明哲王宏
化工学报 2015年4期
关键词:权值增益向量

丛秋梅,苑明哲,王宏,4

(1 辽宁石油化工大学信息与控制工程学院,辽宁 抚顺 113001;2 中国科学院沈阳自动化研究所信息服务与智能控制技术 研究室,辽宁 沈阳 110016;3 中国科学院院重点实验室网络化控制系统重点实验室,辽宁 沈阳 110016;4 沈阳中科博微自动化有限公司,辽宁 沈阳 110179)

引 言

复杂工业过程尤其是化工过程的部分关键过程变量在线不可测或测量滞后非常大,严重限制了简单、有效控制器的应用,使闭环控制难以实现,尤其是当进料特性、外界环境等生产边界条件发生变化时,仅仅依靠人的经验及传统技术难以满足越来越高的运行目标要求[1]。同时,由于存在未建模动态和不确定干扰,采用常规的神经网络、模糊模型等建模方法易出现不稳定的情况,且实时性能较差[2],因此导致过程的关键变量软测量精度下降[3-5]。Hammerstein 模型(简称H 模型)是化工过程的常用模型之一,由无记忆非线性增益和有记忆线性系统串联构成,线性子系统描述对象动态特性,非线性增益用于校正线性系统模型[6]。文献[7-8]以多项式描述H 模型非线性增益,仅能代表弱非线性过程,对于具有中等或强非线性的过程,精度和适用性将有所下降。文献[9]采用基函数的线性组合作为H 模型的非线性环节,这种方法对于多变量的非线性函数,需要大量的参数和很高的阶次,不利于在线辨识。文献[10]对H 模型的非线性环节和线性环节的参数辨识方法分别进行了总结,认为以神经网络、模糊系统、神经模糊系统、支持向量机等基于数据的非线性环节来进行辨识,是目前的研究热点。文献[11]采用模糊神经系统建立Hammerstein-Wiener模型的非线性增益部分模型,适用于非线性环节难以参数化的情况,为H模型的辨识提供了借鉴作用。此外,H 模型的非线性环节模型应具有良好的非线性拟合能力和自适应能力。文献[12-13]指出当神经网络隐含层节点数足够多时,将以任意精度逼近非线性系统,但不能保证非线性动态系统建模误差的稳定性。文献[14]指出与固定学习速率的梯度下降法相比,时变学习率具有更快的收敛性,可以保证误差的稳定性和自适应能力。本研究采用带有时变稳定学习算法的小波神经网络作为H模型的非线性增益,采用基于递推最小二乘的ARX 模型作为线性系统部分,其中小波神经网络使H 模型具有表征强非线性的能力;与固定学习速率的梯度下降法相比,基于文献[15]的ISS(输入到状态稳定性,input-to-state stability)-Lyapunov 函数推导得出的稳定时变学习算法具有更快的收敛性,可以保证误差的稳定性和模型的自适应能力;以非线性系统和实际污水处理过程为例进行了仿真实验,并对实验结果进行了分析。

1 基于稳定H模型的在线软测量模型结构

以无记忆非线性增益部分和有记忆线性部分进行内联的H模型是以非机理形式表征非线性系统的有效模型,其结构简单又能有效地描述弱非线性动态特性,已经逐渐成为建立非线性系统模型的重要方法之一。许多非线性系统都可以用H 模型来实现系统的模型化[16],普遍用于建立如蒸馏塔和热交换系统、聚合反应器、pH 中和、舰艇推动器、大规模模拟电路宏模块结构和发动机振动系统等过程的模型,H 模型非线性增益部分的辨识无需系统的历史输入、输出信息,具有较易辨识、计算量少的特点[16]。文献[17]采用神经动力学来辨识H 模型的参数,H 模型用于建立实际过程模型与机理模型之间的偏差模型,所提方法虽可实现在线校正,但校正算法计算复杂,运算成本高。

本研究采用具有良好非线性拟合能力的小波神经网络来表示H 模型的非线性增益。基于H 模型的软测量模型结构如图1所示。图中,x1表示过程输入变量,x2表示过程中间变量,y表示难以在线检测的过程输出变量,表示输出变量的软测量值,e表示基于H 模型的软测量误差。

图1 软测量模型结构Fig.1 Structure of soft sensor

自适应学习算法由两部分组成:H 模型非线性增益部分小波神经网络的稳定学习算法;动态线性系统部分ARX 模型的递推最小二乘算法。

2 带有稳定学习算法的H 模型

2.1 H 模型结构

H 模型结构如图2所示。

小波神经网络一般采用单隐层结构,但并不影响其逼近能力[18],因此非线性增益部分的小波神经网络模型可写为

图2 H 模型结构Fig.2 Structure of H model

ARX 模型的输出可写为

将式(1)代入式(2),可写为

其中,x(k) ∈RI表示H 模型的输入向量,x(k)=[x1(k),x2(k)];表示非线性增益部分小波神经网络的输出;表示H 模型输出,即过程不可测输出变量的软测量值;ai(k)(i=1,2,…,na)和bj(k)(j=0,1,… ,nb)表示ARX 模型参数,na和nb表示模型阶次;φ=[φi]∈RH表示小波神经网络隐含层节点的激励函数向量,表示小波母函数,其中S=[si(k)]∈RH,si(k)表示第i个隐含层节点小波基函数的伸缩参数;D=[di(k)]∈RH,di(k)表示第i个隐含层节点小波基函数的平移参数;V(k)=[vij(k)]∈RH×I表示隐含层权值矩阵,W(k)=[wi(k)]∈R1×H表示输出层权值向量;H表示隐含层节点个数,I表示输入层节点个数,i=1,2,… ,H;j=1,2,… ,I。

2.2 H 模型的自适应学习算法

2.2.1 小波神经网络的稳定学习算法 文献[19]指出若实现化工过程实时在线优化,必须研究被控变量的在线建模方法。本文提出的稳定学习算法是一类在线建模方法。

定理1 为消除过程的有界未建模动态和不确定干扰对软测量精度的影响,H 模型非线性增益部分的小波神经网络参数采用如下的稳定时变学习算法时

其中,稳定学习率η(k) 为

其中

则可保证H 模型的平均建模误差指标有界,并满足

证明:采用梯度下降算法学习H 模型中的小波神经网络参数V(k)、W(k)、si(k)、di(k)。定义误差性能指标E为

为了最小化误差性能指标E,根据误差反传算法的链式规则,小波神经网络权值和小波尺度参数在E的负梯度下降方向进行训练,各参数的修正量为

其中,η(k)表示小波神经网络的学习率;en(k)表示小波神经网络的建模误差,定义为en(k)=-u(k);uˆ(k)表示小波神经网络的输出;u(k)表示小波神经网络的假定理想输出,由于u(k)无法精确测量,因此en(k)是虚拟误差指标,i=1,2,… ,H;j=1,2,… ,I。

en(k)与e(k)之间的关系式可由下列链式规则推导

当直接以 en(k) 校正模型参数时,式(15)成立

根据式(14)和式(15),可得 e(k) 和 en(k) 之间具有如下关系

将式(16)代入式(10)~式(13),即可得参数V、W、si和di的在线更新算法式(4)~式(7)。

使用Taylor 级数展开分析建模误差 e(k) 的动态。以具有两个独立变量的光滑函数f为例,在平衡点附近的Taylor 级数具有如下形式

其中,εt为Taylor 级数的高阶项。

基于H 模型的软测量模型输出可写为

其中,W*和V*、S*和D*分别表示使辨识误差 μ(k) 最小时小波神经网络的最优权值矩阵和最优小波参数向量,分别表示为

建模误差 e(k) 可写为

其中,δ(k)表示过程的未建模动态,δ(k)=μ(k) +ε(k),ε(k)为Taylor 级数高阶项,μ(k)表示小波神经网络的辨识误差。

因此小波神经网络的虚拟建模误差en(k)可写为

式(20)写成矩阵形式为

其中,

定义一个正定函数L为

由式(4)~式(7)和式(20)可得

其中,

因为

证毕。

2.2.2 ARX 模型参数的RLS 算法 定义ARX 模型参数向量θ和数据向量φ为

ARX 模型的阶次an和bn采用赤池信息量准则(akaike information criterion,AIC)确定。

参数向量θ采用带有遗忘因子的递推最小二乘法进行辨识,辨识算法为

其中,遗忘因子=0.9。

当H模型的非线性增益和线性系统分别采用式(4)~式(7)和式(27)~式(29)所示的自适应学习算法,可以保证基于H 模型的软测量方法在过程存在未建模动态和不确定干扰的情况下,软测量模型的误差是有界的。

2.2.3 建模算法小结 基于稳定H模型的在线软测量建模算法的步骤可总结如下:

(1)在[0,1]上随机选择小波神经网络的初始参数向量W0、V0、S0、D0;

(2)利用训练数据集,根据式(4)~式(7)学习H 模型中小波神经网络的权值W、V和小波尺度参数S、D;再根据式(27)~式(29)学习ARX 模型参数θ,作为H 模型的初始模型参数;

(3)采集新数据样本,由式(4)~式(7)在线学习H 模型中的小波神经网络的权值矩阵 (1)k+W、V(k+1)和小波尺度参数S(k+1)、D(k+1),以式(27)~式(29)在线学习ARX 模型参数θ(k+1);

(4)由式(3)计算H 模型的输出,返回步骤(3),重复上述步骤计算下一时刻H 模型的输出值。

3 仿真实验及结果分析

3.1 非线性系统

以Narendra 等[21]提出的如下非线性系统为例

式中,x1(k) 与x2(k) 为系统状态;k(y)、u(k)和 ε(k) 分别为系统的输出、输入和白噪声。仿真建模的目的是通过输入、状态信息来估计系统当前输出 y(k)。选择输入信息向量为

以u(k) ∈[ -2 .5,2.5]的随机信号与ε(k)∈N(0,0.1)的白噪声作用于非线性系统,构成5000组时间序列训练样本。以测试信号

作用于系统,产生200 组测试样本,来检验本文的算法。

根据输入信息向量,小波神经网络的输入层节点个数选为I=4,隐含层节点个数为H=10;ARX模型的阶次na=nb=2;初始学习率η0=0.9。

将本研究算法与采用不带有稳定学习算法的小波神经网络作为非线性增益的H 模型进行比较,仿真结果如图3所示。

图3 基于带有和不带有稳定学习的H 模型时 非线性系统建模结果比较Fig.3 Comparison of nonlinear system modeling based on H model with and without stable learning

可以看出,带有稳定学习算法的H 模型的平均建模误差指标低于不带有稳定学习算法的H 模型,表明带有稳定学习算法时模型与非线性系统真实输出的拟合程度较高。

图4为小波神经网络输出层节点权值w2的在线学习过程曲线。图5为ARX 模型参数a2的在线学习过程曲线。可以看出,H 模型中的各参数是在线 更新的,可以保证模型的实时性。

图4 权值w2 的在线学习过程曲线Fig.4 Learning curve of weight w2 in wavelet neural network

图5 ARX 参数a2 的在线学习过程曲线Fig.5 Learning curve of parameter a2 in ARX

3.2 污水处理过程出水COD 软测量仿真实验

以实际A/O 污水处理过程为背景,选择与出水COD 相关的入水指标:进水流量x1、进水悬浮固体浓度x2、氨态氮浓度x3,以及中间过程变量:缺氧池内的氧化还原电位x4、好氧池内的溶解氧浓度x5作为出水COD 软测量模型的输入变量。选择输入信息向量为

采用沈阳某污水处理厂A/O工艺过程的实际运行数据,共250 组输入/输出数据对,其中前150 组数据模型训练,后100 组数据进行出水COD 在线软测量的实验研究。

根据输入信息向量,小波神经网络的输入层节点个数选为I=5,隐含层节点个数为H=15;ARX模型的阶次na=nb=2;初始学习率η0=0.9。将带有与不带有稳定学习算法的H 模型进行比较,仿真结果如图6和图7所示。

图6 基于带有和不带有稳定学习的H 模型时COD 软测量结果比较Fig.6 Comparison of COD soft sensor based on H model with and without stable learning

图7 平均建模误差指标比较Fig.7 Comparison of average modeling error

图8 稳定学习率 η(k)Fig.8 Stable learning rate η(k)

由图6可以看出,带有稳定学习算法时软测量 模型的输出与真实COD 值比较接近,在工况出现异常的初期(第70~80 个样本),不带有稳定学习时的拟合精度略高,这是由于稳定学习算法是一步寻优算法,虽具有较高的运算速度,相比较常规误差反传的多步迭代算法,在工况急剧变化时仍需要适当的调整时间;图7表明,随着异常工况的持续,本文所提出基于稳定学习算法的H模型的平均建模误差指标逐渐下降,并明显低于采用常规误差反传的非稳定学习算法的模型。

图8为H 模型的稳定学习率曲线。可以看出,H 模型的学习率 η(k) 是时变的,取值与小波神经网络输入向量、权值和尺度参数、激励函数等有关,大于常规误差反传算法学习率η0的值(η0一般认为可在0~1 之间取值,当η0>0.2 时,权值修正量大可能导致振荡或发散;当η0<0.2 时,可迭代多步学习神经网络参数,η0多在0.05~0.1 之间取值,η0越小则收敛速度越慢);稳定学习算法是一步寻优算法,并且不存在学习速率大引起的振荡或发散现象。

定义平均相对误差绝对值为

带有与不带有稳定学习算法的H模型的平均相对误差绝对值比较如表1所示。

表1 平均相对误差绝对值比较Table 1 Comparison of average absolute relative error

可以看出,由于带有稳定学习的H 模型可自适应地调整稳定学习率,在外界不确定干扰的情况下,具有相对好的软测量性能。

4 结 论

本研究为了解决由于存在未建模动态和不确定干扰,导致复杂工业过程关键变量的软测量精度下降的问题,采用H 模型来建立不可测变量的软测量模型。①基于ISS-Lyapunov 函数推导得出的稳定时变学习算法在存在有界未建模动态和不确定干扰的情况下,建模误差是稳定的;②以非线性系统和污水出水COD 软测量仿真实验表明,基于稳定学习算法的H 模型具有较高的软测量精度;③由于稳定学习率与输入向量、权值和尺度参数、激励函数等有关,应确定最优参数初始值以进一步提高精度;④本文所提方法可适用于建立其他复杂工业过程的软测量模型。

[1]Chai Tianyou (柴天佑).Operational optimization and feedback control for complex industrial processes [J].Acta Automatics Sinica(自动化学报),2013,39 (11):1744-1757

[2]Cao Pengfei (曹鹏飞),Luo Xionglin (罗雄麟).Modeling of soft sensor for chemical process[J].CIESC Journal(化工学报),2013,64 (3):788-800

[3]Yu W,Li X.Discrete-time neuro identification without robust modification [J].IEE Proceedings -Control Theory and Applications,2003,150 (3):311-316

[4]Zhang N M.An online gradient method with momentum for two-layer feedforward neural networks [J].Applied Mathematics and Computation,2009,212 (2):488-498

[5]Chen Y J,Huang T C,Hwang R C.An effective learning of neural network by using RFBP learning algorithm [J].Information Sciences,2004,167 (1):77-86

[6]Narendra K S,Gallman P G.An iterative method for the identification of nonlinear systems using a Hammerstein model [J].IEEE Transactions on Automatic Control,1966,11 (3):546-550

[7]Lakshminarayanan S,Shah S L,Nandakumar K.Modeling and control of multivariable processes:dynamic PLS approach [J].AIChE Journal,1997,43 (9):2307-2322

[8]Wlodzimierz G.Stochastic approximation in nonparametric identification of Hammerstein systems [J].IEEE Transactions on Automatic Control,2002,47 (11):1800-1811

[9]Zhao W X.Parametric identification of Hammerstein systems with consistency results using stochastic inputs [J].IEEE Transactions on Automatic Control,2010,55 (2):474-480

[10]Jia Li (贾立),Li Xunlong (李训龙).Identification of Hammerstein model:review and prospect [J].Control Theory & Applications(控制理论与应用),2014,31 (1):1-10

[11]Jia L,Yang A H,Chiu M S.Special input signals based neurofuzzy Hammerstein-Wiener model and its application [J].International Journal of System Control and Information Processing,2012,1 (2):199-218

[12]Hunt K J,Sbarbaro D,Zbikowski R,Gawthrop P J.Neural networks for control systems—a survey [J].Automatica,1992,28 (6):1083-1112

[13]Chen Senfa (陈森发).Theory and Method of Complex System Modeling (复杂系统建模理论与方法) [M].Nanjing:Southeast University Press,2005

[14]Yu W.Nonlinear system identification using discrete-time recurrent neural networks with stable learning algorithms [J].Information Sciences,2004,158 (1):131-147

[15]Sontag,E D,Wang Y.On characterizations of the input-to-state stability property [J].Systems and Control Letters,1995,24 (5):351-359

[16]Feng Peidi (冯培悌).System Identification (系统辨识) [M].Hangzhou:Zhejiang University Press,1999

[17]Wang Shuangjian (王双剑),Chu Jizheng (楚纪正).Hammerstein model identification method based on the new improved neural dynamics and its application to hybrid modeling [J].Information and Control(信息与控制),2012,41 (3):384-390

[18]Kreinovich V S O,Cabmn S.Wavelet neural networks are asymptotically optimal approximators for function of one variable// Proceeding of IEEE ICNN [C].Florida,USA,1994:299-304

[19]Ye Lingjian (叶凌箭),Ma Xiushui (马修水),Song Zhihuan (宋执环).Real-time optimization for chemical processes based on on-line modeling of controlled variables [J].CIESC Journal(化工学报),2013,64 (8):2918-2923

[20]Sontag E D.Input to state stability:basic concepts and results [J].Lecture Notes in Mathematics,2008,1932:163-200

[21]Narendra K S,Li S M.Neural networks in control systems// Smolensky P,Mozer M C,Rumelhart D E,Mathematical Perspectives on Neural Networks [M].New Jersey:Lawrence Erlbaum Associates,1996:347-394

猜你喜欢
权值增益向量
一种融合时间权值和用户行为序列的电影推荐模型
向量的分解
基于增益调度与光滑切换的倾转旋翼机最优控制
聚焦“向量与三角”创新题
CONTENTS
基于单片机的程控增益放大器设计
基于Multisim10和AD603的程控增益放大器仿真研究
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
向量垂直在解析几何中的应用