基于非线性动态系统辨识的 D-FNN算法研究*

2014-03-23 07:18杨文茵张德丰王传胜

中山大学学报(自然科学版)(中英文) 2014年5期

杨文茵，张德丰，王传胜

(1.佛山科学技术学院计算机系，广东佛山 528000；2.暨南大学计算机科学系，广东广州 510000)

本文将模糊逻辑和神经网络相结合，利用神经网络实现模糊化、模糊规则表达、模糊逻辑推理和反模糊化过程，提出了自适应学习方法，克服了基于先验知识确定模糊规则及网络结构的困难[1]。模糊逻辑、神经网络和模糊神经网络是智能计算这门交叉科学的基本内容，近年来他们都得到了飞速的发展并获得了广泛的应用。多学科算法的相互交叉、相互渗透可以进一步促进现代科学技术的发展[2]。

1 RBF神经网络的学习算法

1.1 模糊神经网络的结构

D-FNN(动态模糊神经网络)的结构是基于扩展的RBF(径向基)神经网络。RBF神经网络具有单隐层的三层前馈网络，RBF结构如图1所示。由于它模拟人脑中局部调整、相互覆盖接收域的神经网络，RBF网络是一种局部逼近网络，已经证明它能以任意精度逼近任一连续函数[3]。

设网络输入n维向量u，输出m维向量y，输入/输出样本对长度为L。

RBF网络隐层第i个节点的输出为

qi=R(‖u-ci‖)

(1)

式中：

u为n维输入向量；ci为第i个隐节点的中心，i=1,2,…,s；‖·‖通常为欧氏范数；R(·)为RBF函数，具有局部感受的特性。它有多种形式，体现了RBF网络非线性映射能力[4]。

网络输出层第k个节点的输出为隐节点输出的线性组合，即

(2)

式中，wk i为qi→yk的连接权；θk为第k个输出节点的阈值[5]。

图1 RBF网络结构

设有p组输入/输出样本up/dd，p=1,2,…,L定义目标函数(L2范数)为

(3)

学习的目的是使

J≤ε

(4)

式中，yp是在up输入下网络的输出向量[6]。

高斯径向基函数网络隐节点的输出为

(5)

式中，[·]表示向量u与ci间的马氏距离。

当∑i为对角阵时，式(5)为

(6)

当∑i为单位阵时，式(5)为

(7)

作用函数是高斯径向基函数(RBF)，是非线性的，即

R(h)=exp(-h)

(8)

(9)

式中，u为n维输入向量，j=1～n；ci为第i个隐节点的中心；σi为第i个隐节点的标准化参数；σij为第i个隐节点第j分量的标准化参数。RBF神经网络被广泛用于函数逼近以及模式识别中，在这些应用中，样本的维数通常很小[7]。正如Moody和Darken在文献[8]中所指出的，“RBF神经网络是最合适用于学习逼近连续的或分段连续的实值映射，其中该映射的输入维数充分的小”。

本文提出了一种动态模糊神经网络D-FNN结构及其学习算法，该模糊神经网络的结构基于扩展的径向基神经网络。其学习算法的最大特点是参数的调整和结构的辨识同时进行，且学习速度快，可用于实时建模与控制。动态模糊神经网络的结构如图2所示，共5层。在图2中，x1,x2,…,xr是输入的语言变量，y是系统的输出，MFij是第i个输入变量的第j个隶属函数，Rj表示第j条模糊规则，Nj是第j个归一化节点，wj是第j个规则的结果参数或者连接权，u指系统总的规则数。

图2 D-FNN结构

1.2 神经网络用于系统辨识

如果实际系统的输出只是依赖于其当前时刻的输入，而与历史输入无关，就称这个系统是静态系统。如果系统的输出不仅依赖于以前的输出而且依赖于当前的输入，则称这类系统为动态系统。n阶动态系统通常可以用如下方程描述[9]：

y(t)=f[y(n)(t),…,y′(t),x(t)]

(10)

其中，y(t)和x(t)分别为对象的输出和输入信号，y(n)(t)为y(t)的n阶微分，它是y(t)的以前信息。如果函数f(·)非线性的，则系统(10)称为非线性动态系统。本文将研究这一类型的系统。

文献[10]指出，在较弱的假设下，任何一个非线性离散时间系统都可用如下的NARMAX(Nonlinear AutoRegressive Moving Average with eXogenous inputs)模型来描述：

y(t)=f[y(t-1),…,y(t-ny),x(t-1),…,

x(t-nx),e(t-1),…,e(t-ne)]+e(t)

(11)

其中y(t)、x(t)、e(t)分别是系统的输出、系统的输入和噪声，f是待辨识的未知函数，ny、nx、ne分别是输出、输入和噪声的最大延迟，e(t)是独立的零均值序列。作为NARMAX的一个特例，实际中经常用到如下的NARX(Nonlinear AutoRegressive with eXogenous inputs)模型：

y(t)=f[y(t-1),…,y(t-ny),

x(t-1),…,x(t-nx)]+e(t)

(12)

基于NARX模型，文献[9]对此作了进一步简化，并提出如下几个没有干扰情况下的模型。

模型Ⅰ

(13)

模型Ⅱ

(14)

模型Ⅲ

y(t)=f[y(t-1),…,y(t-ny)]+

g[x(t-1),…,x(t-nx)]

(15)

基于上述模型，文献[9]提出了如何利用神经网络来进行系统辨识。

用神经网络来进行系统辨识，一个显而易见的方法就是使神经网络或模糊神经网络的输入-输出结构选择和被辨识的系统一模一样。在实际操作上，可以有如下两种模型。

1)并行模型

(16)

2)串-并行模型

y(t-ny),x(t-1),…,x(t-nx)]

(17)

2 实验结果与分析

被辨识的对象描述如下：

(18)

这个模型广为研究人员使用，比如，文献[11]和文献[12]，该对象给出的无外力系统的平衡状态分别为(0,0)和(2，2)。如果串-并行辨识模型用来辨识该对象，则这个模型可以用如下方程来表示：

其中，f是三输入单输出的D-FNN。使用同文献[13]和文献[14]相同的输入u(t)=sin(2πt/25)，其结果如图3所示。其中图3(a)表示产生的模糊规则，图3(b)表示训练时的实际输出误差，图3(c)表示均方根误差。与文献[11]、文献[12]及文献[13]结果比较如表1所示。

由表1可以看到，要达到相同的训练误差，只有结构自适应的OLS方法需要65条规则，远大于D-FNN所需要的规则数。文献[11]和文献[12]也采用了修剪计算[15]，其所用的规则数虽然比OLS方法少，但还是比D-FNN的方法多多了，而且训练误差比D-FNN大得多。由图3(d)可以看到，尽管D-FNN的结构很小，但其泛化能力很强。结果表明：与其它算法相比，D-FNN无论在结构上还是性能上都具有明显的优势。

图3 非动态线性系统的辨识

表1 不同算法的性能和结构比较

Table 1 Comparison of performance and structure with different algorithms

D⁃FNNOLS[13]RBF⁃AFS[11]FNS[12]规则数7653522参数数4732628084均方根误差0 02820 02880 1384未列出

为了检验D-FNN的泛化能力，设p=6，n=500。其中p为前6步预测结果，n为500个样本对。选择不同参数，将得到两种不同的神经网络结构，其训练和测试结构列于表2中。

表2 n=500,p=6时训练数据的仿真结构

当p等于6，模糊规则数为10时，图4说明了D-FNN泛化性的测试，其中，前500个点用于训练，后500个点用于预测。由图4及表2可以看出，无论是采样5条规则还是10条规范，所构建的模糊神经网络都具有很强的泛化能力，因为测试误差几乎等同训练误差[16]。表3列出了D-FNN与ANFIS(基于自适应神经网络的模糊推理系统)、OLS(正交最小二乘网络)和RBF-AFS(径向基自适应模糊系统)的比较结果。

图4 D-FNN预测的测试结果

表3不同的结构和性能比较(训练条件：n=500,p=6)

Table 3 Structure and performance comparision(Training condition:n=500,p=6)

方法规则数参数的数量训练的均方根误差测试的均方根误差D⁃FNN101000 00820 0083ANFIS161040 00160 0015OLS352110 00870 0089RBF⁃AFS212100 01070 0128

比较结果显示，即使D-FNN有更多的可调参数，它的性能也并没有ANFIS好。原因是ANFIS通过迭代学习的方式训练，从而可以达到整体的最优解。而D-FNN只能获得次优的结果。然而，与RAN、RANEKF及M-RAN(它们也只能得到次优解)相比，D-FNN结构小而泛化能力更强。

3 结论

D-FNN算法中，非线性参数是由训练样本和启发方法直接决定的，而没有用优化算法来确定，虽然高斯宽度在学习时可以自适应地调整，但学习规则却很简单。D-FNN算法中，由于分级学习策略的使用可以缓解学习过程中的震荡问题；修剪技术的应用，使得网络的结构不会持续增长。为检验D-FNN的有效性，把D-FNN与其它的学习算法进行了比较，并深入探讨这些算法与其它算法的相互关系，研究表明D-FNN具有简洁的结构和优良的性能。

参考文献：

[1]JANG J-S R.ANFIS:Adaptive-network-based fuzzy inference system[J].IEEE Transactions on Systems,Man,and Cybernetics ,2013,23(3):665-684.

[2]KADIRKAMANATHAN V,NIRANJAN M.A function estimation approach to sequential learning with neural networks[J].neural computation,2012，16(4):954-975.

[3]HONG Z Q.Algebraic feature extraction of image for recognition[J].Pattern Recognition,2011,24(3):211-219.

[4]徐丽娜.神经网络控制[M].北京:电子工业出版社,2009.

[5]WU S Q,ER M J.Dynamic fuzzy neural networks:a novel approach to function approximation[J].IEEE Transactions on Systems,Man,and Cybernetics:Part B,2000,30(2):358-364.

[6]ER M J.WU S Q.A fast learning algorithm for parsimonious fuzzy neural systems[J].Fuzzy Sets and Systems,2002,126:337-351.

[7]任爱红.模糊随机过程函数列均方差一致Henstock积分的可积性[J].中山大学学报:自然科学版,2010,51(4):41-44.

[8]MOODY J,DARKEN C J.fast leaning in network of locally-tuned processing units[J].Neural Computation,2009,1:281-294.

[9]NARENDRA K S,PARTHASARATHY K.Identification and control of dynamical system using neural networks[J].IEEE Transactions on Neural Networks,1990,1(1) :4-27.

[10]LEONTARITIS I J,BILLINGS S A.Input-output parametric models for nonlinear systems,part 1:deterministic nonlinear systems[J].International Journal of Control,2006,41(2):303-344.

[11]CHO K B,CHEN B H.Radial basic fuction based adaptive fuzzy systems and their applications to system identification and prediction[J].Fuzzy Sets and Systems,2006,83(3):325-339.

[12]CHAO C T,CHEN Y J,TENG C C.Simplification of fuzzy neural systems using similarity analysis[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,2008,26(2):344-354.

[13]CHEN S,COWAN C N,GRANT P M.Orthogonal least squares learning algorithm for radial basis function network[J].IEEE Transactions on Neural Networks,2009,2(2):302-309.

[14]何正风,张德丰,孙亚民.高斯激活函数特征值分解修剪技术的D-FNN算法研究[J].中山大学学报:自然科学版,2013,52(1):34-39.