基于模糊聚类的神经网络模型研究及应用

2018-07-21 02:20钮永莉魏光杏
韶关学院学报 2018年6期
关键词:神经元聚类神经网络

钮永莉,陈 晖,魏光杏

(1.滁州职业技术学院 信息工程系,安徽 滁州239000;2.福州大学 数学与计算机科学学院,福建 福州350019)

模糊神经网络是模糊逻辑和神经网络的有机结合,它汇集了模糊推理和神经网络的优点,为处理带有模糊不确定性质的模式识别问题提供了一种有效的手段.在实际应用过程中,模糊神经网络的一个难点问题是如何确定隐层节点数,隐层节点个数的多少对神经网络有举足轻重的作用,甚至直接决定了网络的学习和泛化能力[1].隐层节点数的选取有很多方法,包括根据经验选取、进化法和奇异值分解法等方式,其中进化法的计算量比较大且不够直观,奇异值分解法的好坏依赖于初始节点数和阀值,在计算隐层节点数时也有可能导致结果不唯一,使得网络设定失败[2].

笔者在研究了多种方法优缺点的基础上,使用BP网络,构造出一个基于模糊C均值法的模糊神经网络模型,首先使用模糊C均值法对样本进行特征抽取,确定隐层节点数后,可根据训练集得到所需的网络结构,然后使用测试集进行分类验证.本文使用此模型对塔里木盆地地质测井资料进行油气预测,取得了较好的效果.

1 模糊C均值法

对样本带有不确定性的聚类问题,通常采用模糊聚类算法.在各种模糊聚类算法中,模糊C均值算法(即FCM算法)及其各种优化算法被广泛使用.FCM算法是 Bezdek提出的一种基于目标函数的动态优化算法,能实现对数据的自动聚类.

假设{xi,i=1,2,…,n}是 n 个样本组成的样本集,mj,j=1,2,…,c 为每个聚类的中心, 其中 c 是类别数,μj(xi)是隶属度函数,其中i表示样本,j表示类别,聚类损失函数可以表示为:

用不同的方法定义隶属度函数并求解公式(1)的极小值,就可以得到不同的模糊聚类方法.其中,模糊C均值方法是最有代表性的并被广泛使用的一种聚类算法,对于各个不同的聚类,它要求隶属度之和为 1,即:

在满足隶属度之和为1的条件下求解公式的极小值.令公式(1)的Jf对mi和μj(xi)的偏导数为0,可得公式(3)和公式(4),用迭代的方法求解这两个公式,就是基本的模糊C均值算法[3].

对样本集进行动态聚类,最后的分类数即为模糊神经网络的隐节点数目.

2 BP神经网络

BP网络是一种反向传播网络(Back-propagation Network),BP算法属于监督式的δ算法,主要思想是:对n个输入学习样本:X1,X2,...,Xn,已知其对应的 m 个输出样本为:Y1,Y2,...,Ym,为了实际值与期望值尽可能接近,要达到网络输出层误差平方和最小的目标,网络训练要不断修正其权值,每次修正都以反向传播的方式传递到每一层,从而达到最终目标[4].BP网络模型见图1.

3 模糊神经网络模型

图1 BP网络模型

3.1 模型建立

由于模糊推理的单向性,使得应用比较多的模糊神经网络模型以多层前向网络结构为主.对不同的应用和训练集,需要采用不同的模型.在这些模型中,有很多方面都可以有不同的方式,如隶属度函数的建立、模糊激励函数的确定以及输入输出的形式,另外还有结构调整方式等都有不同[5].总之,需要通过对训练集的特征提取和训练达到尽量优的效果.

通过热解参数进行油气预测是典型的模糊推理问题,它具有多输入多输出的结构.对于输入的特征变量进行模糊分割,可以建立不同模糊分类的隶属度函数,同时根据最终的分类输出,建立起模糊神经网络模型.该网络共有5层:输入层、隶属函数建立层、隐含层、隶属度输出层和去模糊化层(见图2).用Ii(q)表示第q层的第i个神经元输入,Oi(q)表示第q层的第i个神经元输出,则第i个神经元的输入为Ii(l)=xi,输出为:Oi(l)=xi(i=1,2,…,m).

图2 模糊神经网络结构图

(1)输入层.该层每个神经元都是一个输入变量,其中神经元的数目由FCM算法的结果确定.

(2)隶属函数建立层.即对输入变量进行模糊化处理,本文采用高斯函数确定隶属度,高斯函数的中心和宽度也要进行训练.若模糊区间数有r个,则该层共有m*r个神经元.输入为Ik(2)=Oi(1)=xi,输出为Ok(2)=exp,(cij为中心,σij为宽度).

(3)隐含层.该层神经元的个数即前一层模糊聚类的分类数,其中第i个神经元的输入为Ii(3)=neti(3)=表示第q层第i个神经元与第q-1层第j个神经元的连接权值.输出为

(4)隶属度输出层.传递函数采用Sigmoid函数,第i个神经元的输入为

(5)去模糊化层.本层作用是得到最终的模式输出,采用最大隶属度原则.

3.2 网络训练

网络训练时采用附加动量项的反向传播算法,需要学习更新的参数有第三、四层的权值(包括阀值)wij(3)、wij(4),隶属度函数的宽度σij和中心cij.如:第三层权值的调整量和修正公式为:

其中,η是学习速率,α是动量项系数,第四层的计算类似,且:

3.3 模糊神经网络算法

(1)使用FCM算法确定分类数,作为第一层节点数.

(2)赋初值:包括网络权值和阀值,隶属函数的宽度和中心.

(3)对归一化后的样本,在总误差小于给定误差的条件下,重复以下步骤直至收敛:

a.从前向后计算各层神经元的输出O(q)(q=1,…,4);

隶属函数建立层:

隐含层:

b.计算每次实际输出和期望输出的误差.

c.从后向前计算第四层、第三层权值修正量Δwij(4)和Δwij(3)、用附加动量项的反向传播算法计算第二层隶属度函数中心修正量Δcij和宽度修正量Δσij并进行修正.

(4)当达到最小误差后,将模糊量去模糊化,得到最终结果.

4 模型应用

4.1 网络训练

利用本模型对塔里木盆地热解参数进行油气预测,共163个样本,每个样本有9个特征属性.取前120个样本作为训练样本,43个作为测试样本,用本文的模糊神经网络模型进行油气分类预测,具体步骤和参数设置如下:

(1)数据归一化.热解参数的各个特征值单位不同,为保证结果的准确性,需要对这些特征进行归一化(使用最大最小归一化算法),使得特征值都在[0,1]之间,保证每个特征值都发挥作用[6].

(2)将9个特征维数作为输入单元数,每个特征定义了高、中、低3个模糊区间.则第二层(隶属度函数建立层)就有3×9=27个神经元.经过模糊聚类FCM算法后,所有训练样本分成了9类,因此隐含层采用9个神经元.隶属度输出层取实际类别数5个神经元.因此网络结构采用的形式,其中最大误差取0.01.

当最大误差取为0.01时,该网络经过5 120次训练即可达到要求,当迭代次数为3 200时,误差收敛曲线见图3,可见误差收敛还是比较快的.

4.2 测试集验证

使用剩余的43个样本作为测试集进行验证,并与标准BP网络进行对比,BP网络采用的形式,其中第一层9个神经元代表输入层的9个归一化后的属性,第二层参照本方法的聚类结果也使用9个神经元,第三层5个神经元代表实际分类数,第四层是输出,结果见表1.与标准的BP网络相比,本文提出的模糊神经网络在迭代次数上有了很大的降低,正确率也得到较大提高.

图3 迭代次数3 200时的误差收敛曲线

表1 测试集结果

5 结语

通过实验对比,基于模糊聚类的模糊神经网络系统将传统神经网络和模糊聚类算法相结合,通过模糊聚类分析法确定隐层节点数,减少了人工干预,提高的网络的自动化和特征抽取的透明度,网络的学习效率也较高,更加符合实际应用的需要.

猜你喜欢
神经元聚类神经网络
神经网络抑制无线通信干扰探究
基于K-means聚类的车-地无线通信场强研究
跃动的神经元——波兰Brain Embassy联合办公
基于高斯混合聚类的阵列干涉SAR三维成像
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于二次型单神经元PID的MPPT控制
ERK1/2介导姜黄素抑制STS诱导神经元毒性损伤的作用
毫米波导引头预定回路改进单神经元控制
基于支持向量机回归和RBF神经网络的PID整定