姜甲玉,刘仕一,张 炜,孙迎丰
(1.海军驻沈阳地区军事代表局,沈阳 110031;2.91206 部队,山东 青岛 266108;3.92854 部队705 厂,广东 湛江 524016;4.海军航空工程学院 研究生管理大队,山东 烟台 264001)
粗糙集理论是一种处理不精确、不确定与不完全数据的数学方法,在数据约简、特征提取等方面功效卓著,而且该理论与概率论、模糊数学、信息论和证据理论等其他处理不确定性和不精确性问题的理论有很强的互补性[1-3]。模糊神经网络是模糊理论与神经网络的融合,它同时拥有模糊系统和神经网络的优点,它既能像模糊逻辑那样表达定性的知识,处理不完整、模糊的数据,又拥有神经网络强大的自学习、自调整能力。
粗糙集能够对不完全、不确定的信息进行有效的处理,消除冗余数据,提取有用信息,但是由于粗糙集方法本身的局限性,它很难处理新数据,并且对连续性数据办法不多,不具备推广性。模糊神经网络中蕴含的模糊规则,避免了神经网络在知识表达中的黑箱性,但模糊规则的获取存在困难,是模糊神经网络应用的障碍。上述两者虽然各有不足,但在功能上可以互补。模糊神经网络对数据具有很强的泛化能力,可弥补粗糙集的不足;同时,可以发挥粗糙集数据约简的功能确定初始知识,解决初始模糊规则获取的问题,降低网络输入数据的维数,缩短网络训练的时间,避免网络构造的困难。
因此,本文将粗糙集与模糊神经网络技术相结合,建立故障诊断模型(见图1),对其中的数据预处理、粗糙集方法应用和模糊神经网络构造等关键技术进行具体研究,并通过歼击机操纵面故障[4]诊断实例,检验该方法的可行性和有效性。
图1 基于粗糙集—模糊神经网络的故障诊断模型
图1所示故障诊断的工作过程:首先,对数据库中的样本数据进行预处理,即对连续数据进行离散化处理,并获取各模糊集的初始隶属函数;其次,对离散化后的数据进行粗糙集处理,即数据约简(包括属性约简和值约简),获取诊断规则;第三,根据诊断规则确定网络的基本结构,由隶属函数以及相关参数初始化网络,用约简后形成的样本数据训练网络,调整相关参数;最后,用训练好的模糊神经网络对采集的待诊断数据进行处理,给出诊断结论。
粗糙集理论不能直接对连续数据进行处理,而工程领域中故障诊断的各种特征参数多是连续性的,如何将其离散化是首先需要解决的问题。目前,在粗糙集的应用研究中,离散化过程大多基于领域专家的经验知识来实现,寻找最优的离散化方法的问题还处在研究中,许多人提出了各自不同的方法:基本法、概念树法、期望值法、动态聚类法等[5]。一般来讲,不论哪一种方法,都应尽可能满足两点要求[6]:① 连续属性离散化后的空间维数应尽可能小,也就是经过离散化后的每一个属性都应包含尽量少的属性值的种类;② 连续属性值离散化处理后丢失的信息应尽可能小。本文采用模糊 C-均值(FCM)聚类算法[7]对数据进行离散化,使用此方法可获得各条件属性值隶属于相应离散集的隶属度,为获得隶属函数奠定了基础。
1)确定c(1<c<n),m ∈ [1,∞),初始化 V0并令迭代次数 t=1;
3)由tU和公式更新
在构造模糊神经网络时要给出初始隶属函数。由上述讨论可知,在数据离散化的过程中,已经获得了一些关于模糊集的信息,本文以此为基础,采用下述方法获取初始隶属函数。隶属函数采用高斯型,第i个模糊集合的隶属函数为:
隶属函数中心取聚类中心iv,与聚类中心的距离 dij最小的样本数据,设为xmin,为保证该值对于不同模糊集合的隶属度有所差别,故对该值的隶属度取值应为一较小值 µmin(一般不大于0.5),将 xmin和 µmin代入上式即可求得。
在故障诊断工程应用中,为保证故障诊断精度,一般利用较多的特征条件进行判断,其中,一些关键条件对故障比较敏感,而且相互独立,能够提供互补信息,提高诊断精度,应该加以充分利用;一些冗余条件对故障不敏感,或者与其他条件相互关联,没有利用价值,会增加诊断工作量和成本,应该从诊断规则中剔除。
粗糙集理论作为一种分析不确定性数据的数学工具,与经典集合理论不同,它从“知识”的角度处理客观事物的不确定性,认为知识是将对象进行分类的依据,通过这些知识可以将对象划分为不同的类别。知识表达系统的基本成分是研究论域对象的集合,关于这些对象的知识是通过对象的属性和属性值来描述的。
一个知识表达系统(也称信息表)可以表示为S=(U,R,V,f),其中:U是对象的集合;R=C ∪D,C ∩ D=φ,C称为条件属性集,D称为决策属性集;是属性r的值域;是一个信息函数,它为对象的每个属性赋予一个信息值,即
应用粗糙集理论最显著的特点是在保持知识系统分类能力不变的前提下,通过属性约简和值约简,导出问题的决策或分类规则。
在已知关于粗糙集的研究成果中,Skowron 提出的可辨识矩阵为求取最佳属性约简提供了很好的思路,该方法将信息表中所有有关属性区分信息都浓缩进一个矩阵当中,通过该矩阵方便地得到信息表的属性核(属性核是指信息表中不可删除的属性)。在此基础上,基于“属性重要性”思想[5]的启发式算法得到了广泛研究。以属性核作为计算的初始约简,引入“属性重要性”这样一个度量作为启发信息,按照属性重要程度的大小逐个将属性加入约简集,直到该集合是一个约简为止。
对信息表进行值约简的过程即是提取规则的过程。在属性约简所获得的最小属性子集的基础上,文献[8]改进的值约简算法使获得的规则集规模最小。文献[9-10]受属性约简中属性重要性的启发,故在值约简过程中引入类似规则重要性的启发信息,且文献[9]认为文献[8]给出的值约简算法存在规则冗余。但是本文采用文献[8]的值约简算法并没有出现文献[9]所示的冗余规则,而且文献[10]最后给出的规则集却有明显的冗余规则。因此,本文仍采用文献[8]给出的值约简算法:
1)对信息表中条件属性进行逐列考察。除去该列后,若产生冲突记录,则保留冲突记录的原该属性值;若未产生冲突但含有重复记录,则将重复记录的该属性值标为“*”;对其他记录,将该属性值标为“?”。
2)删除可能产生的重复记录,并考察每条含有标记“?”的记录。若仅由未被标记的属性值即可判断出决策,则将“?”标记为“*”,否则,修改为原属性值;若某条记录的所有条件属性均被标记,则将标有“?”的属性项修改为原属性值。
3)删除所有条件属性均被标为“*”的记录及可能产生的重复记录。
4)若两条记录仅有一个条件属性值不同,且其中一条记录该属性被标为“*”,那么,对该记录如果可由未被标记的属性值判断出决策,则删除另外一条记录;否则删除本记录。
图2是本文就歼击机操纵面故障诊断实例所构造的模糊神经网络。下面以此对网络结构进行说明。
图2 模糊神经网络的结构
网络第一层为输入层,每个神经元表示一个输入变量,变量值是条件属性的精确值;第二层为模糊化层,每个神经元表示一个模糊集合,用以模拟粗糙集规则前件的离散化,第一层神经元只与表示其离散集合的第二层神经元相连,通过各模糊集的隶属函数将输入值映射为模糊集的隶属度;第三层为规则层,实现粗糙集规则匹配的功能,该层节点数与规则数相同;第四层为结论层,实现模糊与运算,其输出为各规则的适用度;第五层为输出层,其功能是去模糊输出精确量。
由此,通过神经网络构建了完整的模糊推理系统,通过神经网络的学习算法,可以调整隶属函数的各个参数,实现模糊系统的自学习、自适应。本文利用Matlab的模糊逻辑工具箱对此进行了设计和实现。
本文采用的数据来自文献[4]的歼击机操纵面故障识别实例,数据共6种状态、105组数据,每组数据有8个参数,即构建知识系统 S=(U,R,V,f),本文在预处理过程中取聚类数为6,经数据约简后的最佳属性子集为{c3,c5},最简规则数目为12,得到的模糊神经网络的结构如图2所示,网络训练前后的各隶属函数如图3所示,图4为网络学习误差。
图3 网络训练前后的各隶属函数
图4 网络学习误差
为了验证诊断模型的可行性和有效性,本文在样本数据中加入一定的随机噪声构成测试数据,将得到的1 000组测试数据输入网络,诊断正确率如表1所示。
表1 诊断的仿真结果
本文详细研究了粗糙集与模糊神经网络技术结合过程中的几个关键技术,并用Matlab 对歼击机操纵面故障实例数据进行了仿真。结果表明:数据离散化过程不仅完成了粗糙集方法应用的预处理,还解决了属性数据各模糊集合初始隶属函数的获取问题;通过粗糙集方法进行数据约简,得到最简规则,从而可以构建结构简洁的神经网络,且网络各层都有明确的物理意义,有较好的语义;而且,构建的网络也使粗糙集方法获取的规则得以泛化,使得该方法对故障诊断表现出更优越的诊断特性。
[1]张文修,吴伟志.粗糙集理论介绍和研究综述[J].模糊系统与数学,2000,14(4):1-12.
[2]梁瑞胜,孙有田,周希亚.小波包变换和神经网络的某型导弹故障诊断方法研究[J].海军航空工程学院学报,2008,23(2):217-220.
[3]刘玮,宋贵宝,陈小卫.基于粗糙集和神经网络的导弹故障诊断方法[J].海军航空工程学院学报,2009,24(2):214-216.
[4]许洁,胡寿松.灰关联分析在歼击机操纵面故障识别中的应用[J].南京师范大学学报:工程技术版,2006,6(3):5-9.
[5]石红,沈毅,刘志言,等.关于粗糙集理论及应用问题的研究[J].计算机工程,2003,29(3):1-3.
[6]郝丽娜,徐心和.粗糙集理论在故障诊断规则获取中的应用[J].信息与控制,2001,30(7):586-590.
[7]孙即祥.现代模式识别[M].长沙:国防科技大学出版社,2003:268-271.
[8]常梨云,王国胤,吴渝.一种基于Rough Set 理论的属性约简及规则提取方法[J].软件学报,1999,10(11):1206-1211.
[9]林嘉宜,彭宏,郑启伦.一种新的基于粗糙集的值约简算法[J].计算机工程,2003,29(4):70-71.
[10]刘艳丽,王海涌,郑丽英.基于粗集理论的决策规则约简算法的研究与应用[J].兰州交通大学学报:自然科学版,2004,23(6):78-80.