基于粗糙集-神经网络的变压器故障诊断方法

2011-01-25 07:52陈小玉
制造业自动化 2011年17期
关键词:决策表约简粗糙集

陈小玉,张 静

(南阳理工学院 计算机科学与技术系,南阳 473000)

0 引言

研究和开发高效、实用的故障诊断技术,不仅是现代化生产及设备制造自动化的需要,也是现代机械设备运行维护和管理的一大课题[1]。智能故障诊断被认为是诊断技术的重要发展方向,传统的故障诊断方法是建立在系统的数学模型基础上的,数学模型依赖于被诊断系统的结构[2],而很多故障会造成系统结构的变化。神经网络具有自学习能力,善于联想记忆,有很强的鲁棒性和容错性。但神经网络不能确定输入特征冗余,不能将输入信息空间维数简化,因而当输入信息空间维数较大时,训练时间太长。粗糙集理论是一种新的处理不确定知识的数学工具,它不需要先验知识,仅从实际数据中得出系统的内在规律,能在保留关键信息的条件下对数据进行约简,去除冗余属性和冗余样本,压缩信息空间维数,精简知识系统[3]。因此将神经网络方法和粗糙集方法相融合,用粗糙集方法约简信息表达空间,去掉冗余信息,使训练集简化,以减小神经网络结构的复杂性,从而减少训练时间。

本文针对现有粗糙集理论与神经网络集成的故障诊断实施方案中计算繁琐、容易出现错误、收敛速度慢等缺点,对属性约简算法进行了改进,并将改进算法与BP神经网络结合应用到变压器的故障诊断中,简化了故障特征量输入的维数,对快速诊断变压器的故障进行了研究。

1 粗糙集的约简算法及改进

传统的硬计算方法,是使用精确、固定和不变的算法来表达和解决问题。粗糙集理论是一种处理含糊性、不精确和不确定性问题的新型软计算数学工具,它能有效地分析不精确、不一致和不完整等各种不完备的信息,并从中发现隐含的知识,揭示潜在的规律[4,5]。粗糙集理论作为一种软计算方法,利用所允许的不精确性、不确定性和部分真实性以得到易于处理、鲁棒性强和成本较低的解决方案。采用粗糙集理论作为故障诊断工具的优点[6]:粗糙集处理不精确、不确定问题不需要先验知识;粗糙集是一个强大的数据分析工具,具有严密的数学基础。粗糙集以不可分辨关系为基础,侧重分类,可以用一对精确集合逼近。

差别矩阵的主要思想是:首先利用差别矩阵导出差别函数,然后求解差别函数的析取范式,该范式的每一个析取项即为系统的一个约简。可以采取一定的措施对该算法进行改进,进一步简化属性约简过程。基于差别矩阵和逻辑运算的属性约简算法可以得到决策表的所有可能的属性约简结果,它实际上是将对属性组合情况的搜索变成逻辑公式的化简,从而简化问题。但是,这种计算过程比较繁琐。不难发现,如果矩阵中存在一个元素,其取值为包含单属性元素的集合,则表明该属性是区分这个矩阵元素所对应的两个样本所必需的属性,也是唯一能够区分这两个样本的属性。差别矩阵中的这些元素所包含的属性组成的属性集合其实就是该决策表系统的相对属性核。我们可以首先将这些属性置为0,同时将差别矩阵中包含核属性的元素的值修改为0,从而得到一个新的矩阵,再在这个新矩阵的基础上来实施上面讨论到的算法,同样可以得到约简结果[7]。

改进的差别矩阵算法步骤:

1)计算差别矩阵Mmxn(IS),根据差别矩阵计算核CORE(C);

2)∀cij如果CORE(C)⊆Cij(Cij≠Φ),则令Cij=0;

3)对差别矩阵中所有取值为非空和非零的元素Cij=α(xi,xj),建立析取范式其中;

2 神经网络算法

人工神经网络(Artincial Neural Network,ANN)是模拟人类神经系统传输、处理信息过程的技术。它采用了大规模并行处理的机制,速度很快;神经元执行非线性运算,具有很大的自组织潜力;采用信息分布式存储方式,具有很强的联想能力;通常都具有很高的冗余度,有很强的容错性和抗干扰能力。由大量简单的处理单元组成的非线性、自适应、自组织系统,它是在现代神经科学研究成果的基础上,试图通过模拟人类神经系统对信息进行加工、记忆、处理的方法,设计出的一种具有人脑风格的信息处理系统。

人工神经网络具有其独特的容错、联想、推测、记忆、自适应、自学习和处理复杂多模式等优点。目前神经网络己经被应用于许多领域,在制造方面的应用有过程机器诊断,生产流程控制,产品设计和分析,实时微粒识别和可视质量监督系统等。BP神经网络是目前应用最多的神经网络,它是一种多层前馈神经网络,其优点是只要有足够的隐层和隐结点,网络可以逼近任意的非线性映射。由于该网络结构上的特点,尤其是在学习过程中便于引入经验知识,大大提高了学习速度。

3 粗糙集-神经网络算法

粗糙集和神经网络结合起来进行故障诊断[8,9]的一般步骤如下:

1)样本收集:首先选择那些典型的样本数据集,样本集的好坏直接决定诊断性能的优劣。使用粗糙集约简方法尤其擅长输入量多的大样本处理,因此尽可能选择全部输入特征矢量和多一些样本数目。

2)样本处理:粗糙集只能对离散值进行处理,而原始样本的数据一般是连续值,因此必须对样本离散化处理才能有效使用粗糙集。

3)属性约简:采用粗糙集方法对离散化后的决策表进行约简,约简后的决策表中输入矢量和决策规则均减少,最后形成最小决策表。

4)神经网络训练:使用最小决策表对神经网络进行训练,确定神经网络的结构和每层神经元的数量。训练成功后的神经网络具有故障诊断能力。

5)仿真验证:用检验数据对已训练好的神经网络进行检验比较,若结果不满意,则重复第2到第5步,通过调整最后获取最优的神经网络。

应用粗糙集化简神经网络训练样本数据集,在保留重要信息的前提下消除了多余的数据,通过粗糙集归约,并将归约后的数据作为训练数据提供给神经网络,提高了训练数据表达的清晰度,也减小了神经网络的规模,同时利用神经网络又克服了粗糙集对噪声数据敏感的影响。实验表明训练速度明显提高了,获得了较好的效果。

4 仿真验证

变压器内部故障作早期诊断的最佳方法是油中溶解气体分析法(Dissolved Gas Analysis,DGA)。绝缘油中溶解气体的分析是以负荷及故障情况下油分裂出不同分解产物为依据,分解油中所溶解气体的组分和浓度含量,判断变压器内部可能存在的潜伏性故障。变压器油中溶解气体组分主要有:H2,CH4,C2H2,C2H4,C2H6,CO,CO2等。通过分析各种气体的含量,判断其故障类型。

变压器故障诊断是一个多输入多输出系统。己证明,三层的BP网络就可以以任意精度逼近任何非线性物理对象。增加层数的目的在于可以更进一步的降低误差,提高精度,但同时也使网络更为复杂,增加了网络权闽值的训练时间。而增加隐藏层中的神经元数目也可以使误差精度得到提高,其训练效果也比增加隐藏层的层数更容易观察和调整。在此我们使用三层BP神经网络。

首先收集南阳某变压器厂大量故障数据样本,然后进行数据离散化处理,形成原始决策表,再根据文中提到的属性约简算法,将这些规则精简,得到最终决策表。根据最终决策表,构造一个5输入、5输出的神经网络,其中输入变量Xi(i=1,2,3,4,5)分别代表H2、CH4、C2H4、C2H6和C2H2的含量,输出故障类型Yi(i=1,2,3,4,5)分别表示正常、中低温过热、高温过热、低能量放电和高能量放电。以本文的训练数据考虑,输入层共有5个神经元,输出层为5个神经元,隐层神经元为10个。BP神经网络隐含层神经元的传递函数采用S型正切函数tansig,输出层神经元传递函数采用S型对数函数logsig,训练函数trainlm,学习函数learngdm,性能函数mse,目标误差为0.001。

随机抽取100个进行训练,BP神经网络训练结果如图1所示。

图1 BP神经网络训练结果

从图1中可以看出,BP神经网络的收敛速度快,经过23步就达到要求精度,如果要求的精度比较高,BP算法的优点尤为突出。在很多情况下,采用LM算法的训练函数trainlm可以获得比其他任何一种算法更小的均方误差。

再随机抽取10个进行测试,诊断结果如表1所示。

除此之外,还对人工神经网络,粗糙集-三比值法和粗糙集-BP神经网络的诊断结论进行比较,人工神经网络的正判率为72%、而粗糙集-三比值法的正判率为85%、而粗糙集-BP神经网络的正判率为90%以上。

表1 BP神经网络诊断结果

5 结论

粗糙集理论化简了样本及条件属性,去除了故障诊断的原始决策表中的冗余信息,得到了故障诊断的最小决策表;从而减少了神经网络中输入层神经元个数,简化了神经网络的结构和规模,减少了网络的训练步数和时间;通过粗糙集理论对条件属性约简求核,较好地消除了样本中噪声数据的干扰,提高了神经网络对故障诊断的准确率;由于条件属性项大大减少,使得系统工作成本降低,诊断速度加快,实时性增强;具有良好的容错性和扩展性,能有效地消除故障诊断中的误报和漏报现象的影响。总之,粗糙集—神经网络的故障诊断方法准确率比其它故障诊断方法都高,具有较好的使用价值。

[1]胡波.基于粗糙集理论与BP神经网络结合的火电厂风机故障诊断研究[D].太原理工大学,2008.

[2]郑小霞.动态系统故障诊断技术的研究与发展[J].化工自动化仪表,2005,32(4):1-7.

[3]PAWLAK Z.Rough sets[J].Communications ofACM,1995,38(11):89-95.

[4]Pawlak Z.Vagueness and uncertainty-a rough set perspective[J].Computational Intelligence.1995,11(2):227-232.

[5]Y.Y.Yao.Constructive and algebraic methods of the theory of rough sets[J].Information Science.1998,109(l-4):21-47.

[6]刘清.Rough集与Rough推理[M].北京:科学出版社,2001.

[7]王义飞.粗糙集-神经网络在机械故障诊断中的应用研究[D].太原理工大学,2008.

[8]张景明,肖倩华,王时胜.融合粗糙集和神经网络的变压器故障诊断[J].高电压技术,2007,33(8):122-125.

[9]安文斗,刘平等.粗糙集与神经网络故障诊断组合方法应用[J].煤矿机电,2008,(1):34-36.

猜你喜欢
决策表约简粗糙集
粗糙集与包络分析下舰船运行数据聚类算法
基于决策表相容度和属性重要度的连续属性离散化算法*
基于粗糙集不确定度的特定类属性约简
基于Pawlak粗糙集模型的集合运算关系
带权决策表的变精度约简算法
基于二进制链表的粗糙集属性约简
实值多变量维数约简:综述
广义分布保持属性约简研究
基于决策等价性的决策表属性集分解研究*
基于决策技术和粗糙集理论的诊断知识库构建研究