张继洲 米志飞 谢春丽
摘要:为了减少故障参数的特征数量,加快诊断算法的运行速度,提高故障诊断的效率,本文提出利用熵度量理论对故障参数的特征按重要程度进行排序,将重要程度靠后的特征依次去除,计算去除某些特征后的特征集的熵变化量,若熵变化量变化比较小,则将该特征真正约简,再从约简后的特征集中选出一个最优的约简特征集。利用自组织特征映射神经网络对故障参数特征约简结果进行检验,验证结果表明:利用熵度量理论得出的约简结果能够用于故障诊断且诊断结果正确。
关键词:熵度量;属性约简;故障诊断;SOM神经网络
中图分类号:S11;TP206+.3
文献标识码:A
文章编号:1001-005X(2015)04-0087-05
随着储存技术的快速发展,越来越多的故障数据被储存,而故障诊断过程就是对这些海量般的历史数据进行分类分析的过程。在诊断过程中,最重要的一步就是特征提取。为了更加准确的描述机器的工作状态,大量的特征被创造出来并被用来描述机器设备的运行状态。但是,数据的特征越多(维度越高),分析的难度越大,分析结果的可信度也越低。所以,必须对数据进行属性约简(特征约简或者维归约)。利用熵度量理论,能够直接对特征的重要程度进行排序,可以有效降低故障诊断参数的维数、加快诊断算法的运算速度。
1 熵度量理论
已知初始特征全集 ,去除任意特征 得到一个特征集 ,特征集变化前后的熵的变量 越小,特征 对特征集F越不重要
根据文献,设约简集合 ,故约筒子集 的熵的重要度为
最简约简子集(集合中元素最少)定义为:
2 熵度量理论属性约简实例
根据熵度量理论,本文对电控发动机故障征兆集进行约简,利用文献中的部分故障与征兆对熵度量理论属性约简算法进行说明。
定义对象集(故障集) 属性集(征兆集) ,各参量定义见表1和表2。
根据熵度量理论,求得数据集各样本间的相似度量,即汉明距离,见表4。
由表4计算得,原始数据集的熵:
分别去除各个特征,计算得到熵的变化量(以去除特为例):
去除特征,得到表5的样本数据集。
根据表6计算得,表内数据集的熵:
熵的改变量:
去除特征X4得到表7的样本数据集。
根据表8计算得,表内数据集的熵:
熵的改变量:
以相同的方法计算求得:
根据熵的变化量可知,存在兩种约简方案见表9。
采用方案一时,约简特征X4、X5、X6后,属性集的熵为 ,约简前后熵的改变量
采用方案二时,约简特征X4、X5、X6、X11后,属性集的熵为 ,约简前后熵的改变量 。比较两方案结果, ,根据熵度量理论,熵的改变量越大,该特征越重要,所以特征X11对故障诊断的正确性和诊断速度影响更大,方案一更合适,即将特征X4、X5、X6约简,得到核心属性X1、X2、X3、X7、X8、X9、X10、X11、。
3 约简结果算法验证
为验证约简结果是否可以用于实践运用,本文利用SOM神经网络对约简结果进行验证,验证是否可以利用约简得到的核心属性识别出文献中的8种故障类型。在验证过程中,将约简结果即X1、X2、X3、X7、X8、X9、X10、X11作为SOM神经网络的输入,文献中的8种故障类型即y1、y2、y3、y4、y5、y6、y7、y8作为SOM神经网络的输出结果。神经网络的理想输入和输出见表10。
将样本1~8作为训练样本,对SOM神经网络进行训练,文献中的故障现象数据见表11作为测试数据进行故障诊断,训练结果和诊断结果见表12和表13(以样本4和样本7为例)。
由表12和表13可以看出,当训练步数为100时,每个故障类型都被划分为一类,分类非常细化,互不影响诊断结果。当训练步数提高到200、500、1000时,分类结果没有变化,对诊断结果已经没有实际影响。在训练好的网络中,输入样本4和样本7,诊断结果如上表12和表13所示,SOM神经网络将样本4分到故障类型y4,将样本7分到故障类型y7中,故障诊断结果与实际故障原因相同,说明约简后的属性集可以用于故障诊断,且不影响故障诊断结果。
4 约简结果实验验证
在算法验证的基础上,笔者在实验室组建一个由可设置不同故障的测试车辆、X-431开放式汽车故障诊断仪组成的测试系统对约简结果进行验证。在8种故障分别存在的情况下进行测试,每种故障情况下测得20组数据,总共160组数据,从中随机选出152组数据作为训练样本数据集,剩余8组数据作为测试数据集,构建一个8-17-8的BP神经网络进行故障诊断。由图1可知,当训练迭代次数达到13次时,系统网络的输出达到要求误差,结束训练,输入测试数据集进行测试,得到输出结果,见表14。
由表14可以看出,实际输出与理想输出相吻合,说明约简后的特征属性集可以用于实践中,再次表明本文的约简方法的正确的、可用于实践的。
5 结束语
本文利用熵度量理论,根据属性约简前后属性集的熵的改变量大小对故障属性的重要程度进行了排序并将不重要的特征挑选出来进行约简,得到一个最简约简属性集合。为了验证该最简属性集是否能够用于属性约简,本文利用SOM神经网络从算法上对属性约简结果进行故障诊断验证,利用BP神经网络从实际测试中对约简结果进行故障诊断验证,验证结果表明根据熵度量理论得出的最简约简属性集合是合适的,能够得到正确的诊断结果,达到了减少属性特征且不影响诊断结果的目的。