基于支持向量机和模糊评判的故障诊断方法研究

2010-05-08 08:44:04
铁路计算机应用 2010年12期
关键词:征兆最值适应度

孟 萍

(兰州交通大学 自 动化学院,兰州 7 30070)

故障诊断就本质而言是一类分类问题。支持向量机(Support Vector Machine)具有在小样本下即可获得满意的学习效果以及保证所求解为全局最优解等优点, 因此基于 SVM 的分类方法具有很好的分类应用价值, 被广泛用于故障诊断, 人脸识别等领域中[1~2], 并获得了很好的实际效果。

本文基于SVM和模糊评判理论,根据故障特征和故障类型的不确定性,力求寻找一种智能的综合评判算法,建立实用而高效的故障诊断模型。

1 训练样本的模糊理论表示

设U=(u1, u2,…, um)为故障类型组成的集合;C=(c1, c2,…, cm)为故障类型的危害的权数集合,其中各个元素ci对应于故障集相应元素ui,表示ui相对“严重”的隶属度;V=(v1, v2,…, vn)为征兆集。则评判矩阵的建立方法如下:

设故障类型第i个元素ui对征兆集的第j个元素vj的隶属度为rij,则对征兆vj分析的结果可用模糊集合Ri表示为:Ri=(ri1, ri2,…,rim),则对于所有故障的评判矩阵为:

下面来确定rij,rij的确定是主观地根据专家应验来确定,同时也考虑其他原因,本文用加权统计方法求隶属函数,由经验统计资料,故障相关率(此样本关联故障的概率),对应故障反应,故障样本采集(获取或观察)的难易程度(或者幅值的变化程度)4个因素来分析,分别用下面的符号表示:

X1:故障样本统计(故障样本出现的次数)

(很多、比较多、大、中、小、比较小、非常小)

X2:故障相关率(此样本关联故障的概率)

X3:对应故障反应

X4:故障样本采集(获取或观察)难易程度。

其中X1的评分可用公式(2)来获得:

式中,Nui表示故障ui发生的次数,Nvj表示ui故障发生时vj出现的次数。

对于X2,X3,X4可由表1来确定。

故障的评分集合表示如下:

每一个征兆集的评分集合与权数集合,算出相应的隶属度rij

表1 故障因素与隶属度

2 粒子群算法和SVM的结合运用

支持向量机是基于结构风险最小化原理的学习算法,通过把数据映射到高维空间,使分类间隔最大化的方式来分类。由于该算法具有很好的理论基础和很强的泛化能力,已得到广泛应用,如基因表达数据的分析。但是当训练样本的特征数很高时,分类器的计算复杂度增加 ,且冗余特征会降低分类精度,如何在用支持向量机对样本分类之前,选择合理有效的特征子集显得尤其重要。

故障源的提取可以看作是全部变量中选取部分特定变量, 即为一个组合优化问题。本文利用改进的离散PSO并结合SVM得到一个故障源提取算法。改进的离散PSO 算法如下:

其中:xid为粒子当前位置。粒子由诊断数据中全体变量组成, 取值为 0 或 1, 0表示对应变量被选中, 1代表该变量参与计算。rand ()为[ 0, 1 ]均匀分布的随机数。pid为粒子自身最值, gid为全体最值, vid表示速度,这里为[ 0,1 ]均匀分布随机数。rand(xid)表示对xid进行随机赋值。α为一可调参数,其初始值可以设为一个较大值, 以保证粒子能够充分搜索解空间, 避免陷入局部最优值:随着粒子进化,更改α为一较小值以保证算法稳定,快速收敛。一般α初始值设为0.2~0.3,最后降为0.1。该PSO 离散算法的收敛速度同优化后的遗传算法GA算法相当, 但其简单易实现, 同时需要设置的变量也比GA 少, 因此更具有吸引力。

适应度函数用来评价每个粒子的表现, 在这里即为粒子选中的变量在故障诊断中表现的性能。具体实现时,将对每个粒子选中的变量的数据进行提取和预处理, 并分为训练集和测试集。利用训练集训练SVM , 并用测试集数据对得到的SVM进行测试, 其正分率即为该粒子的适应度。考虑到过多的变量会增加故障诊断系统的复杂性和实时性,改进适应度函数为:

f (xid)为粒子的最终适应度函数;f ( id )为该粒子对应的SVM正分率;mc为该粒子选中的变量数;mall为系统采集数据全部变量数; p为调整参数, 平衡最大正分率与变量个数, 根据具体的系统变量数以及故障诊断要求设置。

基于离散PSO 和SVM 特征选择算法的具体实现如下:(1)初始化粒子群。(2)对每一个粒子计算其适应度函数。(3)将粒子的适应度与其自身最值比较,如果大于,则更新自身最值。(4)选出历史中最大适应度值作为全局最值。(5)根据13 节给出的离散公式更新粒子群。(6)判断是否满足终止准则,是则结束, 否则跳转第(2)步。

当连续几次迭代适应度没有明显提高或是达到预先设定的最大迭代次数即认为满足终止准则,结束迭代。

3 综合故障诊断

为了验证本诊断方法,选取故障诊断的对象为机车的供电机组。

表2给出某机车的供电机组故障征兆和故障类型的频谱关系。

表2 机车的供电机组故障与征兆

根据前面介绍的方法构建K矩阵,并进一步求解出R矩阵。表3给出了不对中对应的K矩阵。

表3 转子不对中与征兆的评分集合

每行做为SVM的训练样本,只是对一组数据做分析计算,在实际工程应用中,需要进行大量的计算得到需要的训练样本,选择30组数据进行训练,输出模式如表4。

表4 输出模式

利用Matlab进行仿真训练,并用一组数据进行验证,可信度为0.86,说明上述方法是有效的。

4 结束语

通过对故障样本进行模糊化处理,再进行SVM的训练,得到了令人满意的效果,对于研究装置故障诊断和数据采集具有一定的现实意义。今后的工作还可以利用各种优化算法,对SVM进行优化,从而达到更理想的效果。

[1]陈长征,胡立新,周 勃,费朝阳.设备振动分析与故障诊断技术[M]. 北京:科学出版社,2007,5.

[2] Fu L M.Rule learning by searching on adapt nets.In:AAAIed.proceedings of the 9thNational ConferenceonArificialIntelligence[C].Anaheim, CA:AAAI Pess,1991,590-595.

[3] 李良敏,屈梁生. 基于遗传编程和支持向量机的故障诊断模型[J].西安交通大学学报,2004,38(3).

[4] 王宏漫,欧宗瑛. 采用PCA特征和SVM分类的人脸识别[J]. 计算机辅助设计与图形学学报,2003,15(4):416-420, 431 .

猜你喜欢
征兆最值适应度
改进的自适应复制、交叉和突变遗传算法
计算机仿真(2022年8期)2022-09-28 09:53:02
单调任意恒成立,论参离参定最值
聚焦圆锥曲线中的最值问题
巧用不等式求最值
数列中的最值题型例讲
地震征兆
地震征兆
基于空调导风板成型工艺的Kriging模型适应度研究
中国塑料(2016年11期)2016-04-16 05:26:02
少数民族大学生文化适应度调查
自适应遗传算法的改进与应用*