支持向量机分类法在异步电机故障诊断中的应用

2019-07-19 06:42朱树先
关键词:学习机向量电机

张 行,朱树先

(1.苏州科技大学 天平学院,江苏 苏州215009;2.苏州科技大学 电子与信息工程学院,江苏 苏州215009)

电机故障检测在工业生产中一直广受重视[1-3]。随着以统计学习理论为基础的支持向量机的应用领域越来越广,目前作为最佳的小样本学习机已经被很多研究者和工程技术人员用于该领域当中,其优点是,即使不知道被控对象精确数学模型,也可以进行控制或分类。因此,将支持向量机识别算法用于电机故障诊断具有传统算法不可比拟的优势。目前,已经有一些研究者和工程技术人员将支持向量机算法用于电机故障诊断。他们的方法也不尽相同,有的采用了对支持向量机进行算法优化的做法[4-5],有些则将支持向量机与别的方法相结合,试图改进支持向量机的识别性能[6-8]。对单一的故障诊断可达到98%的准确率,印证了支持向量机算法的有效性和实用性[9]。但是,以上方法尚存在着一些缺点和不足,主要表现在:首先,多数作者在支持向量机选取上缺乏理论指导;其次,选择的电机故障模型较少,一般只选取了两三种故障进行分类,缺乏对于电机可能出现的各种故障同时进行分析、检测。

在这样的应用背景下,本文将RBF(Radial Basis Function)支持向量机分类法应用于电机故障诊断,从理论和应用两方面对现有方法做出了重要的补充和完善。本文的创新点如下:第一,在小样本学习机的选择方面,通过理论分析,选择分类性能优异的径向基函数支持向量机(简称为RBF支持向量机)作为学习机,用于电机故障诊断,并采用网格搜寻法对RBF核进行了参数优化,改善了其分类性能。第二,增加电机故障种类,提高了该方法的分类能力,拓展了该方法的应用范围。第三,针对支持向量机只能进行单一类别判定的不足,采用二次分类法,样本补偿方法实现了多类输出,可进行多故障的同时检测,因此,本方法是对支持向量机用于电机故障诊断方面的重大改进和补充。

1 支持向量机分类原理简介及支持向量机的选取

1.1 支持向量机分类原理简介

1.1.1 最优分类超平面

设样本集为(xi,yi),i=1,2,…,n,xi∈Rd,yi∈{+1,-1}是类别标签。 当样本线性可分时,目的是找到一个最优超平面将两个类别的点分离开。所谓最优分类面就是要求分类面不但能将两类正确分开(训练错误率为0),而且使分类间隔最大。基本思想如图1所示。图中三角形点和圆形点代表两类样本,H为分类超平面,H1、H2分别为过各类中离分类面最近的样本且平行于分类面的平面,它们之间的距离叫分类间距(margin)。在H1和H2上的向量称为支持向量 (Support Vectors)。设所求超平面方程为:x·w+b=0,对它进行归一化处理,使上述方程满足:

图1 支持向量机分类示意图

式中的分类间距等于2/||w||,使间距最大等价于使||w||2最小。此时,最优化问题可表示为:在式(1)的约束下,求||w||2的最小值。这是一个求解二次规划的问题,该优化问题可以转化为比较简单的对偶问题。即在约束条件

下面求解下列函数的最大值

为原问题对应的Lagrange乘子。容易证明,解中将只有一部分(通常是少部分)αi不为零,对应的样本就是支持向量。解上述问题后得到的最优分类函数是

1.1.2 线性不可分与核函数

前面的讨论是基于样本集是线性可分这一前提的。在现实世界中,大多样本集在原始空间内都是线性不可分的。为解决这种问题,一般做法是采用非线性映射的方法,将原始空间的样本映射到高维特征空间中,使样本在此高维空间中线性可分。假设x∈Rd经非线性函数φ(x)变换后,得到φ(xi)∈Rm,m>d。则称xi所属的d维空间为输入空间,所属的m维空间为特征空间。此时最优化问题改写为

与(3)式相比,(5)式中所做的内积运算是在一个相对高维的空间中进行,可能遭遇维数灾难的问题,使计算得不可能。 如能找到一个函数K(xi,xj),使之满足K(xi,xj)=φ(xi)·φ(xj)。 在高维空间进行的内积运算积就可以用原空间中的函数来实现,甚至没有必要知道φ变换的具体形式。这样就可绕过维数灾难的问题,在特征空间中使样本集变得可分,而计算复杂度却没有增加。核函数的提出正是这一思想的体现。引入核函数后,最优化问题为

相应的分类函数也变为

所谓RBF型支持向量机就是以径向基函数作为核函数,这个径向基函数一般取高斯函数,此时可表示如下形式

1.2 不同核函数支持向量机的选取

支持向量机用于模式识别领域中,选择基于不同核函数支持向量机。基于高斯核函数的RBF支持向量机是基于单一核函数的最好的学习机。笔者曾做过采用几种常用核函数输入样本在高维映射空间的稳定性分析,在几类核函数中,基于RBF核函数的样本在高维映射空间分布是最稳定的。故文中选择RBF支持向量机用于电机故障诊断。

2 异步电机故障种类简介和故障特征向量选择

2.1 三相异步电机故障种类简介

三相异步电机故障种类较多,本文只对鼠笼式三相异步电机常见的故障种类及特征做简要介绍。该类电机在运行过程中较为常见的故障有:转子断条、定子绕组匝间短路、偏心、轴承异常等故障。上述故障既可能是单独出现的,也可能是几种故障同时出现。但在目前的研究中,均未对两种以上故障的做出检测及分类。这些诊断方法无疑是片面的,不完善的。针对这种情况,在单一故障检测工作的基础上,进行了两种以上综合故障检测及分类的探索与研究,提出了一种基于RBF支持向量机的多故障检测分类方法[10-12]。

2.2 电机故障特征向量选择

目前,对异步电机故障的检测对象选择上有多种,例如,有定子电流异常检测法、电机轴振动异常检测法、小波故障分析法等。本文选择对定子电流进行故障检测。因为,首先这种检测方法比较简单、直接。其次,电机的多种故障都能通过定子电流在特定频段的异常表现出来。故提取定子电流信号,并对其作傅里叶变换,取特定频率处的幅值作为支持向量机的输入向量,可简化电机故障特征向量选择的难度[13-14]。

3 实验仿真与结果分析

3.1 实验样本的选择

考虑到本文主要是从理论上模拟、仿真支持向量机对单一故障和多个故障的识别性能,加之实验条件有限,故本文没有进行电机故障实测。但是,本文选择了他人的实测部分样本数据,并且在此基础上,假设故障数据属于线性系统。根据线性系统的具有的线性、时不变特性进行了样本数据的扩展。从理论上该方法是可行的。部分实测数据如表1所列[15]。

表1 部分实测的故障样本

3.2 训练样本和测试的样本选择策略

前面采集到的共5组类别,加上按照线性、时不变性扩展的共30个样本,每一类样本集中有6个样本。对每一类取其中的3个样本作为训练样本,3个作为测试样本,来验证RBF支持向量机的分类效果。除此之外,对于每个故障样本集的6个故障样本,取其平均值作为多故障识别实验的补偿样本,其用作用将在多故障综合识别试验中体现出来。

3.3 训练策略的选择与改进

本文所做实验主要分为两部分,在样本选取、训练、识别策略是完全不同的。第一部分是取单一故障的样本进行训练和测试,其样本选取及训练、测试策略都是常用的。第二部分是改进的多故障综合判别法,由两种以上单一故障样本进行叠加,至少分两个步骤进行识别,第一次要识别出其中的一个故障,根据阈值设定法决定是否进行第二次识别,如果需要,则在第二次识别时采用样本补偿法进行测试,并与上次的识别结果合并,在输出向量中将每个故障全部表示出来。实现基于RBF支持向量机的多故障识别。

3.3.1 单一分类方法的训练与识别

按照传统的学习机分类原理,学习机一次只能检测出一种故障。这种训练方式,期望输出向量所代表的类别如表2所列。分别将标明为正常的训练样本集和故障训练样本集中的15个样本送入RBF支持向量机中进行训练。当样本训练完毕,即可利用训练好的RBF支持向量机对测试样本进行识别,检验该方法的有效性。本文以Matlab7.0为开发平台。按照两类到多类的识别方法,单一故障样本识别正确率可达到90%。

表2 电机正常状态和故障类别的表示法

3.3.2 改进的多故障综合判别法

(1)测试样本和补偿样本的选择

对于多个故障同时出现的情况,从样本集的选择到训练、识别方法比单一故障识别要复杂得多。本文只做几种两类故障同时识别的研究实验,一方面可验证本文方法的合理性和有效性,另一方面,完善支持向量机在电机多故障识别方面的应用。在故障样本选择上,为了简化分析,将电机系统视为线性系统。根据线性系统具有的线性、时不变特性,将两类故障做叠加运算,再进行归一化处理,即得到了同时具有两类故障信息的新样本,对一些典型的故障取两两组合,共取30个样本,分为4个测试样本集,代表了4种同时存在两个故障的样本。此外,对前面的4种单一故障样本,每一种故障样本集中的样本取平均值,在判断第二种故障时,起到相应故障补偿作用。注意,这里选择的多故障样本全是用来进行识别的,没有训练样本。使用前面训练好的学习机进行识别,目的就是扩展该学习机的功能,检验其对多类故障识别的能力。

(2)测试样本和补偿样本的选择

沿用表2对单一故障类别的标号。以电机同时出现两种故障识别为例,其期望输出状态如表2所示。众所周知,当使用样本集对支持向量机进行样本训练时,在有监督学习下不会出现期望输出向量的分量中包含两个1的情况,本文列出的输出向量分量中存在两个1的现象,是指经过对两类同时存在的故障分两次识别,对第一次识别结果进行归一化处理,将标明类别的分量取为1,其余为0,并将其保存到临时变量。完成第二次识别后,对于第二次的识别结果做同样的处理,再与第一次识别后,即可产生多类故障及其故障标识号的输出。

(3)识别策略设计与实验结果分析

本文采用了多次识别的方法。首先,对多故障样本送入前面训练好的支持向量机做第一次识别,以两类故障样本为例,只要有一类故障被识别出来,即支持向量机输出向量中,标识该故障的分量最大,则视第一次识别是成功的。如果两类故障都没有识别出来,则本次实验失败,不需要再进行第二次识别。第一次识别成功后,对支持向量机的输出做如下处理:将输出向量的最大分量置1,其余置0,作为中间变量保存下来。第一次成功后,采用样本补偿法进行第二类故障的识别。具体方法是,将第一次的待识别样本减去已识别出的故障样本的补偿样本,经过归一化处理,作为第二次识别的输入样本,如果第二次识别正确,则仿造第一次的样本处理做法,将第二次支持向量机输出向量的最大分量置1,其余置0。再将此向量与第一次保存的中间变量合并,即可得出表3所要表示的多故障类别的形式。如果第二次识别没有达到预期效果,则本次试验属于部分成功。

本文首次进行了支持向量机多分类实验,构造了电机多故障样本,作为对电机实际工作在多故障系下的模拟。经过对30个存在两种故障的样本进行测试,第一次识别成功率为80%。经过样本补偿后,第二次识别成功率为66.7%。与前面的实验相比较,以单一故障样本为训练样本训练出的学习机尽管在识别多故障时表现不佳,但是,实验结果表明该方法是有效的。尤其重要的是,这部分实验没有训练样本,而是利用前面训练好的,用于识别单一故障的支持向量机。所以本文方法可对单一故障,多识别故障同时识别,是对现有方法的重要改进和完善。

表3 电机多故障类别的表示法

4 结论

针对支持向量机在电机故障存在的缺点和不足,本文系统地进行了RBF支持向量机在该方面的应用研究。首先,通过理论分析完成了支持向量机的选型工作。接下来利用选择的RBF支持向量机对单一故障样本进行了测试和验证,得到了相对满意的实验仿真结果。为了进行多类别综合故障识别,本文采用样本补偿和二次识别的手段对现有的支持向量机分类方法做出了重大改进,进行了多故障样本的识别实验,实验仿真结果证明该方法是行之有效的,是对现有方法的重要补充和完善。

猜你喜欢
学习机向量电机
向量的分解
泵用电机水润滑轴承选择与应用
关于电机滚动轴承的选择与计算
瞻望电机的更新换代
聚焦“向量与三角”创新题
基于极限学习机参数迁移的域适应算法
基于改进极限学习机的光谱定量建模方法
分层极限学习机在滚动轴承故障诊断中的应用
电机隐忧
向量垂直在解析几何中的应用