石瑞敏,杨兆建
(太原理工大学机械工程学院,太原 030024)
基于复杂网络优化的DAG-SVM在滚动轴承故障诊断中的应用
石瑞敏,杨兆建
(太原理工大学机械工程学院,太原 030024)
针对滚动轴承故障与其演化程度组合类型数量大,一般模式识别方法难以适应的问题,提出基于复杂网络优化的有向无环图支持向量机(CNDAG-SVM)。该方法引入复杂网络理论中相似性测度概念用以评定各样本类型间的分离性质,并以平均相似性测度作为有效度量样本类型可区分程度的测度对有向无环图叶节点类型进行排序,依次提取对应二元分类器构造较优有向无环图拓扑结构,缓解误差累积效应的同时提高了结构上层节点的容错能力,获得较高的正确识别率。利用局部均值分解方法提取乘积函数(Production Function,PF)分量波峰系数、峭度系数及能量构造特征向量,将其输入CNDAG-SVM分类器中用于区分滚动轴承的故障类型与演化程度。对滚动轴承内圈故障、外圈故障及滚动体故障振动信号的分析结果表明,该方法能准确有效识别故障类型与其演化程度,较之传统多元分类支持向量机具有更高的识别精度和效率。
复杂网络;有向无环图支持向量机;滚动轴承;故障诊断
滚动轴承是各种机械设备中应用最为广泛的部件之一,其运行状态直接影响设备的精度、可靠性及使用寿命,滚动轴承的缺陷往往会导致异常噪声和振动,严重时甚至会直接损坏设备[1]。因此对滚动轴承进行在线监测与故障诊断具有十分重要的工程应用价值。在滚动轴承故障诊断中,利用振动信号对故障进行诊断是最有效、最常用的方法之一[2]。实际工况中获得的滚动轴承振动信号常含有较强的背景噪声,同时表现出典型的非平稳非线性特征,为故障特征信息的提取带来困难,随着现代信号处理技术及模式识别理论的发展,各种滚动轴承诊断方法被提出。目前研究热点主要集中在两个方面:① 采用现代信号处理技术尽可能的消除噪声与干扰,从各种谱图中清晰的体现故障信息[3-4];② 从振动信号中提取包含故障信息的特征参量,结合状态识别技术判断故障类型[5-6]。故障特征的提取与模式识别均易于实现在线运算与判断,因此更适合滚动轴承的在线监测与故障的及时预警,在实际工程中得到了更多的应用。
目前,人工神经网络(Artificial Neural Network,ANN)、支持向量机(Support Vector Machine,SVM)等模式识别方法已广泛应用于机械故障诊断中。人工神经网络具有较强的自适应、自组织、自学习能力,但需要大量的经验知识支持[7],工程实际中很难获得大量的典型故障样本或经验知识。支持向量机[8]是一种基于结构风险最小化原理的机器学习技术,作为小样本分类器广泛应用在故障诊断的模式识别中,表现出了较高的识别精度与泛化能力。经典SVM在本质上针对的是二元分类问题,然而大部分故障诊断为多元分类情况,为解决此类问题发展出多元支持向量机。传统的多元支持向量机通常由组合多个二元分类器得到,主要方法有“一对一”,“一对其余”,决策树SVM(Decision Tree Support Vector Machine,DT-SVM)以及有向无环图SVM(Directed Acyclic Graph Support Vector Machine,DAG-SVM)等。
滚动轴承故障可表现在不同组成部件之上,随着故障的演化程度不同又可表现为轻度、中度及重度故障,根据组合原理,不同部件不同演化程度的故障导致需要识别的类型数较大。在此情况下,采用ANN作为识别工具会因为其结构复杂和训练难度增大而缺乏适用性[9],而采用传统的多元支持向量机作为识别工具则需要建立更多的子分类器从而增加误差累积,降低识别精度和效率。为此,提出一种复杂网络优化的有向无环图多元支持向量机(Complex Network Directed Acyclic Graph Support Vector Machine,CNDAG-SVM),采用复杂网络描述包含各类型的样本全体,建立样本数据的网络模型,利用类间平均相似性测度估计各类样本数据间的分布性质,依此确定样本类型叶节点排序,优化有向无环图节点顺序得到较优结构的多元分类器。提取滚动轴承故障信号中时域与能量参数构造特征向量输入CNDAG-SVM分类器,从而实现区分滚动轴承故障类型与演化程度的目的。通过对外圈故障、内圈故障及滚动体故障类型与程度的诊断结果分析表明,提出的基于复杂网络优化的有向无环图多元支持向量机方法具有较高的识别精度和效率,可有效用于滚动轴承的典型故障诊断。
1.1 传统多元支持向量机
传统多元支持向量机通常采用将多元分类问题转化为若干个通过某些策略组合的二元分类问题的方法,目前常用的策略主要有:“一对一”,“一对其余”,决策树(Decision Tree,DT)以及有向无环图(Directed Acyclic Graph,DAG)等。
DAG-SVM可以视为对“一对一”多元支持向量机的改进,对于K分类问题,在训练阶段需要构成K(K-1)/2个二元分类器,分类阶段子分类器组成K-1层与K个叶节点构成的DAG拓扑结构,未知类别样本由顶节点输入,自上而下根据中间节点判断结果层层分类直到抵达某叶节点即得到类别归属。该方法分类时只需进行K-1次判断,分类效率得到提高,但同DT-SVM方法一样,子分类器组织结构并不唯一[10],不同的DAG形式的选择直接影响最后的分类结果。DAG-SVM方法没有过多考虑DAG结构的优化问题,包括顶节点在内的各节点选择分类器时具有随意性,容易产生“误差累积”,不稳定的分类性能导致最后的分类结果并不是最优。因此,对DAG结构进行优化,避免各分类节点的随机选择,是提高顶层节点容错能力,获得较高分类精度的有效途径。
1.2 基于复杂网络理论的优化DAG-SVM
DAG-SVM采用由顶节点、中间节点及叶节点构成的三角形层次结构,其组织形式由叶节点包含的分类样本的排列顺序决定,即当叶节点中各类样本排列顺序确定后,顶节点即为相距最远的两类样本编号构成的二元分类器,包含顶节点在内的左类型自上而下为样本编号逆序与首样本编号构成的二元分类器,右类型分类器则由尾样本编号与样本编号顺序构成,除左右类型之外的中间节点由左右上层节点的左右编号确定。因此,只要给出叶节点样本排列顺序,相对应的DAG-SVM结构就完全确定了。图1为典型的四分类问题DAG拓扑结构。
图1 四分类问题DAG拓扑结构Fig.1 DAG topology structure of four classification problems
传统DAG-SVM对于样本顺序的排列是随机的,因此最终分类结果具有不稳定性。同时,层次型的排列结构造成了固有的自上而下的“误差累积”现象,即某节点发生分类错误,则会导致后续节点也判断错误。首次分类错误发生的层次越靠近顶节点,受误差累积影响越大,最终分类精度越低。另外,由于每层节点只有一个二元分类器会被采用,所有样本类型的判断各有早晚,越靠近顶节点出现的样本类型,一旦判断错误,最终可以被正确划分的概率大大降低,也就是说上层节点具有较差的容错能力。基于以上分析,为了从不同结构中选择分类效果较优的DAG组织形式,需要改变叶节点包含样本类型排序的随机性;为了减少误差累积效应并提高上层节点的容错能力,则应最大限度保证较高层分类器识别结果的正确性,即将越容易区分的类型之间二元分类器置于较高层。因此,先对样本类型按易于区分程度进行排序,然后据此确定DAG拓扑结构,不失为对DAG-SVM方法进行优化并提高最终分类精度的有效途径。
对DAG-SVM方法优化的关键在于确定一种能有效度量样本类型可区分程度的测度,这里引入一种基于复杂网络理论的相似性测度来评定各样本类型间的分离性质。复杂网络是对复杂系统的抽象和描述方式,任何具有大量组成元素的系统,将构成元素抽象为节点,元素之间的相互关系抽象为边后,都可以作为复杂网络来分析[11]。将DAG-SVM中各个训练样本抽象为网络中的节点,样本与样本之间的关系抽象为边,即可将各类型的所有样本全体抽象为复杂的网络结构。
令n个训练样本组成集合X={x1,x2,…,xn},每个样本有m个特征值,即xi=(xi1,xi2,…,xim),i=1,2,…,n,将每个分类样本xi视为“节点”,样本之间的联系视为“关系”,则全体样本结构可以表示成加权无向网络G(X,A),X为网络的节点,相似度矩阵A为加权边[12],即A反映了各样本间的相似情况:
式中,aij为样本xi与xj之间的相似度,一般定义为样本xi与xj之间距离dij的函数。采用指数函数增强信息,构建相似度函数为
式中,e为信息增强函数,取正整数,取e=10;dij采用欧式距离度量。
对于K分类DAG-SVM优化问题,样本集合X的可划分子集即类别数已知:X={X1,X2,…XK},我们更关心的是子集间的可区分性。令Xp和Xq为K个集合中的两个子集,定义两个子集之间相似性测度[12-13]Spq为 Spq反映了子集之间节点的连接情况,S越大,表明子集间相似度越高,子集所代表的类型越不容易区分。
以平均相似性测度为依据构造DAG-SVM分类器,具体过程如下:
(1)根据式(2)~式(3)计算所有训练样本两两之间的相似度aij与不同类型间样本相似性测度Spq;
(2)将各类型样本间相似性测度组成类型相似性测度矩阵D,计算矩阵D每一行的算术平均值,得到各类型平均相似性测度;
(3)比较各类的平均相似性测度的大小,并按升序从两头向中间交替插入类型编号,得到优化的类型编号序列L={l1,l2,…,lK},即平均相似性测度最小的类型出现在序列L首位,次小的出现在序列末尾,处于序列越靠近中间位置的类型平均相似性测度越大,而越靠近序列两端的类型平均相似性测度越小;
(4)以序列L中类型编号确定多元器结构中叶节点类型顺序,并依次确定顶节点、左右类型与各中间节点处二元分类器,得到较优DAG拓扑结构。
改进后的DAG-SVM多元分类器能够避免拓扑结构的随机确定,提高分类器上层容错能力,降低误差累积带来的影响,从而提高整体识别精度的可靠性。
2.1 故障信号特征提取
对于实际采集到的滚动轴承故障信号,因受到轴与轴上多种零件振动的干扰而表现出非平稳、非线性的特点,另外,因元件表面损伤或应力集中作用而表现为周期性的冲击信号,该信号易收到脉动激发力的调制而表现出调幅-调频特性[14]。局域均值分解(Local Mean Decomposition,LMD)是由Smith[15]提出的一种自适应信号时频分析方法,它可将原始信号分解为若干个具有物理意义的瞬时频率的分量之和,分解过程由高频到低频依次分解,适于非平稳非线性信号的处理。LMD方法将复杂的多分量调幅调频信号分解为单分量的调幅调频信号,且分解结果保持原信号的幅值与频率变化,因此,LMD方法非常适合处理滚动轴承故障信号等非平稳非线性且多分量的调幅-调频信号[16]。当滚动轴承元件发生故障时,振动信号在相同频带内信号特征会发生较大变化,特征分布在频带之间也会产生差异,而LMD的分解结果PF(Product Function,PF)分量包含了各个频段的信息,因此选取各PF分量的波峰系数、峭度系数及能量值构造特征集。
滚动轴承振动信号的故障信息主要集中于高频段,故选择前四阶PF分量进一步分析,提取特征信息并构成特征向量。设采集到的原始信号为yi(t)(i=1,2,…,N),计算前四PF分量波峰系数Pi,峭度系数Qi和能量Ei,其计算公式如下:
对能量归一化处理后得到特征向量
2.2 滚动轴承故障诊断方法
采用LMD方法对原始信号进行分解,提取分解后前四阶PF分量的波峰系数、峭度系数及能量特征作为CNDAG-SVM多元分类器的输入参数,从而对滚动轴承故障类型与演化程度进行分类识别。基于CNDAGSVM的滚动轴承故障诊断方法具体实现步骤如下:
(1)以一定的采用频率对滚动轴承振动信号进行采集,收集正常状态、不同演化程度下内圈、外圈、滚动体故障等状态的振动信号,得到相应的样本数据;
(2)对样本数据进行LMD分解,得到各样本的PF分量,并将其与原始信号进行相关分析,将相关系数很小的分量视为虚假分量剔除;
(3)按式(4)~式(6)求出各样本前四阶PF分量的波峰系数、峭度系数及能量,对能量归一化处理并构造特征向量;
(4)根据各故障类型的平均相似性测度对DAGSVM结构进行优化,确定较优的DAG拓扑结构,将训练样本的特征向量输入CNDAG-SVM进行训练,得到SVM多元分类器;
(5)将测试样本的特征向量输入训练好的CNDAG-SVM多元分类器,判断测试样本的工作状态与故障演化程度。
为验证所提方法的有效性,采用美国凯斯西储大学电气工程与计算机科学系轴承实验数据[17]对滚动轴承故障类型与演化程度进行分类实验。实验台由电动机、扭矩传感器/译码器、测力计及电器控制装置组成。测试轴承选用电机输出端型号为6205-2RSSKF的深沟球轴承,将振动加速度传感器垂直固定于轴承上方采集正常、内圈故障、外圈故障及滚动体故障四种状态的振动信号,采样频率为12 000 Hz。各元件故障点为电火花加工单点损伤,损伤直径分别为0.177 8 mm,0.355 6 mm及0.533 4 mm,用以表示由轻到重的故障演化程度。由于外圈位置相对固定,考虑到损伤点相对于轴承负荷区位置对系统振动的影响,选择外圈损伤点布置于6点钟位置。电机负载由风机调节,测试负载为0 kW,对应测试转速为1 797 r/min。选取正常状态样本、内圈、外圈及滚动体的轻度、中度及重度故障样本各50组,形成总数为500的样本集,每一样本的数据点为2 048个,随机选取每一种状态样本中30组用于训练,20组用于测试,即训练样本300组,测试样本200组。
对每一组样本进行LMD分解,求取各PF分量的波峰系数、峭度系数及能量值构造特征向量。图2~图5所示为各类型故障样本前四阶PF分量部分特征向量变化趋势。其中1~10组为正常状态,11~20组为内圈轻故障,21~30组为内圈中故障,31~40组为内圈重故障,41~50组为外圈轻故障,51~60组为外圈中故障,61~70组为外圈重故障,71~80组为滚动体轻故障,81~90组为滚动体中故障,91~100组为滚动体重故障。
图2 第一阶PF分量特征向量趋势Fig.2 The feature vectors trend of the first PF
图3 第二阶PF分量特征向量趋势Fig.3 The feature vectors trend of the second PF
图4 第三阶PF分量特征向量趋势Fig.4 The feature vectors trend of the third PF
图5 第四阶PF分量特征向量趋势Fig.5 The feature vectors trend of the fourth PF
用字母N,I,O,B分别对应表示轴承正常、内圈故障、外圈故障及滚动体故障,字母L,M,H分别对应表示由轻到重的三种损伤程度,这样将样本集划分为N,IL,IM,IH,OL,OM,OH,BL,BM,BH十个类型。计算各类型的平均相似性测度值,结果见表1,按由小到大从两头向中间交替插入类型编号,得到优化的类型编号序列:
以此为依据构造较优CNDAG拓扑结构。
表1 各类型平均相似性测度Tab.1 Average sim ilarity m easure of sam p les
将300组训练样本输入CNDAG-SVM中进行训练,利用得到的多元分类器对滚动轴承十种工作状态200组测试样本进行分类,识别结果见表2。所有类别的识别率都在85%以上,其中超过一半的类别识别率达到90%以上,总体正确识别率为91.5%,证明CNDAGSVM能够有效对滚动轴承故障状态及演化程度进行识别。
表2 测试样本识别结果Tab.2 The indentify results of test sam ples
分别选取“一对一”,“一对其余”以及传统DAGSVM几种多元SVM分类器与CNDAG-SVM应用于滚动轴承故障诊断的性能进行比较,结果如表3所示,在统计各分类器总正确识别率的同时,统计在相同的软硬件环境下各分类器对单个样本识别的平均耗时。
表3 多元SVM分类器识别性能比较Tab.3 Com parison of recognition performance ofmulti-class SVMs
对比表3中几种多元SVM分类器对滚动轴承故障类型与演化程度的平均识别情况,与“一对一”和“一对其余”算法相比,有向无环图拓扑结构的引入解决了不可分区域问题,具有更高的识别精度、更少的二元支持向量机子分类器及更高的识别效率;CNDAG-SVM通过引入基于复杂网络理论的类间平均相似性测度,对各节点重新排序,构造较优的有向无环图拓扑结构,较传统DAG-SVM取得了更高的识别精度。综合以上分析,CNDAG-SVM较其他几种多元分类SVM在识别精度与效率上具有综合的最优性能,更适合于滚动轴承故障类型与演化程度的分类诊断。
(1)针对滚动轴承故障类型与演化程度类型数量大,使用传统多元分类器难以保证识别精度与效率的问题,提出了基于复杂网络理论优化的CNDAG-SVM,该方法通过比较平均相似性测度对类型在DAG拓扑结构叶节点顺序进行排列,再依此提取相应二元分类器构建较优DAG-SVM多元分类器,从而改善传统DAG-SVM随机结构带来的分类结果不稳定的问题,改善误差累积效应的同时提高上层节点的容错能力。与其他几种常用多元分类SVM比较结果表明,CNDAGSVM具有更高的分类正确识别率与识别效率。
(2)提出的基于PF分量特征提取与CNDAG-SVM的滚动轴承故障诊断方法,对识别故障类型与演化程度具有较高的识别精度与较短的平均耗时,可有效用于滚动轴承的典型故障诊断。
[1]钟秉林,黄仁.机械故障诊断学[M].北京:机械工业出版社,2007:1-16.
[2]姚培,王仲生,姜洪开,等.局部保形映射和AdaBoost方法在滚动轴承故障诊断中的应用[J].振动与冲击,2013,32(5):144-148.
YAO Pei,WANG Zhong-sheng,JIANG Hong-kai,et al.Roller bearing fault diagnosis based on locality preserving project[J].Journalof Vibration and Shock,2013,32(5):144-148.
[3]Candès E J,Charlton PR,Helgason H.Detecting highly oscillatory signal by chirplet path pursuit[J].Applied and Computational Harmonic Analysis,2008,24(1):14-40.
[4]姜锐红,刘树林,刘颖慧,等.基于CPWP混合原子分解的滚动轴承故障诊断方法研究[J].振动与冲击,2013,32(23):48-51.
JIANG Rui-hong,LIU Shu-lin,LIU Ying-hui,et al.Rolling bearing faultdiagnosis based on CPWPmerged atomic decomposition[J].Journal of Vibration and Shock,2013,32(23):48-51.
[5]Ocak H,Loparo K A,Discenzo FM.Online tracking ofbearing wear using wavelet packet decomposition and probabilistic modeling:a method for bearing prognostics[J].Journal of Sound and Vibration,2007,302(4/5):951-961.
[6]罗颂荣,程军圣,杨宇.基于本征时间尺度分解和变量预测模型模式识别的机械故障诊断[J].振动与冲击,2013,32(13):43-48.
LUO Song-rong,CHENG Jun-sheng,YANG Yu.Machine fault diagnosismethod using ITD and variable predictivemodel-based class discrimination[J].Journal of Vibration and Shock,2013,32(13):43-48.
[7]胥永刚,孟志鹏,陆明.基于双树复小波包变换和SVM的滚动轴承故障诊断方法[J].航空动力学报,2014,29(1):67-73.
XU Yong-gang,MENG Zhi-peng,LU Ming.Fault diagnosis method of rolling bearing based on dual-tree complex wavelet packet transform and SVM[J].Journal of Aerospace Power,2014,29(1):67-73.
[8]Vapnik V N.Statistical learning theory[M].New York:Springer,1998.
[9]朱波,刘飞,李顺江.基于优化有向无环图支持向量机的多变量过程均值异常识别[J].计算机集成制造系统,2013,19(3):549-568.
ZHU Bo,LIU Fei,LIShun-jiang.Mean abnormality identification in multivariate process based on optimized directed acyclic graph support vectormachine[J].Computer Integrated Manufacturing Systems,2013,19(3):549-568.
[10]陈世杰,连可,王厚军.遗传算法优化的SVM模拟电路故障诊断方法[J].电机科技大学学报,2009,38(4):553-558.
CHEN Shi-jie,LIAN Ke,WANG Hou-jun.Method for analog circuit fault diagnosis based on GA optimized SVM[J].Journal of University of Electronic Science and Technology of China,2009,38(4):553-558.
[11]陈安华,潘阳,蒋玲莉.基于复杂网络社团聚类的故障模式识别方法研究[J].振动与冲击,2013,32(20):129-133.
CHEN An-hua,PAN Yang,JIANG Ling-li.Fault pattern recognition method based on complex network community clustering[J].Journal of Vibration and Shock,2013,32(20):129-133.[12]杜海峰,王娜,张进花,等.基于复杂网络的故障诊断策略[J].机械工程学报,2010,46(3):90-96.
DU Hai-feng,WANG Na,ZHANG Jin-hua,et al.Fault diagnosis strategy based on complex network analysis[J].Journal of Mechanical Engineering,2010,46(3):90-96.
[13]Newman ME J.Detecting community structure in network[J].Eur.Phys.J.B,2004,38(2):321-330.
[14]刘卫兵,李志农,蒋静.基于局域均值分解的滚动轴承故障诊断方法[J].轴承,2009(9):48-52.
LIU Wei-bing,LI Zhi-nong,JIANG Jing.Fault diagnosis method of rolling bearing based on localmean decomposition[J].Bearing,2009(9):48-52.
[15]Smith JS.The localmean decomposition and its application to EEG perception data[J].Journal of the Royal Society Interface,2005,2(5):443-454.
[16]唐贵基,王晓龙.基于局部均值分解和切片双谱的滚动轴承故障诊断研究[J].振动与冲击,2013,32(24):83-88.
TANG Gui-ji,WANG Xiao-long.Fault diagnosis of roller bearing based on localmean decomposition and slice bispectrum[J].Journal of Vibration and Shock,2013,32(24):83-88.
[17]http://www.eecs.cwru.edu/laboratory/bearing,Bearing Data Center Website,Case Western Reserve University.
App lication of optim ized directed acyclic graph support vector machine based on complex network in fault diagnosis of rolling bearing
SHIRui-min,YANG Zhao-jian
(School of Mechanical Engineering,Taiyuan University of Technology,Taiyuan 030024,China)
Due to the large amountof crossed combinations of fault patterns and evolution stages of rolling bearings,the general patterns recognition method is difficult to adapt tomultivariate process.In view of the problem,an optimized directed acyclic graph support vectormachine(DAG-SVM)based on complex network(CN)was proposed.According to the similaritymeasure in complex network theory,the separating characters of samples were evaluated,and the nodes of directed acyclic graph were sequenced by the average similarity measure which was calculated as the criterion for distinguishing degree of samples.Then the corresponding binary support vector machines were selected to construct an optimal directed acyclic graph,to achieve high correction identification ratio by alleviating error accumulation and improving fault tolerance of the upper nodes.Feature vectorswere constructed of the crest factor,kurtosis coefficient and energy of product functions,obtained by localmean decomposition.And then the feature vectors were served as input parameters of CNDAG-SVMclassifier to sort fault patterns and evolution stages of rolling bearings.By analyzing the vibration signal acquired from the bearingswith inner-race,outer-race or elements faults,the experimental results indicate that the proposed method can recognize the fault types and evolution grades effectively and has higher accuracy and productiveness than traditionalmulti-class support vectormachines.
complex network;DAG-SVM;rolling bearing;fault diagnosis
TH133.33
A
10.13465/j.cnki.jvs.2015.12.001
国家自然科学基金资助项目(51075292);山西省青年科技研究基金资助项目(2012021022-6)
2014-03-31 修改稿收到日期:2014-06-13
石瑞敏女,博士生,1983年8月生
杨兆建 男,教授,博士生导师,1955年生
邮箱:yangzhaojian@tyut.edu.cn