郑近德,代俊习,朱小龙,潘海洋,潘紫微
(安徽工业大学 机械工程学院,安徽 马鞍山 243032)
滚动轴承是各类旋转机械中最通用的机械部件,其运行状态是否正常往往影响到整台机器的性能[1],因此,对滚动轴承运行状态和故障诊断的研究具有重要的理论和实际意义。随着非线性理论的发展,许多非线性动力学方法为非平稳信号的处理提供了新的思路与方法[2–7]。如吕志民等把分形维数作为故障特征量用于滚动轴承的故障诊断[2],但是分形维数对噪声比较敏感;文献[3]把近似熵作为衡量标准并应用于轴承状态监测;胥永刚等把分形维数与近似熵同时用于度量振动信号的复杂性[4],结果表明近似熵具有一定抗噪、抗野点的能力,但是,其存在自身匹配难、依赖时间序列长度等缺陷。赵志宏等提出将集成经验模态分解与样本熵结合[6],应用于滚动轴承故障的诊断,结果表明该方法比单一样本熵识别率更高。
Costa等在样本熵的基础上,提出了多尺度熵(Multiscale entropy,MSE)[8–9]。郑近德等将多尺度熵与样本熵分别作为轴承故障信号复杂性的度量,结果表明多尺度熵优于单一尺度样本熵[10]。但是研究发现,粗粒化会导致多尺度熵随着尺度因子的增大,产生“飞翼”现象,同时,粗粒化可以看做是对时间序列在不同尺度下进行线性插值,而振动信号一般是非平稳、非线性的采用线性的手段势必有一定的局限。因此,笔者考虑采用三次样条插值时间序列代替粗粒化过程,提出了插值多尺度熵(Interpolation Multiscale Entropy,InMSE),并将其用于滚动轴承非线性故障特征的提取。
在提取故障特征后,由于故障特征类之间的隶属关系比较模糊,不易分辨。模糊C-均值聚类(Fuzzy C-means,FCM)是模糊聚类中应用最为广泛的聚类算法,它通过迭代优化目标函数,把数据按照数据的某种属性聚集成多个类的过程,使同一类对象之间的相似性很高,不同类之间的相似性很差。FCM聚类算法在机械故障诊断等多个领域得到了广泛应用[11–13],因此,论文考虑采用FCM来识别滚动轴承故障类型。
基于上述分析,论文提出了一种基于插值多尺度熵与FCM模糊聚类的滚动轴承故障诊断方法。通过对滚动轴承数据试验分析,结果表明了论文方法的有效性和优越性。
多尺度熵定义为时间序列在不同尺度因子下的样本熵[8–9],其计算步骤如下。
(1)设原始数据为X={x1,x2…,xN} ,长度为N,建立粗粒化序列
其中τ是正整数,称为尺度因子。事实上,pj(1)即为是原时间序列。当τ=1时,粗粒化后的序列与原始序列是相同的。对于非零τ,{xi}被分割成τ个长度为(表示不大于的正整数)的粗粒化序列{pj(τ)} 。
(2)分别计算τ个粗粒序列的样本熵,并画成尺度因子τ的函数。即计算各尺度下的时间序列的样本熵。
其中,样本熵的计算参考文献[5]。样本熵从单一尺度衡量时间序列复杂性,而多尺度熵法克服了单一尺度熵分析复杂性的缺陷,可以有效地从多尺度衡量时间序列的复杂性。但是由公式(1)可以发现,当尺度因子为2时,多尺度化法只考虑了数据点x1,x2和x3,x4,…的特征信息,并没有考虑到数据点x2,x3和x4,x5,…之间的特征信息;其次,粗粒化过程可以近似看做是在不同尺度下对时间序列数据点两两之间线性插值而得(求平均),而振动信号往往具有非线性性和非平稳性,因此,考虑用三次样条插值来代替多尺度化法,提出了插值多尺度熵算法。
插值多尺度熵计算步骤如下:
(1)设原始数据为X={x1,x2,…,xN},长度为N,插值点的构造如图1所示。
图1 尺度因子为1、2和3时的插值点示意图
当τ=1时,粗粒化序列仍取原时间序列;在原始粗粒化过程中,粗粒化是求x1,x2,x3,x4,……xN-1,xN的均值,即下标t=1.5,2.5,……,N-0.5处的函数值,该数值是线性插值的结果。由于信号具有非线性和非平稳的特性,因此本文用三次样条插值方法代替线性插值。当尺度τ=2时,即在区间[x1,x2]、[x2,x3]、……、[xN-1,xN]上 给 定 1 个 插 值 节 点以及相应的下标t的值1.5,2.5,……,N-1.5,N-0.5,得到新序列,该数据为插值后的时间序列。当尺度τ=3时,在区间上给定1个插值节点 ,以及相应下标处t的值1.5,2.5,……,N-2.5,N-1.5 ;得 到 新 序 列;依次类推,计算出所有
(2)分别计算τ个粗粒序列的样本熵,并画成尺度因子τ的函数。即计算各尺度下的时间序列的样本熵[5]。
与多尺度熵相比,插值多尺度熵不仅一定程度上克服了由时间序列变短带来的影响,而且还充分挖掘了时间序列的信息,同时采用三次样条插值时间序列,也很好地考虑了振动信号的非线性特性。
为了说明时间序列的长度对InMSE的影响,取长度分别为1 000,1 500,2 000,2 500,3 000,3 500,4 000的高斯白噪声和1/f噪声作为研究对象。分别计算二者的MSE和InMSE,结果如图2(a)-图2(d)所示,其中m=2,r=0.15SD(SD是原始数据的标准差),最大尺度因子为20。
图2 时间序列长度对熵值的影响
首先,从图2可以看出,随着数据序列长度的增加,InMSE熵值曲线比MSE熵值曲线稳定,无论长度是1 500还是3 500,熵值曲线的趋势始终一样,这说明InMSE对数据序列长度的依赖更小。同时,当N>2 000时,时间序列长度对InMSE熵值的影响更小;其次,随着尺度因子τ的增加,MSE曲线在右端出现了比较大的波动,而InMSE几乎没有波动,这说明InMSE更具有稳定性和优越性;最后,从两种信号的变化趋势来看,高斯白噪声信号的MSE和InMSE曲线随着尺度因子的增大而逐渐递减,这说明高斯白噪声信号较为简单,只在较低的尺度包含信息。1/f噪声的MSE曲线随着尺度因子的增大而变化缓慢,基本稳定在一个恒定值附近,虽然InMSE曲线呈现出下降趋势,但是从熵值的大小可以看出变化不是很大,这说明1/f噪声较白噪声信号复杂,不仅在较低的尺度包含信息,而且在其它尺度也包含有重要信息,这与我们关于白噪声和1/f噪声信号的定义和认识相符。
为了研究相似容限r对InMSE的影响,以相同长度的高斯白噪声和1/f噪声作为研究对象,取长度N=5 000。对不同的r=0.05SD,0.10SD,0.15SD,0.20SD,0.25SD(SD是原始数据的标准差),分别计算二者的MSE和InMSE,其中m=2,尺度因子取20,表示模糊函数边界的宽度,结果如图3(a)-图 3(d)所示。
图3 相似容限对熵值的影响
首先由图3可以看出,相似容限对MSE和InMSE的计算结果影响较大,r越大,匹配的模板越少,熵值越小,r越小,匹配的模板越多,熵值越大;其次,当容限r过小时,InMSE熵值曲线相比较于MSE曲线光滑,随着容限的增大,InMSE熵值变化较小且波动较小,这表明InMSE对r依赖较小。一 般 取SD,本文
在提取故障特征后,由于故障特征类之间的隶属关系比较模糊,不易分辨,因此选用聚类效果较好模糊C-均值(Fuzzy C-means,FCM)用于故障特征识别。FCM的基本原理如下:
假设样本X={x1,x2,……,xn}是一个d维数据,并假设其具有C类。定义mj为第j类中心j={1,2,……,C} ,模糊隶属度矩阵,其中uj(xi)为第i个样本属于第j类的隶属度。公式如下
通过隶属度函数进而确定新的聚类中心
此时聚类损失函数可以表示为
FCM算法的原理就是通过迭代方法对式(2)和式(4)进行求解,给定聚类数目C和加权指数b,步骤如下:
1)初始化隶属度矩阵uj(xi),使其值的范围在(0,1)之间,并使隶属度矩阵uj(xi)满足式(3)的约束条件;
2)初始化样本中每一个聚类中心mj;
① 用每一类的mj根据式(2)计算隶属度函数。
② 根据①计算出的隶属度函数根据式(4)重新计算各类中心。
通过上述步骤的计算,可以得到样本中各类聚类中心以及每一类相对于样本的隶属度,由此完成了模糊聚类划分。
振动信号一般表现出非平稳和非线性等特性,还受干扰信号和噪声的影响。因此,故障诊断的关键是如何从振动信号中提取故障的特征信息。论文将InMSE算法用于振动信号的特征提取,提出了基于插值多尺度熵和模糊C-均值的滚动轴承故障诊断方法。具体步骤如下:
(1)假设滚动轴承有K种故障类别;每种状态下取mK个样本,共有个样本,计算每一类样本的插值多尺度熵,得到们的特征集 (TK,K),TK∈Rmk×τmax;
采用美国Case Western Reserve University的滚动轴承试验数据[14]对论文方法进行验证。测试轴承为6205-2RS JEM SKF深沟球轴承,转速为1797 r/min,故障直径为:0.5334 mm,共采集到正常(Norm)、外圈(Outer Race,OR)、滚动体故障(Ball Element,BE)和内圈(Inner Race,IR)四种状态的振动信号,数据长度为2 048。正常、具有内圈故障、外圈故障以及滚动体故障的滚动轴承振动信号的时域波形如图4(a)-图4(d)所示。
图4 滚动轴承振动信号的时域波形
分别计算上述四种工况数据的MSE和InMSE,其中,每种工况选取58组数据,数据长度为2 048。MSE和InMSE熵值均方差曲线如图5(a)、图5(b)所示。首先,从图中可以看出,虽然不同故障类型的振动信号在不同尺度下的样本熵熵值均不同,但是多尺度熵曲线总体波动较大,而且随着尺度因子的增大,内圈故障、外圈故障和滚动体故障这三类熵值比较接近(熵值曲线走势一致,且越来越接近),而插值多尺度熵曲线波动较小且光滑,随着尺度因子的增大,不同故障类型的熵值相互之间区别比较明显,进而有助于提高识别率;其次正常的滚动轴承是随机和无规则的振动,随着尺度因子的增大,熵值曲线下降缓慢,这说明正常滚动轴承信号不仅在低尺度包含重要信息,而且在较高的尺度也包含了信息;最后,由于滚动轴承本身运动的特性(内圈随轴承运动而外圈固定),外圈故障特征频率比内圈故障特征频率小,因此,外圈故障的熵值要比内圈故障的更小。上述分析结果表明,InMSE能明显地区别不同故障类型的滚动轴承,且区分效果要优于MSE。
将原始信号进行插值多尺度熵和多尺度熵计算,将得到的特征向量输入到模糊C-均值分类器中。其中,模糊C-均值分类器设置聚类类别数为4,终止条件的最大迭代次数为100,隶属度最小变化量迭代终止条件10-5,隶属度矩阵的指数为2。对上述4种轴承故障类型信号各取58组数据作为测试样本,根据上述方法分别计算多尺度熵与插值多尺度熵,取尺度因子τ=20,构成一个232×20的特征向量矩阵。通过计算测试样本T和第k个状态Ck的海明贴近度来衡量FCM分类的正确与否,其中k=1,2,3,4,即
由贴近度定义可知,贴近度最大者为一类,当存在两组测试样本的贴近度相差小于0.01时,即无法识别或者识别率较低。对232组数据分别计算MSE和InMSE的平均贴进度,得到4种状态的测试样本相对于聚类中心的平均贴近度。MSE和InMSE的平均贴近度如图6(a)、图6(b)所示,由图6(a)可知,当采用MSE方法时,虽然正常信号、内圈故障中的最大贴近度接近于1,且其它贴近度相差比较明显,但是滚动体故障、外圈故障中有两个贴近度接近于1,不利于故障的辨识;当采用InMSE方法时,正常信号、滚动体故障和外圈故障中的最大贴近度接近于1,且其它贴近度相差较明显,只有内圈故障中两个贴近度之间的差值不怎么明显。这说明InMSE方法相比较于MSE有很好的优越性,对特征的提取更全面。
由表1可以看出,首先,InMSE与FCM聚类结合方法的聚类分类系数F要比MSE的大,而且更接近于1,这说明在特征识别过程中,InMSE提取的特征更明显;其次,InMSE与FCM聚类结合方法的平均模糊熵H更接近于0,这说明基于InMSE与FCM方法的聚类效果要好于基于MSE与FCM的方法。综上所述,InMSE提取的故障特征在FCM方法中的聚类效果优于MSE提取的特征。
图5 MSE和InMSE熵值曲线
图6 平均贴近度分布
表1 两种方法的检验结果
为了说明InMSE相对于MSE的优势,基于MSE和InMSE故障诊断方法的识别率如表2所示。
表2 MSE和InMSE识别率/(%)
从表2可以看出,首先InMSE故障诊断方法的识别率,除了正常信号低于MSE,外圈故障、内圈故障和滚动体故障识别率均高于MSE,由图6可以看出,正常、外圈故障、内圈故障和滚动体故障的InMSE熵值虽然在尺度较低时相互之间的插值比较明显,但是在尺度因子较大时,这四类熵值比较接近,而MSE无论是低尺度还是尺度较高时,熵值均比较接近;其次,分析时采用的样本量多,而改进的插值多尺度熵识别率97.4%明显高于多尺度熵的93.95%,这说明InMSE具有很好的稳定性。综上,此试验表明,InMSE能够明显地区分正常和故障滚动轴承的类型,是一种有效的滚动轴承故障诊断方法。
(1)提出了InMSE算法,通过仿真信号将其与MSE进行了对比分析,结果表明,与MSE相比,随尺度因子的增加,InMSE曲线的变化趋势更加平缓,克服了MSE右端“飞翼”的现象,具有一定的优越性。
(2)研究了数据长度和相似容限的选择对InMSE和MSE的影响,结果表明,相比较于MSE,InMSE在尺度因子较大时受数据长度的变化更小,只需较短的数据便可得到稳定的熵值。
(3)将InMSE与FCM算法结合应用于滚动轴承故障的诊断,并对故障发生的机理及振动信号的特性进行解释,结果表明,基于InMSE特征提取方法能够有效地将同种故障类型数据聚在聚类点中心附近。
InMSE是一种有效的时间序列复杂性衡量的非线性动力学方法,但其也有不足之处,如运算时间久等问题,有必要对其进一步研究并加以改善。
[1]梅宏斌.滚动轴承振动监测与诊断理论·方法·系统[M].北京:机械工业出版社,1996.
[2]吕智民,徐金梧,翟绪圣.分形维数及其在滚动轴承故障诊断中的应用[J].机械工程学报,1999,35(2):88-91.
[3]YAN RUQIANG,GAO R X.Approximate entropy as a diagnostic tool for machine health monitoring[J].Mechanical Systems and Signal Processing,2007,21(2):824-839.
[4]胥永刚,何正嘉.分形维数和近似熵用于度量信号复杂性的比较研究[J].振动与冲击,2003,22(3):25-27.
[5]RICHMAN J S,MOORMAN J R.Physiological time series analysis using approximate entropy and sample entropy[J].American Journal of Physiology Heart and Circulatory Physiology,2000,278(6):2039-2049.
[6]赵志宏,杨紹普.一种基于样本熵的轴承故障诊断方法[J].振动与冲击,2012,31(6):136-154.
[7]郑近德,潘海洋,戚晓利,等.复合层次模糊熵及其在滚动轴承故障诊断中的应用[J].中国机械工程,2016,27(15):2048-2055.
[8]COSTA M,GOLDBERGER A L,PENG C K.Multiscale entropy analysis ofbiologicalsignals[J].Physical Review E,2005,71:1-18.
[9]COSTA M,GOLDBERGER A L,PENG C K.Multiscale entropy analysis of complex physiologic time series[J].Physical Review Letters,2002,89(6):1-18.
[10]郑近德,程军圣,杨宇.基于多尺度熵的滚动轴承故障诊断方法 [J].湖南大学学报,2012,39(5):38-41.
[11]郭谋发,徐丽兰,廖希仁,等.采用时频矩阵奇异值分解的配电开关振动信号特征量提取方法[J].中国电机工程学报,2014,34(28):4990-4997.
[12]张淑清,孙国秀,李亮,等.基于LMD近似熵和FCM聚类的机械故障诊断研究[J].仪器仪表学报,2013,34(3):714-720.
[13]周川,伍星,刘畅,等.基于EMD和模糊C-均值聚类的滚动轴承故障诊断[J].昆明理工大学学报,2009,34(6):34-39.
[14]The Case Western Reserve University Bearing Data Center.Bearing Data Center Fault Test Data[EB/OL].[2012-03-01].http://www,eecs,cwru,edu/laboratory/bearing.