改进多尺度幅值感知排列熵与随机森林结合的滚动轴承故障诊断

2020-04-11 02:07吴海滨陈寅生张庭豪
光学精密工程 2020年3期
关键词:特征提取幅值分量

吴海滨,陈寅生*,张庭豪,汪 颖

(1.哈尔滨理工大学 测控技术与通信工程学院,黑龙江 哈尔滨 150080;2.哈尔滨工业大学 电气工程及自动化学院,黑龙江 哈尔滨 150080)

1 引 言

滚动轴承是旋转机械中最常见的连接部件之一,但由于磨损、疲劳、腐蚀、过载等诸多因素的影响,滚动轴承在工作过程中极易发生故障[1-6],进而影响机械设备的整体性能。因此,滚动轴承的故障诊断及严重程度分析对保证机械设备运行的可靠性及制定相应维修策略具有重要意义。

滚动轴承故障的位置及严重程度导致其振动信号的冲击特性存在明显差异。因此,基于振动信号的故障诊断技术成为当前滚动轴承异常状态监测的重要研究方向之一[7]。滚动轴承故障诊断的本质是一个模式识别过程,主要包括特征提取和故障分类[8-9]。但是,滚动轴承振动信号具有非线性和非平稳的特点,同时运行过程中容易受到多种外界因素的干扰,信噪比较低,导致轴承故障特征难以得到有效提取,影响故障诊断的识别准确率。

鉴于此,相关学者针对滚动轴承故障诊断展开了大量的研究工作。文献[7]利用集合经验模态分解(Ensemble Emprical Mode Decompositon,EEMD)实现对滚动轴承振动信号的自适应分解,并采用峭度值结合相关系数的方法确定包含主要轴承状态信息的本征模态函数,再利用其奇异值作为特征向量,通过超球多类支持向量机实现对滚动轴承的多故障分类。然而,EEMD不能够完全解决EMD的模态混叠问题,峭度值结合相关系数的本征模态函数选择法会损失部分轴承故障信息,而超球多类支持向量机的核参数选取和优化过于复杂,增加了实际应用的困难。文献[10]利用局部均值分解(LMD)算法对滚动轴承振动信号进行预处理,再利用多尺度熵(MSE)提取故障特征向量,最后构建BP神经网络分类器实现故障类型识别。但是,在时间序列的粗粒化过程中,MSE的序列长度会随着尺度因子的增加而缩短。当尺度因子较大时,多尺度熵值具有不稳定性,进而影响特征提取的有效性。文献[11]利用多尺度排列熵提取滚动轴承振动信号中的故障特征,并采用Laplacian Score算法进行特征选择,随后通过支持向量机(SVM)实现故障类型识别。然而,基于排列熵的特征提取忽略了时间序列中元素幅值对熵值的影响,使得提取的故障特征具有较大的随机性,进而影响故障识别的准确率。

由于现有基于滚动轴承振动信号的故障诊断方法尚存在特征提取可分性不强、故障识别准确率较低及故障严重程度分析不充分等问题,本文提出了一种基于改进多尺度幅值感知排列熵(Improved Multiscale Amplitude-Aware Permutation Entropy, IMAAPE)与随机森林(Random Forest, RF)分类器的滚动轴承故障诊断方法。首先,采用固有时间尺度分解(Intrinsic Timescale Decomposition, ITD)对滚动轴承振动信号进行分解,选取最佳固有旋转分量,改善EMD分解结果的欠包络和过包络问题,并有效抑制了模态混叠和端点效应。然后,利用IMAAPE提取最佳固有旋转分量中蕴含的滚动轴承故障特征,改善了多尺度分析中的粗粒化过程,提升了故障特征提取的稳定性,同时在计算排列熵过程中引入相对规范化概率,增加对故障信号幅值和频率变化的敏感特性,有效提取故障类型与严重程度特征。最后,利用随机森林分类器泛化能力强、参数设置简便、训练速度快等优点,实现对滚动轴承不同故障类型的识别及严重程度分析。

2 固有时间尺度分解

(1)

ITD算法的主要步骤如下:

Step1:假设{τk,k=1,2,…}表示信号Xt的局部极值,默认τ0=0。

Step2:在区间[0,τk]中定义了Lt和Ht,且Xt在t∈[0,τk+2]的区间内有效。那么,在连续极值间隔(τk,τk+1]中提取的基线信号Lt表示为:

(2)

其中:

(3)

其中:α是线性缩放因子,用来调节提取固有旋转分量幅度,α∈[0,1],通常取α=0.5。

Step3:根据式(2)和式(3),固有旋转分量Ht可以表示为:

(4)

Step4:将基线信号Lt作为下一次分解的输入信号,重复步骤1~3,获取一系列PR分量。分解的终止条件为基线信号Lt变得单调或者小于某个预设值。

经过ITD分解后,时间序列Xt被分解为一系列PR分量和一个单调趋势分量。信号峰度能有效描述信号的脉冲特性。峰度值越高,信号所包含的脉冲特征越丰富。因此,定义峰度值最大的PR分量为最佳固有旋转分量,其计算过程如下[13-14]:

(5)

(6)

其中:Ki表示第i个PR分量的峰度值,n表示时间序列长度。Ui为第i个PR分量的归一化峰度值,m是PR分量的个数。最佳固有旋转分量选取Ui为最大值时所对应的PR分量。

3 基于IMAAPE的特征提取

3.1 改进多尺度熵

仅从单一尺度对时间序列进行熵值分析,可能会损失原始信号的部分重要信息。因此,Costa等于2007年提出了多尺度熵(Multi-scale Entropy, MSE)[15],实现对复杂信号在不同时间尺度下的特征信息提取,其定义如下:

假设一个长度为N的时间序列{Xi}={x1,x2,…,xN},利用尺度因子τ=1,2,…,n,对序列进行粗粒化,粗粒化过程如下:

(7)

图1 尺度因子τ=2和τ=3下改进多尺度熵的粗粒化过程

Fig.1 Improved coarse-graining procedures for scalefactorτ=2 andτ=3

随后,计算每个粗粒化的新时间序列的样本熵值,获得不同时间尺度下的n个多尺度熵值来描述原始时间序列的信号特征。然而,在粗粒化过程中,MSE的时间序列的长度将缩短为N/τ。尺度因子τ越大,经粗粒化后的时间序列长度越短,这将影响后续对熵值的度量,降低特征提取效果。为了解决该问题,相关学者对MSE的粗粒化过程进行改进[16],解决了MSE粗粒化后时间序列长度缩短的问题,改进多尺度熵的粗粒化过程如图1所示。改进后的粗粒化时间序列表示为:

(8)

3.2 幅值感知排列熵

Bandt等于2002年提出排列熵(Permutation Entropy, PE)的概念[17],目前PE广泛应用于对复杂时间序列信号的分析,以衡量一个非线性、非平稳性信号的复杂度。

每个排列顺序πi出现的概率表示为:

(9)

(10)

然而,通过排列熵描述复杂时间序列还存在两个主要问题。第一,传统PE仅考虑了时间序列幅值的排列次序,而忽略了对应的时间序列中元素的幅值信息;第二,时间序列中幅值相等的元素对PE值的影响并没有清晰说明。鉴于此,文献[18]提出了幅值感知排列熵(Amplitude-Aware Permutation Entropy, AAPE),以提升PE对时间序列的幅值和频率的敏感特性。不同于排列熵算法,AAPE算法考虑了信号振幅的均值及振幅之间的偏差,引入了相对规范化概率替代PE中f(πi)的计数规则。

(11)

(12)

时间序列的AAPE可表示为:

(13)

3.3 改进多尺度幅值感知排列熵

IMAAPE算法借鉴了改进多尺度熵算法中的粗粒化过程,突出不同时间尺度下的信号特征,再利用AAPE对信号幅值和频率变化敏感的特性,提取不同时间尺度下的信号特征。该方法的主要计算步骤如下:

(14)

4 随机森林分类器

RF由美国科学院院士Breiman L.于2001年提出,该算法适用于解决预测与分类问题[19-20]。RF集成了多个弱分类器,由众多决策树组成,其输出结果根据森林中每棵决策树的预测结果,利用投票原则确定。RF的实现过程简单,具有较高的识别准确率,在故障诊断领域具有广泛应用[21-22]。RF的基本原理如下:

假设随机森林分类器由多个决策树{hj(x,Θk),k=1,2,…,n}组成,{Θk,k=1,2,…,n}表示相互独立且同分布的随机向量。随机森林分类器的训练样本集表示为D={(x1,y1),(x2,y2),…,(xN,yN)},xi=(xi,1,…,xi,p)T表示第i个训练样本,xi具有p个特征值,yi表示训练样本xi对应的标签。对训练样本集D进行n次Bootstrap采样,获得n个Bootstrap子样本Dj(j=1,2,…,n)。针对每个子样本Dj,构建决策树模型hj(x)(一般选用CART决策树),最终获得由一组决策树{h1(x),h2(x),…,hk(x)}组成的决策树分类器。对于一个新的测试样本,通过n个决策树投票,得到最多票数的类别作为测试样本的最终类别,分类决策如下:

(15)

其中:hj(x)代表第j棵决策树;I(·)为示性函数,即当集合内有此数时值为1,否则值为0;y表示类别标签yi构成的目标变量。

5 滚动轴承故障诊断方法流程

本文提出的故障诊断方法能够实现滚动轴承内环、外环及滚珠故障识别及故障严重程度分析,该方法的故障识别及故障严重程度分析流程如图2所示。

本文提出的滚动轴承故障诊断方法改进了多尺度熵的粗粒化过程,并利用幅值感知排列熵提取振动信号特征,提升滚动轴承故障特征的可分性,再通过随机森林分类器进行故障类型识别及故障严重程度分析。

图2 故障识别及故障严重程度分析流程Fig.2 Flow chart of fault identification and severity analysis

该方法通过IMAAPE对不同故障类型及故障严重程度(故障直径)的数据样本进行特征提取,描述故障严重程度特征,再利用RF良好的分类性能对故障类型及严重程度进行判断,具体流程描述如下:

Step1:获取不同故障程度下的滚动轴承振动信号,并组成不同故障程度下的滚动轴承振动信号样本集;

Step2:针对样本集中的每一个振动信号,进行ITD,获取一系列PR分量,并从中选取最优PR分量进行后续特征提取;

Step3:利用IMAAPE提取最优PR分量不同时间尺度下包含的滚动轴承振动信号的幅值和频率特征,组成不同故障程度下的故障特征向量;

Step4:通过对滚动轴承振动信号样本集进行特征提取,可以组成滚动轴承振动信号故障特征集,并利用该特征集构建RF多分类器;

Step5:对待测试的滚动轴承振动信号进行ITD分解,选取最优PR分量提取故障特征向量,将该特征向量输入到RF分类器中,得到滚动轴承故障类型和故障严重程度。

6 实验与分析

6.1 实验数据

本文选用美国凯斯西储大学轴承数据中心[23]提供的滚动轴承故障数据集对所提出的故障诊断方法进行实验验证,滚动轴承实验平台如图3所示。实验以SKF轴承作为研究对象,数据集通过加速度传感器采集正常(NM)、内环故障(IR)、外环故障(OR)及滚珠故障(B)4种状态下的轴承振动信号。加速度计安装在电机外壳的驱动端和风扇端的12点钟方向,采样频率为12 kHz。对于三种故障类型,分别选取故障直径为2.13,4.27和6.4 mm三种不同的故障严重程度进行样本采集。2 237.1 W负载下不同故障严重程度的滚动轴承振动信号的时域波形如图4所示,可见其振动信号的幅值和频率的变化与故障类型和故障严重程度的变化紧密相关。表1所示为本文中实验样本的轴承负载、故障类型及严重程度组成。实验样本一共包括3种不同的滚动轴承故障类型,每种故障类型分为3种不同的故障严重程度。将每种轴承数据不重叠地分割成多个数据样本,每个样本中含有N=1 024个采样点,组成每种故障严重程度下50个样本构成的实验数据集。实验中,采用每种故障严重程度下10个样本作为训练集,40个样本作为测试集。

图3 凯斯西储大学滚动轴承实验平台Fig.3 Rolling bearing experimental platform of Case Western Reserve University

图4 负载2 237.1 W下不同故障严重程度的滚动轴承振动信号Fig.4 Vibration signals of rolling bearing with different fault severity under 2 237.1 W

表1 实验样本的故障类型及严重程度组成

6.2 滚动轴承故障特征提取实验

在执行滚动轴承故障特征提取前,需采用ITD对振动信号进行预处理,进一步突显信号固有瞬时幅值、频率等形态特征。图5所示为故障直径为2.13 mm下滚珠故障的振动信号ITD分解实验结果。ITD将故障振动信号分解为5个PR分量和1个单调趋势分量。由分解结果可见,最优PR分量包含描述滚珠故障振动信号中的主要幅值和频率特征。

滚动轴承振动信号经ITD分解后,采用IMAAPE进行特征提取。对最优PR分量进行IMAAPE特征提取,设置嵌入维数d=4,时间延迟l=1,时间尺度τ=20,调整系数A=0.5。对测试集的振动信号样本进行IMAAPE特征提取,得到20维的滚动轴承振动信号故障特征向量。图6所示为0负载下不同故障直径的IMAAPE特征聚类图,从特征向量的前3个维度可以看出,本文提出的特征提取方法能够较好地对正常、内环故障、外环故障及滚珠故障进行描述,特征向量具有较强的聚类性。图7所示为0负载下不同故障严重程度的IMAAPE特征聚类图,选取特征向量中前2个维度可以看出,本文提出的特征提取方法对不同故障严重程度的特征提取结果也具有较好的聚类性。

图5 故障直径2.13 mm下滚珠故障的ITD分解结果Fig.5 ITD decomposition results of ball fault under fault diameter of 2.13 mm

为了说明IMAAPE滚动轴承振动信号特征提取方法的性能,本文将IMAAPE与现有滚动轴承故障特征提取方法的效果进行对比。实验采用0负载下内环故障、外环故障和滚珠故障各40个样本进行分析,实验结果如表2所示。不同故障类型情况下,特征向量的类间距离平均值越大,表示特征提取方法提取的不同故障类型的特征差异性越大;不同故障类型情况下特征向量的类内距离平均值越小,表示特征提取方法提取的相同故障类型的特征差异性越小。由表2可见,IMAAPE的平均类间距离大于改进多尺度排列熵[11](IMPE)和精细复合多尺度排列熵[25](RCMPE),但小于改进多尺度样本熵[26](IMSE)、改进多尺度模糊熵[11](IMFE)和精细复合多尺度样本熵[25](RCMSE),而IMAAPE的平均类内距离在所有特征提取方法中最小。该实验结果说明IMAAPE提取的滚动轴承故障特征具有较好的聚类性质。此外,由表2可知,在计算相同的采样点数的样本时,IMAAPE的平均耗时为所有特征提取方法中最小的,具有较好的实时性。表3为故障程度识别准确率的比较。

(a)故障直径2.13 mm(a)Fault diameter of 2.13 mm(b)故障直径4.27 mm(b)Fault diameter of 4.27 mm(c)故障直径6.4 mm(c)Fault diameter of 6.4 mm图6 负载0下不同故障直径的IMAAPE特征聚类图Fig.6 IMAAPE feature clustering diagram of different fault diameters under zero load

表2 滚动轴承故障特征提取算法的性能比较

图7 0负载下不同故障严重程度的IMAAPE特征聚类图Fig.7 Clustering diagram of IMAAPE features with different fault severity under zero load

为了进一步说明本文提出的IMAAPE故障特征提取方法的可分性,本文分别利用表2中描述的特征提取方法与RF分类器相结合,设置CART决策树数量为50,对滚动轴承10种不同健康状态下的每种类别40个测试样本进行分析,实验结果如表4所示。由实验结果可知,与当前不同滚动轴承故障特征提取方法相比较,本文提出的IMAAPE故障特征提取方法具有更好的故障严重程度描述能力,提取的特征向量具有更高的可分性。

表3 滚动轴承故障特征提取算法准确率比较

6.3 滚动轴承故障类型识别实验

为了验证IMAAPE与RF相结合的轴承故障诊断方法的性能,对滚动轴承10种不同健康状态下的每种类别40个测试样本进行实验验证,结果如表5所示。可见,提出的滚动轴承故障诊断方法能够有效地识别正常、内环故障、外环故障、滚珠故障,并且能够较为有效地分析故障严重程度,误报率较低,平均识别准确率高达99.25%。

表4 不同滚动轴承故障诊断方法识别率比较

表5 滚动轴承故障诊断方法的识别率

为了进一步说明本文提出方法在滚动轴承故障诊断中的性能,将本文提出的滚动轴承故障诊断方法与现有方法进行比较,实验结果如表5所示。可见,本文提出的方法能够实现滚动轴承故障类型识别,并能够进一步分析轴承故障的严重程度。在不考虑故障严重程度的情况下,能够准确识别故障类型,故障识别准确率达到100%;在考虑故障严重程度的情况下,提出的故障诊断方法具有故障严重程度分析能力,且具有相对较高的平均故障识别率,达到99.25%。

7 结 论

ITD能够稳定地将滚动轴承故障信号分解为一组PR分量,其中最优PR分量能够突显滚动轴承故障信号的冲击特征,适用于滚动轴承振动信号的时-频分析。IMAAPE改善了多尺度分析中的粗粒化过程,并利用幅值感知排列熵对信号幅值和频率变化敏感的特性,计算不同时间尺度下的AAPE值并组成特征向量,具有较强的故障描述能力且实时性较好。基于IMAAPE与RF的滚动轴承故障诊断方法能够在准确识别故障类型的基础上,进一步对故障严重程度进行分析,在考虑故障严重程度的情况下,平均故障识别准确率达到99.25%。

本文方法目前仅适用于滚动轴承固定负载下的故障类型识别及故障严重程度分析。为了进一步提升该滚动轴承故障诊断方法的泛化能力,后续的研究重点为变负载情况下滚动轴承的故障类型与故障严重程度分析。

猜你喜欢
特征提取幅值分量
多尺度串联非线性能量阱的减振效能及阻尼连接方式研究
AFM轻敲模式下扫描参数对成像质量影响的研究
《液压与气动》常用单位的规范
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
论《哈姆雷特》中良心的分量
基于S变换的交流电网幅值检测系统计算机仿真研究
Bagging RCSP脑电特征提取算法