基于自适应局部迭代滤波和模糊C均值聚类的滚动轴承故障诊断方法

2021-07-21 09:22张超何闯进何玉灵
轴承 2021年5期
关键词:分量滤波轴承

张超,何闯进,何玉灵

(华北电力大学 机械工程系,河北 保定 071003)

滚动轴承是旋转机械中容易损坏的部件之一,在机械运转过程中,过载、疲劳、磨损、腐蚀等现象都有可能导致轴承损伤。轴承损伤部位经过载荷区时会产生一定的冲击,激励固有频率振动并表现出高频、调幅的特性,而调幅信号中的低频特征与轴承故障类型有关。因此,提取故障信号的低频特征是滚动轴承故障诊断的关键。

由于轴承运行工况复杂,实际采集到的轴承振动信号往往具有明显的非线性、非平稳性特征,且包含较强的背景噪声,传统的傅里叶方法无法实现理想的分析效果。经验模态分解(EMD)可将非平稳多模态信号自适应分解为不同频段的本征模态函数(IMF),然后结合希尔伯特变换得到各阶IMF的幅值与频率信息[1]。在EMD基础上结合高斯白噪声频率均匀分布的特性,提出的集合经验模态分解(EEMD)方法可以解决EMD的模态混叠问题,从而更好地实现信号的分类识别[2-4]。EMD及其改进算法带来了超越傅里叶分解的新思路,对信号的自适应分解准确度高[5-6],但仍存在端点效应、分解误差较大等问题。

文献[7]采用固定低通滤波函数替代EMD方法中的包络均值曲线,从而提出了迭代滤波(Iterative Filtering,IF)算法,但该方法的滤波函数需提前设定且在逐次迭代运算过程中保持不变,无法像EMD一样有针对性地实现信号的自适应分解,因而限制了其实际应用。在此基础上,文献[8]选用Fokker-Planck方程的基础解系作为滤波函数,进一步提出了自适应局部迭代滤波(Adaptive Local Interative Filtering,ALIF)方法。该方法能够根据待分解信号计算得到相应滤波函数,从而在有限的迭代过程中筛选出各阶IMF,实现信号的自适应分解,并能够有效克服模态混叠和端点效应,实现信号更加精准的分解。

为实现滚动轴承不同类型故障的识别,需进一步对提取的故障特征信息进行分类。传统的模糊C均值(Fuzzy C-Means,FCM)算法是一种应用比较成熟的聚类方法,基于核方法改进的模糊均值(Kernelized Fuzzy C-Means,KFCM)方法通过非线性映射将待分类样本映射至高维空间,突出了样本点间的特征差异[9],然后再用FCM算法对高维特征空间进行聚类,从而达到更好的数据分类效果。基于以上论述,提出了一种基于ALIF和KFCM聚类的滚动轴承故障诊断方法,并通过对比分析定性、定量地验证该方法识别滚动轴承不同类型故障的准确性和有效性。

1 ALIF基本原理

ALIF方法采用Fokker-Planck方程的基础解系作为滤波函数,该滤波函数能够随着滤波区间的变化计算得到相应表达式,从而在迭代运算过程中精确提取单一的IMF分量,实现非平稳信号的自适应分解。ALIF算法的迭代筛选过程包含内循环、外循环2个过程。

1.1 内循环过程

内循环过程的目的是迭代筛选出各阶IMF分量。滑动算子Г(z(t))可表示为

(1)

(2)

式中:ω(t)为滤波函数;l(z)为滤波区间;m为极值点个数,N为信号长度。

假设h(x)和g(x)均为光滑可导函数,且在区间[a,b]上满足:

1)g(a)=g(b)=0,且对于任意x∈(a,b),g(x)>0;

2)h(a)<0

则Fokker-Planck微分方程的一般形式为

(3)

式中:δ,μ的取值范围为(0,1)。

(4)

此时,方程存在的解p(x)即为所求的滤波函数ω(t),且满足:

1)对于任意x∈(a,b),p(x)≥0;

2)对于任意x∉(a,b),p(x)=0。

原信号z(t)与滑动算子Г(z(t))相减可得到波动算子κ(z(t)),即

κ(z(t))=z(t)-Γ(z(t))。

(5)

在实际情况下,迭代过程不能一直进行下去,通常需设置迭代停止条件,令

(6)

式中:κi为第i个波动算子。当Ei小于指定阈值时,内循环迭代筛选停止,κ(z(t))即为提取到的IMF分量。

1.2 外循环过程

外循环的目的是终止内循环的IMF分量的提取过程。当从原信号z(t)中去除所有IMF分量后得到的余量r(t)呈现明显平均趋势特征时,外循环停止。

ALIF分解流程如图1所示。

图1 ALIF分解流程图

2 近似熵

近似熵是一种用非负数衡量时间序列复杂度的方法[10]。文献[11]通过对比单一正弦信号加入白噪声前后的不同发现,单一正弦信号波形规律性好,近似熵值小;而加入白噪声后的信号波形畸变大,近似熵值也大大增加:说明时间序列越复杂,近似熵就越大,时间序列越不具有规则性。

设原始时间序列有x(1),x(2),…,x(n)共N个数据点。预先给定维数m和相似容限r,计算过程如下:

1)按顺序将时间序列{x(i)}分成一系列m维矢量,即

X(i)=[x(i),x(i+1),…,x(i+m-1)]。

(7)

2)定义矢量X(i)与X(j)之间的距离为矢量中任意2个元素的最大差值,即

d[X(i),X(j)]=max{|x(i+k)-x(j+k)|};k=0,…,m-1。

(8)

3)给定相似容限r的阈值,统计d[X(i),X(j)]

(9)

(10)

5)取维数m+1,重复上述步骤1~4,得

(11)

(12)

6)近似熵的估计值为

EApEn(m,r,N)=Φm(r)-Φm+1(r)。

(13)

当m=2,r=(0.1~0.25)σ(σ为数据序列{x(i)}的标准差)时,近似熵值对数据长度N的依赖性较小,具有较为合理的统计特性[10],即

EApEn(2,r,N)≈EApEn(2,r)。

(14)

实际计算中,通常取r=(0.1~0.25)σ,m=2,本文取r=0.25σ,m=2。

3 KFCM聚类

3.1 KFCM原理

基于核的模糊C均值聚类是通过核空间非线性映射将待分类样本映射至高维空间,突出样本的特征差异后再进行聚类的方法[12]。

非线性映射Ф定义为

Φ:xk→Φ(xk)∈F,

(15)

式中:xk为原始特征空间样本,xk∈X。

KFCM算法的聚类目标函数为

(16)

(17)

式中:c为类别数;n为样本数量;μik为隶属度;m为模糊加权指数;vi为聚类中心。

定义核函数K(x,y)=ФT(x)Ф(y),即

(18)

则核空间的欧式距离为

‖Φ(xk)-Φ(vi)‖2=K(xk,xk)+K(vi,vi)-2K(xk,vi),

(19)

式中:σk为高斯核参数。

根据(17)式所示约束条件,结合(18)和(19)式可求得隶属度和聚类中心,分别为

(20)

(21)

隶属度在逐次迭代过程中更新,当目标函数的变化小于阈值或无变化时,迭代运算停止。

3.2 聚类效果分析

通常采用分类系数S和平均模糊熵E进行聚类效果评价,分别定义为

(22)

(23)

具体的分类效果可以用分类系数和平均模糊熵表征。分类系数S是表示聚类结果模糊程度的标准。若S=1,聚类结果属于硬划分;若S<1,则属于模糊划分;因此S越接近1,说明样本聚类效果越好。平均模糊熵E表示分类的不确定性,对于硬划分有E=0,对于模糊划分有E>0。因此E越接近0,样本聚类效果就越好[13]。

4 试验验证

4.1 不同类型故障分类

为验证ALIF和KFCM聚类对轴承故障的有效性与优越性,采用美国凯斯西储大学电气工程实验室采集的滚动轴承数据进行分析,并与EMD,EEMD聚类分析结果进行对比。试验轴承型号为6205-2RS,在转速1 750 r/min、采样频率12 kHz条件下,分别对轴承处于正常、内圈故障、外圈故障以及钢球故障状态时的振动数据进行分析。

以轴承内圈故障信号为例进行说明,分别采用EMD,EEMD和ALIF方法进行分解并选取前6阶IMF分量进行对比,结果如图2所示,由图可知:EMD与EEMD比较相似,IMF分量的频率区间都比较接近,其中EMD中的第4,5阶和EEMD中的第4阶IMF分量存在比较明显的模态混叠问题。而ALIF分解出的前6阶IMF分量所占据频率区间的细化程度较高,也没有出现模态混叠问题。

图2 内圈故障信号的分解结果

相关系数较大的IMF分量可以很好地保留信号的故障特征信息[14],前6阶IMF分量与原信号的相关系数见表1,由表可知:前3阶IMF分量与原信号的相关系数远大于其他分量的相关系数值,可以认为原始信号的大部分故障特征信息包含在前3阶IMF分量中,故选用前3阶IMF分量表征原始信号。

表1 IMF分量与原信号的相关系数

采用近似熵提取IMF分量中的故障特征进行聚类。为证明近似熵能够作为聚类分析的依据,分别求取轴承4种状态样本数据的ALIF近似熵值,结果见表2,由表可知:对于同种故障类型信号,ALIF分解所得各阶IMF分量的近似熵值有明显不同,说明各阶IMF分量的复杂程度不同;总体而言,4种信号各阶IMF分量的近似熵值组成的特征向量也存在较大差异,表明各个状态类型信号的复杂度不同,存在硬分类的可能。

表2 前3阶IMF分量的ALIF近似熵

在同一试验条件下,对轴承4种运行状态时的振动数据分别连续取20组(训练和测试各10组)样本数据,每个样本的数据点数为3 072。分别采用EMD,EEMD和ALIF方法自适应分解20组样本数据得到多阶IMF分量,计算前3阶IMF分量的近似熵值作为特征向量矩阵,从而得到3×40的故障样本近似熵矩阵和待测样本近似熵矩阵。先将故障样本近似熵矩阵作为特征向量,对其作聚类运算得到4个聚类中心,然后将得到的聚类中心和待测样本近似熵矩阵作为特征向量输入到KFCM中,数据迭代运算直至误差收敛小于容差时完成聚类,结果如图3—图5所示。对比分析图3—图5可知,不同方法所得结果的聚类中心位置和样本点分布在聚类中心周围的紧密程度均不相同:

图3 不同状态轴承振动数据EMD近似熵的KFCM聚类结果

图4 不同状态轴承振动数据EEMD近似熵的KFCM聚类结果

图5 不同状态轴承振动数据ALIF近似熵的KFCM聚类结果

1)基于EMD近似熵的聚类方法的分类效果较差,数据点散落分布在聚类中心周围,且内圈故障与外圈故障数据混杂在一起,在二维平面和三维空间上都无法区分。

2)基于EEMD近似熵的聚类方法提取故障特征信息的效果要优于EMD聚类方法,能够实现较好的轴承故障分类效果。图中4类数据均散布在各自的聚类中心周围,且数据点紧凑,类别区分清晰,但二维投影平面显示出内圈故障与钢球故障的类间间距较小。

3)对于基于ALIF近似熵的聚类方法,各类信号的聚类中心相隔较远,类别区分非常清晰。4种不同类型的待识别样本信号经ALIF分解聚类后,各类数据点均聚集在各自的聚类中心周围,且分布紧凑。与EMD和EEMD相比,基于ALIF聚类方法的类中心间距更大,不同信号区分更明显,说明该方法的分类效果更优,对滚动轴承各类故障信号具有很高的识别度和良好的分类效果。

对以上3种算法的聚类效果进行定量对比,分别计算各聚类结果的分类系数S和平均模糊熵E,结果见表3。由表3可知:基于EMD和KFCM聚类方法的分类系数为0.788,平均模糊熵为0.400,聚类效果最差;基于EEMD和KFCM聚类方法的分类系数为0.970,平均模糊熵为0.086,聚类效果相对EMD得到极大改善;基于ALIF和KFCM聚类方法的分类系数最接近1,平均模糊熵最接近0,说明该方法的聚类效果在3种方法中最优。

表3 不同信号分解算法的KFCM聚类指标

4.2 不同聚类方法分类

同样,在同一试验条件下,对轴承4种运行状态时的振动数据分别连续取20组(训练和测试各10组)样本数据,每个样本的数据点数为3 072。采用ALIF方法自适应分解20组样本数据得到多阶IMF分量并选取前3阶IMF分量作为包含主要故障特征信息的特征向量计算近似熵值,得到3×40的故障样本近似熵矩阵和待测样本近似熵矩阵,分别进行FCM,KFCM聚类的结果如图6所示。2种算法的分类系数S和平均模糊熵E见表4。

表4 ALIF处理后FCM及KFCM的聚类指标

图6 不同状态轴承振动信号经ALIF处理后的聚类效果

根据三维空间聚类结果及聚类指标可知:经FCM聚类后,轴承各信号聚类中心相隔较远,各类别信号区分也较为明显,可以实现轴承不同类型故障的划分;但基于KFCM聚类的数据点距各自中心更近,分布更加紧凑,各类数据的中心间距更大,不同信号的区分更明显,且分类系数更接近于1,平均模糊熵更接近于0,比FCM的聚类效果更好。

5 结束语

采用基于ALIF和近似熵的方法进行滚动轴承振动信号特征提取,通过KFCM实现对轴承内圈、外圈及钢球故障的聚类识别划分。对比分析表明,相对于EMD和EEMD,ALIF方法能够更加准确地将多模态信号分解为单一IMF分量,便于后续提取信号故障特征;相对于FCM,KFCM的数据点聚类更加紧凑,不同类别信号区分更大;基于ALIF近似熵特征的KFCM聚类的分类系数最接近1,平均模糊熵最接近于0,能够有效识别滚动轴承的故障特征并进行高精度分类。

本文算法为滚动轴承各类故障的诊断识别划分提供了一种有效的分析工具,如何进一步提高算法效率,将其应用于工程实践是以后需要进一步开展的工作。

猜你喜欢
分量滤波轴承
轴承知识
轴承知识
轴承知识
轴承知识
帽子的分量
一物千斤
论《哈姆雷特》中良心的分量
RTS平滑滤波在事后姿态确定中的应用
基于线性正则变换的 LMS 自适应滤波
基于瞬时对称分量法的三相四线制D-STATCOM控制研究