基于精细复合多尺度熵特征向量相关系数在滚动轴承故障诊断中应用

2018-10-23 07:35叶金义谢小平梁烊炀张福运
噪声与振动控制 2018年5期
关键词:训练样本特征向量尺度

叶金义,谢小平,2,梁烊炀,张福运

(1.湖南大学 汽车车身先进设计制造国家重点实验室,长沙 410082;2.中国汽车技术研究中心有限公司,天津 300300)

滚动轴承是旋转机械中应用最广泛的零部件之一,并且它的故障经常是引起旋转机械故障的最终原因[1]。当轴承发生故障的时候,在振动信号中就会发生变化。轴承的故障信息会掩藏在大量混合信号中,凭借个人的主观经验很难做出判断,通常需要运用信号处理的方法进行故障信息的提取。因此研究如何有效地从振动信号中提取故障特征,并进行准确识别具有重要意义。

样本熵最早是由文献[2]针对近似熵存在的模态问题提出来的改进方法。文献[3]与文献[4]分别将样本熵运用于轴承故障诊断,结果表明样本熵作为特征取得良好效果。同时,样本熵存在包含信息量不足,不能准确的反映数据中随时间变化的复杂性特征,在文献[5]中提出了多尺度熵。文献[6]分别将多尺度熵成功用于转子故障信号复杂性的度量,以提取故障特征。文献[7]利用多个尺度上熵值均值大小和熵值变化趋势的描述轴承故障程度。多尺度熵能从多个尺度熵反映时间序列复杂程度,但同时也存在着在熵值随尺度增大稳定性和一致性差的问题。在文献[8]中提出了复合多尺度熵,对同一尺度下的时间序列进行细化,获得更准确客观的熵值。文献[9]将多尺度熵与拉普拉斯支持向量机结合,显著提高了故障诊断的正确率。对于复合多尺度熵提高了多尺度熵的准确性,但不能解决未定义熵的产生。在此基础上,文献[10]提出了精细复合多尺度熵概念,能提高了熵估计的准确性,并降低了诱导未定义熵的概率。

基于RCMSE优越性,本文提出将RCMSE特征向量相关系数方法用于轴承故障诊断。该方法首先对样本数据进行处理获得RCMSE,并计算测试样本的RCMSE与已知故障状态的RCMSE特征向量的相关系数,最后选取相关系数最大值,从而作为判断样本的状态类型,对测试样本分类获得最终的故障识别结果。将本文的方法运用于滚动轴承实验数据,结果表明该方法能对故障信号准确识别分类。

1 精细复合多尺度熵理论

1.1 多尺度熵

多尺度熵是在样本熵的基础上,在不同尺度因子下,将数据粗粒化形成新的序列,并对每一尺度序列求其样本熵。不同的数据在同一尺度因子下,熵值越高则表明时间序列复杂性越高。多尺度样本熵的计算过程如下

其中:τ为正整数,称为尺度因子。对于尺度τ,样本X被分割为长度为N τ序列。

(2)计算样本X在各个尺度下的粗粒序列,并求其样本熵,可以得到随尺度因子τ变化对应的样本熵函数。

在多尺度样本熵计算过程中,随着尺度因子增加而使得粗粒化序列长度降低,计算出来的样本熵会出现熵值不准确。同时,时间序列过短时还会引起未定义熵,熵值得偏差随着粗粒序列变短而逐渐增大。

1.2 复合多尺度熵

复合多尺度熵就是针对多尺度熵的不足基础上提出来的。在每一尺度因子上,对粗粒序列再进行深度挖掘,获取更多的信息。

(1)对于一个原始数据X={x1,x2,…},xn,长度为N,给定嵌入维数m和相似容限r,则可以构建粗粒化序列

其中:k为在尺度τ下构造滑动序列号。在尺度τ下,相对于多尺度熵只生成一粗粒序列,复合多尺度熵依次平滑移动生成τ个粗粒序列。

(2)对每个尺度因子τ,生成τ个粗粒序列分别计算其样本熵,在对τ个样本熵取均值。

最终获得随尺度因子τ变化的样本熵函数,即为复合多尺度熵。在多尺度熵中只考虑单一粗粒序列,在尺度因子逐渐变大时,过短的粗粒序列很容易产生熵值波动。复合多尺度熵在样本计算中,在同一尺度比多尺度熵计算更多粗粒序列,能够获得到更准确的熵值,但是对于较短的数据样本处理也增大未定熵产生概率。

1.3 精细复合多尺度熵

在复合多尺度熵计算中,首先计算尺度τ下多粗粒序列样本熵再求均值。在计算复合多尺度熵,若其中一个粗粒时间序列太短引起未定义熵时,复合尺度熵则变为未定义熵。这样增加了未定义熵的概率,这限制了复合尺度熵在短序列中的应用,因此论文[10]提出了精细复合多尺度熵

在精细复合多尺度熵中,改变了复合尺度熵中先求熵值再平均,而是把尺度因子τ下所有粗粒序列的求出来并求和,最后再求总的样本熵。相对于复合尺度熵,这种方法在粗粒序列较短时大大降低了未定义熵产生的概率。

1.4 精细复合多尺度熵特征向量相关系数

为了衡量提取样本精细复合尺度熵特征向量的相似程度,定义精细复合多尺度熵特征向量相关系数,如下

其中:λki为第i个样本的RCMSE的第k个熵值,Pij为第i个样本与第j个样本的RCMSE的相关系数。可以认为,RCMSE相关系数为第i个样本与第j个样本在特征空间的夹角余弦绝对值。通过RCMSE相关系数,可以用于判断两个样本的RCMSE的相似程度。

在不同轴承类型样本之间在特征空间投影方向不同,可通过RCMSE特征向量相关系数来进行区分识别。

1.5 RCMSE与MSE、CMSE仿真对比分析

为了分析MSE、CMSE和RCMSE,选取了高斯白噪声和1f噪声进行仿真分析。分别取两种噪声信号时间序列长度为512、1 024、2 048、4 096、8 192的高斯白噪声和1f噪声,设定嵌入维数m=2,最大尺度因子取20,求相应的MSE、CMSE和RCMSE。由于熵值的波动,为了方便观察,分别各取50组数据计算其平均值作为最终的熵值,如图1和图2所示。

在图1可以看出,随着尺度因子的增加,RCMSE,CMSE,MSE逐渐减。在白噪声中,当N=512时,MSE在τ≥10产生波动,RCMSE产生轻微波动,而RCMSE结果保持很好的稳定性。当时间序列长度逐渐增大时,RCMSE和MSE、CMSE误差很小,基本能保持一致。这表明,在处理短数据时,RCMSE更具有稳定性。

同时从图2可以看出随着尺度因子的不断增大,三种算法的值趋于稳定。在N=512时,MSE和CMSE分别在τ=4和τ=6开始出现未定义熵,而RCMSEτ=17后才出现未定义熵。这是因为当时间序列过短时,未定义熵容易产生。根据MSE的算法,当nm+1k,τ或nmk,τ其中一个为0时,则就会产生未定义熵。在RCMSE算法中,CMSE在某一尺度因子下进行更密集时间尺度分割,求各个粗粒序列的熵值后再求平均值作为该尺度因子下的熵值。因此,CMSE比MSE出现未定义熵可能性更高。而RCMSE则先计算各个粗列时间序列的参数,对nm+1k,τ、nmk,τ求和后再求熵值,大大降低了未定义熵的产生。

图1 白噪声序列长度与熵值关系

白噪声信号较为简单,而1f噪声较为复杂。从图中也可以看到,当尺度因子较大的时候,白噪声随着尺度因子增大而逐渐降低,而1f噪声随着尺度因子增大而维持在一个稳定的范围。RCMSE,CMSE,MSE能很好的反应信号的复杂程度。

为了研究RCMSE与CMSE,MSE的稳定性效果,分别计算1f噪声在尺度因子τ=20时的熵值。对于同一尺度因子,样本长度越大,计算的熵值越准确。分别取200组独立噪声样本,计算RCMSE,MSE,CMSE随着数据长度不断增大的均值与方差,数据长度分别为1 000,2 000,3 000,5 000,10 000,20 000。

而当样本长度在2 000~3 000时,RCMSE计算的结果更接近长度为30 000的熵值,可说明在相同样本长度下,RCMSE的准确性优于MSE与RCMSE。

图2 1/ƒ噪声序列长度与熵值关系

如图3所示,随着样本长度的不断增加,三种方法计算结果趋向一致,说明当样本长度逐渐增大时,RCMSE的结果与MSE,CMSE是一致的。

图3 RCMSE、CMSE、MSE准确性与稳定性对比分析

2 滚动轴承故障诊断方法及应用

2.1 故障诊断方法

本文基于精细复合多尺度熵相关系数滚动轴承故障诊步骤为:

(1)若轴承故障类型为k类,对每一种类型的轴承故障信号进行随机采样取t个样本,并把其中n个样本作为训练样本,其余作为测试样本。

(2)对每一个滚动轴承振动信号样本计算RCMSE,设置尺度因子τ,嵌入维度m,相似容限r可获得不同尺度下τ个样本熵,并将其作为特征参数,由此构成初始特征向量矩阵T。

(3)提取每类轴承状态n个训练样本RCMSE,求该类状态每个尺度因子的平均值,记为Sτ。可得到代表该类轴承状态的RCMSE,为该类状态标准RCMSE。

(4)用RCMSE相关系数公式(5)计算每个测试样本RCMSE与k类轴承状态标准RCMSE的RCMSE相关系数,比较测试样本与k类轴承状态相关系数的值,选取最大值对应的训练样本状态为识别的类型状态,对测试样本进行分类,确定测试样本的轴承故障类型。

本文方法流程如图4所示。

图4 故障诊断流程图

2.2 应用实例

为了验证该方法的可行性,本文选取了美国的Case Western Reserve University电气工程实验室的轴承数据进行分析。本文选的取得轴承数据工况如表2所示:

轴承的故障位置在内圈半径为0.355 6 mm的位置,用电火花对滚动体、内圈、外圈点蚀破坏处理,安装于靠近电机驱动一侧。实验的电机转速为1 730 r/min,采样频率为12 kHz。采集轴承状态分为四类:完全正常、滚动体故障、内圈故障和外圈故障信号,时域波形如下图所示。由图5可知在正常状态下信号是无冲击,变化无规律;发生故障时,波形出行冲击波形,且幅值出现不同程度增大。

对4种滚动轴承状态,每一类振动信号分别取25个样本,每组样本长度为2 000,其中5个作为训练样本,20个作为测试样本,共计100个样本。

首先,对全部100个样本计算RCMSE,设置尺度因子τ=20,嵌入维度m=2,相似容限r=0.15σ可获得不同尺度下20个样本熵,作为该训练样本的特征向量。故4类轴承状态,每类5个训练样本,构建训练样本特征向量矩阵T(维数20×20)。计算每类轴承类型状态均值RCMSE,并作为该类型状态的特征的标准RCMSE。四类轴承状态特征RCMSE如图6所示,每一类状态为该故障类型状态的标准RCMSE。可以看出在尺度因子τ〈5时,轴承完全正常、滚动体故障、内圈故障的熵值相互交叉区分度低,但随着尺度因子增大,熵值差异变得明显。

表1 滚动轴承尺寸参数

图5 四种状态信号时域图

图6 四类轴承状态的标准RCMSE

其次,对每一个测试样本进行特征识别,分别计算测试样本的RCMSE与四种轴承状态的RCMSE相关系数,并选取RCMSE相关系数最大值所对应的轴承状态为识别的状态类型。为了方便观察,四类轴承状态训练样本没有打乱,依次排序,顺序为0-20正常轴承状态,20-40内圈故障,40-60外圈故障,60-80滚动体故障。

如图7所示在0-20测试样本序号中,与四种轴承状态RCMSE相关系数由大到小顺序为:正常状态>滚动体故障状态>内圈故障状态>外圈故障状态。可知1-20样本与正常状态的轴承RCMSE最接近,可判断该样本的状态类型为正常状态。在60-80序号样本中,测试样本与轴承内圈故障RCMSE相关系数和尽管与滚动体故障RCMSE相关系数很接近,但是始终小于滚动体故障RCMSE相关系数。

图7 训练样本RCMSE相关系数

设定第A类为轴承正常状态,第B类为轴承内圈故障,第C类为轴承外圈故障,第D类为轴承滚动体故障。经过对每一样本与四种状态标准RCMSE求相关系数,选取最大值对应的轴承状态为识别状态,获得最终的分类结果如图8。可以看出本文提出的方法具有很好的分类效果,实现了轴承各个故障的分类识别测试样本识别率为100%。

为了说明采用本文RCMSE相关系数的分类优势,分别采用传统的Kmeans聚类算法进行对比分析,训练样本与测试样本与本文前部分叙述相同,分类结果如图9所示。

在图9中可看出各类该轴承状态都没能进行准确分类,外圈故障的测试样本虽然分为了一类,但滚动体故障测试样本和内圈故障测试样本无法进行区分,而正常状态的测试样本则被分为了两类。

从图6四类轴承状态的RCMSE可以看出内圈故障与滚动轴承故障的RCMSE曲线在不同尺度因子下都非常接近。在尺度因子2~5之间,轴承完全正常、轴承滚动体故障、轴承内圈故障的RCMSE发生了交叉。由上述可知,采用本文RCMSE相关系数的方法优于传统的Kmeans分类方法,进一步说明了本文方法准确性和有效性。

图8 训练样本轴承分类结果

图9 Kmeans算法分类结果

3 结语

(1)随着尺度因子的增大,粗粒序列会逐渐变短,CMSE和MSE方法容易产生未定义熵。同时,MSE在尺度低是还会产生误差较大的熵值估计。RCMS通过与CMSE和MSE,对比分析可知,该算法能很好的降低未定义熵的产生,对熵值计算的稳定性与精确性也优于其他两种算法。同时,RCMSE对数据长度要求相对其他两种算法更低,具有很好的优越性。

(2)本文提出精细复合多尺度熵特征向量相关系数作为分类依据,定义为精细复合多尺度熵特征向量之间夹角的余弦值,具有计算操作简单,运算速度快等特点。

(3)将RCMSE及其RCMSE相关系数运用于轴承故障诊断,能100%对故障类型进行分类,实现轴承故障诊断,具有很好的应用价值。

猜你喜欢
训练样本特征向量尺度
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
财产的五大尺度和五重应对
人工智能
一类三阶矩阵特征向量的特殊求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
宇宙的尺度
9