基于HTMFDE以及ICNN的滚动轴承寿命状态识别方法

2023-03-29 02:56董绍江刘文龙方能炜胡小林余腾伟
铁道科学与工程学报 2023年2期
关键词:尺度寿命卷积

董绍江,刘文龙,方能炜,胡小林,余腾伟

(1. 重庆交通大学 机电与车辆工程学院,重庆 400074;2. 重庆工业大数据创新中心有限公司,重庆 400707)

滚动轴承作为轨道、航空、风电等领域中不可缺少的零部件,同时也是最容易发生故障的零部件之一,其工作状态将直接影响机械设备的运行状态[1],若不能及时监测其是否出现故障并采取一定应对措施,一旦轴承失效,可能造成严重的事故和大量的财产损失。因此,研究有效的滚动轴承寿命状态识别方法具有十分重要的意义。轴承寿命状态识别有2个关键问题需要解决:1) 构建合适的轴承性能退化评估指标;2) 建立有效的轴承寿命状态识别模型[2]。传统描述轴承退化趋势的方法主要是提取时域、频域和时频域的特征量来描述,如利用峭度和均方根值等。但滚动轴承的振动信号受运行环境、工况等因素影响,常常表现出非线性特征,仅仅依靠传统单一时频域的特征量已无法精准地描述轴承性能退化趋势。周建民等[3]提出基于特征优选结合优化支持向量机的性能评估方法,较好地刻画了轴承的性能退化趋势,但需要同时计算10 余种时域特征参数,计算过程复杂繁琐。董绍江等[4]通过构造特征噪声能量比(Feature-to-Noise Energy Ratio,FNER)也较好地描述了轴承退化趋势,但需要提前明确轴承的故障频率,不适用于实际工况下未知轴承的性能评估。近年来,基于熵理论的非线性特征量在故障特征提取领域得到了广泛应用,如多尺度样本熵(Multiscale Sample Entropy,MSE)[5]、多尺度排列熵(Multiscale Permutation Entropy,MPE)[6]和多尺度散布熵(Multi-scale Dispersion Entropy,MDE)[7]等。JIAO 等[8]将MSE 与能量矩阵相结合,从多个轴承信号中获取故障特征,结合最小二乘支持向量机准确地识别出了轴承的故障程度。LI等[9]提出一种多尺度符号模糊熵(Multiscale Symbolic Fuzzy Entropy,MCFE)并用于机械故障的提取。然而,上述方法都有其局限性,如MSE 在衡量较短时间序列的相似性上效果较差;MPE 忽略了时间序列相邻点间的幅值信息;MDE 则未考虑非线性时间序列的相邻散布模式之间的差异信息。多尺度波动散布熵(Multiscale Fluctuation Dispersion Entropy,MFDE)[10]作为一种新的非线性动态特征量,通过将序列的每个元素映射到不同的类别,生成不同的波动散布模式,有效克服了上述不足。但是传统的多尺度分析有共同的缺陷,那就是只关注嵌入在低频中的故障信息,忽略了隐藏在高频中的故障信息,致使提取的特征不够全面,且在对序列进行粗粒化过程中序列长度随尺度因子的增加而减小,加之受线性均值粗粒化的影响,会导致序列丢失重要的信息。而基于层次分解的层次熵在量化振动信号的多尺度动态特征领域上也得到了广泛的应用。郑近德等[11]提出一种复合层次模糊熵(Composite Hierarchical Fuzzy Entropy,CHFE)有效获取了轴承故障特征信息。LI等[12]提出改进的层次排列熵(Modified Hierarchical Permutation Entropy,MHPE)较好地提取了齿轮箱的故障特征。尽管相比于传统多尺度熵,层次熵的稳定性稍显不足,但是在对于每个时间序列,它不仅考虑了其低频信息,同时也考虑了高频信息,常被用来评估振动信号低频和高频成分中隐藏的动态特征。轴承寿命状态识别的模型近年来不断被提出,基于人工神经网络的方法被广泛地应用在轴承的状态识别领域。MANJURUL ISLAM 等[13]利用最小二乘支持向量回归模型来实现了轴承寿命状态的识别。LUO 等[14]基于Bi-LSTM 神经网络实现了轴承寿命状态的识别。尽管以上模型都有较高的识别准确率,然而都未考虑早期故障信息极易被噪声淹没所带来的识别问题。因此,本文提出改进卷积神经网络的轴承寿命状态识别模型,采用双层多通道卷积提取特征,通过残差收缩模块以及注意力模块,筛选有用特征,滤除无用特征,有效地增强了模型在噪声环境下的鲁棒性。基于以上分析,本文对传统多尺度波动散布熵进行改进,提出一种层次时移多尺度波动散布熵用于特征提取,并结合JRD 距离以及ICNN 模型实现轴承的寿命状态识别。首先,结合层次分解、改进的时移粗粒化过程,克服了传统多尺度熵的缺陷,细化信号故障特征量,进而获得不同层次、不同尺度下的全面多维退化特征。其次,通过JRD 距离来衡量正常信号与故障信号特征量间概率分布的相似性,以此作为轴承性能退化指标,实现轴承的性能退化评估。最后,依据所建指标划分轴承的全寿命数据集,将不同寿命状态数据输入改进的卷积神经网络模型进行训练,完成在不同噪声环境下的寿命状态识别。

1 理论内容

1.1 层次时移多尺度波动散布熵

对于给定的一组轴承全寿命振动信号X(t)={x1,x2,…,xN},HTMFDE求解过程如下。1) 定义一个均分算子和差分算子。

式中:2n-1表示序列信号长度;Q0(x)表示层次分解后序列的低频部分;Q1(x)则表示序列的高频部分。

2) 为了准确描述信号的层次分析,当j=0 或1时,定义第k层算子Qkj的矩阵形式为:

3) 定义一个k维向量[γ1,γ1,…,γk]∈{0,1},则整数e表示为对于特定的整数e,都有一组唯一确定的k维向量,那么第k层第e个节点的层次分量可表示为:

4) 对层次分量xk,e进行多尺度分析,采用时移粗粒化过程代替传统平均值粗粒化过程。计算s尺度下时移粗粒化序列

式中:1 ≤h≤s,Δ(h,s)=[(N-s)/h]表示不大于(Ns)/h的最大整数。

5) 依据文献[15]计算不同尺度因子下时移粗粒化序列的波动散布熵,并采用式(6)对生成的散布模式概率进行精细化操作,避免相同尺度下波动散布熵产生无效熵值。

6) 则时间序列的HTMFDE可以定义为:

式中:m为嵌入维数;c为类别个数;d为时间延迟;k为分层次数;s为尺度因子。

考虑对序列进行层次分解、多尺度分析,参数过大会影响计算效率,且容易造成特征冗余。根据文献[16]和[17],本文将参数设定为m=3,k=1,c=5,s=4。通常时间延迟d对结果影响较小,默认为1。

1.2 JRD距离

JRD 距离是在JSD 距离(Jensen Shannon Divergence,JSD)基础上,结合Renyi 熵的定义推演而来的。对于一个给定长度为N的时间序列{x(i),i=1,2,…,N}, 其 每 个 数 据 相 应 的 概 率 分 布 为{p1,p2,…pN},则 其Shannon 熵 和Renyi 熵 的 定义为:

Renyi 熵相比Shannon 熵,增加了一个参数α,使其在评价时间序列的复杂度上更加灵活。文献[18]研究证实α=0.5时,其会获得更加稳定的效果,因此本文将α设定为0.5。

设2 个随机序列概率分布分别为p(i)和p'(i),则其KLD 距离(Kullback-Leibler Divergence,KLD)以及JSD距离可以表示为:

式中:mi为p(i)和p'(i)的平均概率分布。通过化简可知:

那么由式(12)结合Renyi 熵的定义可推得JRD距离的定义:

当2 个分布之间没有显著差异时,JRD 距离接近等于0;相反当2 个分布概率差异变大时,JRD距离也逐渐变大。由于轴承状态的变化会直接影响信号特征的表现形式,进而影响信号特征间的概率分布,所以通过JRD 距离能够较好地刻画轴承退化状态的转变过程。

1.3 改进的卷积神经网络模型

本文所提出的ICNN 模型主要由4 部分组成,包括2 个特征提取层、1 个注意力层以及1 个输出层。采用ReLU 激活函数和Dropout 技术以提高模型的抗干扰能力,同时为了加快模型的收敛速度,对每层卷积增加了批量归一化操作,且通过全局池化(Global Average Pooling,GAP)代替全连接层,减少模型参数,提升模型的训练效率。与传统CNN模型相比,本文方法改进如下。

1) 引入残差收缩结构。残差收缩结构是ZHAO 等[19]在残差网络结构的基础上,结合注意力机制和软阈值函数所搭建的,实现了注意力机制下的软阈值化。通过注意力机制,会使得网络生成一组针对不同特征的阈值向量,主网络的输入特征通过与阈值之间的对比实现自适应的改变。具体公式如式(14):

其中:x为模型中的输入特征;y为输出特征;τ为阈值,τ值由输入的特征以及尺度系数α共同决定。具体计算公式如式(15):

式中:zc为C 通道神经元的特征;αc表示C 通道的尺度参数;x表示神经元特征;i,j和c分别表示特征图的宽度、高度和通道索引。

通过引入残差收缩结构作为多通道特征提取层的一环,在实现特征跳连的同时,还能进一步根据阈值对输入的特征剔除部分干扰,可以有效提高模型在含噪数据集上的特征学习能力,提高学习效率。

2) 为了使模型学习到的特征信息实现最大化,本文设计了双层多尺度的卷积层(Multichannel Block)。其包括2 种不同尺度卷积模块和一组残差收缩模块,通过不同大小、数量的卷积核以获取信号在不同尺度下的关键信息,同时结合残差收缩网络的软阈值化,学习重要特征信息,滤除部分无用信息。与传统采用单一尺度并联结构的卷积相比,所提方法更有利于提取丰富的细节特征。最后通过沿深度方向叠加不同尺度的特征,以此达到特征融合的效果。

3) 引入通道注意力机制(SENet)。在设计的双层多通道特征提取层后,为抑制冗余特征带来的干扰,通过注意力机制建立起信号特征与通道之间的联系,对不同通道的特征赋予不同的权重,可以进一步减少无用信息对模型识别的负面影响。

1.4 轴承的寿命状态识别过程

轴承的寿命状态识别建立在退化状态评估的基础上,具体步骤如下。

1) 首先,由于轴承的包络信号对故障特征更为敏感,所以采用希尔伯特变换后的包络信号作为输入,对其进行层次分解,得到不同层次、不同频段下轴承的包络信号分量。

2) 其次,为了消除均值粗粒化过程导致的幅值信息丢失,进一步全面获取各分量的特征信息,对各层次分量进行时移多尺度分析。另外,为了避免相同尺度下波动散布熵产生无效熵值,对生成的散布模式概率进行精细化操作,计算信号的HTMFDE作为轴承的退化特征。

3) 然后,对获取的每组样本的特征进行归一化,形成一组概率分布。将前10 组样本概率分布的均值视作正常样本的概率分布,计算全寿命样本与该组正常样本特征间的JRD 距离作为退化指标。另外,为了削弱离群值对性能退化评估带来的影响,通过高斯滤波算法进行平滑处理,得到最终的JRD 性能退化曲线,实现轴承性能退化评估。

4) 最后,根据JRD 性能退化曲线的局部最大幅值变化,结合时域波形来划分轴承寿命状态,对不同的寿命状态阶段制作等样本的标签数据集。使用标签化数据输入到ICNN 模型中训练,并将测试集输入到训练好的ICNN 模型中实现轴承的寿命状态识别。图1为寿命状态识别的具体流程。

图1 轴承的寿命状态识别流程Fig. 1 Identification flow chart of bearing degradation state

2 轴承性能退化评估

根据所提方法在轴承全寿命周期数据集上进行实验,得到滚动轴承HTMFDE-JRD 性能退化曲线,并与其他传统指标作对比,验证本文方法的有效性。

2.1 数据来源

采用来自辛辛那提大学智能维护中心的轴承加速寿命实验数据集2,实验由安装在交流电机驱动轴上4 组ZA-2115 双列轴承组成。采样频率设置为20 kHz,每隔10 min 记录一次振动数据,持续1 s,每次采样数据的长度为20 480。利用轴承数据可以计算出其外圈故障频率236.4 Hz。数据详情见文献[20]。

2.2 指标构建

首先,由于层次分解要求信号的长度为2n,为了避免数据过大以及轴承失效后期信号不稳定带来的影响,共截取原始数据982 组,每段长度为4 096。以前10 组健康样本概率分布的均值作为正常样本的概率分布,最终得到如图2所示的轴承样本的轴承性能退化曲线(存在0 样本编号,编号为0~981)。

在轴承退化状态评估的过程中,对早期故障起始点的有效判定具有重要的意义。采用基于高斯分布的4σ准则[4]建立健康阈值监测轴承的退化起始点,当JRD 数值超出所划分的阈值时,即可判定该样本时间点处为异常点,根据对异常点的进一步包络谱分析,进而准确地得到轴承早期故障的起始位置。

由图2 轴承的HTMFDE-JRD 性能退化曲线可知,轴承运行前200个样本的JRD 值处于相对稳定状态,因此选择前200个样本计算健康阈值。分析可知,滚动轴承的寿命状态大致可以划分为5个阶段,分别为健康阶段、轻微退化、中度退化、严重退化以及失效阶段。轴承在编号前531 样本(前5 310 min)的运行过程中,JRD 值保持相对稳定状态,当运行到编号532个样本时(第5 320 min),JRD性能退化曲线开始升高,且此时JRD 数值超出了健康阈值,表明此时轴承的性能状态从健康阶段开始过渡到轻微退化阶段;当轴承运行到编号第700 个样本时(第7 000 min),JRD 性能曲线开始出现阶跃性的升高,表明滚动轴承的性能退化程度进一步加重,并且在运行到编号第701~783 个样本时(第7 010~7 830 min),JRD 性能曲线开始下降,导致下降的原因主要是轴承出现故障磨损到“自愈”的假象,因此可以定义此时轴承性能状态进入中度退化阶段;当轴承运行到编号第784个样本时(第7 840 min),轴承故障程进一步加深,JRD性能退化曲线开始出现往复波动,轴承已无法可靠工作,轴承性能进入严重退化阶段;当轴承运行到编号第906 个样本时(第9 060 min),轴承的性能急剧恶化,进入失效阶段,轴承已不能继续使用。

图2 轴承HTMFDE-JRD性能退化曲线Fig. 2 Performance degradation curves of HTMFDE-JRD

2.3 包络谱验证

为验证实验分析结果的准确性,分别对经SVD 降噪后的编号531,532,533 和700 样本数据进行包络谱分析,其结果如图3 所示。从图3(d)中可以明显看出与外圈故障频率接近的1 倍频231 Hz,2 倍频462 Hz,证明此时轴承发生外圈故障。观察图3(b)和图3(c),能够在故障频率附近依然有明显的倍频现象。相反在图3(a)的包络谱中,虽然能够发现231 Hz 的谱峰,但是其峰值较小,考虑是由部分噪声信号造成的,因此可认为此时的轴承性能依旧处于健康阶段。综上,可认为在轴承运行编号532 样本,即5 320 min 时为轴承性能开始退化的起始点,验证了结果的准确性及有效性。

图3 SVD降噪后的样本包络谱Fig. 3 Sample envelope spectrum after SVD denoising

2.4 退化指标的对比验证

为了进一步验证本文所提指标的准确性与优越性,对不同指标进行分析和比较,实验结果如下。

图4(a)是采用传统时域参数均方根(Root Mean Square,RMS)获得的性能退化曲线,根据所计算的健康阈值能够明显看出轴承在编号512个样本时发生误报警。在编号532 个样本(第5 320 min)开始退化,但是退化幅度不明显,这表明基于RMS 的性能退化曲线在健康阶段过渡到早期故障时期不够敏感,并且其对于轴承其他阶段的退化趋势描述也不够清晰,无法准确反映轴承退化的各阶段。

图4(b)是依照多尺度散布熵(Multiscale Dispersion Entropy,MDE)提取特征得到的JRD 性能退化曲线。从图中可知,轴承的性能退化曲线能够较清晰地描述轴承各阶段的退化趋势,但在编号523至525样本时发生多次误报警,并且识别出的退化起始点在编号535 样本处,相较于本文方法落后30 min。

图4(c)是依照层次散布熵(Hierarchical Dispersion Entropy, HDE)提取特征获取的JRD 轴承退化性能曲线。由图可知,HDE-JRD 曲线较好地描述轴承的退化趋势,但是轴承运行的前期多次出现误报警情况,且在轴承的早期故障识别中,检测出编号533(第5 330 min)轴承开始故障,相较于本文方法落后10 min。

图4 不同指标的退化曲线图Fig. 4 Performance degradation curves of different indicators

综合以上分析,本文所提方法相比基于传统指标RMS,以及通过MDE-JRD 和HDE-JRD 所获取的轴承退化曲线,在对故障的早期监测以及在描述故障发展的趋势一致性上都有较好的性能,验证了所提方法的准确性及优越性。表1给出了针对不同退化指标早期故障监测结果对比。

表1 不同退化指标监测结果Table 1 Monitoring results of different degradation indicators

3 轴承寿命状态识别

根据2.2 节的分析,将轴承全寿命周期数据划分为5 种寿命状态,如图5 所示,包括健康阶段、早期退化阶段、中期退化阶段、严重退化阶段以及失效阶段。采用重叠采样的方法制作数据集,各类状态样本数目为500,每个样本包含2 048 个数据点,共计2 500 组,其中80%用于训练,20%用于测试。

图5 轴承的5种寿命状态划分Fig. 5 Five life state divisions of bearings

3.1 ICNN模型结构参数

本文所建立的模型共计10 层,包括2 个多通道特征提取层,2 个卷积层,4 个池化层,1 个Dropout层,1 个Softmax 层。其中多通道特征提取层包含2 个不同尺度卷积通道以及1 个残差收缩模块。选用Adam 学习率优化算法来更新网络训练参数,将ReLU 作为激活函数,batch 为32,迭代循环60 次,Dropout 为0.2。提改进卷积神经网络模型的参数设置如表2所示。

表2 改进卷积神经网络识别模型的参数设置Table 2 Parameter setting of ICNN recognition model

其中第1 层卷积(1, 64, 1, 16)表示1×64 的大卷积核,步长为1,通道数为16。M-block1 代表第1个多通道特征提取层,其中包括2个不同尺寸卷积通道和1 个残差收缩模块。Conv2-1 表示第1 个卷积通道表示第1 层卷积核为1×1,步长为1,通道数为16,(1,1,1,16)和(1,3,1,16)表示2个并列卷积层,卷积核大小分别为1×1 和1×3,步长均为1,通道数为16。表示第1 个多通道特征提取层中残差收缩结构中的两层卷积,卷积核的大小均为1×4,步长为1,通道数为16。

3.2 ICNN模型抗噪性能验证

为了证明所提方法的准确性和抗噪性,本文通过控制不同变量获得了以下4组模型。具体设置如表3所示。

表3 不同变量的组合设置Table 3 Combination settings of different variables

表中模型A 为本文所提改进的卷积神经网络模型。模型A,B 用于验证双层多通道特征提取层的优势;模型A,C 用于验证残差收缩模块的优势;模型A,D 用于验证SENET 模块的优势。E模型为传统的卷积神经网络。为了验证改进方法的抗噪性能,在测试集中加入SNR=0~10 dB 的高斯白噪声,测试结果如表4 所示,所有结果均为5 次验证的均值。

从表4 中可得知,在无噪声、较低噪声SNR=10 dB 的环境下,所有模型都有较高的识别准确率,但是随着噪声的不断加强,B,C,D 和E 模型的识别准确率相较于低噪声环境下都有了较为明显的降幅,而本文方法在不同程度噪声环境下都有98%以上的识别正确率。将模型A 与模型B相比,本文方法在不同程度噪声下的平均准确率高于B 模型5.08%,结果表明采用多通道特征提取层可以有效提取丰富的细节特征,通过融合不同尺度下的特征,有效提高了模型的识别准确率以及在噪声环境下抗噪性能。将模型A 与模型C 相比,本文方法在不同程度噪声下的平均准确率高于C 模型1.57%,说明引入残差收缩块后,根据阈值的大小,使得输入的信号特征可以进一步实现噪声的滤除,有效提高了模型在含噪声数据集上的特征学习效果。将模型A与模型D相比,本文方法在不同程度噪声下的平均准确率高于D 模型1.8%,证明通道注意力的应用,减轻了无用信息对模型识别的负面影响,提高了模型的抗干扰能力。对于传统卷积神经网络模型E,当测试集的SNR 小于2 dB 时,其识别准确率已经低于70%,且在低噪声环境下的识别效果也与改进模型有较大差距,进一步证明了本文方法的抗噪性与准确性。综上,根据模型间的对比验证,表明本文所提改进卷积神经网络模型在不同的噪声环境下都有较好的识别性能。

表4 噪声环境下ICNN模型的识别正确率Table 4 Recognition accuracy rate of the ICNN model in noise %

4 泛化性实验

为了进一步验证本文方法的有效性,采用XJTU-SY滚动轴承加速全寿命数据集[22]进行泛化性实验。实验轴承型号为UER204,采样频率设置为25.6 kHz,每隔1 min 记录一次振动数据,持续1.28 s。本文选用实验后最终出现内圈故障的轴承2-1 和轴承3-3,以及出现外圈故障的轴承1-2 和轴承1-3进行验证。

4.1 基于退化指标的性能评估

图6 为轴承2-1,轴承3-3,轴承1-2 和轴承1-3基于HTMFDE得到的JRD指标的性能退化曲线。

通过4σ准则计算健康阈值,从图6 中可以发现轴承Bearing2-1 的早期故障起始点在编号452 样本时刻,此时JRD 值超出了健康阈值且有较大的幅值变化,可以认为此时轴承发生了早期故障。同理得出Bearing3-3,Bearing1-2 和Bearing1-3 的早期故障发生的起始点分别在编号339,36 和59样本时刻。

图6 XJTU-SY部分轴承退化状态曲线Fig. 6 XJTU-SY partial bearing degradation state curves

4.2 基于改进卷积神经网络的泛化性验证

本节将通过改进卷积神经网络来识别轴承的寿命退化状态,验证所提模型的泛化性能。

依据轴承的性能曲线分别将Bearing2-1,Bearing3-3,Bearing1-2 和Bearing1-3 划分为2,2,3 和3 种寿命状态,按照重叠采样的方法制作数据集,每种状态有500 个样本,每个样本包含2 048个数据点。Bearing2-1 的健康、故障状态样本编号为划分0~451,452~491;Bearing3-3 的健康、故障 状 态 样 本 编 号 划 分 为0~339, 340~371;Bearing1-2 的3 种寿命状态样本编号划分为0~36,37~79,80~161;Bearing1-3的3种寿命状态样本编号划分为0~59,60~135,136~158。将轴承数据分别输入改进卷积神经网络,在不同噪声环境下进行寿命状态识别。

由表5 可知,针对Bearing2-1 和Bearing3-3,在SNR=0~10 dB 的噪声环境下二分类状态下能够保证100% 的正确率。针对轴承Bearing1-3 和Bearing1-2,在SNR=0~10 dB 的噪声环境下三分类状态下,平均识别准确都有90%以上,有效地证明了所提方法的准确性和抗噪性。

表5 噪声环境下模型的识别正确率Table 5 Recognition accuracy rate of the model in noise %

5 结论

1) 通过数据验证了基于HTMFDE 特征获取的JRD 指标相较于RMS 等传统时域指标,具有更强的早期故障检测能力,且在描述轴承故障发展的趋势一致性上更好。

2) 所提出的改进卷积神经网络模型通过多通道实现特征的提取,引入残差收缩模块和注意力机制,有效提高了模型的特征学习能力。实验表明在SNR=0~10 dB 环境中,模型的平均识别正确率为98.5%,模型具有良好的准确性和抗噪性能。

3) 通过泛化性实验表明,所提指标在不同数据集都能够较好地评估轴承的退化状态,通过所提ICNN 模型进行寿命状态识别,结果表明在噪声环境中所提模型均有较好的鲁棒性。综上,本文所提方法能够可靠地实现轴承性能退化评估以及寿命状态的识别。

猜你喜欢
尺度寿命卷积
人类寿命极限应在120~150岁之间
基于3D-Winograd的快速卷积算法设计及FPGA实现
财产的五大尺度和五重应对
仓鼠的寿命知多少
从滤波器理解卷积
马烈光养生之悟 自静其心延寿命
基于傅里叶域卷积表示的目标跟踪算法
人类正常寿命为175岁
宇宙的尺度
9