结合CNN 和LSTM 的滚动轴承剩余使用寿命预测方法∗

2021-06-26 11:18王玉静李少鹏康守强谢金宝MIKULOVICH
振动、测试与诊断 2021年3期
关键词:趋势性频域时域

王玉静,李少鹏,康守强,谢金宝,MIKULOVICH V I

(1.哈尔滨理工大学电气与电子工程学院 哈尔滨,150080)(2.白俄罗斯国立大学 明斯克,220030)

引言

当前,滚动轴承广泛应用于众多旋转机械设备中,为保障设备的安全可靠运行发挥着重要的作用,一旦发生故障,将会导致一系列负面影响,比如延长停机时间、造成恶性事故等[1‐3]。因此,准确地预测轴承剩余使用寿命对旋转机械的预防性维修决策意义重大[4‐5]。现有的故障预测和健康管理方法可分为3 大类:基于物理模型方法、数据驱动方法和二者混合的方法[6]。其中,数据驱动方法根据历史传感器数据对退化特性进行建模,应用范围非常广泛,而深度学习[7]作为数据驱动方法的一种,已在各领域得到一定应用。

文献[8]提出一种时域和频域特征相结合的多轴承RUL 协同预测的集成深度学习方法,实验结果证明了该方法的有效性。文献[9]提出基于深度自编码器(deep auto encoder,简称DAE)的RUL 预测方法,通过提取时域、频域及时频域的联合特征,有效地描述了轴承退化过程,验证了方法的有效性。文献[10]将来自小波系数的峰值和均方根(root mean square,简称RMS)值输入到循环神经网络(recurrent neural network,简称RNN)模型中以达到预测轴承RUL 的目的。文献[11]提出将经验模态分解获得的固有模态函数能量熵之和作为状态特征,利用LSTM 网络进行机械状态单步预测,获得了良好的效果。CNN 在机械设备故障诊断领域中应用较为广泛,具有权值共享、卷积操作和空间池化等特性,能够挖掘大量数据中的深层特征。文献[12]通过构建特征矩阵训练CNN 故障诊断模型,分类效果优于自动编码器(auto encoder,简称AE)等方法。上述研究虽利用深度学习方法进行振动信号特征提取与RUL 预测,但均需人为预先进行较复杂的信号处理提取特征,未能发挥深度模型特征学习的特性。

构建预测健康指标方面,良好的健康指标能够全面反映滚动轴承的健康状况,描述滚动轴承的衰退过程。文献[13]提出一种选择加权融合指标反映轴承健康状况,用于滚动轴承RUL 预测。文献[14]采用主成分分析将多频率尺度模糊熵进行融合,构建滚动轴承性能退化评估指标。文献[15]利用改进后的限制玻尔兹曼机进行特征提取,再利用自组织映射将多个特征融合作为构建的健康指标。上述方法均可实现健康指标构建,但不同轴承之间失效阈值往往不同,通过实验或经验确定失效阈值存在盲目性的问题。文献[16]提出一种基于RNN 的健康指标,用于预测轴承剩余寿命,实验确定了不同轴承相同的失效阈值,验证了健康指标的有效性。LSTM 可有效克服RNN 的梯度消失或梯度爆炸问题,使模型具有学习到长期依赖信息的能力,有效地处理序列数据。然而,上述文献并未考虑到轴承存在性能退化渐变故障和突发故障两种模式。因此,针对两种故障退化模式问题,提出适应两种退化模式的方法变得尤为关键。

综上,笔者提出一种结合CNN 和LSTM 构建趋势性量化健康指标预测滚动轴承RUL 的方法。首先,将FFT 所得的频域幅值信号进行归一化处理后作为CNN 的输入,自主挖掘深层特征,避免了传统算法需要专家大量经验的弊端;其次,利用LSTM 对时间信息序列具有良好学习能力的特性,构建趋势性量化健康指标,从而进一步预测滚动轴承的RUL。

1 相关深度学习理论

1.1 卷积神经网络

CNN 是由多个卷积层和多个池化层堆叠而成。单层CNN 网络由2 层组成:1 个卷积层和1 个池化层,可直接处理原始输入序列。如图1 所示,每层CNN 包含若干个大小一致的卷积核及同一类型的池化函数。首先,卷积核遍历整个输入序列数据,产生更高层、更抽象的特征空间;其次,池化层压缩每个生成的特征进行二次特征提取、降维,选取较高层次的重要特征;最后,产生新的序列特征作为下一个卷积层、池化层的输入。卷积层和池化层的具体运算过程如下。

图1 一维CNN 示意图Fig.1 The diagram of 1D CNN

1)卷积层:以卷积核窗口大小滑动选取部分数据进行计算,卷积的结果即为特征图。通常一个卷积层有多个卷积核,会产生多个特征图,且同一卷积核的权值共享。这一特性减少了网络连接的数量,降低模型复杂度,并降低系统内存开支。具体卷积层运算如式(1)所示

其 中:W为卷积窗口尺寸大小为 第l层的第i个卷积核的第j′个权值为第l层中第j个局部感受域。

另外,选取常用ReLU 激活函数对卷积输出的logits 进行非线性变换,可提高网络稀疏性,减少网络过拟合问题。具体表述如式(2)所示

其 中:yl(i,j)为卷积层输出 值;al(i,j)为激活函数输出值。

2)池化层:此层主要进行降采样操作,可达到网络参数减少的目的。池化函数一般分为3 种,而最大池化函数能提升细微差别信息,故最常用的就是最大值池化,其数学描述如式(3)所示

其中:V为池化区域宽度;pl(i,j)为池化层输出值;al(i,t)为激活值。

1.2 长短时记忆神经网络

LSTM 网络是RNN 的一种变体。LSTM 网络区别于其他网络的原因是在网络结构中引入记忆单元,有效克服了梯度消失问题,并解决了RNN 无法学习长期依赖问题。LSTM 记忆单元如图2 所示,通过3 个“门”的作用控制时间序列中信息的流动,从而更好地捕获序列中的长期依赖信息,有效地处理序列数据。更新步骤如下。

图2 LSTM 记忆单元结构Fig.2 The structure of LSTM memory units

2)计算输入门的值it。输入门控制当前数据输入对记忆单元状态值的影响

3)计算遗忘门的值ft。遗忘门控制历史信息对当前记忆单元状态值的影响

4)计算当前时刻记忆单元状态值ct

其中:⊗为逐元素相乘操作。

由式(7)可知,记忆单元状态更新由遗忘门控制计算出要丢弃的信息和输入门调节信息的更新。

5)计算输出门的值ot。输出门主要作用控制信息输出

6)LSTM 单元记忆输出ht为

其 中:ht-1为前一时刻的输出;Wxc,Wxi,Wxf,Wxo分别为在时刻t的输入层xt和隐藏层记忆单元、输入门、遗忘门及输出门间的权重值;Whc,Whi,Whf,Who分别为隐藏层在时刻t-1 与时刻t之间记忆单元、输入门、遗忘门及输出门的权重值;bc为记忆节点偏置;bi,bf,bo分别对应3 个乘法门的偏置向量;σ为sigmoid 函数,取值为0~1。

2 滚动轴承RUL 预测方法及流程

滚动轴承通常存在性能退化渐变故障和突发故障两种模式。笔者通过对滚动轴承振动信号的分析,以及结合CNN 与LSTM 的各自优势,进行深层特征自主挖掘并构建趋势性量化健康指标,刻画轴承退化趋势,实现滚动轴承RUL 的预测,流程框图如图3 所示。

图3 剩余寿命预测方法的流程图Fig.3 Flow chart of the RUL prediction method

具体流程操作如下。

1)选取不同工况运行条件下部分滚动轴承的原始时域振动信号数据作为训练集,并利用FFT 变换将其转换为频域信号。

2)对数据集中每个样本的频域信号作最大最小归一化处理,使结果映射到0~1 之间,将其作为特征输入,寿命百分比为模型输出。模型进行有监督训练,输入输出标记形式为,其中:xt∈RN×1表示某工况某轴承在当前时刻下的N维输入特征向量;yt∈[0,1]为对应当前时刻的寿命百分比值。

3)设置CNN 中的超参数,将步骤2 归一化后的频域信号作为CNN 的输入,运用CNN 中的核心公式(1)~(3)充分提取时域振动信号所包含的内在特征,挖掘深层特征。

4)将深层特征输入到LSTM 网络中,利用LSTM 网络中的核心公式(4)~(9)及记忆单元结构独有的特性,经LSTM 网络输出获取趋势性量化健康指标,建立模型。

5)对测试集中非全寿数据作预处理,得到归一化后的频域幅值信号,输入到所建模型中获取趋势性量化健康指标。为降低振荡对预测结果的影响,减小预测误差,采用移动平均法(moving average,简称MA)对获取的健康指标进行平滑处理[17]。

6)利用多项式曲线[18]拟合方法对性能退化趋势进行拟合,并通过与阈值交点所对应的时刻对轴承RUL 进行预测。

3 应用与分析

3.1 实验数据

实验所用滚动轴承加速寿命数据是由PRO‐NOSTIA[19]试验台获取的,分别由水平方向和垂直方向两个加速度传感器进行数据采集,每10 s 记录1 次数据,每次保存0.1 s,采样频率为25.6 kHz,即每次采样振动数据为2 560 点。加速传感器共采集3 种工况下17 组滚动轴承全寿命数据:工况1(1 800 r/min 和4 000 N)轴承1_1 至轴承1_7 共7组;工况2(1 650 r/min 和4 200 N)轴承2_1 至轴承2_7 共7 组;工况3(1 500 r/min 和5 000 N)轴承3_1至轴承3_3 共3 组。

3.2 滚动轴承RUL 预测

实验先对数据集进行划分,选取不同工况下的前2 组轴承数据,即工况1 条件下的轴承1_1 和轴承1_2,工况2 条件下的轴承2_1 和轴承2_2,工况3条件下的轴承3_1 和轴承3_2 共6 个不同轴承数据作为训练集用于模型训练,其余11 个不同轴承作为测试集。

实验对3 种工况下17 组轴承数据分别作FFT变换,将时域信号转化为频域幅值信号。以轴承1_3为例,0.1 s 采集时间段内的某一样本时域振动信号及相应的归一化频域幅值信号如图4 所示。

图4 轴承1_3 某一样本的时域及频域信号波形图Fig.4 The time domain and frequency domain signal waveform of a sample of the bearing 1_3

将频域预处理所得归一化的频域幅值信号作为输入,利用CNN 进行深层特征提取,再结合LSTM对时间信息序列具有良好学习能力的优点,进行特征与标签间的映射,构建趋势性量化健康指标,进而预测轴承RUL。经大量实验,该网络模型主要由以下几个部分组成:5 个卷积层、5 个池化层、3 个LSTM 层,其中激活函数选用ReLU。加入dropout防止过拟合,dropout 比率是被设为0 的特征所占的比例,通常在0.2~0.5 范围内,经多次实验设置为0.5。为提高模型计算效率,实验选取尺寸大小为128 的小批量样本进行训练。在多层CNN 中,采用一维卷积核。

在不同工况运行条件下,轴承运行状态可能存在两种故障模式。为进一步说明,以轴承1_3、轴承2_6 为例,分别对2 组轴承整个寿命周期内的时域振动信号作图分析,如图5、图6 所示;并分别求取各自的时域特征RMS 值,如图7、图8 所示。

图5 轴承1_3 时域波形图Fig.5 The time domain waveform of the bearing 1_3

图6 轴承1_3 原始振动信号均方根值Fig.6 The RMS results of original vibration signal of the bearing 1_3

图7 轴承2_6 时域波形图Fig.7 The time domain waveform of the bearing 2_6

图8 轴承2_6 原始振动信号均方根值Fig.8 The RMS results of original vibration signal of the bearing 2_6

由图5 和图7 可知,不同工况下的轴承在运行过程中退化状态不一。轴承1_3 的时域振动信号幅值随运行时间的推移而增长,其整体退化趋势表现为缓慢渐变的特点。轴承2_6 在刚开始运转阶段较为平稳且时域信号幅值稳定,但在运行后期幅值剧烈变化出现跳变。同时,图6 表明轴承1_3 的RMS 值缓慢变化,较好地反映轴承在运行过程中的退化状态;而图8 轴承2_6 的RMS 变化特点为先波动后平稳,直到6 870 s 左右才出现跳变。由此可知,在载荷和转速以及操作环境等不同条件下,滚动轴承的运行状态不再是单一故障模式,可能会出现两种故障模式,一种是性能退化渐变故障,另一种是突发故障。

为直观表明滚动轴承的运行状态在出现两种故障模式情况下,所提方法能够同时解决这两种情形,以轴承1_3 和轴承2_6 的当前数据进行验证,获取的健康指标分别如图9、图10 所示。与图6、图8 相比可看出,无论是性能退化渐变故障还是突发故障模式,所提出的趋势性量化健康指标均能反映轴承运行过程中的退化趋势,其整体具有良好的单调趋势性,且对滚动轴承早期运行退化状态表现更为敏感,并存在局部振荡现象。因此,实验利用MA 平滑滤波消除振荡对健康指标的影响。

图9 轴承1_3 趋势性量化健康指标Fig.9 Trend quantification health indicators of the bear‐ing 1_3

图10 轴承2_6 趋势性量化健康指标Fig.10 Trend quantification health indicators of the bearing 2_6

使用6 倍交叉验证法对训练集全寿命数据进行交叉验证实验,得到训练集6 个轴承的健康指标如图11 所示,即从训练集中随机选取5 个轴承的全寿数据用作模型训练,剩余任意的一个轴承数据作为验证集进行验证,如此反复进行6 次实验。从图11可以看出,在初始时刻不同轴承的健康指标都具有相同的初始值0,随着运行时间的推移,轴承的退化趋势越来越明显,整体趋势具有一定的单调性,且在失效时刻不同轴承的健康指标值都近似等于1。趋势性量化健康指标的实质是滚动轴承的使用寿命百分比值,即当前时刻与全寿命周期的比值,因此可将失效阈值确定为1,解决了轴承失效阈值不一的问题。针对滚动轴承每一时刻的状态,得到表征状态为0~1 间的量化值,达到量化效果。

图11 6 个轴承趋势性量化健康指标Fig.11 Trend quantification health indicators of six bearings

为验证所提方法构建的趋势性量化健康指标对于提高寿命预测精度发挥了重要作用,建立多项式曲线拟合模型,该模型可用于曲线拟合、预测轴承的性能退化趋势。笔者选取三次多项式拟合曲线,其公式为

其中:y为轴承状态值;t为运行时间;a,b,c,d为多项式待定系数。

通过式(10)得到当前时刻t之后的退化状态,当退化状态值达到阈值1 时,求取阈值对应时刻t',即为失效时刻,此时计算两者之差可求得剩余寿命tr

其中:Z(t)为轴承历史运行状态。

经过式(11)求出RUL 之后,利用寿命百分比误差评估模型性能的好坏,如式(12)所示

其中:Ai和Fi分别为第i个测试数据的实际RUL 和预测的RUL。

利用轴承1_3 及轴承2_6 的部分数据构建的趋势性量化健康指标如图9、图10 所示,在此基础上再进行RUL 预测,2 组轴承所得预测结果分别对应图12、图13。其中:点线为模型输出经平滑后的健康指标退化趋势;虚线为对点线的拟合;粗实线为多项式预测的性能退化趋势;细实线为真实的性能退化趋势;失效阈值为1。

图12 轴承1_3 RUL 预测Fig.12 RUL prediction of the bearing 1_3

图13 轴承2_6 RUL 预测Fig.13 RUL prediction of the bearing 2_6

已知数据集中轴承1_3 的当前寿命为18 010 s,预测的失效时刻为22 750 s。图12 中清晰可见2 条竖直虚线分别对应当前时刻和失效时刻寿命,由式(11)计算得到RUL 预测值为4 740 s,而真实剩余寿命为5 730 s,由式(12)可计算其预测误差为17.28%。从图12 可以看出,轴承1_3 的趋势性量化健康指标围绕真实寿命百分比上下波动,与真实寿命百分比偏差较小,表明所提方法在性能退化渐变故障模式下RUL 预测较为准确。已知轴承2_6 在当前时刻寿命为5 710 s,预测失效时刻为7 180 s,对应各自时刻均在图13 中已标注显示。由式(11)计算轴承2_6 的RUL 预测值为1 470 s,而已知轴承2_6 的真实剩余寿命为1 290 s,故由式(12)可计算其预测误差为-13.95%。尽管轴承2_6 由正常工作至故障发生为突发故障,但通过本研究所提方法获取轴承2_6 的健康指标依然具有趋势性,且预测误差较小,更加表明该方法的有效性。

将预测结果与所用相同数据集的文献[16]和文献[20]比对,所得结果如表1 所示。通过与文献[16]对比发现,除滚动轴承1_5、轴承1_6 和轴承2_4 这3 个不同轴承预测误差高于文献[16]外,其余8 个不同轴承的预测误差均低于文献[16];同时相比于文献[20]除滚动轴承1_6 外,其余10 个不同轴承的预测误差均低于文献[20]。从寿命百分比误差均值角度来看,所提方法的误差均值为22.10%,其性能优于文献[16]与文献[20]。在两种故障模式共存情况下,实验结果验证了所构建的趋势性量化健康指标对RUL 预测的有效性。

表1 RUL 预测结果Tab.1 RUL prediction results

4 结论

1)采用频域预处理,将FFT 变换提取的频域幅值信号进行最大最小值归一化,再将其输入到CNN 中,提取局部内在信息,进而挖掘深层特征,避免了传统算法需要专家大量经验的弊端。

2)将深层特征输入到LSTM 网络中,结合LSTM 网络对时间信息序列具有自主学习能力的优点,构建趋势性量化健康指标。经平滑滤波减少振荡对健康指标的影响,使得健康指标退化趋势更加平滑,并确定了失效阈值。

3)对于滚动轴承存在性能退化渐变故障和突发故障两种模式,所提方法均可反映轴承运行过程中的性能退化趋势,预测结果接近真实寿命值。实验结果表明,所提方法百分比误差均值为22.10%,低于其他两种方法。

4)所提方法对滚动轴承其他同类故障的适用性,仍需对实际大量轴承振动信号进行深入研究。为进一步降低预测误差,也将从迁移学习的角度进行研究,进一步提高滚动轴承RUL 预测的准确度。

猜你喜欢
趋势性频域时域
大型起重船在规则波中的频域响应分析
农产品流通竞争力的趋势性和区域分异性
基于时域信号的三电平逆变器复合故障诊断
频域稀疏毫米波人体安检成像处理和快速成像稀疏阵列设计
基于M—K方法及成分提取的海洋表层热状分析
基于极大似然准则与滚动时域估计的自适应UKF算法
基于改进Radon-Wigner变换的目标和拖曳式诱饵频域分离
基于时域逆滤波的宽带脉冲声生成技术
基于频域伸缩的改进DFT算法
基于时域波形特征的输电线雷击识别