基于CNN-LSTM的机床滚动轴承性能退化趋势和寿命预测

2024-05-07 09:12:44姜广君杨金森穆东明
机床与液压 2024年6期
关键词:寿命轴承卷积

姜广君 ,杨金森 ,穆东明

(1.内蒙古工业大学机械工程学院,内蒙古呼和浩特 010051;2.内蒙古自治区先进制造技术重点实验室,内蒙古呼和浩特 010051)

0 前言

滚动轴承是机床主轴中最常见和极其重要的关键部件[1]。因此,监测滚动轴承的运行状态,预测其剩余使用寿命并确定最佳维护点具有重要意义,可为决策者制定维护计划提供支持。预测滚动轴承剩余使用寿命的方法主要有3种:基于模型的方法、数据驱动的方法和混合方法[2]。基于模型的方法需要大量的专业知识和先验知识,不仅浪费时间和人力,而且不具有通用性。研究数据驱动的剩余使用寿命预测方法以实现轴承的准确RUL预测是当前的热点。

近年来,计算机技术发展迅猛,深度学习已经在多个领域获得了极大的成果,如健康管理、故障预测等。深度学习方法能够很好地进行非线性拟合,通过轴承的初始信号预测轴承寿命,无需人工干预即可自动提取特征,避免了效率低、主观性强、过度依赖人工特征提取先验知识等问题。由于单时域和频域特性的不完备,整合多个指标表征轴承性能下降趋势成为近年来的研究热点[3]。周福娜等[4]利用主成分分析 (Principal Component Analysis,PCA)技术,通过将高维态故障特性转换成一维状态,利用深度神经网络(Deep Neural Network,DNN)和非线性拟合法,建立系统的剩余寿命预测模型;王佳瑜[5]对BP网络进行改进,并取得相应的效果;邹旺等人[6]利用 人工神经网络(Artificial Neural Networks,ANN)进行特征选择,利用支持向量机对轴承剩余寿命进行了预测,并对它进行了可靠性分析;REN等[7]采用了基于深度神经网络的滚动轴承寿命预测方法,试验结果表明:该方法具有良好的应用前景。由于单时域的频域特性不够完整,因此,采用多种指标综合反映轴承的性能退化,是目前国内外研究的重点[8]。LI等[9]提出了一种新的、基于灰色径向基函数(Radial Basis Function,RBF)神经网络的剩余寿命模型,其预测效果优于常规 BP神经网络;CHEN等[10]利用多重灰色 RBF混合模型,对工业设备的剩余寿命进行了预测,从而有效地提高了预测的准确性;YANG等[11]采用极限学习机 (Extreme Learning Machines,ELMs)方法建立了剩余寿命模型,并与 BP网络进行对比,发现该模型具有更快的训练速度;李华新、王衍学[12]为改善预测的准确性,提出了一种层次稀疏编码模式;杨宇等人[13]提出了一种基于自下向上的分层无监督贪婪算法的全参数动态学习方法,并利用自上向下的监督学习算法对整个网络参数进行调整;张西宁等[14]针对传统的初始化值易陷入局部最优的情形,提出利用卷积自编码算法进行改进;XU等[15]将从多变量时间序列中提取的时域特征输入到长短期记忆中,以预测剩余使用寿命,并获得了更准确的结果。MA、 MAO[16]提出了一种基于卷积的长短时记忆神经网络 (Convolution-based Long Short-Term Memory,CLSTM),通过对LSTM状态转换执行卷积运算来预测旋转机械的剩余使用寿命(Remaining Useful Life,RUL)。PANKAJ等[17]利用高维信息监测预测设备,并使用长短期记忆神经网络构建HI指数,以实现寿命预测。

为了克服人为因素的干扰,在实现各网络的互补优势及 RUL特征提取的同时,也实现端到端的健康诊断,本文作者利用 CNN-LSTM建立滚动轴承RUL模型。该方法采用原始的振动信号,由CNN进行特征信息提取,LSTM进行剩余寿命的预测。

1 研究方法

1.1 卷积神经网络

CNN是近年来在深度学习领域中应用最为广泛的一个研究热点,该方法可以从局部特征中抽取特征构建稠密、完备的特征矢量。CNN的典型结构包括:卷积层、全连接层、输入层、输出层以及池化层。在 CNN中,卷积层采用分享局部视角和分享权重的概念,通过平滑滤波器产生一组特征图,然后通过池化层对特征图进行压缩,从而减小特征维度,减少模型参数。而所采用的池化方式主要分为2种,分别是最大池化法及平均池化法。

CNN网由三大部分构成:卷积层、池化层和全连接层。在此基础上,采用权值共享原则极大地降低了模型的参数量。同时,使用池化层来合并相似特征,进一步缩小了训练的数据量。此外CNN网络还具有局部连接、权值共享和空间池化三大优势。因此文中选取CNN网络作为特征提取的基本网络。

卷积层能够在一定程度上完成局部连接,并能实现共享权重。卷积层由一系列卷积核组成,在展开特征提取时,其核心是卷积核。一般情况下,在2个连续的卷积层间会增加一个池化层,该池化层可以用一个非线性下取样的方式来获得某一邻近区域卷积层的输出,提高运算效率,并且使该特性表达具有平移不变性。目前最常用的是平均池化法、最大池化法等,文中主要采取后者。经过CNN模型操作后,网络会输出退化特征值,将特征值铺平,然后采取全连接层来学习特征到轴承RUL之间的映射。

1.2 长短时记忆神经网络

滚动轴承出现退化情况是一种逐渐积累、持续发展的过程,其状态的改变与实时监控数据以及历史时刻的监控数据密切相关。循环神经网络是一种能够综合考虑当前和历史阶段的记忆信息并进行预测的记忆网络,有效地解决了传统神经网络不能充分利用历史信息数据的问题。RNN看成一个网络的多重拷贝,其循环结构如图1所示。其中:(x0,x1,…,xt)为输入序列信息;(h0,h1,…,ht)为对应时刻的状态向量;每一层神经网络中的记忆细胞由A表示。一层RNN由输入层、隐藏层及状态层组成。RNN有一定的记忆能力,但其存在训练困难、梯度扩散、梯度爆发等缺点,使得 RNN不能很好地解决长时间依赖性问题。

图1 循环神经网络结构

为了更好地提取状态监测数据中时间序列的信息,文中对传统RNN网络进行改进,在该模型的建立过程中使用了 LSTM网络。LSTM网络的隐藏层采用长时存储模块,其中存储模块由3个控制阈值和1个细胞结构构成。从图2可以看出:矩形方框表示记忆细胞,细胞上的水平线传递细胞状态;ft、it、ot分别为遗忘门、输入门和输出门。

图2 长短期记忆神经网络结构

LSTM网络层以训练样本滑动窗口的特征序列为输入,在经过多层LSTM网络后,连接一个全连接层。第n层LSTM网络的第t时刻循环神经元状态如下所示:

(1)

(2)

(3)

最后一层LSTM网络的输出为

(4)

在长期和短期的记忆神经网络中,利用基于时间的反向传播(Back Propagation Through Time,BPTT)算法训练,并在时间维度上反向传递。通过训练能够对时序数据进行特征提取,反映出时间域内的轴承退化过程,因而能较好地预测出目前时刻以后的时间序列。

2 模型构建

基于CNN-LSTM方法的滚动轴承寿命预测主要分为4步。第一步,数据获取。采集所需的轴承全寿命振动数据,为后续所搭建的剩余寿命预测模型提供数据基础。第二步,退化阶段划分。由于正常阶段的数据无退化,所以正常阶段的数据无需进行剩余寿命预测,因此文中采取了相对均方根值(Relative Root Mean Square,RRMS)来进行退化阶段划分,该指标不仅消除了不同轴承退化过程之间的差异,还能设置较为合理的退化阈值。第三步,搭建CNN-LSTM模型。首先将轴承振动信号输入到CNN模型中,进行振动信号的降维与特征提取,获得轴承振动信号的空间特征;其次,采取LSTM模型,通过挖掘轴承的时域特性得到其时域特性;最后,采取全连接层实现特征到剩余寿命标签的映射。接下来对文中方法进行详细介绍。

(1)数据获取。由于轴承的正常退化是一个长周期的过程,所以很难得到完整运行过程的数据,为了较快地得到轴承退化寿命数据,只能通过加速寿命实验的方法获得轴承退化数据。

(2)退化阶段划分。针对轴承退化阶段划分,选择一个敏感的以及能反映全局退化趋势的退化指标是阶段划分的重要内容。目前多数学者采取均方根值指标RMS作为退化阶段划分的依据,因为RMS指标对轴承退化全局性具有很好的描述效果。其计算公式如下:

(5)

式中:x(i)表示振动信号序列,i表示数据点。

国际标准ISO 2372规定当机械振动信号的均方根值达到2.0~2.2g时,设备处于危险状态。但不同的轴承即使在相同的工况下,也会由于轴承自身材料问题及加工工艺误差等缺陷造成各轴承退化过程出现较大的差距,使国标规定的失效条件的实用性变差。为了消除不同轴承采取相同阈值进行阶段划分引起的误差,文中选取相对均方根值RRMS进行退化阶段划分。此指标选择轴承当前的RMS值与RMS的平均值进行对比得到相对均方根值,来消除不同轴承均方根值的相对差值。其计算公式如下:

(6)

(7)

其中:δRMS,norm为正常阶段的均方根值。为了减少随机因素对RMS指标的影响,对其进行滑动平均提取主趋势,其滑动窗口选取30。在计算相对均方根值时,由于新轴承使用时会存在磨合期,所以文中选取50~200的150个δRMS进行正常阶段RMS的计算,即K取150。文中选取轴承正常阶段与退化阶段的划分阈值为1.1,因为正常阶段RRMS几乎处于平稳状态。

搭建的CNN-LSTM剩余使用寿命模型如图3所示。LSTM网络可以获取长时间监控数据的状态,然而轴承目前的状态与输入特性、前一时刻的状态和后一时刻的状态密切相关。为此,文中提出了一种基于双向的、长短期的记忆网络,将前一时刻、后一时刻状态和当前输入特征相结合,建立了一种具有端对端CNN-LSTM的混合模型,具体的结构模型如图3所示。此模型的构成内容包括2个方面:(1)CNN的特征提取。首先是对异常值进行归一化等预处理并输入到网络模型中,然后通过平面层对所抽取的特征进行时间序列重构,并通过平面层对所抽取的特征进行时间序列重构;(2)LSTM模型的训练和预测,其主要功能是把前一阶段的特征信息输入到模型中,然后利用时间序列编码学习对隐藏在数据中的时序关联特征进行逐层挖掘,获取隐藏在数据中的时序相关性,再利用模型迭代法对网络参数进行调整,以获得最佳的性能。

图3 CNN-LSTM网络结构

3 案例分析

3.1 数据集介绍

文中采取的数据集是来自IEEE 2012 PHM资料挑战赛中的滚动轴承加速退化数据集[18]。在展开验证的过程中,轴承转速保持在1 500~1 800 r/min。加速度计固定在轴承的外圈上,并捕捉轴承水平与垂直2个方向的振动信号。采样频率为25.6 kHz,每个样本包含2 560个数据点,即0.1 s,每10 s重复采样一次。实验数据集包括3种工况下的轴承振动数据,工况一与工况二共获得7个实验轴承全寿命振动数据,工况三获得3个实验轴承全寿命数据。其工况与数据编号如表1所示。

表1 工况与数据编号

3.2 数据预处理

对其轴承数据进行处理,得出其各退化阶段划分结果如表2所示,以轴承1-1为例,求解流程如图1所示。为了验证文中所提方法的有效性,选择轴承1-1的第1 430个采集数据进行包络谱分析,如图4所示。可以看出:在包络谱中可以清楚地看到接近168 Hz的轴承内圈故障特征频率,因此轴承在1 436次采集的数据中已经出现了内圈故障。

表2 三个工况下轴承划分情况

图4 轴承1-1退化阶段划分

文中采取工况一、工况二、工况三下的轴承进行实验,3个工况下轴承退化数据描述如表2所示。

为了评价轴承RUL预测的性能,选择均方根误差RMSE与平均绝对误差MAE作为评价指标。δMAE、δRMSE计算公式如下:

(8)

(9)

以工况一轴承为例,为了使网络模型达到最优的预测效果,文中采用多次实验的方法来进行网络超参数以及网络结构的设计,最终选取超学习率为0.01,批大小为64,迭代次数为20,损失函数为均方根值,优化器为Adam优化器。网络结构采用2层卷积池化层来进行特征的初提取,卷积核大小为3;采用2层LSTM网络结构,单元个数为1 000。以轴承1-1作为训练集,轴承1-2、1-3、1-5、1-6、1-7为测试集。

整体预测效果如表3所示,在各轴承均具有较小的预测误差。以工况一轴承1-3为例,对它进行剩余寿命预测可视化,轴承1-3的预测效果如图5所示。可知:网络模型几乎可以完全预测轴承的最终失效寿命,在轴承的初始退化阶段以及最终退化阶段都取得了不错的效果。

表3 轴承剩余寿命预测效果

图5 轴承1-3预测效果

3.3 对比实验

为了突出文中所构建方法的优势,以CNN、LSTM网络为对比模型,RMSE为评价指标,其余参数保存一致,预测效果如表4所示。

表4 不同模型的RMSE

由表4可知:文中方法预测效果优于CNN与LSTM模型。其中在5个测试轴承中,除轴承1-2的预测效果略差于LSTM网络,其余预测效果均为最优预测值。由于轴承1-2属于突发性故障,与训练集样本差异较大,且空间特征不明显,因此CNN与CNN-LSTM的效果不如LSTM。

4 结论

针对轴承剩余寿命预测精度差、不能同时提取空间特征与时间特征的问题,文中构建了一种基于CNN-LSTM的轴承剩余寿命预测方法。该方法首先采用RRMS进行退化开始点的识别,丢弃无故障的数据,提高了网络的训练速度;然后提出一种CNN组合LSTM的网络模型框架,在实现空间特征提取的同时可挖掘振动信号中的时间序列特征;最后采用PHM 2012轴承数据集进一步检验,并将它与CNN、LSTM模型相比较,结果表明:文中方法在多个测试轴承上表现出较好的效果,显著提高了轴承剩余寿命的预测精度。

猜你喜欢
寿命轴承卷积
轴承知识
哈尔滨轴承(2022年2期)2022-07-22 06:39:32
轴承知识
哈尔滨轴承(2022年1期)2022-05-23 13:13:24
人类寿命极限应在120~150岁之间
中老年保健(2021年8期)2021-12-02 23:55:49
基于3D-Winograd的快速卷积算法设计及FPGA实现
轴承知识
哈尔滨轴承(2021年2期)2021-08-12 06:11:46
轴承知识
哈尔滨轴承(2021年1期)2021-07-21 05:43:16
仓鼠的寿命知多少
从滤波器理解卷积
电子制作(2019年11期)2019-07-04 00:34:38
马烈光养生之悟 自静其心延寿命
华人时刊(2018年17期)2018-12-07 01:02:20
基于傅里叶域卷积表示的目标跟踪算法