基于SMA-LSTM的轴承剩余寿命预测方法

2022-05-16 10:51臧传涛刘冉冉颜海彬
江苏理工学院学报 2022年2期
关键词:特征向量轴承振动

臧传涛,刘冉冉,颜海彬

(江苏理工学院 汽车与交通工程学院,江苏 常州 213001)

随着现代制造业生产力和电子信息技术水平的快速提升,机械设备正朝向高集成化、智能化、数据化方向发展。作为具有高传动效率而被广泛使用的机械零件,滚动轴承的运行质量是旋转机械能否正常运转的前提,因此,对轴承进行剩余使用寿命(Remaining Useful Life,RUL)预测极为重要。现阶段,轴承剩余寿命预测的重点是预测模型的选取,普遍使用的主要有基于物理分析、统计学分析及人工智能的三类轴承剩余寿命预测模型。

传统的轴承剩余使用寿命预测模型主要为物理、数学模型。Luca Quagliato等人[1]提出一种利用加速度测试和建立有限元数值模型对轴承寿命进行预测的方法。贾磊等人[2]通过对调心滚子轴承载荷进行计算,分析了齿轮推力和温度对轴承寿命的影响。上述模型虽然计算简单,但轴承实际运行工况复杂,易受到噪声等因素的影响,且建立的预测模型很难推广到其他工况下,模型泛化能力差。

基于统计学的预测方法主要有回归预测和时间序列预测等。Gao等人[3]利用线性回归模型对轴承性能进行预测。王萌[4]使用逻辑回归模型实现了对轴承退化情况的评估。基于统计学的预测模型虽然具有模型参数识别简单、实时性好等优点,但上述模型多用于处理简单的问题,对于拥有复杂退化特征的轴承RUL预测效果往往欠佳。

人工智能技术的出现,使得智能化预测成为轴承剩余寿命预测的主流方法[5]。Ren等人[6]提出了一种基于深度卷积神经网络的方法预测轴承RUL,并与支持向量机结果进行对比,证明其有效性;但文中关于特征提取的方法较为简单,并不能很好地提取到有效的故障特征。王奉涛等人[7]提出一种基于长短期记忆(Long Short-Term Memory,LSTM)的轴承RUL预测模型,并将预测结果同反向传播(Back Propagation,BP)神经网络和支持向量回归机(SVRM)进行对比,验证了方法的有效性。虽然LSTM在轴承寿命预测方面得到广泛应用,但仍存在以下两个问题:(1)LSTM的学习率、隐藏层单元数等需要人为选择;(2)直接使用归一化后的剩余寿命时间作为训练标签,轴承退化趋势的随机性将会大概率造成神经网络的过拟合现象[8]。目前,常见的LSTM优化算法有遗传算法、粒子群算法等。Cao等人[9]利用遗传算法(Genetic Algorithm,GA)对LSTM的超参数进行寻优,Gundu Venkateswarlu等人[10]使用粒子群算法(Particle Swarm Optimization,PSO)对LSTM的超参数进行自动寻优,均取得了一定的效果,证明了通过优化算法能够提高深度学习预测模型的性能和精度,但上述优化算法易陷入到局部最优状态。

黏菌算法(Slime Mould Algorithm,SMA)是我国学者李世民于2020年新提出的一种群智能优化算法。SMA原理简单,需要确定的参数少,它使用自适应权重来模拟基于生物振荡器的黏菌传播波产生正反馈和负反馈的过程,从而在许多优化问题上可以实现快速收敛。此外,由于具有动态结构,其可以在全局和局部搜索漂移之间保持稳定的平衡,因此,在防止陷入局部最优的同时又具有很强的局部搜索能力[11]。刘通[12]利用SMA在医学领域学习机优化方面取得了较好的效果。

基于上述分析,本文拟选用基于LSTM的轴承剩余寿命预测方法,实现对轴承RUL的预测。针对其超参数选取困难、遗传算法和粒子群等常见参数优化算法容易出现局部最优、模型的泛化能力差等缺陷,利用SMA对LSTM中的学习率、训练次数、隐藏层神经元数目进行优化。(1)利用变分模态分解(Variational Modal Decomposition,VMD)对振动信号降噪,将降噪后的振动信号提取出15类时域、频域特征向量,并通过主成分分析(Principal Component Analysis,PCA)对特征向量进行降维,筛选出能够有效代表轴承故障特性的特征向量;(2)轴承的退化过程同时间相关成线性变化[13],为减小模型的过拟合现象,提高模型的泛化能力,由此构建退化系数;(3)利用SMA对LSTM预测模型中的超参数(如训练次数、隐藏层神经元数目、学习率)进行自动寻优,并使用超参数优化后的LSTM模型对退化系数进行预测,进而实现轴承RUL的预测。

1 理论基础

1.1 VMD原理

VMD是美国学者Konstantin Dragomiretskiy于2014年提出的自适应分解方法[14],赵昕海等人[15]已将其成功应用于振动信号的降噪。VMD首先对原始信号的特征划分频带;然后,连续更新各模态分量及其对应的中心频率;最后,根据约束条件将原始信号自适应分解,并对分解的模态分量进行重构,从而完成对信号的降噪。

1.1.1 变分模型的构造

通过高斯平滑处理得到约束变分模型:

其中:δ(t)表示脉冲函数;k=1,2,…,K;K的值通过中心频率确定;uk(t)为第k个模态分量;ωk为uk(t)的中心频率;f(t)为原始输入信号;‖⋅‖2为2的范数;∂t为对t求偏导。

1.1.2 变分模型的求解

为了求解构造的变分模型,在此引入增广拉格朗日公式:

其中:α为惩罚因子;〈⋅,⋅〉为内积运算;λ(t)为拉格朗日乘法算子。

VMD中各变量的迭代表达式为:

其中:τ表示噪声容限;^表示傅里叶变换;ω为傅里叶变换中原函数周期所对应的基频。

1.1.3 信号重构

原始振动信号经过VMD后得到了K个模态分量,根据峭度和相关性准则,选取模态分量中峭度和相关系数最大的两个分量进行信号重构,得到降噪后的振动信号。

1.2 特征提取

合适特征指标的选取对反映轴承退化情况至关重要。根据之前降噪得到的振动信号,对反映轴承退化情况的时域、频域特征参数进行提取,特征指标如表1所示。

表1 时域及频域特征

值得注意的是,所提取的特征指标往往不能全部反映轴承运行过程中的性能退化趋势,需要对冗余特征向量进行降维[6]。

1.3 PCA降维

PCA是利用线性变换将原始的特征向量简化成几个与线性无关的组合,以保留主要信息,用于主要特征向量的提取。本文通过PCA对前面提取的经过归一化的特征向量进行降维,剔除冗余特征,过程如下[7]。

(1)收集数据,将提取的特征向量进行归一化处理,确定输入为特征向量矩阵X,Xk=(x1k,x2k,…,xnk)T为n维的向量,xk为轴承的某一状态,xk的协方差矩阵为:

其中,的表达式为:

(2)求Wx的特征值λi(i=1,2,…,n)和对应的特征向量hi,并将其按从大到小排序。则xi投影到特征向量hi上的主分量为:

(3)所有的hi组成n维正交空间,x在此正交空间上投影得到n维主分量。其中:前m个主分量累积贡献率的计算式为:

(4)选择主成分。根据贡献率选择相应的主分量。

1.4 LSTM原理

LSTM是在原有循环神经网络基础上改进得到的,如图1所示为LSTM结构。循环神经网络每个循环体内部只有一个状态,但LSTM内部有四个状态;因此,LSTM可以使单元状态长久保持,后面过程中可以选择哪些信息需要保存或传递下去。另外,LSTM结构经改进后可以解决循环神经网络存在的梯度消失或爆炸问题。LSTM的关键部分为细胞状态,由上方的水平线连接,它能够将上一时刻的细胞状态传输到下一时刻。

图1 LSTM网络结构

LSTM中的门结构和单元状态共同组成细胞:门结构中的输入门控制输入信息保留到单元状态的多少;遗忘门控制之前单元状态信息保留到当前的多少;输出门控制当前单元状态到输出值的多少。

LSTM模型中前一个时间t-1的输入可表示为xt-1,对应的输出为ht。如果当前时刻输入xt和ht是下一次t+1的输入,则输出为ht+1。最后,计算候选记忆细胞,公式为:

其中:Wxc为输入到细胞的权重系数;Whc为隐藏层到细胞的权重系数;bc为细胞的偏置量。

上述三个门控制隐藏层信息状态的流动,表达式为:

其中:ft为遗忘门的输出;it为输入门的输出;∗为元素乘法运算。

记忆细胞到隐藏层状态ht之间的信息流动,通过输出门进行控制:

其中:ot为输出门的输出。

1.5 SMA算法

SMA是一种基于黏菌型多头绒泡菌的觅食行为和形态变化的群体优化算法[11]。黏菌是一类长期在阴暗潮湿环境中生长的生物,由于黏菌没有大脑和任何的神经元,因此,通过前端放出的扇形静脉网络来搜寻食物。当黏菌找到食物时,连向食物的静脉就会在生物振荡器发出的生物波的影响下,通过改变静脉中细胞质的流量,增加静脉直径,从而达到加速吸收营养物质的目的;而没有找到食物的静脉直径就会逐渐减小。即使找到食物,黏菌依然会分离出一部分组织继续寻找更优质的食物,通过正负反馈检测并开发连接食物的最佳路径。通过上述过程,黏菌可以非常高效地搜索食物,因而,该模式也被应用于数学建模中。

1.5.1 接近食物

黏菌通过空气中营养物质的气味追踪并接近食物,由下式来模拟其收缩模式:

p的公式为:

其中:i∈1,2,…,n;S(i)表示的适应度值;DF表示在所有迭代过程中获得的最佳适应度。

其中:condition代表S(i)在所有群体中排名位列前50%的部分;maxt为最大迭代次数;bF为当前迭代过程中获得的最佳适应度;ωF表示在迭代过程中获得的最差适应度;SI为适应度值经过升序排列后的序列。式(16)模拟了黏菌静脉的宽度和食物浓度之间的正反馈和负反馈。参数r模拟了静脉收缩方式的不确定性,log用于减小数值的变化率,以使收缩率的值不会有太大变化。condition模拟了黏菌根据食物质量来调整搜索模式。

1.5.2 包裹食物

该部分模拟了黏菌在搜索食物时的收缩模式,表达式为:

其中:UB和LB为搜索范围的上下边界;rand为0~1之间的随机值;z值根据实验情况选取,多为0.03[11]。

1.5.3 振荡

黏菌主要通过生物振荡器中产生的传播波来改变静脉网络中细胞质的流量,从而使静脉更好地向食物集中的位置分布。为了模拟静脉宽度的变化,使用和实现上述过程:通过数学方法模拟不同食物浓度下黏菌的振荡频率;随机在[-a,a]之间振动,并且逐渐接近至0;随机在[-1,1]之间振动到接近0。为了找到更好的食物来源,即使黏菌找到了食物,其仍然会分离一些组织,以探索其他地区,从而寻求更高质量的食物来源。振荡过程模拟黏菌的状态,它决定是接近食物来源还是寻找其他食物来源。探测食物过程中可能存在的各种障碍限制了黏菌的扩散;但是,这也增加了黏菌找到更高品质食物的可能性,并能防止黏菌算法陷入局部最优状态的陷阱。上述过程模仿了黏菌选择性寻找优质食物的行为,算法伪代码如下:

电话响了半天,没人接。哥们儿朝洛蒙想烧烤店老板还没有起床。烧烤的生意一般都在晚上,要到凌晨才能收摊。所以都要睡到中午。

2 预测方法流程

2.1 振动信号预处理

由于振动信号往往是非平稳信号,且信号中存在大量噪声,影响特征提取的准确性,而VMD作为近些年新提出的方法,可以有效地对非线性、非平稳信号进行降噪;因此,本文利用VMD将数据集中的原始振动信号分解成若干个分量,再选取峭度值和相关性系数最大的两个分量进行重构,完成对信号的降噪。

2.2 特征向量的提取及降维

对降噪后的信号提取15个时域、频域参数。并不是提取的所有特征都可以反映轴承的退化情况,冗余的特征向量会降低预测速度;因此,对提取的特征参数进行PCA降维,去除冗余特征向量。

2.3 构建预测模型的标签

若直接将轴承的剩余寿命作为预测模型的标签,则容易造成神经网络的过拟合现象[8]。通常轴承的退化过程随时间呈线性变化。本文拟构建退化系数R来描述轴承的退化程度。通过连续w个特征值组成一个时间序列,第i个时间序列的退化系数Ri为:

其中:n为振动信号采集的组数;w为每个时间序列的长度;R随着时间从1到0线性减小,当R=1时,表明轴承刚刚开始退化,当R=0时,表示轴承完全报废。

以前面提取的轴承退化特征向量为输入,退化系数R作为标签,划分训练集和测试集:

其中:t是振动信号每次采样的时间间隔。

2.4 SMA-LSTM预测模型的构建

利用黏菌算法既具有动态搜索结构又不易陷入局部最优的特点,对LSTM的超参数进行优化。首先,需对黏菌算法的参数进行初始化,以LSTM的均方根误差(Root-Mean-Square Error,RMSE)为SMA的目标函数,对模型进行训练;通过目标函数计算适应度值并对其进行排序,更新最佳适应度和最佳个体位置;通过最后输出的最佳位置得到LSTM的最佳超参数组合;最终,将优化后的超参数输入LSTM模型,得到训练好的最佳模型。

2.5 滚动轴承RUL预测

轴承前期运行平稳,后期会有故障信号突变,直接将每组步长为一的故障特征作为预测模型的输入,并不能很好地预测后期突变故障的特点。因此,本文确定轴承退化起始时刻,将测试集中的n维特征向量按每w组作为一个时间序列输入到SMA-LSTM中,对测试集中退化起始时刻后的R进行预测。用RMSE和平均绝对误差(Mean Absolute Error,MAE)对预测模型的性能进行评估。

3 应用与分析

3.1 实验数据预处理

为了验证本文所提出方法的有效性,选取IEEEPHM 2012 Data Challenge轴承数据作为实验数据进行验证[16]。数据集中包括水平加速度、垂直加速度振动信号和温度数据。温度数据为单通道连续采集,采样频率为10 Hz,但温度数据不适用于所有的案例[17]。根据相关学者的研究,相比于垂直振动信号,水平振动信号能提供更多有用的信息[18],故将水平振动信号作为本文数据集。实验设置当振动信号的幅值超过20 g时轴承发生失效。轴承振动信号的采样频率为25.6 kHz,每次采样持续0.1 s[17]。

如表2所示,轴承在三种工况下进行试验。为使预测的轴承剩余寿命在不同的工况下都能有较高的精度,本文将三种工况下Bearing1_1、Bearing2_1、Bearing3_1的全寿命周期作为实验的训练集,将Bearing1_3作为实验的测试集。

轴承通常前期运行平稳,故障往往发生在运行后期,对轴承发生故障到完全报废的时间段进行预测,可以缩短预测时间,提高效率。轴承振动信号中的均方根值(Root Mean Square,RMS)与轴承的退化情况密切相关[19]。本文将RMS的均值作为轴承发生故障的上阈值点,超过该阈值点,轴承开始发生故障。通过上述方法确定轴承Bearing1_3退化时刻,将轴承退化起点至退化终点间的数据作为实验的测试集。

表2 2012 PHM挑战赛数据集

如图2所示,为Bearing1_3原始振动信号的波形和经过VMD降噪后的波形,如图3所示为RMS值。

图2 轴承1_3的振动信号波形图

图3 RMS值

由图2可知,轴承振动信号经过降噪后,时域图中故障冲击特征明显增强,从而更易判断其退化起始时刻。由图3中的RMS值可知:在轴承运行前期,RMS较小;当轴承发生故障时,RMS急剧增大,与图2振动信号中出现突变的时刻大致相同。

如图4所示,为对降噪后的信号提取的时域、频域特征参数。在轴承运行前期,轴承运转状态稳定,特征指标值变化相对平缓;随着轴承运转,轴承开始发生失效,特征指标值出现突变。由图4可知:各指标随轴承运行状态变化趋势大致相同,但均方根频率等指标随轴承运行的变化并不明显,不能反映出轴承的退化过程。冗余的特征向量会增加计算量,干扰轴承故障诊断的准确性[20],因此,有必要剔除不能反映轴承运行状态的指标,并利用PCA对特征向量进行降维。

图4 退化特征参数

在通过Python进行降维时,PCA算法中的参数n_components设置为mle,即根据效果自动选择合适的特征向量。

3.2 实验参数设置

为了对比分析,本实验采用BP神经网络和SVR进行对比实验,并用遗传算法(Genetic Algorithm,GA)和灰狼优化算法(Grey Wolf Optimizer,GWO)对上述模型参数优化,与SMA-LSTM模型进行对比。其中,LSTM模型网络层数为3,优化器为SGD,批次大小为32,用均方误差(Mean Square Error,MSE)作为模型训练时的损失函数,通过SMA、GA和GWO优化算法对LSTM模型中的学习率、训练次数和隐藏层神经元的数目进行优化。利用SMA对BP模型中的学习率和训练次数进行优化。SVR模型采用poly核函数,通过SMA对SVR模型中的惩罚因子和核函数参数进行自动寻优。

3.3实验结果与分析

通过RMS确定轴承退化起始时刻后,对起始点后的轴承剩余RUL进行预测。采用RMSE和MAE作为衡量预测模型精度的指标。

如图5所示,为利用GA、GWO、SMA以及未用优化算法的LSTM模型的预测结果。由图5可知:经GA和GWO优化后的LSTM和未采用优化算法的LSTM,在预测过程中都存在振荡,这说明优化算法在区域内存在局部最优解;而经SMA优化后的LSTM预测平稳,无明显震荡区域,这证明了SMA算法可以有效跳出局部最优解,其预测精度高于经GA算法和GWO算法优化后的LSTM模型,拟合效果较好。

SMA在优化预测模型超参数方面具有较好的效果。如图6所示,为利用SMA对BP、SVR和LSTM模型进行优化后的预测结果。由图6可知:采用SMA-LSTM模型能更好地反映出轴承的剩余寿命,其预测结果平稳,预测精度高于SMA-BP和SMA-SVR预测模型。

如表3所示,为上述预测模型的误差。

由图5、图6和表3可知:

(1)GA-LSTM、GWO-LSTM和SMA-LSTM预测模型的误差MAE和RMSE均低于未经参数优化的LSTM,从而证明上述三种优化算法确实可以提高LSTM的预测精度;SMA-LSTM的预测误差最低,证明SMA算法相比于其他优化算法可以更好地提高LSTM的预测精度。因此,用SMA对LSTM超参数进行优化是切实可行的。

图5 LSTM预测结果

图6 SMA优化后各模型的预测结果

表3 预测误差

(2)相比于SMA-BP和SMA-SVR模型,SMALSTM的MAE和RMSE更低,证明在相同优化算法下,LSTM模型的预测精度高于上述模型。

4 结论

本文提出了一种基于LSTM的轴承剩余寿命预测方法,实现对轴承RUL的预测。结论如下:

(1)针对轴承早期失效阶段故障特征信息微弱、易受噪声干扰的问题,利用VMD方法对轴承信号降噪。降噪后的振动信号相比于原始信号,故障特征波形冲击明显增强。

(2)针对直接预测轴承剩余时间容易造成过拟合的问题,构建退化系数R,由R计算得到轴承剩余使用时间。利用三种不同工况下的轴承数据作为实验数据,对轴承RUL进行预测,证明了模型具有较好的泛化能力。

(3)针对预测模型LSTM中超参数选取困难、大多优化算法容易出现局部最优的问题,提出了基于SMA-LSTM的轴承RUL预测模型。利用SMA具有动态搜索能力且不易陷入到局部最优的特点,对LSTM的超参数进行优化。为了验证SMA-LSTM的有效性,将预测结果同GWO、GA优化算法以及BP、SVR预测模型进行对比,仿真结果表明,基于SMA-LSTM的轴承RUL预测方法是可行的。

猜你喜欢
特征向量轴承振动
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
某调相机振动异常诊断分析与处理
轴承知识
轴承知识
克罗内克积的特征向量
轴承知识
轴承知识
振动与频率
This “Singing Highway”plays music
一类特殊矩阵特征向量的求法