基于贝叶斯优化的SWDAE-LSTM滚动轴承早期故障预测方法研究

2021-10-11 09:50石怀涛尚亚俊白晓天
振动与冲击 2021年18期
关键词:贝叶斯优化故障

石怀涛,尚亚俊,白晓天,郭 磊,马 辉

(1.沈阳建筑大学 机械工程学院,沈阳 110168;2.东北大学 机械工程与自动化学院,沈阳 110819)

旋转机械是现代工业、民用和军事应用中最常见的机械类型[1-2],而滚动轴承是其核心部件之一,极易在长期运行中由于安装、温度、润滑等因素受到损伤[3]。若早期故障未得到有效识别与及时解除,旋转机械的精度将不断降低,直至系统完全损坏,甚至引起不可挽回的后果。

很多有效的传统滚动轴承故障诊断方法依靠旋转机械的运行振动信号对其进行故障诊断[4-6],对其时域、频域及时频域进行分析,如振动分析、温度分析以及油液分析等。其中振动分析是最具说服力的方法,从振动信号中提取大量的特征参数作为传统故障诊断的标准。时域特征(均方差根、峭度)被广泛应用于轴承性能评估[7-9]。Chen等[10]提出基于均方差根值(root mean square,RMS)的时域统计指标用在滚动轴承状态识别中,RMS反映的是信号能量,振幅值随时间变化的越缓慢,其效果越明显,很明显对早期故障不敏感。袁云龙等[11]基于峭度(Kurtosis)的时域统计指标来进行滚动轴承状态识别,峭度对冲击信号的有较大的反应,所以对早期异常故障信号有较高的敏感性,但对于微小波动的情况,可能出现敏感度过高造成评估滚动轴承故障的可靠性产生影响。而滚动轴承振动信号隐含的特征信息非常多,特征信息的提取是滚动轴承的关键。采用多种时域特征,研究滚动轴承运行状态与振动信号之间的关系。其中,RMS和Kurtosis是最常见的时域特征方法,因为它们能有效地反映滚动轴承运行振动的实时变化。但是,滚动轴承运行过程中振动的不确定性引起的波动对轴承运行状态的预测有很大的影响。时域特征分析不再利于滚动轴承的早期故障预测。

深度学习能自动学习丰富而有区别的特征,具有强大的特征提取能力,使其在故障诊断领域的应用成为了可能。李恒等[12]提出将滚动轴承振动信号进行短时傅里叶变换,使用得到的时频谱样本训练卷积神经网络(convolutional neural networks,CNN),对不同类型的故障有较高的识别精度。Zhang等[13]提出的单类支持向量机(support vector machine,SVM)方法虽然能够向高维空间中进行映射,对于大规模的训练数据比较困难,尤其是进行超参数的智能调优的过程时,会投入大量的时间和精力。以上神经网络模型训练的样本之间是相互独立的,数据之间具有的时序相关性被忽略。长短时记忆[14](long short-term memory network,LSTM)网络是一种特殊的循环神经网络(recurrent neural network,RNN),在涉及序列数据广泛的机器学习问题中是有效的[15]。杜小磊等[16]提出了一种基于深层小波卷积自编码器和LSTM的轴承故障诊断模型,利用小波自编码提取故障特征进行LSTM网络训练,进行故障诊断。赵建鹏等[17]使用经验模态分解数据进行特征参量的提取,并输入到LSTM网络中预测下一刻旋转机械的工作状态。但这些方法都存在网络模型使用简单,提取数据的时序关联特性机理不确切等问题。

越深的网络和越多的节点个数往往会使学习效果和拟合效果越好,但也会增加超参数的个数。超参数是模型训练开始前设置的一系列参数,例如隐藏层的数量、每层的节点个数、迭代次数和学习率等,模型的超参数具有选取困难、没有规律性的特点,而且不同超参数之间存在无法预知的影响,每个超参组合的评估需要进行大量的迭代计算。不同的超参数组合会影响模型的最终准确率和平稳性,通常需要大量的超参数试验来确定模型最终的超参数组合,耗费大量的时间和精力。

网络模型的超参数优化策略[18-19]对模型的精度影响很大,网格搜索方法[20-21]是最早的自动搜索超参数的方法,网格搜索是一种带有步长的穷举方法,通过不断缩小网格的步长增大搜索空间最大程度上找到模型的最优解,但是网格搜索只适合数据集较小的模型,一旦数据规模增大,就会很难得到最优解,甚至会出现“指数爆炸”的问题。Bergstra等[22]提出随机搜索方法,将超参数选择问题转变成函数优化问题,按照概率分布抽取初始值,进行计算得到最优解或者近似最优解,适用于数据集较大的情况,但随即搜索得到的结果之间差异较大。网格搜索和随机搜索均为目标函数可导的优化方法,对于目标函数表达式未知等复杂的优化问题,提出了智能优化方法与深度学习模型相结合的方式,如Yan等[23]用遗传算法来优化人工神经网络模型的超参数,Li等[24]用量子遗传算法优化神经网络,李甜甜[25]用粒子群算法和模拟退火算法来优化SVM中超参数等。但遗传算法和粒子群算法均属于群体优化算法,需要足够多的初始点来进行训练才能有效地搜索到最优解,训练效率不高。本文使用贝叶斯优化(Bayesian optimization,BO)[26]方法,因BO网络只需对目标函数进行次数很少的评估就能获得最优解,非常适用于求解目标函数表达式未知以及评估代价高昂的复杂优化问题,且不需要大量的采样点便可以得到最优解,适合深度学习模型的超参数调优问题[27]。

基于以上分析,本文提出了一种基于贝叶斯优化的滑动窗堆叠去噪自编码器(sliding window stacked denoising auto encoder,SWDAE)和LSTM网络的早期故障预测模型(SWDAE-LSTM)的研究方法。在离线建模阶段,为了保证堆叠去噪自编码(stacked denoising auto encoder,SDAE)提取特征的精确性,使用滑动窗算法对数据进行预处理,之后将数据输入到SDAE网络进行滚动轴承故障特征的提取,并固定训练好的SDAE,将经过SDAE重构的数据集作为LSTM的输入,进行LSTM网络的训练,进一步学习数据之间的时序特征。之后将训练好的SDAE-LSTM模型用于在线监测,去掉LSTM最后一层分类层,实时在线数据输入到SDAE-LSTM网络,训练得到下一时刻的预测值,而这一时刻的真实值来源于实际的运行数据,数据实时输入到模型中,与训练得到的预测值进行残差计算来重构误差,来判断滚动轴承的运行状态。对于SDAE和LSTM的精度与其超参数组合的关系,我们在贝叶斯优化阶段使用贝叶斯优化算法对模型的超参数进行智能调参,BO可以在迭代中寻求最优解,在节省了大量的时间和精力的同时,使模型的精确度和平稳性达到最优,从而使模型能够更全面地学习滚动轴承数据的特征。利用辛辛那提大学智能维护中心提供的数据进行了实验仿真,仿真结果表明,基于贝叶斯优化的SWDAE-LSTM模型可以很好地描述滚动轴承的运行状态,更早更稳定的预测出滚动轴承的早期故障,这对于滚动轴承运行状态的退化监测非常重要。同时,利用旋转机械综合模拟实验台证明了本文提出方法的有效性和可靠性。

得益于SDAE模型的特征提取能力与LSTM模型的数据特征提取能力,本文对滚动轴承早期故障预测的主要贡献如下:

(1)利用贝叶斯优化算法对模型的超参数进行智能调参,使模型的超参数得出最优解,在节省了大量时间和精力的同时,使模型的精确度和平稳性达到最优。

(2)利用滑动窗算法对滚动轴承的数据进行预处理,使输入到网络模型中的数据长度保持一致,使SDAE能更好的提取滚动轴承的数据特征,同时保证了数据之间的时序相关性,使模型能更好的对滚动轴承早期故障的出现进行预测。

(3)将无监督的SDAE网络对滚动轴承振动信号的特征进行提取,去掉LSTM网络最后一层分类层,提取数据之间的时序关联特性,并利用滚动轴承序列数据的完整历史轨迹对滚动轴承的运行状态进行监测,进一步预测滚动轴承早期故障的出现。

1 优化的SWDAE-LSTM理论

1.1 堆叠去噪自动编码器

自动编码器(auto encoder,AE)是一个无监督的特征表达网络,由输入层(x)、隐藏层(h)和输出层(r)组成。AE的目的是通过编码和解码的过程重构数据,使输出数据与输入数据之间的误差最小。去噪自编码器(denoising auto encoder,DAE)是AE的一种改进方法,DAE从被损坏或加入噪声的数据样本中重建数据。AE从输入层到隐藏层的编码公式为

式中:fe()为输入层到输出层的编码函数;σ()为Sigmoid激活函数;Wxh为其权重值;bxh为其偏移值。

AE从隐藏层到输出层的解码公式为

式中:fd()为隐藏层到输出层的解码函数;Whr为其的权重值;bhr为其偏移值。

AE的中心思想是通过编码和解码,使输入数据和输出数据保持一致,因此AE的损失函数为

未处理的振动信号含有大量的噪声,初始故障的信号特征较弱,需要通过DAE处理去除了信号中的大部分噪声,以及隐藏层从信号中提取鲁棒特征。

将多个DAE堆叠便得到SDAE,在训练模型时,上一个DAE的输出作为下一个DAE的输入,以此类推,直到所有的DAE训练结束,得到一个堆叠而成的深层网络。经堆叠而成的SDAE网络在高维度、非线性输入数据特征的提取上具有很强的鲁棒性。

1.2 长短时记忆网络

长短时记忆网络是一种特殊的RNN网络,既有RNN网络所具备的时序关联特性,并且通过门控循环单元 来控制网络中神经元间的历史信息传输,解决了传统RNN网络梯度消失和梯度爆炸的问题。

图1为LSTM网络的基本结构,由输入门、遗忘门和输出门来完成LSTM每个神经单元工作状态的修改和输出,并由GRU在内部控制有效信息的记忆和传递。其中,遗忘门决定(t-1)时刻的单元状态有多少被保留到t时刻。输入门决定单元状态的更新。在遗忘门和输入门更新了单元状态之后,由σ()非线性激活函数和输出门来决定LSTM神经单元状态的输出。一个LSTM细胞的计算过程如下:

图1 LSTM细胞图Fig.1 LSTM structure

遗忘门

式中:ft为遗忘门;Wf为遗忘门的权重矩阵;bf为遗忘门偏置项。

输入门

式中:it为输入门;c′t为当前输入的单元状态,最后计算出当前时刻的单元状态ct。

输出门

输出门和单元状态共同决定了LSTM的最终输出。

1.3 SWDAE-LSTM网络

综上所述,我们将SDAE网络和LSTM网络组合来构建神经网络模型。如图2所示,为SWDAE-LSTM网络框架。

图2 SWDAE-LSTM网络结构Fig.2 SWDAE-LSTM network structure

该模型主要由输入层、特征提取层和预测层组成。滑动窗按照一定的步长和移动速度将数据进行堆叠划分,产生X={X1,X2,…,Xt-1,Xt,…,XN}输入数据集,将处理好的数据集输入到SDAE网络当中,按照式(1)~式(3)训练SDAE网络,利用SDAE网络捕获数据更多有用的隐藏模式,并从原始数据中获得更强的鲁棒性以及数据之间的时序依赖特性。将训练好的数据作为LSTM网络的输入,按照式(4)~式(6)进行LSTM网络训练,生成序列数据,对数据进行预测。

1.4 贝叶斯优化算法

贝叶斯优化针对深度学习模型超参数目标函数表达式未知、搜索代价高昂的复杂优化问题,使用一个不断更新的概率模型,通过少数次的目标函数评估来更新优化函数的后验概率,得到最优的模型超参数组合。模型的超参数组合选择可表示为

式中:f(x)为最小化的目标函数,用于评估目标函数的最优性能;x*为最后获得的最优超参数组合。

贝叶斯优化源于贝叶斯定理,利用BO公式建立优化过程的概率分布

式中:P(E)为高斯分布;P(D|E)为一个高斯回归过程。可由核矩阵∑来确定,∑由核函数定义,其表达式为

BO超参数的目的就是通过不断地迭代得到一个最优的超参数组合,即x*=xn+1使模型的精度达到最优。

2 BO的SWDAE-LSTM滚动轴承早期故障预测

2.1 基于BO的SWDAE-LSTM

基于以上研究,SDAE网络在故障特征提取方面具有很强的鲁棒性,LSTM网络能够学习数据之间的时序关联特性,将SDAE与LSTM网络组合为一个网络模型,来描述滚动轴的运行状态,正确的状态描述是解决滚动轴承早期故障预测的最优方式。为了保证SDAE网络特征提取的有效性,本文引入了滑动窗算法对数据进行预处理,保证了SDAE网络对提取特征的鲁棒性。贝叶斯优化可以不断更新超参数,只需经过少次目标函数评估即可获得理想解,适合深度学习模型的超参数调优问题。因此本文选用BO算法优化模型的超参数,滑动窗算法进行数据预处理,LSTM与SDAE组合来构建深度神经网络模型。

2.2 BO的SWDAE-LSTM模型流程

基于BO的SWDAE-LSTM模型的构建包括贝叶斯优化阶段、离线建模阶段和在线监测阶段,贝叶斯优化阶段由超参数初始点开始进行模型训练,并不断更新超参数组合,直到模型的精度满足要求。离线建模阶段利用经滑动窗预处理的历史正常数据进行SDAE迭代训练,保存训练好的SDAE之后训练LSTM,去除LSTM的分类层将LSTM网络作为序列生成器,可以输出数据变成与输入数据维度相同的序列数据。在线监测阶段,将实时在线数据输入到训练好的SWDAE-LSTM模型中,进行滚动轴承下一时刻运行状态的预测并输出其预测值,将其预测值和在线数据进行残差计算使误差重构,当前的运行状态是否在正常范围之内通过支持向量数据描述(support vector data description,SVDD)来判断,若正常则继续监测,否则报警。如图3所示,为滚动轴承早期故障预测流程图(3个阶段:贝叶斯优化调参、离线建模和在线监测)。

图3 滚动轴承早期故障预测流程图Fig.3 Rolling bearing early fault prediction flow chart

(1)贝叶斯优化阶段:

步骤1根据要优化的超参数,设置n个初始点Xn=[X1,X2,…,Xn],作为模型的初始化超参数,并代入SWDAE-LSTM模型中进行训练。并计算Xn在目标函数上的响应值Yn=[Y1,Y2,…,Yn],构建数据集D={(X1,Y1)…(Xn,Yn)}。

步骤2在模型的验证集上判断模型是否满足精度要求,若满足则模型超参数为Xn,否则判断模型是否达到最大迭代次数,若满足则该模型超参数为Xn,否则循环执行贝叶斯优化迭代。

步骤3利用D数据集,建立高斯回归模型GP。

步骤4基于GP,通过采集函数u(X),进行采样点Xn+1的计算。

步骤5使用新得到的采样点Xn+1作为模型超参数,进行模型训练,并得到模型的响应值Yn+1。

步骤6判断是否满足精度要求。若不满足循环执行步骤2~步骤6;满足则确定超参数为Xn+1,停止迭代。

(2)离线建模阶段:

步骤1采集滚动轴承正常状态下的振动信号,作为历史正常数据x。

步骤2在历史正常数据上运行长度为ω的重叠滑动窗口,得到一个新的扩展时间序列数据Y。

步骤3将新的数据集Y作为SDAE输入数据,将初始化参数作为模型的超参数。根据第2章式(1)~式(5)对SDAE进行训练。

步骤4固定训练好的SDAE,并将重构的数据作为LSTM的输入数据ej,进行LSTM训练。

步骤5训练LSTM时,输出与输入数据维度相同的预测序列,并不断更新SWDAE-LSTM模型的超参数以及参数。

步骤6判断模型的精度是否满足要求。若不满足,循环执行步骤1~步骤5;满足则停止训练。

(3)在线监测阶段:

步骤1将实时数据输入到训练好的SWDAE-LSTM模型中,输出下一时刻的预测数据nt。

步骤2将输出的预测值nt与实时数据的真实值进行残差计算,产生重构误差J(θ)。

步骤3将重构误差经过SVDD,判断重构误差是否超过SVDD设置的阈值,若超过,则滚动轴承出现早期故障,进行报警,否则继续循环步骤1~步骤5。

3 滚动轴承早期故障仿真实验与分析

为验证基于贝叶斯优化的SWDAE-LSTM模型对滚动轴承早期故障预测的诊断效果,分别利用来自美国辛辛那提大学智能维护中心(IMSCenter)的轴承全生命周期数据以及机械故障综合模拟实验装置获取的数据进行仿真实验及分析。如图4所示,为滚动轴承全寿命试验台,轴承测试台在一个由交流电动机驱动的轴上承载4个轴承(1#、2#、3#、4#),轴的转速保持为2 000 r/min。为加速轴承老化,在径向方向上,弹簧机构向轴和轴承施加了2 721.6 kg的载荷,油液循环系统可测量润滑油的流量和温度。此每个轴承箱上均安装了振动加速度传感器,数据采样率为20 kHz,每隔10 min采样一次并记录。本文使用1#轴承的数据进行仿真试验。

图4 滚动轴承全寿命试验台Fig.4 Rolling bearing full life test stand

如图5所示,为机械故障综合模拟试验台,实验台主要由调速电机,加速度传感器等构成。实验中设置不同转速下不同故障尺寸的滚动轴承实验,分别在转速为1 200 r/min,2 400 r/min,3 600 r/min,选取故障直径为0.2 mm,0.3 mm,0.5 mm的滚动轴承,故障的位置包括滚动轴承的外圈、内圈和滚动体,在信号采样频率为12 kHz下采集振动信号。

图5 旋转机械故障综合模拟实验台Fig.5 Rotating machinery fault comprehensive simulation test bench

3.1 实验数据

由美国辛辛那提大学智能维护中心提供的轴承全生命周期数据可知,共包含3个试验,在转速相同的条件下每个实验出现明显故障时停止实验,最后整理试验数据集如表1所示。

表1 滚动轴承全生命周期数据集Tab.1 Rolling bearing full life cycle data set

其中,每个样本中有20 480点,通过表1可以看出,在相同的实验设备、实验环境以及滚动轴承等条件下,实验中的每组滚动轴承发生故障的位置是不同的,并且故障出现的时间也是不一样的。因此说明滚动轴承的故障具有不确定性,人为的历史经验很难做出准确的判断。

以实验B(1#滚动轴承)的数据作为本文实验仿真使用的数据,共包含984个样本,其中每个样本中包含20 480点。选择样本文件的前400个1#滚动轴承的正常运行数据作为模型的训练数据,后584个1#滚动轴承的退化过程数据用于测试模型的性能。为了保证实验结果的有效性和准确性,通过计算采样频率和电机转速可以得出,滚动轴承在实验中旋转一周可以采集600个采样点,将数据按照其周期性将数据输入到模型进行训练和测试。

由机械故障综合模拟实验台可得数据集,为了进一步验证SWDAE-LSTM方法的有效性和可靠性,我们使用采样频率为12 kHz,故障直径为0.2 mm的条件下,3种不同的转速的滚动轴承故障数据,数据类型共10组,最后整理实验数据如表2所示。

表2 滚动轴承故障数据Tab.2 Rolling bearing fault data

数据集中共有80 000个采样点,将每200个采样点划分为一个样本,每个故障包含400个样本,使用前300个样本作为训练集,后100个样本作为测试集。

3.2 实验方案

3.2.1 贝叶斯优化模型验证

为了保证模型能更准确识别出滚动轴承早期故障,本文使用了贝叶斯优化算法进行智能调参。

根据训练集的大小将隐藏层的个数设置为整数范围3~5个,隐藏层神经元个数设置为300~600,并且每次按整百来调整搜索空间。LSTM的收敛速度和训练精度对批量大小(Batchsize)的设置大小十分敏感,所以在待优化超参数选择中,同样需要对Batchsize进行优化,Batchsize的搜索范围设置为90~200,并且每次按整百来调整搜索空间。目前神经网络的主要优化函数有Adam、RMSProp、Nadam,经BO算法优化出最适合模型的优化函数。在激活函数sigmoid、tanh、relu中经迭代搜索出适合模型的激活函数。训练一个大型的神经网络时,为防止过拟合的发生,需引入Dropout归一化。Dropout的大小决定了在训练过程中神经元暂时被丢弃的概率,因此设置其搜索区间为0~0.9。由于本文提出的模型使用贝叶斯优化方法确定模型超参数,图6显示了贝叶斯优化算法优化模型中超参数的过程。

图6 贝叶斯优化超参数过程可视化Fig.6 Visualization of Bayesian optimization hyperparameter process

图6的横坐标表示的是各待优化参数的选择区间,分别为LSTM隐藏层神经元个数、SDAE第一层隐藏层神经元个数、SDAE第二层隐藏层个数、LSTM的Dropout归一化大小、SDAE第一层隐藏层Dropout归一化大小、SDAE第二层隐藏层Dropout归一化大小、优化函数、激活函数、Batchsize的大小,纵坐标表示模型在验证集上的均方误差(mean-square error,MSE),通过参数估计值与参数真值之差平方的期望值的公式MSE=,来评价数据的变化程度,当MSE的值越小时,超参数预测值具有更高的精度。贝叶斯在优化参数的过程中使用高斯函数代替黑箱函数,并通过一致连续的局部平滑性弱假设,来得到最优解。平滑性弱假设使BO算法有效的利用区间邻近信息进行更准确的推断,从而选择更具有“潜力”的点。图6中的每个小框图为每个超参数由BO算法在区间的搜索过程,即通过主动选择策略来确定搜索区间当中最具“潜力”的点,图6中的选中的点表示在设定好的区间内最具“潜力”的点,即超参数组合的最优解,可见,每个待优化超参数都会影响模型的最后精度。

在贝叶斯智能调参的过程中,为了显示任意一组超参数对模型的影响及其调参过程的平稳性,添加可视化程序,图中的曲线代表了在BO的过程中,经过多次迭代(如20次迭代)之后更新学习的超参数组合对SWDAE-LSTM模型的训练损失率即平均损失误差,如图7所示,为模型的训练损失和在验证集的平均损失误差。

图7 贝叶斯优化超参数训练过程Fig.7 BO of the hyperparameter training process

图7中的曲线代表了网络模型使用贝叶斯算法在超参数空间选择的一组超参数进行训练的过程。在训练损失图中,图中的任意一条曲线都代表了当前超参数组合进行迭代时的模型训练损失,随着贝叶斯的优化搜索,模型的训练过程逐渐稳定其损失也降到最低。BO算法从过去的结果中进行推理来更新优化函数的后验概率(参考式(7)~式(9)),不断搜索到最优的超参数组合。从平均绝对误差图中可以看出,模型在验证集的平均绝对误差从0.017左右下降到0.002左右,迭代训练过程也趋于平稳,可以证明BO算法选择出了可以使模型精度显著提高和泛化能力显著增强的一组最优超参数,避免了手动调节超参数造成的大量时间损耗以及超参数组合的不平稳性。

为了验证BO算法选择出来的最优超参数组合的精度是否满足要求,将优化出的超参数组合代入本文提出的模型中,得到振动信号训练模型的损失下降图,如图8所示。

图8 最优超参数模型训练过程Fig.8 The training process of the optimal hyperparameter model

从图8中可以看出,经过贝叶斯优化选择出的超参数组合,在模型训练过程中,模型的收敛速度更快且在收敛过程中波动较小。随着迭代的完成,模型的训练损失降到0.000 751,损失率为0.075 1%,准确率达到了99.91%,模型的平均绝对误差降到0.016 59,此时模型提取数据的特征较为充分,精度高并且稳定。

验证模型满足精度要求后,在模型训练超参数过程中添加显示程序,训练结束时显示优化好的超参数组合,得到本文模型超参数组合如表3所示。

表3 经过优化的模型超参数Tab.3 Optimized model hyperparameters

3.2.2 滚动轴承早期故障预测

选择实验B的1#滚动轴承的运行数据进行仿真,如图9为实验B中1#滚动轴承全生命周期的原始时域振动信号图。由图中可以看出,滚动轴承在大约750个样本(约125 h)前的时域信号是比较平稳的,在大约750个数据样本之后时域信号出现了非常明显的异常,即滚动轴承发生了较为明显的损伤,并且之后时域信号出现了波谷现象,即滚动轴承外圈故障中典型的“治愈现象”,由于损伤出现后在循环力的作用下,损伤位置被短暂的磨合至光滑,之后出现重度损伤之后,滚动轴承不再被“治愈”直至失效。

图9 1#滚动轴承全生命周期振动信号Fig.9 1#rolling bearing full life cycle vibration signal

基于时域统计指标经常被用在滚动轴承状态识别中,常用的时域统计指标有平均值,均方差根值和峭度。图10分别为1#滚动轴承的这几种时域统计指标值。

从图10可以看出,图10(a)平均值基本上不能有效反映滚动轴承的退化趋势和故障状态。从图10(b)RMS值可以看出,大约从500个样本(约83 h)左右开始有上升趋势,反映了轴承退化的早期,信号幅值较正常状态有了相对明显的增加,但是加速度相对平稳增加,随着损伤的加深,RMS值出现波动并逐渐增大。但是RMS没有较大的变化峰值,曲线变化相对缓慢。图10(c)Kurtosis值对冲击信号较为敏感,在故障样本出现时其信号幅值也产生了相对的突变,但不同于RMS,随着故障的加深,其信号幅值波动较大,在退化末期更为敏感,轴承接近失效,而在退化早期冲击信号并不明显,所以相比较于RMS值,从Kurtosis值图中没有有效反映出滚动轴承的退化早期,并且在退化末期出现了下降的趋势。

图10 时域统计指标识别滚动轴承状态Fig.10 1#rolling bearing full life cycle vibration signal

基于时域的统计指标虽然可以在一定程度下反映滚动轴承的退化趋势,但是不能很好的反映滚动轴承早期故障的变化和退化后期的各个阶段。将BO算法选择出的最优超参数组合代入模型中进行训练,如图11所示,为本文提出的基于贝叶斯优化的SWDAELSTM模型对滚动轴承运行状态的描述。

图11 1#滚动轴承全生命周期描述曲线Fig.11 Full life cycle description curve of 1#rolling bearing

从图11可以看出,经过BO算法优化的模型可以检测到在第10 070个周期左右首先出现异常的测试数据较正常状态信号幅值明显增加(轴承运行90 h左右)。与图8相比,提前了将近30 h发现轴承故障。然后数据趋于正常,直到第14 500周期左右异常信号出现之后异常的测试数据出现的时间间隔逐渐变短,且每次异常信号的幅值也逐渐增大,直至滚动轴承完全失效。这符合滚动轴承的生命周期(从正常到完全失效的过程)。与均方差根值和峭度统计指标的方法相比,经过BO算法优化的SWDAE-LSTM的模型可以很好的反映滚动轴承的早期故障的变化和退化的各个阶段。即当滚动轴承的外圈出现初始异常时,随着滚动轴承的继续运行,外圈损伤将被滚动体不断磨合,滚动轴承的异常信号会出现短期的相对正常的数据。随着滚动轴承的继续运行,并且重复损伤与磨合的过程,但是相对正常数据产生的时间间隔被缩短,直至不会再出现类似正常数据。

残差是基于实时在线运行数据对滚动轴承的运行状态进行监测的方法之一,训练之后的SWDAE-LSTM网络能够预测下一时刻的振动数据,预测的振动数据与实时在线的输入数据进行残差计算,之后利用重构误差来识别滚动轴承运行过程中的异常振动情况,如图11可知,能够提前30 h时监测出滚动轴承的异常振动信号。因此有理由相信残差能够为滚动轴承早期故障预测提供健康监测指标。

3.2.3 滚动轴承故障试验

为了验证SWDAE-LSTM网络的有效性,我们使用故障程度最小的故障轴承数据集,数据集共包含了10组实验数据,共4种滚动轴承的运行状态:正常状态、内圈故障、外圈故障、滚动体故障。为了保证模型的鲁棒新和准确性,我们使用历史正常数据对网络进行训练,之后将4种故障数据输入到训练好的模型中,使用重构误差来判断滚动轴承的运行状态。

图12中可以看出,4种故障中,外圈故障最为明显,而其余两种故障与滚动轴承正常状态相差较小,较难区分。

图12 4种故障数据时域图Fig.12 Four fault data time domain diagrams

图13显示了滚动轴承震动数据,经SWDAELSTM网络重构误差之后的结果图。

图13 4种故障诊断的重构误差Fig.13 Reconstruction errors of four fault diagnoses

如图13所示,显示了经过BO算法优化的SWDAE-LSTM网络对滚动轴承进行故障诊断的结果,可以看出,正常状态的重构误差在2.5左右波动,而故障状态的重构误差大于正常状态,在3.7~17.5波动,正常状态的重构误差与故障状态的重构误差具有明显的差异,说明经过BO算法优化的SWDAE-LSTM网络能够将滚动轴承的正常状态和故障状态很好的分隔开来,同时,内圈故障的重构误差在7.5左右波动,滚动体故障的重构误差在3.5左右波动,外圈故障的重构误差在12.5~17.5波动,每个故障的重构误差都不存在重叠部分,可以证明本文提出的方法能够有效的对滚动轴承的故障进行诊断。

3.3 仿真实验结果对比

为了验证本文提出的基于贝叶斯优化的SWDAELSTM(以下简称SDLSTM)方法的稳定性和先进性,将BO之后的SWDAE-LSTM算法与Kurtosis、RMS、SDAE+RMS、SDAE+Kurtosis进行了比较。

3.3.1 全生命周期数据仿真实验分析

为了验证本文提出的基于BO的SWDAE-LSTM模型的有效性,使用IMS数据集,将本文提出的模型与常用的是与特征提取的方法进行了比较。图14中,①号线代表本文提出的经BO的SWDAE-LSTM算法,②号线代表Kurtosis统计指标,③号线代表RMS统计指标,④号线代表SDAE和RMS提取的特征,⑤号线代表特征由SDAE和Kurtosis提取。

图14 故障预测算法提取特征结果比较Fig.14 Fault prediction algorithm to extract feature results comparison

图14描述了故障的发展,图中Ⅰ、Ⅱ分别是早期故障阶段和重度故障阶段。从Ⅰ中可以看出,Kurtosis和本文提出的方法对初始异常的诊断有相似的效果,对于Kurtosis来说,它对信号的异常变化非常敏感,当滚动轴承运行异常时,振动信号会有一个瞬态尖峰,因此Kurtosis会有明显的变化,但是会造成诊断结果不稳定,造成误判的机率会增大。且从Ⅱ中可以看出,Kurtosis并不能很好地反映滚动轴承从早期故障到退化末期的逐步失效趋势,对维修指导意义不大。所以不能为评估滚动轴承的状况提供非常有价值的诊断特征。而对于RMS,在滚动轴承早期故障产生时其振动信号并没有产生异常,在Ⅱ中看出,RMS只在故障产生的后期出现了波动,且波动幅度很小,所以不能作为评估指标来很好的反映滚动轴承的运行状态。另外两种方法(SDAE+RMS、SDAE+Kurtosis),由Ⅰ可以看出,虽然通过SDAE训练,学习到了稳定的特性,但是对状态变化并不敏感。而经过BO的SWDAE-LSTM算法不仅可以对滚动轴承早期异常非常敏感,并且可以反映滚动轴承后期的退化趋势,在诊断过程中滚动轴承的信号稳定,因此能够对滚动轴承早期故障进行预测。

3.3.2 定量对比分析

为了进一步定量验证本文提出的基于贝叶斯优化的SWDAE-LSTM方法的有效性,利用SVDD来表示故障发生时的信号位置。同样的,我们将SVDD与表4中的其他几种方法结合起来,显示每种方法的预测周期通过比较故障报警发生时的运行时间来评估不同方法的有效性。对实验B中1#滚动轴承进行早期异常的预测,为了说明使用深度学习方法的先进性和有效性,使用单类的SVM方法和本文方法进行对比。预测的结果如图15所示。

图15 1#滚动轴承故障预测结果定量比较Fig.15 Quantitative comparison of failure prediction results of 1#rolling bearing

由图15可以看出,经BO的SWDAE-LSTM模型可以在10 070个周期内进行故障报警。相比其他方法,BO算法优化的网络的精度更高,能够更早的发现滚动轴承的早期故障,效果优于其他方法。在RMS、Kurtosis这两种方法结合了SDAE后,相对于直接使用统计指标RMS、Kurtosis的早期故障预测时间,虽然提前了约600个周期,提高了滚动轴承早期故障预测的效果,但仍滞后于本文所提方法。因此,经BO的SWDAE-LSTM模型可以更早的预测到滚动轴承早期故障的出现,能够对滚动轴承早期故障进行预测,末期退化过程也得到良好反映,同时也表明SDAE提取的数据特征更加稳定。

3.3.3 滚动轴承故障诊断实验分析

为了验证经过BO算法优化的SWDAE-LSTM网络的有效性和可靠性,将本文提出的方法与支持向量机自编码、堆栈降噪自编码、循环神经网络、SDAE-RNN这几种常见的故障诊断方法的结果分别进行对比。其中SVM的输入维滚动轴承振动信号的16个时域统计特征和13个频域特征,并且选择SVM常用的损失函数L2,对于RNN、AE、SDAE、SDAE-RNN的输入与本文提出的方法使用同一个输入数据。同理,为了保证实验的可比较性,我们将要对比的网络的超参数有BO算法惊醒优化得出,如表4所示,为模型的部分超参数。

表4 不同方法超参数设置Tab.4 Different methods for hyperparameter setting

上述方法均使用Adam自适应学习率的方法对模型进行训练,经过迭代训练之后,得出每个方法所对应的准确率,如表5及图16所示。

表5 不同方法诊断精度Tab.5 Different diagnostic accuracy methods %

图16 模型诊断结果Fig.16 Model diagnosis results

如图16所示,为每种方法的故障诊断精度,SVM相比于其他深度学习其准确率较低,说明人工拟合特征结合模式识别并不能对故障进行准确识别,具有一定的局限性。AE与SDAE在特征提取方面其准确率由于RNN,SDAE经过多层非线性映射,相比于AE来说,其非线性特征提取能力较强。由于采用的输入数据一致,但SDAE-RNN网络的故障诊断准确率相比于SDAE-LSTM较低,在经过滑动窗之算法预处理的数据,保留了数据之间的时序关联特性,LSTM能够提取数据之间的时序关联特性。综上,SWDAE-LSTM网络在故障诊断方面也具有很高的精度,证明经过BO算法优化的SWDAE-LSTM网络的有效性和可靠性。

4 结 论

(1)简述了滚动轴承早期故障诊断的重要性,指出传统时域特征提取方法的不足,以及超参数组合对模型精度的影响,提出一种基于贝叶斯优化的SWDAELSTM网络模型。

(2)提出的模型不仅可以学习数据的分布,保留数据之间的时序相关性,而且在超参数选择方面,避免了手动调参费时和参数不确定性的问题,保证了模型的精度和准确率,能更好的监测滚动轴承运行状态。

(3)经贝叶斯优化的模型与其他特征提取模型结合SVDD和单类别SVM方法相比,可以更早有效的预测出滚动轴承的早期故障,且具有很强的鲁棒性,对于预测滚动轴承的早期故障和生命周期计算具有重要意义。

猜你喜欢
贝叶斯优化故障
超限高层建筑结构设计与优化思考
民用建筑防烟排烟设计优化探讨
关于优化消防安全告知承诺的一些思考
一道优化题的几何解法
故障一点通
贝叶斯公式及其应用
奔驰R320车ABS、ESP故障灯异常点亮
基于贝叶斯估计的轨道占用识别方法
一种基于贝叶斯压缩感知的说话人识别方法
故障一点通