预测轴承寿命的gate递归单元特征融合域自适应模型*

2024-04-24 01:04曾玉海魏春虎杨世飞
机电工程 2024年4期
关键词:源域轴承工况

曾玉海,程 峰*,魏春虎,杨世飞

(1.江南大学 机械工程学院,江苏 无锡 214122;2.南京凯奥斯数据技术有限公司,江苏 南京 210012)

0 引 言

滚动轴承是常见的机械零件,其性能好坏直接影响设备能否正常运行[1-2]。同时滚动轴承失效也会导致机器产生故障[3]。

滚动轴承的RUL预测可以帮助维修人员定制合理的维护计划,减少机器损坏和人员伤亡[4-5]。常见的滚动轴承RUL预测方法分为基于物理模型的方法和基于数据驱动的方法[6]。基于物理模型的方法是通过建立物理模型来描述滚动轴承的退化过程,然后预测出轴承RUL[7-8]。然而,机械系统结构的复杂性和工作条件的多变性严重干扰了物理模型的建立。采用计算机技术能够快速地建立基于数据驱动的模型,进而将其用于预测RUL。长短期记忆网络(long short-term memory,LSTM)和门控循环神经网络(gate recurrent unit,GRU)是常见的数据驱动模型,在分析时间序列方面具有天然的优势[8]。

PAN Zuo-zuo等人[9]提出了一种基于极限学习机的两阶段滚动轴承RUL预测方法,将轴承的运行阶段分为两种状态,并对RUL进行预测;但其只能实现单一工况的短期预测目的。CHENG Yi-wei等人[10]提出了一种基于深度学习的两阶段方法,利用快速密度峰聚类算法和多维深度神经网络来预测滚动轴承的寿命,分两阶段来预测RUL;但这一工作需要大量目标对应工况数据的支持。SHE Dao-ming等人[11]提出了一种基于Bootstrap的双向门控递归单元模型,预测RUL的置信区间;但其只在单一工况下有效。

数据驱动的方法虽然能在复杂条件下为滚动轴承的RUL提供较好的参考,但它需要满足两个假设:1)在相同的运行条件下收集训练和测试数据;2)丰富标记数据可用于RUL预测任务[12-13]。在现实情况中,通常无法满足这两个条件。而领域自适应(domain adaption,DA)却能够解决这一问题。DA能够将知识从富标记领域转移到不同但相关的稀缺标记领域[14-15]。DA常用的方法有最大均值差异和生成式对抗网络等。

CHEN Qing-chao等人[16]提出了一种基于可转让的卷积神经网络的预测模型,利用卷积神经网络提取降解特征,将多内核的最大差异集成到优化目标中以减少分布差异;但其忽略了大量目标任务特有的信息,导致精度下降。吕明珠等人[17]提出了一种基于深度子领域自适应回归网络以预测变工况轴承的RUL,完成了跨工况RUL的预测;但其对于局部空间特征的保留程度较低,丢失了许多有效信息。TZENG E等人[18]提出了对抗判别领域自适应(adversarial discriminative domain adaptation,ADDA)模型,以减少训练域和测试域之间的分布差异,从而提高了泛化性能;但该方法也丢失了相关信息,导致预测性能下降。

以上这些领域自适应方法虽然能够用于提取源域和目标域的共同特征,但只对齐了高层表示,没用利用复杂的多类结构和局部空间结构,当其他类别的特征不一致时,模型就会发生负迁移[19]。

笔者以轴承振动信号为研究对象,提取最佳特征子集,确定轴承的早期退化点,并构建域自适应轴承寿命预测模型,以对轴承寿命进行预测。

1 理论基础

1.1 对抗自适应

领域自适应方法通过降低源域上的误差,间接降低目标域上的误差。假设某一工况的样本数据分布为Ps(X,Y),同时,假设另一工况的样本数据分布为Pt(X,Y)。领域自适应的目标是学习目标域的高层映射Mt调整预测模型Ct,使其能够在目标域中达到理想的效果[20]。在对抗学习的过程中,模型通过调整源域映射Ms和目标域映射Mt,来最小化两映射之间的距离。

领域自适应总体框架如图1所示。

图1 对抗自适应框架

从图1中可知,在回归训练中,模型利用提取的全局特征在RUL回归器中对轴承寿命进行预测,通过预测误差来更新特征提取器参数和RUL回归器参数。

监督损失公式表示如下:

(1)

式中:Xs为样本数据;Ys为样本标签。

在对抗训练中,模型用回归训练后的特征提取器提取源域和目标域的特征,记为Fs,Ft,输入到域分类器中,得到源域和目标域的分类结果,计算分类误差,梯度反转后,再更新各部分参数。

域分类器的损失函数表示如下:

(2)

综上所述,对抗领域自适应的损失函数表示如下:

Lall=Lcls+Ladv

(3)

式中:Lcls为源域回归器损失;Ladv为域分类器损失。

1.2 门控循环单元

门控循环单元(GRU)是一种循环神经网络,能够克服反向传播中的梯度问题。

GRU的结构如图2所示。

图2 GRU单元结构

在图2中,Zt和rt分别是更新门和重置门,更新门控制前一时刻的状态信息被写入到当前状态的程度。重置门控制前一状态的信息被写入到当前的状态候选集Ht的程度[21]。

2 预测方法

2.1 GFFDA模型

为解决传统域自适应模型容易忽略局部特征的问题,笔者提出了改进自适应模型GFFDA,首先利用GRU网络提取轴承的高层特征作为最初的全局特征f,将轴承的退化特征X作为局部特征。

GFFDA框架如图3所示。

图3 GFFDA网络结构

从图3可知,模型集成多级特征后,采用全局互信息估计器MG和局部互信息估计器ML来最大化全局特征与局部特征的互信息,进而调整其他模块的参数。

该模块公式表示如下:

(4)

(5)

式中:MI为损失函数;h为RUL回归器输出;fs为源域特征;ft为目标域特征;X为目标域输入信号。

MI是测量联合分布P(X,Y)和边缘分布P(X)P(Y)之间的Kullback-Leibler(KL)散度,其公式表示如下:

MI(X,Y)=KL(P(X,Y)‖P(X)P(Y))

(6)

综上所述,GFFDA的总体损失函数表示如下:

(7)

式中:LC为RUL预测损失;LD为域鉴别器损失;α,β,γ为相关损失函数的权重。

2.2 基于GFFDA的轴承RUL预测方法

为了预测变工况下的轴承RUL,笔者提出一种基于GFFDA模型的轴承RUL预测方法,该方法通过特征筛选降低输入冗余,将筛选出的最优特征子集输入到SVM模型以判断轴承的早期故障点,最后采用GFFDA模型预测轴承RUL。

其预测流程如图4所示。

图4 轴承RUL预测方法流程图

该方法的具体步骤为:

1)收集不同工况轴承的振动信号,提取时域、频域和时频域的特征;

2)采用特征评价方法,筛选出最能够反映退化趋势的5个特征作为最优特征子集;选择Cri较高的特征作为最优特征子集[22]。其评价指标表示如下:

Cri=ω1Corr+ω2Mon+ω3Rob

(8)

式中:Corr为特征的相关性;Mon为特征的单调性;Rob为特征的鲁棒性。

根据研究经验,Mon反映了当前的数据和回归过程,权重应该设置为最大[23]。因此,ω2被设置为0.5。

因为Corr或Rob对退化的影响较小,可以根据经验进行设置。因此,ω1=0.2,ω3=0.3。

3)将最优特征子集作为优化后支持向量机(support vector machines, SVM)的输入,判断出支撑的早期故障点,划分退化阶段。

支持向量机超平面方程表示如下[23]:

(9)

式中:κ(x,xi)为(x)·φ(xi);φ(x)为关于x的映射变换;αi为权重系数;yi为真实值。

4)选择不同工况下的轴承数据作为源域和目标域,将退化阶段的最优子集作为GFFDA模型的输入,通过源域和目标域之间的对抗学习,寻找带有局部特征结构的共同特征;

5)将训练后的模型用于目标域工况测试样本;

6)输出RUL,评价模型性能。

3 实验与结果分析

3.1 数据描述

此处实验数据采用的是西安交通大学的轴承数据集[24]。该轴承加速试验平台如图5所示。

图5 轴承加速试验台

由图5可知,该试验平台由交流电动机、电动机转速控制器、转轴、支撑轴承、液压加载系统和测试轴承组成。

试验平台可调节的工况主要包括径向力和转速。其中,径向力由液压加载系统产生,作用于测试轴承的轴承座上,转速由交流电机的转速控制器来设置与调节。

试验轴承为LDK UER204滚动轴承。

数据集包含三类工况共15个滚动轴承的全生命周期数据。实验中设置的采样频率为25.6 kHz,采样间隔为1 min,每次采样1.28 s。

数据集描述如表1所示。

表1 XJTU-SY轴承数据集描述

在表1中,数据集分为训练数据集和测试数据集,训练数据集设置了寿命标签,测试集用来验证模型的性能。

3.2 特征评价

考虑到轴承振动的非平稳性以及噪声的影响,在提取特征前,通常要对振动数据进行标准化处理,再提取轴承的时域特征、频域特征和时频特征。

此处以轴承1-1为例,采用信号分析方法提取轴承时域,频域以及时频域等20个退化特征,编号为特征0到特征19。

轴承1-1中的部分特征如图6所示。

图6 轴承1-1的部分特征

由图6可知,图中具有冗余特征,通过对20个特征进行自相关性分析,发现有些特征具有较高的自相关性,需要对这些特征进行筛选,去除重复信息的特征。

为了对特征进行优选,得到最优特征子集,笔者分别计算了各个特征的相关性、单调性、鲁棒性。

特征评价结果如图7所示。

图7 特征评价结果

由图7可知,折线是特征的Cri值。由图7可以看出:较高相关性的特征综合评价值Cri也相对较高,单调性普遍较低,对评价的影响较小。其中,15号特征的鲁棒性最高,在反映退化趋势上,具有较强的泛化能力。

考虑特征之间的自相关性以及综合评价指标Cri,笔者选择特征编号为1,4,11,16,17作为最优特征子集。

它们的自相关性分析结果如图8所示。

图8 最优特征子集自相关分析热力图

由图8可知,最优特征子集的自相关性较低,有效减少重复信息,且Cri评分较高,能够有效代表滚动轴承的退化趋势。

3.3 健康阶段划分

健康阶段的划分是轴承RUL预测的关键。首先,笔者使用粒子群优化算法对SVM的参数进行优化,得到最优参数c,g;将训练数据集输入SVM,并采用优化算法来调整SVM的参数,得到最优的SVM模型。

SVM判断早期故障点的过程如下:

首先,定义退化指标Di,从第二个样本开始,若判断轴承处于健康状态,则Di(i)=Di(i-1)+0;若判断为故障状态,则Di(i)=Di(i-1)+1;为0表示轴承未进入到退化状态,Di越大则表示故障越严重。其中i为全生命周期样本数据第i个样本的数据。

对三种不同工况的轴承测试结果如图9所示。

图9 SVM早期故障点预测结果

由图9可知,轴承1-1的早期预测故障点为第65个样本。

为了验证早期故障点判断是否准确,以轴承1-1为例,对故障点前后的样本数据进行包络谱分析。

轴承1-1早期健康样本和故障样本包络解调结果如图10所示。

图10 轴承1-1早期健康样本和故障样本包络解调图

由图10(a)可知,轴承在第64个样本点谱峰出现在34.38 Hz。

由图10(b)可知,轴承在第65个样本点的谱峰值在10.82 Hz,34.38 Hz,以及108.6 Hz,与轴承的外圈故障频率理论值107.91 Hz接近。

故笔者认为轴承1-1在第65个样本点出现早期故障。

3.4 GFFDA模型训练和测试结果分析

GFFDA网络具有较强的时序特征提取能力和泛化能力。在该网络中,CONV网络和GRU网络作为特征提取器,全连接层作为RUL回归器和域分类器,Linear层作为互信息估计器。笔者设置模型的学习率为0.000 1,迭代次数为100,批处理大小为64,将RUL预测误差的均方根误差(root mean squared error,RMSE)作为评估指标,采用RMSProp优化器优化模型。

笔者创建了3个跨工况训练任务,将其用于验证GFFDA模型的有效性。

实验任务如表2所示。

表2 实验任务

由表2可知,迁移工况包括1到3、2到3、3到2。

为了验证该GFFDA模型是否能够有效预测轴承剩余寿命,笔者选择三个训练好的模型,将其用于该任务的RUL预测。

该GFFDA模型需要确定三个损失函数的权重系数。由于RUL的预测对目标数据的局部特征几乎没有影响,因此将β设置为0.1。笔者将不同的γ值作为模型参数进行实验,确定了在任务B,C中,当γ在0.5左右时,该模型具有最佳性能,表明目标数据的特定信息对训练过程中的预测效果有显著影响。在任务A中,γ设置为0.7时模型可以获得最佳性能。

为了验证对抗学习对源域和目标域共同特征提取的有效性,笔者将不同工况的轴承数据分别作为源域和目标域,利用t-SNE方法对高维特征进行降维,使其可视化。

领域自适应前后特征的分布对比如图11所示。

图11 GFFDA模型对抗训练前后特征分布对比

由图11可知,在领域自适应训练之前,源域和目标域的特征分布有较大差别,而经过领域自适应处理后,该特征分布的差异明显降低,但仍保持一定差异。

这表明,该网络能够用于有效地获取源域和目标域的共同特征,并保留各自工况的局部特征信息。

为了说明传统域自适应方法的局限性,笔者选择了ADDA模型进行对比实验。ADDA模型是一种传统的自适应模型[25],它可以从源域和目标域获得共同特征[26],但它失去了有用的局部信息。

使用ADDA模型提取的特征分布如图12所示。

图12 ADDA模型对抗训练后的特征分布

由图12可知,笔者提取的特征非常相似,说明ADDA模型丢失了相关信息,很难用于准确预测不同条件下轴承RUL。

笔者采用RMSE来量化模型在三个不同迁移任务中的性能。

RMSE表示如下:

(10)

三项任务中各种模型的评估结果如表3所示。

表3 不同方法性能对比

由表3可知:该GFFDA模型在所有方法中具有最低的RMSE。

就非自适应方法而言,由于数据分布差异较大,训练集所确定的预测模型无法在不同工况的测试集上取得比较满意的预测性能;而传统自适应方法由于丢失了局部特征,导致预测性能较差;该GFFDA模型在对抗学习的同时保留了目标工况的特定信息,提升了预测性能。

对比输入全生命周期数据,仅输入退化阶段数据的预测性能更好,说明了特征评价以及早期退化点确定的重要性[27]。

4 结束语

笔者提出了一种基于GFFDA的领域适应模型,将其用于预测不同工作条件下轴承的使用寿命。采用该方法可以找到不同工作条件下的域不变特征,同时保留RUL预测的特定信息。

研究结果表明:

1)通过最大化局部特征和全局特征之间的互信息,可以将局部信息集成到全局特征中,保持目标数据的特定结构。与现有的自适应方法相比,该模型具有更好的性能;

2)模型的整体损失函数的权重系数决定了保留局部特征的程度。γ越大,保留的局部特征就越多。对于大多数工作条件而言,当γ的值在0.3~0.7之间时,可以保留有效的局部特征,并获得良好的性能。

提取不同工况的共同特征又不丢失重要的局部信息是解决特征丢失问题的关键。因此,在下一步工作中,笔者将研究能够可视化局部信息的方法,对轴承RUL预测做进一步探索。

猜你喜欢
源域轴承工况
多源域适应方法综述
轴承知识
轴承知识
热网异常工况的辨识
轴承知识
轴承知识
不同工况下喷水推进泵内流性能研究
基于参数字典的多源域自适应学习算法
基于非负矩阵分解的高速列车走行部工况识别
可迁移测度准则下的协变量偏移修正多源集成方法