基于多源域自适应残差网络的滚动轴承故障诊断

2024-04-20 11:29高学金张震华高慧慧齐咏生
振动与冲击 2024年7期
关键词:子域源域故障诊断

高学金, 张震华 , 高慧慧 , 齐咏生

(1.北京工业大学 信息学部,北京 100124;2.数字社区教育部工程研究中心,北京 100124;3.城市轨道交通北京实验室,北京 100124;4.计算智能与智能系统北京市重点实验室,北京 100124;5.内蒙古工业大学 电力学院,呼和浩特 010051)

滚动轴承是旋转机械设备中承受载荷和传递动力的核心部件,广泛地应用于工业领域中。然而很多设备中的滚动轴承长时间工作在高温、高压等恶劣的工况下[1]。因此,滚动轴承是极易损坏的元件之一,而一旦机械设备的滚动轴承发生故障,例如磨损、断裂等,极有可能会产生严重的后果[2-3]。据相关文献统计,轴承故障占机械设备总故障的40%~50%[4-5]。因此,及时、准确地识别轴承的故障至关重要[6-7]。

近年来,深度学习在轴承故障诊断领域得到了广泛应用。其中最常用是深度卷积神经网络(deep convolutional neural networks,DCNN)[8-9]、长短期记忆网络(long short-term memory,LSTM)[10]、自动编码器(autoencoder,AE)[11]和支持向量机(support vector machine,SVM)[12]等。这些方法通常可以很好地解决大多数滚动轴承故障诊断问题[13],这得益于大量标记的、相同分布的训练数据[14]。然而,在工业中很难满足这一假设,因为轴承的工作条件随着不同的任务不断变化[15-18]。由于训练和测试数据的分布不同,性能上也会出现差距,这通常被称为域移位[19]。因此,一种称为无监督领域自适应(unsupervised domain adaptation,UDA)[20]的研究发展起来,其主要思想是通过利用已标记的源域数据和未标记的目标域数据减少跨域不匹配问题的影响[21]。目前,将UDA集成到故障诊断模型中的主流方法有两种:统计距离度量方法和领域对抗训练方法。第一类方法通过减小统计指标从而缩小源域和目标域的分布差异,例如最大平均差异(maximum mean discrepancy,MMD)[22]及其改进版本,包括多项式核诱导MMD(PK-MMD)[23]和联合MMD[24]。Li等[25]采用Wasserstein距离度量准则测量分布差异,并在此基础上开发用于部分域自适应的双重对齐策略。UDA的第二类方法利用生成器和鉴别器之间的对抗训练实现特征对齐。Farajzadeh-Zanjani等[26]提出一种GBSS(generative-adversarial based semi-supervised)的生成对抗学习方法,以捕获训练样本的分布,从而提高在恶劣条件下的诊断性能。然而对抗学习方法在对抗训练的过程中会造成某些信息的丢失。统计距离度量方法忽略了两个域中子域之间的关系,混淆相关子域的分布和故障分类结构,可能会丢失每个类的细粒度信息。且传统UDA方法主要设计为从单个源域适应到单个目标域(single-target domain adaptation,STDA),即目标域服从单一分布,这限制了其工业适用性。

随着工业自动化的发展,各类旋转机械在多工序、多任务约束下,其轴承转速与载荷均会发生变化。故障诊断中的迁移任务不可避免地需要执行多次,具有多个目标分布的多工况故障诊断场景,尚未得到很好的解决。多目标域自适应(multi-target domain adaptation,MTDA)旨在将知识从已标记的源域数据转移到多个未标记的目标域数据[27]。与单目标域自适应(STDA)相比,MTDA中的特征分布更为复杂和广泛。虽然UDA方法的研究已经相当成熟,但大多数UDA方法都不能简单地扩展到多目标域,而且传统的UDA方法不可避免地在单一域上进行过拟合, 当诊断样本为多个目标域时,会导致较高的误诊率[28]。

为了解决传统无监督领域自适应方法扩展到多目标域轴承故障诊断适用性较弱的问题,本文提出了一种多源域自适应残差网络进行多工况下的滚动轴承故障诊断。该网络以滚动轴承已标记源域数据和未标记目标域数据作为输入,利用特征提取器充分提取可迁移特征。引入局部最大平均差异(local maximum mean difference,LMMD)度量准则,计算两域间的特征分布差异以最小化类内距离和最大化类间距离,减少相关子域间和全局域间的分布差异,进而对齐全局分布和边缘分布。基于西储大学标准轴承数据集和MFS(machine failure simulation)机械综合故障试验台产生的真实轴承振动数据,进行了多工况迁移试验验证,与现有代表性方法相比,多源域自适应残差网络(multi-source domain adaptive residual network,MDARN)具有更好的故障诊断性能,试验结果证实了该方法在多工况下滚动轴承故障诊断的有效性。

1 问题定义和理论背景

1.1 问题定义

1.2 Inception block卷积模块

传统卷积神经网络为获得更深层次的特征图,倾向于使用更深层次的架构,这导致参数过多,训练难度大,更重要的是增加了时间和空间消耗[29]。然而,Inception模块为提取更深层次的特征图提供了一种不同的方法。Inception模块包含几个具有不同内核大小的并行卷积层,其架构如图1所示。初始块有四个不同的卷积层:内核大小为1×1的卷积层(缩写为conv1×1)、conv2×2、conv3×3和内核大小为3×3的最大池化层。经过四个不同图层的提取后,输出特征图被连接到其最后一个通道。由于不同通道中卷积核的大小不同,来自不同通道的特征呈现不同的含义。同时,Inception模块克服了传统神经网络的缺点,并行架构减少了反向传播中梯度的下降。

图1 Inception模块Fig.1 Inception module

1.3 ResNext网络

近年来,卷积神经网络在计算机视觉、图像分类等领域得到了广泛的应用。深度卷积神经网络得到蓬勃发展,但是随着浅层叠加成深层网络,模型出现退化和梯度爆炸等现象。而ResNet[30]残差块的跳跃连接,缓解了梯度消失的问题。鉴于Inception的“拆分—转换—合并”策略在计算复杂度较低的情况下,达到接近大型密集网络的特征提取能力。基于此,Xie等[31]提出了ResNeXt网络,ResNeXt是ResNet和Inception的结合体,其本质是分组卷积。ResNeXt采用了ResNet的重复层策略,同时利用了“拆分—转换—合并”策略,如图2所示。ResNeXt在保持或降低参数复杂度的前提下提高精度,同时减少超参数的数量。ResNeXt网络的残差部分,输入特征被分割成 32个低维嵌入,之后对32个低维嵌入进行变换,再嵌入聚合。右侧的捷径(Shortcut)从输入连接输出,主线由聚合后的输出与右侧捷径输出相加,之后经过ReLu激活函数得到整个块的输出。

图2 ResNeXt模块Fig.2 ResNeXt module

1.4 局部最大均值差异LMMD

为了减小源域和目标域之间的分布差异,本文引入差异度量准则计算两域间的特征分布差异。最大均值差异(MMD)[32]是度量两种分布差异的有效距离指标。给定源域D(s)和目标域D(t),源域和目标域样本分别取自不同的概率分布p,q。通过核函数φ(g)将数据映射到再生核希尔伯特空间(RKHS)H中,两域之间的MMD距离可表示为

(1)

(2)

式中,δ>0为带宽参数。

局部最大均值差异(LMMD)[33]是由MMD演变而来的。两域之间的LMMD距离可表示为

(3)

(4)

(5)

式中,zl为第l层全连接层的激活(l∈L={1,2,…,|l|})。

2 基于MDARN滚动轴承变工况故障诊断

2.1 网络模型结构

MDARN网络模型结构如图3所示。主要包括特征提取器、子领域自适应和故障分类器。在诊断过程中,具有标记样本的两个源域D(s)提供诊断知识,而没有标记样本的两个目标域D(t)期望从D(s)学习诊断知识。特征提取器分别提取两个源域D(s)和两个目标域D(t)的有效故障表示特征;在子领域自适应中,通过最小化源域和目标域间同一故障类别子域的分布差异,从而拉近同一故障类别的分布;最后,由训练好的共享故障分类器对来自两个D(t)的未标记样本进行分类。

首先对数据预处理,将已标记的源域数据D(s)和未标记的两个目标域数据D(t)利用小波变换统一转换为256×256的时频图;将ResNeXt设计为特征提取器,以分别在源域数据D(s)和目标域数据D(t)中挖掘可迁移特征。ResNeXt分组卷积中每个分支的拓扑结构都是相同的。在特征提取器中,ResNeXt包括初始化操作和四个残差块,残差块中有32个通道和4个不同的卷积核,见图2。对于D(s)和D(t)的输入,ResNeXt特征提取器的相应输出是1×2 048矢量特征;最后,采用完全连接层连接特征提取器,分别获得D(s)数据集的1×2 048向量Zs1、Zs2和两个D(t)数据集的1×2 048向量Zt1、Zt2。表1给出了网络模型结构参数详情。

表1 模型结构参数Tab.1 Model structure parameters

由于工况的变化,训练数据和测试数据的分布不同,模型的诊断性能也会出现差距,这通常被称为域移位,多目标域的域偏移则更加严重。为了有效测量源域和目标域之间的特征分布差异,如图3所示,本文在全连接层FC中嵌入领域自适应模块,该模块采用局部最大平均差异(LMMD)准则计算两域样本之间的分布差异。由于同一故障类别具有更强的相关性,通过对齐具有相同标签样本的子域可以匹配全局分布和局部分布。在子领域自适应层中,通过LMMD准则测量激活层中源域特征输出Zs1、Zs2和目标域特征输出Zt1、Zt2之间相关子域分布的差异,并将其距离作为MDARN模型的优化目标。以两个源域中每一故障类别的子域分布为基础,从源域的固有数据中学习更广义的诊断边界,扩大每一故障类别对应的子域的表示空间,计算目标域样本与每一个子域的分布距离,并将其最小化,从而对齐全局分布和边缘分布。特征自适应如图4所示,两目标域与源域之间的LMMD距离可表示为

图4 特征自适应Fig.4 Feature adaptation

(6)

2.2 MDARN的优化目标

MDARN的优化目标包括源域数据D(s)健康状态的域共享分类器损失Lc,以及源域数据D(s)和目标域数据D(t)之间子域分布的损失LLMMD。

(7)

式中:n为源域样本总数;C为样本类别数;zs为全连接层所生成的激活;f(zs)=softmax(zs);fc(zs,i)为输出f(zs,i)的第c个元素。

第二个优化目标LLMMD是源域数据集D(s)和多个目标域数据集D(t)中同一故障类别子域的分布差异,采用式(6)计算两域之间的LMMD距离。最后,MDARN模型的总体优化目标为

L=Lc+λLLMMD

(8)

式中,λ为超参数。

2.3 故障诊断流程

本文所提出方法的诊断步骤如图5所示。

图5 故障诊断流程图Fig.5 Fault diagnosis flowchart

(1) 首先,准备数据集,将有标记的源域样本作为训练集,无标记的目标域样本作为测试集。同时,利用小波变换将振动信号转换成256×256的时频图。

(2) 构造MDARN模型,并且初始化模型参数,将数据送入模型进行训练,计算LMMD距离损失LLMMD和分类损失Lc。

(3) 使用反向传播对模型参数进行更新,采用早停法防止模型过拟合,并且保存训练过程中性能最好的模型及其参数。

(4) 将测试集数据输入到训练好的故障诊断模型进行故障诊断。

(5) 将MFS机械综合故障试验台产生的真实轴承振动数据输入到训练好的故障诊断模型中,进行故障诊断试验验证。

3 多工况迁移试验

3.1 试验数据

本试验使用美国凯斯西储大学(Case Western Reserve University,CWRU)提供的轴承数据集作为基准数据集进行试验研究。该数据集被广泛用于试验验证,由采样频率为12 kHz的加速度传感器从电机驱动端采集。试验轴承在1 797 r/min、1 772 r/min、1 750 r/min和1 730 r/min四种工况下运行。为了模拟故障情况,利用电火花匹配技术,将不同故障直径(0.007、0.014、0.021英寸)的单点故障分别植入滚动轴承的内圈、外圈和滚珠。轴承故障位置位于内圈、外圈和滚珠,每种故障类型都含有三种损伤等级。因此,该数据集包含1种正常和9种故障状况,以1 024个连续时间序列的分段振动信号组成一个样本,每种状态都含有200个样本,每种工况下样本总数则为2 000。整个数据集的划分如表2所示。表3则详细描述了工况A下数据划分情况。工况B、C和D的数据划分方式同工况A。

表2 CWRU数据集Tab.2 CWRU dataset

表3 工况A下数据划分详情Tab.3 Details of data division under working condition A

3.2 试验参数设置

试验所使用计算机的系统为Windows;CPU为intel i5-12400F 16GB;GPU为NVIDIA GTX 1650 SUPER 4GB。试验环境:Pytorch 1.0.0;Python 3.9。训练过程

3.3 对比试验与分析

在本小节中,进行了多工况迁移试验。在每个试验中,其中两个工况被视为目标域,另外两个工况则被视为源域,如A+B→C+D任务将A和B视为源域,而C和D则视为目标域。因此,共有六种迁移场景。为了验证本文所提出的方法的优越性,在本试验中使用了几种目前最先进的方法与提出的方法进行比较,包括DDC[34]、DAN[35]、MFSAN[36]和MRAN[37]。Resnet网络作为比较的基准方法,也被纳入并测试。这些方法均按照论文中给定的参数复制模型。表4展示了各类方法在不同迁移任务中的识别准确率,并且计算了在每一种迁移任务中,本文方法相较于其他五种方法在该任务下最高诊断准确率的差值。由表4可知,六种方法的平均识别准确率依次为93.01%、94.46%、96.70%、96.72%、98.71%和99.76%。本文方法在所有故障诊断任务中的表现均优于相较于其他方法,其平均诊断准确率相较于表现最好的MRAN提升了1.05%。试验结果表明,在滚动轴承多工况迁移故障诊断任务中,本文所提出的MDARN方法获得了最佳诊断性能,故障诊断效果显著优于其他五种方法。这表明本文所提的方法提取到可迁移特征,并且有效减小了相关子域间和全局域间的分布差异。同时,表5统计了基于各个迁移任务中各模型迭代一次的训练用时、总训练用时和测试集测试用时。各方法的测试用时接近,而本文所提方法的总训练用时仅比MRAN方法的时间多了13.59 s,比DDC方法多了302.14 s, 却在故障诊断准确率上又获得了进一步的提高,因此本文所提方法在故障诊断上更有优势。以上试验结果验证了本文提出的MDARN方法在滚动轴承多工况迁移故障诊断任务中的优越性。

表4 不同迁移任务下的诊断准确率Tab.4 Diagnostic accuracy under different migration tasks

表5 模型训练及测试时间Tab.5 Model training and testing time 单位:s

由于有误分类现象的存在,本文计算了迁移任务A+B→C+D的分类混淆矩阵,以展示每个类别的分类精度。如图6所示,模型在故障诊断中对内圈和外圈故障的分类存在误差,但故障诊断平均准确率已达到99.65%,表现出较高的诊断精度。在其它的迁移场景中也是如此。这主要是因为在不同工况下,内外圈故障特征较为相近,导致特征产生混叠,从而造成了误分类现象。

图6 分类混淆矩阵Fig.6 Classification confusion matrix

3.4 特征可视化

为了更直观地分析本文方法的优点,选择迁移任务A+B→C+D的特征可视化图进行对比分析。本文随机挑选了200个样本,并使用t分布随机邻域嵌入(t-SNE)将高维特征降为二维可视化图。本文中的六种方法的可视化结果如图7所示。在图7中,黑色图形代表源域数据,灰色图形代表目标域数据,不同形状的图形代表不同的故障类别。由图7(a)、(c)、(d)、(e)可知,ResNet、 MRAN、DAN、DDC在分类时存在类别重叠和特征分布较近的问题。由图7(b)可知, MFSAN特征分布均匀,但存在个别特征误分现象。由图7(f)可知, MDARN学习到的特征分布差异要小得多,误分类样本也更少。MDARN有效的对齐了全局分布和同一类别子域的分布,各类别间具有明确的边界,便于分类器更好地识别故障类别。因此,可视化结果进一步印证了本文所提方法的优越性。

图7 t-SNE可视化结果Fig.7 t-SNE visualization results

3.5 算法实际验证

为了验证MDARN滚动轴承故障诊断方法在实际工程信号上的实用性,本文对MFS轴承故障模拟试验台上采集的真实的轴承振动信号进行试验验证。试验选用了Spectra Quest公司生产的MFS机械故障综合模拟装置,如图8所示。试验台能够模拟轴承外圈、内圈和滚珠发生故障时的情况,并提供轴承振动信号。通过对真实轴承振动信号进行故障诊断,以验证本文方法的有效性。

图8 MFS机械故障综合模拟试验台Fig.8 MFS mechanical failure comprehensive test bench

MFS数据集采集自电机驱动端的加速度传感器,用于测试轴承在不同工况下的性能表现,转子试验台负载力矩范围为0~6 N·m。不同转速的四种工况包括0负载下3 000 r/min、2 000 r/min、1 500 r/min和1 200 r/min。不同负载的四种工况包括2 000 rmp转速下0%、30%、60%、100%负载,轴承故障位置位于内圈、外圈和滚珠,因此该数据集包含四种轴承健康状况,其中包括一种正常和三种故障状态。每种状态都有200个样本,每种工况下共有800个样本。表6和表7分别描述了不同转速和不同负载下四种工况数据集的划分情况。表8描述了各工况下数据划分详情。

表6 MFS不同转速数据集Tab.6 MFS different speed datasets

表7 MFS不同负载数据集Tab.7 MFS different load datasets

表8 各工况下数据划分详情Tab.8 Details of data division under various working conditions

试验参数设置同上述变工况迁移试验。选出两种工况作为目标域,而余下的两种工况则被作为源域,因此不同转速和不同负载试验各有6种迁移场景。表9和表10分别展示了本文方法在真实轴承信号不同转速和不同负载的迁移任务中的故障诊断准确率。根据诊断结果,在对MFS轴承故障模拟试验台上采集的真实的轴承振动信号进行故障诊断时,本文所提出的方法仍能保持较高的故障诊断准确率,不同转速和负载的平均识别准确率分别为97.22%、96.99%。与在CWRU数据集上的试验结果相比,故障诊断准确率有所降低,这主要是因为从MFS轴承故障模拟试验台上采集的轴承振动信号有着较高的噪声和干扰。

表9 不同转速下轴承故障诊断准确率Tab.9 Accuracy of bearing fault diagnosis at different rotational speeds

表10 不同负载下轴承故障诊断准确率Tab.10 Accuracy of bearing fault diagnosis under different loads

为了展示每个类别的分类精度,本文计算了迁移任务E+F→G+H的分类混淆矩阵。由图9可见,模型对于外圈故障和正常状态的误分类是影响故障诊断准确率的主要原因。在其余的迁移任务中,也是如此。这主要是由于试验噪声和干扰的影响,不同工况下外圈故障和正常状态的特征较为相似,导致特征产生了混叠,进而引起误分类。尽管如此,故障诊断的平均准确率仍为97.22%,达到了较高的诊断精度。证实了本文方法在实际工程信号上的实用性。

图9 验证试验分类混淆矩阵Fig.9 Classification confusion matrix of validation test

4 结 论

针对在多工况多目标域滚动轴承故障诊断场景中,传统的无监督领域自适应方法适用性较弱的问题,本文提出了一种基于多源域自适应残差网络的滚动轴承故障诊断方法。该方法以ResNeXt作为主干网络,并且引入局部最大均值差异准则LMMD,以两个源域的子域为基础对齐目标域中的相关子域,从而有效减小子域间和全局域间的分布差异。在CWRU标准轴承数据集,选取5种现有代表性的方法进行对比试验,本文方法在对比试验中表现出最好的结果,证明了该方法的有效性和优越性。在MFS轴承真实振动数据上进行算法实际验证,证明了该方法在实际工程信号上的实用性。本文方法对于实际工业中的滚动轴承故障诊断具有一定的应用价值。

猜你喜欢
子域源域故障诊断
多源域适应方法综述
基于镜像选择序优化的MART算法
基于子域解析元素法的煤矿疏降水量预测研究
基于参数字典的多源域自适应学习算法
一种基于压缩感知的三维导体目标电磁散射问题的快速求解方法
因果图定性分析法及其在故障诊断中的应用
可迁移测度准则下的协变量偏移修正多源集成方法
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断
高速泵的故障诊断