基于流形嵌入分布对齐的滚动轴承迁移故障诊断方法

2021-04-28 03:49王肖雨童靳于郑近德潘海洋潘紫微

振动与冲击 2021年8期

王肖雨，童靳于，郑近德，潘海洋，潘紫微

(安徽工业大学机械工程学院，安徽马鞍山 243032)

滚动轴承作为旋转机械设备中最重要的零部件之一，广泛应用于现代工业领域中，当其发生损坏时，直接影响机械设备的安全性，因此对故障轴承故障诊断的研究具有重要的现实意义[1]。目前滚动轴承的故障诊断步骤主要包括信号获取、特征提取以及故障分类等[2]。故障分类可通过K最邻近(K-nearest neighbor, KNN)[3]、支持向量机(support vector machine, SVM)[4-5]、随机森林(random forest, RF)[6]等传统机器学习方法实现。

传统的机器学习存在两个前提：①训练数据和测试数据分布相同；②目标诊断数据样本充足[7]。设备只有在工况平稳时才能满足这两个前提。然而，实际工业中，滚动轴承时常工作在变工况环境下，导致目标诊断数据无法直接获取、测试数据与训练数据分布存在差异。此时，基于原工况下训练的分类模型被用于新工况，模型泛化效果差，分类精度低。面对滚动轴承变工况诊断难题，大多数机器学习采用在新工况下重新采集、标记目标故障数据来解决，不仅消耗人力物力且代价昂贵[8]。随着物联网和工业互联网技术的快速兴起和普及，轴承运行过程中海量不同但相关的的监测数据被采集并逐渐积累。

将某个领域(源域)上学到的知识应用到不同但相关的领域(目标域)中的方法称为迁移学习[9]。迁移学习的出现打破了上述机器学习的两个前提。迁移学习包括基于基于样本的迁移、基于模型的迁移、基于特征的迁移和基于关系的迁移[10]。近年来，这些迁移学习方法逐渐从文本和图像识别领域被推广应用至机械设备故障诊断领域[11]。文献[12]提出了一种基于样本的深度迁移网络，通过选择与目标数据相匹配的源域样本来辅助模型训练，实现了目标数据标记不足时滚珠丝杠的退化识别。文献[13]提出了一种基于长短期记忆网络的样本迁移学习方法来生成辅助数据集，用于诊断轴承故障，解决了目标数据标记样本有限的问题。文献[14]提出一种基于深度自编码器的模型迁移学习方法，用于齿轮箱的故障诊断，该方法利用源域预训练一个模型，然后使用少量目标数据从源模型获得的参数知识迁移到目标模型。上述基于样本的迁移和基于模型的迁移主要被应用于目标数据含有少量标签的半监督诊断任务。文献[15-16]将故障特征嵌入到流形子空间进行流形特征变换以此获得更好的特征表示，从而减小域间数据偏移，实现了对不同工况下滚动轴承的故障诊断。文献[17]将卷积神经网络与联合分布自适应(joint domain adaptation, JDA)相结合，通过对源域和目标域边缘分布和条件分布进行对齐，实现了对不同工况下风力发电机的故障诊断。上述基于特征的迁移通过领域自适应减小源域和目标域特征分布差异，被广泛应用于目标数据不含标签的无监督诊断任务。

上述基于特征的领域自适应迁移方法还存在如下问题：①只在子空间进行流形特征学习，没有对变换后的流形特征进行分布对齐，子空间学习只利用了子空间或流形结构获得了更好的流形特征表示，然而子空间学习后，特征发散并没有被消除；②只对源域与目标域之间的原始特征进行分布对齐，但未对原始特征进行子空间学习且未定量评估边缘分布与条件分布的权重，分布对齐只减小了特征分布差异，然而在原始空间中，特征会被扭曲，域间数据会发生偏移。

针对上述问题，本文提出了一种基于流形嵌入动态分布对齐的域自适应滚动轴承迁移故障诊断方法，来解决变工况下滚动轴承故障诊断问题。首先，利用子空间学习将源域和目标域特征变换为流形特征，避免了特征扭曲以此获得更好的流形特征表示；其次，对变换后流形特征的边缘分布和条件分布给定不同的权重，从而对流形特征进行动态分布对齐。本文方法同时利用了子空间学习和动态分布对齐的优点，最小化源域与目标域之间的分布差异，从而将基于源域和目标域训练的分类模型更好的用于无标记的目标域故障的分类，对不同工况下的滚动轴承实验数据分析验证了所提方法的有效性。

1 域自适应理论

图1 领域自适应示意图

2 流形嵌入分布对齐

领域自适应的目的在于最小化源域与目标域之间的分布差异，下面通过两个方面实现这一目的：一方面，在子空间进行流形特征学习避免特征扭曲，以来获得更好的特征表达；另一方面，在子空间学习的基础上，通过动态调节特征边缘分布和条件分布的权重，以此进行自适应的分布对齐。

2.1 流形特征学习

在原始空间中，源域Ds和目标域Dt数据特征分布不同，直接进行迁移会导致数据发生扭曲变形，可以通过一个特征映射，把Ds和Dt变换到一个公共空间上，在这个空间里，它们的距离是最小的，再利用传统的机器学习方法进行分类。文献[18]提出，将两个分布分别映射到Grassmann流形空间中，在流形空间中Ds和Dt就可以看成两个点Φ0和Φ1，两点之间的路径通过测地线流{Φ(r):0≤r≤1}构成。流形空间中的特征z可以表示为

z=g(x)=Φ(r)Tx

(1)

式中：x为原空间中的特征；g为流形特征学习函数。

分别计算两个原始d维特征向量xi，xj在Φ(r)上的投影zi，zj，变换后特征zi和zj的内积定义了一个半正定的测地线流式核G。

(2)

使用核G可以导出对域特征的低维表示。

2.2 动态分布对齐

动态分布对齐的目的在于定量评估边缘分布(P)和条件分布(Q)的重要性。现有的方法[19-20]通常假设这两种分布权重相同，而实际应用中，这一假设并不成立。例如，由图2(a)迁移至图2(b)，源域与目标域数据集差异较大，此时边缘分布对齐更为重要；相反由图2(a)迁移至图2(c)，源域与目标域数据之间数据集相似，各类别的差异较为明显，此时条件分布对齐更为重要。

图2 源域和目标域数据的不同分布情况

(3)

当μ→0，表示源域与目标域之间数据分布差异较大，此时，边缘分布对齐更为重要(图2(a)→图2(b))，此时方法等同于迁移成分分析(transfer component analysis，TCA)；当μ→1，表示源域与目标域之间数据集相似性较高，对每个类别的分类更为重要，此时，条件分布对齐更为重要(图2(a)→图2(c))；当μ=0.5，表示边缘分布对齐和条件分布对齐同等重要，此时方法等同于JDA。因此，通过学习最优的自适应因子μ，动态分布对齐可用来处理边缘分布差异较大或条件分布差异较大的域适应问题。

采用最大均值差异(maximum mean discrepancy,MMD)[21]来计算两个域之间的分布差异。P和Q之间的MMD距离MP和MQ可以表示为

(4)

(5)

式中，HK为特征映射φ形成的再生核希尔伯特空间(RKHS)。

至此，在流形特征变换和分布对齐的基础上，基于源域数据和目标域数据训练的分类模型即可用于对目标域数据的分类识别。

3 基于特征提取的域自适应迁移模型

3.1 信号特征提取

为了提取与故障密切相关的敏感特征，利用CEEMDAN对振动信号进行分解，得到若干IMF分量[22]。CEEMDAN是基于EEMD所提出的的一种改进算法，相较于EMD和EEMD，CEEMDAN在提高分解效果的同时，改善了分解完备性，揭示了振动信号的局部多尺度特性，可以为故障诊断提供更准确、全面的信息。峭度作为衡量信号中的冲击成分的指标，通常，峭度越大表明信号中的冲击成分越大。对每个IMF分量分别计算其峭度值，选取峭度值较大的前 6 个 IMF 分量分别提取均值、均方根值、平均幅值、方根幅值、最大峰值、标准差、峭度指标、峰值指标、偏斜度指标、裕度指标、脉冲指标、波形指标 12个时域特征指标，并提取均方根频率、重心频率、频率方差及峭度频域、频域标准差5 个频域特征指标，对每个IMF分量提取17个特征指标[23]，共102个特征，作为迁移模型的输入。

3.2 训练分类器

流形嵌入分布对齐方法利用结构风险最小化原则(structural risk minimization,SRM)训练一个域不变的分类器f

(6)

该分类器的训练步骤如下：

步骤3利用变换后的特征zs=z1:n和zt=z1:m构造核函数K，由此，高维空间数据被映射到低维流形空间中；

步骤4对变换后的流形特征进行动态分布对齐，最小化域之间分布差异，得到域不变分类器f；

步骤6最后返回分类器f。

3.3 基于所提模型的故障诊断流程

所提模型故障诊断具体流程如图3所示，过程如下：

步骤1将已知标签的振动信号作为源域，未知标签的振动信号作为目标域，并对源域振动信号和目标域振动信号进行CEEMDAN分解，得到若干IMF分量；

步骤2基于峭度值选取敏感的IMF分量，并提取其时域和频域特征，构建已标记源域训练样本和未标记目标域测试样本；

步骤3利用流形嵌入分布对齐对源域训练样本与目标域测试样本进行流形嵌入和动态分布对齐域适应处理；

步骤4使用域适应后的源域数据样本集和目标域数据样本集训练分类模型，以获得未知标签的滚动轴承故障诊断结果。

图3 基于所提模型故障诊断流程图

4 实验验证

4.1 数据集描述

为了验证所提方法的有效性，将其应用于轴承故障试验数据分析。试验数据采用安徽工业大学的滚动轴承试验测试数据。实验测试平台如图4所示，测试轴承为6206-2RS1 SKF，包括7类轴承运行状态： a，b分别为故障直径为0.3 mm，0.4 mm的内圈故障(NQ1，NQ2)； c，d分别为故障直径为0.2 mm，0.3 mm的外圈故障(WQ1，WQ2)； e，f分别为故障直径为0.2 mm，0.4 mm的滚动体故障(GDT1，GDT2)； g为正常轴承运行状态(ZC)。设定采样频率10.24 kHz，在不同负载下(7 kN，8 kN，9 kN，10 kN)采集每种轴承状态的监测数据。

图4 轴承实验测试平台

选取7 kN下7类轴承故障的振动数据作为源域数据集，以1 024个点为一个样本，每类轴承故障状态取100个样本。分别选取8 kN，9 kN，10 kN下7类轴承故障的振动数据作为目标域数据集，以1 024个点为一个样本，每类轴承故障状态取20个样本。构建数据集如表1所示。创建三类迁移任务：7 kN→8 kN，7 kN→9 kN，7 kN→10 kN，其中源域为7 kN，目标域为8 kN的时域信号如图5所示。

表1 滚动轴承迁移学习数据集

将不同运行状态下的时域信号采用CEEMDAN对其进行分解，其中，CEEMDAN中添加的白噪声标准差为0.2，添加的白噪声次数为100，允许的最大筛选迭代次数为8；然后，对其分解得到的前6个峭度较大的IMF分量，分别提取17个特征指标(12个时域、5个频域)，共102个特征，即将一个1 024个数据点的样本变为 102个数据点的样本作为迁移模型的输入。

图5 不同运行状态下滚动轴承时域信号

4.2 实验结果分析

为了验证所提方法的有效性，将本文方法与传统机器学习方法，包括SVM，RF，KNN和其他三种迁移学习方法，包括TCA，JDA，GFK对比，所有方法均使用基于CEEMDAN降维后的数据集进行试验，迁移学习方法均采用KNN作为基础分类器来训练模型。SVM的核函数采用RBF函数，惩罚因子设置为1，核函数参数设置为1；RF中决策树个数设置为200；本文方法中子空间维度d设置为40，正则化参数：η设置为0.1，λ设置为5，ρ设置为0.1；GFK，TCA，JDA与本文方法中相同的参数保持一致。

为了避免实验结果的偶然性，对所有方法重复试验10次，在三类迁移任务中，10次重复试验平均准确率如图6和表2所示。

图6 不同方法的分类准确率

表2 不同方法的分类准确率

为了说明本文所提方法在处理训练数据和测试数据分布不同、目标诊断数据样本不充足方面的优越性，将迁移学习方法与传统机器学习方法对比；同时，为了说明所提方法在最小化源域与目标域分布差异方面的优越性，将本文所提方法与其它迁移学习方法对比。

4.2.1 与传统机器学习方法对比

从表2中可以看出，首先，四种迁移学习方法TCA，JDA，GFK和本文方法的平均准确率均高于90%，明显高于传统机器学习方法SVM的70.71%，RF的65.98%和KNN的80.95%。原因在于由于工况不同，导致源域和目标域数据分布不同，传统机器学习直接将基于源域数据训练所得模型用于目标域测试，模型泛化效果差，分类精度低。而基于数据特征的迁移学习方法考虑了不同工况下特征分布的差异，减小了源域与目标域的分布差异，分类效果显著提升。因此，与传统方法相比，证明了在处理源域和目标域数据分布不同时迁移学习的必要性及优越性。

4.2.2 与其它三种迁移学习方法对比

将本文方法与GFK方法比较可以看出，本文方法平均准确为98.31%，高于GFK方法的90.24%。是因为GFK方法将原始特征嵌入到子空间中进行流形特征变换，减小了域间数据偏移，但并未进行分布对齐，特征存在发散，在一定程度上降低了分类器的学习效率。本文方法在流形特征变换的基础上，对变换后的特征进行动态分布对齐，在一定程度上解决了变换后的特征发散现象。

将本文方法与TCA和JDA方法比较可以看出，本文方法平均准确率大于JDA方法的93.78%，大于TCA方法的91.43%，主要原因在于TCA和JDA方法直接将源域和目标域中的数据在原始空间中进行分布对齐，这种对齐方式会导致分布差异较大的数据之间存在较大偏移，从而导致数据出现扭曲变形，分类精度下降。本文方法在对特征分布进行对齐前先将特征嵌入到流形子空间进行流形特征变换，避免了数据发生扭曲，减小了域间数据偏移。此外，实验中发现，随着迭代次数增加自适应因子μ的值均大于0.5，如图7所示，证明源域与目标域之间条件分布差异更明显，而TCA仅考虑了边缘分布对齐(此时μ→0)；JDA假设边缘分布和条件分布对齐同等相同重要(此时μ= 0.5)；而本文方法自适应调节边缘分布与条件分布的权重，赋予了条件分布更高的权重。这也是本文方法优于JDA和TCA的原因之一。

图7 自适应因子μ与迭代次数的关系

因此，对比现有特征迁移学习方法，本文方法同时利用子空间学习进行流形特征变换与动态分布对齐，在最小化源域与目标域特征分布差异方面取得了更好的效果。

综上，通过本文方法与传统机器学习方法对比，验证了迁移学习方法(包括本文方法)在处理源域和目标域数据分布不同问题时的必要性；通过本文方法与现有特征迁移学习方法对比，验证了其在最小化特征分布差异方面的优越性。

4.3 特征可视化

最后，为了深入了解域自适应迁移学习的工作机制，进一步分析输出的特征数据，利用t-分布邻域嵌入(t-distribution stochastic neighbor embedding，t-SNE)算法将迁移任务7 kN→8 kN的分类结果以二维散点图形式呈现，如图8～图10所示。对比图8、图9可知，直接对原始数据进行迁移，特征区分效果较差，原因在于原始数据中包含过多不相关的特征，增加了学习任务的难度；而经CEEMDAN处理提取过的特征，特征区分趋向明显，证明所提特征能较好表征故障数据。对比图9、图10可知，尽管图9所提特征能较好表征故障数据，然而在源域和目标域条件分布存在差异的前提下，基于源域训练的诊断模型直接用于目标域测试，模型泛化效果差，特征区分不明显。本文所提方法通过特征提取和域自适应，将源域故障特征分布向目标域迁移，放大了不同工况下源域和目标域数据相似信息，同时抑制了差异性信息对故障诊断过程的影响，使得到的故障特征更具代表性，更易区分。

图8 原始数据散点图

图9 CEEMDAN所提特征散点图

图10 所提方法特征散点图

5 结论

本文提出了一种基于流形嵌入分布对齐的域自适应滚动轴承故障诊断方法，旨在解决不同工况滚动轴承故障诊断任务，主要得出以下结论：

(1) 将不同工况下的滚动轴承时域信号通过CEEMDAN分解，保留了丰富的故障特征，为故障诊断提供更准确、全面的信息。

(2) 基于流形特征学习和动态分布对齐的域自适应方法能够最小化训练数据与测试数据之间的差异，将基于源域和目标域训练数据学习到的分类模型更好的用于目标域，以此提高分类准确率。

(3) 在变工况条件下，目标域数据集小量且不含标签，难以有效训练诊断模型，所提方法能够依据源域已知标签的诊断知识辅助识别目标域轴承状态。通过对比传统机器学习方法和其它迁移学习方法，验证了本文方法在处理变工况目标域小数据集下滚动轴承状态识别时具有较高的准确率。