徐承军 于佰宁 秦 懿
武汉理工大学交通与物流工程学院 武汉 430063
滚动轴承是旋转机械的重要传动部件,在长时间高负荷工况下故障率较高,一旦出现故障且未得到及时维修,轻则影响生产系统的正常运行,重则将引发严重的灾难事故,故监测滚动轴承故障的准确性、时效性具有重要研究意义和应用价值。
现阶段深度学习方法在故障诊断领域被广泛应用,Wang F等[1]提出了一种自适应深度卷积神经网络的滚动轴承故障诊断方法,利用粒子群优化方法确定深层卷积神经网络模型的主要参数,以适应不同的信号特征;Zhu Z X等[2]提出了一种基于深度双向长短时记忆网络(Deep Bidirectional Long Short-Term Memory,DBLSTM)的高速列车轮对轴承故障诊断方法,通过堆叠多个双向LSTM(Long Short-Term Memory)层构建DBLSTM网络,对于复杂环境下测得的振动信号,可以有效地学习更复杂的故障特征。深度学习的应用需要满足2个条件:有足够的标记数据来训练模型、训练数据和测试数据具有相同的分布[3],这在实际故障诊断中通常很难实现。
针对以上问题,迁移学习可以利用源域学习的先验信息提升目标域中预测模型的性能,很好地解决故障诊断中的数据限制问题。Cheng C等[4]提出了一种基于Wasserstein距离的深度迁移网络,用于有监督和无监督的故障诊断任务,通过对抗训练最小化2域间的差异提高故障诊断的准确性;毛文涛等[5]基于深度自编码器网络构建了最大均值差异(Maximum Mean Discrepancy,MMD)与Laplace正则项的混合损失函数,以此提高早期故障在线检测结果的可靠性;王志超等[6]在MS-1DCNN模型中加入了迁移学习算法,利用联合最大均值差异(Joint Maximum Mean Difference,JMMD)对具体特征进行适配,很好地实现了源域训练模型到目标域的迁移,有效解决了目标域可用训练样本不足的问题;王业统等[7]以最大均值差异(MMD)作为优化指标,利用实验台中的样本训练模型实现权值微调,最终有效实现了故障诊断的模型迁移;曹现刚等[8]采用稀疏自动编码器从不同运行条件下的轴承中提取频谱数据特征,再最小化最大均值差异(MMD)以适应学习到的可迁移特征的分布。
鉴于此,本文提出一种基于生成对抗网络和多核最大均值差异(MK-MMD)的深度域适应迁移学习方法。通过深度域适应方法缩小仿真数据与实际数据之间的领域差异,从而使由仿真数据训练得到的故障诊断模型可应用于物理实体的故障诊断问题。最后,通过变工况实验,验证了深度域适应迁移学习方法的性能,同时也证明了基于有限元仿真和迁移学习的滚动轴承故障诊断方法的合理性。
迁移学习是指针对2个不同却相关的领域数据进行知识迁移,从而实现一个领域中的知识在另一领域中得以应用。迁移学习主要包含领域和任务2个基本概念,其中领域是进行迁移学习的对象[9],主要包括数据、数据标签及数据间的相互关系3部分;任务是学习的目标主要由标签和标签函数2部分组成,它们反映了源域和目标域的实际类别。
迁移学习主要包括源域和目标域2种领域。其中源域是指具有大量标签数据的领域;相对于源域,目标域中的数据通常缺乏标签。将使用源域数据训练好的分类器应用到目标域数据上,如果训练效果良好,则证明完成了迁移。
最大均值差异(MMD)是一种度量准则,主要作用是描述源域和目标域的距离,主要思想是当2个样本数据在样本空间的分布为线性不可分时,通过映射函数将样本数据从样本空间映射到再生核希尔伯特空间中,从而计算源域与目标域的样本数据之间存在的分布差异,最大均值差异(MMD)的计算公式为[10]
式中:X为源域,Y为目标域,xi为源域的第i个样本,yj为目标域的第j个样本,n、m分别为源域与目标域的样本数,φ为映射函数。
鉴于需要将样本数据映射到高维空间中,而高斯核函数就可以实现将样本数据映射至无穷维空间,所以最大均值差异(MMD)的核函数通常采用高斯核函数。高斯核函数的计算公式为
式中:x、y为输入空间的2个向量,σ为带宽,‖x-y‖为欧氏距离。
由于核函数的选取直接关系到样本空间与高维空间地映射关系,故核函数的合理选取将对MMD的性能产生较大影响。因此,本文选择多个高斯核函数增强模型的表征能力,MK-MMD表示多核最大均值差异[11],是在最大均值差异(MMD)的基础上改进而来的,其表达式为
式中:p、q为2个分布,X为源域,Y为目标域,φ为映射函数,H为希尔伯特特征空间。
多核最大均值差异MK-MMD多核kernel函数可表示为
式中:m为kernel加权,βu为权重。
由此可知,多核最大均值差异(MK-MMD)计算得到的K表征能力比单核最大均值差异(MMD)更强。
生成对抗网络由Goodfellow等[12]受博弈论的启发于2014年提出,主要包括生成器G和判别器D。生成器G的作用是获得目标域数据的分布,以随机噪声或源域数据作为输入并输出伪样本;生成器的目标是通过与判别器之间的不断对抗使其输出的数据与目标域的相似程度不断提高,最终使判别器分辨不出输出数据的真伪。然而,判别器作为对抗方,其目标就是提高自身对真伪样本的分辨能力。通过生成器与判别器的不断对抗,最终使优化后的生成器能生成与目标域数据具有相近分布的数据。生成对抗网络的优化目标表达式为
式中:D为判别器;G为生成器;Pr为目标域数据的分布;Pz为输入生成器中的源域数据的分布;x为真实数据训练集的样本;z为噪声分布中随机抽取的潜在向量;G(z)为生成器生成的假样本;V为判别器的价值函数,其值越大判别器的性能越好。
由式(5)可知,生成对抗网络的优化目标包含2个目标函数,max函数是判别器的目标函数,min函数是生成器的目标函数,实现这2个目标的过程即判别器和生成器之间进行对抗的过程。首先执行max函数,固定生成器的网络参数然后对判别器网络进行训练,使判别器的价值函数V取得最大值,即
由式(6)可知,判别器的任务是二分类问题,判别器的输出是Sigmoid函数,输出值范围为[0,1]。因此,若要取得价值函数的最大值,就要使D(x)的值趋于1,而D[G(z)]的值趋于0,从而使判别器达到最佳状态,即当判别器输入真实样本时,判别器输出1;当输入伪样本时,输出0。
随后需要对生成器进行训练,其训练过程与判别器的类似,所不同的是生成器的价值函数要取得最小值,其目标函数表达式为
由式(7)可知,若要取得价值函数的最小值,D[G(z)]就要趋于1,使判别器将生成器的输出数据判定为1。最后,生成器与判别器进行不断的迭代对抗,使生成器输出的数据与真实数据有相同的分布。
有限元软件主要有显式算法和隐式算法2种核心算法,本文采用显式动力学方法对滚动轴承进行运动仿真。显式动力学主要使用的是中心差分法,假设在初始时刻的位移、速度及加速度均为已知,且等于x0、、,则在时间点t时系统的振动方程为
式中:M、C、K分别为系统的质量矩阵、阻尼矩阵和刚度矩阵,Qt为系统某个时间节点t的载荷向量。
本文以滚动轴承6205作为研究对象,其结构尺寸如下:外径为D=52 mm,内径为d=25 mm,宽度为B=15 mm,节圆直径为Dpw=39.04 mm,球径为Dw=7.94 mm,球数为9个。为了使模型尽可能地与实际仿真对象特征接近,且考虑到模型的准确度和经济性,本文对实际物体模型中部分细节特征进行简化,降低模型的复杂程度,减小建模以及求解的时间。
在Solidworks中建立该轴承的3D模型,即1)倒角对滚动轴承振动的影响很小,本文模型不包含倒角;2)去除保持架的连接铆钉;3)忽略滚动轴承径向游隙、轴向游隙以及油膜的影响;4)考虑到滚动轴承在运转过程中产生的塑性变形非常微小,将轴承材料都假设为线弹性材料。
滚动轴承的三维模型如图1所示,其中将轴承的故障的简化为矩形块。为了方便约束和转速载荷的施加,对轴承外圈外表面和内圈内表面用壳单元(Shell 163)进行网格划分,同时需将其与内外圈的三维网格进行耦合。最后对所有的网格进行单元设置,外圈、内圈、保持架、滚动件都选用Solid 164单元,线弹性材料。外圈外表面和内圈内表面选用Shell 163单元,且为刚性材料,轴承旋转轴是X轴,约束内表面X方向移动和绕Y、Z轴旋转,约束外表面所有自由度。模型总的单元数为233 924。
图1 滚动轴承的三维模型图
利用构建的滚动轴承有限元仿真模型可获得包含充足故障信息的训练集,目前尚无可量化的指标能衡量不同迁移学习数据集之间的相似性。因此,本文将通过轴承故障诊断方面的专业知识,选择可以代表关键故障信息的实际物理值,对仿真数据与实际数据集进行对比分析,验证有限元仿真模型的可靠性以及仿真数据的可迁移性。
对于后续研究的滚动轴承故障诊断模型,所采用的训练域数据来自轴承有限元模型,诊断域轴承数据来自美国某大学试验台。试验台主要由电动机、扭矩传感器(译码器)、功率测试仪和电子控制器等组成。选取电动机负载工况条件为0马力时采样频率12 kHz的驱动端轴承数据进行分析。故障类型分为外圈故障、内圈故障和滚动体故障3种,每种故障类型都有0.177 8 mm、0.355 6 mm、0.533 4 mm这3种故障直径。
将振动信号通过EMD分解成n个本征模函数分量,每个本征模函数都包含不同的频率分量以及故障信息;之后以n个本征模函数分量组成能完整描述振动信号的初始特征向量矩阵A,再对其进行特征提取得到振动信号的特征;最后将矩阵A进行奇异值分解,奇异值熵[13]能够表示各阶奇异值分布的随机情况,进而表示出不同频带能量的分布的情况。
如果初始特征向量矩阵A通过奇异值分解后得到的奇异值是(λ1,λ2,λ3,…,λn),则计算奇异值熵的公式为
其中
图2为实际振动信号的前5阶内奇异值变化趋势曲线图,图3为方针模型振动信号的前5阶内奇异值变化曲线图,表1为实际信号与仿真模型信号的奇异值熵比较数据。由图2、图3和表1可知,轴承不同健康状态下实际信号与仿真模型信号的前5阶奇异值变化趋势基本相同,且实际信号与仿真模型信号不同健康状态下的奇异值熵之间的变化趋势也基本一致。故障轴承的前5阶奇异值均与正常轴承有较大差别,相对应的奇异值熵均小于正常轴承,这可能是轴承故障导致振动信号的能量逐渐集中在故障特征频带内,能量分布的不确定性降低导致奇异值熵减小。
表1 实际信号与仿真模型信号的奇异值熵
图2 实际振动信号的前5阶内奇异值的变化趋势
图3 仿真模型振动信号的前5阶内奇异值的变化趋势
为了使由仿真数据训练得到的故障诊断模型能应用于实际故障数据的诊断,克服仿真数据与实际数据间的领域差异,提高诊断模型的泛化能力,本文提出一种生成对抗网络与MK-MMD相结合的深度域适应迁移学习方法,该方法基本流程示意如图4所示。
图4 深度域适应迁移学习方法示意图
本文提出的方法由生成器、判别器和分类器3部分组成。生成器的输入包括高斯噪声和具有标签的仿真数据2部分,生成数据能够达到与真实数据具有相同的分布;判别器的目标是辨别输入数据的真伪;分类器用于轴承健康状态的预测,通过具有标签的生成数据进行训练,使用实际数据进行测试。对于网络高层次参数层(即2个全连接层在训练域和诊断域所学习到的不同深层诊断知识),均单独使用MK-MMD度量进行概率分布差异的定量计算,然后累加作为模型在2个不同领域学习到的故障特征的领域概率分布差异。
在模型训练过程中,目标函数可分为生成器目标函数、判别器目标函数和分类器目标函数3部分,其中判别器目标函数最大化可表示为
生成器目标函数就是将表达式最小化,即
生成器优化目标是最小化交叉熵损失以及生成数据和实际数据之间的MK-MMD值,即
最终的目标函数计算方程为
式中:λ1、λ2为权重系数。
根据轴承故障发生的位置不同,可将数据分为正常数据、外圈故障数据、内圈故障数据和滚动件故障数据4类。每类故障数据分别有3种故障程度,故将数据集划分为10类。通过滑动窗口对数据进行切分得到训练集和测试集,每个样本含有1 024个数据点,训练集每类包含1 000个样本,测试集每类包含100个样本。
由图5a可知,在模型训练过程中第30轮时准确率达到了100%,测试集上在第150轮时准确率达到了93%以上,之后基本稳定在93%~94%,取模型最后30次迭代的测试集准确率计算平均准确率为 93.8%。
图5 模型在训练过程中准确率和损失值变化曲线图
由图5b可知,随着迭代的进行,模型在训练和测试时的整体损失值分别在第30轮和第150轮附近收敛,其收敛域分别在0.1和 0.25左右。测试集的整体损失值较大是由于训练集是通过监督学习获得知识使损失值较低,而测试集上的知识由训练集上迁移而来,分类效果自然会略差一些。对比 CNN[14]模型、DAN[15]模型和DANN[16]模型的准确率分别为61.4%、88.3%和91.4%。由此可知,本文提出的模型从仿真数据到实际数据迁移情况下的故障诊断的准确率有明显提高。
由图6可知,进行域适应的3种模型比CNN模型在大部分类别上准确率更高,并在对B14、IR14、OR14、B21的分类准确率上都有显著增强。按照粗分类和细分类对其进行分类,DAN和DANN在粗分类上分别出现49个和35个错误,而本文提出的模型在粗分类上只出现了9个错误,在细分类上出现3个。由此可知,本文提出的模型对在轴承故障诊断的效果高于DAN和DANN。
图6 各模型的混淆矩阵比较
分别对这4种模型利用T-Sne进行可视化分析,如图7所示。通过对比图7a~图7d可知,本文模型的分类效果更好,10个故障类别基本都能区分开,没有大范围重叠出现。从整体看,不同类别间的区分更加清晰,同类别的特征也更聚合,这表明该模型对目标域数据具有更高的分类效果。
图7 各模型的特征可视化分析
本文采用CWRU轴承数据库中驱动端轴承在不同转速下的故障数据,建立表2所示数据集,每个数据集共有10个类别,每个类别数据样本为1 000个,按9:1的比例划分训练集和诊断集。
表2 不同转速下数据集设置
分别使用所建模型与CNN模型、DAN模型、DANN模型进行转速变化的工况下不同数据集之间的迁移学习,得到实验结果如表3,所建立的模型对所有迁移任务的准确率均高于其他3种模型。与DAN相比,平均准确率提高了3.19%,与DANN相比提高了大约2.12%。对于差异较大的迁移任务A→D而言,迁移效果更加显著,分类准确率达到了95%以上,分别比DAN和DANN提高4.2%和2.3%。
表3 故障诊断结果
此外,对以上4种模型利用T-Sne进行可视化分析(见图8)。由图8可知,本文所提模型的分类和聚类效果高于其他3种模型,这表明本文模型可以更好地对目标域数据进行分类。同时,再对比图7、图8、表2和表3,发现在不同工况下使用仿真数据进行迁移学习的分类效果要优于其他3种模型。
图8 各模型的特征可视化分析
针对利用深度神经网络进行轴承故障分类诊断时出现的可供训练数据不足的缺点,由此限制深度学习在故障诊断领域应用的问题,本文利用Ansys/LS-DYNA模块对滚动轴承的运动过程进行仿真,从而获得大量带有故障信息的仿真数据;提出了一种基于生成对抗网络和MK-MMD的深度域适应迁移学习的方法,通过迁移学习方法将仿真数据中蕴含的故障特征信息用于实际轴承故障诊断,缩小仿真数据与实际数据之间的领域差异,使由仿真数据训练得到的故障诊断模型能应用于实际数据的故障诊断,具有一定的实际意义和应用价值。