基于ACGAN-DSAN的变工况滚动轴承故障诊断

2023-02-17 01:41杨青叶义霞吴东升刘伊鹏
轴承 2023年2期
关键词:源域灰度故障诊断

杨青,叶义霞,吴东升,刘伊鹏

(沈阳理工大学 自动化与电气工程学院,沈阳 110159)

滚动轴承是旋转机械的重要部件,其故障将影响整机的安全运行,轴承故障诊断一直是研究的热点问题[1-3]。轴承大部分时间处于正常状态,正常数据易于采集,故障数据难以采集,这导致出现了数据不平衡问题[4]。此外,轴承在工作过程中工况(如转速、负载)会发生变化,而目前大多数研究均假设轴承工况不变[5-6]。

针对数据不平衡问题,从数据处理和算法改进2个方面进行研究。在数据处理方面:文献[7]提出了一种基于样本特性的过采样算法;文献[8]提出了一种简单有效的时域下采样算法。在算法改进方面:文献[9]将归一化卷积神经网络用于数据不平衡和变工况轴承的故障诊断;文献[10]提出了一种可再生融合故障诊断网络(Renewable Fusion Fault Diagnosis Network, RFFDN)深度学习模型。上述研究取得了一定的成果,但存在如下问题[11]: 1)数据处理未学习到原始样本的数据分布; 2)样本数据较少时,改进算法也无法使模型等价学习不平衡样本。随着深度学习的发展,有学者尝试用深度神经网络解决数据不平衡问题:文献[12]提出的生成对抗网络(Generative Adversarial Networks,GAN)能够学习原始数据的分布,然后生成具有相似分布的新样本;文献[13]利用GAN生成故障样本,进而提高故障诊断模型的泛化能力;文献[14]为解决GAN的模式崩溃与训练不稳定问题,提出了基于深度遗憾分析(Deep Regret Analysis,DRA)的变分自编码(Variational Auto-Encoder, VAE)- GAN的滚动轴承故障诊断方法,在VAE-GAN 的基础上使用DRA机制和特征匹配模块,提高了生成样本的质量。

针对变工况问题:文献[15]提出了一种基于对抗学习的分布式自适应网络,通过改进联合最大平均差(Improved Joint Maximum Mean Difference, IJMMD)测量源域与目标域之间的联合分布差异,无需近似计算,利用对抗性域自适应方法提取源域与目标域数据的不变特征,实现无监督变工况故障诊断;文献[16]提出了一种基于注意力的双层对抗网络的变工况滚动轴承故障诊断方法;文献[17]提出了一种新的多任务域自适应变工况滚动轴承智能故障诊断方法。上述方法取得了一定的成果,但大多考虑全局域对齐,计算复杂。

为更好地解决上述问题,本文提出一种辅助分类生成对抗网络与深度子领域自适应网络(Auxiliary Classifier Generative Adversarial Networks-Deep Subdomain Adaptation Network, ACGAN-DSAN) 相结合的变工况滚动轴承故障诊断方法。首先,用自适应损失函数代替原来ACGAN中的交叉熵损失函数,生成高质量轴承数据进行平衡;然后,使用子领域自适应网络对齐源域与目标域的数据分布并加入自注意力机制;最后,构建联合损失进行变工况自适应故障诊断。

1 基本原理

1.1 ACGAN

GAN[12]主要由生成器和鉴别器组成,生成器主要用于学习原始数据的分布并生成与之相似的数据,鉴别器主要用于判断输入的数据是真实数据还是来自生成器的数据并训练至纳什均衡。目标函数为

Ez~pz(z)[log(1-D(G(z))],

(1)

式中:x为真实数据;pdata(x)为真实数据分布;z为随机噪声;pz(z)为随机噪声的数据分布;D(x)为样本为真的概率;G(z)为生成的样本。

ACGAN[18]是GAN的变体,ACGAN给生成器输入标签信息,利用随机噪声和类别数生成有对应标签的样本Xfake=G(z,c)。生成器根据输入标签生成指定样本,鉴别器输出样本真假与标签类别,实现样本分类。ACGAN网络结构如图1所示。

图1 ACGAN结构

ACGAN的损失函数包含判断样本真假的损失LS及判断标签类别的损失LC,即

LS=E[logP(S=real∣Xreal)]+

E[logP(S=fake∣Xfake)],

(2)

LC=E[logP(C=c∣Xreal)]+

E[logP(C=c∣Xfake)],

(3)

式中:S为样本真假;C为样本类别;Xreal为真实数据;Xfake为生成数据;P(S∣X)和P(C∣X)为判别器网络输出数据为真实样本的概率分布、所属数据类别概率分布。

鉴别器用于鉴别样本的真假与类别,即LS,LC越大越好,其损失函数为LS+LC最大。生成器希望LS小,LC大,其损失函数为LC-LS最大。

1.2 DSAN

全局领域自适应的迁移网络虽然能使2个域的分布大致相同,但会使不同子域的数据分布过于接近,无法准确分类。文献[19]提出了一种子域适应方法,即在源域和目标域中精确对齐同一类别内相关子域的分布,结构如图2所示。

图2 DSAN结构图

DSAN使用类别划分子领域,一个类别对应一个子领域。采用局部最大均值差异(Local Maximum Mean Discrepancy,LMMD)对齐子领域分布,其计算方法为

(4)

样本xi的权重为

(5)

采用真实标签的独热编码计算源域样本,使用网络的概率输出作为伪标签计算目标域样本。整个网络的损失函数为

(6)

2 ACGAN-DSAN的故障诊断算法

2.1 一维信号转换为二维图像

原始一维时序信号数据可以用来处理数据不平衡问题,但特征不明显,生成样本的质量较差。故本文将一维的原始轴承数据转换为二维的灰度图,转换过程如图3所示。

图3 一维数据转化为二维图像

将一维振动信号切分为若干个N×N的序列片段,将每个序列片段归一化到0~255之间,将像素值取整后转换为灰度图,归一化公式为

(7)

式中:p(i,j)为图像在(i,j)点的像素值;h为取整;Lmax,Lmin为振动信号的最大值和最小值。

2.2 改进ACGAN

为了提高样本质量,提出了一种改进ACGAN网络,结构如图4所示。

图4 改进ACGAN结构图

为降低噪声对模型稳定性的影响以及提高图像质量,用自适应损失函数代替原ACGAN中的交叉熵损失函数,即

(8)

式中:x为期望值与目标值的差;α为超参数,用于控制损失函数的鲁棒性;m为尺度参数,用于控制x在0附近的弯曲尺度。

(8)式可转化为

(9)

当m=1.1时,对(9)式求导可得f与x的关系如图5所示。由(9)式和图5可知:当limα→2时,损失函数近似于平方误差损失,x越大,对损失函数的影响越大,模型收敛越快;当α=1时,损失函数近似于平均绝对误差损失,当|x|增大到大于m时,导数的大小饱和为常数1/m,当残差增加时,其影响永远不会减小,但永远不会超过固定值,收敛速度慢;当α<1时,|x|逐渐大于m,损失函数的导数值逐渐减小,故x在梯度下降期间对模型的影响较小,这说明当期望值与目标值的差值增大时对梯度的影响较小,可以有效地减缓模型训练过程中异常值的影响,提高生成样本的质量;当limα→-∞时,|x|>3m时损失函数值几乎不变,对模型影响几乎不变。

图5 自适应损失函数导数

在模型训练过程中,根据(10),(11)式优化α,m使模型能自适应地选择不同形式的损失函数,即

(10)

(11)

2.3 改进DSAN

为提高变工况下故障诊断的泛化能力,在原DSAN中加入自注意力机制,结构如图6所示。自注意力机制可以调整不同特征向量的注意力权重,从而弱化冗余特征信息。根据样本重要性分配权重,即

(12)

加入自注意力机制的交叉熵分类损失为

(13)

LMMD的自适应损失为

(14)

改进后的DSAN损失函数为

(15)

2.4 故障诊断流程图

基于ACGAN-DSAN的变工况滚动轴承故障诊断流程图如图7所示,主要包括数据预处理、数据集平衡、离线阶段、在线阶段,具体步骤如下:

1)将不同工况的原始振动信号分为源域和目标域,将一维数据转换为二维灰度图;

2)将转换后的源域和目标域数据分别用来训练改进ACGAN网络,达到纳什均衡后保存模型,调用模型生成源域和目标域类别不平衡的数据;

3)用残差网络提取源域和目标域的特征,将其映射到再生核希尔伯特空间中,在该空间中用LMMD计算每个类别源域和目标域的最大均值差异,并在DSAN中加入自注意力机制,由交叉熵分类损失和LMMD自适应损失计算联合损失,判断是否完成训练;

4)模型训练完成后保存模型,调用模型进行在线故障诊断。

图7 变工况滚动轴承故障诊断流程图

3 试验验证

3.1 试验数据

采用美国凯斯西储大学[20]的6205深沟球轴承数据集。CPU为Intel Core i7-8700,GPU为INVIDIA GTX 1080 Ti,深度学习框架为Tensorflow和Pytorch。

试验装置如图8所示,转速分别取1 772,1 750,1 730 r/min,定义为工况A,B,C,每种工况又包含10种故障类型,见表1。

图8 试验台

表1 6205轴承的故障类型

3.2 样本生成

采样频率为48 kHz,每个故障类型取4 096个连续点生成一张像素为64×64的灰度图,每类故障可以生成115张灰度图,每种工况下共计1 150张灰度图,转换后的灰度图如图9所示。在转换后的灰度图数据集中,取80%作为训练样本,20%作为测试样本。

图9 不同故障类别的灰度图

采用KL散度、欧式距离(ED)和皮尔逊相关系数(PCC)3个指标来评估样本质量,KL散度、ED表征2个分布的相似度,其值越小,说明两分布越相似,PCC表征2个变量的相关性,其值越大,说明越相关。为验证本文方法的有效性,选择DCGAN,ACGAN与本文改进ACGAN对比,3组试验均采用相同的数据集和训练参数。迭代次数为1 000,批次大小为32,鉴别器的学习率为0.000 2,生成器的学习率为0.000 3,优化器采用Adam算法,3种方法生成样本的各项质量指标见表2:改进ACGAN的KL散度和ED最小,PCC最大,说明改进ACGAN生成样本的质量优于其他模型。

表2 不同方法生成样本的各项质量指标

改进ACGAN在训练过程中,生成器和鉴别器的损失曲线如图10所示:当迭代次数达到1 500时,生成器和鉴别器的损失曲线基本耦合并保持小幅震荡,说明网络达到了纳什均衡。网络训练后故障8的生成灰度图如图11所示,随机截取故障8的真实灰度图,如图12所示。

图10 改进ACGAN的损失曲线

图11 故障8的生成样本图

图12 故障8的真实样本图

为进一步验证本文方法在数据集不平衡方面故障诊断的有效性,选择Borderline-SMOTE[21],DCGAN,ACGAN进行对比,生成不平衡类别的数据然后补全训练集数据,用CNN网络进行故障诊断,诊断准确率见表3:改进ACGAN的诊断准确率优于其他模型,说明本文的数据生成方法能有效解决数据不平衡问题。

表3 不同方法对轴承故障诊断的准确率

3.3 变工况轴承故障诊断

为验证本文方法在变工况轴承故障诊断方面的有效性,选择DAN,Deep Coral[22]与本文改进DSAN进行变工况轴承的故障诊断。设1为原始轴承数据集,2为ACGAN生成数据进行平衡后的数据集,3为改进ACGAN生成数据进行平衡后的数据集,根据工况的不同,分别进行A1-B1,A1-C1,B1-C1,A2-B2,A2-C2,B2-C2,A3-B3,A3-C3,B3-C3(A1代表原始数据中的A工况,A2代表ACGAN生成的数据平衡原始数据集后的A工况,A3代表本文方法生成的数据平衡原始数据集后的A工况,B,C工况类似;A1-B1代表A1为源域,B1为目标域,其他类似)的变工况轴承故障诊断试验,具体的任务样本集见表4。参数设置:网络的输入为64×64的灰度图,初始学习率为0.01,动量因子为0.9,批次大小为32,迭代次数为100。每次试验重复3次取平均值,结果见表5。

表4 任务样本集设置

表5 变工况轴承故障诊断的准确率

对比表5中任务1,2,3,任务4,5,6,任务7,8,9可知:改进ACGAN生成数据进行源域数据增强和目标域数据平衡后的数据集的故障诊断准确率高于原始数据和ACGAN生成数据进行源域数据增强与目标域数据平衡后的数据集,说明本文方法生成的数据能有效解决数据不平衡的变工况轴承故障诊断问题。

对比表5中任务1,4,7,任务2,5,6,任务3,6,9可知:使用改进ACGAN生成数据进行数据增强时,本文方法的故障诊断准确率高于DAN,Deep Coral且波动不大,说明本文方法具有较好的鲁棒性。

对比表5中任务4,5,6可知:DAN,Deep Coral的A-C工况故障诊断准确率远低于本文方法, 说明对齐源域和目标域中同一类别相关子域的分布能够获取每个类别的细粒度信息,这些信息可以在端到端的框架中训练,使模型能有效提高变工况轴承故障诊断的准确率。

为进一步验证本文方法对故障误判的情况,对本文方法进行混淆矩阵试验,分别选取有自注意力机制A1-B1工况,无自注意力机制A3-B3工况,有自注意力机制A3-B3工况,结果如图13所示:1)未进行数据增强时,模型将故障6误判为故障1,故障1的准确率仅33%;2)在有自注意力机制A3-B3工况,故障2, 8的准确率分别为67%,86%,其余故障的准确率均达到100%,说明本文方法的数据增强能有效提高故障诊断准确率;3)有自注意力机制的诊断准确率高于无自注意力机制,说明引入自注意力机制,能降低模型对故障识别的混淆度。

(a) 有自注意力机制A1-B1工况

(b) 无自注意力机制A3-B3工况

(c) 有自注意力机制A3-B3工况

4 结束语

为解决轴承故障数据少、样本不平衡以及变工况导致故障诊断准确率低的问题,提出一种基于ACGAN-DSAN的滚动轴承故障诊断方法,其具有以下优点:

1)改进ACGAN能有效提高生成样本的质量;

2)对原始数据集进行数据增强,有效提高了轴承故障诊断的准确率;

3)使用子领域自适应方法将源域和目标域同一类别的特征对齐,增大了样本的类间可分性,提高了模型的分类性能;

4)在DSAN中加入自注意力机制,提高了模型对故障特征的非线性拟合能力,降低了模型对故障识别的混淆度,进一步提高了轴承故障诊断的准确率。

ACGAN-DSAN在加噪的环境中故障诊断效果较差,后续有待进一步研究。

猜你喜欢
源域灰度故障诊断
采用改进导重法的拓扑结构灰度单元过滤技术
基于包络解调原理的低转速滚动轴承故障诊断
基于参数字典的多源域自适应学习算法
数控机床电气系统的故障诊断与维修
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于灰度线性建模的亚像素图像抖动量计算
因果图定性分析法及其在故障诊断中的应用
可迁移测度准则下的协变量偏移修正多源集成方法
基于LCD和排列熵的滚动轴承故障诊断
全彩LED驱动芯片的S-PWM优化