基于VAE-GAN和FLCNN的不均衡样本轴承故障诊断方法

2022-05-16 11:08张永宏张中洋赵晓平王丽华吕凯扬
振动与冲击 2022年9期
关键词:轴承故障诊断卷积

张永宏,张中洋,赵晓平,王丽华,邵 凡,吕凯扬

(1.南京信息工程大学 自动化学院,南京 210044;2.南京信息工程大学 计算机与软件学院,南京 210044;3.南京信息工程大学 江苏省网络监控中心,南京 210044)

滚动轴承是旋转机械设备中的核心部件之一,由于长时间的运行和复杂的系统环境,其常常发生损坏,甚至会导致事故发生。因此,精准地诊断出滚动轴承的健康状态对于监测设备健康,及时排除安全隐患具有重大意义[1]。经典的轴承故障诊断方法大多基于故障信号的分解、变换,通过人工手段提取故障特征,例如经验模态分解[2]、小波变换[3]等。近年来,不少学者开始将神经网络方法和信号处理技术结合进行轴承故障诊断。常见的有支持向量机[4]、深度置信网络[5]、卷积神经网络(convolutional neural network,CNN)[6]等。然而这些方法需要大量分布均衡的故障数据作为支撑才能获得较好的诊断效果。在实际生产中,机械设备发生故障是低概率事件,并且采集故障数据时设备可能已经无法运行,这导致采集到的故障类样本常常远少于正常类样本,产生样本分布不均衡问题。

目前,国内外专家、学者针对样本不均衡问题主要从数据扩充和算法改进两个方面进行研究。Chawla等[7]提出了经典的合成少数类过采样技术(synthetic minority oversampling technique,SMOTE),通过在少数类样本间进行线性随机插值生成新的样本,从而使原始数据分布均衡。Douzas等[8]对SMOTE方法进行改进,提出了Kmeans-SMOTE算法,并将其应用到实际问题中。姚培等[9]提出一种基于代价敏感度框架的Boosting故障诊断方法,通过建立一个新的代价敏感损失函数,赋予正样本和负样本不同的惩罚因子,在转子故障数据不足的情况下,明显提高了故障诊断性能。尽管上述方法在解决样本不均衡问题时能够产生一定的效果,但过采样方法在合成新样本的同时也可能造成过生成、过泛化或者改变原始数据分布的问题[10];代价敏感算法需要对代价参数进行合理设置,并且当数据不均衡比过大时,由于缺少少数类样本的特征信息,算法的提升效果有限。

深度学习模型以其可以自动学习数据特征的优点,在图像分类、目标识别等领域已经取得了巨大成功[11]。其中生成对抗网络(generative adversarial networks,GAN)[12]和变分自编码器(variational auto-encoder,VAE)[13]是近年来兴起的最具潜力的生成模型,经过研究者的不断改进,已被广泛应用于图像修复[14]、风格迁移[15]、超分辨率重建[16]以及故障诊断等领域。王威等[17]研究了一种少样本信息情况下的行星齿轮箱故障诊断方法,利用生成对抗网络产生补充的故障样本,提高了样本不均衡条件下的诊断准确率。Cabrera等[18]提出一种基于GAN的往复式机械故障诊断方法,通过试验证明了在数据失衡情况下该方法的有效性。张周磊等[19]针对同步电机样本稀少引起的诊断偏差问题,提出一种基于变分自编码的故障样本快速扩展策略,丰富了训练数据集。尽管如此,GAN在实际应用中还存在训练不稳定、梯度消失等问题,容易造成生成图像失真;VAE生成的图像会出现边缘模糊,缺少纹理细节的问题。两种方法各有不足,一定程度上限制其在各领域中进一步的发展和应用。

总体来说,在故障诊断领域,针对样本不均衡问题的研究还较少,应用于轴承故障诊断的方法更加屈指可数。此外,现有方法大多是针对二分类诊断问题进行建模,且不均衡比例单一,适用范围有限。基于以上分析,为了解决故障类样本与正常类样本分布不均衡情况下的轴承故障诊断问题,本文提出一种基于VAE-GAN+FLCNN的故障诊断模型。首先,对采集到的振动信号进行快速傅里叶变换并切分为训练集和测试集;其次,将样本量少的故障类数据输入到VAE-GAN模型训练,生成相应的故障样本;然后把生成的样本混合到真实样本中进行数据增广,使各类样本分布均衡;最后将增广后的训练数据输入FLCNN样本分类模型中,利用卷积神经网络(convolutional neural network,CNN)的特征提取能力和焦点损失(focal loss,FL)对故障类样本的关注实现轴承故障的精准分类。试验结果表明,提出的VAE-GAN+FLCNN方法与其他3种经典方法(SMOTE+CNN、VAE+CNN、GAN+CNN)相比能够取得更好的故障诊断效果。

1 相关原理介绍

1.1 变分自编码器

VAE是一种基于变分推断的隐空间生成模型,被广泛应用于数据生成。与普通自编码器相比,VAE能够学习到隐含变量的近似概率分布,并通过采样生成新的数据。假设训练数据集为X,隐含变量为Z,由贝叶斯公式可推断出Z的概率分布,如式(1)所示。

(1)

式中:P(Z|X)为给定X时Z的概率分布,即可以通过观测大量的数据样本来计算隐变量的分布情况。但在实际应用中,真实数据X一般为高维连续变量,难以用公式直接求解出Z的分布。因此,VAE使用神经网络训练一个简单的分布Q(Z)来近似P(Z|X),并通过KL(Kullback Leibler)散度[20]来度量二者的接近程度。

由于任意复杂的分布都可由简单分布经过函数映射而成,为了简化求解过程,一般假定Q(Z)服从于高斯分布,隐变量Z服从于标准正态分布,即Q(Z)~N(μ,σ2),P(Z)~N(0,1)。μ和σ2表示均值和方差,可以通过网络学习得到。为了能使用梯度下降法优化网络,在采样操作时,VAE运用重参数方法[21],通过一个高斯噪声e将μ和σ2组合成隐变量Z,即Z=μ+e×σ,VAE的网络结构如图1所示。

图1 VAE网络结构图

VAE的网络结构主要包含隐变量编码部分和解码生成部分,模型的优化目标是尽可能使学习到的隐变量分布逼近标准正态分布,并且不断缩小生成样本和原始真实样本间的重构误差,其损失函数如式(2)所示。

(2)

1.2 生成对抗网络

GAN由两个部分组成,即生成器(generator,G)和判别器(discriminator,D),模型基本结构如图2所示。其中,G的作用是学习真实数据的潜在分布,并生成新的数据样本,其输入是一定维度的随机向量。D相当于一个二分类器,训练目标是最大程度判断出输入网络的是真实样本还是G生成的假样本。

图2 GAN网络结构图

网络优化过程中,生成器G和判别器D二者交替训练,相互对抗。G不断提高网络的生成能力,D不断提高网络的判别能力,最终达到平衡状态。此时,G生成的样本接近于真实样本,而D也难以判断数据的真假,GAN的损失函数如式(3)所示。

Ez~Pz(z)[log2(1-D(G(z)))]

(3)

式中:x为真实样本;z为随机向量;Pdata为真实样本的分布;G(z)为生成器生生成的数据,网络的训练目标是最小化生成器损失和最大化判别器的输出值。

1.3 焦点损失

焦点损失(focal loss,FL)是由Lin等[22]针对目标检测中的类别不平衡问题提出的,由标准交叉熵损失函数改进而来。其主要思想是通过降低易分样本的权重,使模型在训练时更加关注难分样本。

(4)

传统交叉熵损失对每个样本的预测标签进行计算叠加,在各类样本数量不一致时会降低少数类样本的损失比率。FL在交叉熵的基础上引入两个可调节的参数,对训练数据中的难分样本和少样本类别分配更大的权重,表达式如式(5)所示。

(5)

式中:(1-pj)γ为调制系数;αj和γ为超参数,用来调节不同类别的样本在损失中占的权重。当某类样本难分时,预测标签pj的值会偏小,通过设置γ为大于1的整数,(1-pj)γ将变大,从而增加分类权重。

2 VAE-GAN+FLCNN故障诊断模型的构建

针对轴承故障诊断中故障类样本和正常类样本分布不均衡的问题,本文从数据和算法两个方面入手,采用VAE-GAN样本增广模型来增加故障类样本,然后通过FLCNN分类模型对轴承故障进行识别,将两个模型融合,从而构建VAE-GAN+FLCNN故障诊断模型。

2.1 VAE-GAN样本增广模型

尽管VAE和GAN模型在数据生成方面已经取得了良好的效果,但传统VAE生成的数据往往比较模糊,对复杂模型的表达能力差;传统GAN训练困难,生成器和判别器很难同时收敛,且容易出现梯度消失问题。基于此,本文同时借鉴了VAE对数据的特征编码能力和GAN的对抗学习机制,提出VAE-GAN样本增广模型。

VAE-GAN模型在GAN的基础上增加了真实样本的特征编码部分,用编码后得到的隐变量代替随机向量来改进网络,具体结构包含3个部分,即编码网络、生成网络和判别网络,如图3所示。

图3 VAE-GAN网络结构

编码网络由3个全连接层组成,其作用是将输入的高维真实样本映射为2个低维的特征参数,即数据分布的均值和方差。编码网络的优化目标是最小化隐变量分布与标准正态分布之间的KL散度,其损失函数如式(6)所示。

(6)

式中:μ和σ2为编码网络输出的均值和方差;KL(·)为计算两个数据分布之间的散度。

生成网络由5个反卷积层组成,除最后一层外,对每一层输出进行批标准化,激活函数采用Relu。生成网络将输入的低维隐变量逐层进行特征放大,最终生成和真实样本尺寸相同的新样本,其优化目标除了尽可能生成逼真的样本去欺骗判别网络,还包括最小化生成样本和真实样本间的特征误差,损失函数为

(7)

式中:Z为由μ和σ2采样合成的隐变量;G(Z)为生成的样本;D(·)为判别网络将输入数据判断为真实样本的概率;Dl(·)为判别网络第l层输出的特征向量;X为输入的真实样本。

判别网络由4个卷积层和2个全连接层组成,每个卷积层后面加入了批标准化层,除了最后的输出层,其余层激活函数采用LeakyRelu。判别网络将输入的真实样本和生成网络生成的样本进行特征提取和降维,最后通过Sigmoid激活后输出真伪标签,其优化目标是尽可能地区分出输入的是真实样本还是生成样本,损失函数如式(8)所示。

LD=log2D(X)+log2(1-D(G(Z)))

(8)

VAE-GAN模型将VAE的解码部分和GAN的生成器合为一体,综合两个模型的优点,使二者相互促进,既能改善生成数据的质量,也能缓解模型训练不够稳定、难以收敛问题。训练生成网络时,利用真实样本编码后的隐变量代替原始GAN中的随机向量,提升生成网络中初始参数与真实样本间的关联性,并且将判别网络从生成样本和真实样本中提取到的特征向量进行误差优化,能够使生成网络更快地学习到真实数据的分布,不至于在对抗训练中轻易被判别网络击败。此外,在判别网络和生成网络的搭建上,借鉴了DCGAN(deep convolutional generative adversarial networks)[23]的结构设计,通过一些经验性的结构设计使得对抗训练更加稳定,采用了卷积和反卷积结构以及批归一化层,并去掉了池化层,VAE-GAN的训练步骤如下:

步骤1输入N个真实样本X={x(1),x(2),…,x(N)};

步骤2对输入样本进行编码(μ,σ2)=Encoder(X);

步骤3对(μ,σ2)采样合成隐变量,Z=μ+e×σ;

步骤4将隐变量输入生成网络生成样本;

步骤5将生成样本和真实样本输入判别网络;

步骤6用梯度下降法更新LE、LG、LD中的参数;

步骤7重复步骤1~步骤6,直到满足最大训练次数。

2.2 FLCNN样本分类模型

CNN具有强大的特征表征能力,在特征提取方面展现出巨大的优势,其网络结构主要包含卷积层、池化层和全连接层[24],能够自主提取故障信号中的不同特征,从而完成故障分类。根据学习任务的不同,通常将不同数量的卷积层和池化层堆叠起来组成不同深度的卷积网络结构。

传统CNN在分类时一般采用平方误差或交叉熵作为损失函数,将数据集中每个类别平等看待,无法适应类别不均衡和样本难易程度不一致的分类问题。在文中,为了适应轴承信号的一维特性,采用一维卷积结构搭建故障识别模型。此外,尽管前期已经通过VAE-GAN方法解决了故障类样本数量的不足问题,但其只是在数据层面上的处理,并且由于生成模型本身的限制,生成的样本并不能完全替代真实样本。因此,为了进一步提升识别模型对故障类样本的分类准确性,在损失计算部分采用FL函数代替传统的交叉熵损失,增加故障类样本的错分权重,减小正常类样本的错分权重,从而在算法层面上加强模型对故障类样本的关注度。在此基础上,提出FLCNN样本分类模型,结构如图4所示。

由图4可知,FLCNN样本分类模型包含3个卷积模块和2个全连接层,每个卷积模块由1个卷积层和1个池化层组成。其中,卷积层通过不同尺寸的卷积核与训练数据进行卷积运算来提取局部特征;池化层通过下采样方式减少特征维数,加快训练速度和避免模型过度拟合;全连接层将最终提取到的特征图映射为一维向量然后送入分类器。模型的输入是包含真实样本和生成样本的均衡数据集,输出是每个样本的识别结果。计算分类损失时,通过设置Focal Loss中参数α和γ的值以赋予故障类样本和正常类样本不同的分类权重。

图4 样本分类模型

2.3 VAE-GAN+FLCNN模型训练流程

VAE-GAN+FLCNN故障诊断模型的整体框架包含数据预处理、故障样本增广和样本分类3个部分,训练流程如图5所示。

图5 轴承故障诊断流程

(1)数据预处理

试验采集的轴承故障数据为时域振动信号,其存在采样点密集、故障特征不明显、信息冗余的问题。相比之下,频域信号的规律性更强,包含的有用信息和特征也更加明显。因此,把时域信号按照每2 000点为一段切分成多个样本,然后进行快速傅里叶变换,将得到的频域样本划分为训练集和测试集,随机去除一定数量的故障样本使训练集样本分布不均衡。

(2)故障样本增广

将各训练集中数量少的故障类样本分别输入VAE-GAN模型进行训练,然后把生成的样本混合到原始分布不均衡的训练集中实现故障样本的增广。

(3)样本分类

将经过故障样本增广后的均衡训练集输入搭建好的FLCNN样本分类模型训练,然后用训练完成的模型对测试集数据进行诊断,通过CNN强大的特征提取能力和Focal Loss对故障类样本的关注实现对各类样本的准确识别。

3 试验与分析

3.1 试验数据

本文的试验数据采集自Spectra Quest公司制造的动力传动故障诊断试验台(drivertrain diagnostics simulator,DDS),试验装置如图6所示。试验共采集到5种状态的故障轴承数据,除去正常状态,其余4种故障轴承的实物,如图7所示。每个故障轴承不区分损伤位置和损伤程度,框内标注的字母表示轴承的故障类型:Ball为滚动体故障,Combine为复合故障(滚动体、内圈和外圈均发生损伤),Inner为内圈故障,Outer为外圈故障。

图6 动力传动故障诊断试验台

图7 轴承的4种故障状态

为了使采集到的轴承数据更具多样化和普遍性,能够包含多种条件下的轴承数据,更加贴近实际情况,试验设置了4种电机转速(1 700 r/min、1 800 r/min、3 400 r/min、3 800 r/min)和4种负载(负载电压为0、4 V、6 V、8 V),共16种工况状态。采用单向加速度传感器获取振动信号,采样频率设置为20 kHz,采样时间20 s。每种故障状态下得到16个振动信号文件(16种工况,每种工况得到1个文件),每个文件包含409 600个点。按照每2 000点为一段进行切分,每个文件得到200个样本,最终共获取16 000个样本,其中每类故障有3 200个样本(包含各种工况数据),通过快速傅里叶变换得到频域数据样本。取每类故障样本的25%作为测试集,为了制造样本分布不均衡的训练集,在剩余的75%样本中,把正常状态之外的4类故障样本随机去除一定的数量,使其满足故障样本与正常样本的比例分别为1∶2,1∶5,1∶10和1∶40,将这4种类别的数据集定义为训练集A、B、C、D,每个训练集中均包含了各种工况的轴承数据,数据集具体切分情况如表1所示。

表1 试验数据集

3.2 试验过程及结果分析

3.2.1 试验参数设置

编程环境为i7-4790 CPU、英伟达GTX1050Ti、python3.7、Pytorch1.3。试验分为VAE-GAN增广故障样本和FLCNN样本分类两个部分,训练样本增广模型时,Batch-size设置为60,采用Adam优化器,学习率均设置为0.000 2,迭代500次;训练分类模型时,Batch-size设置为100,采用Adam优化器,学习率设置为0.001,迭代300次,Focal Loss中参数α的值设为1,γ大小参照经验值设为2,能够增加难分样本的错分权重。

VAE-GAN和FLCNN模型中的具体参数,如表2和表3所示。其中神经元个数括号中的数值分别表示前一层的节点个数和当前层的节点个数,卷积参数括号中的数值分别表示输入通道、输出通道、卷积核尺寸、步长和padding的大小,池化参数括号中的数值分别表示池化窗口大小和步长。

表2 VAE-GAN模型的参数设置

表3 FLCNN模型的参数设置

3.2.2 VAE-GAN样本增广效果分析

为了验证VAE-GAN模型对故障样本的生成效果,将训练集A、B、C、D中的真实样本(见表1)分别输入模型训练,通过生成网络生成一定数量的故障样本。不均衡比为1∶10(即使用训练集C训练模型)情况下4种故障轴承的真实样本和生成样本的频域图,如图8所示。

图8中,实线代表真实故障样本,虚线代表VAE-GAN模型生成的样本,为了量化二者的接近程度,借鉴文献[25]中的相似度计算法,求解真实样本和生成样本的均方根误差并进行归一化处理,得到的结果越接近1表明二者的相似度越高。相似度计算方法如式(9)所示。

(a)滚动体故障样本对比

(9)

为从整体上验证生成样本与真实故障样本在空间分布上的近似程度,对原始不均衡数据集和增广后分布均衡的数据集进行T-SNE可视化。同样以1∶10不均衡情况为例,提取数据的前3个主要特征,可视化结果如图9所示。

(a)原始真实数据的特征散点

图9(a)为原始真实数据的分布情况,从图9中可以明显看出:正常类样本数量多且集中,包含的特征信息更为全面;而故障类样本分布稀疏,各故障类之间重叠也较多。图9(b)为增广后的数据分布情况,可以看出:用VAE-GAN生成的样本有效地补充了故障样本的数量,使各类故障样本与正常类样本在数量上保持一致;同时,生成样本基本都聚集在真实故障样本周围,使每类故障的特征点更加丰富和集中,从而大大增加了类间的可区分性。从以上分析可以得出,提出的VAE-GAN样本增广模型有效解决了故障样本不足问题。

3.2.3 VAE-GAN+FLCNN故障诊断效果分析

在一般的分类问题中,通常采用准确率作为模型的评价指标,但这对于数据分布不均衡的情况并不适用[26]。本文选择更能反映各种故障类型分类情况的Recall和F1-score作为试验的评价指标,并通过可视化混淆矩阵,给出了每一类故障的分类情况。Recall也被称为查全率,能够反映每类故障被分类正确的比重;F1-score反映的是精确率(Precision)和Recall的综合水平,其值越高说明分类模型越稳健。

为验证提出的VAE-GAN+FLCNN模型在样本不均衡条件下对各类轴承故障的诊断效果,对采集的5种轴承故障数据,设置3组试验进行阶段性对比:第一组将原始分布不均衡的数据直接输入CNN进行训练;第二组先通过VAE-GAN模型生成故障样本,然后将增广后分布均衡的数据集输入CNN进行训练;第三组采用改进完全的VAE-GAN+FLCNN方法进行训练。使用测试集验证各组试验的诊断结果,对Recall和F1-score值进行对比,结果如表4所示。

从表4可知,当直接采用CNN进行诊断,Recall值和F1-score值都比较低,并且不均衡程度越高,诊断结果越差,尤其是使用训练集D训练网络时,Recall值和F1-score值仅有0.51和0.44;而采用VAE-GAN进行样本增广后,CNN的诊断结果有明显的提升,Recall值和F1-score值在训练集D上仍然可以达到0.83和0.82,使用训练集A时,两个指标的值都达到了0.96;采用VAE-GAN+FLCNN方法后,即首先进行数据增广,并将Focal Loss应用到CNN模型,诊断效果得到进一步的改善,两个指标在使用训练集A作为训练数据时的值都为0.98,即使在训练集D上也能达到0.86和0.84。

表4 VAE-GAN+FLCNN方法不同改进阶段诊断结果的Recall、F1-score值对比

为了清晰地展示VAE-GAN+FLCNN方法对每类样本的识别情况,将其与CNN方法进行对比,以训练集A和训练集D作为训练数据为例,诊断结果的混淆矩阵如图10所示。

图10 不均衡比为1∶2和1∶40时CNN方法和VAE-GAN+FLCNN方法诊断结果的混淆矩阵对比

纵坐标表示样本的真实类别,横坐标表示预测的类别。当不均衡比为1∶2时,从图10可知,用CNN进行诊断,只有正常类样本被准确识别,其他故障类均有不同数量的样本被错分。在图10(a)中,800个正常类样本都被预测正确,而外圈故障仅有638个被预测正确;采用VAE-GAN+FLCNN方法后,各类样本均能被准确识别;在图10(b)中,正常类样本都被预测正确,外圈故障也有782个被预测正确,比CNN增加了144个。当不均衡比为1∶40时,从图10(c)和图10(d)可知,用CNN进行诊断,4种故障的分类情况很差,有大量样本被识别错误。在图10(c)中,滚动体故障和外圈故障分别仅有350个和441个样本被预测正确;采用VAE-GAN+FLCNN方法后,错分的故障样本数大大减少;在图10(d)中,滚动体故障和外圈故障分别有578个和664个样本被预测正确,其他故障类别被正确预测的样本也显著增多。综合来看,无论训练数据的不均衡程度低或高,提出的VAE-GAN+FLCNN方法均能提升故障诊断效果。

3.3 与其他方法对比分析

为了进一步验证VAE-GAN+FLCNN方法对不均衡样本故障诊断的有效性,选取SMOTE+CNN方法、VAE+CNN方法和GAN+CNN方法作为对比。SMOTE方法通过在真实样本间进行随机插值来扩充数据,VAE和GAN方法即1.1节、1.2节介绍的标准变分自编码网络和生成对抗网络,试验结果的Recall值和F1-score值如表5所示。

表5 不同故障诊断方法的Recall、F1-score对比

从表5可知,在不同的训练数据集下,SMOTE+CNN方法的故障诊断效果均是最差的,使用训练集D作为训练数据时,Recall值和F1-score值只有0.69和0.67,表明通过简单插值方法增加训练样本数量并不能使模型学到更多的特征信息,提高模型对测试样本的泛化性;GAN+CNN方法的诊断效果在3种对比方法中表现最好,在使用训练集A作为训练数据时,Recall值和F1-score值达到0.92和0.94,但当使用训练集D作为训练数据时效果仍然不理想,Recall值和F1-score值分别只有0.73和0.72;而VAE-GAN+FLCNN方法在使用训练集D作为训练数据时两个指标仍然能达到0.86和0.84,相较于其他3种方法有明显的提升,可以对各类轴承数据进行准确诊断。

为了更直观地展示VAE-GAN+FLCNN方法在样本分布不均衡情况下与其他3种方法相比有更好的故障诊断效果,以1∶10不均衡比(训练集C)为例,将训练数据分别输入4种模型,然后用训练好的模型诊断测试集样本,对最终的分类结果进行可视化,结果如图11所示。

图11 不同方法故障诊断结果可视化

从图11(a)可知,SMOTE+CNN方法在几种方法中分类效果较差,各故障种类之间均有不同程度的重叠,例如内圈故障的部分样本混合到了滚动体故障和外圈故障中,正常类样本也混合到了滚动体故障中;从图11(b)可知,GAN+CNN方法的错分样本数量较少,滚动体故障、内圈故障和正常类样本都被很好地区分开了,分类结果相对较好。从图11(c)可知,VAE+CNN方法的诊断效果一般,内圈故障和正常类样本均有部分被错分到了滚动体故障中,复合故障和外圈故障重叠较多。从图11(a)、图11(b)、图11(c)的对比可知,3种对比方法对各类样本均有不同程度的错分,并且对复合故障和外圈故障产生了较高的错分率,样本间重叠严重。从图11(d)可知,使用VAE-GAN+FLCNN方法后,不同类别样本之间有较大的间隔,复合故障和外圈故障之间也能看到明显界限,仅有少量外圈故障样本被分类错误,总体而言,VAE-GAN+FLCNN方法对轴承的故障诊断效果明显优于其他3种方法。

4 结 论

本文提出一种基于VAE-GAN+FLCNN的不均衡样本轴承故障诊断方法,通过VAE-GAN样本增广模型生成少数类故障样本,实现训练数据的均衡化;然后将增广后的数据输入FLCNN分类模型进行特征提取和故障识别。设置了4种不均衡比例的训练数据进行试验验证,主要结论如下:

(1)VAE-GAN模型能有效学习真实故障样本的分布特点,从而生成大量故障样本以增广原始不均衡数据集。

(2)通过将Focal Loss应用到CNN分类网络,提高了FLCNN模型对故障类样本的诊断精度。

(3)通过和其他3种方法(SMOTE+CNN、VAE+CNN、GAN+CNN)的试验对比可知,在不同的训练数据集下,提出的VAE-GAN+FLCNN方法都能有效提高诊断结果的Recall值和F1-score值。

本文的贡献在于将VAE和GAN结合,弥补各自的缺点,改善了样本生成能力,从而实现故障样本的增广;通过多次试验对比,验证了VAE-GAN+FLCNN方法对样本不均衡下轴承故障诊断的有效性。

猜你喜欢
轴承故障诊断卷积
轴承知识
轴承知识
基于包络解调原理的低转速滚动轴承故障诊断
基于3D-Winograd的快速卷积算法设计及FPGA实现
轴承知识
轴承知识
卷积神经网络的分析与设计
从滤波器理解卷积
数控机床电气系统的故障诊断与维修
基于傅里叶域卷积表示的目标跟踪算法