基于LSGAN-SqueezeNet的轴承故障诊断研究

2022-06-29 09:57李长杰苏宇涵孙兴伟
振动与冲击 2022年12期
关键词:轴承故障诊断准确率

刘 杰, 李长杰, 苏宇涵, 孙兴伟

(沈阳工业大学 机械工程学院,沈阳 110870)

滚动轴承作为机械设备最重要的部件之一,其广泛的应用于各类机械设备之中[1]。在工程实际过程中,滚动轴承的状态直接影响着设备的工作效率,如发生突发故障不仅会造成巨大的经济损失,严重时会导致相关工作人员的伤亡。因此,对滚动轴承的故障诊断研究不仅保证了设备的工作效率,而且对设备操作者的保护具有重要的意义[2]。在滚动轴承故障诊断过程中,故障数据的可靠度直接影响诊断结果的准确性。在数据的采集和收集过程中由于轴承的工作环境较为复杂,易导致收集的数据丢失,或不能精准收集到大量的对应故障数据[3]。而针对数据驱动下的滚动轴承故障诊断,首要前提是解决滚动轴承数据缺失的问题[4]。

Li等[5]提出了一种改进GAN(generative adversarial networks)生成样本在机器故障条件下生成人工样本并进行跨域故障诊断的方法。Gao等[6]提出了一种基于Wasserstein梯度惩罚GAN(wasserstein generative adversarial networks with gradient penalty, WGAN-GP)的样本数据量不足方法,重新设计了WGAN的损失函数。Shao等[7]利用一维卷积神经网络(1D-convolutional neural networks,1D-CNN)构造辅助分类器GAN(auxiliary classifier generative adversarial networks, ACGAN)进行数据扩充,其中附加的标签信息有利于生成相应的故障样本。上述基于GAN的数据生成方法在一定程度上克服了在高维度、丢失比例较大的情况下仍能重建数据和恢复数据。但由于损失函数的限制,使GAN在训练过程中会出现梯度消失和色散。虽然改进的WGAN方法可以一定程度上解决梯度消失问题,但会导致训练效率降低。

针对上述问题,本文提出将最小二乘生成对抗网络结合SqueezeNet应用于样本数据量不足条件下的滚动轴承故障诊断。首先,将滚动轴承故障数据重构为二维矩阵输入生成器中添加了dropout层的改进LS-GAN(least squares generative adversarial networks)模型,通过最小二乘损失函数代替交叉熵损失函数的方法生成相应故障样本。与真实故障样本按不同比例输入SqueezeNet模型,经过训练得到准确率较高的诊断模型,并通过真实样本验证模型诊断的准确率和有效性,同时对比其他方法验证所提方法的优越性。

1 LSGAN-SqueezeNet模型及理论

1.1 LSGAN理论

GAN在2014年由Goodfellow等[8]提出,它由生成器生成样本结合判别器判别生成样本与真实样本数据分布是否一致,一致就输出否则循环此过程直到生成样本符合真实样本分布。其广泛应用于图像生成、语音识别等领域。GAN是一种无监督的学习模式,该模型体现在一方赢则另一方一定为输的“零和博弈”思想[9],GAN由生成器G和判别器D基于非合作博弈概念组成。生成器G用于训练任意分布样本Z得到映射样本x′=G(z),x′服从真实数据的分布PG(x)。其目标是最小化生成数据与真实数据的分布差距。判别器D判别输入样本是“生成数据”还是“真实数据”,在训练过程中生成器G和判别器D的相互博弈,得到最优生成样本并达到纳什均衡[10]。

GAN的目标函数可表示为

Ez~pG(x)[log(1-D(G(x)))]

(1)

式中:PG(x)为真实数据的分布;pdata(x)为最优解;Ex~pdata为样本分布为pdata(x),x的期望;Ex~pG(x)为样本分布pG(x),x的期望。判别器的目标是最大化V(D,G)使其能够更好地区分D和G,当logD(x)越大,log(1-D(G(x)))就越小,判别准确率就越高。

原始GAN由生成器G构造的“生成样本”分布可能与实际样本分布存在较大的差异,会致使训练过程中梯度消散,从而导致生成样本质量偏低。针对上述问题,Mao等[11]于2017年提出LS-GAN模型,将GAN的目标函数由交叉熵损失函数变为最小二乘损失函数,解决了生成样本质量不高和训练过程不稳定的两大缺陷。

LSGAN的目标函数表示为

(2)

式中:a,b分别为生成样本和真实样本的标签;c为判别器D对生成样本判别为真的期望值。对a,b,c值的确定,现存在两种取值思路[12]。结合本文内容将选择其中一种取值方法作为目标函数,并进行详细阐述:设定b=c时生成样本尽可能的接近真实数据分布,则设定a=0,b=c=1代入目标函数可得

(3)

LSGAN的中心思想是判别器通过平滑且非饱和的梯度损失函数,将生成的“伪样本”训练为趋近真实样本的数据分布[13]。

为了防止生成器中过拟合,加入dropout层,防止生成重复的数据影响训练效果。同时在生成器加入的dropout层与判别器中的最小二乘损失函数均会保证生成数据的质量,提高滚动轴承故障诊断结果的准确性。图1所示为LSGAN的网络结构图。

图1 LSGAN网络结构图Fig.1 LSGAN network structure diagram

1.2 SqueezeNet卷积神经网络

SqueezeNet是一个简易的CNN架构[14],是在保持模型分类准确性的基础上,减少网络的深度以及参数。与加深网络结构提高准确率的ResNet等网络不同的是,SqueezeNet在保证了提高模型准确率的基础上同时降低了训练成本。在CNN的基础上采用以下几种策略来设计SqueezeNet[15]:

(1)网络中卷积核尺寸由3×3简化为1×1。

(2)将输入通道的数量减少至3×3。

(3)在网络后期进行欠采样,使卷积层具有较大的激活函数。

其中,(1)和(2)可以显著减少参数数量,(3)在参数数量受限的情况下提高准确率。

Fire Module是SqueezeNet主要组成模块,该模块由包含1×1卷积核压缩层,和混合1×1和3×3多尺度学习卷积核的扩展层组成,模块结构如图2所示[16]。

图2 Fire Module模块结构Fig.2 Fire Module structure

本文采用的SqueezeNet由conv层结合Fire Module模块加Softmax分类器组成,其模型结构如图3所示。

图3 SqueezeNet网络结构Fig.3 SqueezeNet network structure

在如图3所示的网络结构中,SqueezeNet具体的网络内部参数如下表1所示。

表1 SqueezeNet网络内部参数Tab.1 Internal parameters of SqueezeNet

其中输出尺寸为特征图输出该网络层的特征图尺寸,如64×64×3为输出尺寸为64×64,通道数为3的特征图。

采用LSGAN-SqueezeNet的滚动轴承故障诊断流程图如图4所示。其包含以下步骤。

步骤1数据集构建。根据数据特点和类型结合LSGAN需求,将一维数据信号转为二维矩阵信号,并按比例划分数据集为训练和测试集。

步骤2生成样本。将步骤1中数据输入LSGAN模型中进行训练,生成更多数据样本,扩充训练数据集。

步骤3训练SqueezeNet网络模型。将生成数据和真实数据转换为二维灰度图输入SqueezeNet模型,对网络模型进行训练。

步骤4将不同的样本作为测试集输入步骤3中训练得到的网络模型中,获得故障识别的准确率,实现对LSGAN-SqueezeNet模型性能的测试。

中国国有企业大致分为三类:一是中央所属的工业企业(特殊行业的不算),即“中央企业”(狭义); 第二类是中央所属的非工业企业和特殊行业的工业企业,这类企业被财政部称为“中央企业”(广义),不但包括中央所属的金融机构,如四大国有商业银行、烟草总公司、铁路总公司等巨无霸企业,也包括各中央部委所属的林林总总的企业,甚至某部委机关服务中心下属的地下室招待所、印刷厂都在其中;第三类是地方政府出资成立的国有企业,按属地原则由当地政府所属的国资委或指派特定机构履行出资人职责。说明一下,地方国资委与国务院国资委无直接隶属关系,它们归地方政府管。

步骤5采用不同类型的轴承试验数据对上述步骤进行验证,数据集1采用凯斯西储大学轴承试验数据,数据集2采用德国帕德博恩大学轴承故障数据。

图4 本文轴承故障诊断流程Fig.4 Bearing fault diagnosis process in this paper

2 基于LSGAN-SqueezeNet轴承故障诊断实例1

2.1 LSGAN试验样本构建

LSGAN的试验训练样本1来自凯斯西储大学轴承数据中心公开轴承数据集[17]。采用12 kHZ采样频率下驱动端轴承数据,根据轴承的故障状态分为:正常(N)、内圈故障(IR)、外圈故障(OR)以及滚动体故障(RE)。在同种故障条件下,根据故障程度分为0.177 8 mm,0.355 6 mm,0.533 5 mm,负载条件为735~2 205 W,如表2所示。

表2 滚动轴承故障类型Tab.2 Fault types of rolling bearing

将每类一维数据构建二维矩阵,作为LSGAN的网络输入。每段取4 096个采样点重构为64×64的轴承信号矩阵输入判别器进行训练及生成对应种类样本。

2.2 LSGAN网络参数设定

采用表2所示10类训练样本,每类样本量为400,共4 000个训练样本。按80%训练集和20%测试集划分比例,作为LSGAN训练的输入样本数据。为了保证训练结果的可比性,采用的各类型生成对抗网络参数均设置为:采用RMSProp方式训练,生成器与判别器学习率均设置为0.000 2;迭代次数500次;批尺寸为32;β1取0.5;β2取0.999。

图5为迭代500次后生成的轴承故障数据与真实样本数据转换为二维灰度图后的比较。

图5 生成数据与真实数据比较图Fig.5 Comparison between generated data and real data

图6所示为LSGAN在迭代过程中生成器与判别器的损失函数,当模型迭代次数达到200时,判别器与生成器的损失变为小幅震荡,并其值均保持在小于0.5的数据范围内,说明网络达到纳什平衡。

图6 LSGAN判别器和生成器损失函数趋势Fig.6 Loss function trend of LSGAN discriminator and generator

通过对比3种GAN生成数据的能力,引入GAN[18]和SGAN[19]按2.1节所述网络结构,采用相同的迭代次数和网络深度生成样本。通过Wasserstein距离(Wasserstein distance,WD)[20]、欧氏距离(Euclidean distance,ED)[21]以及最大均值差异距离(maximum mean discrepancy,MMD)[22]3个衡量分布差异的指标来判定生成样本的质量。上述分布差异指标均为越小越优型。结果如表3所示。

表3 不同样本数据量不足方法的指标对比Tab.3 Index comparison of different data enhancement methods

通过表3对比可知,LSGAN相较于对比的GAN网络,生成数据的质量有一定的提升。

2.3 生成数据比例对故障诊断结果影响

结合SqueezeNet卷积神经网络设置不同训练比例的生成样本和真实样本,验证生成样本在故障诊断过程中对模型及结果的影响。验证样本分为三类:第一类,使用不同样本量的真实数据,训练模型并使用该模型对真实数据生成的4 000个样本进行分类;第二类,按不同比例设置真实+生成复合数据集训练模型,将上述4 000个样本输入该模型用于故障诊断;第三类,只使用生成样本训练SqueezeNet网络模型,再将训练好的模型用于对4 000个真实数据样本的故障诊断。在训练上网络模型过程中始终使用80%训练20%验证的比例,记录训练模型准确率、测试模型准确率以及测试过程所耗时长。

表4 不同样本比例对模型及诊断准确率Tab.4 Model and diagnostic accuracy of different sample proportion

表4展示了在3类数据集的训练及验证准确率,从序号3~4及18~20表明训练模型的数量较小时,验证的误差也会随之升高,降低模型精度。其中序号6和9得到本次试验的最高准确率,均达到99%以上,可以得出生成数据结合真实数据能够明显的提升训练模型的准确率。当单纯使用真实数据或生成数据训练模型时,验证准确率并不理想。而将真实数据结合生成数据辅助训练时,模型精度达到最高。结果表明,当训练数据量及真实数据量过少时均会导致模型准确率降低,原因是生成数据本身有一定的误差,从而影响模型的性能进而降低故障诊断的准确性。

在本试验过程中对比6号和9号的训练模型准确率时会发现,9号的模型训练准确率略高于6号,但测试准确率却相对较低。说明此时9号网络在训练模型的验证过程中出现过拟合现象,但将训练好的网络对其他数据集进行故障诊断时效果明显不如6号。同时也可得出结论,当出现过拟合现象时,解决方法之一就是增加训练样本的数量。

2.4 不同生成样本诊断准确率对比

为了验证LSGAN生成样本的有效性,将对比方法GAN和SGAN,生成与LSGAN数量相同的样本。构建GAN和SGAN生成样本与真实样本训练集对SqueezeNet进行训练,再对4 000个真实样本进行分类。通过对比诊断的准确率,判别生成样本模型的有效性。

表5为当采用GAN和SGAN生成数据与真实数据样本结合进行的滚动轴承故障诊断准确率及所用测试时长。各选取LSGAN测试过程中比较有代表性的数据集比例,对应表3中编号分别为1,2,6,7的样本量比例。在各个模型训练过程中的参数均与LSGAN网络参数相同,迭代次数为500,按照不同的故障种类训练10种生成模型。通过结果对比可知,对比方法生成的数据在诊断时长上与本文所提方法较接近。但本文所提故障诊断模型的准确率均达到90%以上,明显优于对比方法。

表5 不同生成数据方法对准确率的影响Tab.5 Influence of different data generation methods on accuracy

2.5 不同负载下故障诊断分析

图7所示为真实样本与生成样本量各为2 000时,对SqueezeNet模型进行1 600次训练迭代过程的变化。当训练达到1 400次时,验证准确率达到99.5%;损失率在1 200次迭代之后逐步趋近于0,并持续到最大迭代次数1 600次。表明在此样本训练模型的情况下,模型可以较好的拟合。

图7 SqueezeNet模型迭代过程Fig.7 SqueezeNet model iteration process

将负载分别为735 W,1 470 W以及2 205 W的滚动轴承真实故障样本输入本节所述训练模型,得到真实样本结合生成样本训练的网络模型诊断结果。并采用该模型对735 W及2 205 W负载下的故障进行迁移诊断。对各诊断情况进行定量描述,如图8所示。

图8 训练模型对不同负载条件下轴承故障诊断Fig.8 Fault diagnosis of bearing under different load conditions by training model

对比图8各图可知,LSGAN-SqueezeNet模型在以1 470 W负载条件下真实结合生成样本进行训练,输入735~2 205 W负载条件下的轴承故障样本进行故障诊断,结果分别对应为735 W为97.7%、1 470 W为99.7%和2 205 W为97.3%。故障诊断识别均达到97%以上,验证了模型在滚动轴承故障诊断的准确率和有效性,同时对不同工况下故障诊断具有较强的泛化性。

3 基于LSGAN-SqueezeNet轴承故障诊断实例2

3.1 数据描述

采用德国帕德博恩大学提供的公开轴承数据集,试验台由几个模块组成:电机、扭矩测量轴、滚动轴承测试模块、飞轮和负载电机,如图9所示。

图9 德国Paderborn大学轴承试验台Fig.9 Bearing test bench of Paderborn University of Germany

采用6203型球轴,以64 kHZ采样频率采样。根据轴承的故障状态分为:正常(N)、内圈故障(IR)以及外圈故障(OR)。其中内圈故障由3种加工方式所得:电火花加工、钻孔以及电刻加工;外圈故障由两种加工方式所得:电火花加工及电刻加工。选用电火花加工数据目的是与实例1中故障加工方法一致。为保持收集的信号的稳定性,需要使驱动系统的转速、轴承径向力以及传动系统负载扭矩3个参数恒定。本文选取转速为1 500 r/min、负载扭矩0.7 Nm、径向力1 000 N的基本条件下采集的轴承振动信号。

每段取4 096个采样点重构为64×64的轴承信号,构建二维矩阵,每种状态信号构建400个样本,作为输入LSGAN进行训练及生成对应种类样本。实例2所使用网络结构与表1相同,且学习率、批尺寸以及优化器参数设定均与2.1节保持一致。

3.2 结果及分析

使用LSGAN分别对N,IR,OR状态下振动信号样本进行训练,经过500次迭代后得到生成样本,将生成样本与真实样本的时域及频域对比如图10所示。

由图10所示可知,LSGAN生成的数据可以有效的学习到原数据的分布规律,从而实现在训练样本量不足的情况下实现数据扩充及增强的效果。

将生成数据的三类信号各构建400个样本集,作为SqueezeNet的网络输入,结合真实样本数据进行网络训练,得到不同样本比例的情况下模型诊断的准确率。

图10 真实样本与生成样本信号时域频域图Fig.10 Real sample and generating sample signal in time domain and frequency domain

表6 不同样本比例对模型及诊断准确率Tab.6 Model and diagnostic accuracy of different sample proportion

由表6可知,使用帕德博恩数据集进行故障诊断过程中,在训练样本量较小时如序号3,6,15,训练模型的及验证准确率均很低,且均低于90%准确率。在序号7的试验中得到最高准确率,达到99.7%。并且结合序号8,9,10,13的试验结果可得,生成数据结合真实数据训练的模型可以达到提升故障诊断准确率的目的,验证了所提方法的有效性。其中序号7所示的具体分类结果混淆矩阵如图11所示。

图11 轴承3种不同状态的混淆矩阵Fig.11 Confusion matrix of three different states of bearing

4 对比试验

为验证所提方法的有效性,采用LSGAN生成样本结合真实样本集,与其他应用于轴承故障诊断的方法进行对比。选取试验1中的数据集6、试验2中的数据集7作为输入,利用GoogleNet进行故障诊断[23]。将对比方法1中所提数据集作为输入,与AlexNet结合进行故障诊断[24]。选用文献[25]中提到的振动信号特征包括:峰值、均值、方差、均方根、峭度、斜度、时频域特征选用小波变换的3层低频信号结合3层高频信号,所提取的特征结合SVM进行故障诊断分类,数据集采用与前对比方法相同,但未转换成二维矩阵的一维振动信号。

表7 不同模型的故障诊断准确率Tab.7 Fault diagnosis accuracy of different models

由表7可以看出,在生成结合真实样本的条件下,本文所提方法诊断准确率均高于对比方法。GoogleNet在对数据集2的诊断能力略逊于AlexNet和SqueezeNet;而SqueezeNet的网络结构相对于AlexNet更为简化,但诊断精度更优于后者,不仅提升了诊断准确率还降低了训练成本。多特征-SVM通过提取特征在进行故障诊断,虽然准确率也达到了90%以上,但受限于特征提取不够充分导致准确率不如本文所提方法。与其他方法对比,本文所提方法在保证了故障诊断准确率的同时,也降低了诊断过程的时间成本,体现了该方法的优越性。

5 结 论

本文提出LSGAN结合SqueezeNet滚动轴承故障诊断方法,验证该方法应用于样本数据量不足情况下的可行性:

(1)采用改进LSGAN数据样本生成方法,相较于其他对比方法,生成样本精度有一定的提升。同时对应生成数据在应用于故障诊断过程中,所提方法相较于对比方法准确率由80%左右提升至99.7%。

(2)选择不同比例的真实样本与生成样本训练SqueezeNet模型,在两个试验中诊断准确率最高达到99.7%,体现出所提模型对故障诊断的有效性。

(3)将不同负载条件下的滚动轴承样本输入训练模型中,其准确率分别达到97.7%,99.7%和97.3%,表明该模型在不同工况数据集上具有较强的泛化能力。

(4)所提方法不仅在诊断准确率优于对比方法,在同类型方法中网络结构相对简化但不降低诊断精度,节约了故障诊断过程中的时间成本,具有较高的实用价值。为样本数据量不足条件下的滚动轴承故障诊断提供一种具有较高效率及准确率的方法。

Vol.41 No.12 2022

猜你喜欢
轴承故障诊断准确率
轴承知识
轴承知识
基于包络解调原理的低转速滚动轴承故障诊断
轴承知识
轴承知识
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
数控机床电气系统的故障诊断与维修