基于改进残差网络的旋转机械变工况故障诊断*

2022-11-09 00:21段泽森郝如江王一帆杨文哲郭梓良
组合机床与自动化加工技术 2022年10期
关键词:残差准确率故障诊断

段泽森,郝如江,王一帆,杨文哲,郭梓良

(石家庄铁道大学机械工程学院,石家庄 050043)

0 引言

在实际运转中,旋转机械长期在复杂多变的工况下运转,再加上润滑等因素使得滚动轴承很容易发生故障,若不及时发现故障并维修,在长时间的持续运转下很有可能导致机械设备的损坏,造成严重的经济损失[1]。因此,从旋转机械振动信号提取出有效的故障信息并识别出故障,在实际的生产生活中具有深远的影响。

近些年,深度学习(deep learning)变得越来越热门,其中残差网络(ResNet)成为了人们广泛学习的对象,该网络能很好的解决深层神经网络中过拟合现象和梯度消失或梯度爆炸问题[2]。赵小强等[3]对残差块中池化层结构进行改进,使网络的特征提取能力增强,但该方法涉及参数过多,无法轻易寻找最优参数,而且网络训练时间较长,故障诊断准确率较低。金余丰等[4]结合残差网络和注意力机制方法,有效地提高了故障诊断准确率,但在变工况条件下,其模型稳定性较差,无法适用于复杂变工况环境。针对以上问题,本文提出了一种残差神经网络,它能有效解决上述问题。其主要优点有:①本文方法是一种高效简单的端对端残差神经网络,它能直接利用一维数据作为输入,并对其进行诊断分类;②该网络结构能在复合变工况下保持高的分类准确率;③该结构较为简单,有助于训练,使测试集准确率有很好的稳定性。

1 理论介绍

1.1 残差网络

HE等[5]提出了残差网络概念,该网络以卷积神经网络(CNN)为基础,通过加入残差学习理念,设计出残差块结构,并用于构建深层网络,其中残差块结构示意图如图1所示,残差学习的定义为:

y=F(x,{Wi})+x

(1)

式中,x和y为模块的输入和输出;F为将要学习的残差映射;Wi为模块参数。

图1 残差块结构示意图

1.2 Inception模块

Inception模块主要是将神经网络中层与层间的卷积运算进行拓展。运用不同尺寸大小的卷积核,使得卷积网络在挖掘深层信息的过程中获得不同的感受野,且不同尺寸的卷积核能提取多种特征,最后不同尺度特征整合到一起,得到丰富的特征信息,从而提升模型的识别准确率[6]。常见的Inception模块结构示意图如图2所示。数据由输入进入模块,分别输送到1×1卷积、1×1卷积与1×3卷积的串联、1×1卷积与1×5卷积的串联、1×1卷积与1×3最大池化层的串联。最终整合4个部分提取的特征,得出多尺度特征。

图2 Inception模块结构示意图

1.3 注意力机制

注意力机制在深度学习中越来越流行,其主要作用是能关注到有效的特征信息,并能抑制其他无关紧要的信息特征[7-8]。

注意力机制含有挤压与激励网络(squeeze and excitation network,SENet)两部分,其单元结构如图3所示。SENet通过其中的挤压与激励模块自主调整每个特征通道的权重分布,再利用通道权重加强重要特征并抑制多余特征[9]。

图3 注意力单元结构示意图

首先进行挤压(Squeeze)操作。要想调整通道间的权重关系,需要压缩通道中的特征信息,并通过池化层将输入的W×H×C特征信息转换成1×1×C的输入,其中C个特征图的全局信息,表达式为:

(2)

式中,zc为特征输出;Fsq()为挤压操作;uc为特征输入;(i,j)为特征的坐标再激励(Excitation)操作。将上一阶段得到的压缩后的全局信息与维度为C÷r×C全连接层连接,其中r是缩放参数,主要用于减小通道数,缩减网络中的参数量与计算量。紧接着在ReLU层激活,再输送到第二个全连接层,并复原通道数[10-11]。其中两个全连接层的主要为了把各个通道提取的特征信息进行整合。最后利用sigmoid函数,将输入映射到0~1范围内,生成通道权重,表达式为:

s=Fex(zc,Wi)=δ(W2σ(W1zc))

(3)

式中,s为通道权重参数;Fex()为激励操作;W1、W2为全连接层;σ为ReLU激活函数;δ为Sigmoid函数。

1.4 DropBlock层

DropBlock是一种正则化方法,也是Dropout的一种结构化形式。DropBlock通过设置大小使得各块元素就能学习到更具有鲁棒性的特征,进而能同时在卷积层和全连接层上使用DropBlock方法[12]。DropBlock主要参数有两个:s和γ,s表示drop的方块大小;γ表示drop的方块激活单元的数量,其表达式为:

(4)

2 模型架构设计

本文所设计的深度学习模型以残差神经网络为基础,结合多尺度模块和注意力机制模块构成。其整体的网络模型如图4所示。其过程为:①模型以旋转机械一维数据作为输入,先进入一个大卷积核的卷积层,该层的主要作用是为了在输入数据中能获得更多有效的信息和抑制噪声作用。②多尺度部分,由多个不同尺寸的卷积层和池化层组成的4个通道进行特征提取,得出多尺度特征信息。③残差部分,采用2个残差块进行进一步特征提取,适量的残差块不仅能提高深度挖掘复杂数据中的有效特征信息,还能避免过拟合现象的产生,两个残差块均采用一层BN层ReLU激活函数和卷积层组成,减小计算量的同时,还能改善梯度消失问题。④注意力机制部分,其部分主要是通过调整通道的权重,捕捉有效特征信息,并能减小噪声等干扰因素对模型识别效果的影响,进而提升模型的识别能力。⑤最后经过全连接层、DropBlock层和输出层进行分类。

3 实验与结果分析

3.1 多故障类别数据集实验

为了验证本文方法的可行性,采用动力传动故障诊断综合实验台(DDS)进行实验验证,实验台主要组成部件示意图,如图5所示。

图5 DDS实验台

DDS实验台内部传动系统简图,如图6所示。

图6 传动系统简图

滚动轴承几种故障类型示意图,如图7所示。

(a) 内圈故障 (b) 滚动体故障 (c) 外圈故障

实验台所用的滚动轴承型号为ER16K,其滚动轴承主要参数,如表1所示。

表1 滚动轴承参数

本实验采用齿轮箱中的9种工况,包括1种健康状态、8种故障类型,其中具体故障类型、样本数据点数和数据样本划分设置,如表2所示。

表2 实验数据设置

实验工况参数设置,如表3所示。

表3 实验工况

实验采用Adam优化算法更新模型参数,大小设置为0.001,迭代次数为140,每批处理量为128,DropBlock层的值为0.5,其模型参数如表4所示。

表4 模型参数设置

利用初始信号下共5400个训练样本和3600个测试样本进行实验,实验结果如图8所示。

(a) 准确率曲线图 (b) 损失值曲线图

从图8a准确率曲线可看出,准确率随着迭代次数增加而增加,迭代到20~40次之间时,变化曲线有小的浮动,但当迭代50次以后趋于稳定,且训练与测试曲线开始重合,其准确率接近100%。

从图8b损失值曲线可看出,随着迭代次数的增加,损失值也在减小,当迭代100次以后,其损失值趋于0,进一步发现其测试与训练曲线近乎重叠看出模型有很强的鲁棒性。

从图8c混淆矩阵可以看出,标签4(滚动轴承滚动体故障)和标签5(齿轮断齿故障)、标签4和标签7(齿根裂纹故障)之间有着互相识别错误的现象发生。模型对9种故障类型的平均识别率为99.64%。

3.2 T-SNE可视化

T-SNE(t-distributed stochastic neighbour embedding)能够很好的将数据样本映射到二维或三维空间。考虑到可视化神经网络每一层输出量的需求,需要用T-SNE将测试样本在网络每层的高维输出结果进行降维,在低维空间中可视化。

图9展现的是利用测试样本在训练好的模型里特征分布图。采用不同颜色和形状的符号用来区分齿轮箱故障类型,并按照表2中标签进行设置,标注显示在图的右侧。

由图9可以看出,图9a中首层卷积输出图的多种故障类型的特征重叠在一起,经过图9b多尺度模块后,各类故障特征有明显的分离和聚集,随着深层挖掘,故障类型特征经过图9c第二个残拆块后分离越来越明显,最后的图9d全连接输出层中,各类特征完全分离且各自聚集在一块,很容易区分不同故障类型。

图9 不同层的T-SNE可视化输出图

3.3 凯斯西储大学变工况实验数据与设置

为了验证本文所提模型在实际工作环境下的效果,因此,分别模拟变噪声、变负荷和变噪声、变负载共存的3种不同工况。利用美国凯斯西储大学(CWRU)滚动轴承实验数据,使用不同电机转速,选取对应的4种负载的大小分别为0 hp、1 hp、2 hp和3 hp(1 hp=0.746 kW)。

选用滚动轴承10种故障类型如表5所示。其中每个训练样本、测试样本采用的数据点数为3000,并分别在样本中添加不同负载和不同噪声强度的信噪比(SNR)分别作为变负载测试样本和变噪声测试样本,其中的训练样本和测试样本按照一定的比例划分。变工况数据的具体划分如表6所示。

表5 滚动轴承10种故障类型

表6 变工况数据

3.4 变工况实验结果及分析

3.4.1 变噪声工况故障诊断

本文选取2 hp负载下滚动轴承数据作为实验样本。加入不同程度的高斯白噪声,得到信噪比为-10 dB、-8 dB、-5 dB、-3 dB、3 dB、5 dB、10 dB的变噪声测试样本,以检测每种方法的抗噪性,为了客观地比较方法的优劣,对比实验为:AlexNet、一维ResNet、一维CNN和本文方法进行对比,为了公平性,这4种先进模型的首层卷积层卷积核大小为1×100,以上4种模型在不同噪声强度下的对比结果如图10所示。

图10 不同信噪比下准确率对比图

由图10可得,随着信噪比的下降,分类准确率也随之下降,当信噪比为-10 dB时候,本文所提模型的准确率最高,达到80.14%,而一维ResNet、一维CNN和AlexNet的准确率分别为77.45%、76.04%和73.24%,分别低于本章节方法2.69%、4.1%和6.9%。结果表明,与比较先进的3种模型相比,本文模型具有更加出色的抗噪声稳定性。

3.4.2 变负载工况故障诊断

图11 不同方法的变负载准确率对比图

本实验是在变负载的条件下进行的,并与AlexNet、一维ResNet、一维CNN故障诊断方法进行了比较。负载变化是指在0 hp、1 hp、2 hp、3 hp这4种不同的负载数据中,本文用0-1、0-2和0-3分别表示在0负载下的数据作为训练样本,以1 hp、2 hp、3 hp负载下的数据作为测试样本三组实验编号,其他实验组编号同理。几种先进方法的变负载准确率对比图如图11所示。

从图11可得,本文方法的平均准确率达到96.33%,均高于其他方法。这是因为多尺度结构获取了不同特征信息,通过多个卷积池化的深层处理,能够多层次和更全面挖掘特征信息。本文方法在变负载工况条件下有较好的适应性和泛化能力。

3.4.3 复合工况故障诊断

为了模拟真实的工作环境,所以设置变噪声、变负载共存的复合工况环境,并与一维ResNet方法比较。为了公平期间,该一维ResNet的模型结构为本章所提模型去掉多尺度模块和注意力模块余下的结构,对比结果如图12所示。

(a) 一维ResNet方法 (b) 本文方法

从图12a可得,一维ResNet方法在信噪比(SNR)为6 dB、9 dB和12 dB不同强度的噪声干扰下,故障诊断准确率平均最高为80.63%,最低为71.36%,整体准确率偏低;从图12b可得,本文方法在3种不同强度的噪声干扰下,故障诊断平均值最高为95.32%,最低为88.21%,整体准确率值较高且浮动较小。由此可得,本文方法在复合工况下的故障诊断准确率更高且平稳。

4 结论

本文提出了一种改进的残差网络用于处理旋转机械故障诊断问题。它是在残差网络的基础上加入了注意力机制模块和Inception模块所构成,是一种鲁棒性很强的故障诊断模型。主要结论有:

(1)本文模型直接处理一维故障信号,省掉了过去繁琐的人工提取特征操作,极大缩短了故障诊断工作时间,进而提升了工作效率。

(2)在变噪声工况条件下,本文方法的平均故障故障诊断率均高于其他对比方法。在变负载工况条件下,本文方法在每一组负载变化实验的故障诊断准确率均高于其他办法,3-1组变负载实验的准确率最高,达到了97.21%。在复合工况下,本文所提方法的故障诊断准确率平均值更高更平稳。

猜你喜欢
残差准确率故障诊断
比亚迪秦EV充电系统故障诊断与排除
基于神经网络的船舶电力系统故障诊断方法
基于残差-注意力和LSTM的心律失常心拍分类方法研究
融合上下文的残差门卷积实体抽取
基于包络解调原理的低转速滚动轴承故障诊断
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
基于残差学习的自适应无人机目标跟踪算法