张晓锋, 郝如江, 程旺, 夏晗铎, 段泽森
(石家庄铁道大学 机械工程学院,石家庄 050043)
齿轮箱是旋转机械的关键部件,其内的机械故障约30%是由轴承发生故障引起的[1]。而对机械设备进行定期的故障诊断之后,可以将事故的发生率减少75%,维修的费用也可以降低25%~50%[2]。因此,对机械进行故障诊断不仅能有效提高生产效率,而且能产生巨大的经济效益。科研人员逐渐将浅层的机器学习方法应用到旋转机械的故障诊断之中,常见的有深度置信网络[3]、循环神经网络和卷积神经网络[4]等故障分类方法或模型。ResNet[5]作为卷积神经网络的一种优秀模型,在图像识别领域[6]应用广泛且表现优异,所以本文将其应用到故障诊断方面。但是一方面考虑到故障信号的具体工业环境含有噪声等冗余信息,ResNet网络并不能解决噪声等冗余信息对故障诊断性能的影响,如何剔除噪声等冗余信息的影响是当前故障诊断的一个关键问题。另一方面由于故障信号时变性较强,如何保证数据的特征不被丢失也是目前较为受关注的一个方向。
本文对ResNet进行改进使其具备降噪效果,而且增加了多尺度特征融合[6],对实验数据进行预处理,得到不同尺度的特征信息,从而避免丢失敏感特征。经过在DDS实验台上的数据测试,取得了良好的故障分类效果。
残差网络(Residual neural network,ResNet)由He等[7]在2015年提出,在当年的ILSVRC竞赛中,取得了ImageNet比赛分类任务冠军。该网络为网络增加了一条恒等映射,其映射函数为
H(x)=x+F(x)
(1)
式中x为输入,也就是identity,在另一条路径中经过卷积变换得到F(x),二者对应元素相加最终输出H(x)。而神经网络在训练过程中是利用反向传播来进行特征的学习,其公式为
(2)
由式(2)可以发现:
在实际工况中,采集到的数据一般都包含噪声信号,本文用神经网络利用注意力机制[8]自动生成阈值[9]来将噪声等冗余信息消除,从而提高故障诊断的正确率。设置阈值在很多降噪[10、11]中都用应用,将[-τ,τ]区间内的特征置为0,让距0较远的特征朝着0进行收缩。其公式为:
(3)
考虑到每组数据特征不一致,利用注意力机制根据数据自身的特征来设置自己独特的一组阈值,这样每组数据都可以有可以根据样本自身的重要程度不同,进行独特的特征通道加权调整。从而保留重要信息,削弱冗余信息对诊断结果的影响。将自适应阈值块加入到残差网络中改进为残差收缩块(Residual shrinkage network block)[12],本文称其为RSNB块,可以很好的对信号中的冗余信息进行剔除,该模块的模型如图1所示。
图1 RSNB模型图Fig.1 RSNB model
由于故障信息的频率各不相同,所以在采集数据时就会采集到不同尺度的信号。而经典的CNN卷积核大小一般是固定的,所以使用不同尺度的卷积核来处理特征就显得十分重要。将多尺度特征融合[13](Multi-scale feature fusion)添加到经过改进的残差收缩网络中,本文将此卷积块称为MFF块,对数据进行多尺度预处理从而获得更多有用特征[14]。为此选用了1×4、1×32、1×64、1×128等不同尺度的卷积核,组成2个MFF层来充分挖掘信号中的特征信息如图2所示,重复两次最后进行汇总传入后续的残差收缩网络之中。
图2 MCK卷积块结构Fig.2 MCK convolution block structure
多尺度特征融合模型有两个特征融合模块(Fusion block),两个融合模块的结构是相同的,都是采用跳跃连接。因为在后续的残差收缩模块中,特征信息经过其中的最大池化层之后尺度信息发生了变化,而特征融合需要特征层的尺度必须大小一致,所以需要对浅层卷积层进行卷积变化,使得变化后输出的尺度与后面需要相加的特征层尺度一致;然后对其进行ReLU[15]激活处理,接着输出到BN层对数据进行批量归一化;而低层卷积层进行简单的卷积、激活与批量归一化处理后通过Add函数与经过反卷积的高层卷积层进行添加操作,具体计算流程如图3所示。
图3 MFF特征融合模块Fig.3 MFF feature fusion module
针对故障信号中的不同尺度信号,采用1×4、1×32、1×64、1×128等不同尺度的卷积核层联,构建了1个多尺度卷积核模块来提学习网络深层的不同特征;而后为了融合高层网络与低层网络各自的优点,将经过两次RSNB模块的高层卷积层经过反卷积操作与低层的卷积层进行特征融合处理。将高层的两个卷积层1×510×64经过卷积操作,使其尺度与经过残差收缩模块后的卷积层尺度相同,通过Add函数使其对应相加,如此特征融合操作完成,然后将两个特征融合后的卷积层通过网络的后面层相连接后输入到后续的故障分类层。该改进使模型实现了高层卷积层与低层卷积层的特征融合,使网络能够同时学习到低层网络特征的细节信息,又拥有高层网络所具备的的敏感度,使网络在进行故障诊断时学习能力得到明显提升,网络诊断效果更加精。改进后的具体网络结构如图4所示。
图4 MFF+RSNB网络模型结构Fig.4 MFF+RSNB network model structure
本实验考虑了试验台的8种工况,包括一种健康状态、3种轴承故障类型、4种齿轮故障类型。8种健康类型的具体形态如图5所示。
图6为DDS试验台,主要由电机、扭矩控制器和磁粉制动器组成。齿轮箱可以模拟旋转机械健康状态和各种故障状态。
图6 DDS试验台Fig.6 DDS test bench
DDS试验台在进行实验时的工况参数设置如表1所示。
对采集到的8种类型的故障信号进行打标签操作,其标签编号如表2所示,其中的训练集规模为训练集规模为1 536×1 600,每种故障类型都选取1 536×200测试集规模为1 536×400。
表2 故障类型Tab.2 Fault types
为模拟在噪声条件下的信号特征,所以在DDS试验台采集到的信号中加入随机噪声,以此来模拟具体环境下的噪声;将信噪比为2dB的数据输入到改进后的RSNB与MCK+MFF+RSNB网络中,每次迭代都打印1次训练精度和训练损失值。得到网络训练的准确率变化分别如图7与图8所示。
图7 RSNB模型正确率Fig.7 RSNB model accuracy rate
图8 MCK+MFF+RSNB模型正确率Fig.8 Accuracy rate of MCK+MFF+RSNB model
为验证改进后网络模型的抗噪效果,分别加入信噪比为-4dB、-2dB、0、2dB、4dB的噪声来测试5种网络在不同噪声强度下的故障诊断准确率,
网络模型分别为CNN、AlexNet、ResNet和本文提出的RSNB、MCK+MFF+RSNB这4种网络模型。在迭代150次之后将实验故障诊断准确率结果记录下来进行对比,5种网络训练与测试的故障诊断的准确率随噪声强度的变化对比如图9与图10所示。
图9 4种模型正确率对比(训练)Fig.9 Comparison of accuracy rates of four models(training)
图10 4种模型正确率对比(测试)Fig.10 Comparison of accuracy rates of four models (test)
发现总体而言随着数据信噪比的降低,故障诊断的效果出现下降,在信噪比为-4dB的时候,MCK+MFF+RSNB网络的故障诊断精确度为88.0%,RSNB模型的诊断精度为80.1%,而AlexNet、ResNet网络、CNN网络的故障诊断精度分别为71%、68.7%、57.5%。而当信噪比增大到2dB时,噪声对原始数据的影响变小,MCK+MFF+RSNB网络的故障诊断精确度为99.8%,RSNB网络模型的诊断精度为99.7%,而AlexNet、ResNet网络、CNN网络的故障诊断准确率分别为92.3%、92.5%、91.4%,当信噪比继续增大时,说明数据中的噪声强度小对网络性能的影响进一步变小,这5种网络模型都有不错的诊断效果。
而后统计网络的学习效率与特征提取能力,将5种网络在训练的准确率不再变化时所需要的迭代次数统计下来重复3次取平均值,其结果如图11所示。
可以发现改进网络达到稳定的训练状态所需要的迭代次数是最小的,相同的条件下只需要网络迭代28次,而残差收缩网络也需要42次迭代才能达到稳定的识别精度;其他3种网络模型都需要迭代更多次数才能达到稳定的。可以得出在经过多尺度卷积核(MCK)与特征融合处理(MFF)之后,改进网络的特征提取能力得到很大程度的提高,而且网络训练的稳定性得到提升。
1) 将特征映射加入到传统卷积神经网络中形成的残差网络,能够在层数加深时使特征丢失严重的问题得到改进,解决网络梯度消失的现象,使网络的深度能够加深,为构建深层卷积神经网络打下基础,进而提升网络性能的目的。
2) 将注意力机制与软阈值化加入到网络中构建残差收缩模块(RSNB),针对在工业环境下会产生噪声等干扰因素这一问题,在网络中设置自适应阈值块,根据噪声的不同强度自适应生成阈值,该模块使网络获得良好的降噪效果。
3) 将多尺度特征融合运用到神经网络中,在网络的前端使用这一处理,可以使后续进入到神经网络的信号获得不同尺度的特征,而且使得网络能够获取深层与浅层的信息,既能够提取到细节信息,又能够保证足够的敏感度。最大限度的获取故障信号中的故障特征,降低特征丢失,而且降低了神经网络的训练时间,提高网络模型的训练效率。
为了提高网络的鲁棒性,还需要采集不同试验台上的数据来进行模型的训练,探究网络在其他类型故障诊断的应用及改进。