基于改进1DCNN-GRU的滚动轴承故障诊断

2023-11-02 11:37:30金海龙马吴旭孙登云樊凤杰
计量学报 2023年9期
关键词:特征提取故障诊断准确率

金海龙, 马吴旭, 孟 宗, 孙登云, 曹 伟, 樊凤杰

(燕山大学电气工程学院,河北秦皇岛066000)

1 引 言

随着国家“智能制造”战略的逐渐推进,机械系统开始朝着大型化、复杂化、智能化的方向发展[1]。滚动轴承作为旋转机械设备必不可少的零部件,其故障可能导致旋转机械系统停机、性能下降甚至是巨大的经济损失及人员伤亡[2,3]。因此,滚动轴承运行状态及时准确地诊断对保证许多复杂机械系统安全可靠运行起着至关重要的作用。传统的基于振动信号的故障诊断方法主要包括3个步骤:数据预处理,特征提取以及模式分类。文献[4]利用相空间重构、奇异值分解及独立分量分析完成了轴承故障信号中故障特征的有效提取,实现了轴承故障的高效识别。文献[5]利用变分模态分解分解、均方根熵及支持向量机完成了滚动轴承振动信号故障特征参量的有效提取,实现滚动轴承运行状态的有效监测。虽然,上述方法在故障诊断中取得了一定的成就,但是,这些传统故障诊断方法需要大量的先验知识和专业知识以及花费大量的时间选取合适的特征[6]。近年来,深度学习技术[7~9]为设备的故障诊断提供了强有力的数学工具,成为众多研究者关注的焦点。文献[10]结合对称点模式图像和卷积神经网络实现了转子故障可靠、准确的识别。文献[11]结合卷积神经网络及分层正则化实现了滚动轴承故障的有效诊断。文献[12]提出了一种基于优化的带有余弦损失的长短时记忆网络(long short-term memory,LSTM)的滚动轴承故障诊断算法,消除了信号强度对滚动轴承故障诊断的影响,提高了诊断精度。文献[13]提出了一种基于门控递归神经网络的滚动轴承故障诊断方法,实现了滚动轴承故障的快速精确诊断。

然而,目前多数研究只利用了振动数据在空间或者时间的单个尺度上的特征,无法充分利用振动数据所包含的信息。同时还存在故障诊断模型结构复杂、泛化性能欠佳等问题。基于上述分析,本文将振动数据空间及时间特征相融合,提出了一种改进一维卷积神经网络(one-dimensional convolutional neural networks, 1DCNN)与门控递归神经网络(gated recurrent neural networks, GRU)相结合故障诊断方法。同时,提出了一种IReLU激活函数,改进卷积网络中的激活函数,增强网络的特征提取能力。

2 基本理论

2.1 一维卷积神经网络

作为深度学习中提取数据特征的通用方法,CNN在图像处理[14]、语音识别[15]及故障诊断[2~13]研究中取得了显著的成就。典型CNN主要由3部分组成:卷积层、池化层和全连接层,如图1所示。在轴承故障诊断中,轴承信号通常被转换成频域图或者时频图,然后输入到2DCNN进行处理。鉴于信号在转换过程中会造成部分信息丢失,本研究采用一维卷积操作对信号进行特征提取。

图1 典型CNN结构图Fig.1 Structure of typical CNN

卷积操作主要完成数据的空间特征提取,其数学表达式为:

(1)

激活函数的重要作用就是增强网络的非线性表达能力,进而增强网络的分类能力。由于ReLU激活函数在输入值为负数时梯度为0,神经元不再处于激活状态,导致信息丢失。为了充分利用信号所含信息,本研究提出IReLU激活函数曲线图如图2所示,其数学表达式为:

(2)

由图2可知,当输入较大时,IReLU激活函数仍有输出,则可以防止模型进入饱和状态;当输入较小时,函数具有下限,又可以起到一定的正则化作用。此外,其允许输入小于0时,信号所含信息仍能够深入神经网络,从而减少信息丢失,增强网络的特征提取能力。

图2 IReLU曲线图Fig.2 The curve of IReLU

池化层主要用来对上层输出特征图进行缩放映射,进而减少卷积网络的参数量、加快运算速度,同时抑制过拟合。目前常用的池化方法有最大池化和平均池化。本研究采用最大池化操作,数学表达式为:

(3)

2.2 门控递归神经网络

循环神经网络(recurrent neural network, RNN)能够充分提取序列数据中的时间特征信息。然而,标准的RNN在梯度更新过程中存在梯度消失和梯度爆炸的问题。因此,RNN出现了2种常用的变体,即LSTM[12]和GRU[13]。但是,GRU的结构更加简洁紧凑,在训练数据很大时既能保证准确率,又能够加快运算速度。GRU结构如图3所示,其计算式为:

(4)

(5)

(6)

(7)

图3 GRU结构图Fig.3 Structure of GRU

3 改进的1DNN-GRU

结合1DCNN、GRU及Dense网络的优势,本研究所建模型主要由3部分组成:空间特征提取部分、时间特征提取及空间-时间特征融合部分以及故障诊断部分,如图4所示。首先,预处理后的数据通过具有不同尺度卷积核的1DCNN模块,经过一系列卷积和池化操作之后,数据的空间特征被提取出来。同时,为了抑制高频噪声,网络第1层的卷积核尺寸较大。接着,1DCNN模块输出的具有空间特征的数据经过堆叠GRU模块之后,数据中的时间特征也被提取出来并且完成了时间-空间特征融合。最后,具有时间-空间特征的数据通过Dense模块之后,输出诊断结果,实现滚动轴承的智能故障诊断。

图4 改进1DCNN-GRU结构图Fig.4 Structure of the improved 1DCNN-GRU

4 实验验证与分析

4.1 数据增强及划分

实际工况时,轴承往往工作在健康状态,因此轴承的故障数据较少。为增强网络故障识别能力,本研究提出一种新的数据增强方法,如图5所示。首先,将原始振动数据分为2部分,第1部分用于得到训练集,第2部分用于得到验证集和测试集。对于第1部分数据,首先,在合适范围内随机生成1个起始点以样本长度为窗口大小开始滑窗,把样本长度与步长的比值设为滑窗次数,达到滑窗次数后,会随机得到另1个滑窗起点再次将窗口滑动相应次数(每次滑窗次数相同),重复上述操作,得到训练集。对于第2部分数据,采用随机切分方法,在一定数据长度内, 随机生成1个起始点以样本长度为切分尺寸切取样本,然后按比例再分为验证集和测试集。此方法既可以实现数据增强,又能够保证训练集与验证集和测试集不发生数据混叠,进而增强网络的识别能力和泛化性能。

图5 数据增强及划分Fig.5 Data augmentation and partition

4.2 基于CWRU轴承数据的实验分析

4.2.1 数据集描述及划分

本试验首先采用西储大学公开的滚动轴承数据集[16]对本文所提方法进行实验分析。采用不同工况下的驱动端滚动轴承数据的10种状态作为此次实验数据集,每个状态下1 000个样本,单个样本长度为2 048,按照7:2:1划分训练集、验证集以及测试集,根据负载不同分为4组数据集A~D如表1所示。

表1 数据集信息表Tab.1 Datasets information table

4.2.2 模型优化及结果分析

本研究所提模型包含2个1D卷积和最大池化层、2个GRU层及1个Dense模块(包含输出层)。为了防止过拟合及加快网络训练速度,模型中引入批标准化层及dropout机制。运行平台为windows10+PyCharm,CPU为Intel(R) Core(TM) i7-6500U。

本研究所提模型的堆叠GRU模块中含有2个GRU层,用于提取数据中的时间特征,因此需要讨论每层所含神经元个数以达到充分提取特征的目的。设置4组实验,第1组堆叠GRU模块中神经元个数分别为128和64;第2组分别为64和32;第3组分别为32和16;第4组分别为16和8。以数据集A为例,进行10次实验,模型在测试集上的实验结果如图6所示。

图6 堆叠GRU中不同神经元个数对模型准确率的影响Fig...6 Effects of different number of neurons in stacked GRU on model accuracy

从图6中可看出,当2个GRU层的神经元数目分别为32和16时,模型准确率较高且比较稳定。故本研究所提模型的堆叠GRU模块中的神经元数目分别设为32和16。模型主要参数如表2所示。

表2 模型主要参数设计Tab.2 Model parameter design

4.2.3 模型性能评估

为了验证本文所建立模型的特征提取能力及泛化性能,采用t分布-随机邻近嵌入算法[17]对模型在不同数据集下的故障诊断结果进行降维可视化,如图7所示。从图7可以看出,本文模型对不同负载下的数据集都能进行有效的特征提取,具有较强分类和泛化性能。

为了验证本文所建模型在故障诊断中的优势,利用相同的数据集,将该模型与其他模型进行对比,每个模型进行10次测试,实验结果如表3所示。

图7 不同数据集下模型的分类结果可视化Fig.7 Visualization of classification results of the proposed model under different datasets

表3 不同模型性能对比Tab.3 The performance comparison of different models

测试集准确率取均值。实验1、5中使用的是向后传播网络(back propagation neural network, BPNN);实验2、6中所用的模型为典型1DCNN网络;实验3、7中所用模型是1DCNN-LSTM模型且模型中的1DCNN模块同实验2、6相同。

由表3可知,本文所提方法在不同数据集下的故障诊断中,平均准确率最高可达99.96%,高于对比模型且准确率标准差均低于对比模型,稳定性能最优。此外,当使用本文所提的IReLU激活函数时,模型的诊断准确率以及稳定性能普遍提高,进一步说明本文所提的IReLU激活函数能够使模型更加充分地提取信号特征、提高模型故障诊断准确率以及增强模型稳定性。

4.3 基于实验室试验台的实验分析

4.3.1 数据集描述及划分

实验室的轴承试验平台是标准机械故障模拟试验台,如图8所示。轴承故障的引入方式及信号采集频率同西储大学试验台一致,电机转速为1 800 r/min。实验中主要模拟了滚动轴承的3种故障状态,即滚动体故障(RF)、内圈故障(IF)、外圈故障(OF),加上正常状态,总共4种状态。数据集按照7∶2∶1划分训练集、验证集和测试集,实验数据集如表4所示。

图8 机械故障模拟试验台Fig.8 Mechanical fault simulation test stand

表4 数据集划分Tab.4 Datasets partition

4.3.2 故障诊断结果分析

为进一步验证本文所提方法的优越性,利用实验室中采集的滚动轴承振动数据对第4.2.2节实验1、2、3及实验8中模型进行测试。10次对比实验准确率均值如图9所示。由图9可知,本文所提方法测试准确率均值高达98.58%,远高于其他方法,具有显著的优越性。

综上所述,本文所提方法在不同的数据集上都具有较高的诊断准确率,这也表明本文所构建的模型具有较强的鲁棒性和更好的泛化能力。

图9 不同模型的故障诊断准确率Fig.9 The fault diagnosis accuracy of different models

5 结 论

本文提出一种改进的1DCNN-GRU滚动轴承故障诊断方法,其优越性如下:

1) 所提模型使用原始被测数据作为输入,无需进行人工特征提取及特征选择,既保证了原始振动信号中所含信息的完整性又减少了对先验知识和专家知识的依赖;

2) 提出IReLU激活函数,使振动信号所含信息更好地深入网络,减少信号所含信息的丢失,进而增强网络的特征提取能力,提高模型的故障诊断性能;

3) 引入堆叠GRU模块,从1DCNN模块输出的具有空间特征的数据中提取时间特征并进行特征融合,提高模型的诊断准确率;

4) 所提方法在不同的数据集上都表现出卓越的特征提取性能,故障识别率高达99.96%,高于对比模型且具有优越的泛化性能,对实际工况下的滚动轴承故障诊断有一定的帮助。

猜你喜欢
特征提取故障诊断准确率
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
基于Daubechies(dbN)的飞行器音频特征提取
电子制作(2018年19期)2018-11-14 02:37:08
高速公路车牌识别标识站准确率验证法
Bagging RCSP脑电特征提取算法
因果图定性分析法及其在故障诊断中的应用
基于MED和循环域解调的多故障特征提取
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断
机械与电子(2014年1期)2014-02-28 02:07:31