基于一维卷积神经网络的轴承故障诊断方法研究

2021-02-23 10:04冯连强田瑞明焦丽聪
重型机械 2021年1期
关键词:识别率故障诊断卷积

冯连强,徐 江,田瑞明,焦丽聪,李 韬

(中国重型机械研究院股份公司,陕西 西安,710032)

0 前言

随着工业生产水平的不断提升,机械设备朝着大型化、集成化方向发展。机械设备持续可靠运行不管从经济角度出发,还是人员安全角度出发保证生产过程安全显得至关重要。轴承作为旋转机械的关键基础部件,被广泛应用于各种旋转机械中,一旦发生各种故障将会影响机械的运行稳定性,甚至会引发机械整体出现故障。由此看来,轴承健康与否决定着机械设备的健康状态,及时对轴承故障进行诊断、定位能够有效的提高机械设备的安全性。因此,展开对轴承故障诊断技术的研究具有重大现实意义。

1 轴承故障诊断研究现状

轴承故障诊断首先需采集可靠的故障信号,采集的信号类型有声信号、温度信号及振动信号等,振动信号与其他信号相比受到外部干扰少,能够准确地反应轴承健康状态,因此在轴承故障诊断时大多数采用振动信号作为故障信号来源。信号处理方法从故障信号中进行故障特征提取,常用的信号处理方法有经验模态分解[1]、小波变换[2]、Winger-Ville[3]等。随着机器学习方法的不断发展,一些机械故障诊断领域的研究者将机器学习方法应用到故障诊断中,如使用贝叶斯分类器[4]、支持向量机[5]、神经网络[6]等机器学习方法提取故障特征实现故障诊断。这些轴承故障诊断方法虽然在轴承故障诊断中具有不错的故障诊断识别率,但需对信号进行详细的分析并设计合适的特征提取器与分类器组合,不同类型的故障所用的方法也不尽相同,即算法的通用性不强。且人工提取故障特征的故障诊断方法均过度依赖于轴承故障诊断专家的经验和知识[7]。随着传感器检测技术的不断提高,轴承状态监测点的增多和采集的数据量不断增大,该轴承故障诊断方法已不能满足大数据分析的要求。

近几年,随着计算机硬件集成制造技术和计算能力的不断提升,深度学习方法在图像处理、语音识别和自然语言处理等领域得到广泛的应用[8],并被应用到故障诊断领域。如稀疏自编码器[9]、深度置信网络[10]、深度神经网络[11]和卷积神经网络[12-13]。卷积神经网络(CNN)是一种经典的深度学习方法,对于一维轴承振动信号,卷积层与滤波器有着相似作用,可以从输入信号中提取出不同频带的故障特征。轴承故障信息往往分布于不同频带中,利用卷积神经网络的卷积层不同特征提取通道从中准确的提取出故障特征在此基础上实现高效的故障诊断。

基于此,文章中提出一种基于一维卷积神经网络(One-dimensional Convolution Neural Network,1DCNN)的轴承故障诊断方法。该轴承故障诊断方法中利用全局平均池化层[14-15](Global Average Pooling,GAP)代替全连接隐藏层减少网络模型参数的同时提高模型的泛化能力,输入信号为轴承原始振动信号包含轴承健康状态完备信息。

2 基础理论

卷积神经网络为多层网络结构,包含多层特征提取器和分类器。每一个特征提取器由卷积层、激活层和池化层3个基本单元组成,多层特征提取器的作用是对输入信号的低级特征随着网络层数的加深提取出更加高级具有区分性的特征,分类器对由多层特征提取器提取的特征进行分类识别。

如图1所示,卷积神经网络的卷积池化过程主要由卷积操作、激活操作及池化操作组成。卷积操作主要由卷积层的多个卷积核与输入数据的局部区域进行卷积运算实现特征提取生成新的特征图[16](feature maps)。卷积运算表达式为

(1)

图1 卷积网络结构图

通过卷积操作的线性变换从输入数据中提取出比较具有区分性的特征,通过激活操作进行非线性变换得到更加高级且具有区分性的特征。本文选用的激活函数为PReLU函数[17],其表达式为

(2)

从输入数据中提取出更加高级且具有区分性的特征,一定程度上可以减少数据维度,但由于提取的特征维度仍过高,易产生过拟合问题。因此需要对卷积操作后的特征根据局部相关性通过降采样方式对特征维度进一步减少,仅保留局部特征中的重要信息。卷积神经网络中的池化层可以实现该过程,池化层的输入是卷积层输出的特征。池化层输出特征向量为

(3)

本文在前几层池化层采用最大池化方式对卷积层提取的特征进行降采样,最大池化方式的表达式为

(4)

全局平均池化(GAP)为池化层中一种重要的池化方式,如式(5)所示。GAP通过对最后一个卷积层提取的每一维特征向量整体求平均值,生成一个1×1特征向量,作为该特征向量的浓缩特征实现减少特征向量维度,提高网络模型的泛化能力,因此文章中利用全局平均池化层代替全连接隐藏层。

(5)

在卷积神经网络中,通过全连接层对卷积、池化层提取的特征进行分类。全连接层的前向计算公式如式(6)所示,通过Softmax函数[18]式(7)对前向计算值进行分类。

(6)

(7)

3 故障诊断模型网络设计准则

若最后一层卷积层输出特征映射上的神经元节点在输入信号的感受野[19]为Re0,轴承每转动一圈振动信号采集传感器采集的数据长度为T,L为输入振动信号的长度,则有T≤Re0≤L为感受野设计的重要条件。因此,基于一维卷积神经网络的轴承故障诊断模型网络参数设计步骤如下:

设在第l个池化层的感受野为Rel,则有在第l-1个池化层的感受野为Rel-1,两个池化层感受野满足:

Rel-1=Sl(PlRel-1)+Wl

(8)

式中,Sl为第l个卷积层的卷积步长;Wl为第l个卷积层卷积核宽度;Pl为第l个池化层的池化窗口宽度。

本文设计的基于一维卷积神经网络的轴承故障诊断模型中,默认Wl=5,当l>1时Pl=2,Sl=1。因此公式(8)可写为

Rel-1=2Rel+4

(9)

当有n个卷积层时,l为最后一层卷积层Ren=1,在第n-1个池化层的感受野为

Ren-1=5

(10)

则最后一个卷积层输出特征映射上的神经元在第一个池化层上的感受野根据公式(9)进行递推为

Rel=2n-2×9-4

(11)

将公式(11)带入式(8),可以得到最后一层卷积层输出特征映射上神经元在输入层输入信号的感受野Re0为

Re0=Sl(PlRel-1)+Wl≈Sl(2n-1×9-8)

(12)

根据感受野设计的重要条件T≤Re0≤L且Sl必须能被L整除,则可得到轴承故障诊断模型网络参数设计准则为

(13)

4 轴承故障诊断实验与分析

4.1 实验数据来源

文章中选用凯斯西储大学(CWRU)轴承数据中心[20]提供的数据集作为轴承故障诊断数据来源。该数据采集系统装置图如图2所示,采用加速度传感器分别从驱动端和风扇端两个位置采集轴承不同健康状态的振动信号。由于驱动端采集的轴承振动信号与风扇端采集的轴承振动信号相比受到外部干扰少,因此在本实验中选用驱动端采集的轴承故障信号作为轴承故障诊断实验数据来源对应的采样频率为12 kHz。该数据集包括四种负载条件下(0 hp,1 hp ,2 hp和3 hp)的轴承振动信号,每种负载条件下轴承故障共有3种不同位置分别为内圈故障(IR)、滚动体故障(B)和外圈故障(OR),且每种故障位置分别包含由电火花加工的故障损伤直径为0.007 inch、0.014 inch和0.021 inch三种损伤程度,与相同负载条件下轴承正常状态组成10种轴承健康状态。

图2 CWRU轴承数据采集系统

4.2 数据增强

为了增强深度学习模型的泛化能力常用的方式是使用大量的训练样本对深度学习模型进行充分的训练。针对轴承振动信号,采用等间隔滑动固定长度窗口完成对轴承振动信号重叠截取,实现扩充轴承故障信号训练样本数量如式(14)所示,在前后两次重叠截取过程中前一次采集的信号与后一次采集的信号有重叠部分,重叠截取实现原理图如图3所示。

(14)

图3 振动信号重叠叠取原理图

式中,N重叠截取的样本数量;L原振动信号长度;W训练样本长度;S信号采样间隔W>S>0。

4.3 数据集构建

在实验中采用重叠截取数据增强方法,对每种轴承健康状态的振动信号前50 000点数据,采用样本长度L=2 048信号采样间隔S=80生成600条训练样本,对于原振动信号的50 001到120 000点数据进行无重叠截取最多生成34条测试样本。为了加快故障诊断模型的收敛速度,对每一条样本信号均采用公式(15)进行归一化处理:

(15)

本实验准备了4个数据集,数据集A、B和C对应负载为1 hp、2 hp、3 hp条件的数据集,具体划分如表1所示。每一个数据集包含每种轴承健康状态600条训练样本,对于测试样本每种状态选取30条数据。数据集D为A、B和C数据集的并集包含18 000条训练样本和900条测试样本。具体数据集划分如表1所示。

表1 实验数据划分

4.4 故障诊断模型

由于本文所构建的数据集中每条信号长度为L=2048,三种负载条件下轴承转速分别为1 772 r/min、1 750 r/min和1 730 r/min,根据公式(16)可以计算出T≈400。若设计的承故障诊断模型有5层卷积池化层,通过公式(13)可以计算出取值为4或8。

(16)

式中,Fs为采样频率;n为电机转速。

为实现对轴承不同健康状态进行准确的识别,在网络参数设计准则的约束下设计的基于一维卷积神经网络的轴承故障诊断模型共有4层卷积池化层,每一层卷积层之后连接批量归一化层将输出的特征向量归一化到合适的数据分布,利用PReLU作为激活层的激活函数对提取的特征进行非线性变换,输出层具有10个神经元实现对轴承10种健康状态进行分类。轴承故障诊断模型的具体网络参数设置如表2所示。

表2 轴承故障诊断模型网络参数

4.5 故障诊断实验与性能分析

在搭建网络模型过程中其他超参数设置如下:RAdam[21]最小学习率设置为le-4,mini-batch大小设置为256提高模型训练过程中并行计算速度。

(1)实验方案一。为了对文章所提出的基于一维卷积神经网络的轴承故障诊断方法的性能进行评价,分别利用所构建的数据集A、B、C和D对搭建好的轴承故障诊断模型进行10次训练减小在训练过程中网络参数随机初始化对本节设计的轴承故障诊断模型稳定性的影响,每次训练过程最大迭代次数为1 000次。

如图4所示,轴承故障诊断模型在A、B、C和D数据集上10次训练测试结果图。在数据集A上故障诊断识别率均达到99.59%以上,在B、C和D三个数据集上识别率最为稳定,每次识别率均达到100%。由此可以得出:文章中所提出的基于一维卷积神经网络的轴承故障诊断方法,可以直接对时域振动信号进行处理,提取特征,实现对各种故障进行准确的识别。

图4 故障诊断模型在4个数据集上的识别率

(2)实验方案二。在实际工业生产中,机械设备工作条件复杂,随着生产任务的变化,负载条件也在不断的发生变化,当负载条件变化时,加速度传感器采集的轴承振动信号幅值、周期及相位也将会发生变化。因此使用数据集A、B和C一种数据集对模型进行训练,另外两种数据集对该轴承故障诊断模型在变负载条件下的性能进行测试,在实际工业生产中轴承故障诊断具有重要意义。实验过程中训练集与测试集设置,如表3所示,各个数据集对应的转速如表4所示。

表3 变负载条件下实验数据集划分

表4 数据集A、B和C对应转速

实验结果如图5所示,文章提出的基于一维卷积神经网络的轴承故障诊断方法的平均识别率为93.13%。从图中还可以看出当使用轻负载条件数据集训练故障诊断模型利用重负载条件进行测试时,将会获得较高的故障诊断识别率;当利用重负载条件数据集训练故障诊断模型利用轻负载条件数据集测试时,对应的故障诊断率较低。利用数据集C进行训练故障诊断模型,利用数据集A进行测试时,故障诊断效果较差故障诊断识别率仅为89.99%。如表4所示,数据集A的转速高于数据集C,数据集A中振动信号相比于数据集C较为复杂,因此当利用较低转速数据集训练故障诊断模型利用高转速数据集进行测试时,因信号特征发生变换导致较低的故障诊断识别率。

图5 变负载条件下故障诊断识别率

5 结论

文章提出了一种基于一维卷积神经网络的轴承故障诊断方法,该方法直接对一维时域信号进行处理,通过利用大量轴承不同健康状态数据进行训练学习,该方法能够自适应的提取故障特征实现准确高效的故障诊断。实验结果表明,该轴承故障诊断方法在同种负载条件下故障诊断识别率为99.59%以上,且具有一定的变负载条件,自适应性平均变负载条件故障诊断识别率为93.13%。相比于其他深度学习故障诊断方法,省去了信号预处理的步骤保留轴承健康状态的完备信息,具有实际应用价值。

猜你喜欢
识别率故障诊断卷积
基于包络解调原理的低转速滚动轴承故障诊断
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于类图像处理与向量化的大数据脚本攻击智能检测
从滤波器理解卷积
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
数控机床电气系统的故障诊断与维修
提升高速公路MTC二次抓拍车牌识别率方案研究
基于傅里叶域卷积表示的目标跟踪算法
高速公路机电日常维护中车牌识别率分析系统的应用
因果图定性分析法及其在故障诊断中的应用