改进的CNN网络在轴承故障诊断中的应用

2020-09-25 06:02杨兰柱刘文广

机电工程技术 2020年8期

杨兰柱，刘文广

（1.内蒙古科技大学工程训练中心，内蒙古包头 014010；2.内蒙古科技大学机械工程学院，内蒙古包头 014010）

0 引言

轴承是旋转机械的基本部件之一，45%～55%的机器停机是由轴承故障引起的[1]，所以，有效的轴承故障诊断方法是保证机器正常工作的重中之重。但轴承故障诊断一直是故障诊断领域中的难题。

到目前为止，大多数基于数据驱动的智能诊断方法已被应用于轴承故障诊断领域中。如人工神经网络（Artificial Neural Network，ANN），随机森林和支持向量机（Support Vector Machine，SVM）。利用这些浅层机器学习模型进行轴承故障诊断需要手工提取一系列的振动信号特征（例如方差、能量熵、均方根等），将所提取的特征作为模型输入从而利用分类器进行故障分类。以往的研究结果表明，特征提取是达到理想诊断准确率的重要前提。但实际上，人为的提取很难准确表征轴承故障特性的有效特征，主要有以下3个难以解决的问题[2]：（1）需要足够的专业知识和经验知识；（2）在难以消除的硬件干扰及多变的机械系统环境下，提取的特征也应该是多变的；（3）手工提取特征可能对数据利用率较低，从而导致有效信息缺失。因此，上述经典的浅层模型不适用于轴承故障诊断。

为了避免上述问题，近年来，各种基于模式识别[3]的深度学习方法被提出，其中CNN受到各个领域的广泛关注。与其他深度学习模型相比，CNN采用权值共享、局部感知和子采样策略，可以显著减少待优化参数数量，使网络训练速度大大提升。同时，由于CNN卷积过程中对局部变化不敏感的特点，使CNN具有了较强的抗噪能力。CNN作为主要的深度学习模型之一，已经成功应用于许多领域。

但由于传统CNN网络自身特性，在用于轴承振动信号深层次特征提取时，在提取过程中往往会产生过拟合现象，导致测试集准确率较低且训练速度较慢。基于此，本文在原有的CNN网络架构基础上对网络进行了改进，增加了一个批归一化（batch normalization，BN）层[4]，一个指数线性单元层（exponential linear unit，ELU）[5]，并通过实验表明提出的网络更具有有效性及泛化性。

1 方法

1.1 改进的CNN网络

改进的CNN网络目的是完善传统CNN在提取信号局部特征时的一些弊端。改进的CNN网络信号提取层由一个卷积层（Convolution），一个BN层，一个ELU层和一个最大池化层（Max Pooling，MP）构成，结构如图1所示。其中，卷积层和池化层是改进的CNN网络的核心层。BN层提高了深度网络的性能和稳定性。ELU层加快了设计网络的学习速度，提高了的识别精度。最大池化层可以减少噪声对提取故障特征的干扰[6]。它将输入划分为一组互不重叠的区域，并输出每个子区域的最大值[7]。改进的CNN网络是由对输入噪声具有鲁棒性的层构建而成，因此改进的CNN网络学习到的特征具有一定的鲁棒性。

图1 改进的CNN网络

将信号x（n）作为输入输入到大小为l的卷积核w（n）中进行卷积来获得结果z（n），实验中随机初始化卷积核w（n）。

然后将卷积得到的特征输入到BN层，使这些特征在激活后得以归一化。归一化后，这些特征的平均值接近于0，标准差接近于1。归一化的特征可以表示为：

经过函数BN(∗)的处理后，卷积层获得的特征已被规范化，函数σ(∗)为ELU层的激活函数，可表示为：

将所得特征传递给最大池化层，池化层具有非线性下采样功能，可以降低特征分辨率，最大池化层生成的特征可表示为：式中：Ωk为索引为j的池化区域。

1.2 改进的CNN网络使用方法

本文构建了改进的CNN网络来对轴承振动信号进行处理，通过叠加4个特征提取层来提取轴承振动信号深层次特征。其流程图如下，其中每一个LFLB为一个特征提取层，每个LFLB层由一个卷积层，一个BN层，一个ELU层及一个最大池化层组成。4个LFLB组成的LFLBS层提取出了信号的深层次特征如图2所示。该网络目的是从轴承振动信号中学习深层特征，轴承振动信号是一维的，因此，每个LFLB模块的卷积核和池化内核都是一维的，且每个LFLB模块的卷积核大小都为3，步长都为1，填充方式都为SAME。其中LFLB1与LFLB2卷积核数量为64，LFLB3和LFLB4卷积核数量为128。每个LFLB模块中的最大池化内核大小与步长都为4。网络参数如表1所示。网络顶层使用softmax分类器，分类器根据学习到的深层次特征来判别轴承故障类型。

然后将学习到的深层次特征输入到全连接中，全连接层输出的故障特征可表示为：

图2 改进的CNN网络流程图

表1 改进的网络参数（C为卷积层，P为池化层）

全连接层输出输入到Softmax分类器中进行分类。Softmax是一种分类器，在多分类问题中，标签z包含两个以上的值。Softmax函数可以定义为：式中：zi为softmax的输入；hj为倒数第二层的激活；Wji为倒数第二层和softmax层之间的权重。

因此，预测类标签为：

2 轴承故障实验

2.1 数据采集实验与数据库描述

西储大学轴承数据集被认为是检验机械故障诊断方法的基准。所用故障轴承故障为正常轴承；内圈故障轴承，外圈故障轴承，滚动体故障轴承。该试验使用电火花加工技术分别在轴承外圈（3点钟、6点钟、12点钟方向）、内圈、滚动体上布置了单点故障，故障直径分别为0.007英寸（1英寸=2.54 cm）、0.014英寸、0.021英寸、0.028英寸、0.040英寸，转速分别对应于 1 797 r/min、1 772 r/min、1 750 r/min、1 730 r/min。信号的采样频率为12 000 Hz。将西储大学正常轴承振动数据及3种故障轴承振动数据每类故障下的每个样本裁剪为10个大小为12 000个点的子样本，随机性的将子样本集以8∶2∶2的比例分割为训练集、验证集及测试集。

图3 HZXT-DS-003双跨双转子滚动轴承试验台简图

表2 6205轴承参数

2.2 数据处理

2.2.1 传统CNN在该数据集上的应用

使用传统的CNN来对该数据集数据进行处理，网络架构如图4所示，网络参数如表3所示。

图4 传统CNN架构图

表3 CNN参数

实验结果如图5所示。从结果可以看出，使用传统CNN来对该数据集数据进行分析，要达到模型最优需要的迭代次数有230次左右，且验证集准确率最高仅有76.33%，使用测试集对训练好的网络进行测试，准确率为75.26%，显然，传统的CNN并不适合处理轴承原始振动信号。

2.2.2 改进的CNN在该数据集上的应用

使用改进的CNN网络来对数据集进行处理，网络架构如图2 所示，网络参数与表1参数相同。处理结果如图6所示，当迭代次数达到34次时模型达到最优，此时验证集准确率最高为98.75%。使用测试集对模型进行测试，得到的轴承故障混淆矩阵如表4所示，测试集准确率为97.35%。结果表明，与使用传统CNN实验结果相比较，网络达到最优所用迭代次数大大减少，表明改进的CNN运算成本大大降低。且准确率方面，改进后的CNN性能明显优于传统CNN。

图5 传统CNN训练准确率和验证准确率随迭代次数的变化图

图6 改进的CNN训练正确率和验证准确率随迭代次数的变化图

表4 轴承故障混淆矩阵准确率%

3 结束语

使用改进的CNN网络来对轴承进行故障诊断，可以避开人工提取特征过程，减少诊断成本。又由于是在海量数据中寻找特征，所以具有更高的泛化性。本文提出的改进的CNN网络可以有效地学习到轴承振动信号深层次特征，相比于使用传统CNN网络，其提取的特征更具有代表性，诊断效果远好于使用传统CNN神经网络。