基于FFT 和CNN 的滚动轴承故障诊断方法

2021-12-15 02:38尹文哲夏虹彭彬森朱少民王志超

应用科技 2021年6期

尹文哲，夏虹，彭彬森，朱少民，王志超

1.哈尔滨工程大学核安全与先进核能技术工信部重点实验室，黑龙江哈尔滨 150001 2.哈尔滨工程大学核安全与仿真技术国防重点学科实验室，黑龙江哈尔滨 150001

在核电厂中存在诸多旋转设备，如电机、泵、风机、汽轮机等，它们在核动力系统中扮演着重要的角色，而滚动轴承是旋转设备中最常用的部件之一，其对旋转设备完成预定功能起着至关重要的作用。但由于设计、制造、安装、工况等多方面因素，滚动轴承也是最常出现故障的部件之一。为确保核动力系统安全稳定运行，对滚动轴承进行有效的故障诊断十分必要。

目前最常用的滚动轴承故障诊断方法是振动分析法，即利用滚动轴承的振动信号进行故障诊断。针对该方法的研究主要集中在特征提取和模式识别2 个方面：首先利用信号处理方法，如小波变换[1]、希尔伯特-黄变换[2]、局部均值分解[3]、变分模态分解[4]等，提取原始振动数据的相关特征，并构建特征向量；然后利用机器学习算法，如贝叶斯分类器[5]、支持向量机[6]、神经网络[7]等，对特征向量进行模式识别。虽然传统的滚动轴承故障诊断方法已取得一定的效果，但其诊断模型表达能力有限，且较依赖于信号处理技术和专家经验。

近年来，深度学习已成为学术研究热点，为了增强故障诊断模型的表达能力，摆脱对专家经验的过度依赖，学者们开始研究将深度学习模型应用到滚动轴承故障诊断中，以追求更加良好的诊断效果。其中，研究最多的深度学习模型是卷积神经网络。卷积神经网络是一种监督学习算法，广泛应用于模式识别领域。目前，一般是将原始振动信号处理变换成时域图像、频域图像或时频图像，然后用卷积神经网络对这些图像进行诊断识别故障类型。HAN 等[8]将滚动轴承振动信号转换成时域图像，对图像进行相关处理后将其作为卷积神经网络的输入，以实现对轴承故障类别的判定。李恒等[9]对原始振动信号进行短时傅里叶变换，构造时频图样本，并将其作为卷积神经网络的输入，完成故障识别。袁建虎等[10]对轴承振动信号进行连续小波变换，得到相关时频图，作为卷积神经网络的输入。许理等[11]对采集的轴承信号进行小波包时频分析，得到各类信号的时频图，然后与卷积神经网络相结合进行故障诊断。然而，以时域图像或频域图像作为输入的卷积神经网络诊断效果有限，采用时频图像作为输入，诊断效果虽然得到一定的提升，但一般需要对相关预定义参数，如基函数、窗函数、窗口大小等参数进行合适地选择才能得到较好的效果，对专家经验具有一定的依赖性。

针对上述问题，本文提出一种基于快速傅里叶变换(FFT)和卷积神经网络(CNN)的滚动轴承故障诊断方法。该方法在信号处理过程中不需要设定相关预定义参数，对原始振动信号进行快速傅里叶变换后，将得到一维数据转换为二维的特征图作为ResNet-18 网络的输入，对不同故障类型和故障程度的滚动轴承进行诊断识别。

1 快速傅里叶变换

快速傅里叶变换是快速计算序列的离散傅里叶变换(discrete Fourier transform, DFT)或其逆变换的方法。傅里叶分析能够将信号从原始域(通常是时间或空间)转换到频域中进行表示，对于序列x(n)={x0,x1,···,xN-1},0 ≤n＜N的离散傅里叶变换表达式为

式中：e为自然对数的底数；i为虚数单位；k=0,1,···,N-1。

FFT 通过将DFT 矩阵分解为稀疏因子之积来快速计算此类变换，因此它能够计算DFT 的复杂度，将用DFT 定义计算需要的O(n2)降低到O(nlogn)。

2 卷积神经网络

卷积神经网络是深度学习的代表算法之一，它是一类包含卷积计算的前馈深度神经网络。CNN 在如文本识别、语音识别、故障诊断等识别领域有着广泛的应用。典型的卷积神经网络主要由输入层、卷积层、池化层、全连接层以及输出层构成。其中，卷积层以及池化层属于滤波级，用于对输入信号进行深度特征提取；全连接层属于分类级，用于对得到的特征向量进行分类判断。

在卷积神经网络中，卷积层可以有效地对图像进行特征提取，它具有权值共享、局部连接的特点，即使用若干个卷积核对原始输入数据按照一定的步长进行局部滑动卷积计算，从而实现对输入数据的特征提取，因而可以利用较低的计算成本得到较好的提取效果。卷积操作过程的数学表示如下：池化层也称下采样层，主要是通过采样的方法来减小特征的空间尺寸。目前比较常用的2 种池化方法是平均池化和最大池化，两者分别是用一定宽度的窗口以一定的步长在得到的特征图上滑动，求取该窗口内特征值的均值或最大值。本文选用的池化方法是最大池化法，可降低参数数目，提高特征的鲁棒性。

在经过前面一系列的卷积操作和采样操作后，会连接一个或多个全连接层，用于整合通过卷积层和采样层提取出的局部信息，然后将这些局部信息输入到Softmax 分类器中进行故障分类。Softmax 分类器实质上是逻辑回归二分类器的演化，它在多分类场景中应用较为广泛，通过将多分类问题映射为概率分布以实现分类决策。

由于卷积层、池化层和全连接层都是线性计算，为弥补线性模型表达能力的不足，通常会引入激活函数进行非线性操作，使得整个网络的非线性表达能力增强，挖掘出信号背后的潜藏特征，提升网络在非线性场景下的分类能力。常用的激活函数有Sigmoid 函数、tanh 函数以及Relu函数。本文使用的激活函数是Relu 函数，它能够避免神经网络出现梯度消失的问题，并且收敛速度快。

3 故障诊断模型

本文的故障诊断流程如图1 所示，首先对原始振动信号进行信号处理，再将处理后的信号按一定比例随机分为训练集和测试集；然后采用交叉熵函数作为损失函数，并使用Adam 方法对卷积神经网络模型进行训练；最后使用测试集对训练好的模型进行测试，验证模型的泛化性能。

图1 故障诊断流程

3.1 信号处理

在信号处理过程中，首先将原始振动信号等分成若干个数据段，假设每段序列表示为y(N)={y1,y2,···,yk,···,ym×n}，其中m、n为正整数，1 ≤N≤m×n；接着，对y(N)进行快速傅里叶变换，并求其模值，即可得到变换后的数据序列Y(N)={Y1,Y2,···,Yk,···,Ym×n}；最后，将序列Y(N)按如图2 所示方式转换成m×n的二维矩阵，构成特征图，作为卷积神经网络的输入。

图2 转换方式

这种数据预处理方法直接有效，且处理速度快。更重要的是，相比于一些时频分析方法，如小波变换(wavelet transform, WT)需要选择合适的基函数、短时傅里叶变换(short time Fourier transform,STFT)需要选择合适的窗函数以及窗口大小等，该方法不需要设定相关预定义参数，直接进行计算，摆脱了对专家经验的过度依赖。在本文中，分割1 024 个数据点作为一个数据段，对每一数据段采用上述信号处理方法，将其构成大小为32 ×32 的特征图。

3.2 神经网络模型

本文所采用卷积神经网络是ResNet-18 网络，它是经典卷积神经网络之一。ResNet 网络的特点是其存在着大量残差模块，这些残差模块包含着恒等映射层，其能使网络随着深度的增加而不会产生权重衰减和梯度衰减或消失等问题。ResNet-18 网络结构如图3 所示，包含一系列卷积层、恒等映射、Relu 激活函数、批量标准化、全局均值池化、全连接层等。

图3 ResNet-18 网络结构

图3 中“Conv 3× 3”指的是长为3、宽为3 的卷积核；64、128、256、512 表示的是卷积核的个数；“/2”指的是卷积核的步长设置为2，可实现特征图的长宽减半；Relu 是激活函数；BN 是批量标准化；GAP 是全局均值化；Max Pool 是最大值池化，其窗口大小为2 ×2；FC 是全连接层。

4 实验分析

4.1 实验数据

实验所采用的数据来自美国凯斯西储大学的公开轴承实验数据，其实验台架如图4 所示。本文采用的数据包含正常运行状态数据、3 种外圈故障数据、3 种内圈故障数据以及3 种滚动体故障数据，共10 种状态运行数据，实验样本信息如表1 所示，采样频率为12 kHz。每种数据的样本数目为100，每个样本有1 024 个数据点，共计1 000个样本。将全部样本经过如前所述的处理变换后，从中随机抽取700 个样本作为训练集，另外300 个样本作为测试集。

图4 轴承实验台架

表1 故障样本信息

4.2 超参数设置

在本实验中，需要进行设定的卷积神经网络超参数为批量大小m、学习速率α以及迭代次数N。为保证网络具有较好的分类效果，本文通过对m、α以及N进行组合对比试验，以得到良好的超参数组合。选择常用的m值以及α值作为可选值(m可选值为32、64、128，α可选值为0.01、0.001、0.000 1)，得到9 种组合，每种组合迭代次数为10 次。用已准备好的训练集对不同超参数设置的神经网络模型分别进行训练，训练完成后，用测试集进行测试。为避免实验的偶然性，对每种组合进行10 次训练和测试，将得到的10 次测试准确率结果去除最大、最小值后取均值，即为平均测试准确率，实验结果如图5 所示。

图5 超参数设置结果

当学习速率α=0.01 时，由于学习速率过大，出现了梯度弥散现象；当学习速率α=0.001 时，平均测试准确率最大值为100%，此时批量大小m=32；当学习速率α=0.000 1 时，平均测试准确率最大值为100%，此时批量大小m=32 或m=64。而在平均测试准确率为100%的3 种超参数组合中，α=0.000 1、m=32 组合收敛速度最快。综上，本文采用学习速率α为0.000 1、批量大小m为32、迭代次数N为10 的超参数组合进行正式的训练和测试。

4.3 结果与分析

用已准备好的训练集数据对ResNet-18 模型进行训练，训练完成后用测试集数据对模型进行测试。在迭代过程中的平均测试准确率结果如图6 所示。

图6 本文方法结果

可以看出，本文所提出的故障诊断方法对于多种滚动轴承故障具有极好的分类效果，平均测试准确率可达100%，诊断效果优良，证明了本文所提出的滚动轴承故障诊断方法的可行性与有效性。

为凸显本文诊断方法的优越性，将原始振动信号分别处理成时域图像、频域图像、经过STFT 变换的时频图像以及经过WT 变换的时频图像，且图像均先经过灰度化处理，再对每个像素点值进行归一化，然后作为ResNet-18 网络的输入，进行对比分析，其结果如图7 和表2 所示。

图7 不同方法平均测试准确率变化趋势

表2 平均测试准确率结果

通过对比实验可知：输入形式为本文特征图的卷积神经网络分类效果最佳，其平均测试准确率达到100%；其次是2 种时频图像以及频域图像，平均测试准确率分别为99.34%、97.34%、96.86%；最差的是时域图像，平均测试准确率为63.78%。相对于其他几种输入形式，本文的特征图能够更好地表现出信号的特征，当其作为卷积神经网络的输入时，更有利于卷积神经网络进行识别分类。此外，相对于2 种时频图像，本文方法不仅测试准确率更高、收敛速度更快，而且不需要设定相关预定义参数，如基函数、窗函数、窗口大小等，摆脱了对专家经验的过度依赖。

5 结论

本文提出了一种基于快速傅里叶变换和卷积神经网络的滚动轴承故障诊断方法。对原始振动信号进行相关处理得到特征图，将其作为CNN 的输入进行学习训练，并通过超参数寻优使得模型具有较好的诊断效果。实验结果表明，提出的诊断方法对于多类滚动轴承故障的识别准确率高，诊断效果良好；通过与不同的输入形式进行对比分析，本文方法的诊断准确率更高，收敛速度更快，并且在本文方法的信号处理过程中不需要设定相关预定义参数，可直接进行计算。