基于轻量级CNN的电机轴承故障诊断研究

2022-11-23 07:21田勇董国贵

齐齐哈尔大学学报（自然科学版） 2022年1期

田勇，董国贵

基于轻量级CNN的电机轴承故障诊断研究

田勇，董国贵

（铜陵职业技术学院机械电气工程系，安徽铜陵 244000）

：针对深度学习在嵌入式或移动端设备中用于故障诊断时，受限于有限的硬件资源而又需要有足够的效率和精度的应用需求，提出基于轻量级卷积神经网络的电机滚动轴承故障诊断方法。首先对滚动轴承的振动信号数据集进行连续小波变换生成固定尺寸的时频图，并以此方式生成数据集输入网络进行训练。使用测试集进行测试，结果表明，所生成的故障诊断预测网络模型具有较高的识别精度和识别速度，准确率达到99%。通过验证噪声对网络的影响，表明所使用的网络具有较好的鲁棒性和泛化能力。

轴承故障诊断；卷积神经网络；轻量级；时频图

电机轴承是大多数旋转设备动力单元的重要零部件，其状态好坏是决定设备能否平稳运行的关键。对于轴承类零件的故障诊断，从早期采用人工“听诊”的经验型判断方法，逐渐发展到目前以提取振动信号特征为主要手段的数据分析型诊断方法，该类方法主要使用快速傅立叶变换、短时傅里叶变换、时频分析等方法提取故障特征，其主要难点在于如何使用合适的故障信号的处理方法提取出尽可能多的故障特征。伴随着人工智能技术的发展，故障诊断的方法又进一步发展到以深度学习为重要手段的智能故障诊断方法。此类方法通过搭建合适的网络模型来学习故障数据，自动地完成特征提取和故障分类过程，在取得较高准确率的同时，也大大降低了故障诊断过程中的人工干预和对专家经验的需求程度。基于深度学习的网络模型框架可以大致分为卷积神经网络（Convolutional Neural Network，CNN）、深度信念网络（Deep Belief Network，DBN）和自编码器（Auto-Encoder，AE）[1]。文献[2]和文献[3]采用基于自编码器的深度神经网络，实现了轴承与电机的故障分类和诊断。文献[4]使用深度信念网络对滚动轴承进行故障诊断。曲建岭等[5]基于一维卷积神经网络，对滚动轴承自适应故障诊断算法做了深入研究。

卷积神经网络无论是在一维数据还是在二维图像的分类和识别方面都已取得了较大突破。该类网络通常具备前馈二阶段网络结构，主要是由卷积和分类两大部分构成。本文采用了一种轻量级的卷积神经网络模型，通过小波变换和数据集增强等手段对轴承故障数据进行预处理，转化为时频图后作为神经网络的训练样本，实现了较高的故障诊断准确率。

1 数据集预处理

1.1 轴承故障原始数据集

电机轴承故障及正常状态下的振动数据采用美国凯斯西储大学的所公开的数据集[6]（CWRU）。该实验数据采集自电机驱动端的轴承，数据集中分别包含了正常情况、轴承内圈损伤、轴承外圈损伤、滚动体损伤等四大类不同的轴承状态，在3类故障损伤状态中，损伤部分的尺寸又分别包括0.1778mm, 0.3556mm, 0.5334mm。同时，在外圈的故障中，又分别针对故障位于3点钟、6点钟和12点钟方向等3个位置，监测获取了3组不同的数据。本文的研究中，选取了电机在12kHz的工作频率下，电机转速在1748r/min时，电机驱动端轴承的正常状态和3种损伤尺寸下的轴承滚动体故障、轴承内圈故障与轴承外圈故障（6点钟方向）共10种状态作为故障诊断的类型。

1.2 数据集增强

对于同一个神经网络模型，扩大训练样本的数量是既简便又能明显提高机器学习的模型泛化能力的有效方法[7]。在利用机器学习进行二维图像分类和识别等应用时，通常可以对一张图像采用翻转、平移、缩放、旋转、切变等方式来扩充数据集数量，进而达到数据集增强的目的。轴承运转中产生的振动信号，是一维的非平稳时变信号，同时具有一定的周期性特征。本文参照了文献[8]提出的方法，通过对原始数据进行二次重叠采样，来实现一维数据集增强的目的。

以轴承滚动体出现0.1778mm尺寸损伤的故障情况下的轴承振动数据为例，该故障信号共有121556个数据点。每次采样长度为1024的数据序列作为训练样本的预处理数据，第+1次采样时较第次采样的数据段偏移量为32（小于每次采样长度），则所有数据点一共可以生成1849个预处理样本数据段。减小数据段的偏移量，可以进一步增大样本规模。重叠采样方式如图1所示。

图1 轴承诊断信号重叠采样示意图

1.3 基于连续小波变换的时频图

利用小波函数对信号进行分析能够较好地体现信号的时频局部特性[9]。轴承故障信号除了其周期性特点以外，还具有突变和非平稳的特性，使用复值小波分析手段来处理此类信号可以有效地提取信号中的幅值和相位信息。

为了更好地提高图像分类的准确率，需要让不同故障状态类型的信号经小波变换后所生成的时频图具有较明显区别，Complex Morlet复值小波和高斯复值小波是两类较常用的复值小波分析工具。

Complex Morlet复值小波的表达式为

高斯复值小波的表达式为

利用上述两个小波基函数，对截取的样本分别做连续小波变换，并生成时频图，并将图片输出尺寸统一设定为128×128像素。以轴承滚动体故障为例，如表1所示为3个不同的滚动体损坏尺寸的样本下，两种小波处理后所生成的时频图对比。

从表1中可以看出，基于高斯复值小波的时频图和基于Complex Morlet复值小波的时频图在不同故障类型下均具有相对明显的区分。在本文中选择高斯复值小波cgau8来对样本进行连续小波变换并生成时频图。

依照上述样本预处理方法，针对电机轴承正常状态和不同故障类型下共10种状态，每种状态生成700张时频图，随机选取每种状态类型中的500张加入训练集，剩余200张图片加入验证集。此外，在原始数据中，从每种状态类型数据中再随机截取100个数据段生成时频图作为测试集。最终得到电机在12kHz的工作频率下，电机转速在1748r/min时，共计8000张轴承振动信号的时频样本图片，其中训练样本5000张，验证样本2000张，测试样本1000张。

2 轻量级卷积神经网络

卷积神经网络是一种多层的监督学习网络模型，能够很好地应用在二维和三维图像的识别分类场景中。网络结构通常包含了输入层、激活层、卷积层、池化层和全连接层，网络最明显的特点就是其“端到端”的特性，对需要处理的图像、信号等信息不用进行人工提取特征等环节，在输入端直接输入原始信息后，可以直接得到输出结果。随着卷积神经网络的发展，先后出现了AlexNet、VGGNet、ResNet等深度学习网络模型。这些网络模型在取得不俗的识别效果的同时，也具有体量巨大的参数量和计算量，对计算硬件也有较高的要求，不适合在嵌入式或移动端设备中运行。MobileNet是由谷歌公司提出的一种轻量化卷积神经网络，在保证足够高效的同时也大大降低了网络中参数的规模。本文中使用的是该轻量化卷积神经网络的改进版本MobileNet V2[10]。

表1 样本在Complex Morlet复值小波和高斯复值小波下生成的时频图对比

2.1 深度可分离卷积

深度可分离卷积是MobileNet相对于其他大型深度神经网络结构的一个明显区别，其作用就是显著降低网络中的参数规模和运算量。深度可分离卷积可以具体细分为逐通道卷积和逐点卷积两步操作，如图2所示。首先，输入样本的每个通道仅与一个单通道卷积核进行卷积操作。操作完成后，会生成数量与输入通道数相同的特征图。但是逐通道卷积没有将各不同通道在同一像素位置上的信息组合利用，也无法完成对输出特征图的通道扩展。因此，在完成逐通道卷积后再进行一次逐点卷积。逐点卷积使用的卷积核尺寸为1×1×（为上一层输入的通道数），使用该卷积核对逐通道卷积的结果进行加权组合，在此基础上生成新的特征图。同时，如果使用所需求数量的卷积核进行卷积操作，最终就会生成对应数量的特征图，输出的特征图的通道数具备可扩展的特性。

图2 深度可分离卷积操作的示意图

假设对一个样本进行卷积操作的卷积核大小为××，输出通道数为，卷积后的输出尺寸为××。

若按常规卷积操作，卷积层参数量可计算为：=×××。

卷积过程中的乘法运算量可计算为：=×××××。

若使用深度可分离卷积操作，在逐通道卷积过程中，是个尺寸为××1的单通道卷积核分别对个通道进行单独卷积操作，卷积参数尺寸为××，乘法计算量为××××。逐点卷积使用个1×1×的卷积核，卷积参数为×个，乘法计算量为×××。整个深度可分离卷积操作的乘法总计算量和参数量是两步卷积操作之和。则：

深度可分离卷积的总参数个数为：=××+×。

深度可分离卷积的总乘法计算量为：=××××+×××。

2.2 倒置残差模块与线性激活函数

MobileNet V2在采用深度可分离卷积的同时，还使用了倒置残差结构。常规的残差模块是“降维-卷积-扩张”的结构，即是先对样本降维，再使用常规卷积方法进行卷积操作，最后再对特征进行扩张。而MobileNet中所使用的逐通道卷积不具备扩展输出通道的能力，如果输入样本自身的通道数较少，就难以获取足够的不同维度的特征。因此，网络在逐通道卷积之前新增了一个1×1的卷积层进行通道扩张，再进行逐通道卷积，最后逐点卷积对特征的维度进行压缩，即是“扩张-卷积-降维”的结构。

在整个网络运行中，特征图经历了先升维后降维的过程。文献[10]指出，相对高维的信息在变换到低维时，已经对信息做了一次特征压缩，若再经过ReLu激活函数处理，则会损失更多的信息。因此，在网络的最后一层，将激活函数由ReLu函数改为线性激活函数，以减少特征信息损失。

MobileNet V2网络的结构模型中有共包含了17个倒置残差结构模块（每个模块包含两个逐点卷积层和一个逐通道卷积层），1个标准卷积层和2个单独的逐点卷积层，共计有54层可训练参数层。

3 实验结果与分析

3.1 模型训练与诊断预测结果

实验程序基于python3.8编写，使用GPU版本的Pytorch深度学习框架构建网络可以加速训练和检测。因使用的为轻量级网络结构，对硬件要求相对较低，显卡的显存为2G，并安装CUDA显卡运算平台来完成运算。设置网络的batchsize大小为32，样本遍历次数epoch大小为30次，每次遍历迭代次数Iteration为110次。

网络训练过程中，训练集和验证集的精度与损失值变化曲线如图3和图4所示。从图中可以看出，网络在遍历样本15次后，精度和损失值已经收敛。最终，网络在验证集上的识别精度达到99.5%以上，损失值趋近于0。

图3 网络训练过程中训练集与验证集精度变化曲线

图4 网络训练过程中训练集与验证集损失值变化曲线

使用训练好的网络，对随机截取的包含轴承的10种状态的1000个数据段生成时频图组成的测试集进行测试，对轴承各状态的诊断预测结果如表2所示。

表2中，轴承故障下的状态类型以故障位置和故障点尺寸来表示，如“滚动体-07”表示轴承故障位置在滚动体上，损伤部位尺寸为0.1778mm。在实验程序中，将轴承的10种状态分别以数字0～9作为标签。从表2中可以看出，网络在测试集上的表现较好，对各种故障均有较高识别准确率，综合识别正确率达到99.9%。同时，检测耗时也较少，100张样本图片的诊断预测时间约为2.5s。

3.2 噪声对识别结果的影响

旋转设备在工作过程中，无可避免的会受到外界各种振动源的干扰，比如齿轮箱轴承啮合的振动干扰、临近设备运转产生的振动干扰等。为了进一步检验本文所使用的网络模型在存在振动噪声情况下的鲁棒性，进行如下实验：

实验一：在原始振动信号中混合20dB信噪比的高斯白噪声，再按照同样的数据预处理方法生成轴承振动状态信号时频图。用此方法生成的时频图作为数据集重新训练网络，检验噪声背景下网络模型的识别性能。结果如图5所示。

表2 训练好的网络在测试集上的诊断结果

从图5中可以看到，原始数据在混合高斯白噪声后，性能表现与使用原始数据训练的情况类似，网络在遍历15次后，在训练集与验证集上的精度基本收敛。最终，网络在验证集上的识别精度达到99.57%。使用同样的方法生成测试集，在测试集上识别准确率达到99.3%。结果表明本文所使用的网络在具备较高诊断准确率的同时，具备较好的鲁棒性和泛化能力。

图5 混合噪声后的样本训练过程中精度变化曲线

实验二：对1000个测试集样本分别混合信噪比范围从50～10dB的高斯白噪声信号，在使用原始信号训练后的网络中再次进行测试，在测试集上诊断的整体准确率随混合入噪声的信噪比变化趋势如图6所示。

从图6中可以明显看到，使用轴承原始振动信号所训练的网络模型在混合信噪比大于30dB噪声的测试集样本上的故障识别准确率保持在99%，表现出较高的故障识别准确率，具有一定的抗噪能力。当噪声的信噪比继续下降时，识别的准确率有较明显的下降趋势。10dB信噪比下，测试集样本的整体准确率降低到25.4%。分别观察不同信噪比的噪声对轴承各种状态的测试样本的影响，结果如图7所示。

图6 混合不同信噪比的噪声对测试集样本识别准确率的影响

图7 不同信噪比的噪声对各种轴承状态样本测试准确率的影响

结合图6和图7可以看出，在样本中混入不同信噪比的噪声后，随着信噪比的降低，样本的测试准确率总体呈下降趋势。但是，噪声的信噪比对不同的轴承状态信号影响各有不同。损伤尺寸为0.1778mm和0.5334mm的外圈故障，其振动信号在混合了13dB信噪比的噪声后，对这两种故障的诊断准确率才开始出现明显的下降，在混合10dB信噪比的噪声时，仍能保持对此类故障95%以上的诊断准确率。而轴承的正常状态、损伤尺寸为0.1778, 0.5334mm的滚动体故障状态以及损伤尺寸为0.3556mm的外圈故障状态在混合信噪比为25dB噪声后，其故障检测的准确率即出现明显的快速下降，并直接降至接近0。

4 结论

本文在公开的轴承振动数据集基础上，利用小波变换所生成的时频图作为轴承故障诊断的数据集，采用基于MobileNet V2的轻量级卷积神经网络算法来进行轴承故障类别诊断，分别在原始数据所生成的数据集和混合噪声后所生成的数据下取得了较高的识别精度，降低了对高性能硬件的依赖，同时也具备较快的识别速度。训练后的网络对信噪比在30dB以上的噪声中能保持较好的性能和稳定性。同时发现噪声对不同的轴承状态信号的诊断结果影响各不相同，可作为后续的进一步研究。

[1] 陈海宇，贺珂珂，王惠中. 深度学习在电机故障诊断中的研究现状综述[J]. 电气自动化，2020, 42(3): 1-3.

[2] 孙文珺，邵思羽，严如强. 基于稀疏自动编码深度神经网络的感应电动机故障诊断[J]. 机械工程学报，2016, 52(9): 65-71.

[3] 赵光权，葛强强，刘小勇，等. 基于DBN的故障特征提取及诊断方法研究[J]. 仪器仪表学报，2016, 37(9): 1946-1953.

[4] GAN M, WANG C. Construction of hierarchical diagnosis network based on deep learning and its application in the fault pattern recognition of rolling element bearings[J]. Mechanical Systems and Signal Processing, 2016, 72: 92-104.

[5] 曲建岭，余路，袁涛，等．基于一维卷积神经网络的滚动轴承自适应故障诊断算法[J]. 仪器仪表学报，2018, 39(07): 134-143.

[6] LOPARO K. Bearing vibration data set[D]. Cleveland: Case Western Reserve University, 2003．

[7] GOODFELLOW I, BENGIO Y, COURVILLE A. Deep learning[M]. Massachusetts: MIT Press, 2016.

[8] 张伟. 基于卷积神经网络的轴承故障诊断[D]. 哈尔滨：哈尔滨工业大学，2017.

[9] 崔锦泰. 小波分析导论[M]. 西安：西安交通大学出版社, 1995.

[10] SANDLER M, HOWARD A, ZHU M, et al. MobileNetV2: Inverted residuals and linear bottlenecks[C]. 2018 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2018: 4510-4520.

Research on fault diagnosis of motor bearing based on lightweight CNN

TIAN Yong，DONG Guo-gui

(Department of M&E Engineering, Tongling Polytechnic, Anhui Tongling 244000, China)

Aiming at the application requirements of limited hardware resources and sufficient efficiency and accuracy when deep learning is used for fault diagnosis in embedded or mobile devices, a fault diagnosis method of motor rolling bearing based on lightweight convolutional neural network is proposed. Firstly, continuous wavelet transform is applied to the vibration signal data set of rolling bearing to generate the fixed size time-frequency diagram, and then the data set is generated and input into the network for training. The test results show that the network model has high recognition accuracy and speed, and the accuracy rate is 99%. By verifying the influence of noise on the network, it shows that the network has good robustness and generalization ability.

bearing fault diagnosis；convolution neural network；lightweight；time frequency diagram

2021-07-30

安徽省教育厅高校自然科研重点项目——新能源汽车大功率冷却风机研究（KJ2020A0972）

田勇（1986-），男，安徽铜陵人，讲师，硕士，主要从事工业机器人以及机器学习方向研究，tyarist@163.com。

TP18;TM307

1007-984X(2022)01-0011-06