基于GAF-MTF-CNN 的滚动轴承故障诊断

2022-11-03 09:59宋乾坤周孟然

安徽工业大学学报（自然科学版） 2022年4期

宋乾坤，周孟然

(安徽理工大学a.人工智能学院；b.电气与信息工程学院，安徽淮南 232001)

随着智能制造的快速发展，机械设备已成为生产领域中的关键设备，作为多数机械设备中必不可少的部件轴承，其状态好坏显著影响机械设备的正常运转。因此，准确检测识别滚动轴承状态对机械设备的正常运转至关重要。20 世纪以来，针对轴承故障诊断的研究从未间断过，赵志宏等[1]采用小波包变换分解不同频带滚动轴承的振动信号，再通过支持向量机(support vector machine，SVM)进行故障诊断；徐卫晓等[2]通过经验模态分解(empirical mode decomposition，EMD)提取轴承的振动特征，再由BP 神经网络(back propagation neural network，BPNN)进行故障诊断；Qu 等[3]利用双树复小波包变换和多分类器进行轴承数据信息的提取与故障分类；詹君等[4]利用变分模态分解(variational mode decomposition，VMD)处理轴承振动信号，通过与多重马氏距离相结合完成轴承的故障诊断。除此之外，BP 网络、人工神经网络(artificial neural network，ANN)等机器学习算法也被广泛用于轴承故障诊断，这些方法能够对特定的轴承故障进行较好的分类，但过度依赖人工且对不同振动信号的适应性较低、泛化能力差。

随着深度学习的快速发展，一些新的理论方法被不断提出并取得广泛应用。Shao 等[5]利用粒子群算法设计深度置信网络(deep belief network，DBN)优化滚动轴承的故障诊断；李恒等[6]利用短时傅里叶变换生成轴承振动信号的时频图，再将其导入卷积神经网络(convolutional neural network，CNN)中进行轴承的故障诊断；Lu 等[7]通过双谱将轴承振动信号转换为图像，再通过概率神经网络实现轴承的故障分类；孙岩等[8]用多尺度卷积核Inception 结构和空间注意力机制替代传统胶囊网络单一卷积层提取滚动轴承振动特征，再结合反向传播损失值计算实现轴承的故障诊断。上述基于深度学习的方法在应对数据量较大引起的特征提取泛化能力差、过度依赖于人工以及不同振动信号适应性低等方面有较大改善。CNN 作为一种能有效进行图像分类的方法，已成为当下故障诊断的研究热点。鉴于传统图像编码方式与神经网络的轴承故障诊断方法泛化能力差及测试准确率仍有提升空间，提出一种基于格拉姆角场(Gramian angular field，GAF)和马尔可夫变迁场(Markov transition field，MTF)以及卷积神经网络(CNN)的滚动轴承故障诊断方法，以期实现对滚动轴承故障的分类检测。

1 数据处理

1.1 一维数据处理

滚动轴承发生不同故障转动时产生的振动频率是不同的，据此可判别其故障类型。因此，对滚动轴承振动数据的处理是其故障诊断的必要任务。格拉姆角场和马尔可夫变迁场是2 种能够对一维数据向二维图像映射的方法，已被用于轴承故障诊断并取得较好效果[9-10]。

1.1.1 格拉姆角场

将缩放后数据序列中的数值作为夹角余弦值Φ，将其缩放至[-1，1]时，夹角范围为[0，π]；缩放至[0，1]时，夹角范围为[0，π/2]。设置时间戳ti为半径r，把一维数据转换到极坐标系统中：

式中m为正则化极坐标系统生成空间的常数因子。最后采用对应做角度和即格拉姆角和场(Gramian angular summation field，GASF)，或对应做角度差即格拉姆角差场(Gramian angular difference field，GADF）的方法实现对不同时间点的相关性识别。

1.1.2 马尔可夫变迁场

马尔可夫变迁场是表示时间序列的转变概率场，主要是基于一阶马尔可夫链，针对马尔可夫转移矩阵对序列的时间依赖性低，通过加入时间t位置关系而提出的一种方法[11]。对于一维数据序列Z={z1,z2,…,zn}，依据数值范围划分为Q个分位数单位，由分位数qj(j ∈{1,2,…,Q})量化一维数据序列中的各值，通过识别分位数，序列中数值zi(i∈{1,2,…,n})对应唯一的qi；由wij构建马尔可夫转移矩阵WQQ，尺寸为Q×Q。其中wij由qi中的数据被qj跟随的概率P决定：

对各概率通过时间顺序排列，构建一个尺寸为n×n的马尔可夫变迁场M矩阵：

对于长度为256 的一维振动信号序列，经过马尔可夫变迁场变换得到[256，256]的矩阵，生成尺寸为256×256马尔可夫变迁场变换后的图像。

1.2 数据集构建

获取轴承振动原始一维数据集后，需对其进行增强处理，构建为可导入CNN中进行训练的图像数据集。

1.2.1 数据来源

采用美国凯斯西储大学公开的轴承数据集，选用0负载下1 797 r/min的转速电机、采样频率为12 kHz的驱动端收集振动数据。轴承故障主要在内圈、外圈和滚动体位置，故障直径为0.177 8，0.355 6，0.533 4 mm，这样就组成了9 种故障类型及1 种正常类型，共10 种类型。其中9 种故障类型数据分别为12 万个至13 万个数据点，正常类型有24万多个数据点。

1.2.2 数据增强

从轴承原始一维振动数据集中按序每次提取(采样)256个数据点分别进行GADF和MTF变换，生成相应的2 张256×256 的二维图像，将生成的2 张图像采用水平方向拼接的方法拼接成1 张512×256 的图像。通过这种处理方式，采样的每段振动信号同时拥有2种图像编码方法刻录的信息，在卷积过程中可获得更多的特征信息。调整拼接后的图像尺寸为256×256，为适应搭建CNN 中的图像尺寸，最后对图像进行归一化处理。经过以上操作，共获得4 000 张256×256 尺寸的拼接图像，每个类别400 张，按4∶1 的比例将其随机划分为训练集3 200张和测试集800张。数据集构建过程如图1。

图1 数据集构建过程Fig.1 Building process of data set

数据集构造的主要步骤如下：

1)每次提取256个一维振动数据点分别经GADF和MTF变换生成二维图像；

2)对每段数据的GADF图和MTF图进行水平方向上的拼接；

3)将拼接的图像尺寸由512×256调整为256×256；

4)对调整后的图像进行归一化处理(这一步可与第三步或第五步颠倒)；

5)构建训练测试数据集，将其按4∶1随机划分为训练集和测试集。

2 卷积神经网络搭建

将轴承振动数据通过GADF 处理构建数据集，将其导入划分好的以LeNet-5为基础的CNN数据集中，设Batch size 为16。通过CNN 的训练测试结果，参考VGG(visual geometry group)网络调整模型框架及相应的超参数，直至测试准确率达较高水平(99%以上)，即完成CNN的构造，整体流程见图2。

图2 卷积神经网络构造过程Fig.2 Construction process of convolutional neural network

经过多次测试修改，采用5 次卷积3 次全连接构建本文的CNN 网络，每层均采用Relu 激活函数。搭建的CNN 第一层和第二层卷积采用32 个5×5 的卷积核，剩下3 次卷积分别采用64，64，128 个3×3 的卷积核，以便获取更多的图像特征信息。设置每层卷积的步长为1，通过零填充使每次卷积后的图像尺寸保持为卷积前的尺寸。对于池化层选择2×2 的最大池化操作，最终将输入的256×256 图像尺寸转变为8×8，自此完成特征信息的提取。经过3 次全连接操作，输出10个类别对应值，实现最终的分类。其余参数设置与搭建的CNN架构见图3。

图3 卷积神经网络结构Fig.3 Structure of convolutional neural network

搭建的CNN中加入批量归一化(batch normalization)[12]与随机失活(dropout)[13]操作，以进一步提高网络模型训练的收敛速度及泛化能力。选择交叉熵损失函数为该网络的损失函数，采用自适应矩估计(adaptive moment estimation，adam)[14]优化算法。

3 滚动轴承故障诊断

测试平台为1台搭载Intel-i5-11400CPU和NVIDIA-3060显卡的笔记本电脑，数据处理以及测试均在基于Windows10系统环境下由python和pytorch软件完成。

3.1 CNN测试

为验证搭建CNN 的性能，采用连续小波变换(continuous wavelet transform，CWT)、格拉姆角场(GADF 和GASF)、递归图(recurrence plot，RP)及马尔可夫变迁场(MTF)等5 种图像编码方法处理轴承振动数据，每次提取256个振动数据点，再经归一化处理将构建的数据集导入搭建的CNN中进行测试，结果如图4。由图4 可看出：采用GADF，CWT，GASF，RP，MTF 图像编码方法处理数据的CNN 测试准确率分别为99.37%，99.12%，95.75%，93.62%，76.25%；将4 种编码方法构建的数据集导入搭建的CNN 中进行训练，最高测试准确率均达到93%以上，最高99.37%，表明搭建的CNN 模型具有较强的泛化能力。这是因为在搭建的CNN中加入2次的神经元50%随机失活操作，可减少对各神经元的依赖性。

图4 不同图像编码方法在CNN中的测试准确率Fig.4 Test accuracy of different image coding methods in CNN

3.2 GADF-MTF-CNN测试

将经GADF-MTF，GADF，MTF 处理后的数据集分别导入CNN 中，设学习率为0.000 3，进行200 轮的迭代训练测试，测试准确率与测试集的整体损失值见图5。由图5可看出：GADF-MTF方式构建的数据集在搭建的CNN 中训练的最高准确率为99.87%，经GADF 处理数据集的最高准确率为99.37%，而MTF-CNN 的最高准确率仅76.25%；GADF-MTF-CNN 的测试集总体损失值相比于GADF-CNN 更低且波动较小，由于MTF的损失平均值为100.89，为不影响绘图阅读效果，故未加入该方法的损失值。

图5 GADF-MTF-CNN的测试结果Fig.5 Test results of GADF-MTF-CNN

以上测试结果表明，经GADF-MTF 构建的数据集在搭建的CNN 训练中可获得性能更好的测试模型，相比于单一GADF 数据处理方法构建的数据集在CNN 的测试准确率上提升了0.5%，文中所提数据集构建方法结合搭建的CNN 在轴承故障诊断中的测试准确率较高。

学者们采用LMD-BP，EMD-ANN 等方法对滚动轴承故障进行诊断，本文方法与其他方法滚动轴承故障诊断结果如表1。从表1可看出，相比于其他方法，本文所提轴承故障诊断方法在分类数与准确率上均有所提升。

表1 不同方法的滚动轴承故障诊断结果Tab.1 Fault diagnosis results of rolling bearings with different methods

3.3 数据集构建方法可行性测试

为测试本文所提数据集构建方法是否具有普遍可行性，将经GADF 与MTF，CWT，RP，GASF 等4 种图像编码方法变换后的图像采用水平拼接的方法构建数据集，导入搭建的CNN 进行测试，结果如图6。由图6 可看出：相比GADF，MTF，CWT 单一图像编码方法，GADF-MTF 和GADF-CWT 构建的数据集在CNN 测试的准确率有所提升，而GADFRP 和GADF-GASF 的准确率相对于GADF 并没有提升甚至有所降低(对比图4)；2 种图像编码方式拼接构建数据集的方法在一定范围内可提升训练模型的测试准确率。综上，基于GADF-MTF-CNN 的轴承故障诊断方法准确率最高，本文所提数据集构建方法具有一定的可行性。

图6 GADF与不同图像编码方法拼接构建数据集的测试准确率Fig.6 Test accuracy of GADF and different image coding methods splicing to construct data set

4 结论

提出一种基于GAF-MTF-CNN的滚动轴承故障诊断方法，采用水平方向拼接的方法对滚动轴承振动数据的GADF 和MTF 变换图像构建数据集，将其输入搭建的多层CNN 网络中实现轴承的故障分类检测。实验结果表明：搭建的CNN 具有较好的性能，在应对多种图像编码方法构建的数据集测试中可取得较高的准确率；相比于仅用GAF和MTF数据处理方法，文中提出的数据集构建方法在CNN中训练出的模型测试准确率更高，可达99.87%，证明了数据集构建方法的可行性。基于GAF-MTF-CNN 的滚动轴承故障检测可满足轴承故障诊断准确率的要求，可为一维数据处理及滚动轴承的故障检测提供新的方法。