基于深度学习的矿井滚动轴承故障诊断方法

2024-03-01 09:53窦桂东白艺硕王均利黄博昊阳康

工矿自动化 2024年1期

窦桂东，白艺硕，王均利，黄博昊，阳康

（1. 陕西彬长小庄矿业有限公司，陕西咸阳 713500；2. 中国矿业大学（北京）人工智能学院，北京 100083；3. 陕西彬长矿业集团有限公司，陕西咸阳 712000）

0 引言

滚动轴承作为机械设备中不可或缺的零件之一，已在采煤机、提升机和通风机等矿用机械设备中得到广泛应用[1-2]。然而，由于煤矿机械设备工作环境恶劣，使得滚动轴承故障频发，如果不能及时发现故障并进行后期维护，不仅会损坏电动机本身，而且会影响整个系统的正常运行，导致极大经济损失，甚至威胁人员生命安全。因此，滚动轴承故障检测的准确高效对提高煤矿安全生产具有重要意义[3-4]。

传统的智能故障诊断方法在早期较为流行，然而其十分依赖信号处理和专家经验，很难自主挖掘海量数据中的有效信息。为了解决这一问题，深度学习方法逐渐走进人们的视野，文献[5]针对齿轮箱故障提出了一种多信息融合的卷积神经网络（Convolutional Neural Networks，CNN）诊断模型，利用多个卷积层和最大池化层，解决了传统人工选择特征向量的问题；文献[6]结合Inception 模块和卷积注意力模块（Convolutional Block Attention Module，CBAM）获得多尺度故障特征信息，进一步拓宽分支网络结构，提高了网络表达能力。但是卷积结构采用标量神经元，未能考虑特征间的关联，所以网络中没有可用的空间信息，导致故障特征提取不全面，影响诊断准确率。对此，文献[7]提出了具有动态路由算法的胶囊网络，通过计算向量神经元的模长进行分类预测，打破了传统标量神经元传递信息的片面性。近年来，胶囊网络展现出强大的细节特征提取能力，已在机械设备故障诊断领域崭露头角，文献[8]把胶囊网络运用到齿轮箱故障检测，利用门控循环单元初步提取特征后，采用胶囊网络关注更多细节信息，取得了较好的诊断效果；文献[9]提出了一种基于随机法则的深胶囊网络，验证了胶囊网络在不同载荷、不同背景噪声下对轴承故障诊断具有良好的诊断效果及较强的鲁棒性。为了更好地利用神经网络在机器视觉中的优势，可以将一维振动数据通过编码转换为二维图像后，再输入神经网络进行学习。文献[10]将原始振动信号转换为二维灰度图像，输入CNN 中进行故障诊断，取得了较好的诊断效果，但该方法并未考虑信号的时间相关性，模型还有一定的改进空间。文献[11]采用连续小波变换构造二维时频图像，再输入所建立的生成对抗网络模型中，实现齿轮箱故障诊断，虽然其可以表达信号的局部时频特征，但选取合适的小波基有一定的困难，存在故障信息丢失问题。对此，可以利用马尔可夫转移场（Markov Transition Field，MTF），其通过考虑每个分位数与时间步长之间的依赖关系，保留了原始信号的时间相关性，且编码方式的映射是一一对应关系，避免了一维信号重要信息的丢失。文献[12]提出一种MTF 与CNN 相结合的故障诊断方法，但常规CNN 会随着网络深度加大而出现梯度弥散等问题，导致模型难以训练。文献[13]使用MTF 对振动信号进行编码，然后输入深度残差网络进行故障诊断，实验在公开数据集上取得了较好的诊断效果，但并未验证模型在变工况及存在噪声污染时的诊断性能。

针对传统CNN 在煤矿井下等复杂环境中难以充分挖掘数据特征的问题，本文提出一种基于MTF和双通道多尺度卷积胶囊网络（Dual-channel Multiscale Convolutional Capsule Network，DMCCN）的滚动轴承故障诊断方法。为保留原始信号的时间依赖性，采用MTF 对振动信号进行编码，并采用灰度图转换，兼顾原始信号的动态和静态特征；根据双通道输入，将2 组特征图分别通过二维卷积层提取浅层特征后进行特征融合，减少信息损失；同时，引入Inception 模块，聚焦多尺度特征，加强网络的特征提取能力；通过胶囊层进行向量化处理，采用动态路由算法计算特征向量相似度，进而实现故障诊断与分类。

1 MTF 和胶囊网络

1.1 MTF 编码

MTF 通过计算马尔可夫转移矩阵对动态信息进行编码传递，保留信号在不同时间间隔内的时间相关性，是一种将原始一维信号转换成二维图像的编码方法[14-15]。该方法将时间序列的推移类比为马尔可夫过程，即在已知目前状态的条件下，信号未来的演变不依赖于其以往的变化情况，由此构造马尔可夫转移矩阵，进而拓展为MTF，实现图像编码。

给定序列X={x1,x2,···,xn}，其中xt（t=1,2,···,n，n为数据总数）为t时刻的振动信号幅值。将序列X分为Q个分位箱，每个数据点对应的分位数为qj(j=1,2,···,Q)。采用一阶马尔可夫链的方式计算分位数之间的转移概率，进而构建一个Q×Q的马尔可夫转移矩阵：

式中：wi,j为分位数qi与qj的逼近概率，i=1,2,···,Q；P（·）为逼近概率函数。

为了克服马尔可夫转移矩阵对数据分布和时间步长不敏感的缺点，通过考虑时间因素及位置信息，将其拓展到包含时间轴的MTF：

式中mi j为分位数qi到分位数qj的转移概率。

1.2 胶囊网络

胶囊网络的核心思想是用向量神经元代替传统神经网络中的标量神经元[16]，其对图像中的位置、角度等姿态信息更敏感，具有更丰富的特征表达能力，且底层胶囊通过动态路由算法更新得到高层胶囊，保留了目标部分与整体之间的相关信息。胶囊网络由卷积层、初级胶囊层和数字胶囊层组成，如图1 所示。通过卷积操作将原始输入数据转换为底层胶囊，再通过动态路由算法计算出高层胶囊，进而完成预测分类。

图1 胶囊网络结构Fig. 1 Capsule network structure

动态路由算法类似于聚类的迭代过程，选择更多相似特征而弱化离群特征，其具体结构如图2 所示。令输入向量uI与权重aIJ相乘，得到预测向量将和路由权值cIJ进行加权求和，计算出总的高级特征向量sJ；通过非线性函数squash 得到压缩后的输出向量vJ，即确保向量的方向不变，长度不超过1；初始化中间参数bIJ，并计算uˆJ|I和vJ的点积，更新中间参数bIJ，进而通过softmax 函数更新路由权值cIJ，保留特征比较相似的信息。

图2 动态路由算法结构Fig. 2 Dynamic routing algorithm structure

2 MTF-DMCCN 故障诊断模型

针对传统神经网络应用于轴承故障诊断时特征辨识性差、难以充分挖掘数据间特征信息的问题，本文提出了DMCCN，将一维振动信号转换为二维图像信号作为输入，实现对轴承故障类型及故障程度的识别。MTF-DMCCN 故障诊断模型由数据转换、特征提取、胶囊传递3 个部分构成，如图3 所示，其中“@”表示个，如128@5×5 表示128 个5×5 卷积核。

图3 MTF-DMCCN 故障诊断模型Fig. 3 Fault diagnosis model based on Markov transition field(MTF) and dual-channel multi-scale convolutional capsule network(DMCCN)

2.1 数据转换

将一维数据直接转换为二维灰度图像的方法简单有效，但这种转换方式只关注静态信息，单一输入数据无法包含信号的时域特征。因此，本文采用双通道输入模式，兼顾信号的静态和动态特征，第2 通道通过MTF 编码方式生成图像，保留了振动信号间的时间相关性，避免信息丢失。

2.2 特征提取

在特征提取部分，利用2 个二维卷积层直接从图像中学习初步特征，第1 卷积层采用5×5 卷积核扩大卷积运算的接收范围，第2 卷积层采用3×3 小卷积核提高局部特征提取能力。对双通道提取的特征进行融合后，参考多尺度卷积核Inception 结构，将包含1×1，3×3，5×5 等不同大小的卷积运算加入到初级胶囊层中，提取多尺度信息，在增加网络宽度的同时减少参数，增强模型的鲁棒性。最后将特征标量转换为特征向量并进行压缩，封装为初级胶囊。

2.3 胶囊传递

利用胶囊结构构建向量神经元，向量的方向代表特征的位置、角度等姿态信息，向量的长度代表该特征估计的概率，因此胶囊结构能包含更多的空间信息。胶囊之间采用动态路由方式进行特征传递，如图4 所示，紫色向量表示胶囊输出，橙色向量表示胶囊输入，黑色向量表示胶囊其他输入。图4 （a）中输出v1和输入的方向夹角大于90°，即二者点积是一个负数，该特征对应的路由权值c11减小；同理，图4 （b）橙色向量对应的路由权值c12增大。对所有胶囊及其输入重复该过程，直至获得与胶囊输入最匹配的特征，之后继续传递。但实际上，使用多次迭代往往会导致模型过拟合，本文设置迭代次数为3[17]。

图4 胶囊传递中的权值更新Fig. 4 Weight update in capsule delivery

在模型训练过程中，需要通过损失函数计算预测值与真实值的误差，以更新模型权重，本文采用边缘损失函数：

式中：Lk为损失函数值；Tk为分类指示函数，当输入样本属于类别k时，Tk=1，否则Tk=0；m+为上边界，取值为0.9；m-为下边界，取值为为模型输出第k类故障的概率； λ为比例因子，取值为0.5。

3 实验验证与结果分析

3.1 数据集获取

为了验证所提MTF-DMCCN 模型的性能，本文使用美国凯斯西储大学（Case Western Reserve University，CWRU）轴承数据和中煤信息技术（北京）公司矿用滚动轴承数据进行实验[18]。CWRU 采用的滚动轴承型号为SKF6205，中煤信息技术（北京）公司采用的滚动轴承型号为NSK6800Z，二者均为深沟型轴承，且具有防尘盖设计，是煤矿井下常用的滚动轴承。CWRU 数据集是使用人为电火花技术造成不同严重程度的单点损伤后获取，包含的故障类型相对较多；中煤信息技术（北京）公司数据集是通过监测已发生故障的矿用滚动轴承的实际状态获取，更具有代表性，但其包含的故障类型相对较少。故本文结合2 个数据集的优点，将二者混合后构成数据集。

CWRU 实验平台由异步电动机、转矩传感器、功率测试机和电子控制器组成，测试对象为支撑电动机的轴承。待测轴承在0，0.746，1.491，2.237 kW这4 种载荷条件下转动，相应的电动机转速分别为1 797，1 772，1 750，1 730 r/min，使用电火花加工造成不同类型的轴承故障状态，包括滚动轴承内圈故障状态（IF）、外圈故障状态（OF）和滚动体故障状态（BF），每种故障状态又分别包含0.177 8，0.355 6，0.533 4 mm 3 种损伤直径，分别对应编号07，14，21，故共有9 种故障。中煤信息技术（北京）公司将压电式加速度传感器固定在待诊断轴承的基座上，从而完成对矿用滚动轴承振动信号的捕捉，实际损伤类型包括垂直不对中故障状态（VMF）和水平不对中故障状态（HMF）。本文通过滑动窗口重叠采样制作混合数据集，窗口步长为4 096，包含12 种故障类型的7 200 个样本，轴承故障数据组成见表1。同时，考虑到实际工作场景的多样性，制作了3 种不同工况下的轴承数据集，见表2。

表1 单一工况下轴承故障数据组成Table 1 Composition of bearing failure data under single operating conditions

表2 不同工况条件下的数据集参数Table 2 Dataset parameters under different operating conditions

3.2 数据预处理

将所有样本通过编码转换为MTF 图像及灰度图。由于灰度图采用直接转换方式，为使其包含一维信号的所有数据信息，规定图像尺寸为64×64。针对MTF，分位箱不同，生成的图像尺寸也不同，以内圈故障信号为例，不同尺寸的MTF 图像如图5 所示。

图5 不同尺寸的MTF 图像Fig. 5 MTF images of different sizes

从图5 可看出，由于分位数转移概率不同，MTF图像像素点有深有浅，说明该二维特征图包含一维信号的时间特性，将其作为输入可以充分利用神经网络的优势。尺寸为1 024×1 024 的MTF 图像像素点过于密集，包含太多冗余信息，以致于难以辨别不同像素点之间的颜色区别；尺寸为64×64 的MTF 图像像素点的颜色区别明显，但其单个像素点的面积相对较大，排列相对稀疏，使得其包含的信息量不足。从图像自身方面考虑，尺寸较大的MTF 图像能够包含更多信息，但信息点过于密集，导致计算成本增加，网络训练时间大大延长；尺寸过小的MTF 图像很难保证图像包含完整的故障特征信息，不利于模型的训练。从实验数据量方面考虑，MTF 图像体现了振动信号的动态特性，因此要将尽可能多的信号转换成MTF 图像，然而，若MTF 尺寸过大，会减少可用的训练图像数量或使训练集数据重复性过高，从而无法提取故障特征。基于以上2 个方面因素，本文最终确定原始输入MTF 图像的尺寸为256×256。此外，由于灰度图与MTF 图像大小不同，采用双通道输入模式提取不同故障特征，灰度图保留大量静态信息，MTF 图像则保留更多动态信息。

3.3 消融实验

为验证MTF-DMCCN 模型的合理性，探寻各重要组成部分对模型整体性能的影响，设置消融实验。采用数据集A 为实验数据，设置训练集样本量为3 600，验证集和测试集样本量均为1 800。不同模型的识别结果见表3。其中MTF-DCCN 模型去除了DMCCN 网络结构中的 Inception 模块，MTF-MCCN模型去除了灰度图输入通道，DMCCN 模型去除了MTF 编码图像输入通道。

表3 不同模型的识别结果Table 3 Recognition results of different models

分析表3 可知， MTF-DMCCN 模型识别准确率最高。加入MTF 图像输入后，识别准确率提升了26.5%，对模型的诊断精度提升最高，其主要原因是MTF 编码方式注重每个分位数与时间步长的依赖关系，能保留原始信号的时间相关性，并且其编码方式的映射是一一对应关系，避免了重要信息的丢失。比较MTF-DMCCN 和MTF-DCCN 识别结果，其15.72%的准确率差距反映了Inception 模块在轴承故障诊断中的重要性。MTF-MCCN 虽然取得了较为满意的结果，但引入灰度图输入后，准确率提高了4.83% ，表明加入此模块对提升模型的诊断效果仍具有一定的有效性。此外，虽然MTF-DMCCN 模型的运行时间不是最短，但能够在相近时间内获取最高的识别准确率，依然能说明所提模型具有一定的优越性。

为进一步展示不同模型对轴承故障的识别效果，引入混淆矩阵对实验结果进行更准确、更全面的分析，不同模型的混淆矩阵如图6 所示。可看出MTF-DMCCN 模型仅对故障IF21，OF21，VMF 的分类略有错误，将4 个IF21 样本识别为IF14 和HMF，2 个OF21 样本识别为VMF，4 个VMF 样本识别为IF21，其他故障均实现了正确分类；MTF-DCCN 模型和MTF-MCCN 模型对故障IF21，OF07，BF07，HMF均存在错误分类，此外，MTF-DCCN 模型还对其他4 种故障类型存在错误分类。从总体来看，MTFMCCN 模型的错误样本共有97 个，MTF-DCCN 模型的错误样本共有293 个，说明MTF-DCCN 模型性能较差；对于DMCCN 模型，不正确分类发生在IF14，IF21 等10 种故障中，甚至将45 个OF07 故障样本错误识别为BF14 故障。

图6 不同模型的混淆矩阵Fig. 6 Confusion matrix of different models

可见，MTF-DMCCN 模型在滚动轴承故障诊断实验中效果最好，MTF-MCCN 模型次之，MTF-DCCN模型和DMCCN 模型效果较差，说明Inception 模块、灰度图输入、MTF 图像输入均对轴承故障诊断具有正向促进的作用，MTF 编码对模型的诊断精度提升最高。

3.4 抗噪性能实验

在实际工作环境中，受各种外界因素影响，信号采集时不可避免地会存在噪声干扰。为了验证MTFDMCCN 模型在噪声环境下的性能，向数据集B 加入不同的高斯白噪声，在信噪比-4～6 dB 范围内进行实验，并与MTF-MCCN，MTF-DCCN，DMCCN 模型进行比较。各模型在不同噪声环境下的混淆雷达图如图7 所示。

图7 各模型在不同噪声环境下的混淆雷达图Fig. 7 Confusing radargrams of each model in different noise environment

从图7 可看出，4 种模型的识别准确率随着信噪比的改变而变化。当添加6 dB 噪声时，4 种模型的识别准确率均超过80%。随着信噪比降低，MTFDCCN 模型和DMCCN 模型的识别准确率迅速降低，信噪比为-4 dB 时，2 种模型的识别准确率均低于45%。MTF-DMCCN 模型和MTF-MCCN 模型的识别准确率下降相对缓慢，在信噪比降为-2 dB 前二者仅有微小差别，信噪比为-4 dB 时，MTF-DMCCN模型的识别准确率比MTF-MCCN 模型高10%以上。MTF-DMCCN 模型比其他模型具有更好的鲁棒性和抗噪声能力。

3.5 泛化性能实验

为验证MTF-DMCCN 模型在变工况环境下的故障诊断能力，采用在不同工况下分别进行5 次实验取均值的方法进行泛化性能实验，实验结果见表4。其中实验工况 A→B 表示数据集A 用于模型训练，数据集B 用于模型测试，其他工况依此类推。分析可知，MTF-DMCCN 模型在A→C 工况下分类效果最佳，平均识别准确率达88.2%；在B→A 时平均识别准确率最低，为76.3%，但仍能基本完成对滚动轴承故障的精准分类；在A→B，A→C，C→B 3 种工况下，每次实验准确率均超过80%，且在所有实验中模型识别准确率不低于70%。经过上述分析，证明了本文提出的 MTF-DMCCN 模型具有优异的变转速适应能力，在不同工况下具有良好的泛化性能。

表4 变工况下的故障识别准确率Table 4 Fault recognition accuracy under variable operating conditions%

3.6 IMS 数据集对比实验

为进一步验证MTF-DMCCN 模型在故障诊断中的优势，排除数据单一的影响，采用辛辛那提大学智能维护系统（Intellegent Maintenance System，IMS）的轴承数据进行对比实验[19]。共进行3 次实验，对比实验数据集选取其中2 次实验数据，数据类型包含内圈故障、外圈故障、滚动体故障和正常状态4 种，每种类型2 000 组样本，每组样本包含2 048 个采样点，其中前5 600 组样本作为训练集，后2 400 组样本作为测试集。从编码方式和网络结构2 个方面分别进行对比，共建立10 种故障诊断对比模型。采用分别进行5 次实验取均值的方式进行比较，各模型的识别准确率如图8 所示。其中GASF 表示格拉姆角和场编码方式，GADF 表示格拉姆角差场编码方式；MTF-DCCN1 模型是将DMCCN 网络结构中的 Inception 模块替换为16 通道的3×3 二维卷积层；ResNet 是一种深度残差网络；WDCNN[20]是以原始信号作为输入的宽核一维CNN。

图8 IMS 数据集下不同模型的识别准确率Fig. 8 Recognition accuracy of different models in the IMS dataset

从图8 可以看出，MTF-DMCCN 模型在IMS 数据集上的识别准确率最高，达99.37%，可以准确识别出轴承的不同故障类型及故障程度。对比MTFDMCCN 和 WDCNN，前者的识别准确率比后者高9.44%，说明在滚动轴承故障诊断中，以双通道输入的2D-CNN 相较于以单通道输入的1D-CNN 具有一定优势。在网络结构相同的情况下，以MTF 为主的模型准确率普遍高于采用其他编码方式的模型，GADF 编码方式的准确率高于GASF 编码方式，即MTF 编码方式最有效，GASF 编码效果最差。在编码方式相同的情况下，相比MTF-DCCN1 模型，MTFDMCCN 模型的识别准确率高8.17%，说明Inception模块可显著提高模型的故障诊断效果。对比MTFDMCCN 模型和MTF-ResNet 模型，前者的识别准确率比后者高3.73%，进一步证明了本文所提方法的优越性。此外，在10 组模型对比中，MTF-DMCCN 模型的误差棒长度最短，即实验结果的误差范围更小，集中度更高，证明该模型的稳定性更好。

4 结论

1）采用MTF 编码方式将一维信号转换为二维图像，考虑了信号在不同时间间隔内的时间相关性，并通过双通道输入模式，在关注振动信号静态特征的同时兼顾其动态特征，减少原始信息的丢失。

2）针对传统神经网络难以获得空间信息的问题，选用胶囊网络，采用向量神经元最大程度地保留图像位置、角度等姿态信息，使特征提取更完善，并在胶囊网络中加入Inception 模块提取多尺度特征，在增加网络宽度的同时减少胶囊层参数，提高模型故障诊断效率。

3）在模型对比实验中，MTF-DMCCN 模型的平均故障识别准确率达99.37%，表明该模型能够准确判断轴承故障类型及故障程度。为模拟实际工程环境，在样本中加入信噪比为-4～6 dB 的高斯白噪声进行抗噪实验，结果验证了所提方法具有较强的鲁棒性。采用不同负载条件下的数据集进行泛化实验，结果表明，MTF-DMCCN 模型在6 组变负载实验中均表现良好，证明了本文所提方法的有效性和优越性。