基于VMD和卷积神经网络的变工况轴承故障诊断方法

2021-09-07 03:14黄凯旋吕伍佯刘圆圆刘幸福蔡坤奇

计量学报 2021年7期

陈剑，黄凯旋，吕伍佯，刘圆圆，杨斌，刘幸福，蔡坤奇

(1.合肥工业大学噪声振动研究所，安徽合肥 230009；2.安徽省汽车NVH技术研究中心，安徽合肥 230009)

1 引言

滚动轴承是旋转机械的重要元件之一，在交通、工程机械等领域中获得广泛应用。随着旋转机械高转速、大载荷、工作时间长的发展趋势，轴承的运行工况逐渐复杂，实际故障类型通常是变工况下的复合型故障。然而，现有故障诊断方法使用的轴承数据集大多来源于稳态转速或转速变化较小，与实际工况差异较大。因此，适用于变工况的轴承故障诊断方法具有重大意义。

由于旋转机械工况复杂，采集的振动信号混叠多种频率成分，有效的特征提取成为故障诊断的关键。文献[1]提出了自适应分解信号的变分模态分解，实现了不同频率成分的有效分离。文献[2～4]分别将变分模态分解与广义分形维数矩阵、马田系统、数据驱动时域分析方法结合，实现轴承的故障诊断。

近年来，深度学习凭借强大的自适应特征提取优势，摆脱了传统机器学习过于依赖特征提取的缺点，在数据诊断、数据监测等方向得到广泛应用。文献[5～7]分别将Inception-v3网络、离散小波变换、奇异值分解与卷积神经网络相结合，实现了有效的故障诊断。文献[8]构建了引入领域适配约束的深度残差网络，迁移了实验积累的故障诊断数据，实现对工程实际装备的故障诊断。文献[9]将支持向量机融入卷积神经网络模型，提升了故障识别准确率、模型收敛速度和泛化能力。

根据上述研究，本文提出基于变分模态分解(variational mode decomposition,VMD)和卷积神经网络(convolutional neural networks,CNN)的变工况轴承故障诊断方法。使用固有模态函数(intrinsic mode function,IMF)分解后的IMF构造特征图，设计了对应的卷积层和池化层结构，充分利用卷积神经网络的特征提取能力，直接进行特征提取并分类。同时，通过加入激活函数、正则化损失函数、调整优化方法等手段提高模型的适应性和泛化性。最终，该模型不仅在稳态转速数据上取得较高的准确率，而且适用于变转速数据的识别，能取得较好的结果。

2 VMD基本理论

VMD 算法将原始信号放入变分模型进行分解，计算得到IMF。变分模型的构建如下：1)对每个模态函数uk(t)，经Hilbert变换得到解析信号；2)通过增加指数项e-jωkt调节每个模态的预估中心频率，将各模态的频谱变换到基带上；3)采用高斯平滑估计解析信号的带宽，得到变分约束模型，见式(1)：

(1)

同时，VMD算法加入二次惩罚因子α和拉格朗日乘法算子λ，将式(1)构建成无约束问题，其增广的拉格朗日表达式见式(2)。

(2)

VMD分解层数根据谱相关系数确定。使用式(3)计算各分量与原始信号的谱相关系数，寻找其最小值低于阈值的情况，进而确定分解层数。

(3)

式中：X(k)、Y(k)分别表示两信号的傅里叶变换的模；n表示频域离散值序列号。

本文轴承试验信号的每个样本包含1000个数据点，利用IVMD计算得到样本集最优分解层数为3，即单个样本数据分解后转化为1000×3的格式。

3 卷积神经网络

3.1 基本原理

卷积神经网络是一种前馈神经网络，一般包含卷积层、池化层、全连接层和输出层。卷积层由若干个卷积核组成，用于提取局部区域的特征。训练时卷积核根据设定步长做空间移动，对全局进行特征提取获得特征图，数学模型见式(4)。

(4)

池化层对卷积后的特征图进行降采样，减小数据的规模，突出提取后的特征。全连接层能将池化后的特征图转化为一维向量，实现对局部特征数据的整合。经过输出层的Softmax分类器处理后，可得到特征图的最终诊断结果，完成对输入特征的诊断和识别。

3.2 结构设计

本文将单个样本的数据格式构建成100×10×3，用于神经网络的输入层。第二层是卷积层，选取32个3×3卷积核，卷积后输出32个98×8的特征图。第三层是池化层，采用2×2最大池化，池化不改变特征图个数，尺寸变为49×4。第四层卷积层使用64个4×3卷积核，输出46×2特征图。第五层池化层参数与第二层相同。第六、七层为全连接层，分别包含512、256个隐含节点，实现对特征图的非线性变换。输出层有11个隐含节点，加入Softmax函数计算特征数据属于每个类别的概率，从而得到识别结果，模型示意图见图1。

图1 卷积神经网络模型示意图Fig.1 Convolution neural networkmodel diagram

3.3 优化方法

为了防止模型过度拟合训练数据，在第六、七层加入Dropout处理[10]。训练时，Dropout会随机使一定比例的隐含节点暂停工作，输出值为0，这样等于每个样本只有部分数据参与全连接层运算，间接创造了很多新的随机样本。即使样本数据存在缺失，也不会过多的影响模型的效果，防止模型过拟合。验证时，卷积神经网络模型则不执行Dropout，全连接层的所有隐含节点参与运算。

各神经层需要通过激活函数为模型引入非线性特征。修正线性单元(rectified linear unit，ReLU)[11]类似人脑的阈值响应机制，神经元平时处于抑制状态，信号超过阈值则被激活。本文选用ReLU6函数，抑制ReLU线性增长部分，将上限设定为6，在低精度计算中有更好的鲁棒性[12]，见式(5)。

y=min(max(x,0),6)

(5)

交叉熵损失函数通过计算真实值与预测值之间的距离，评价模型的准确程度；再通过正则化引入刻画模型复杂程度的指标。最终由交叉熵损失函数和正则化损失构成模型的损失函数，见式(6)。

(6)

式中：p(x)表示真实概率分布；q(x)表示预测的概率分布；λ表示正则化系数；w表示正则化的权值。

采用ADAM优化算法更新卷积神经网络的参数。ADAM以梯度的一阶矩估计和二阶矩估计自适应调整参数的学习率，在反向传播过程中不断更新权值以获得全局最优解，使损失函数值最小。模型测试的硬件环境为 Intel i7-8750H+GTX 1050ti，软件环境为 Windows10+Python3.6+TensorFlow。

4 滚动轴承故障诊断数据

4.1 数据采集

试验数据来自合肥工业大学高速轴承试验机，结构如图2所示[13]。试验轴承为单列圆柱滚子轴承，型号分别为内圈可拆的NU1010EM和外圈可拆的N1010EM，以方便使用激光打标机和线切割加工出轴承故障损伤点。轴承故障类型不仅有内圈、外圈、滚动体的单点损伤，还包括了多点损伤以及复合型故障损伤，总计11种故障类型，具体见表1。

图2 轴承信号采集试验装置Fig.2 Bearing signal acquisition test device

表1 滚动轴承故障参数Tab.1 Parameters of rolling bearing fault

试验数据利用LMS Test.lab软件进行采集，采样频率为20.48 kHz，分别测试了以上11种故障类型的滚动轴承在2，4 kN载荷下，在2000，3000，4000 r/min等3种稳态转速工况和2000～4000 r/min变转速运行工况下的振动信号数据，具体工况描述见表2。

表2 工况参数Tab.2 Parameters of working condition

4.2 数据集构建

数据集分为训练集和两个测试集，训练集和测试集1为稳态工况下的数据；测试集2为变工况的数据。采用独热码对11种故障类别进行编码，每种类别对应一个向量，维数为11。例如，正常状态的轴承对应类别1，编码为[1,0,0,0,0,0,0,0,0,0,0]，以此类推构建出全部标签。每个样本的采样点数为1000，具体数量和对应工况见表3。

表3 方法验证数据集Tab.3 Data set for verifying method

5 故障诊断方法验证

本文使用分类混淆矩阵表示模型的预测结果。混淆矩阵的行表示数据的真实类别，列表示模型预测的类别。类别1对应正常信号，其余10种类别对应10种故障，用第1行第1列的数据除以第1行和第1列所有数据之和，其商值定义为判断轴承是否故障的诊断准确率。对角线所有数据的平均值定义为分辨轴承故障类别的识别准确率。

5.1 轴承故障数据验证结果

卷积神经网络使用训练集进行参数的训练，分别使用稳态转速的测试集1和变化转速的测试集2验证模型的诊断和识别能力，得到分类混淆矩阵，结果见图3。

图3 CNN在测试集1、测试集2的分类混淆矩阵Fig.3 Classification confusion matrix of CNN for sets 1 and sets 2

由图3计算可得，模型在测试集1的诊断/识别准确率分别为100%/99.83%；在测试集2的诊断/识别准确率分别为100%/98.86%。从结果可以看出，当转速在2000～4000 r/min变化时，模型的诊断准确率没有变化，可以正确判断轴承是否发生故障；识别准确率降低0.97%，对工况8～11这4种复合型故障的混淆概率增加。这是因为复合型故障包含两种故障成分，损伤点之间相互接触，波形混叠情况更严重，干扰了特征的提取。总体上说，模型在稳态转速和变转速下均实现了较高的诊断/识别率，转速变化对模型的影响较小。

考虑到不同的数据格式和Dropout值会影响模型的诊断结果，进行了多组试验，得到不同参数下模型在测试集1、测试集2上的诊断/分类准确率，见表4。格式100×10×3在4种Dropout值时的诊断准确率均为100%，分类准确率也普遍高于另外2种，因此将其确定为模型的输入数据格式。而Dropout值为0.6时，该数据格式的诊断/分类准确率的平均值更高，最终将Dropout值定为0.6。

表4 不同参数下的诊断结果Tab.4 Diagnosis results under different parameters (%)

5.2 不同模型对比

为了进一步验证本文模型的性能，选择深度残差网络(deep residual network,ResNet)[14]和支持向量机(support vector machine,SVM)进行诊断效果对比。ResNet是2015年提出的深度学习模型，曾在ImageNet比赛中获得冠军。SVM是轴承故障诊断常用的机器学习模型，能实现不错的分类效果。

由于SVM需要预先对数据集提取特征，这里计算每个IMF的平均值、峰值、均方根、波峰因子、裕度因子、脉冲系数、形状系数、偏度、峭度、方差[3]，用这些常用参数构成特征参数集。训练时使用训练集对应的特征参数集进行SVM模型的训练，验证在测试集1、测试集2对应的特征参数集上的诊断结果。

图4 SVM在测试集1、测试集2的分类混淆矩阵Fig.4 Classification confusion matrix of SVM for sets 1 and sets 2

SVM的分类混淆矩阵见图4。计算可知，在测试集1的诊断/识别准确率为91.67%/91.35%；在测试集2的诊断/识别准确率为80.10%/84.27%。可见，SVM的预测结果一般，对轴承正常/故障的诊断存在偏差，对复合型故障类型的识别效果较差，转速变化对SVM的诊断率和识别率影响较大。

图5 ResNet在测试集1、测试集2的分类混淆矩阵Fig.5 Classification confusion matrix of ResNet for sets 1 and sets 2

ResNet的分类混淆矩阵见图5，诊断/识别准确率为99.50%/99.84%、98.03%/95.82%。

ResNet对2个测试集的诊断结果高于SVM，体现了深度学习模型在复杂数据的自适应特征提取和多分类问题的处理上具有一定的优势。对于稳态工况，ResNet模型与本文CNN相差不大，但对于变转速工况，ResNet模型的诊断/识别率均低于本文CNN模型，说明其适应性不如本模型，进一步证实了本文方法的有效性。

5.3 VMD效果对比

为了验证VMD分解对本模型的作用，现在使用训练集对应的原始样本对模型进行训练，使用测试集1、2对应的原始样本进行验证，结果见表5。从表中可以看出，未使用VMD分解的模型在测试集1、2下的诊断结果低于本文模型，说明通过VMD分解构建多层IMF分量的方法有助于本文卷积神经网络的特征提取，能够取得更好的诊断结果。

表5 本模型在两种方法下的诊断结果Tab.5 Diagnosisresults of databy two CNN methods

6 结论

本文提出了基于VMD和卷积神经网络的变工况滚动轴承故障诊断方法，经对比验证后得到以下结论：1)提出的卷积神经网络模型可以自适应提取特征，有效实现滚动轴承振动信号的故障诊断，省去特征参数的选择过程；2)通过结构设计和优化技术提高了模型的适应性，用稳态转速下的数据集训练，对在其转速区间内变化的轴承数据仍有较好的诊断和识别效果，更适合复杂工况的旋转机械。