轴承变转速多模式下的深度卷积神经网络诊断方法研究

2022-12-06 12:43潘玉娜程道来魏婷婷刀建明
应用技术学报 2022年4期
关键词:故障诊断卷积准确率

潘玉娜,程道来,魏婷婷,刀建明

(上海应用技术大学a.轨道交通学院;b.城市建设与安全工程学院;c.机械工程学院,上海 201418)

轴承是旋转机械中至关重要的零件之一,且易发生损伤,其健康状态对设备的性能、稳定性及使用寿命有着巨大的影响。通过准确的故障识别,可以有效减轻轴承给机械设备带来的消极影响。

目前,常见的轴承故障诊断过程主要包括振动信号采集、特征向量提取、故障诊断3个步骤[1],众多学者在这方面进行了深入的研究工作。伍建军等[2]先对滚动轴承原始故障信号进行小波分解、降噪、重构,接着依据边带相关算法,计算出特征信号的最佳调制信号区间,最后在这个最佳调制信号区间的信号进行Hilbert变换分析其包络谱,将其与正常轴承信号的包络谱对比,进而判断轴承是否出现故障。蔡振宇等[3]首先利用集合经验模态分解(ensemble empirical mode decomposition, EEMD)和Hilbert变换进行特征提取,然后利用基于improved teaching-learning-based optimization(ITLBO)算法优化的support vector machine(SVM)模型进行多分类故障诊断。彭宅铭等[4]通过时域、频域和自适应白噪声的完备经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)提取多维特征,构建初始特征集,结合马田系统和有向非循环图(direct acyclic graph,DAG)的特点,构建多分类模型并将其运用到轴承故障诊断中。上述方法虽然在一定程度上提高了轴承故障诊断的准确率和可靠性,但特征提取高度依赖获取准确稳定的轴承速度或者转速信息以及领域内的专家知识,这限制了其在工程实际中的应用。

随着现代化机械设备的增加,对机械运转时的数据采集也能达到较高的采样频率以及获得较多的采样点,由此获得的海量数据也使机械设备故障诊断领域进入了“大数据”时代[5]。深度学习理论在“大数据”下有着强大的自学习能力,部分学者陆续开展了其在轴承故障诊断领域中的应用研究。郭亮等[6]与王春梅[7]分别通过堆叠自编码和深度置信网络对原始振动数据进行特征处理及训练,取得了较好的效果。袁建虎等[8]采用短时傅里叶及小波变换对原始振动信号进行处理,将时序数据转换为灰度图并作为卷积神经网络(convolutional neural networks,CNN)的输入,实现了轴承故障的智能分类。上述方法虽在一定程度上降低了故障诊断工作的复杂度,但未能充分发挥CNN算法强大的自学习能力。而且,将时序信号转为图像信号,破坏了数据间的关联度,限制了其性能的进一步提升。张伟[9]建立了第1层大卷积核加多层小卷积核的深度卷积神经网络模型,并应用在凯斯西储大学单一转速、单一损伤程度的轴承数据的故障诊断中,准确率接近100%。然而,在实际工程中,转速和损伤程度往往复杂多变。因此,本文以同一故障类型(正常、内圈、外圈和滚动体故障)下变转速多损伤程度的轴承数据为一大类样本,通过构建合理的网络结构,优化网络参数,建立了基于深度卷积网络(deep convolutional neural network,DCNN)的四分类故障诊断模型,应用在凯斯西储大学变转速、多损伤程度的轴承数据中,其诊断准确率可达98.6%,明显高于BP神经网络(back propagation neural network,BPNN)、支持向量机(support vector machine,SVM)以及浅层卷积网络(shallow convolutional neural network,SCNN)的结果。

1 CNN

1.1 CNN的结构

CNN属于深度学习中的多层的神经网络,主要是由卷积层、池化层和全连接层构成,其典型结构如图1所示。

图1 CNN典型结构Fig.1 Typical structure of CNN

卷积层是将输入进去的数据信号运用权值共享操作,直接与卷积层里的卷积核进行卷积运算产生新的特征图谱,通过权值共享可避免由过多网络参数引起的过拟合,加快网络收敛速度。卷积过程的数学表达式为:

式中:M j表 示为输入的特征矢量;l表 示为第l层网络;w表示为卷积核;b为网络的偏置值;x lj表 示为第l层输出;x l i-1代表为上一层的输出;i和j代表两个相连的神经元;f为提高网络的非线性表达能力的激活函数,其数学表达式为

池化层通过对上一层卷积得来的特征图谱进行降采样操作,以此来减少模型中网络的参数,选用最大池化方法。最大池化方法的数学表达式为:

式中:q jl(t)表 示为第l层 表示第i个 特征矢量中第t个神经元的值,t∈[(j-1)w+1,j w];W表示池化区域的宽度,Pi l+1(j)表 示为第l+1层神经元对应的值。全连接层则是将最后得到的特征图谱作平铺操作,将其平铺展开成一维的特征向量,然后执行分类或回归任务。全连接层的前向传播表达式为:

式中:Wj l i表 示为第l层 第i个 神经元与第l+1层 第j个神经元之间的权重;z il+1表示为l+1层 第i个神经元的输出值;b li表 示为偏置值;f为非线性激活函数。

分类器层是指最后的全连接层采用可以将输入的神经元转化为和为1的概率分布的Softmax激活函数,得到输入数据的标签分布:

式中:z=[z1,z2,···,z c]代 表最后的输出,下标c的数值即最后1层的神经元个数,也表示是分类器的分类标签数。

1.2 卷积网络的训练过程

卷积神经网络的训练过程主要由前向传播和反向传播构成。前向传播将输入数据层层递进获得输出,反向传播的是利用损失函数计算得出预测值与真实值之间的误差。其中的损失函数使用交叉熵损失函数:

式中:{yi=j}是括号里的数值为真值时为1,为假值时为0的示性函数;K是训练样本总的数量;C是训练样本类别的个数;y i表示第i个训练样本的真实值,p ji表示第i个 训练样本为第j个类别的预测概率。误差反向传播使用梯度下降法来最小化损失函数L(W,e),以此更新每一层的参数W和e。参数的更新公式为:

式中:η为卷积神经网络的学习率。

2 实验验证

2.1 实验数据

为了验证上述理论方法,选取了美国凯斯西储大学滚动轴承数据中心[10]的数据信号进行实验。该数据中心利用电火花加工了轴承内圈、外圈、滚动体3种故障,每种故障包含3种损伤模式(故障尺寸):177.8、355.6、533.4 mm(7、14、21 inch),又分别在1 797、1 772、1 750、1 730 r/min转速下获取轴承振动信号,采样频率为12 kHz。其轴承实验系统如图2所示。

图2 轴承实验系统Fig.2 The bearing experiment system

考虑到工程中转速和损伤程度复杂多变,难以进行细分。因此,将数据按表1所示的形式进行了分组。其分组特点为:以轴承故障位置不同设置为4个标签,每个标签内都含有轴承在不同工况(轴承转速为1 797、1 772、1 750、1 730 r/min)下的数据信号,和对应每个工况下不同的损伤模式(177.8、355.6、533.4 mm)下的数据信号,共计14 400个数据样本,用来训练和测试本文提出的滚动轴承变工况多模式下的四分类诊断模型。

表1 DCNN试验样本组成Tab. 1 Composition of DCNN experimental samples

2.2 模型结构与参数

2.2.1 模型结构及其超参数的确定

由于输入样本数量较大,且蕴含在样本数据的中非线性特征具有离散化的特点。针对该问题,本文通过构建包含卷积层、池化层以及分类层等多层一维网络对原始信号特征信息进行提取,构建的DCNN故障诊断模型如图3所示。原始样本数据通过卷积层输出若干个特征图谱;接着通过采用最大池化方法的池化层对特征图谱进行约简,以此减少神经网络的参数,且提高其非线性特征的鲁棒性。网络模型中交替构建的多层卷积池化层可多层提取输入样本数据的非线性特征,进一步提高特征提

图3 DCNN故障诊断模型Fig. 3 Fault diagnosismodel of DCNN

取的可靠性与准确性。同时,Santurkar等[11]提出使用批次归一化(batch normalization,BN)方法处理训练过程中的卷积运算,对网络模型训练过程中的参数进行修正,使优化过程更加平滑,这种平滑性会导致渐变的预测性和稳定性更好,从而可以更快地进行训练;该网络模型优化算法选择Adam,与之对应的设置学习率0.001[9],这种算法对超参数的选择具有鲁棒性,之后,通过一个全连接层,将提取出的特征参数展开形成一维向量,最后设置一个类层,激活函数选Softmax。

根据张伟[9]提出的轴承故障诊断方法的第一层大卷积核加多层小卷积核的参数设置,本文DCNN模型具体结构参数设置如表2所示。

表2 DCNN模型的具体结构参数Tab.2 Specific structure and parameters of DCNN

2.2.2 数据长度的选择

不同的数据长度蕴含的信息不同,势必会影响诊断结果,同时也会影响计算速度。因此,本文对比了不同数据长度下的诊断结果准确率和训练时间,结果如表3所示。可以看出,随着数据长度的增加,诊断准确率也在不断地增加,但数据长度达到2 048点时,继续增加数据长度测试准确率基本保持稳定,但训练时间消耗大幅增加,基于此,数据长度选为2 048点。

表3 数据长度实验结果对比Tab.3 Comparison of experimental results of different data lengths

2.2.3 样本批量处理的选择

深度学习训练网络需要大量的样本数据,为了避免样本数据以单一的形式进行迭代训练时,出现模型陷入局部最优化,以及增加网络的训练时间,可将训练样本数据划分为合适的训练批次,进而提高网络的泛化能力和网络的训练速度[12]。因此,本文对比了不同的批处理样本数量下的准确率和训练时间,结果如表4所示。可以看出,随着批处理样本数量的增加,训练准确率不断下降,训练时间不断减少,而测试准确率没有规律性的变化,综合来看,当批处理样本数量为128时,准确率和训练时间达到相对较优。因此,本文将批处理样本数量设置为128。

表4 不同批处理样本数量实验结果对比Tab.4 Comparison of experimental results of different batch samples

2.3 模型性能

将表1中的标签样本数据按照8:1:1的比例,划分为训练样本、验证样本以及测试样本。对于训练和测试DCNN模型的样本,网络的最大迭代次数设置为14。训练集和测试集的准确率如图4所示,在一定次数的迭代下趋于收敛且准确率大小相当;训练集和测试集的损失函数值如图5所示,在一定次数的迭代下也趋于收敛且测试集的损失函数值略低于训练集,说明DCNN模型未出现过拟合或欠拟合的情况。测试集的平均准确率达到了98.6%,具有较高的故障识别效率。

图4 训练集准确率和测试集准确率Fig.4 Accuracy of training sets and test sets

图5 训练集损失率和测试集损失率Fig.5 Lossrate of training sets and test sets

为了验证本文所搭建的模型相对于其他方法的优势,将表1中的数据分别应用BPNN、SVM以及SCNN3种算法进行建模和测试,其中BPNN与SVM方法利用Hilbert变换提取轴承5个特征频率处的幅值作为特征向量,诊断结果如表5所示。可以看出,3种算法的准确率分别为72.8%、76.9%和93.1%,明显低于本文所提方法的98.6%。

将准确率偏低的BPNN、SVM算法与DCNN算法进行深入对比,分别分析它们在测试样本上的混淆矩阵,结果如图6所示。4类故障共1 440个测试样本,标签1-4分别对应轴承的正常、内圈、外圈以及滚动体故障,从图6(a)中可以看出,BPNN算法在4种故障类型诊断正确的个数分别是141、350、255和158,相较之下正常状态和滚动体故障诊断准确的样本数偏低;从图6(b)中可以看出,SVM算法在4种故障状态诊断正确的个数分别是317、352、224和214,相较之下外圈与滚动体故障状态诊断准确率偏低;从图6(c)中可以看出,DCNN算法在4种故障状态诊断正确的个数分别是360、360、360和340,除滚动体故障状态诊断稍有偏差外,其余故障状态的诊断准确率均达到100%。文献[13]提到当轴承滚动体出现故障时,传感器采集的信号会因损伤点位置变化多变而有些复杂,对此时的信号进行Hilbert变换,产生的包络信号和频谱也比较复杂,致使特征提取方法在滚动体故障状态下的数据提取特征不明显,因此依赖特征提取方法的BPNN和SVM均在诊断轴承滚动体故障时表现不佳,而本文DCNN算法对轴承滚动体故障状态的诊断准确率达到94.4%,与前两者相比有着明显优势。

图6 BPNN、SVM和DCNN算法的测试样本混淆矩阵Fig.6 Test sample confusion matrix of BPNN,SVM and DCNN

表 5试验情况及诊断结果Tab.5 Experimental situation and diagnosis results

3 结语

轴承在实际应用中转速和损伤程度复杂多变,传统的诊断方法依赖于特征提取的有效性,在一定程度上限制了其工程应用。基于此,本文提出了一种变转速多损伤程度下的深度卷积神经网络模型搭建方法,该方法以振动原始数据为网络输入,利用卷积层和池化层实现特征自提取和简化,四分类的分类器实现故障识别。通过实验验证与对比,该方法具有以下优势:①不依赖任何信号分析和转速信息;②诊断准确率明显高于传统算法,尤其是对滚动体故障的诊断。

猜你喜欢
故障诊断卷积准确率
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
从滤波器理解卷积
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法
因果图定性分析法及其在故障诊断中的应用
一种基于卷积神经网络的性别识别方法
基于LCD和排列熵的滚动轴承故障诊断