声发射与混合维深度融合的滚动轴承智能诊断

2022-11-10 06:11王之海柳小勤李佳慧冯正江
关键词:故障诊断卷积准确率

魏 巍, 王之海, 柳小勤, 李佳慧, 冯正江

(1.昆明理工大学 机电工程学院,云南 昆明 650500; 2.云南省先进装备智能制造技术重点实验室,云南 昆明 650500)

0 引 言

滚动轴承是旋转机械的核心部件,实时监测滚动轴承的运行状态非常重要[1].大数据的出现为机械故障诊断的研究和应用提供了更多的机会[2].深度学习可不依赖于传统信号处理技术和专家先验知识,直接从测量数据自动获取、挖掘有效特征,通过强大的自学能力以准确识别滚动轴承故障.CNN因对高维非线性数据有很好的特征提取能力而广泛用于滚动轴承故障诊断.

声发射技术是一种无损检测方法,可检测材料内部动态缺陷,相对于振动方法可更早获取滚动轴承内部损伤信息[3].目前常用的故障声发射信号分析方法包括参数分析和波形分析.有学者从参数分析与波形分析[4-6]角度开展了滚动轴承故障诊断研究,但它们高度依赖于现场诊断工程师的经验,难免受主观因素影响.张晓涛等[7]提出了一种结合最小周期相关熵反卷积与窄带解调的复合故障诊断方法,该方法适用于轴承复合故障声发射信号的处理,能够实现复合故障诊断.唐贵基等[8]通过改进二进谐波小波包分解方法,实现了滚动轴承单通道复合故障信号的特征分离,但实验中复合故障类型较少.He等[9]利用希尔伯特黄变换对声发射信号进行分解,提取状态指标分别应用于k-最近邻和反向传播神经网络进行轴承故障诊断,故障识别准确率均超过92%.Saufi等[10]把滚动轴承的声发射信号和振动信号的时域信号、特征统计量分别输入自适应弹性堆叠稀疏自编码器,对比发现声发射信号的识别准确率高于振动信号.Appana等[11]将声发射信号的包络谱分析与一维CNN结合对滚动轴承故障进行分类,在变转速工况下平均故障分类精度约为86%.袁建虎等[12]提取滚动轴承的小波时频图作为二维CNN的输入,实现了轴承的故障诊断.施杰等[13]提出一种改进希尔伯特黄变换与二维CNN相结合的滚动轴承复合故障诊断方法,实现了不同工况下的轴承复合故障智能诊断,并具有较好的泛化能力和鲁棒性.Islam等[14]将原始声发射信号离散小波包变换的时频图输入自适应卷积神经网络实现特征提取和分类,对比现有先进算法分类精度提高4.87%~19.38%.

以上研究表明,一维与二维卷积神经网络(1D-CNN、2D-CNN)均可自动获取滚动轴承有效故障信息,将深度学习与声发射技术相结合可提高故障识别准确率.但基于CNN的特征学习方法存在泛化能力差的缺点,往往只针对特定转速或负载工况信号才有较好效果,难以发挥深度学习优势.

混合维融合数据可以发挥数据间的互补性,以弥补单维数据信息不完整的缺点[15].林桐等[16]通过对多维特征的融合实现滚动轴承的故障诊断与状态评估,用超球优化改善特征向量的空间分布以降低数据描述任务的难度.实验表明超球优化SVDD比传统的SVDD方法滚动轴承故障效果更优.Sun等[17]提取时域、频域和时频域的多视角特征后应用随机森林模型选择与轴承运行状态高度相关的特征,通过自动编码器融合减少冗余,并利用支持向量机对融合特征进行评价.实验结果表明,该方法能有效地反映滚动轴承不同故障信号之间的差异.现有轴承故障领域的特征级融合方法多是通过人为提取特征融合降维后输入分类器或是用不同的深层网络各自提取特征,然后把不同特征进行组合拼接,这些方法处理复杂故障数据时没有充分利用多维信息的低层细节信息和高层的语义信息.

综上,为解决低层和高层信息利用不充分问题,本文引入特征金字塔(Feature Pyramid Networks,FPN)[18]结构,提出一种基于声发射与混合维深度特征融合卷积神经网络(Hybrid Dimension Deep Feature Fusion Convolutional Neural Network,HDFF-CNN)的滚动轴承早期故障智能诊断.实验表明,本文提出的模型具有较好的鲁棒性和泛化能力.

1 卷积神经网络模型

卷积神经网络属于典型前馈神经网络,其实质是通过建立多个滤波器来提取输入数据的特征.下面简要介绍模型所用到的几种网络结构.

1.1 卷积层

卷积层进行卷积运算,卷积运算将卷积核应用于输入数据.卷积核用于计算不同的特征图.卷积后通过激活函数将非线性引入卷积神经网络中.卷积层计算公式如下:

(1)

常用激活函数有sigmoid、tanh和ReLU函数,本文使用ReLU激活函数,yl(i,j)经过ReLU的公式为:

al(i,j)=ReLU(yl(i,j)=max(0,yl(i,j))

(2)

1.2 池化层

池化层的主要作用是降低卷积层输出特征图的维度,减少运算量.最常用的池化方法是最大池化(MaxPool),最大池化是选取图像区域中的最大值作为新的特征映射.最大池化层公式如下:

(3)

1.3 全局平均池化层

全连接层会导致神经网络的过度拟合问题.虽然,Dropout能在很大程度上抑制过拟合,但也有一定的局限性.为了抑制过拟合现象,本文将全连接层替换为全局平均池化层(Global Average Pool,GAP).全局平均池化层在最终的特征图之后取每个特征图的平均值.在全局平均池中没有可以优化的参数,避免了该层的过拟合现象.同时也聚合了空间信息,增加了空间变换的多样性,可以适应不同工作环境下的智能故障诊断.全局平局池化的公式如下:

(4)

2 混合维深度特征融合诊断模型

2.1 混合维深度特征融合模型结构

混合维深度特征融合模型(HDFF-CNN)整体结构如图1所示.模型以声发射一维原始数据和二维小波时频图为输入,2D-CNN特征经由维度转换层(Reshape)后和1D-CNN特征融合,融合时用FPN结构融合高维与低维特征,并采用全局平均池化代替全连接层降低过拟合,最后由Softmax层对融合后的高层特征进行分类得到分类结果输出.

图1 HDFF-CNN模型结构Fig.1 HDFF-CNN model structure

2.2 连续小波变换

小波分析可对信号的时频域进行局部放大分析,调整尺度因子,改变低频和高频信号的时间及频率分辨率来适应不同成分的信号,因此小波分析方法在滚动轴承故障诊断方面显示出良好的效果.信号x(t)的连续小波变换(Continuous Wavelet Transfrom,CWT)可以表示为:

(5)

式中:s和τ分别为尺度和平移参数;ψ*(·)为小波函数ψ(·)的共轭函数.

连续小波变换的本质在于,小波基的平移与尺度变换,以尽可能逼近原始数据.然而,不同的小波基具有不同的时频特性,对逼近效果会产生一定的差异,进而导致后续数据处理的精度差异.因此,选择小波基也是小波分析的关键一步.根据与声发射信号的相似性,本文选择cmor3-3为声发射连续小波变换所采用的小波基.

2.3 模型训练

在神经网络模型的训练过程中,为确保预测值能较好贴近实际值,本文模型采用交叉熵损失函数(Cross-entropy Loss Function).交叉熵损失函数在进行梯度下降计算时可避免梯度弥散导致的学习率下降.

(6)

训练以尽可能降低损失函数值为目标以逼近真实值.Adam[19]是一种高效简洁的优化器,基于训练数据迭代更新神经网络权重.其实现简单、计算效率高、对内存需求少,参数更新不受梯度的伸缩影响,能够自动地调整学习率.因此,本文采用Adam优化器对模型优化.

2.4 混合维深度特征融合算法流程

综上,基于HDFF-CNN的滚动轴承故障诊断模型实现步骤如下:

1) 采集滚动轴承不同故障类型的声发射信号并对信号分段;

2) 使用连续小波变换(小波基cmor3-3)将声发射信号样本转化为时频图;

3)将一维信号、二维时频图和与之对应的故障标签作为一个样本对,并按一定的比率将样本随机划分为训练集、验证集和测试集;

4) 初始化模型权重参数;

5) 将训练集输入模型进行训练,并用验证集调整模型,通过反向传播损失函数值更新权重,通过不断的调整模型权重参数,获得在训练集上的最佳模型;

6) 利用测试集对训练完成的模型进行性能测试.

具体流程图如图2所示.

图2 HDFF-CNN模型流程图Fig.2 HDFF-CNN model flow chart

3 实验验证与算法性能分析

为了验证提出方法的有效性,在图3所示的滚动轴承实验台上进行了相关实验研究.实验台驱动部分由ABB-QABP90L2A型电机及其ACS550-01-05A4-4型变频器组成.

图3 滚动轴承实验台Fig.3 Rolling bearing test bench

电机额定功率 2.2 kW,额定转速 2 860 r/min,额定电流 4.8 A,额定转矩 7 N·m,可由变频器控制转速;测试对象为推力球轴承(ZCFZ-51126)参数如表1所示,加载部分由液压系统施加 14.13 kN 推力载荷.

表1 ZCFZ-51126推力球轴承基本参数

为获取滚动轴承故障数据,分别对滚动体和座圈进行电火花故障加工以仿真滚动轴承点蚀故障[20],共加工出4种单一故障,即损伤直径分别为 0.5 mm 和 1 mm、深度 0.65 mm 的滚动体损伤与座圈损伤,其中,0.5 mm 的损伤直径为早期故障[21];2种复合故障,即滚动体损伤 0.5 mm、座圈损伤 0.5 mm,滚动体损伤 1 mm 和座圈损伤 1 mm 的复合故障;1种无损伤正常运行状态,共计7种滚动轴承运行状态,如图4为电火花模拟故障样例.

图4 电火花模拟故障样例Fig.4 Sample of electric spark simulation failure

实验中,采用美国物理声学公司(PAC)R15-ALPHA谐振式AE传感器(频响宽度50~400 kHz)、台湾凌华公司的PCI-9846H高分辨率数据采集卡以及鹏翔科技(PX)的AE PreAmp放大器(增益 40 dB)采集滚动轴承AE信号.为保障AE信号传输,采用中国Cofo超声波耦合剂.AE信号的采样频率设置为 1 MHz,分别在转速为 400 r/min、600 r/min 和 800 r/min 下采集滚动轴承不同状态的AE信号,每种状态采集 3 s.以 2 048 个数据点为一个样本长度,对每种状态的声发射信号进行随机无重叠的截取 1 000 个样本,按7∶2∶1的比例,把数据集划分为训练集、验证集和测试集得A、B、C数据集.采集到微弱复合损伤原始数据与小波时频图,如图5所示.

(a)时域波形图 (b)小波时频图图5 复合损伤0.5 mm特征数据Fig.5 Composite damage 0.5 mm characteristic data

3.1 超参数设置

具体的参数设置由实验和故障诊断领域的相关经验决定.经过多次实验比较,HDFF-CNN的参数结构如表2所示.

表2 HDFF-CNN参数

表2中C11和C21分别表示第一个一维卷积层和第一个二维卷积层,其他层以此类推;R表示转换层(Reshape),Reshape是将一定维度的多维矩阵重新排列构造一个新的保持同样元素数量但是不同维度尺寸的矩阵.batch-size通常为8~128,小的batch-size有助于增强模型的泛化能力[22],所以本文的batch-size为8.经对不同的训练轮数(epoch)评估,最终epoch定为30进行模型训练.设置初始学习率为0.001,最小值为 0.000 01,当验证集的损失值在2个epoch后不再下降时,将学习率折半以进一步训练.

3.2 算法对比

实验中,由于神经网络的初始权值是随机生成,因此为了研究该方法的准确率与稳定性,每种转速工况下重复10次实验,并与本文模型的1D-CNN、2D-CNN、WAFCNN[23]和RestNet18方法对比,结果详见表3.五种模型训练过程的准确率曲线如图6所示.

表3 10次训练准确率

图6 HDFF-CNN与四种对比算法训练过程的准确率曲线Fig.6 Accuracy curves of HDFF-CNN and four comparison algorithms during training

通过表3可看出,在仅使用一维原始声发射信号的WAFCNN模型的准确率最低,仅使用时频图的RestNet18次之.本文的1D-CNN和2D-CNN准确率有进一步提升,且1D-CNN的提升较大,但2D-CNN在高转速工况下性能差.相比而言,提出的混合维深度特征融合模型在准确率上达到最高.通过标准差可以看出本文方法的准确率标准差不超过 0.001 2,模型的稳定性优于对比方法.

从图6中可看出,收敛速度由快到慢依次为HDFF-CNN、1D-CNN、RestNet18、2D-CNN、WAFCNN.虽然,RestNet18比本文模型二维分支2D-CNN收敛速度快,且两者前期验证集准确率都有较大波动,但前者验证集准确率远低于训练集,说明其存在严重的过拟合.1D-CNN训练过程中训练集与验证集准确率波动小、值接近.本文模型,虽然在训练初期有微弱的波动,但后期训练集与验证集准确率几乎相等且无波动,说明其稳定、无过拟合现象.综上,HDFF-CNN有最快的收敛速度、最高的测试准确率与最好的稳定性.

为更直观地检验该方法有效性,以 400 r/min 工况为例,采用t-分布邻域嵌入算法[24],将本文模型与四种对比方法的Softmax分类层进行可视化,如图7所示.图中C1、C2为早期故障,C5、C6为复合故障.其中WAFCCN方法故障分类均存在混叠现象,效果最差.RestNet18中C4、C6无混叠现象,C1、C2、C5混叠严重,说明该方法对早期复合故障的识别性能差.与RestNet18相比1D-CNN和2D-CNN的混叠有一定减少.本文HDFF-CNN通过FPN融合了1D-CNN和2D-CNN的特征,各种状态均不存在混叠,分类效果最佳.

图7 400 r/min工况t-SNE降维可视化Fig.7 Visualization of t-SNE dimensionality reduction under 400 r/min working condition

4 结 论

本文提出了一种基于混合维深度特征融合的滚动轴承复合故障声发射智能诊断模型.该模型同时输入一维原始声发射信号及其二维时频图,分别由1D-CNN和2D-CNN提取不同维度特征,并用FPN结构融合多维特征,提升模型的特征提取性能.同时,模型将全连接层替换为全局平均池化层,避免了该层的过拟合现象.实验结果表明,相较于1D-CNN、2D-CNN和2种近期提出的网络模型,本文提出的模型对滚动轴承早期及其复合故障声发射数据具有更高的识别准确率和稳定性.

猜你喜欢
故障诊断卷积准确率
基于包络解调原理的低转速滚动轴承故障诊断
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
卷积神经网络的分析与设计
从滤波器理解卷积
高速公路车牌识别标识站准确率验证法
数控机床电气系统的故障诊断与维修
基于傅里叶域卷积表示的目标跟踪算法