基于深度迁移自编码器的变工况下滚动轴承故障诊断方法

2021-08-04 09:05苏靖涵
计算机测量与控制 2021年7期
关键词:源域编码器轴承

苏靖涵,张 潇

(1.南开大学 电子信息与光学工程学院,天津 300350;2.徐州医科大学 医学信息与工程学院,江苏 徐州 221008)

0 引言

在现代工业领域中,旋转机械设备的运行状态将直接影响工业生产的进程和效率,而作为其核心部件之一的滚动轴承发生故障将直接影响设备的安全运行,因此,滚动轴承的故障诊断研究对保障工业机械设备安全稳定运行具有重要意义[1-3]。

随着传感器技术、工业互联网、数据挖掘和机器学习的快速发展,基于人工智能数据驱动的故障诊断方法逐渐成为研究热点[1]。近年来,深度学习理论作为研究热点,由于深度学习模型具备强大的特征提取能力,能够克服浅层学习模型的缺陷,进而在机械故障诊断领域获得了越来越多的关注[2-5]。然而,面对实际工业场景下的故障诊断,存在如下问题[1,3,6]:(1)由于机械设备运行工况复杂多变,导致故障诊断模型的训练样本与实际运行过程中的轴承振动信号样本存在分布差异,而传统的深度故障诊断模型大多假设训练样本与测试样本是相同分布。(2)实际工况下的轴承故障样本不足。机械设备中正常状态的轴承在不同工况下运行的监测数据易获取,但若想获取不同工况下的故障数据,代价巨大。

针对上述问题,迁移学习方法在近年来逐渐获得研究者的关注,迁移学习旨在利用已有领域(源域)的知识解决不同但相关领域(目标域)的问题,包括基于样本、基于特征、基于关系和基于模型的4种迁移方法[2-5]。文献[1]提出了一种深度在线迁移的故障诊断方法,通过建立CNN-ISVM预训练模型并保存参数,使在线处理新增目标数据时,无需重新训练,实验表明所提出方法能够较好实现变负载下的滚动轴承多状态在线故障分类。文献[3]针对轴承监测数据严重缺乏的问题,提出一种用于不同机械设备间轴承故障诊断的深度迁移自编码器模型,采用可缩放指数型线性单元作为自编码器的激活函数,修正代价函数来降低重构误差,最后采用不同设备中的轴承开展实验,验证了所提出方法的有效性与适应性。文献[6]利用稀疏自编码器构建深度迁移学习模型,用于不同载荷工况下的轴承故障诊断。文献[7]针对不同设备,提出了一种增强深度自编码器用于跨域故障诊断,实验分析表明,所提出的方法能够表现出更优的故障诊断性能。然而,上述文献中的故障诊断方法关注于深度模型的迁移,而未考虑特征间分布差异和判别性能对深度模型迁移后的故障分类影响。对此,本文提出一种新的变工况下滚动轴承故障诊断框架,首先,利用小波包变换(WPT,wavelet packet transform)处理原始信号,进行统计特征提取,构建源域和目标域特征样本;其次,利用源域带标签样本与目标域正常状态样本,综合考虑特征的判别性能和域间分布差异,选取更有利于跨域故障诊断的特征构建源域特征子集;然后,利用源域特征子集训练深度自编码器(DAE,deep auto encoder),将模型参数直接迁移至目标域,在微调阶段,利用源域带标签特征样本与目标域正常状态特征样本进行迁移学习,获得深度迁移模型;最后,诊断模型对目标域无标签特征样本进行识别分类,输出故障诊断结果。

1 基于朴素贝叶斯与域间差异的特征选取

1.1 朴素贝叶斯算法

朴素贝叶斯算法是一种基于贝叶斯定理的数据分类方法,其通过贝叶斯公式对已有样本数据的类别进行判别[9]。贝叶斯公式如下:

(1)

式中,P(A|B)表示A在B条件下的后验概率;P(B|A)表示B在A条件下的后验概率;P(A)和P(B)均为先验概率;朴素贝叶斯算法分类的原理是将事件的先验概率和后验概率相联系,并利用先验信息预测事件的后验概率。

(2)

式中,P(t1,t2,…,tn|cj)为故障类型ai∈Rm的条件概率;式中P(cj)为Rd(d

(3)

1.2 最大均值差异

在基于特征的迁移学习中,最大均值差异(Maximum mean discrepancy,MMD)被常应用于度量不同域数据间分布差异[2,10]。给定源域特征样本XS与目标域特征样本XT,有PT(XT)≠PS(XS),则两个域间的边缘分布差异有:

(4)

式中,φ为再生核Hilbert空间H中的非线性映射函数,nS与nT分别为源域与目标域的样本数。

1.3 基于朴素贝叶斯与域间差异的特征选取(FSBD)

为从原始特征集中选取更有利于跨域故障诊断的特征用于深度模型的训练和迁移,本文提出基于基于朴素贝叶斯与域间差异的特征选取方法(FSBD),FSBD从两方面角度评价特征,特征的判别性能和特征在不同域间的分布差异。我们认为,判别性能高且在不同域间的分布差异小的特征更有利于跨域故障诊断和深度模型的迁移。

给定工况1下的带标签轴承特征样本作为源域XS,工况2下的正常状态特征样本和无标签故障特征样本作为目标域XT。源域与目标域样本中均包含M种故障类型(包括正常状态),每种故障类型有N个样本,每个样本有K种特征。本节中,对于特征判别性能的评估,利用朴素贝叶斯算法对源域中每种特征样本进行分类,得到的分类精度作为表征特征判别性能的指标。对于特征在不同域间分布差异的度量,利用MMD度量源域和目标域中正常状态下的特征样本的边缘分布差异。最后,基于朴素贝叶斯算法的分类精度和特征的MMD值,构建新的特征选取指标FSI。FSBD的具体步骤如下:

(5)

ACC={acc(1),acc(2),…,acc(K)}

(6)

(7)

DD={MMD(1),MMD(2),…,MMD(K)}

(8)

3)构建新的特征选取指标FSI。基于前两步骤获得的分类精度序列ACC和域间差异序列DD,构建新的特征选取指标FSI,表达式如下:

(9)

对于K种特征,可得到FSI序列如下:

FSI={FSI(1),FSI(2),…,FSI(K)}

(10)

本文认为,特征的ACC值越大,其用于分类的判别性能越好,特征在不同域间分布差异MMD越小,则其域适应能力越强。因此,当FSI值越大,则对应的特征更有利于跨域故障诊断和深度模型迁移。最后,将FSI序列根据数值大小降序排列,选取前d个数值对应的特征用于后续的深度模型训练和迁移。

2 深度迁移自编码器

2.1 堆叠自编码器

自编码器(Auto encoder,AE)[8]是一种无监督学习的神经网络,它能够从无标签数据集中学习提取出深层特征。AE包括编码和解码两个过程,自编码器的结构可分为三层,输入层、隐含层和输出层[10],其结构如图1所示。

图1 一个自编码器的结构

在编码过程,输入层数据{x1,x2,...,xm}通过激活函数φact(·)映射到隐含层{h1,h2,...,hn},映射关系如下所示:

h=φact(W·x+b)

(11)

其中,W∈Rn×m为编码权重矩阵,b∈Rn为偏置向量。在解码过程,隐藏层数据{h1,h2,...,hn}通过激活函数φact(·)映射到输出层{z1,z2,...,zm},映射关系如下所示:

z=φact(W′·h+b′)

(12)

其中,W′∈Rm×n为解码权重矩阵,b′∈Rm为偏置向量。AE的参数通过最小化重构误差为优化目标,训练获得,其重构误差如下所示:

(13)

其中,θ={W,b,W′,b′}为自编码器参数。

深度自编码器的构建,本文是将多个AE叠加在一起,即堆叠自编码器(stacked auto encoders,SAE),将每个AE经编码后的隐含层作为下一级AE的输入层,最后一级AE的隐含层作为输出的深度特征,最后输入分类器。上述深度自编码器的训练有两个阶段:

1)无监督预训练。利用训练集样本进行各层AE训练,获得深度自编码器的参数。

2)对深度自编码器网络的整体进行有监督微调。

2.2 深度迁移自编码器

为实现跨域故障诊断,本文在深度自编码器的基础上,构建深度迁移自编码器,具体过程如下:

1)设置AE模型的激活函数,本文采用SELU函数作为激活函数;设置深度自编码器的结构层数,每层节点数。

2)利用源域无标签特征数据训练深度自编码器模型,获得每一层的编码权重参数和偏置参数。

3)将利用源域数据训练得到的深度自编码器模型的结构层数,节点层数,编码权重参数以及偏置参数迁移至目标域的模型,作为针对目标域数据的深度自编码器初始参数。

4)利用softmax分类器构建分类层,连接在深度自编码器的最后一层,再利用目标域中正常状态下特征数据对连接了分类层的深度自编码器进行Fine-tuning微调。

5)获得深度迁移自编码器模型,可用于目标域无标签特征数据的分类。

3 故障诊断框架

本文基于信号处理,提出的基于朴素贝叶斯与域间差异的特征选取方法和深度迁移自编码器,提出一种新的应用于变工况下轴承故障诊断框架FS-DTAE,如图2所示。该框架主要包括3个步骤:信号处理与特征提取,特征选取和深度迁移学习。具体描述如下:

图2 基于深度迁移自编码器的变工况下轴承故障诊断框架FS-DTAE

1)信号处理与特征提取。本文利用WPT对采集到的轴承振动信号进行分解,结合统计参数,提取统计特征作为原始特征集。

2)特征选取。为从高维原始特征集中选取有利于跨域故障诊断和深度迁移学习的特征,基于源域有标签特征数据和目标域正常状态数据,利用提出的特征选取方法FSBD,对原始特征集中各特征进行判别性能与域间差异的度量,提出新的量化指标FSI。基于降序排列的FSI序列,选取特征构建子集,用于后续的深度模型训练与迁移。

3)深度迁移学习。在第二步基础上,获得源域和目标域特征子集。首先,利用源域无标签特征子集数据作为训练样本,训练深度自编码器;其次,将源域训练得到的深度自编码器参数迁移至目标域,作为目标域深度自编码器模型的初始化参数。最后,利用源域和目标域中正常状态的特征数据对目标域深度自编码器进行Fine-tuning微调。最后,目标域无标签特征数据测试深度迁移自编码器的故障诊断性能。

4 实验验证

为验证本文所提出的变工况下轴承故障诊断框架FS-DTAE的有效性与适应性,采用美国凯斯西储大学(CWRU)的轴承振动数据开展不同工况下故障诊断实验验证。

4.1 实验设置与任务

本文使用的CWRU轴承数据采集自图3所示的故障模拟试验台,该数据集广泛的被研究人员用于开展轴承故障诊断研究。该试验台轴承有三类故障,内圈缺陷,外圈缺陷以及滚动体缺陷,缺陷的尺寸包括0.007英寸、0.014英寸、0.021英寸和0.028英寸。振动数据集中包含4种不同运行状态下的振动数据,分别为0 hp、1 hp、2hp和3 hp电机负载情况下。基于该数据集,本文设置2个跨域故障诊断任务,任务1中,2 hp和3 hp下的故障数据分别作为源域和目标域;任务2中,2 hp和3 hp下的故障数据分别作为目标域和源域。两个任务的实验数据具体如表1所示。任务1和2中,源域和目标域数据均包含12种轴承故障样本,对应的类别标签为1-12,其中源域中样本数为240,目标域中样本数为480。每个样本包含2 000个采样数据点。

图3 CWRU的轴承故障实验台

表1 CWRU轴承振动数据集

4.2 实验结果分析

根据本文提出的FS-DTAE故障诊断框架,首先,利用WPT对轴承振动信号进行四层分解(母小波为“demy”),基于第四层的16个终端节点的单支重构信号(16个信号),和重构信号的16个Hilbert包络谱,计算11种统计参数[5,11-13](极差,平均值,标准差,峰度,能量,能量熵,偏度,波峰因子,脉冲因子,形状因子和纬度因子)。因此,共计算得到352个统计特征,构建原始特征集(Raw feature set,RFS)。

在原始特征集基础上,运用本文提出的FSBD方法,评价各特征的判别性能和不同域间差异,获取特征选取的量化指标FSI,图4所示为352个特征值的FSI值。根据得到的FSI值序列,进行降序排列,选取序列中前d个FSI值对应的统计特征构建特征子集,再进行深度自编码器训练和模型迁移。本文基于从源域选取的特征用于深度自编码器训练,设置隐含层4个,每层节点个数分别为400,200,100和50,分类层为softmax分类器。

图4 352个统计特征的FSI值

为进一步验证本文所提出框架的优越性,选取一些经典和常用迁移学习的故障诊断方法进行实验对比。经典方法包括SVM,KNN,CNN和DBN,常用迁移学习方法包括TCA和JDA[14-16]。基于上述方法,构建对比故障诊断模型,如表2所示。举例说明,RFS-SVM模型表示源域的特征数据全部作为SVM的输入,进行故障诊断模型的训练,再利用训练好的模型对目标域进行故障分类;RFS-TCA/JDA模型表示源域和目标域无标签特征数据经TCA/JDA处理后,再输入SVM分类器进行模型训练,训练好的模型再对目标域特征数据进行故障分类[17-20]。RFS-FSBD-TCA/JDA模型则是在RFS-TCA/JDA模型基础上引入本文所提出的特征选取方法,特征选取后构建的特征子集再进行TCA/JDA处理。

表2 对比故障诊断模型

基于表2中所示的对比模型,进行表1中所示的故障诊断任务1和2,对应的故障诊断结果如表3和图5所示。图5所示为表2中各故障诊断模型的实验结果对比,表3所示为所提出的FS-DTAE模型,RFS-FSBD-TCA和RFS-FSBD-JDA模型在不同的特征选取数时的故障诊断结果。

表3 轴承故障诊断结果

图5所示的实验结果对比表明本文所以出的故障诊断模型在不同工况下的故障诊断性能最优,任务1和任务2的故障诊断精度最高分别可达99.79%和100%,高于其他对比模型的最大故障诊断精度。对比模型中,将本文提出的特征选取方法FSBD与迁移学习方法结合起来,能够明显提高故障诊断精度,RFS-FSBD-TCA和RFS-FSBD-JDA两个模型在任务1中所取得的最大故障诊断精度分别为95.21%和98.13%,在任务2中,最大故障诊断精度可达98.13%和97.92%。表明,FSBD方法所选取出的特征更有利于跨域故障诊断和迁移学习过程,进而提高模型的故障诊断性能。

图5 不同故障诊断模型的实验结果对比

表3所示的故障诊断结果表明本文提出的特征选取方法FSBD在选取合适的特征数时,能够明显提高故障诊断准确率,对于FS-DTAE模型,任务1中,根据降序FSI序列选取前120个特征用于后续的模型训练和迁移,能够取得最大的故障诊断准确率;任务2中,选取前100个特征可达到100%的诊断准确率。FSBD与迁移学习方法TCA和JDA结合起来构建的故障诊断模型,基于降序FSI序列选取一定数量的特征,能够提升模型的故障诊断性能。

5 结束语

本文在信号处理与统计特征提取,特征选取和深度自编码器基础上,提出了一种新的基于深度迁移自编码器的轴承故障诊断模型FS-DTAE,旨在提高在不同工况下的轴承故障诊断准确率。利用CWRU轴承故障数据开展不同工况下的故障诊断实验,实验结果表明:

1)本文所提出的FS-DTAE模型与设置的对比模型相比,取得的故障诊断准确率最高,验证了该模型在不同工况下故障诊断的有效性和优越性。

2)本文提出的特征选取方法FSBD能够明显提高迁移故障诊断模型的诊断准确率。基于原始特征的降序FSI序列,分别选取前120个和100个特征时,可使FS-DTAE模型在任务1和2的故障诊断结果分别达到99.79%和100%。

3)本文提出的FSBD方法与其他迁移学习方法结合,同样能够明显提高故障诊断准确率,表明该方法所选取出的特征更有利于跨域故障诊断和迁移学习。

综合实验结果分析,本文所提出的FSBD方法能够提升故障诊断模型的性能,使构建的深度迁移模型达到理想的故障诊断准确率。

猜你喜欢
源域编码器轴承
基于ResNet18特征编码器的水稻病虫害图像描述生成
WDGP36J / WDGA36J编码器Wachendorff自动化有限公司
基于Beaglebone Black 的绝对式编码器接口电路设计*
接触式密封在大功率半直驱永磁风力发电机应用探讨123
斯凯孚展示用于电动汽车的先进轴承产品
一种轴承拆卸装置的实用设计
基于TMS320F28335的绝对式光电编码器驱动设计
浅析《离骚》中的跨域映射现象
从映射理论视角分析《麦田里的守望者》的成长主题
轴承,转动的传奇