基于深度学习多样性特征提取与信息融合的行星齿轮箱故障诊断方法

2019-02-25 08:56王友仁
中国机械工程 2019年2期
关键词:齿轮箱特征提取分类器

金 棋 王友仁 王 俊

南京航空航天大学自动化学院,南京,211106

0 引言

行星齿轮箱具有传动比大、承载效率高等优点,广泛应用于直升机主减速器、风力发电机组等机械设备。在实际运行中,行星齿轮箱承受动态重载负荷,工况复杂,太阳轮、行星轮、齿圈等关键零部件容易发生故障,实现行星齿轮箱状态监测与故障诊断具有重要意义[1-2]。

行星齿轮箱故障诊断过程一般包括数据采集、特征提取、特征选择融合、状态模式识别4个步骤,其中,特征提取是一个关键步骤,特征提取直接决定着故障诊断的性能。文献[3]提出了一种基于局部均值分解理论的解调分析方法,先利用局部均值分解将行星齿轮箱振动信号分解为一系列乘积函数,再对乘积函数做Fourier频谱分析,成功提取了风机行星齿轮箱齿轮局部裂纹故障特征频率。文献[4]将一种改进的经验小波变换应用于行星齿轮箱振动信号解调分析,通过滤波将信号分解为一组调幅-调频单分量成分,有效提取出行星齿轮箱局部故障特征频率。然而上述故障特征提取方法一般都需要掌握大量的信号处理知识和丰富的专家诊断经验,这对于一些简单信号是有效的,但对于一些复杂信号,在内外多激励干扰情况下,传统故障特征提取方法难以提取到有效的早期故障特征。

伴随着机器学习等技术的发展,基于机器学习模型的故障诊断方法成为研究热点,例如BP神经网络(back propagation neural network,BPNN)、支持向量机(support vector machine,SVM)等。然而,浅层学习模型(如BPNN、SVM)用于行星齿轮箱故障诊断时,诊断精度依赖于提取故障特征的好坏,且在高维大数据情况下,其诊断能力和泛化性能明显不足[5-6]。近年来,深度学习作为机器学习领域一种新兴方法,因其强大的建模和表征能力,在图像处理、语音识别和故障诊断等领域取得丰硕成果[7]。文献[8]将堆栈式去噪自动编码器(stacked denoising autoencoders,SDAE)应用于行星齿轮箱故障诊断,实现行星齿轮箱故障特征自适应提取及诊断。文献[9]利用深度置信网络(deep belief networks,DBN)进行轴承振动信号频谱故障的特征提取。文献[10]将去噪编码融入稀疏自动编码器(sparse autoencoder,SAE),可以自动提取感应电动机的鲁棒性稀疏特征,提高SAE故障诊断的稳定性和泛化能力。深度学习模型可以直接从频域信号中自适应地提取故障特征,实现了大数据环境下故障特征的自适应提取与智能故障诊断,然而,现有的深度学习故障诊断方法在理想实验环境下诊断效果较好,而实际行星齿轮箱振动信号中常伴有较大的噪声与干扰,使得单一深度神经网络故障诊断精度不高,稳定性与泛化性能较差[11]。

集成学习通过将多个分类器的诊断信息进行融合,可以取得比单一分类器更好的故障诊断性能。文献[12]同时提取振动信号和声发射信号的小波包特征,利用深度随机森林集成两路玻尔兹曼机进行齿轮箱故障诊断,提高了故障诊断精度。文献[13]利用集成堆栈去噪自动编码器(ensemble stacked denoising autoencoders,ESDAE)进行眼科疾病的辅助诊断,ESDAE利用Bagging算法训练多个SDAE,再将多个SDAE的输出进行加权平均完成故障分类。文献[14]通过多目标训练方式得到多个DBN,再利用粒子群(PSO)优化算法对多个DBN优化权重分配,提高了设备剩余寿命预测稳定性和泛化性能。通过不同分类器之间特征信息融合、参数共享策略,可有效提高分类器泛化能力和稳定性,减少单一分类器因原始数据样本受噪声干扰的影响。

针对行星齿轮箱实际运行时噪声干扰大、早期故障特征微弱、单一分类器进行诊断时泛化能力和稳定性不强等问题,本文提出了一种基于深度学习多样性故障特征自动提取和信息融合的行星齿轮箱故障诊断方法。设计多个SDAE来优化训练目标,利用基于分解的多目标优化算法[15](multi-objective evolutionary algorithm based on decomposition,MOEA/D)优化SDAE,获得一组多样性SDAE,提取出多样性故障特征,再采用多响应线性回归(multi-response linear regression,MLR)模型[16]对多样性故障特征进行信息层融合,得到多目标集成堆栈去噪自动编码器(multi-objective ensemble stacked denoising autoencoders,MO-ESDAE)。将MO-ESDAE应用于行星齿轮箱故障诊断,能有效提高故障诊断性能。

1 SDAE多样性故障特征自动提取

1.1 SDAE原理

自动编码器[17](autoencoder,AE)是一种对称的3层神经网络,由编码网络和解码网络构成,结构见图1。在编码网络,AE通过隐含层对输入向量进行编码,得到编码向量;然后利用解码网络将编码向量重构回原来的输入向量。当输出向量与输入向量间的重构误差足够小时,可以将编码向量看作输入向量的一种特征表示。

图1 自动编码器结构Fig.1 Structure of autoencoder

图2 去噪自动编码器结构Fig.2 Structure of denoising autoencoder

去噪自动编码器[18](denoising autoencoder,DAE)在AE的基础上融入去噪编码,加强了编码器的抗噪能力,其结构见图2。其核心思想如下:将含有一定统计特性的“噪声”添加到样本数据,再对样本进行编码,解码网络再重构回未受到干扰的样本,从而使DAE可以从含噪样本中学习到更具鲁棒性的特征,降低噪声的干扰。

(1)

(2)

f(x) =1/(1+exp(-x))

(3)

其中,θ′是解码网络的参数集合,且θ′={W′,c},W′是解码网络的权重矩阵,c是偏置项。

(4)

图3 SDAE的结构Fig.3 Structure of stack denoising autoencoders

DAE是一个3层的网络结构,其函数构造能力有限。为构造表达能力更强的函数,将DAE网络层层堆叠,前一个DAE的编码矢量作为后一个DAE的输入量,进行故障特征的层层提取,再合并每个DAE的编码矢量构成一个多层的神经网络,并用Softmax分类器构成输出层,见图3。SDAE包括输入层、N个隐含层和输出层,每个隐含层即为每个DAE预训练逐层提取的特征。

(5)

其中,θN+1为输出层的参数,g(·)是输出层激活函数,这里为Softmax函数。设x(m)的健康状况类别为y(m),SDAE通过最小化JSDAE完成微调:

(6)

其中,Θ为SDAE的参数集,且Θ={θ1,θ2,…θN+1}。经过微调后,优化了SDAE对行星齿轮箱故障特征表示,能提高行星齿轮箱故障诊断能力。

1.2 多样性故障特征提取算法与建模

SDAE可以直接从振动信号频谱中自适应地提取故障特征,摆脱对信号处理技术和诊断经验的依赖。SDAE在训练过程中需要设置多个参数,如隐含层节点数、噪声因子、学习率等,这些参数对SDAE的特征提取能力和故障识别能力起着至关重要的影响。为得到多个性能优异的SDAE,以提取出多样有效的故障特征,在SDAE的训练过程中融入多个优化准则,建立多样性故障特征提取模型。SDAE优化准则如下。

(1)稀疏性最小。故障特征稀疏性是基于稀疏编码的思想提出的特征性质。稀疏特征能更有效地找出隐含在行星齿轮箱振动信号中内部的结构与特点,表达故障模式的本质特征,提高故障特征的泛化能力。其数学表达式如下:

(7)

(8)

(9)

(2)分类错误率最低。故障分类错误率是衡量SDAE故障诊断性能的重要指标,其值要尽量小。故障分类错误率

f2(S)=1-s/M

(10)

式中,s为所有样本中正确诊断的样本总数。

依据上述两个优化目标,建立SDAE多样性故障特征提取模型。目标函数为

(11)

本文引用MOEA/D对SDAE多样性故障特征提取模型进行求解,可以得到多个满足差异性和优异性的SDAE,称之为多目标堆栈去噪自动编码器(multi-objective stacked denoising autoencoders,MO-SDAE)。MOEA/D是一种将数学规划与进化算法相结合的求解多目标优化问题的多目标进化算法,它采用分解思想将多目标优化问题分解为指定规模的单目标子问题,通过与其相邻子问题之间的进化操作来完成种群进化,可以高效得到一组多样性的多目标优化解。

MOEA/D算法的主要操作步骤如下。

(1)编码设计。决策变量d采用实数编码,d=(n,p)为SDAE两个待优化参数,对应一个待优化SDAE网络。其中,n∈(5,1 000)为SDAE第2层隐含层节点数,p∈(0,1)为样本的加噪比例。

(2)算法初始化。初始化设置如下:目标函数个数为2,种群个数Np=100(即子问题个数为100),邻居个数T=20,迭代次数为500,SDAE的网络结构设为2 000-1 000-n-5,即输入维数为2 000,第1层隐含层神经元节点数为1 000,第2层节点数为待优化参数n,输出层维数为5。对每个子问题平均初始化权重向量,利用权重向量间欧氏距离确定各种群的邻居。

(3)适应度函数计算。适应度函数计算采用切比雪夫分解法(Tchebycheff approach,TE),计算公式为

(12)

(13)

dk=(nk,pk)

其中,F′、CR为差分进化中的两个控制参数,均设为0.5。nk为第k个种群的SDAE第2层隐含层神经元节点数。pk为第k个种群的噪声因子。

变异操作即采用高斯变异,计算公式为

d′=qk+N(0,δ2)

(14)

新种群的生成通过评估新产生的决策向量和当前子问题的邻居决策向量的切比雪夫式大小来进行邻居和自身种群决策向量的更新。

利用MOEA/D建立SDAE多样性故障特征自动提取模型,以获得多个优异的MO-SDAE,提取出多样性的故障特征。具体算法实现流程如下:

输入:行星齿轮箱振动信号的频谱X、标签y

1.设置种群规模Np、邻居个数、迭代次数nc,差分进化算子参数F′和CR均设置为0.5,高斯变异方差m=1/2。

2.对Np个种群随机初始化权重矢量,并利用欧氏距离确定各种群邻居。

3.Fori=1,2,…,nc

Forj=1,2,…,Np

3.1 计算决策向量d的目标函数值,利用该值计算当前整个种群各目标最小值z*;

3.2 从当前种群中选出2个邻居,利用差分进化算子进行交叉操作,然后进行高斯变异,最后进行新决策向量d′边界限定;

3.3 分别计算新决策向量d′和当前种群邻居决策向量的适应度函数,用新决策向量替换邻居适应度值大于新决策向量适应度值的邻居进行种群更新,同时更新z*;

3.4 如果达到最大迭代次数则退出循环,否则继续步骤3。

4.得到多个多样优异的SDAE,称之为MO-SDAE。选择与最高准确率偏差在2%内的多个MO-SDAE。

输出:获得一组多样性的MO-SDAE。

2 行星齿轮箱信息融合故障诊断

利用一组多样性MO-SDAE可以提取出多样性故障特征,将每组故障特征输入至Softmax分类器得到故障诊断结果,对其进行决策层信息融合,提出基于MO-ESDAE的行星齿轮箱故障诊断方法。考虑SDAE以类概率输出结果的特点,MO-ESDAE网络组合策略采用MLR模型。MLR模型实现对多个MO-SDAE自动提取的故障特征进行信息融合,提高故障诊断性能。

2.1 多响应线性回归模型

多响应线性回归模型通过建立多个线性回归模型,对多个MO-SDAE的输出进行集成决策,得到故障诊断结果。MLR模型的工作机制如下。

(15)

(16)

MLR方法首先将原来的含有c个类的分类问题转化为c个回归问题:基于由MO-SDAE的输出组成的中间的特征空间,如式(16)所示,MLR只挑选MO-SDAE1、MO-SDAE2、…、MO-SDAEL预测的x(m)属于类yj的概率作为输入特征建立一个线性模型,在对应于类yj的回归问题中,如果个体具有类标签yj,则令输出为1;如果个体的输出为其余的类标签,则令输出为0。对于每个类yj,其数学表达式如下:

(17)

式中,α为线性回归模型的参数,由非负系数最小二乘算法估计[20];LR(·)为线性回归函数。

在对一个新的样本xm进行预测时,需要计算式(17),然后将其预测为LRj(xm)具有最大值的类,即

(18)

2.2 故障诊断实现方法

基于MO-ESDAE的行星齿轮箱故障诊断方法实现流程见图4。

图4 基于MO-ESDAE的行星齿轮箱故障诊断流程图Fig.4 Flow chart of planetary gearbox fault diagnosis based on MO-ESDAE

3 实验及结果分析

3.1 实验方案

本实验采用的行星齿轮箱传动系统故障诊断综合试验台见图5,其中,行星齿轮箱与定轴齿轮箱均为两级结构,行星齿轮箱参数见表1。实验中设置了4种太阳轮故障模式:磨损、裂纹、切齿和断齿,见图6。在行星齿轮箱外部安装加速度传感器用于检测振动信号,原始振动信号的时域波形和频谱见图7。

图5 行星齿轮箱实验平台Fig.5 Planetary gearboxes transmission system experiment platform

齿数第一级第二级齿圈100100行星轮(个数)40(3)36(4)太阳轮2028

图6 行星齿轮箱中典型故障模式部件Fig.6 Typical faulty components of planetary gearboxes

图7 5种状态模式下各振动信号的时域图和频谱Fig.7 Time domain diagram and frequency spectrum of vibration signals under five state modes

实验中,正常与故障情况下设置了9种变速变载工况:转速分别取1 200 r/min、2 400 r/min和3 600 r/min,负载分别取0、20 N·m和40 N·m,每种工况下振动信号连续采集时间为90 s,样本个数均为765,即共采集了3 825个行星齿轮箱样本数据。随机选取每种健康状况下665个样本作为训练集,训练集样本数为3325,剩余500个样本作为测试集。为了模拟行星齿轮箱噪声干扰下的运行环境,对在实验室环境下采集的原始振动信号随机添加国际通用噪声库NoiseX-92的机舱噪声,信噪比为-5 dB。

3.2 故障诊断结果

3.2.1 SDAE多样性故障特征提取结果的分析

通过SDAE多样性故障特征提取模型得到了一组多样性MO-SDAE。基于MOEA/D的SDAE参数多目标寻优结果见图8,圆圈圈出的解为以最高准确率偏差在2%为基准选取的5个MO-SDAE,其参数见表2。

图8 基于MOEA/D的SDAE参数优化结果Fig.8 Parameters optimization result of SDAE based on MOEA/D

模型第二层隐含层神经元节点数n加噪比例pMO-SDAE15110.51MO-SDAE25320.54MO-SDAE35390.54MO-SDAE45070.62MO-SDAE54930.63

为了验证MO-SDAE的特征提取能力和诊断性能,将MO-SDAE与SDAE进行分析比较。其中,SDAE的网络结构设置为2 000-1 000-500-5,加噪比例设置为0.1。三种深度学习网络第二层的隐含层神经元节点输出值见图9,即深度学习网络自动提取的故障特征。可以看出,经过稀疏性目标优化完成的MO-SDAE1和 MO-SDAE5所自动提取的故障特征最稀疏,远低于SDAE,这种稀疏特征更能有效地表达数据的本质特征,提高故障特征的泛化能力。从MO-SDAE1和MO-SDAE5的故障特征分布也可以发现,多样性MO-SDAE自动提取的特征满足差异性和多样性。三种深度学习网络的故障诊断结果见表3。SDAE未经过优化训练,其诊断精度低于MO-SDAE。MO-SDAE1的诊断性能最佳,在训练集上的分类准确率达到100%,在测试集上的分类准确率达到97.2%,优于SDAE的表现。综合图9和表3的结果,MO-SDAE的诊断性能优异,可以提取出相对较稀疏的故障特征,故障诊断精度更高。

表3 三种深度学习网络的故障诊断准确率比较

图9 三种深度学习网络自动提取的故障特征稀疏性比较Fig.9 Comparison of fault feature sparsity among three deep learning networks

3.2.2 MO-ESDAE和MO-SDAE诊断性能的比较

为比较信息融合后得到的集成分类器MO-ESDAE与单一分类器MO-SDAE的诊断性能,采用BootStrap随机重采样样本,分别进行10次故障诊断实验,得到故障分类准确率的统计盒图,见图10。由图10可知:

图10 集成分类器和单一分类器的诊断精度比较Fig.10 Comparison of classification accuracy between MO-ESDAE and different MO-SDAEs

(1) 在诊断精度方面,相比单一MO-SDAE,集成分类器MO-ESDAE的诊断精度得到进一步提高,最高达到98.6%,平均诊断率达到98.2%;而单一MO-SDAE的最高诊断精度为97.2%,平均诊断率为94.0%~95.9%。说明MO-ESDAE能更准确地映射出样本与行星齿轮箱不同健康状况之间的关系。

(2) 在诊断稳定性方面,MO-ESDAE的分类稳定性更好,分类准确率的分布最紧密,输出波动范围最小,其分类准确率的极差仅为1%,优于MO-SDAE的分类准确率极差1.6%~2.8%。集成学习分类器MO-ESDAE的故障诊断结果更可靠。因此,利用集成学习进行决策层信息融合,在故障分类准确率与分类稳定性方面,集成分类器MO-ESDAE均优于单一分类器MO-SDAE。

3.2.3 MO-ESADE和其他方法诊断性能的比较

设计了MO-ESDAE方法与其他常用机器学习方法的诊断性能对比实验。对比方法包括深度学习网络中SDAE,浅层学习网络中BPNN,SVM与极限学习机(extreme learning machine,ELM)等多种故障分类判别网络。SDAE的隐含层的神经元节点数设置为2000-1000-500-5,加噪比例为0.1。BPNN的隐含层节点数设为20。SVM选择径向基函数,采用交叉验证的方法优化核函数参数和惩罚因子。ELM隐含层神经元个数为100。测试数据方面,深度学习网络采用行星齿轮箱加噪数据集的频谱直接作为输入信号,浅层学习网络难以处理高维大样本数据,采用手动提取的时域、频域、时频域共39个特征构成输入信号[21-22],这些故障特征全面反映了故障信息。本实验同样采用BootStrap随机重采样构成测试样本,进行10次故障诊断实验。实验结果见表4。可以看出:深度学习网络的故障诊断性能普遍优于浅层学习网络,说明基于深度学习的故障诊断方法可以有效地从行星齿轮箱振动信号频谱自适应提取故障特征并完成故障分类,在故障诊断能力方面更具优势。在所有机器学习方法中,本文方法的故障诊断能力最强,其平均分类准确率可以达到98.2%,分类准确率极差为1%,标准差为0.3%,均优于其他机器学习方法。

表4 不同故障诊断算法的性能比较

为了进一步验证本文方法的有效性,比较不同样本数量下以及不同噪声情况下提出方法与其他机器学习方法的故障分类准确率,实验结果分别见图11和图12。从图11中可以看出,深度学习网络的诊断性能与训练样本量的大小有关,训练样本量越大,深度学习网络的分类准确率越高。而浅层学习网络随着样本量的增加,其分类准确率没有太大变化。这说明相比于浅层学习,深度学习更能从大量数据中挖掘出深层信息,高效、准确地诊断出行星齿轮箱健康状态,在大数据时代,基于深度学习的故障诊断方法更具优势。另外,不同样本规模下,MO-ESDAE方法的分类准确率最高。

图11 样本数量变化对6种故障诊断模型诊断结果的影响Fig.11 The fault diagnosis results of six methods under the different number of samples

图12 信噪比变化对6种故障诊断模型诊断结果的影响Fig.12 The fault diagnosis results of six methods under the different SNR

由图12可知,随着信噪比的降低,各诊断算法诊断性能均有所下降,然而所提出方法在-10~0 dB的强噪声干扰下,依然能取得较好的诊断性能,且分类准确率在对比算法中最高,验证了本文方法对噪声的鲁棒性强。结合表4的实验结果,证明基于MO-ESDAE的行星齿轮箱故障诊断方法进一步提高了深度学习网络方法的诊断精度,同时其抗噪能力强,稳定性高,诊断结果更可靠。

4 结论

(1) 基于MOEA/D利用SDAE多样性故障特征提取模型得到一组多样性MO-SDAE,提取出的故障特征满足多样性和稀疏性。

(2) 通过决策层信息融合,构建了集成分类器MO-ESDAE,其故障诊断能力远高于单一深度神经网络分类器和浅层神经网络分类器。

(3) 本文提出的基于MO-ESDAE方法的行星齿轮箱故障诊断方法的诊断准确率高、稳定性及抗噪声干扰能力强、泛化性能好。

猜你喜欢
齿轮箱特征提取分类器
风电齿轮箱轴承用钢100CrMnSi6-4的开发
CJ-1型齿轮箱箱体强度分析
基于朴素Bayes组合的简易集成分类器①
基于特征选择的SVM选择性集成学习方法
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
基于Daubechies(dbN)的飞行器音频特征提取
基于差异性测度的遥感自适应分类器选择
基于伪故障信号的齿轮箱故障诊断方法