基于KPCA信息融合与随机森林的中介轴承故障诊断方法

2019-12-10 02:44艾延廷孙志航
沈阳航空航天大学学报 2019年5期
关键词:决策树分量故障诊断

艾延廷,孙志航,田 晶,许 鹭,王 志

(沈阳航空航天大学 辽宁省航空推进系统先进测试技术重点实验室,沈阳 110136)

中介轴承广泛应用于航空发动机双/三转子系统的轴间支承方案。不同于传统滚动轴承,中介轴承工作时内外圈同时转动,且润滑困难,导致故障率较高。中介轴承一旦出现故障,将对航空发动机安全运行造成极大威胁。由于中介轴承故障源到位于机匣的传感器安装位置传递路径长,微弱的故障信号极易淹没在背景噪声中,使早期故障诊断十分困难[1]。因此,及时、准确的诊断出中介轴承故障具有重要的理论及实际意义[2]。

与振动信号相比,声发射信号具有频率范围宽、特征明显、对冲击敏感等优点,因而在滚动轴承故障诊断中开始受到重视[3]。由于受高、低压转子不平衡、不对中及动力学耦合的影响,采集的声发射信号具有较严重的非线性、非平稳特征,导致中介轴承故障信号特征提取极为困难。集成经验模式分解(EEMD)是一种处理非平稳信号的时频分析方法,它将信号中不同特征尺度的冲击或趋势逐层分离出来,降低了特征信息间的耦合,进而削减了非周期信号干扰[4]。近年来,信息熵作为一种信息融合方法发展迅速,被广泛应用于机械故障诊断领域[5-7]。由于中介轴承故障信号复杂且微弱,单一类型的信息熵在提取故障特征时难以体现其优越性。不同故障类型的故障特征间存在很强的非线性关系,故障特征向量间的模糊性和重叠性影响诊断的准确性和稳定性。KPCA是一种融合降维方法,并具有强大的非线性处理能力。在两种信息熵融合方面,已经得到了应用,在保证信息不损失或损失较少的前提下,减轻了计算负担[8-9]。随机森林由Leo Breiman和Adele Cutler提出[10],在学习器训练过程中进一步引入了随机属性选择。随机森林在计算量没有显著增加的前提下,提高了准确率并能对缺失数据具有良好的兼容性,在信号特征分类中具有突出优势。

本文利用EEMD处理非线性信号的优势进行信号处理,将采集的声发射信号分解成多个IMF分量。首先,采集多种典型故障中介轴承的声发射信号,采用集成经验模式分解法(EEMD)将其分解为多个窄带内蕴模式分量;其次提取各IMF分量的样本熵及奇异熵,应用KPCA将两种熵特征融合降维,形成维度缩减的特征矩阵;然后提取一部分特征矩阵作为样本训练多个学习器,以随机森林为模型将其集成整合,建立多类分类器;最后,将另一部分特征矩阵作为测试样本验证分类器的泛化性能。本文提出并建立的中介轴承故障诊断方法具有很好的诊断效果。

1 集成经验模式分解

集成经验模式分解(Ensemble Empirical Mode Decomposition,EEMD)是对经验模式分解(EMD)的改进,将信号分解为表征时间尺度的内蕴模式分量(intrinsic mode function,IMF)。从本质上讲,EEMD方法是将信号中不同尺度的波动或趋势逐步分解出来,是对时间序列进行平稳化处理的过程。通过叠加随机高斯白噪声,消除非周期信号的干扰,与单次EMD分解相比,可以更准确地揭示数据的真实物理意义[11]。研究表明,EEMD 可以有效抑制EMD中的模式混淆问题[12]。

2 故障特征提取

样本熵(Sample Entropy,SampEn)是一种时间序列复杂性的测试方法,是对近似熵算法的改进,并成功应用在轴承故障状态监测上[13]。奇异熵(Singular Entropy,SingEn)是一种分析信号频率组成及各频率分布特征的方法[14]。分别提取轴承信号时域的样本熵及频域奇异熵,用以表征中介轴承故障信号的时频信息。

3 基于KPCA的特征融合降维

目前没有一种熵特征能够准确完整的提取信号的时频特征[15],因此,需要对故障特征向量融合、降维来得到更有效表征轴承运行状态的融合特征。KPCA是基于特征抽取的降维方法,是PCA法在非线性领域的一种推广,适用于解决非线性特征提取问题[16]。

给定一组M个样本数据x1,x2,,xn∈Rn,利用非线性函数将该数据从低维数据特征空间映射到高维空间,KPCA算法如下:

(1)

(2)求解核矩阵K。首先选择适当的核函数,将高维数矩阵映射到函数空间F,其中,使用的核函数为径向基核函数

K(xi,xj)=[b·s(xi,xj)+c]d

(2)

(3)修正核矩阵K。用于修正核矩阵K的中心化核矩阵Kc,使得矩阵K中心化,其公式

Kc=K-lNK-Kln+lNKNlN

(3)

其中,lN为N×N矩阵,每个元素为1/N;

(4)计算协方差矩阵Kc的特征值。计算出的特征向量为λ1,λ2,,λn,其特征值对应的特征方差为v1,,vn,求得的特征值向量要进行调整,按降序排列

λV=CV

(4)

(5)特征向量正交化处理。对求得的特征向量通过施密特正交化处理,正交化并单位化处理特征向量。计算特征值累计贡献率r1,,rn,根据设定的累计贡献率要求P,使得rt≥P,选取其前t个主分量a1,,at,作为降维后的数据,累计贡献率计算公式

(5)

4 随机森林

随机森林(random forests,RF)算法是一种基于决策树的组合分类器思想的机器学习算法,克服单分类器的局限性,旨在提升机器学习稳定性和准确性的集成学习算法,该方法克服了决策树的过拟合、分类规则复杂等缺点[17]。

随机森林算法流程如图1所示(设样本属性个数为M个,m为大于零且小于M的整数):

(1)从特征矩阵H中分出训练集样本X和测试集样本Y;

(2)依据Bootstrap重采样法从训练集样本X中无权重的随机抽取需要训练样本,产生对应的训练集Train tree 1,Train tree 2,Train tree ,Train treen;

(3)利用Random subspace随机选取m(m

(4)利用决策树对测试样本Y进行投票识别,汇总各决策树输出结果,以所有决策树输出最多的类别结果作为测试样本Y的故障类别。

5 基于EEMD的KPCA-RF中介轴承故障诊断方法

本文提出的基于KPCA-RF的中介轴承故障诊断方法如图2中所示:

图1 随机森林流程图

图2 技术路线图

(1)确定高低速转子转速和载荷等实验工况,分别采集不同故障类型的中介轴承声发射信号;

(2)对声发射信号先进行小波降噪,提高信号的信噪比,用EEMD方法将声发射信号在时间尺度内分解成若干频段的内蕴模式IMF分量;

(3)提取内蕴模式分量IMF的奇异熵特征矩阵Q和样本熵特征矩阵S,组合为特征矩阵H,其中H=(QT,ST)T;

(5)将融合特征矩阵输入随机森林中,分为训练样本和测试样本两部分,对训练样本进行训练,并产生决策树用于故障分类识别,得到决策树投票结果,最后根据随机森林的决策结果进行故障诊断。

6 实验结果与分析

6.1 实验数据获取

图3为双转子航空发动机中介轴承故障模拟实验台。实验台主要由高速转轴、低速转轴、机匣、载荷加载系统、滑油系统、水冷系统、电气控制系统、压缩空气系统和排雾系统等组成。实验台最高转速为20 000 rpm,可施加20 kN径向载荷,两转子可同向或反向旋转。

图3 中介轴承试验台

实验中传感器为R15声发射传感器,测点位置选择在机匣的主轴径向方向,实验信号由PAC公司Express8声发射系统采集。

实验所用中介轴承为某型涡扇发动机中介轴承。实验中轴承故障分为4种类型:外圈划伤轴承、内圈麻点与划伤轴承,滚动体剥落轴承和正常轴承,如图4所示。

6.2 EEMD分解结果

以外圈故障轴承为例,工况为外圈转速12 000 r/min、内圈转速7 000 r/min、载荷4 900 N、采样频率为1 MHz。中介轴承声发射信号经过EEMD分解为IMF分量,声发射信号和imf1~imf7分量的时域波形如图5所示。

图4 实验所用的中介轴承

图5 声发射信号和IMF分量的时域波形图

由图5可见,EEMD分解后,其中imf1分量幅值在所有IMF分量中最高、信号成分最丰富,imf1~imf7分量幅值逐渐降低,包含故障信息越来越少;声发射信号在EEMD分解前周期性冲击信号特征并不明显,而imf3~imf7分量中存在周期性冲击特征,但肉眼很难识别。

由图6可见,imf1频率成分在imf1~imf7中最高,imf1~imf7的频率成分依次降低,频率越来越窄。EEMD分解将轴承故障特征信息按照频率高低分解到IMF分量中,但特征依然并不明显。

6.3 故障特征提取与分析

声发射信号经EEMD分解信号为IMF后,通过分别计算IMF的样本熵值和奇异熵值来提取故障特征。不同故障类型的样本熵值和奇异熵值的对比结果如图7所示(从左到右,从上到下依次对应外圈故障、正常轴承、内圈故障和滚动体故障)。

图6 声发射信号和IMF分量的频域波形图

从图7中发现,不同故障类型的两种熵特征值是不相同的,但是特征值减小的整体趋势是一样的,说明用不同的标准衡量一个信号的复杂程度是不一样的,但是大体趋势是一致的。奇异熵值描述信号频域复杂程度和分布的不确定性,样本熵值描述信号在时域能量分布和复杂程度。本文根据信息熵融合理论,融合奇异熵和样本熵两种熵特征作为故障特征,加强了故障特征间的互补性,提高了诊断识别率。

6.4 熵特征融合与效果

图8为奇异熵特征、样本熵特征和KPCA融合特征的前3个特征在三维空间的投影。从图8a奇异熵特征和图8b样本熵特征图中发现,不同故障类型熵值具有一定的重叠性,区分度很低,且类聚性较差,但经过KPCA降维融合后,从图8c中发现,4种故障特征很好的分开聚集,区分度高,类聚性强。

图7 内圈故障的样本熵值和奇异熵值

图8 三维空间中熵特征与KPCA融合特征的投影

6.5 随机森林法故障识别分析

为了验证本文所提出的特征提取方法的有效性,利用随机森林法对KPCA融合的轴承故障特征进行训练和识别。作为比较,EEMD熵特征也用随机森林法进行识别诊断。

从图9中看出,当决策树数量在50~1 000范围内时,分类正确率都较高,且数目为150、500、900~1 000时正确率最高。综合考虑决策树棵数影响建模速度与决策时间,本文选取决策树的数量N=500。

图9 决策树数目对分类精度的影响

提取部分标记完成数据的样本熵、奇异熵,并用KPCA将两种熵融合降维,利用随机森林模型训练分类器。利用测试样本测试其正确率,并与融合前样本熵、奇异熵方法比较,最终得到故障诊断率如表1所示。

从表1可知,随机森林对奇异熵特征故障诊断率为67%~82.5%,对样本熵特征的故障诊断率为80.0%~92.5%,诊断率并不高;但随机森林对KPCA融合特征的故障诊断率为95.0%~100%,有很大提高。诊断结果表明,KPCA特征融合的方法能够获得表征中介轴承运行状态的故障特征,较大的提高故障诊断率,同时诊断结果也证明了本文所提的中介轴承故障诊断方法的有效性。

表1 随机森林的识别结果

7 结论

本文针对中介轴承声发射信号信噪比低、非线性强、故障特征不易提取的难题,提出了基于核主元分析(KPCA)与随机森林(RF)相结合的故障诊断新方法,并通过实际发动机中介轴承试验台验证,具有良好的诊断效果。本文研究得到如下结论:

(1)奇异熵值描述信号频域复杂程度和分布的不确定性,样本熵值描述信号在时域能量分布和复杂程度,两者具有一定的重叠性,单独使用时区分度很低,且类聚性较差,但经过KPCA降维融合后具有很好的互补性,其特征矩阵的前3个特征在三维空间的投影体现了强大的聚合性。

(2)对外环故障而言,随机森林对奇异熵特征故障诊断率为67%~82.5%,对样本熵特征的故障诊断率为80.0%~92.5%,但对KPCA融合特征的故障诊断率为95.0%~100%,具有满意的分类诊断效果。

(3)本文提出的基于EEMD分解—奇异熵及样本熵提取—KPCA特征融合—RF分类的故障诊断新方法,具有很好的适用性,为复杂结构、长传递路径下的航空发动机中介轴承微弱故障信号特征提取及诊断提供了一个有效方法。

猜你喜欢
决策树分量故障诊断
基于包络解调原理的低转速滚动轴承故障诊断
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
决策树和随机森林方法在管理决策中的应用
论《哈姆雷特》中良心的分量
数控机床电气系统的故障诊断与维修
基于决策树的出租车乘客出行目的识别
基于模糊关联规则和决策树的图像自动标注
基于肺癌CT的决策树模型在肺癌诊断中的应用
基于LCD和排列熵的滚动轴承故障诊断