基于改进MPE与KELM的滚动轴承故障诊断

2022-03-09 05:37顾杰斐卢立新
噪声与振动控制 2022年1期
关键词:维数特征提取尺度

赵 云,宿 磊,李 可,顾杰斐,卢立新

(1.江南大学 江苏省食品先进制造装备技术重点实验室,江苏 无锡214122;2.江南大学 机械工程学院,江苏 无锡214122)

滚动轴承作为机械设备中应用广泛且容易出现故障的核心部件,对机械的运转有着至关重要的意义。提取滚动轴承振动信号故障特征频率能有效实现其故障检测,但滚动轴承多数工作在强噪声环境下,故障信号时常淹没于噪声中导致振动信号信噪比较低,难以有效区分某些频率特征,当滚动轴承发生故障时对所采集到的非平稳非线性信号进行特征提取十分困难。

迄今为止,已有多种特征提取方法实用于滚动轴承并取得了良好效果。在传统分析方法中,基于信号平均值的时域参数分析、频域分析以及倒谱分析等在故障诊断中被普遍使用。为提高故障诊断的准确性,众多时频域方法应时而生,譬如小波分析、稀疏分解等方法受到了广泛关注。吴雅朋等[1]利用小波分析与基于负熵的独立分量分析实现滚动轴承含噪振动信号处理。张晗等[2]将稀疏分解逐级匹配形态分析方法用于航空发动机轴承故障信号中谐波和冲击成分的分离。然而,小波变换由于小波基函数的有效选择较为困难;稀疏分解虽具备较强分解能力但存在过度依赖原子库的选取且计算复杂度较高,对于多种复合故障类型的定性分析能力也较弱。以上方法对于复杂非平稳非线性特性振动信号的处理显得力有不逮,因而愈来愈多非线性分析方法应运而生,如关联维数、近似熵以及排列熵等。排列熵(Permutation entropy,PE)用于检测一维时间序列单个尺度下的随机性和复杂度[3],抗噪能力强且算法简单,但较难获取表现于其他尺度中的信息。为衡量时间序列多个尺度下复杂性变化,Aziz等[4]提出了多尺度排列熵并得到广泛应用。王余奎等[5]提出一种衡量MPE变化趋势的偏均值指标,对液压泵信号的分析验证了该指标的优良性。陈哲等[6]利用MPE算法对舰船辐射噪声进行分类识别,效率明显高于采用的其他特征提取算法。董治麟等[7]使用复合多尺度排列熵表征轴承故障信息,该方法优化了MPE的粗粒化过程。陈东宁等[8]以变分模态分解各模态分量MPE的均值为特征向量并采用GK模糊聚类使滚动轴承故障达到了较优的分类性能。

MPE 算法具有许多优点但容易受其参数的影响,参数设置不合理将使计算结果产生较大误差。在重构相空间过程中,时间延迟与嵌入维数两参数有单独与联合确定两种观点。在重构相空间过程中单独确定时间延迟与嵌入维数两参数的方法存在计算量大等缺点[9]。进行有限数据长度时间序列分析时无法预知序列是否具有非线性特征,而嵌入维数与时间延迟之间不可避免可能存在相关的关系。Kim等[10]提出的关联积分法能实现对时间延迟与嵌入窗的同时估计,计算量远小于参数单独确定的方式。郑近德等[11]提出一种基于MPE 与支持向量机的故障诊断方法,对排列熵参数选取进行分析,通过计算高斯白噪声在限定时间序列长度不同维度下排列熵的差值大小决定最终数据长度值。

滚动轴承故障诊断的关键在于模式识别。极限学习机(Extreme learning machine,ELM)相比于支持向量机与BP神经网络等方法,具备更强的学习和泛化能力,但输入权值与阈值的随机初始化可能会导致模型不稳定[12]。Huang[13]提出的核极限学习机KELM 通过引用核函数使核映射代替了随机映射,算法的分类与泛化能力明显增强。敦泊森等[14]使用萤火虫算法对KELM进行参数优化。杨锡运等[15]利用粒子群算法优化KELM 输出权值,所得模型能准确高效地实现对风电功率的区间预测。

综合以上分析,本文在前人理论研究的基础上提出基于参数优化MPE 与KELM 相结合的故障诊断方法。首先使用关联积分法优化MPE 参数中的嵌入维数与时间延迟,确定MPE 的最优参数,实现滚动轴承故障特征提取。为提高故障诊断效率,利用KELM 算法对滚动轴承振动信号进行分类识别。通过实验验证了优化参数后的MPE 算法具有更好的故障特征提取能力,与KELM 相结合能有效实现轴承的故障诊断。

1 基于改进MPE的故障特征提取

1.1 多尺度排列熵

当信号的非线性越强时,信号的规则性随之减弱,复杂程度却逐步升高。信号复杂性越大通常所对应的排列熵也会增大,MPE从多个尺度表征时间序列的复杂度特征,以下为具体计算方法。

对一维时间序列X={xi,i=1,2,…,N}进行粗粒化得到不同尺度的子序列:

式中:N是时间序列长度;s为尺度因子,s=1,2,…,s=1时上述序列表示原始序列,[N/s]表示取整。

以合适的时间延迟τ与嵌入维数m进行相空间重构:

式中:l表示重构矩阵Y(s)l中对应的第l个重构分量,l=1,2,…,N-(m-1)τ;对重构分量中各元素依照公式(3)进行升序排列得到表示各重构分量元素所在列的索引j1,j2,…,jm。

显然,对于任意的重构分量可得到符号序列D(r)=(j1,j2,…,jm),r=1,2,…,R且R≤m!,统计出现的概率Pr(r=1,2,…,R),定义多尺度下子序列的排列熵:

当Pr=1/m!时,Hp(m)取得最大值ln(m!),对其进行归一化处理:

因此,0 ≤Hp≤1,若Hp越小,时间序列越规则,否则越接近随机[16]。

计算MPE的过程中,参数值的选取和设定对结果影响较大。m太小使重构序列包含状态过少,难以有效检测序列动力学突变[17]。m取值太大则会直接影响计算效率,无法反映序列微弱变化。s决定时间序列粗粒化程度,取值过小致使无法有效提取故障特征,s过大则难以区分信号之间的复杂度差异。N与τ也会对计算结果产生影响,因此,对MPE的参数进行优化选择使得能够更加有利于提取滚动轴承的故障特征信息尤其重要。

1.2 关联积分法优化MPE

对于时间序列{xi,i=1,2,…,N}重构相空间中的点Xi,定义嵌入时间序列的关联积分方程为:

其中:r为参考半径且r>0,τ为时间延迟,m是嵌入维数,M=N-(m-1)τ,θ(a)为阶跃函数,如下式所示:

关联积分为相空间中任意点对间距离小于r的点对数量占点对总数的比例,以矢量之差的无穷范数表示点之间的距离。将{xi,i=1,2,…,N}分成τ个不相交的序列,计算检验统计量:

采用分块平均策略定义子序列为:

当N→∞上式写作:

若相空间点独立分布且满足条件N→∞,对于任意r值S(m,r,τ)=0,然而真实数据长度有限且各序列存在相关关系,则使得S(m,r,τ)≠0。最优时间延迟τd取S(m,r,τ)首次经过零点或者对所有r变化最小的点,此时的点接近均匀分布。定义r的最大偏差变量为:

当N≥500 时,取m=2,3,4,5,ri=iσ/2,σ为时间序列标准差,i=1,2,3,4。计算以下统计量:

通常确定(τ)的首个零点或者(τ)的第一极小值为最佳时间延迟,Scor(τ)最小值对应横坐标为最佳嵌入窗宽τω,由下列公式得到:

2 核极限学习机

2.1 极限学习机

ELM算法源自单隐含层前馈神经网络,以xi和yi表示结构网络的输入与输出,输入层、隐含层、输出层的神经元数目分别为n、l和m。bi是隐含层神经元的阈值,输入层与隐含层、隐含层和输出层之间的连接权值对应为ωi和βi。

假设对于样本容量为Q的训练集(xi,ti),其中xi∈Rn,ti∈Rm,T为期望输出,以g(x)表示隐含层神经元激活函数,则输出表达式:

当前馈神经网络以零误差逼近于Q个样本时,,简化得到:

其中:H表示为隐含层输出矩阵,详细表达式为:

在求解伪逆矩阵H+=HT(HHT)-1时,HHT常表现出非奇异。引入惩罚系数C,使HHT特征根偏离零值,其中I为对角矩阵,求得最终权值:

得到ELM的输出模型:

其中:h(xi)为隐含层输出,xi为Q的第i个样本。

2.2 核极限学习机

为提高ELM模型泛化能力,引入核函数将输入样本映射到高维特征空间,以解决低维线性不可分的问题[13]。用核矩阵代替ELM的随机矩阵:

由式(19)、式(20)和式(21)计算得到KELM 的输出:

本文选择的高斯核函数表达式如下:

3 基于MPE与KELM故障诊断方法

本文以MPE作为特征参量,首先使用关联积分法优化选取MPE的嵌入维数与时间延迟,将优化后的参数设置为MPE的参数,计算滚动轴承正常和故障状态下的多尺度排列熵值。最后根据所得的多尺度排列熵提取特征向量,选取部分样本为训练样本,其他作为待识别的测试样本,以此实现滚动轴承的故障分类识别。如图1所示。该图为基于MPEKELM方法的故障诊断过程。

图1 MPE-KELM故障诊断系统流程

4 试验验证

为验证本文方法的有效性,采用如图2所示实验平台采集到的滚动轴承振动信号进行验证。

图2 滚动轴承故障诊断实验平台

如图3所示。采用线切割加工技术在滚动轴承上布置细微伤痕模拟各自对应的故障类型。故障直径为0.3 mm,深度为0.05 mm,通过磁铁吸盘将接触式HD-YD-221 型加速度传感器吸附在被测量的机械装备上,采集各状态的加速度振动信号,采样频率设定为50 kHz,转速为1 000 r/min。

图3 滚动轴承故障类型

如图4所示,NO、OF、IF、RF分别表示滚动轴承正常、外圈故障、内圈故障以及滚动体故障振动信号时域波形。

图4 滚动轴承振动信号时域图

计算各状态振动信号排列熵需要选定相关参数,其中参数m对结果的影响较大。Bandt 等[3]建议m取3~7,嵌入维数m决定相空间的维数,选取太小会影响算法检测突变性能的能力,选取过大直接降低计算效率。时间序列长度N通常应满足N≥5m![18],才能得到有效的计算结果,尺度因子s的最大取值通常大于10。时间延迟τ对排列熵值计算结果影响较小。因此,选取一组如下经验参数[19](m=6,τ=1,s=12,N=2 048),用EMPE 表示在该参数下滚动轴承正常与各种故障状态下的排列熵值,如图5所示。滚动轴承各种状态下的复杂度不同,从图中可看出各种故障状态下的排列熵值波动强度也不相同,但由于环境噪声干扰使得各状态下特征值区分度不明显,各状态下某些尺度排列熵值相差不大,不能有效区分特征。因此直接将经验参数设定为MPE 的参数难以有效提取滚动轴承的故障特征。

图5 使用经验参数计算的排列熵EMPE

采用关联积分法对排列熵的嵌入维数m和时间延迟τ进行优化,然后在得到最优参数的基础上计算正常振动信号各尺度下的排列熵。利用关联积分法联合确定m与τ的规则,设置计算过程中最大时间延迟τ=100,得出Sˉ(τ)、ΔSˉ(τ)和Scor(τ)与τ的关系如图6(a)所示。ΔSˉ(τ)第一极小值确定的延迟时间稳定性更强[3],因此本文以此确定最优延迟时间。图6(a)中(τ)第一极小值对应的最佳延迟时间τ=4,Scor(τ)最小值对应的τ为最佳嵌入窗宽τω=22,由公式(15)可求得嵌入维数m=6。同理,使用关联积分法计算其他故障状态下对应的优化后m与τ。图6中C-CNO,C-COF,C-CIF,C-CRF分别表示滚动轴承正常、外圈故障、内圈故障与滚动体故障振动信号计算所得的(τ)(τ)和Scor(τ)的变化曲线。为减小在参数优化时所产生的不稳定性误差,通过10次运算取整得到参数的平均值,具体优化后的参数m与τ如表1所示。

图6 各状态下(τ)、(τ)和Scor(τ)的变化曲线

表1 关联积分法优化后参数m和τ

设定正常与各种故障状态下优化后的参数为MPE 的参数,计算优化后各尺度下的PE 值,以CMPE表示图7优化后计算所得的排列熵。

将图7与图5对比可以明显看出,在描述多尺度信号的复杂度时,经由参数优化后计算所得到的排列熵可以更好地区分滚动轴承的故障类型,无交叉混叠现象。尺度因子s的增大会使排列熵值总体呈下降趋势,由此表明粗粒度序列的复杂度和随机性将随着s增加而逐渐降低。计算结果具有更强的稳定性。

图7 关联积分法优化参数m和τ后的排列熵CMPE

以参数优化后多尺度排列熵的值作为特征参量,结合KELM算法对滚动轴承故障进行分类识别。由于各状态下的排列熵在前几个尺度已表征出信号的主要信息特征,因此选取滚动轴承4种状态下前8个尺度的PE 值[11],以T表示对应的特征向量,即T=(PE1,PE2,PE3,PE4,PE5,PE6,PE7,PE8)。同时,计算滚动轴承各状态振动信号时域统计量波形指标、峰值指标、脉冲指标、裕度指标、偏斜度指标以及峭度指标组成特征向量T2。每种状态计算120 组样本数据,以标签1表示滚动轴承正常振动信号,标签2~4分别对应外圈故障、内圈故障和滚动体故障振动信号。选定前60组特征向量数据为训练样本,利用后60组数据对训练模型进行测试。得到采用经验参数与优化参数进行多尺度排列熵特征提取、时域统计量特征提取后结合KELM进行故障识别3种方法的诊断结果,以EMPE-KELM、CMPE-KELM与TD-KELM分别表示所得分类诊断结果。

如图8至图10所示,符号“●”与“ ”两者的中心重合则说明识别故障类型结果与实际滚动轴承状态一致,两者分离则表示识别结果与实际情况不符,最终诊断结果如表2所示。由于滚动轴承几种故障振动信号的复杂度差异较小,导致正常状态的排列熵值与故障状态区别不显著,正常状态下样本也被错分到其他类别中。表2中由于滚动轴承各状态时域统计特征指标相近导致其诊断率相比前面两种方法较低,TD-KELM方法故障诊断正确率仅89.58%,由此表明多尺度排列熵特征提取能力强于时域指标统计分析。

图10 TD-KELM测试样本故障分类结果

由图8和表2可知,EMPE-KELM 方法中标签2与标签3相互错分明显,图5中使用经验参数计算所得两种故障状态下的排列熵值接近。因此使用KELM 进行故障分类时容易导致标签误判,EMPEKELM 方法的故障识别正确率为93.33%。经过参数优化后计算得到的排列熵具有较强的区分性,CMPE-KELM 方法中仅有标签3 中的4 个样本被错分到第1 类,其余外圈与滚动体故障样本均被完全识别,故障识别正确率为97.50%。因此,利用关联积分法优化MPE 参数进行特征提取后使用KELM方法具有更好的诊断效果。使用CMPE-KELM 对滚动轴承故障诊断的正确率大于EMPE-KELM诊断的正确率,说明CMPE-KELM 相比于EMPE-KELM故障诊断准确性更高。

表2 故障分类结果

图8 EMPE-KELM测试样本故障分类结果

图9 CMPE-KELM测试样本故障分类结果

为验证KELM 故障分类的高效性,对比分析在相同特征提取条件下几种不同分类方法的最终识别率,得到表3与图11 所示结果,图中TD、EMPE、CMPE分别表示使用时域统计特征、经验参数MPE,优化参数MPE 进行特征提取,SVM、PNN、ELM、KELM分别表示使用支持向量机、概率神经网络、极限学习机、核极限学习机的故障分类方法,SVM 方法中核函数类型为高斯核函数,惩罚因子C与核函数参数σ通过交叉验证的方法确定。图中方法所得诊断率均取10 次平均值。

表3 故障诊断正确率/(%)

图11 测试样本故障分类结果

对比图中同一种分类方法,基于复杂度的非线性特征提取方法诊断率高于时域统计特征方法,其故障特征提取能力更强。其中,CMPE 相比于EMPE进行特征提取效率更高,再次说明改进优化参数后特征提取能力更强。对比同一种特征提取方法,以KELM 作为分类器的方法具有最高的诊断率,以此说明KELM分类的有效性。

5 结语

本文采用关联积分法对MPE 中嵌入维数与时间延迟两个参数进行优化,将经过参数优化后的多尺度排列熵应用于滚动轴承故障特征的提取,采用SVM、PNN、ELM、KELM 方法对具有多种故障类型的滚动轴承故障信号进行模式识别。对比以TD、EMPE 为特征的分析方法,通过分析滚动轴承实验平台采集到得正常与各种故障状态下的数据,试验结果表明基于复杂度的MPE 方法相比传统时域统计方法能更有效实现特征提取。参数优化后的MPE 与KELM 相结合的滚动轴承故障诊断精度高于采用经验参数计算所得结果。

当前排列熵时间序列长度的有效确定较为困难,相关研究甚少,多数情况下仍然依靠经验选择。为进一步减少人为因素对排列熵参数选取的干扰,下一步将对排列熵时间序列长度进行优化。

猜你喜欢
维数特征提取尺度
修正的中间测度和维数
一类平面数字限制集的维数
含非线性阻尼的二维g-Navier-Stokes方程全局吸引子的维数估计
财产的五大尺度和五重应对
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
基于Daubechies(dbN)的飞行器音频特征提取
宇宙的尺度
9