基于ICEEMDAN和IMWPE-LDA-BOA-SVM的齿轮箱损伤识别模型*

2023-11-27 02:11张锐丽

机电工程 2023年11期

关键词：齿轮箱特征提取尺度

王洪,张锐丽,吴凯

(1.宜宾职业技术学院智能制造学院,四川宜宾 644003;2.成都理工大学机电工程学院,四川成都 610059)

0 引言

齿轮箱是一种常用的传动系统部件,目前已被广泛应用于汽车、航空航天、化工等领域。由于齿轮箱的结构复杂,并且运行工况不稳定,导致齿轮箱内部的零部件极易发生疲劳失效,导致整个设备的振动,不利于设备的安全运行[1]。

齿轮箱发生故障后,其振动信号中包含大量与故障特征无关的谐波信息,干扰其故障特征的提取[2]。因此,有必要采取信号分解方法对源信号进行处理,以降低噪声的干扰[3]。

高淑芝等人[4]提出了一种基于集成经验模态分解(ensemble empirical mode decomposition,EEMD)的故障诊断方法,采用该方法准确地识别出了滚动轴承的故障信息;然而EEMD的运行效率极为低下,且引入噪声进行辅助分解,会导致分解分量残留部分噪声。为此,肖俊青等人[5]采用自适应噪声完备集成经验模态分解方法,对故障信号进行了处理,结果表明了其效果优于EEMD,故障信号分解得更为精确;然而其分解的信号依然残留少量噪声。针对该问题,李铭等人[6]将改进自适应噪声完备集成经验模态分解(ICEEMDAN)用于处理滚动轴承振动信号,并进行了实验,结果验证了ICEEMDAN的优越性,其能够更好地去除信号中的噪声。

基于此,笔者采用ICEEMDAN来剔除齿轮箱振动信号中的噪声,以减少噪声对后续分析的干扰。

齿轮箱振动信号为非线性的一维数据,通常需要采用基于熵值的非线性分析方法进行处理[7]。常见的熵值分析方法包括样本熵、排列熵、多尺度熵等。排列熵(permutation entropy,PE)具有计算效率高、抗噪性强和性能优异等特点,被广泛用于故障诊断的研究中。

顾云青等人[8]提出了一种基于ICEEMDAN和PE的滚动轴承故障诊断方法,并将其用于轴承故障诊断,诊断结果验证了排列熵的性能;然而PE忽略了信号的幅值信息。为此,ZHOU Shen-han等人[9]将加权排列熵(weighted permutation entropy,WPE)用于表征滚动轴承的健康状态,准确检测和识别了滚动轴承的故障;然而WPE只是进行了单一尺度的分析。YUAN Xu-yi[10]提出了多尺度加权排列熵(multiscale weighted permutation entropy,MWPE),采用MWPE有效提取出了隔膜泵的故障特征;然而MWPE的粗粒化处理依赖于分析数据的长度,造成熵值偏差随着尺度的增加而变大。为此,王振亚等人[11]对粗粒化方式进行了优化,提出了改进多尺度加权排列熵,并将其应用于故障诊断,结果验证了该算法的有效性;但是在分析某些信号时,基于方差改进的加权排列熵可能会失去有效性[12]。

针对上述问题,笔者采用均方根对改进多尺度加权排列熵进行改进,提出另一种形式的改进加权排列熵(IMWPE),以进一步增强算法的特征提取能力;在此基础上,提出一种基于ICEEMDAN信号重构、IMWPE故障特征提取、线性判别分析(LDA)特征降维和蝴蝶优化算法优化支持向量机(BOA-SVM)的损伤识别模型(ICEEMDAN-IMWPE-LDA-BOA-SVM)。

首先,采用ICEEMDAN对样本进行处理,筛选出核心组件,进行故障信号重构;随后,利用IMWPE提取重构信号的故障特征,并采用LDA进行特征的降维;最后,采用基于蝴蝶算法优化的支持向量机SVM进行故障识别。

1 ICEEMDAN信号重构

1.1 ICEEMDAN算法原理

ICEEMDAN利用数据的局部均值来获取k阶模态,能够进一步消除数据中的残留噪声和伪模态,使得分解得到的本征模态函数(intrinsic mode function,IMF)分量具有更清晰的物理意义。ICEEMDAN对信号处理的详细过程可参考逄英等人的研究[13]。

1.2 分量选择原则

相关系数能够准确地刻画IMF分量与原始数据之间的紧密程度,根据相关系数,能够据此保留信息量更多的IMF分量[14]。首先,笔者计算了归一化处理后的原始数据自相关函数,以及各阶IMF分量自相关函数之间的相关系数。

2 改进多尺度加权排列熵特征提取

2.1 加权排列熵算法

排列熵对时间序列的幅值不敏感,对幅值相等的时间序列无法进行有效的区分[15]。

受到基于方差的加权排列熵的启发,笔者采用均方根对排列熵进行改进,提出了加权排列熵的另外一种形式,其原理如下:

(3)

式中:m为嵌入维数;τ为时间延迟。

2)定义各子信号的权重ωi:

(4)

(5)

4)求解信号X的WPE值为:

(6)

2.2 多尺度加权排列熵算法

多尺度加权排列熵能够有效地从多个尺度来表征非线性数据的复杂性。对于信号X={x1,x2,…,xN},多尺度加权排列熵的具体计算步骤如下:

1)对信号进行粗粒化处理,生成粗粒化序列Ys={ys(j)}。

(7)

式中:s为尺度因子。

2)提取不同尺度因子s下,各粗粒化序列Ys的加权排列熵值,则得到MWPE如下:

MWPE(X,m,τ,s)=WPE(Ys,m,τ)

(8)

2.3 改进多尺度加权排列熵

MWPE避免了WPE只能进行单尺度分析的不足,然而原始的粗粒化处理会造成熵值误差随着尺度因子的增加而增大。因此,笔者平均同一尺度下全部粗粒序列的WPE熵值,以避免由于粗粒序列变短而造成WPE熵值突变现象的出现,使得复杂性分析更加准确[16]。

对于信号X={x1,x2,…,xN},改进多尺度加权排列熵的原理如下:

(9)

(10)

当尺度因子为s=3时,传统的粗粒化处理和改进的粗粒化处理如图1所示。

图1 尺度因子s=3时的传统粗粒化和改进粗粒化过程

由图1可以发现:在传统的粗粒化过程中,粗粒序列中的元素数量会随着尺度的增加而变少,导致熵值的不稳定性。此外,传统的粗粒化处理还忽视了部分相邻样本点之间的动态关系,如在图1(a)中,x3和x4之间的信息就被忽略了;反之,在改进的粗粒化处理过程中,在相同尺度因子s下,改进的粗粒化处理能够获得s组粗粒序列,对这些序列进行平均处理,能够有效解决熵值不稳定的问题。

而且改进粗粒化处理通过滑动操作,充分考虑了相邻样本点之间的关系,数据的利用率更高。

IMWPE方法的性能与嵌入维数m、时间延迟τ和尺度因子s有关。m选择得过小,重构向量的长度变短,算法无法有效探测信号的动力学突变;相反,m设置过大,不仅降低计算效率,而且无法有效表征信号的微弱波动。因此,通常设置嵌入维数的取值范围在[4,7],笔者设置为m=5。

尺度因子s的设置没有严格的要求,通常设置为s≥10,笔者设置为s=25。

时间延迟τ对IMWPE的影响几乎可以忽略不计,笔者设置为τ=1。

3 LDA特征降维和BOA-SVM分类识别

3.1 LDA算法原理

LDA算法基于Fisher判别定理,定义子空间J,并将数据向子空间J做投影,生成低维样本作为新的特征样本,进而实现降维的目的[17]。

假定有C个样本类别,而数据X={xi∈Rn,i=1,…,N}则是N个n维的训练样本,则基于Fisher定理对空间J进行定义为:

(11)

(12)

(13)

当Sw非奇异时,广义特征方程的d(d≤C-1)个最大的特征值所对应的特征向量wi即为最佳投影矩阵W的列向量:

Sbwi=λSwwi

(14)

笔者将数据xi向子空间J进行投影,即yi=WTxi,则yi对应低维特征向量。

3.2 蝴蝶优化算法

蝴蝶在飞行时,会在周围散发一种气味,其他蝴蝶闻到该气味后,会基于香味的浓度而被吸引。当某只蝴蝶闻到最佳香味时,会朝着散发气味的蝴蝶靠近,这个过程称为全局搜索阶段;而当蝴蝶无法闻到任何蝴蝶气味时,将在全局搜索范围内随机选择移动位置,这个过程称为局部搜索阶段[18]。

蝴蝶会在飞行时散发气味,定义气味浓度为:

f=cIa

(15)

式中:I为刺激强度;c为感知形态;a为激励系数。

蝴蝶的运动模型包含两个阶段:

1)全局搜索阶段

蝴蝶在飞行中会散发气味,其他蝴蝶会按照闻到的气味浓度来搜索目标,模型定义如下:

(16)

式中:xi(t)为迭代t时蝴蝶i的位置;g*为全局最佳解;r1为[0,1]之间的随机数;fi为蝴蝶i的气味浓度。

2)局部搜索阶段

若蝴蝶缺乏感知其他蝴蝶气味的能力,则它将在搜索范围内随机移动,模型定义为:

(17)

式中:xj(t),xk(t)为任意选择的蝴蝶;r2为[0,1]之间的随机数。

BOA进行全局寻优或局部寻优的概率由阈值P决定,在每次迭代时会随机生成随机数r3,并与P进行对比,定义为:

(18)

4 ICEEMDAN-IMWPE-LDA-BOA-SVM方法

4.1 故障诊断流程

基于上述理论介绍,笔者提出了基于ICEEMDAN信号重构、IMWPE特征提取、LDA特征降维、BOA-SVM模式识别的齿轮箱故障诊断方法。

该方法的主要诊断步骤如下:

1)采集齿轮箱在多个常见工况下的振动信号,并将其分割为长度为2 048的多组样本;

2)采用ICEEMDAN对振动信号进行分解,基于IMF分量选择原则,筛选得到包含主要信息的IMF分量,并进行信号的重构;

3)利用IMWPE提取重构信号的故障特征,并采用LDA进行特征降维,得到低维敏感特征,并将其分为训练样本和测试样本;

4)利用BOA算法对SVM模型中的参数进行优化。其中,对于蝴蝶种群,适应度设置为SVM对训练样本的识别精度;

5)判断是否符合迭代终止条件,若符合则输出最佳参数的(C,g)组合,并将其代入至SVM模型中;

6)将测试样本输入至优化后的SVM模型中,实现故障的识别。

4.2 故障诊断实验

4.2.1 实验平台及数据

为了检验ICEEMDAN-IMWPE-LDA-BOA-SVM方法,笔者采用东南大学的齿轮箱故障数据进行实验。

齿轮箱故障实验平台如图2所示[19]。

图2 齿轮箱实验平台

该平台由驱动电机、电机控制器、行星齿轮箱、平行齿轮箱和制动器等组成。

振动信号由布置在行星齿轮箱表面的振动加速度计以5 120 Hz的频率进行采集。转速和负载分2两种,分别是20 Hz/0 V和30 Hz/2 V,笔者选择30 Hz的振动数据进行分析;每种工况均截取60个长度2 048的样本,其中30组用于训练,剩余30组用于测试。

齿轮箱故障及样本的详细信息如表1所示。

表1 齿轮箱样本的详细信息

齿轮箱振动信号的波形如图3所示。

图3 齿轮箱振动信号波形

4.2.2 结果与分析

首先,为了消除齿轮箱振动信号中的噪声,笔者利用ICEEMDAN对振动信号进行分解,并进行信号的重构。

此处以健康齿轮振动信号为例,其ICEEMDAN的分解结果如图4所示。

图4 健康齿轮的ICEEMDAN分解波形

从图4可以发现:对于健康齿轮的振动信号而言,在经过ICEEMDAN分解后,不同频率成分的特征信息实现了分离,但是高阶IMF分量包含的信息较少,更多的是噪声成分,有必要进行剔除。

为此,笔者基于相关系数,对IMF分量进行重要性评估。

所有样本的相关系数如图5所示。

图5 IMF分量与原始信号的相关系数

经过计算,5种工况样本的相关系数阈值均近似为0.2,因此,笔者根据该阈值选择IMF分量进行信号重构。

从图5可以发现:前两阶IMF分量的相关系数均大于阈值,即这两个分量包含了原始信号的大部分故障信息,因此,笔者选择这两阶分量进行信号重构。

重构信号如图6所示。

图6 齿轮箱重构信号

从图6可以发现:经过信号重构后,部分的冲击成分更加明显(这是因为剔除的IMF分量中包含许多噪声),可见,信号重构有利于突出核心的故障成分。

随后,笔者利用IMWPE提取齿轮箱重构信号的故障特征,得到5种状态下的IMWPE值,如图7所示。

图7 5种状态下的IMWPE值

从图7可知:5种状态下的IMWPE值具有类似的趋势,即熵值随着尺度因子的变化而存在较显著的波动,且在不同尺度下熵值存在明显的交叉重叠,故不能直接将原始的故障特征输入至分类器进行识别。

为了提高特征的准确率,笔者对IMWPE特征进行优化,利用LDA对特征进行可视化降维,提取前2个故障特征进行分类识别。

5种工况样本的LDA降维结果如图8所示。

图8 IMWPE特征的可视化

从图8可知:基于ICEEMDAN-IMWPE提取的故障特征具有比较好的质量,可视化的结果表明,样本5能够实现完全的区分,而样本4、样本2、样本1发生了较明显的混叠,证明这3种样本可能会出现错误识别的样本。

笔者利用BOA方法,对支持向量机中的参数进行优化,随后对测试样本进行识别。

ICEEMDAN-IMWPE-LDA-BOA-SVM的故障识别结果,如图9所示。

图9 ICEEMDAN-IMWPE-LDA-BOA-SVM的故障识别结果

从图9可知:ICEEMDAN-IMWPE-LDA-LDA-BOA-SVM故障诊断方法仅错误识别了一个样本,即将样本3错误识别为样本2,总的准确率为99.33%。

该结果证明,该方法能够较为有效地识别齿轮箱的故障类型,具有一定的应用潜力。

为了验证ICEEMDAN-IMWPE-LDA-BOA-SVM故障诊断方法相对于其他故障诊断方法的优劣,笔者从3个维度开展对比分析。

1)特征提取维度对比

笔者将ICEEMDAN-IMWPE-LDA故障特征提取方法分别与EEMD-IMWPE-LDA故障特征提取方法、IMWPE-LDA故障特征提取方法和ICEEMDAN-IMWPE故障特征提取方法进行比较,利用上述几种方法进行故障特征提取。

笔者将特征输入到BOA-SVM中进行故障识别,识别结果如图10所示。

图10 不同故障特征提取方法的诊断结果

4种方法的详细诊断结果如表2所示。

表2 4种特征提取方法的故障诊断结果

由表2可知:经ICEEMDAN-IMWPE-LDA故障特征识别后的准确率高于EEMD-IMWPE-LDA特征提取方法,ICEEMDAN算法在特征提取效果方面优于EEMD的原因是,EEMD进行信号重构时无法完全去除信号中的噪声和干扰。

ICEEMDAN-IMWPE-LDA和EEMD-IMWPE-LDA的准确率高于IMWPE-LDA,即对信号进行分解和重构的准确率高于对原始信号进行分析的准确率,这是因为原始信号中的噪声会对分析结果造成极大影响。

而ICEEMDAN-IMWPE-LDA的结果高于ICEEM-DAN-IMWPE方法,这是因为LDA特征降维有效去除了冗余信息,突出了核心故障信息,从而提高了识别准确率。

2)熵值方法对比

为了证明IMWPE方法在特征提取中的优越性,笔者利用改进多尺度排列熵(improved multiscale permutation entropy,IMPE)、MPE、多尺度加权排列熵(MWPE)、基于方差的多尺度加权排列熵(multiscale weighted permutation entropy based on variance,MWPE_rms)进行对比,并将采用上述5种方法提取的故障特征经过LDA降维,然后将其输入至BOA-SVM中,进行故障的识别。

笔者重复10次上述操作,得到了故障诊断结果,如表3所示。

表3 故障诊断结果对比

由表3可知:基于IMWPE的故障诊断方法实现了98.47%的平均识别准确率,高于其他4种诊断方法;与其他4方法相比,该方法多次实验的平均识别精度分别高了2.74%、17%、17.14%和16.20%,证明了其具有较好的稳定性;同时,其最小准确率为96.67%,表明其能够稳定可靠地识别齿轮箱的不同故障类型。

3)分类模型对比

为了验证BOA-SVM的可行性,笔者采用常见的遗传算法优化支持向量机(genetic algorithm optimized support vector machine,GA_SVM)、粒子群算法优化支持向量机(particle swarm optimization optimized support vector machine,PSO_SVM)和差分算法优化支持向量机(differential evolution optimized support vector machine,DE_SVM)进行故障诊断对比,得到的诊断结果如表4所示[20-22]。

表4 故障诊断结果对比

由表4可知:相较于其他3种故障诊断模型,基于BOA优化的SVM取得了最高的故障诊断准确率和效率,诊断精度为99.33%,用时5.31 s,比GA_SVM缩短了近三分之二的时间,比PSO_SVM缩短了近一半的时间,说明BOA优化得到的参数最优,同时耗时最少,在故障诊断中最具有优势。

笔者基于多个维度开展了对比实验,结果表明ICEEMDAN-IMWPE-LDA-BOA-SVM方法在效率和准确率方面均具有一定的优越性。

5 结束语

综上所述,笔者提出了一种基于ICEEMDAN信号重构、IMWPE特征提取、LDA特征降维和BOA-SVM故障识别的齿轮箱故障诊断方法,并利用东南大学齿轮箱数据集对其进行了实验,以验证该方法的有效性。

研究结论如下:

1)采用ICEEMDAN对信号进行处理,结合相关系数分量筛选准则能够实现信号的降噪和重构。利用齿轮箱数据集对ICEEMDAN-IMWPE-LDA-BOA-SVM方法进行了验证,得到的故障识别准确率为99.33%,证明了该方法的有效性;

2)在提取故障特征方面,基于均方根的IMWPE特征提取方法优于IMPE、MWPE、MPE和MWPE_rms方法,多次实验的平均识别精度也得到了不同程度的提高;

3)采用BOA对SVM的惩罚系数和核函数参数进行了优化,减小了分类识别的不确定性,增加了分类精度,同时降低了模型的训练时间;与其他3种分类模型相比较,其效率最高,诊断时间只需5.31 s,诊断精度为99.33%,在故障诊断中更具比较优势。

虽然该方法取得了不错的损伤识别结果,但最低识别准确率为96.67%,证明诊断性能存在提升空间。后续,笔者将进一步降低信号中的噪声,提升故障识别精度。