基于EEMD和GA-LSTM算法的行星齿轮故障诊断方法*

2023-11-27 01:52陶浩然潘宏侠徐轟钊
机电工程 2023年11期
关键词:行星齿轮故障诊断

陶浩然,许 昕,潘宏侠,*,王 同,徐轟钊

(1.中北大学 机械工程学院,山西 太原 030051;2.中北大学 系统辨识与诊断技术研究所,山西 太原 030051)

0 引 言

行星齿轮传动是一种多功能的机械传动方式。该传动方式可以实现功率分流,具有高效率、高承载能力、高可靠性等优点,是许多旋转机械设备的一个重要组成部分。然而,由于行星齿轮的齿面几何形状非常复杂,行星齿轮的制造和装配需要很高的精度。另外,行星齿轮经常处于高速和重载等恶劣工况[1],其关键部件的损坏都会导致设备的停机,甚至导致严重的后果。

因此,研究行星齿轮各振动模式的信号模型[2],保证设备运行的稳定性与可靠性,在实际工程应用中具有重要的意义。

在强烈的背景噪声下,如何较好地提取行星齿轮的微弱故障特征,这是行星齿轮故障诊断领域需要解决的难题[3]。由于旋转机械的故障通常伴随着振动信号的变化,因此,其振动信号分析方法成为故障诊断的有效手段[4]。

针对行星齿轮实际工作条件下,收集到的振动信号的非线性和非平稳性特点,HUANG N E等人[5]提出了一种经验模态分解(empirical mode decomposition,EMD)算法,由于该算法在处理非线性、非平稳信号上具有自适应等的优点,使得其在一些领域得到了广泛应用。谷玉海等人[6]对轴承振动数据进行了经验模式分解和频谱分析,将频谱数据压缩成特征二值化图像,并将其作为卷积神经网络的输入数据进行了训练,取得了不错的效果;但使用EMD方法处理振动信号时,容易发生模态混叠的现象。在此基础上,WU Z等人[7]提出了一种将EMD方法与白噪声信号的统计特性相结合的新方法,即集合经验模态分解(EEMD),旨在提高经验模式分解的准确性和有效性,在特征量提取困难的情况下,利用其自适应性来提取故障特征[8],获得本征模态函数成分后,直接将其输入神经网络,作为特征值[9-10],并根据所需特征用于故障诊断和识别。目前,这种方法已经在故障诊断领域得到了广泛应用。

在实际工作条件下,收集到的振动信号可能会被各种噪声源所破坏。针对这一问题,一些学者采用机器学习的方法,对旋转机械进行了故障诊断。JIN Y等人[11]开发了一种处理一维格式数据的标记序列生成方法,即时间序列变换器,并对其超参数进行了分析,采用该方法进行了滚动轴承故障诊断实验,对该方法的有效性进行了验证。

孙灿飞等人[12]采用参数自适应变异模式分解方法,对强背景噪声下的二阶太阳齿轮裂纹进行了诊断;但其特征提取不够充分。

为了弥补上述方法在特征提取方面的不足,一些学者在故障诊断系统中运用了深度学习方法[13-14]。冯浩楠等人[15]提出了基于批量归一化的一维卷积神经网络模型,用于旋转机械的故障诊断和故障特征的自适应提取,该模型减少了故障诊断的工作量。HUANG W等人[16]使用一种多尺度级联卷积神经网络,以端对端的形式,实现了输入信号分类信息增强的目的,并自适应地提取和识别了故障类型;但是上述方法都没有考虑故障在时间序列上的特征。

从时间序列数据入手,为提取更全面的故障特征,学者们开始利用长短期记忆(LSTM)网络。作为一种经改进的递归神经网络,LSTM在时间序列任务中可以更好地捕捉长期依赖关系[17-18],已在很多基于时间序列的应用中取得了不错的成果。TAK A[19]在输电系统的故障诊断中,使用LSTM网络进行了诊断分类。吕云开等人[20]使用孪生神经网络与LSTM相结合的故障诊断方法,在小样本数据条件下,取得了不错的故障诊断效果。

然而,以上学者都未对LSTM网络的超参数设置产生的影响进行深入研究。

综上所述,针对行星齿轮工作过程中存在的复杂工况(比如,工作环境差、齿轮轮齿易发生复合故障等),笔者提出一种基于EEMD和LSTM相结合的方法,将其用于行星齿轮故障诊断。

首先,使用EEMD对复杂行星齿轮故障振动信号进行分解,得到其本征模态分量;随后,将输入数据送入经遗传算法优化的LSTM模型中进行训练,并对网络超参数进行自动寻优,以提高模型的分类精度和泛化能力;最后,采用4种状态下采集的行星齿轮故障信号制作样本集,对基于EEMD和GA-LSTM方法的故障识别准确率进行验证。

1 数据处理

1.1 集成经验模态分解理论

集成经验模态分解(EEMD)是为优化EMD算法中模态混叠和端点效应劣势,而提出的一种用于分解非线性、非平稳信号的方法。

EEMD算法是通过向原始信号添加不同尺度和振幅的随机高斯白噪声,利用所加噪声的频率均匀分布的统计特性,得到多个与原始信号有相同物理意义的本征模态函数(IMF)。

在每个IMF中添加适当振幅的随机高斯白噪声,有助于消除离群点和拟合误差,从而提高数据的可靠性与准确性。

1.2 EEMD算法步骤

以下为EEMD算法步骤:

1)将高斯白噪声si(t)加入原始信号x(t)中,得到待处理信号Xi(t):

Xi(t)=x(t)+csi(t)

(1)

式中:c为白噪声信号的幅值系数;si(t)为第i次加入的白噪声;Xi(t)为第i次加入的白噪声时得到的待处理信号;

2)利用EMD对待处理信号Xi(t)进行分解,得到各阶IMF分量与余项Mi(t),其表达式如下:

(2)

3)对步骤1)和2)进行重复,每次都加入不同序列的随机高斯白噪声,其表达式如下:

(3)

4)每次分解都会得到分量与余项。为消除多次加入高斯白噪声对真实IMF值的影响,将两项相加求平均。采用高斯白噪声频谱的均值为零,计算上述各IMF均值,得到最终IMF分量为:

(4)

式中:kin为第i次EMD分解所产生的第n个IMF;n为EEMD的集成次数。

2 故障诊断网络模型

2.1 遗传算法

遗传算法(GA)是一种用于寻找最佳方案的计算模型,它模拟了生物进化的过程。GA模型使用选择、交叉和变异运算符来创建新的候选解决方案,并随着时间的推移提高群体的适配性。GA算法广泛用于优化问题,如工程设计、调度、机器学习等,对解决非线性和全局优化问题等具有良好的效果。

GA模型的基本原理如图1所示。

图1 GA模型的基本原理

2.2 长短期记忆递归神经网络

长短期记忆神经网络是递归神经网络(recurrent neural networks,RNN)中的一种。与RNN相比,LSTM克服了梯度消失问题,且具有更强的记忆能力,更擅长处理冗长的顺序信号。LSTM引入特殊的“门”机制,通过其3个门控(遗忘门、输入门和输出门)学习时间序列特征[21]。

神经单元结构如图2所示。

图2 LSTM神经单元结构

LSTM的运算过程为:遗忘门ft利用当前输入xt和最后时间步长的外部状态ht-1,同时执行sigmoid函数,评估是否保留先前的神经元信息Ct-1。

遗忘门ft的输出为0,表示先前神经元信息将被丢弃;当输出为1时,表示上一时刻信息被保留。

遗忘门的表达式如下:

ft=σ(Wf·(ht-1,xt)+bf)

(5)

式中:σ为sigmoid激活函数;bf为偏置;Wf为权重;Ct-1为存储先前记忆信息的单元状态;ft为由遗忘门控制的遗忘程度。

输入门负责确定必要的新信息添加到单元状态中,用来更新。输入门的表达式如下:

it=σ(Wi·(ht-1,xt)+bc)

(6)

(7)

(8)

为了确定LSTM中当前神经元的输出信息,采用了输出门,其表达式如下:

ot=σ(Wo·(ht-1,xt)+bo)

(9)

ht=ot·tanh(Ct)

(10)

式中:ot为输出门。

笔者使用sigmoid函数来确定当前状态信息中应该被输出的相关部分,然后将所得值与当前状态信息Ct相乘,由tanh激活;随后,所得的内部状态信息被转发到外部状态,即隐藏层输出ht。

2.3 EEMD与GA-LSTM故障诊断模型

LSTM网络使用一个存储单元来存储和检索长时间的信息,这使得网络能够保持顺序数据的长期依赖性。但是其泛化能力差,收敛速度慢。

笔者使用GA-LSTM就是在其基础上进行的改进,并利用GA选取最佳参数。

故障诊断模型如图3所示。

图3 故障诊断模型

故障诊断模型步骤如下:

步骤一。采集行星齿轮的时域加速度数据,将各种状态的振动数据分割成固定长度的序列;随后进行预处理,用数值进行标注,将其分为训练集和测试集,作为深度神经网络故障诊断模型的输入;

步骤二。在GA-LSTM层,利用遗传算法优化权重和偏差,在训练过程中分批接收训练样本,并为学习率、LSTM单元数、训练次数等超参数选择合适的值迭代;采用GA-LSTM层对时序数据进行计算,整合计算值后,将其输入到SoftMax层;

步骤三。SoftMax层为每个可能的输出类别产生一个概率分数,预测的类别是具有最高分数的类别。该层通过概率分布对故障状态进行分类。通过比较样本的输出概率和实际值,得到损失率,并使用梯度下降算法不断优化权重和偏置;

步骤四。模型训练达到指定的迭代次数后,使用训练好的模型对测试样本进行预测,将预测结果与实际类别进行对比,得到模型对测试集的分类准确率。

3 实验及结果分析

3.1 故障模拟实验及数据集

故障模拟实验在晋中学院故障诊断实验室进行。

该实验台由驱动电机、扭矩速度传感器和采集仪、螺旋锥齿轮箱、行星齿轮箱、底板、磁粉制动器、保护罩和控制系统组成。

实验台底板尺寸为1 800 mm×900 mm,齿轮箱尺寸为350 mm×250 mm。实验内容为采集不同故障工况齿轮的振动加速度信号。

行星齿轮故障模拟实验台如图4所示。

图4 行星齿轮故障诊断实验台

实验电机转速为2 200 r/min。笔者设定采样频率为5 kHz。

ICP三向加速度传感器X、Y、Z轴分别对应信号采集通道1、2、3;ICP单向加速度传感器Z轴对应信号采集通道4,笔者将其分别设置在大小齿轮轴线处的箱盖上,每种工况采样时间为10 s。

为了获得IMF分量,需要对每种状态的信号都用EEMD进行分解。笔者将数据分为500个数据点的集合,并使用EEMD将每个集合分解为IMF分量。

在这项研究中,原始信号和前6个IMF分量被选为特征量,从而使每组数据被分解为一个特征样本。笔者使用该方法对不同状态的数据进行分解,共得到750组特征样本。

故障数据集描述如表1所示。

表1 故障数据集

在试验过程中,笔者考虑了4种不同的条件(状态):正常状态、齿根断裂、齿面磨损和缺齿。

在正常和3种故障条件下,从实验台获得的信号时域图如图5所示。

图5 4种状态信号的时域图

由图5可得:不同条件下的振动信号表现出不同的特征,其中,正常情况下表现为稳定的周期性振动信号,故障条件下的振动信号更不规则,包含脉冲状的特征。

3.2 EEMD分解与网络参数设置

笔者使用EEMD,对行星齿轮振动加速度进行信号分解,以获得IMF分量,然后按频率对IMF分量进行排序,并在其中加入标准偏差为0.1的高斯白噪声,共得到6个IMF分量。

在不同的运行条件下,对齿轮信号进行分解,其中一种IMF分量如图6所示。

图6 齿根断裂信号EEMD分解图

为了提高预测精度,笔者采用遗传算法(GA)[22-23]对LSTM进行优化,这样可避免人为设置超参数时存在的主观性影响,也节省了计算资源和时间成本。

GA-LSTM网络参数设置如表2所示。

表2 网络参数设置

笔者利用GA-LTSM网络模型来识别最初的6个模态成分,并为其配置相应的参数。GA-LSTM模型由1个GA-LTSM层、1个SoftMax层、1个全连接层和1个分类输出层组成。其中,为避免模型的过拟合问题,在全连接层中增加了Dropout随机失活层,并在Dropout层中设置失活概率为0.6。

此外,还可以使用小批次设定,使模型更频繁地更新参数,并且可以降低对内存的需求。

经GA优化的LSTM网络的超参数如表3所示。

表3 GA-LSTM网络模型超参数设置

循环数代表训练次数,笔者设置为100次,每个循环后网络都会迭代更新。模型的运行环境为MATLAB。

3.3 实验结果分析

在该实验中,笔者随机选取90%的数据作为训练样本,并使用GA-LSTM网络对样本进行训练。

损失随迭代次数变化的情况如图7所示。

图7 迭代次数与模型的训练损失率的关系

从图7中可以看出:该网络的损失率低于2%,证明了该网络具有良好的稳定性。

笔者使用剩余10%的数据进行测试。模型训练准确率曲线如图8所示。

图8 模型训练准确率曲线

由图8可知:模型经过测试后,得到了该模型的精度为94.17%;同时,在迭代计算过程中,训练曲线会产生一定的波动,表明该模型在进一步迭代中可以达到稳定的预测效果。

笔者利用混淆矩阵展示模型分类的评估性能,如图9所示。

图9 测试结果混淆矩阵

由图9可以发现:模型能比较准确地识别出行星齿轮的缺齿、正常和齿面磨损情况,但是对行星齿轮齿根断裂情况的识别率最低,为90.0%,这表明模型还存在齿根断裂被误判的问题,导致结果偏差增加(其原因是在特征判断上,与其他故障类型相比,齿根断裂容易被误判为正常情况)。

因此,笔者还需要进一步优化模型,以提高对齿根断裂的识别率。

综上所述,该网络在行星齿轮故障识别方面表现良好,是一个可靠的分类工具。

3.4 对比分析

3.4.1 必要性验证

未经EEMD处理以及经过EEMD处理的网络,在迭代测试精度方面的情况如图10所示。

图10 网络精度随EEMD处理前后迭代次数的变化

由图10可以得知:未进行EEMD处理的网络表现出相对较差的稳定性,其精度仅能达到78%;经过使用EEMD处理后的网络,可以实现94%的准确率,同时稳定性和精度也得到了显著提升。

这表明,使用EEMD方法处理数据有利于改善网络的稳定性和精度,同时也说明LSTM网络更适合用于处理时序信号。

由于该实验是模拟的,而在实际工作条件下,行星齿轮可能会遇到更多的噪声干扰,这会大大削弱故障信号的特征,使得其特征提取更具有挑战性。

为了进一步模拟行星齿轮的实际工作情况,笔者在其原始振动信号中加入了噪声,并对这种添加噪声的影响进行了分析,结果如图11所示。

图11 添加噪声后EEMD处理对模型精度的影响

由图11可以看出:如果没有对添加噪声的信号进行EEMD降噪处理,其分类结果会变差;反之,添加噪声后,对EEMD和GA-LSTM网络而言,其分类精度仍然保持在相对较高的水准上。这说明,在实际应用中,EEMD方法能有效地减少噪声的干扰,提高行星齿轮的故障诊断精度;

当加入噪声后,该模型的准确度达到了90.0%;而当使用没有经EEMD分解的信号时,其准确度只有75.3%。这证明,使用EEMD算法的信号分解有效地减轻了噪声的影响,并提高了模型的准确性;

此外,与直接将噪声信号输入模型相比,使用分解后的信号,其在精确度上显著提高了15%。因此,可以推断:EEMD处理方法及其结合LSTM网络的方法可能会在时序信号处理领域有更为广阔的应用。

3.4.2 优越性验证

在初始迭代测试阶段中,2个网络都表现出了快速收敛状态,GA-LSTM和LSTM网络的准确性对比如图12所示。

图12 迭代次数与不同网络模型准确性之间的关系

由图12可知:实验结果表明,与没有优化的模型相比,用GA算法优化的LSTM网络的准确性从85%提升到94%,预测的准确度提高了9%,其原因是两种网络都采用类似的训练方式,即单向的往前训练方式;

两者相比而言,GA-LSTM网络更加平滑,这是因为GA优化是通过优化LSTM层参数去除其人为设定的随意性,避免了网格寻优方式耗费大量时间和计算资源。随着迭代次数的增加,2个网络的精度逐渐提高。

值得注意的是,到达后期迭代阶段时,GA-LSTM网络比未经过优化的LSTM网络获得了更好的精度。这证明了GA-LSTM网络的优化策略确实有效地提升了网络性能。

4 结束语

笔者将EEMD与基于GA-LSTM的神经网络相结合,提出了一种新的行星齿轮故障诊断方法,并利用故障模拟实验平台,对4种不同状态的行星齿轮数据集进行了测试,对该方法的有效性与泛化性进行了验证。

研究结论如下:

1)相比于传统的故障诊断技术,EEMD方法能有效地将非线性和非平稳信号分解为多个本征模式函数分量,IMF分量可以作为进一步处理和分析的特征,从而提高故障诊断的准确性和可靠性;

2)使用遗传算法来优化LSTM网络模型,可以显著提高网络的泛化能力,并且在加快训练过程和降低过拟合的风险方面也具有优势。实验结果显示,相比于传统LSTM算法,GA-LSTM算法的准确率更高(达到了94%),而传统LSTM算法仅能达到85%的准确率;

3)GA-LSTM模型的总体故障诊断准确率达到了94.17%。在人为加入噪声信号后,与未经EEMD分解的模型相比,该模型在精确度上提升了15%,表明该模型对噪声信号具有较强的鲁棒性,具备良好的抗噪声能力。

综上所述,笔者所提出的故障诊断方法具有更高的识别率和更强的鲁棒性,该方法可为行星齿轮故障诊断提供良好的应用前景。

在未来的研究中,笔者旨在将上述行星齿轮故障诊断方法扩展到更具挑战性的场景中,如强噪声干扰和可变工况,以进一步优化并提高该模型的抗噪声能力和泛化能力,使其更加适用于不同的环境和场景。

猜你喜欢
行星齿轮故障诊断
东升齿轮
流浪行星
你找到齿轮了吗?
异性齿轮大赏
追光者——行星
行星呼救
齿轮传动
行星
因果图定性分析法及其在故障诊断中的应用
基于LCD和排列熵的滚动轴承故障诊断