基于双向长短时记忆网络的牵引机齿轮泵故障诊断

2022-06-24 13:37:04王长华蒋云刚李保吴珂朱凯

机械制造与自动化 2022年3期

王长华，蒋云刚，李保，吴珂，朱凯

(1. 浙江省机电设计研究院有限公司，浙江杭州 310051； 2. 浙江大学平衡建筑研究中心，浙江杭州 310007； 3. 杭州运河集团建设管理有限公司，浙江杭州 310000； 4. 中国计量大学质量与安全工程学院，浙江杭州 310018)

0 引言

随着自动控制的快速发展，工业物联网也获得了广泛应用，可以高效收集大量的牵引设备运行故障，但无法继续通过传统故障分析方法来及时处理这种大数据故障信息[1-4]。采用深度学习方法因具备数据自我迭代处理及对多种复杂数据都能够达到快速准确提取的效果，这使其成为大数据处理领域的一项重要应用技术，已被用于语音信号处理、图像分析等方面[5-8]。石鑫等[9]选择深度自编码网络诊断电力变压器的运行故障；王惠中等[10]则根据LTSM方法在时间序列提取的独特优势，综合运用LTSM与Softmax分类器方法对各类故障信号进行诊断分析。

国内学者胡茑庆等[11]也开展了智能诊断方面的研究工作，利用经验模态分解方法度数据进行处理，再通过深度卷积神经网达到诊断的要求。步骤是先对信号实施EMD处理完成分解过程，将其转换成多个 IMF分量后计算每个分量的峭度，再以DCNN对其中峭度较大的6个分量进行特征融合，接着继续测定行星齿轮泵齿的振动信号并验证了该方法实际诊断效果。WU C Z等[12]则利用一维卷积神经网络来判断齿轮箱形成的振动信号，结果发现该诊断方法能够达到高精度的判断要求。本文测试在行星齿轮泵故障诊断前进行，采用经验模态分解(ensemble empirical mode decomposition, EEMD)和双向记忆网络(bi-directionallong short-time memory, BLSTM)相结合的模式，对本实验中4种不同的齿轮泵进行故障测试。采用EEMD方法实施信号分解生成相应的IMF分量，将上述参数输入模型内进行训练得到准确的分类结果。

1 双向长短时记忆网络

1.1 循环神经网络

循环神经网络(recurrent neural network, RNN)属于一类递归神经网络，时间序列输出取决于前一时刻与当前输入的共同影响。

t时刻的RNN网络输出为：

st=f(uxt+wst-1)

(1)

yt=g(vst)

(2)

式中：t-1是上个时刻；t是现有时刻；w为之前隐藏层相对目前隐藏层所占的权重；x为RNN网络输入；u表示输入层至隐藏层权重；y为RNN网络预测结果；s为隐藏层状态输出。

以E表示网络在t时的总损失，如式(13)所示。

(3)

对网络进行训练时通过参数优化算法来完成u、w、v参数的更新。式(4)给出了参数w在t时梯度误差计算式。

(4)

在处理深层次网络的时候，当选择参数优化模式实施更新时，将会出现局部梯度弥散的结果，严重时还会引起梯度爆炸，从而导致产生差异很大的网络权重，表现为网络状态的大幅波动。

1.2 双向长短时记忆网络

为得到更加准确的信息，构建得到双向长短时记忆网络，图1显示了BLSTM通过时间展开计算的结果。

图1 BLSTM网络结构

显然，当前输出受到前向层和反向层输出综合作用，式(5)-式(7)给出了网络在t时的输出ot。

(5)

(6)

(7)

式中：w为权重；ht为正向隐藏层输出；→为网络正向输入；←为网络反向输入。

2 数据处理及网络设置

2.1 数据集描述

齿轮泵测试平台如图2所示。分别对齿轮泵处于不同的运行状态下形成的信号数据进行采集分析，采集的齿轮泵4种故障数据集描述如表1所示，齿轮泵故障时域图如图3所示。本实验将采样频率设定在10kHz，电机转速2500r/min，依次对各齿轮状态采集得到300组振动加速度信号，每组中存在900点数据。

图2 现场测试图片

表1 齿轮泵4种故障数据集描述

图3 齿轮泵故障时域图

2.2 EEMD分解

对本实验采集得到的初始数据进行EEMD分解获得IMF分量，再以频率由高往低的顺序排序后，将高斯白噪声加入，其标准偏差为0.2，迭代次数上限为25，后续分量信息造成的影响可以忽略。本次共确定6个IMF分量，对齿轮不同运行状态下的信号实施分解，结果见图4。

图4 不同故障的EEMD分解

利用BLSTM网络对初始6个模态分量识别，进行模型训练时，由于分量包含了太长的数据，需要花费更长时间才能完成训练。为提升训练效率并改善精度，选择15个时域和16个频域特征进行分析，再将模型输入维度由1000降低至30，进一步优化了故障特征。

2.3 参数设置

本研究构建的双向长短时记忆模型包含了1个Softmax层、1个全连接层、1个分类输出层、1个BLSTM层。为全连接层设置了Dropout随机失活层，避免模型发生过拟合的问题，控制失活值保持在恒定的0.65，并设置更多ReLU激活层来达到加快网络训练的效果。本次模型运行环境为Matlab2019a，具体参数见表2。

表2 BLSTM网络

测试时设定批量为100，学习率0.01，选择Adam算法完成寻优计算。通过控制梯度阈值=1以防止梯度爆炸的情况；以轮数代表训练次数，共训练50次，每个周期结束后再对网络开展1次迭代计算。表3为本实验的网络超参数。

表3 BLSTM网络超参数设置

3 实物实验结果分析

3.1 实验结果

以上述实验实测获得信号处理后数据为研究对象，随机选择比例为80%的数据实施训练，再测试剩余30%比例的数据。图5给出了模型训练与验证过程，可以看到在不同迭代次数下验证误差变化情况。通过测试发现该模型精度达到95.3%，进行迭代计算时形成了波动变化的训练曲线，可以推断该模型并没有达到稳定预测的效果。以图6的混淆矩阵模型准确识别齿面形成的磨损缺陷和缺齿情况，断齿识别率94.1%，最低的是齿根裂纹故障识别率，只达到86.5%。同时发现齿根裂纹只达到了一个较低的识别率，这是由于齿根裂纹会被误判为断齿而引起结果偏差。

图5 BLSTM网络训练损失随迭代次数的变化

图6 BLSTM网络验证数据混淆矩阵

3.2 对比分析

图7显示了未进行EEMD处理和经过EEMD处理的两种不同模型对应的迭代精度。可以看到，未经EEMD处理的模型表现出了不稳定的测试结果，实际精度只有70%，EEMD处理后模型精度与稳定性都发生了大幅上升。因此，BLSTM模型在时序信号处理方面具有明显优势，本次测试的初始信号呈现相对紊乱的时序特性，不能达到准确识别的效果。先对信号EEMD分解后，可以促进所有分量都获得更优的时序性，促使模型诊断精度得到显著提升。

图7 EEMD处理前后网络精度随迭代次数的变化

4 结语

1)本网络损失<1%，可以推断该网络满足良好稳定性的条件，可以实现精确识别齿面磨损和缺齿的问题，断齿、正常齿的轮识别率都达到了93%以上，齿根裂纹故障识别率达到了87.2%。

2)经过EEMD处理的网络稳定性与精度显著提升。到达后期迭代阶段时，BLSTM网络拟合速度开始变快，精度也获得提升。