基于深度置信网络与信息融合的齿轮故障诊断方法

2021-04-28 03:24李益兵黄定洪马建波

振动与冲击 2021年8期

李益兵，黄定洪，马建波，江丽

(1. 武汉理工大学机电工程学院，武汉 430070； 2. 数字制造湖北省重点实验室，武汉 430070)

齿轮作为旋转机械和传动系统中的关键零部件之一，具有结构紧凑、传动效率高等优点。当齿轮发生故障时，会严重影响旋转机械和传动系统的使用寿命和运行安全[1]。齿轮的振动信号往往呈现出非线性、非平稳性等特点，传统的故障诊断方法主要从时域、频域和时频域方面对数据进行特征提取，并输入到相应的分类器中进行故障分类。胡茑庆等[2]通过经验模态分解对振动信号进行特征提取，并利用深度卷积神经网络进行特征融合，实现了齿轮箱的故障诊断。辛玉等[3]通过迭代经验小波变换对齿轮振动信号进行特征提取，利用输出层(soft-max)进行故障分类。上述方法中，需要进行人为的特征提取，依赖于一定的信号处理技术和专家经验；而且，传统的分类器，如BP(back propagation)神经网络、SVM(support vector machine)等大多是基于浅层的网络模型结构，训练时容易陷入局部最优，泛化能力较差。

深度置信网络(deep belief network, DBN)作为经典的深度学习算法之一，具有强大的自适应特征提取和非线性数据处理能力，可以直接对原始时域振动信号进行特征提取[4]，避免了传统方法对信号处理技术和专家经验的依赖。近年来，DBN被广泛应用于各种机械设备的故障诊断。Yan等[5]针对传统数据处理方法无法有效挖掘多源异构数据中的特征分布，提出一种基于多源异构信息融合的DBN转子不平衡故障诊断方法。与传统故障诊断方法相比，该方法对转子不平衡的故障诊断精度高达100%，大大提高了模型的故障识别精度。Xu等[6]提出一种基于DBN和模糊C均值聚类算法的无标签数据滚动轴承故障诊断方法，试验表明，该方法的故障诊断精度优于变分模态分解-奇异值分解-模糊C均值聚类等组合模型。Zhang等[7]提出一种基于混合深度置信网络的故障诊断模型，该模型通过不同的数据集成方式对汽车驱动系统进行智能故障诊断，并通过试验证明了方法的优越性。陈保家等[8]对齿轮的原始时域振动信号进行傅里叶变换，然后将提取的特征信号输入到DBN模型中进行诊断分析，并取得了较好的识别效果。郑小霞等[9]采用变分模态分解法对风机的振动信号进行特征提取，然后将提取到的故障特征构建高维特征向量输入到DBN分类器中进行故障识别，提高了风机易损部件故障预警的准确率。

DBN结构参数的选取对模型的故障特征提取能力起着至关重要的作用，然而上述方法，对DBN结构参数的选择大多是凭经验人为确定，从而导致模型的故障诊断性能存在一定的不确定性。对此，Shao等[10]提出一种基于粒子群优化DBN的轴承故障诊断方法，在缺乏先验知识的情况下取得了较好的故障识别精度。此外，相对于单一传感器，多传感器信息融合可以较为全面、准确的反映设备的运行状态，从而提高故障诊断的精度。李松柏等[11]通过对多传感器采集的振动信号进行数据层融合，并利用堆叠降噪自编码进行逐层特征提取，试验表明该方法的识别精度高于单一信号的识别精度。

基于此，本文提出基于DBN与信息融合的齿轮故障诊断方法。该方法利用多传感器信息融合技术对每个传感器采集的振动信号进行数据层融合。同时，为了避免人为选择结构参数对DBN特征提取能力的影响，结合改进的混合蛙跳算法(improved shuffled frog leaping algorithm，ISFLA)全局搜索能力强、收敛速度快、易跳出局部极值等优点[12]对DBN结构参数进行优化，以提高模型的故障诊断精度。

1 深度置信网络

深度置信网络是由多个受限玻尔兹曼机(restricted boltzmann machine，RBM)堆叠而成的多隐含层神经网络，其核心是通过逐层贪婪学习算法优化DBN各隐含层之间的连接权重，从而有效挖掘原始数据中的故障特征。图1(a)为三个RBM和soft-max堆叠而成的DBN模型结构，每一个RBM由可视层和隐含层组成。RBM层间的神经元相互独立无连接，层与层之间的神经元全连接，如图1(b)所示。图中：v为可视层神经元；h为隐含层神经元；a为可视层偏置向量；b为隐含层偏置向量；Wnm为可视层与隐含层之间的连接权重。

RBM作为DBN的基本组成单元，训练DBN的实质就是对RBM进行训练。RBM是基于能量的模型，其公式推导见文献[13]，由于其值不易求解，文献[14]采用对比散度算法用于快速训练RBM，其训练过程如图1(c)所示。DBN训练过程主要分为两个阶段：

(1) RBM无监督逐层预训练过程。通过一系列非线性变换，自适应的从原始高维数据中提取深层次的特征表示。

(2) 反向微调过程。RBM无监督逐层预训练过程只能确保每一层自身的权值对该层的特征提取能力达到最优，由于训练误差会进行逐层传递，从而形成误差累积。因此，需要对DBN每一层的连接权重和偏置进行微调，使误差达到最小。

图1 DBN模型结构

2 齿轮故障诊断模型

2.1 ISFLA算法参数设置

为了避免因人为选择DBN结构参数导致模型诊断性能下降，以及穷举法耗时耗力等问题，本文采用ISFLA对DBN结构参数进行优化。优化参数包括RBM1，RBM2和RBM3各隐含层的神经元个数m1，m2和m3，以及学习率η(0,1)。

ISFLA的基本思想是将一个青蛙种群Fp划分为mp族群，然后在每个族群中进行局部搜索策略，使性能优异的青蛙(模因)在族群个体之间传递。局部搜索策略结束之后，将mp个族群混合，并进行全局搜索策略，然后更新全局最优蛙。全局搜索策略使不同族群之间的模因得以交流，从而使算法能够跳出局部极值点，避免早熟现象发生，向全局最优方向前进，ISFLA更新公式为[15]

s=r1(Ul-Uw)+r2(Ug-Uw)

(1)

(2)

U′w=Uw+S

(3)

Smax=Ps(Xup-Xdown)

(4)

式中：r1和r2为[0,1]的随机数；Uw，Ul和Ug分别为局部最差蛙、局部最优蛙和全局最优蛙；U′w为更新后的值；Smax为最大跳跃步长；Ps为跳跃步长系数。

ISFLA是一种基于种群的启发式算法，因此，初始种群的好坏对算法的搜索性能极其重要。当初始种群在可行域中分布不均匀时，将导致算法的搜索范围受到一定的限制，从而降低算法的全局搜索能力。因此，本文采用正交设计理论来初始化青蛙种群[16]。族群mp较小时，不仅会导致各族群之间的交流减少，而且还会使得算法的求解速度变慢，所以mp数量不宜过小。族群内青蛙个数np的增加会导致青蛙种群数目变大，会有更多的青蛙接近于最优解，但是在族群mp确定的情况下，np的增大不仅不会提高求解精度，反而会增加计算成本。局部迭代次数Nl太小，则失去局部深度搜索的意义，太大则会导致算法的效率大打折扣。根据Eusuff等研究中给出的参考范围，本文选取的算法参数如表1所示。

表1 ISFLA参数

为了保证青蛙族群的多样性，同时防止陷入局部最优解，在随机选择q只青蛙构建子族群时，对适应度值较大的青蛙赋予较大的权重，适应度值较小的青蛙赋予较小的权重，权重按照式(5)进行分配[17]。

(5)

2.2 多传感器信息融合

为了能够全面、准确的反映设备运行状态，通常采用多传感器进行信号采集，以提高故障诊断精度。在连续时间上采用D个同类型传感器，对反映设备运行状态随时间变化的一系列振动信号进行采集，得到多维时间序列数据集X。

式中：D为传感器的个数；i为1～N的某一时刻；xk(i)为第k个传感器在i时刻的观测值。

使用加权平均法，将D个传感器在i时刻采集的振动信号进行数据层融合为Pi={x1(i),x2(i),L,xk(i),L,xD(i)}，得到样本数据集Q=[P1,P2,L,Pi,L,PN]T。

2.3 齿轮故障诊断模型

基于深度置信网络与信息融合的齿轮故障诊断模型如图2所示，主要分为三个步骤：

步骤1振动信号采集和数据预处理

本文试验部分采用型号为PCB-356A16的三个加速度传感器，采集齿轮箱振动信号，数据采集卡型号为NIPXI-1042，采样频率为5 000 Hz。然后，对采集的多维时间序列数据集X利用加权平均法进行数据层融合，得到样本数据集Q。

为消除变量之间量纲和数量级的影响，利用式(6)对样本集Q进行归一化处理。

(6)

式中：xi为第i个采样点；xmin为样本集中最小采样值；xmax为最大采样值。然后，将处理后的样本集按一定的长度进行采样，得到由n个样本组成的数据集A，按3∶1∶1的比例划分为训练集S、验证集V和测试集T，满足关系A=S∪V∪T，且S∩V∩T=∅。

步骤2ISFLA-DBN逐层特征提取

首先，利用ISFLA对DBN各隐含层神经元个数和反向微调算法的学习率进行参数优化，并将ISFLA输出的最优解重构DBN模型。然后，将训练集和验证集数据输入到经ISFLA优化后的DBN模型中进行训练，使得各隐含层之间的连接权重和偏置达到最优，从而提高模型的故障特征提取能力。最后，将测试集数据输入到训练好的DBN模型中进行逐层特征提取。

步骤3故障分类

将ISFLA-DBN模型中最后一个隐含层提取的故障特征输入到Soft-max分类器中进行故障分类，从而实现齿轮的故障诊断。

图2 基于深度置信网络与信息融合的齿轮故障诊断模型

3 试验研究

3.1 试验台及其数据采集

多传感器信号采集试验台如图3所示，主要包括：一台伺服电机、单级齿轮变速箱、一个扭矩传感器、以及电磁制动器和制动控制器。

图3 单级齿轮变速箱试验台

由于制造、装配以及传动等误差的共同作用下，齿轮箱中的齿轮、轴承等在工作时会产生振动，振动信号由齿轮经传动轴和轴承座传递到箱体上，从而引起箱体的振动。信号在传递过程中会不断发生衰减，靠近轴承座附近的测点信号频率及幅值衰减较小，振动信号故障特征表现较为明显。基于此，为了有效、全面的获取齿轮振动信号，分别在主动齿轮轴承端、从动齿轮轴承端以及试验台基座上安装加速度传感器，采集x，y，z方向上的振动信号，加速度传感器按照位置如图4所示。

试验中，通过线切割的方式在主动齿轮齿根处切割四种不同深度的齿轮裂纹，以模拟齿轮正常状态、轻度故障、中度故障和重度故障，对应的裂纹深度分别为0 mm，5 mm，10 mm，15 mm，试验用齿轮参数如表2所示。

图4 加速度传感器安装位置

实际工况下，齿轮的转速或负载并不是一个恒定值，即同一种齿轮故障状态可能对应多种运行工况。因此，为了探究模型对同一故障类型在不同工况下的故障诊断性能，对每一种齿轮裂纹分别选择转速1 200 r/min、负载2 N·m，以及转速1 500 r/min、负载4 N·m两种工况进行试验研究。每种齿轮故障取900个样本，每个样本维度为800，共3 600个样本，将其划分为训练集S、验证集V和测试集T。齿轮样本划分如表3所示。

表2 齿轮参数列表

表3 齿轮故障参数及样本划分

3.2 对比试验模型构建

在64位Intel i5-8250U 2.2 GHz，8 GB内存运行环境下，使用相同的数据集进行试验。本文选取BP神经网络、未经优化的DBN和本文提出的方法进行试验对比，比较三种方法在训练集、验证集上的准确率和损失值，以及算法趋于稳定时所需的迭代次数。

由输入样本维数以及齿轮故障类型可知：DBN以及BP神经网络的输入层和输出层神经元个数分别为800和4。由于Adam算法是目前优化效果最好的反向微调算法[18]，因此，本文采用Adam算法作为反向微调算法。其中，Adam第一次估计指数衰减率为0.9，Adam第二次估计指数衰减率为0.999。算法迭代次数K=500，迭代步长为64，每个RBM迭代次数为100，输入层激活函数为Relu函数，输出层为soft-max，损失函数为交叉熵损失函数。

3.2.1 ISFLA-DBN模型

采用ISFLA对DBN各隐含层神经元个数以及反向微调算法学习率进行参数优化。利用ISFLA在给定范围进行参数寻优，得到DBN模型结构为800-1 084-682-364-4，反向微调算法学习率η=8.661 4×10-4。

3.2.2 DBN模型

采用逐级递减的方式[19]人为构建DBN模型，即DBN模型中后一层神经元个数要小于前一层神经元个数，得到的DBN模型结构为800-600-400-200-4，反向微调算法学习率为η=6×10-5。

3.2.3 ISFLA-BP模型

选取三层ISFLA-BP神经网络作为比较算法，利用ISFLA对BP神经网络隐含层神经元个数以及反向微调算法学习率进行优化，得到ISFLA-BP神经网络模型结构为800-336-4，学习率η=0.062 466。

3.3 结果讨论

3.3.1 DBN与ISFLA-DBN对比分析

DBN和ISFLA-DBN模型在训练集和验证集上的准确率和损失变化曲线，如图5和图6所示。由图可知，DBN模型在训练集和验证集上的收敛速度相对较慢，并且存在过拟合情况。而ISFLA-DBN模型在训练集和验证集上的准确率、损失值、收敛速度、拟合效果均优于DBN模型，即ISFLA可用于优化DBN结构参数以提高模型的故障诊断性能。

图5 DBN和ISFLA-DBN准确率对比

图6 DBN和ISFLA-DBN损失对比

3.3.2 ISFLA-DBN逐层特征提取能力

由于样本数据和ISFLA-DBN模型中各隐含层提取的特征维数较高，不利于可视化观察。因此，为了便于进一步评估ISFLA-DBN模型特征提取能力，对样本数据和ISFLA-DBN模型中各隐含层的输出利用主成分分析法，提取前两个主成分进行可视化分析，可视化特征如图7～图10所示。图中：“0”为正常齿轮； “1”为轻度齿轮故障； “2”为中度齿轮故障； “3”为重度齿轮故障。

图7 原始数据集可视化特征图

图8 第1隐含层可视化特征图

由图7可知，齿轮原始时域振动信号相互交错，很难进行故障区分。将数据集输入到ISFLA-DBN模型中进行特征提取，经RBM1特征提取后，四种故障信号由最初混乱无序的状态开始有效的聚集，并且处于一种向外发散状态。其中，正常齿轮和重度齿轮故障信号有效的聚集在一起，轻度齿轮和中度齿轮两种故障信号存在部分交叉重叠现象，如图8所示。经RBM2特征提取之后，轻度齿轮和中度齿轮两种故障信号基本上完全剥离开，只有极少部分出现相互交错的现象，如图9所示。经RBM3特征提取之后，四种故障信号全部剥离开，如图10所示。

图9 第2隐含层可视化特征图

图10 第3隐含层可视化特征图

3.3.3 ISFLA-BP、DBN和ISFLA-DBN对比分析

对比三种故障诊断模型在训练集和验证集上算法趋于稳定时，训练集和验证集准确率的最大值，以及算法趋于稳定时，所需迭代次数和损失差值大小，取10次运行结果的平均值进行比较，结果如表4所示。

表4 三种算法运行结果对比

由表4可知，ISFLA-DBN模型在训练集和验证集上的准确率和损失差值均高于DBN和ISFLA-BP模型，且算法趋于稳定时所需的迭代次数仅为43次，远低于DBN和ISFLA-BP模型的126次和264次。

3.3.4 ISFLA-DBN模型泛化性能分析

为了进一步评估ISFLA-DBN模型的泛化性能，即检验模型在未知数据集上的故障分类准确率，将测试集数据输入到训练好的ISFLA-DBN模型，并将结果以混淆矩阵形式表示，如图11所示。横轴代表预测的轴承故障类别，纵轴代表真实故障类别，对角线上的数值表示故障类别预测准确率，非对角线上的数值表示该类别预测错误的概率。

图11 齿轮故障分类混淆矩阵

由图11可知，正常齿轮故障识别率达到100%。轻度齿轮故障识别率较低，为94.44%，其中4.81%的概率预测为中度齿轮故障，说明轻度齿轮和中度齿轮故障的振动信号存在部分相似。中度齿轮和重度齿轮故障识别都较高，分别为97.78%和96.67%。四种齿轮故障平均准确率为97.22%，说明ISFLA-DBN模型在未知数据集上具有较好的泛化性能。

3.3.5 多传感器与单传感器试验对比

为了验证多传感器信息融合相对于单传感器更能全面、准确的反映齿轮运行状态，将传感器1、传感器2和传感器3采集的振动信号作为独立的数据源，与融合后的信号进行试验对比，比较其在算法趋于稳定时训练集和验证集故障识别准确率的大小，取5次运行结果的平均值进行比较，结果如表5所示。

表5 多传感器数据融合与单传感器故障诊断对比

由表5可知，多传感器数据融合在验证集和训练集上的准确率最高，相对于传感器1～传感器3来说更能准确地反映齿轮的运行状态。传感器2和传感器3在训练集和验证集的准确率都较高，传感器1的准确率最低。

4 结论

本文针对传统故障诊断方法依赖于一定的信号处理技术和专家经验，单一传感器无法全面、准确的反映复杂设备的运行状态，提出基于深度置信网络与信息融合的齿轮故障诊断方法。该方法利用加权平均法对多传感器采集的振动信号进行数据层融合，并利用ISFLA全局搜索能力强、易跳出局部极值、收敛速度快等优点对DBN结构参数进行优化。

试验表明，ISFLA-DBN和DBN模型相对于浅层BP神经网络具有更高的故障识别精度、更快的收敛速度以及更少的迭代次数。经过ISFLA优化后的DBN模型拟合效果更好、损失误差更小、故障识别精度更高。相对于单一传感器故障诊断来说，多传感器数据融合更能全面、准确地反映齿轮的运行状态。