基于改进二进制粒子群算法优化DBN的轴承故障诊断*

2024-01-27 06:44:10徐庭亮孙太华李雪原

组合机床与自动化加工技术 2024年1期

陈剑,黄志,徐庭亮,孙太华,李雪原

(合肥工业大学 a.噪声振动工程研究所;b.安徽省汽车NVH技术研究中心,合肥 230009)

0 引言

滚动轴承是旋转机械最易磨损、更换的部件之一,在设备运转过程中,如果滚动轴承出现故障,容易造出重大损失,甚至发生安全事故,因此,对滚动轴承的工作状态进行监测尤为重要[1]。滚动轴承的故障振动信号大都呈现出非平稳性特点,时频分析方法依靠专业知识从源信号中提取含有故障信息的特征分量进行故障诊断。唐贵基等[2]使用改进的小波包变换来分离滚动轴承单通道振动信号中的复合特征故障,而后重构轴承的单点故障信号,实现滚动轴承故障特征的分离和提取;苏文胜等[3]将经验模态分解(empirical mode decomposition,EMD)应用在滚动轴承的降噪预处理过程中,使用EMD对采样信号进行预处理,凸显信号的高频共振部分,再利用带通滤波和包络解调实现故障诊断。这些经典的时频分析故障诊断技术十分依赖故障特征设计,且在处理复杂信号时,分解阈值的设置需要多次实验,耗时长,效果也不够理想。

随着深度学习算法的引进,传统故障诊断方法与深度学习相融合的研究逐渐成为主流。崔鹏宇等[4]把轴承振动信号的时频域特征参数和熵特征参数融合,构建特征矩阵,然后输入到优化的反向传播(back propagation,BP)神经网络中进行故障诊断;程军圣等[5]中先对源信号做EMD分解,然后建立起内涵模态分量(intrinsic mode functions,IMF)的自回归模型(autoregressive model,AR),用AR的自回归参数和残差方差构建特征向量,再输入支持向量机(support vector machine,SVM)中进行故障诊断。但传统时频分析方法具有一定的局限性,尤其对轴承这类多分量信号处理时,变分模态分解(variational modal decomposition,VMD)容易发生频率混叠,计算速率会受到中心频率初值选择的影响,计算效果又受到分解个数和惩罚因子的制约,此外,EMD的端点效应也会导致深度学习算法的诊断效果不理想[6-7]。LMD是在EMD的基础上提出,用来处理多分量信号,LMD分解后得到乘积函数(product function,PF)分量,其频率和幅值都较完整的蕴含在PF分量中,对于多分量轴承振动信号,LMD是一个非常适合的预处理方法[8-10]。

本文利用LMD对轴承振动信号进行分解,计算各PF的散布熵和时域指标,构建特征矩阵,再使用加权惯性权重改进BPSO中的固定权重,并用改进BPSO优化DBN的隐含层神经元个数和学习率,得到IBPSO-DBN诊断模型,实现滚动轴承故障的诊断和分类。同时为了验证所提方法的优越性,用试验数据训练IBPSO-DBN模型并与DBN、PSO-DBN、BPSO-DBN模型做对比,结果表明,基于LMD的IBPSO-DBN故障诊断模型能有效诊断滚动轴承故障。

1 基础理论

1.1 局部均值分解方法

LMD是一种自适应时频分析方法,其本质是利用信号自身的局部均值点,通过自适应迭代分解把多分量信号分解成若干个含有物理意义的PF分量与残余项之和的形式,具体分解过程如式(1)、式(2)所示。

经LMD迭代分解得到的PF分量表达式为:

PF1=a1(t)s1n(t)

(1)

式中:PF1中的包络信号a1(t)代表源信号的最高频率,s1n(t)为一个纯调频信号,能计算PF1的瞬时频率为:

(2)

然后,再从Y(t)中去除PF1,得到一个新的信号,重复此过程k次,直到uk为一个单调函数为止。uk的迭代过程如式(3)所示。

(3)

至此,源信号Y(t)重构为式(4):

(4)

1.2 散布熵理论

散布熵通过符号化时间序列,比对信号之间幅值的关系来计算模式的重复概率,能够有效降低原始序列中的噪声干扰。因此,PF分量散布熵能很好抑制PF分量含有的噪声成分。

(5)

(6)

式中:round()表示取整函数,c表示散布熵符号化时间序列过程中的类别数。

(7)

式中:i=1,2,…N-(m-1)d。

再计算每个嵌入向量散布模式的概率p(πo0o1…om-1):

(8)

式中:count{ }表示嵌入向量映射到散布模式的个数。计算时间序列的散布熵值:

(9)

把LMD分解后的各PF分量作为散布熵的输入,求出各PF分量的散布熵。

1.3 IBPSO-DBN模型构建

IBPSO-DBN诊断模型的构建分为两步:首先是DBN模型初始化,其次是改进BPSO优化DBN隐含层神经元个数和学习率,得到最优粒子,构建IBPSO-DBN模型。

1.3.1 DBN网络结构初始化

DBN是由多个受限玻尔兹曼机(restricted boltzmann machines,RBM)堆叠而成,具有3个RBM的DBN网络如图1所示,每个RBM由可视层和隐含层构成,RBM层间通过权重w连接,数据特征在RBM间逐层映射传递,即前一个RBM的输出特征是后一个RBM的输入特征[13]。每层RBM保证该层隐含层对可视层特征的最优映射,从而高层RBM具有抽象性和表征力更好的特征向量输出。然后从最高层RBM的开始,自顶向下微调DBN模型参数。本文的DBN网络结构初始化分为无监督和有监督两部分,无监督部分使用大量无标签数据得到DBN初始网络结构参数和少量有标签数据,有监督部分使用少量有标签数据进行反向微调,从而获得理想的DBN网络结构参数[14]。

(a) 含有3层RBM的DBN网络结构 (b) 含有n个可视神经元和m个隐藏神经元的RBM图1 DBN结构模型

RBM是基于能量的函数,能量最小时RBM为最优值,预训练的目的即最小化RBM。RBM能量函数定义为:

(10)

由图1a和式(10)可知,RBM中可视层v=(v1,v2,…vn)有n个神经元,隐含层h=(h1,h2,…hm)有m个神经元,vi表示可视层第i个神经元的状态,hj表示隐含层第j个神经元的状态,ai,bj表示神经元偏置,wij为可视层和隐含层的连接权重,由此定义初始参数θ={a,b,w},计算基于RBM能量函数的可见层和隐含层的神经元联合概率分布,即:

(11)

(12)

考虑到同层神经元的独立性,可以求得vi=1的概率为:

(13)

同理可求得hj=1的概率为:

(14)

Sigmoid()函数为激活函数:

(15)

RBM预训练的目的就是为了初步得到最优初始参数θ,用θ*表示,得到具有较好拟合效果的DBN初始结构,此时DBN中的样本统计概率和模型生成概率最大化相等,θ*计算公式为:

(16)

式中:T表示训练样本总数。

DBN网络结构经过预训练得到了初始参数,反向微调阶段就是为了提高模型的拟合效果。反向微调从DBN最高层出发,自顶向下使用预训练得到的少量标签数据逐层向低层微调初始参数。一般采用Soft-max做为最后的分类器,使用BP算法实现微调过程。设定DBN网络有l个RBM,则预训练输出为:

ul(x)=Sigmoid(al+wlul-1(x))

(17)

Soft-max会以最大概率(预测类别)的形式判断DBN的输出。

DBN网络结构初始化完成后,得到了DBN模型,但在初始化的过程中,隐含层神经元和学习率反映了DBN挖掘数据特征的能力,隐含层神经元个数过多,DBN的迭代时间延长,过少又会导致特征挖掘不充分,分类效果差。针对此问题,本文提出采用BPSO优化DBN的隐含层神经元个数和学习率。

1.3.2 BPSO优化DBN网络结构

标准的粒子群算法适用于在连续空间中进行,对于优化DBN隐含层结构和学习率这样的离散搜索空间问题,粒子群算法局限性较大。针对离散搜索解空间的问题,本文提出BPSO算法对DBN结构中的隐含层神经元个数和学习率进行优化。针对BPSO固定权重会影响粒子寻优效果的问题,提出加权惯性权重对BPSO算法的固定权重进行改进。二进制粒子群算法理论为:

二进制粒子群算法中各个粒子的位置使用了二进制编码方式,如X=(x1,x2,…,xM)表示粒子种群的位置矩阵,xi=(xi1,xi2,…,xiN)表示第i个体粒子在第N次迭代的位置,其速度为连续变化的值,qi=(qi1,qi2,…,qiN)。BPSO的粒子位置和速度更新[15]为:

(18)

(19)

(20)

由式(18)～式(20)的位置和速度更新公式可知,BPSO算法中粒子的位置依靠更新,对于惯性权重来说,惯性权重较大,就会加快粒子在解空间中的搜索速度,避免陷入局部收敛的情况;惯性权重较小,就会降低粒子在解空间中的搜索速度,虽然搜索细致度提升,但搜索空间变小,反而有利于收敛。但是随着迭代次数的增加,搜索解空间的细致度提升,固定权重不能很好满足优化要求,比如算法计算初期着力于全局搜索,需要较大的惯性权重,然而在算法计算末期,需要让尽快收敛,那么就需要较小的惯性权重,为了解决固定权重不能很好适配算法迭代过程的需要,本文提出加权惯性权重来改进二进制粒子群算法的固定权重。

(21)

改进BPSO的速度更新公式为:

(22)

BPSO优化DBN网络结构参数步骤如下:

步骤1:DBN网络结构初始化,得到初始参数和网络结构参数;

步骤2:初始化粒子群,采用二进制编码方式得到初始种群;

步骤3:计算粒子适应度值,本文用准确率做适应值,计算本轮迭代中的粒子自身最优解pbest,ij和全局最优解gbest,ij;

步骤4:依据式(19)、式(20)和式(22)更新粒子位置和速度;

步骤5:更新判定,若适应度值或迭代更新次数满足条件,优化完成跳转到步骤6,否则跳转到步骤3,开始新一轮更新(更新次数加1);

步骤6:得到最优粒子,即最优DBN隐含层神经元个数和学习率。

2 故障诊断流程

轴承的时域特征是研究轴承故障的有力工具,当轴承发生如点蚀、磨损等故障时,其相应的时域特征指标也会发生改变,为了把时域指标有效利用起来,本文把PF分量的散步熵与时域指标融合,构建特征矩阵,输入IBPO-DBN诊断模型中进行训练,然后用测试集验证。

基于LMD分解和改进BPSO-DBN神经网络的轴承故障诊断方法的实现框图如图2所示。

图2 基于LMD分解和IBPSO-DBN故障诊断流程

步骤1:截取采集的滚动轴承原始振动信号,保证每个样本中都包含轴承旋转一周的时域信号,一共选取8种工况(见表2所列),每种工况60个样本,样本长度为1024;

步骤2:对8种工况的振动信号依次采用LMD分解,得到一系列PF分量,统计出这些PF分量标准差、峭度、均方根、波峰指标、脉冲指标、偏度、裕度指标、波形指标等8个时域特征指标,得到维度为24的特征向量;

步骤3:特征融合与提取。提取步骤2的时域指标与PF分量进行融合。将融合后的特征进行归一化处理,消除不同参数数量级对变量的影响,得到故障特征向量;

步骤4:构建数据集。将步骤3的故障特征向量作为诊断模型的输入数据,为了对数据进行标签化处理,采用one-hot编码对数据进行标签化处理,接着,将数据集划分为测试集和训练集。为了确保数据集的随机性和可靠性,需要将480个样本随机打乱,然后从中随机选取280个样本作为训练集,200个样本作为测试集。这样可以有效地避免数据集中存在的偏差和干扰,提高模型的鲁棒性和泛化能力;

步骤5:初始化粒子群。DBN初始训练,得到深度置信神经网络初始参数和初始网络结构,将DBN三层隐含层中n1、n2、n3个神经元以及学习率L通过二进制编码得到初始化粒子群;

步骤7:终止条件判定。如果训练样本的适应度值满足设定条件或者迭代次数等于N,则IBPSO优化结束,否则转到步骤5,同时N自加1,重复执行步骤5,直到满足判别条件;

步骤8:故障诊断与分类。得到最优粒子构建最优DBN网络,使用训练集对诊断模型进行训练,训练完成后,经测试集输入DBN网络模型中,输出诊断结果。

3 实验验证

3.1 实验数据采集

本文轴承实验数据来自于某大学航空发动机主轴轴承试验机上采集的不同类型轴承故障振动数据。轴承试验机的配置如图3所示。

图3 轴承试验机

实验的轴承型号为NU1010EM和N1010EM的单列圆柱滚子轴承,轴承相关参数如表1所示。

表1 实验轴承参数

为了得到不同故障类型的轴承,对轴承内圈故障采用激光加工获得,外圈和滚子故障采用线切割获得。试验轴承的工况如表2所示,共8种工况。

表2 轴承工况参数

图4为本实验验证所采用的不同工况的滚动轴承振动信号的原始信号图,图4中R表示r/min。

图4 实验原始信号

3.2 实验验证结果

将3.1节如图4所示采集到的数据按照如图2所示流程进行处理。同时,DBN开始初始化训练,再用IBPSO对DBN的网络结构参数进行优化,得到经过IBPSO优化后的DBN网络参数如表3所示。

表3 BPSO-DBN网络结构参数

本文随机选取采集数据的60%作为IBPSO-DBN的训练集,剩下的数据作为测试集,然后开展故障诊断工作。为了验证所提方法有效性,将BPSO-DBN分别于PSO-DBN、DBN、BPSO-DBN做比较,得出以下结论。

(1)诊断准确率明显提高。不同模型的对比验证如表4所示,IBPSO-DBN的正确率为99.3%,DBN、PSO-DBN网络的正确率分别为89.36%和90.64%,未经优化的BPSO-DBN的正确率为93.75%。

表4 模型对比验证

(2)拟合效果、诊断正确率明显提高。如图5所示,IBPSO-DBN的损失值约在100次迭代后约为0,而PSO-DBN需要迭代约200次,DBN的损失值则陷入局部收敛,可见IBPSO-DBN的拟合效果更好。

图5 IBPSO-DBN、PSO-DBN、DBN损失对比图6 IBPSO-DBN、BPSO-DBN正确率对比

如图6所示,IBPSO-DBN的正确率在迭代至115次左右时非常接近100%,且迭代过程正确率函数曲线较平滑,而BPSO-DBN的正确率函数在迭代至300次左右才逐渐平稳,且迭代过程正确率函数波动较大,表明迭代过程中陷入局部收敛的情形较多,可见BPSO-DBN的诊断正确率和拟合效果优于BPSO-DBN方法。

(3)分类效果好。如图7所示的混淆矩阵可知,在对正常轴承和滚子故障诊断中出现了误分类现象,分类正确率为96%,这是由于实验结构系统噪声的干扰导致。

图7 诊断结果的混淆矩阵

除此之外,IBPSO-DBN方法对其他类型的故障的分类识别率都是100%,综合分类正确率为99%。可见IBPSO-DBN算法的故障诊断和分类效果很好。

4 结论

本文把LMD与DBN神经网络相结合,把PF分量散布熵和时域指标融合,构建特征矩阵,针对DBN网络结构参数:隐含层神经元个数和学习率设置不当的问题,提出BPSO优化DBN网络结构参数,针对BPSO迭代过程中固定权重导致BPSO寻优效果不理想的问题,提出加权惯性权重改进BPSO的迭代过程。最后,把特征矩阵输入IBPSO-DBN模型中训练,获得IBPSO-DBN诊断模型。轴承试验结果与模型对比试验表明:

(1)基于LMD分解的BPSO-DBN滚动轴承故障诊断分类方法能够有效识别滚动轴承的工作状态和故障类型,诊断正确率优于DBN、PSO-DBN和BPSO-DBN神经网络结构,拟合效果优于PSO-DBN和DBN网络。

(2)采用加权惯性权重改进BPSO方法,并用IBPSO对DBN网络的隐含层神经元个数和学习率进行优化,构建最优DBN网络,获取IBPSO-DBN故障诊断模型,对于提高滚动轴承在运转过程中的故障识别和诊断率有着重要意义。