CMWPE结合SaE-ELM的轮对轴承故障诊断方法

2023-07-05 05:53张龙彭小明熊国良吴荣真胡俊锋
机械科学与技术 2023年4期
关键词:车轮尺度故障诊断

张龙, 彭小明, 熊国良, 吴荣真, 胡俊锋

(1. 华东交通大学 机电与车辆工程学院,南昌 330013;2. 中国铁路南昌局集团有限公司 科学技术研究所,南昌 330002)

外界非平稳载荷和内部非线性因素使得轮对轴承的振动信号往往呈现出繁杂性和不规则性。传统的时频分析方法难以有效地处理这种随时间变化的非平稳信号[1]。为了克服这一缺点,许多基于熵的复杂性度量技术相继被提出,且被广泛应用于故障诊断领域。然而,样本熵易受时间序列波动性和异常值的影响[2];近似熵的计算结果一致性较差[3]。文献[4]的分析结果表明,排列熵(PE)可以检测滚动轴承振动信号的随机性和动态突变行为。然而PE只能反映单一尺度的时间序列信息,特征提取效果不理想。多尺度排列熵(MPE)由Wu等[5]结合多尺度熵(MSE)和PE提出,MPE具有较强的抗噪能力和较高的计算能力,可以有效地反映滚动轴承非线性动力学特性,解决单一尺度下提取信号信息的局限性问题。但是,MPE在实际应用中存在两个主要缺陷:1)MPE是基于PE计算的,PE仅在提取序数模式时保留序数结构,如果仅提取顺序结构,则幅值信息将丢失;2)MPE中的粗粒化处理将减少时间序列的长度,导致提取的信息不足,尤其是对于短时间序列而言[5]。为了克服PE的不足,Fadlallah等[6]提出了加权排列熵(Weighted permutation entropy, WPE)。文献[7]中又提出了多尺度加权排列熵(MWPE)来克服单一尺度分析的不足。但是,MWPE仍然存在一些由WPE和粗粒化时间序列引起的问题。为了克服上述WPE和MWPE的缺点,Zheng等[8]提出了复合多尺度加权排列熵(Composit multiscale weighted permutation entropy, CMWPE),以增强WPE和MWPE的鲁棒性。CMWPE通过对时间序列的不同幅值赋以不同的权重,充分保留了原始的数据信息,从而得到更为精准的熵值特征。同时粗粒化采用复合构造的方式,降低原始序列长度对粗粒化时间序列的影响,避免时间序列因粗粒化变短而引起熵值突变[8]。

近年来,神经网络算法被广泛地应用于滚动轴承的故障诊断。张龙等[9]利用时序模型和自联想神经网络实现对齿轮故障程度的评估。何园园等[10]提出一种ELMD熵特征融合与PSO-SVM的齿轮故障诊断方法。极限学习机(Extreme learning machine, ELM)是Huang等[11]提出的一种单隐含层前馈神经网络(SLFN)算法,ELM克服了BP神经网络在训练过程中训练速度慢、易陷入局部最优和泛化性能差等缺点。但由于ELM的隐含层节点在训练之前先指定,最终会导致获得的模型中存在某些对网络性能贡献较少的节点,造成模型结构的冗余,影响网络的性能。为了克服ELM的上述不足,Cao等[12]提出一种自适应进化极限学习机(Self-adaptive evolutionary extreme learning Machine, SaE-ELM)算法来优化ELM的输入权重、隐含层偏置和输出权重。

基于以上分析,针对DF4型内燃机车轮对轴承不同故障状态的判别问题,本文先用CMWPE提取机车轴承原始信号的特征信息,然后利用SaE-ELM模型对轴承不同故障类型和故障程度进行智能识别。该方法结合了CMWPE精准表征信号非线性特征信息和SaE-ELM运算速度快、网络泛化性能好的优势。为验证所提方法的实际应用效果,将真实工况下损伤的DF4型内燃机车轮对轴承用于本次实验研究。

1 复合多尺度加权排列熵方法

1.1 加权排列熵

PE具有理论简单、抗噪能力强等优势,因此在故障诊断领域应用较为广泛[13-14]。但PE只考虑了时间序列的序数结构,简单地将具有不同幅值的相同模式视为相等,而忽略了相同序数之间的幅值特性,其通常包含更重要的时间序列信息,这不可避免地影响熵的计算精度[15]。因此,文献[6]在PE的基础上,提出了WPE,即在一般PE的基础上考虑了时间序列的幅值信息,通过引入加权因子,对相同序号下的不同幅值进行加权。为了说明WPE的优势,将脉冲信号加入到高斯白噪声中进行分析验证,如图1所示。

图1 白噪声加脉冲信号仿真图

分别计算高斯白噪声加脉冲信号的PE和WPE值,根据文献[16]选择嵌入维数m=6,时延τ=1。如图2所示,可以看出PE的单调不变性,但WPE对幅值信息非常敏感。由此说明加权方法可以检测数据的突然变化,并为规则的尖峰模式分配更多的权重[6]。

图2 仿真信号的PE和WPE对比图

WPE计算步骤如下:

1) 对时间序列{xi,i=1,2,…,N}进行相空间重构得到一系列子序列为

(1)

式中:r=1,2,…,k,k=n-(m-1)t,m为嵌入维数;τ为时延;xr为状态向量,并且总共有k个状态向量。

2)xr中的元素分别以升序排列。在m维空间中,每个向量xr可能存在m!种排列模式ψr。让P(ψr)表示时间序列中第r个元素排列模式ψr的概率,则P(ψr)可以描述为

(2)

式中L是同一时间序列中所有可能的排列模式的数量。若状态向量xr映射到模式ψr,则P(ψr(l))=1,否则P(ψr(l))=0。

3) 根据同一排列模式的幅值不同,给每个向量分配一个权重值ωr,每个状态向量的加权相对概率定义为Pω(ψr),则

(3)

(4)

4) 根据Shannon熵定义的WPE值用EWPE表示为

(5)

最后,EWPE通过除以In(m!)的最大值归一化到区间[0,1]内。

1.2 多尺度加权排列熵

MWPE的计算过程为:

1≤j≤N/ss=1,2,…,smax

(6)

2) 计算不同尺度因子下粗粒化序列y(s)的WPE值,得到MWPE,即

(7)

1.3 复合多尺度加权排列熵方法

针对MWPE存在的不足,文献[8]提出CMWPE,其结合了MWPE和复合粗粒时间序列的优越性,计算步骤为:

1≤j≤N/s≈d, 1≤k≤s

(8)

(9)

1.4 对比分析

通过对1/f噪声和高斯白噪声两种噪声信号的分析,将CMWPE与MPE和MWPE进行比较,验证CMWPE的优越性并介绍CMWPE参数的选择过程。CMWPE中有4个参数需人为设定,分别为:尺度因子s,样本长度N,嵌入维数m和时延τ。其中,s通常设置为s>10,设定s=20。m对CMWPE有一定的影响,若m过小,过少的信息将无法全面表征时间序列所蕴含的原始信息;反之,若m过大,时间序列的微弱变化在熵值计算时易被忽略,且计算非常耗时。因此,通常设定m的取值范围在[4,7]之间,设置m=6。时延τ影响较小,一般设定τ=1[17]。

由图3可知,1/f噪声和白噪声的CMWPE、MWPE和MPE值都随尺度因子的增加而单调减小。图3a)~图3c)分别是1/f噪声的CMWPE,MWPE和MPE,而图3d)~图3f)分别是白噪声的CMWPE,MWPE和MPE。比较图3中CMWPE,MWPE和MPE的误差棒图可以发现,MWPE和MPE的标准偏差值随着比例因子的增加波动较大,而CMWPE的标准偏差值不随比例因子的增加而波动,CMWPE曲线几乎保持平滑和稳定。

图3 具有不同长度的1/f噪声和白噪声的MPE、MWPE和CMWPE

另外,由图3d)~图3f)中长度为2 400的1/f噪声和白噪声的CMWPE,MWPE和MPE曲线图可以看出,CMWPE可以在任何尺度上区分这两种噪声,而这两种噪声的MPE和MWPE在某些尺度上有重叠。表明 CMWPE的整体稳定性优于MWPE和MPE。此外,对于相同的尺度因子,白噪声的CMWPE,MWPE和MPE值始终大于1/f噪声,这表明白噪声比1/f噪声更不规则。

由图3还可以观察到,当N较小时,1/f噪声和白噪声的CMWPE具有较大的偏差,并且当N较大时偏差将减小。另外,文献[3]的研究表明,时间序列长度应满足N>200 s,但随着N的增加,偏差减小的效果有限,且计算量呈指数增加。设置样本长度N=4 800。

2 SaE-ELM算法

2.1 ELM算法

ELM算法可表述如下:对于任意训练数据集{xi,yj},(i=1,2,…,M;j=1,2,…,N),其中xi∈Rd且yi∈Rd,则具有L个隐含节点的单隐含层前馈神经网络(SLFN)输出为

(10)

Hβ=Y

(11)

式中:Η为隐含层输出矩阵,Η={hij=g(αj,bj,xi)};β为权重矩阵,β=(β1,β2,…,βL);Y为输出矩阵,Y=(y1,y2,…,yM)。通过最小二乘解可以求出网络的输出权重,即

(12)

式中H†为H为输出矩阵H的MP广义逆矩阵。

2.2 SaE-ELM算法

Cao等[15]采用自适应进化算法[18-20](SaE)来计算ELM神经网络的输入权重、隐含层偏置和输出权重。SaE优化ELM的过程如图4所示。

图4 SaE-ELM算法流程图

具体算法步骤如下:

1) 初始化网络隐含层参数的向量,并作为原始种群的大小,种群参数为αi,bj,其第一代为

(13)

式中:αi和bj(j=1,2,…,L)随机产生;G为种群代数;r=1,2,…,NP,NP为种群规模的大小。

2) 根据最小二乘法,分别计算种群个体的输出权重β和均方根误差RMSE,即:

(14)

(15)

Hr,G=

(16)

θr,G+1=

式中:θr,G+1为基于RMSE迭代产生的第G+1代待选向量;ur,G+1是第G+1代试验向量,且ε为预设的极小正值,默认为0.015。在第一代中,RMSE最小的个体表示为θbest,1,其均方根误差表示为RMSEθbest,1。

3) 变异,目标向量θbest,1通过某种变异策略成为变异向量vi,G,4种常用的变异策略为:

策略1

(18)

策略2

(19)

策略3

(20)

策略4

(21)

式中:控制搜索步长的F为变异因子,其服从正态分布;两两均不相同的的θr1,θr2,θr3,θr4,θr5为随机选择的异于父代的向量;控制参数K属于0~1且是随机分配的;索引r1…r5是1、2…NP范围内的随机整数。试验向量变异策略的生成在种群中是按概率pz,G选取的。pz,G(z=1,2,3,4)代表种群中第G代中,策略z被选中的概率。概率pz,G在一个学习周期T内按下面的方式更新:

当G≤T,每一个策略被选中的概率相等,pz,G=1/4。

当G>T

(22)

其中

(23)

式中:nsz,g为G代中由第z个变异策略获得且顺利到下一代的试验向量的数量;nfz,g为G代中由第z个变异策略获得但没有到下一代的试验向量的数量。控制参数F依据正态分布N(0.5,0.3)随机产生。

(24)

式中:交叉率CR在0~1区域内取值;randj随机分配于[0,1];jrand为1,2,...,NP中的随机整数。

5) 把RMSE作为适应度函数。当RMSE值最低时,存储相应的目标向量和试验向量,供下一个群体使用。

6) 重复步骤2)到步骤5),直到达到预先设定的目标值或者最大迭代次数。

3 故障诊断实验分析

3.1 故障诊断模型

基于复合多尺度加权排列熵和SaE-ELM的机车轮对轴承故障诊断流程如图5所示。

图5 所提故障诊断方法的流程图

故障诊断方法主要步骤如下:

1) 信号采集。设定采样频率fs,利用加速度传感器分别采集DF4型内燃机车不同健康状态的轮对轴承试件的振动加速度信号,并将其分为训练和测试样本。

2) 数据处理。对输入的原始样本数据进行归一化,除去其中的奇异值,以免影响识别精度。

3) 计算故障特征。利用CMWPE算法对振动信号进行熵值特征提取,并将CMWPE特征提取后的特征样本作为SaE-ELM模型的训练和测试样本。

4) 模型的训练和建立。网络初始化,设定网络参数,利用SaE对ELM进行优化,寻找最佳参数αi、bi,并计算输出权重β。

5) 故障识别。利用SaE优化后的ELM对测试集进行分类,从而确定机车轮对轴承的故障类型。

3.2 故障诊断实例

本次实验在铁路局机务段完成,所用的不同故障轴承试件如图6所示。所用轴承均是从DF4型内燃机车上拆卸下来的实际机车轮对正常和故障轴承,型号为NJ2232WB,轴承内外径分别为160 mm和290 mm。实验前。实验过程中,轴承由图7所示的JL-501型轴承检测台驱动。检测台主要由台身、电气系统、液压系统和主轴箱组成。主轴箱是试验台的主要部分,待测机车轮对轴承的安装和旋转都是通过主轴箱来实现,主轴转速范围为120~1200 r/min;待测机车轴承的径向加载和卸载主要由液压系统完成。

图6 轮对轴承6种故障类型实物图

图7 JL-501机车轴承检测台

本文利用该检测台对机车轮对轴承进行驱动和加载,设置主轴转速为500 r/min、轴承径向载荷当量为1.4 MPa。利用3个型号为CA-YD-187T的加速度传感器和型号为NI.USB-4431的采集卡完成机车轮对轴承振动信号的采集,振动信号的采样频率fs设置为20 kHz,本文分析数据来自传感器2。

表1给出了正常及图6所示的6种故障状态共7种轮对轴承的状态信息和样本数量,机车轮对轴承的状态标签依次设为1~7。实验过程中分别采集机车轮对轴承试件包含单一和复合故障在内的7种不同健康状态的振动信号,每个样本长度为4 800,样本数量各为80。图8为7种轮对轴承振动信号的时域图。

表1 机车轮对轴承故障类型及样本数量

图8 机车轮对轴承7种状态的时域信号

3.3 特征提取

把不同嵌入维数(m分别设置为4,5,6,7)下的CMWPE应用于两种状态轴承数据的分析过程中,如图9所示。

由图9可知:当嵌入维数m较小(4或5)时,CMWPE熵值拟合线较为平缓,多尺度的优势无法体现,特征区分不明显;而当m较大(7)时,时间序列的细微变化易被忽略,导致两种状态熵值曲线较为接近,无法有效区分故障类型,且大大增加计算量,效率低下。因此,本文选取m=6较为合理。

计算出具有不同故障类别和程度的机车轮对轴承的所有560个振动信号样本的CMWPE值,如图10所示。

图10 图8中7种轮对轴承振动信号的CMWPE

从图10中可以发现正常轮对轴承的CMWPE值从尺度3到5逐渐增加,从尺度5到20逐渐减小。对比于正常轴承,故障轴承的振动信号的总体趋势在不同的比例因子下具有不同的波动。当机车轮对轴承处于正常状态时,信号振动状态更为复杂,信号更无规则,规律性低,蕴含了更多的特征信息,故熵值较大;而当机车轮对轴承出现故障时,振动信号的波动较为规律,自相似性高,故熵值较小。表明不同的故障使得振动信号的复杂性在一定范围内有所不同,这也使得区分各种故障和故障程度成为可能。例如,轮对轴承在状态2、3的振动信号在比例因子为5到10时的CMWPE一直下降,但当比例因子为10到12时,CMWPE将单调增加。当比例因子为3到5时,轴承在状态7的CMWPE增大,而当比例因子大于5时CMWPE的整体性能逐渐降低,且熵值较小。因此,CMWPE可以有效地区分滚动轴承故障部位和程度。

另外,从图10中也可以看出,不同机车轮对轴承振动信号的CMWPE值在第20个尺度时基本没有交叉重叠,区分较为明显。若选择超过20个尺度的CMWPE,易导致信息冗余,影响故障的识别精度;而若选择较小尺度的CMWPE,故障信息则无法完全被提取,故障识别率低。

3.4 模式识别

SaE-ELM的建立首先要求设定相关初始网络参数。将CMWPE作为输入特征向量,由表1可知每种轴承状态有80个样本,随机选取其中40个作为训练样本,剩下40个作为测试样本。

将均方根误差RMSE设为SaE算法的适应度值,SaE的参数自动优化。训练ELM网络,获得最佳的网络性能,然后对机车轮对轴承振动信号数据进行分类识别。变异因子F设为0.5、交叉率CR为0.3、变异策略选择策略3、种群个数设为100以及隐含层节点数设为10。通过比较每类函数所获得的最佳测试结果选择激励函数,最终选择效果更佳的Sigmod函数。

以上述参数训练SaE-ELM模型,并将训练后的SaE-ELM模型用于测试样本的智能识别。模型对280个测试样本的10次平均识别准确率达到100%。由实验可知,τ=20时,CMWPE能够有效地提取机车轮对轴承的故障特征,SaE-ELM模型对不同故障及不同故障程度能很好区分。

3.5 方法对比

将CMWPE值输入到ELM模型中进行分类识别,得到10次平均分类准确率为98.57%。再将MWPE值输入到训练好的SaE-ELM模型中,得到10次平均准确率为87.14%。最后将WPE值输入到SaE-ELM中,得到10次平均准确率为73.57%。不同方法的故障诊断准确率结果如表2所示,显然,所提CMWPE+SaE-ELM方法故障识别率最高,进一步验证了所提故障诊断方法的优越性。

表2 不同方法的准确率对比

4 结论

本文针对DF4型内燃机车真实工况下损伤的轮对轴承的故障类型的判别问题,提出了一种基于CMWPE特征提取与SaE-ELM故障识别的诊断方法。计算机车轮对轴承不同健康状态下振动信号在20个尺度上的WPE构成CMWPE特征向量,输入到训练好的SaE-ELM模型中进行智能故障识别。结果表明,CMWPE能全面准确地表征机车轮对轴承振动信号在不同尺度下的复杂度,并且SaE-ELM模型可以很准确且高效地识别机车轮对轴承的不同故障及不同故障程度。通过对机车轮对轴承试件振动信号的诊断分析,可以得出以下结论:

1) 采用一种能全面提取非平稳时间序列特征信息的方法-复合多尺度加权排列熵(CMWPE),该方法克服了多尺度加权排列熵(MWPE)粗粒化过程的不足,结合了MWPE和复合粗粒化时间序列的优越性;采用SaE对ELM的输入权重、隐含层参数和输出权重进行优化,解决了ELM随机选取网络参数的局限性,提高了网络的分类识别性能。故障诊断的结果表明,所提特征提取方法优于MWPE和WPE,SaE-ELM模式识别效果优于ELM。

2) 提出一种基于CMWPE和SaE-ELM的机车轮对轴承故障智能识别方法。实验表明,该方法识别准确率达到100%,为提高轮对轴承故障的检测精度和效率提供了一种有效的方法。

猜你喜欢
车轮尺度故障诊断
财产的五大尺度和五重应对
车轮的位置
车轮开启赴爱之旅
有趣的车轮转动
宇宙的尺度
修车
因果图定性分析法及其在故障诊断中的应用
9
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断