李娜娜,万 中
(1.西安交通大学城市学院 机械工程系,陕西 西安 710018;2.西安昆仑工业集团有限公司,陕西 西安 710043)
滚动轴承的健康状况直接影响整个旋转机械设备的性能和可靠性。一旦轴承出现故障,轻则会降低产品的加工质量或加剧设备的振动噪声,重则造成严重的安全事故。因此,研究滚动轴承的故障诊断策略具有积极的工程价值[1-2]。
在真实的机械系统中,由于存在摩擦、阻尼、冲击等多种因素的影响,使得滚动轴承振动信号中的故障信息是相互耦合的。基于熵的特征提取指标(例如,近似熵、样本熵、模糊熵和排列熵等),因为其能够有效处理非线性数据,而被广泛应用于旋转机械的故障诊断中[3]。
李卫民等人[4]采用近似熵来表征异步电机的故障状态,利用支持向量机的识别结果验证了近似熵的有效性;但近似熵对短序列的分析精度较低。邹龙庆等人[5]提出了基于局部均值分解和样本熵的故障诊断方法,结果验证了样本熵的性能优于近似熵;但样本熵基于阶跃函数进行定义,无法考虑数据的模糊特性。ZHANG Xiao-yuan等人[6]采用排列熵检测并诊断滚动轴承的故障状态,结果表明,排列熵不仅可以用于准确地筛选出健康轴承,而且能够有效识别故障轴承;但排列熵忽略了信号中的幅值信息[7]。随后,OMIDVAR-NIA A等人[8]对样本熵进行了改进,提出了极差熵(range entropy,RE),并基于多种故障信号,对RE方法的优越性(与样本熵和近似熵进行对比)进行了验证;但RE方法只用于进行信号的单尺度分析,忽略了其他尺度的信息。
为将RE方法扩展至多尺度分析,李富国等人[9]2基于粗粒化处理,提出了多尺度极差熵(multiscale range entropy,MRE),并将其用于滚动轴承的故障诊断,结果证明了MRE方法的有效性;但MRE方法的粗粒化处理存在较大缺陷,遗漏了其它尺度上的故障信息。随后,ZHENG Li-kang等人[10]提出了改进多尺度极差熵,证实了改进粗粒化处理的优势;但基于粗粒化处理的多尺度分析无法用于提取信号的高频特征,遗漏了大量的故障信息。为此,周杰等人[11]采用层次分析对信号进行了处理,结合RE方法提出了层次极差熵(hierarchical range entropy,HRE),通过滚动轴承的故障诊断,结果证明了HRE方法明显优于MRE方法;但HRE方法的层次处理不够精细,遗漏了部分故障信息。
针对上述问题,笔者基于改进的层次分析对时间序列进行处理,提出一种改进层次极差熵算法,以同步提取信号中低频和高频的故障特征;在此基础上,结合鲸鱼算法优化的极限学习机模型,提出一种基于IHRE和WOA-ELM的滚动轴承故障诊断策略。
首先,使用IHRE方法提取滚动轴承振动信号的故障信息,构建故障特征向量;然后,随机抽取部分特征向量对WOA-ELM分类器进行训练;最后,将剩余的测试样本输入至训练好的分类器中,进行滚动轴承故障的识别。
RE方法的理论如下:
(1)
(2)
(3)
(4)
式中:r为相似容差;Ψ( )为Heaviside函数。
其中:
(5)
(6)
(7)
多尺度极差熵方法虽然能够对信号进行多尺度分析,但根据WANG Xian-zhi等人[13]的研究,粗粒化处理的固有缺陷导致其只能分析信号的低频特征信息,而忽视了信号的高频特征。
为此,笔者通过借鉴层次分析的优势,提出了HRE方法。该方法不仅能对信号进行多尺度分析,而且能够同时提取信号低频和高频的特征。
给定振动信号X={x1,x2,…,xN},其中,N=2n(n=1,2,…),则HRE定义如下:
1)定义一个平均算术符Q0如下:
(8)
长度为2n-1的信号Q0(X)表示原信号X经过单次层次分解后的平均分量;
2)定义一个差分算术符Q1如下:
(9)
长度为2n-1的信号Q1(X)表示原信号X经过单次层次分解后的差值分量。原信号X能够通过Q0(X)和Q1(X)表示如下:
x2j-1=(Q0(X))j+(Q1(X))j,
x2j=(Q0(X))j-(Q1(X))j
(10)
据此,信号Q0(X)和Q1(X)组成了对信号X进行多次层次分析的第二层。算术符Qj(j=0/j=1)可定义为一个矩阵:
Qj=
(11)
算术符Qj的矩阵形式由信号X的长度所决定。为了表征X的多层次分析,算术符将被重复利用;
3)令e为整数,且0≤e≤2n-1;令Li(i=1,2,…,n)等于0或1。对于给定的e,存在唯一向量组[L1,L2,…,Ln],使得:
(12)
4)信号X第n+1层的第e+1个层次节点定义如下:
Xn,e=QLn·QLn-1·…·QL1(X)
(13)
式中:QLi为X0,0到Xn,e的第i次层次分割。
若第i次层次分割为平均计算,则QLi=Q0,即Li=0;若第i次层次分割为差分计算,则QLi=Q1,即Li=1;
5)计算每个节点Xn,e的极差熵,即得到了原信号X的HRE,定义为:
HRE(X,m,r,k)=RE(Xn,e,m,r)
(14)
虽然HRE方法实现了从低频和高频两个频段来表征信号的复杂性,但其与MRE方法类似,所采用的层次分割不够精细,导致随着分解层数的增加,层次分量Xn,e的长度显著减小,降低了复杂性的测量精度。为此,笔者借鉴柏世兵等人[14]提出的改进层次分割处理,结合极差熵,提出了改进层次极差熵。
其原理如下:
1)对于信号{x1,x2,…,xN},定义平均算术符Q0(x)和差分算术符Q1(x)如下:
(15)
式中:N为信号的数据长度,为大于1的正整数,其避免了传统层次分析必须要求数据长度N=2n的缺陷;Q0(x)为信号的低频信息;Q1(x)为信号的高频信息;
(18)
3)为了完成信号的层次分析,需重复利用步骤2)中的算术符。对于分解层数k∈N+,建立长度为k的向量sm=[s1,s2,…,sk],则整数e可以定义如下:
sm∈{0,1},m=1,2,…,k
(19)
式中:sm为第m层的平均算术符Q0或差分算术符Q1;
4)基于向量sm=[s1,s2,…,sk],定义信号xi的层次分量如下:
(20)
式中:Xk,e为信号x第k层的节点e上的层次分量;
5)计算每个节点Xk,e的极差熵,即实现了信号的IHRE分析目的,定义如下:
IHRE(x,m,r,k)=RE(Xk,e,m,r)
(21)
以k=2为例,对应的层次分解和改进层次分解过程如图1所示。
图1 2层的层次和改进层次分解过程
综合上述分析可知:改进的层次分析弥补了多尺度分析只考虑信号低频分量而忽略高频分量中故障信息的缺陷;同时,相较于传统的层次分析,改进的层次分析缓解了传统层次分析方法存在的“随着层次层数增加,统计可靠性降低”的缺陷。
极限学习机是一种单隐层神经网络,其具有学习速度快、泛化性能好的优点。但其输入权重和隐含层阈值会严重影响模型的稳定性和可靠性,干扰分类识别的准确率[15]。
为此,笔者采用鲸鱼算法(WOA)对极限学习机(ELM)的输入权重和隐含层阈值进行优化[16]。
WOA算法是MIRJALILI S等人[17]通过模拟座头鲸的捕食行为而开发的一种智能算法,其具有操作简单、参数少等优点。
WOA优化ELM的具体步骤如下:
1)初始化ELM的输入权重和隐含层阈值,并将其作为WOA中鲸鱼个体的起始坐标;
2)求解种群中全部个体的适应度值,搜索到最优的鲸鱼个体,并存储目前最优个体的坐标;
3)若未达到最大迭代次数,则更新鲸鱼个体与猎物之间的方位,并进入下次迭代;
4)当符合条件时,保留当前最优鲸鱼个体坐标,其坐标即对应ELM的最优参数。
在IHRE方法中,需要设置4个参数(即信号数据长度N,嵌入维数m,相似容差r和分解层数k)。
基于李富国等人[9]4的研究,笔者将参数设置为m=2,r=0.2;参考SONG En-zhe等人[18]的研究,将分解层数设置为k=3。
白噪声和1/f噪声是2种典型的随机噪声,两者的差异在于白噪声的复杂性随着频率的增加而减小,1/f噪声在全频段都具有较大的复杂度。因此,笔者通过对这两种噪声信号进行分析,以检测算法的有效性。
笔者以数据长度为1 024、2 048、4 096的白噪声和1/f噪声为对象,首先研究数据长度对IHRE算法性能的影响,并将其与HRE,MRE进行比较,3种方法的参数保持相同,而MRE的尺度因子设置为8。
3种方法的分析结果如图2所示。
图2 不同长度N下IHRE,HRE和MRE对两种噪声的分析结果
由图2可以发现:1)对于不同长度的两种噪声,其IHRE曲线基本重合,且能够较明显地区分两种噪声,说明样本长度对IHRE的影响较小,因此,笔者设置N=2 048;2)对比图2(a)、图2(b)和图2(c)可以发现,在分析同一长度的噪声信号时,IHRE的熵值曲线具有最小的标准差,证明改进的层次分析方法在分析稳定性方面优于层次分析和粗粒化分析;3)IHRE在分析噪声信号时,1/f噪声的熵曲线一直呈现波动,这表明1/f噪声在高频时也具有较大的复杂度(与理论一致);而1/f噪声的MRE曲线呈现下降的趋势,表明1/f噪声的复杂度随着尺度的增加而减小(与理论不一致),验证了IHRE方法的有效性。
为了证明基于IHRE方法在分析非线性数据中的有效性和优越性,笔者提出了一种基于IHRE和WOA-ELM的滚动轴承故障诊断策略。该策略的详细步骤如下:
1)假定有m种不同的滚动轴承故障数据,将其等分为n个样本,对全部样本进行IHRE故障特征提取,选择8个尺度的IHRE值作为故障特征向量;
2)从不同工况样本的特征向量中随机抽取j个样本构造训练集,其余构造测试集;
3)对基于WOA-ELM构建的多类别分类器进行训练,得到参数最优的分类模型;
4)对测试数据进行分类,根据分类器的输出标签来判断滚动轴承的健康状态。
笔者采用东南大学数据集进行基于IHRE和WOA-ELM的滚动轴承故障诊断算法的性能分析。该数据集由齿轮箱数据集和滚动轴承数据集组成。
笔者采用动力传动系统模拟器进行数据集的采集。实验装置如图3所示。
图3 实验装置
该装置的主要结构包含电动机、制动器、控制器模块和行星齿轮箱、平行齿轮箱。笔者利用布置在驱动电机、行星齿轮箱和平行齿轮箱表面的振动传感器,以5 120 Hz的频率收集振动信号,模拟器的转速和负载配置分别为20 Hz/0 V和30 Hz/2 V,笔者选择30 Hz/2 V下的滚动轴承数据进行实验,该数据包含5种不同的工况,分为1种健康状态和4种故障状态。
滚动轴承故障数据集的描述如表1所示。
表1 滚动轴承故障数据集描述
笔者将每种故障类型的数据选择60组长度为2 048的样本(其中,20组样本用于构建训练集,剩余40组样本作为测试集)。因此,总共有100个训练样本,200个测试样本。
为了获得能够反映滚动轴承故障本质的故障特征,笔者利用IHRE方法对振动信号进行分析,所提取的故障特征如图4所示。
图4 滚动轴承样本的IHRE故障特征
由图4可以发现:IHRE对样本有一定的区分效果,在部分尺度上能够较好地区分故障,但仍然需要进一步验证其性能。
为了评估上述模型的性能,并分析滚动轴承样本的损伤状态、完成故障的识别,笔者将基于IHRE方法提取的故障特征输入至WOA-ELM分类器进行识别。
首先,笔者采用100组样本对WOA-ELM分类器进行训练,获得参数最优的分类器;随后将200组样本输入至训练完备的分类器,进行测试,以识别故障类型。其中,WOA的种群规模设置为20,迭代次数设置为100。
IHRE方法的WOA-ELM识别结果如图5所示。
图5 IHRE方法的WOA-ELM混淆矩阵
随后,为了进一步评估IHRE方法的优越性,笔者将由改进层次样本熵(improved hierarchical sample entropy,IHSE)、HRE和MRE提取的故障特征,分别输入至WOA-ELM分类器,进行故障类别的识别,并统计了各个方法在特征提取中所耗费的时间。
4种方法的详细故障识别结果如表2所示。
表2 4种故障诊断方法的详细识别结果
结合图5和表2可以发现:IHRE+WOE-ELM方法的识别准确率为100%,能够准确地识别滚动轴承的故障类型。
横向来看,基于RE的特征提取方法(IHRE)优于基于SE的特征提取方法(IHSE),这表明RE方法的性能优于SE,这与已有的结论一致。
从纵向来看,改进的层次分析优于传统的层次分析,而传统的层次分析优于粗粒化处理,这与之前的理论分析一致(这是因为层次分析考虑了信号的高频特征信息,在特征提取上较粗粒处理更加全面。而改进的层次分析由于采用滑动的平均处理,相较于传统的层次分析更加精细,因此IHRE的准确率更优)。
最后,从效率方面来看,IHRE方法的效率最差,需要681.41 s来提取故障特征;HRE方法的效率最高,只需要70.25 s,但由于IHRE方法的识别准确率最高,因此,综合来看IHRE是有效的。
随后,为了验证4种方法在实际工况下的抗干扰性能,笔者在相同条件下重复进行50次分类实验,以观察4种方法的平均分类准确率。
采用4种方法分别进行50次实验,所得到的结果如表3所示。
表3 4种方法50次实验的详细结果
从表3可以发现:IHRE方法的平均准确率达到了99.82%,高于其他4种方法,证明了IHRE方法具有极强的稳定性,能够保证每次的分类结果都是可靠的;IHSE方法的平均识别准确率也达到了97.99%,也具有很强的故障诊断性能,但其最小准确率只有94.5%,证明其性能不是非常稳定,容易出现错误识别的结果;HRE和MRE的识别结果非常差,平均识别准确率只有66.13%和52.93%,无法保证故障的准确识别,因此可以说明HRE和MRE方法不适用于该数据的故障识别。
总体而言,IHRE和IHSE方法都具有优异的性能,而IHRE方法在稳定性方面略优于IHSE。
为了进一步验证IHRE和IHSE方法的性能,笔者将不同数量的故障特征依次输入至WOA-ELM分类器中进行故障识别,得到了不同特征数量时的分类准确率结果,如图6所示。
图6 不同特征数量时的分类准确率
从图6可以发现:IHRE准确率曲线一直在IHSE曲线的上方,证明在输入不同数量的特征时,IHRE的准确率均高于IHSE方法;在输入第5个特征时,IHRE方法已经能够取得100%的识别准确率,这证明IHRE方法可以在仅需少量特征的情况下准确识别滚动轴承的故障,故IHRE优于IHSE方法。
最后,为了验证WOA-ELM的性能,笔者利用粒子群优化的极限学习机(particle swarm optimization extreme learning machine,PSO-ELM)、蝙蝠算法优化的极限学习机(bat algorithm-extreme learning machine,BA-ELM)和遗传算法优化的极限学习机(genetic algorithm-extreme learning machine,GA-ELM)进行对比,将IHRE故障特征输入至这4种分类器进行识别,并统计分类的时间,得到不同分类器的故障识别结果,如表4所示。
表4 不同分类器的故障识别结果
由表4可以发现:WOA-ELM和BA-ELM都实现了100%的分类准确率,但WOA-ELM的效率更高;同时,PSO-ELM和GA-ELM的准确率均低于WOA-ELM分类器,且分类时间也多于WOA-ELM。
由此可见,WOA-ELM不仅具有较好的泛化性,而且还具有较高的分类效率。
由于传统的多尺度熵特征提取方法无法提取信号的高频故障特征,造成特征提取不够完整,故障识别准确率也较低。为此,笔者提出了一种基于IHRE和WOA-ELM的滚动轴承故障诊断策略,并利用东南大学滚动轴承数据进行了实验和分析,验证了该故障诊断策略的有效性和优越性。
研究结论如下:
1)IHRE方法避免了MRE方法无法分析信号高频分量的缺陷,同时优化了HRE方法依赖数据长度的问题,其分析更加全面和充分,更适合于提取滚动轴承的故障特征;
2)与常见的GA-ELM、PSO-ELM和BA-ELM相比,WOA-ELM分类器在识别精度和效率方面更具有优势;
3)在故障诊断实验中,IHRE+WOA-ELM的故障诊断方法取得了100%的识别准确率和99.82%的平均准确率,均优于对应的3种对比方法;同时,IHRE方法仅需5个特征即可实现故障的准确识别,性能优于IHSE方法。
在后续的工作中,笔者将针对极差熵的快速计算开展研究,以进一步提高IHRE的特征提取效率。