袁建明,刘 宇,2,胡志辉*,王 磊
(1.武汉理工大学 交通与物流工程学院,湖北 武汉 430063;2.武汉理工大学 海南研究院,海南 三亚 572024)
滚动轴承作为旋转设备的重要零部件,其运行状况与设备的安全性、稳定性息息相关。据统计,在旋转设备的失效案例中,有45%~55%是由滚动轴承发生故障导致的[1]。在实际工程中,滚动轴承常在变负载的工况下运转。因此,提高变负载工况下的滚动轴承故障识别准确率具有重要意义。
随着信号处理和人工智能技术的不断发展,智能故障诊断已成为目前滚动轴承故障诊断的主要发展方向。智能故障诊断本质上是一个故障识别过程,包括故障特征提取和故障模式识别两个重要步骤[2]。近几年,国内外学者提出了多种智能故障诊断方法,如部分学者研究了基于深度学习算法的轴承故障诊断方法,并取得了不错的效果。姚德臣等人[3]研究了基于深度学习的滚动轴承故障诊断方法,实现了对列车滚动轴承进行故障诊断的目的;但其在实际工程中,存在着数据成本高、数量不足等问题,一定程度上限制了深度学习算法的应用。
在故障特征提取方面,受负载、间隙、摩擦等因素的影响,滚动轴承的振动信号通常表现为非平稳性和非线性[4]。鉴于此,一些学者采用非线性动力学方法中的熵值提取信号中隐藏的非线性特征,如样本熵、多尺度熵、排列熵、模糊熵等[5]。其中,排列熵(permut-ation entropy,PE)方法通过比较相邻时间序列的值,检测时间序列的动态变化,其具有对突变信息敏感性强、计算速度快与抗噪声性能好等优点。
XUE Xiao-ming等人[6]采用排列熵方法提取了轴承振动信号故障特征;但排列熵只能用于描述单一尺度上的时间序列信息。为描述不同尺度下时间序列信息,AZIZ W等人[7]在排列熵的基础上,提出了多尺度排列熵(MPE)。刁宁坤等人[8]将MPE用于滚动轴承故障特征提取,并取得了良好的故障识别效果。赵云等人[9]提出了关联积分法优化MPE与核极限学习机相结合的滚动轴承故障诊断方法,取得了较高的故障识别准确率。
虽然MPE可以提取时间序列特征信息,但在MPE中,粗粒化后的序列长度等于原时间序列的长度除以尺度因子,在大的尺度因子下,粗粒化序列长度会急剧变短,使得MPE的粗粒化序列不可避免地遗漏掉一些重要的故障信息[10]。
在故障模式识别方面,支持向量机(SVM)在小样本、非线性和高维模式识别方面具有许多独特的优势,被广泛用于故障诊断领域[11]。在SVM对训练集训练之前,必须先确定核函数参数g以及惩罚因子c,然而SVM的性能对惩罚因子和核函数参数的取值比较敏感,其取值依赖于人工经验,且效果不稳定。为此,研究者使用多种优化算法对参数c和g进行自适应寻优。
YE Mao-you等人[12]把经粒子群优化算法(particle swarm optimization,PSO)优化的SVM作为滚动轴承故障诊断分类器,成功对轴承故障进行了诊断。赵国社等人[13]使用遗传算法(genetic algorithm,GA)对SVM进行了优化。虽然传统智能算法对参数优化具有一定效果;但对于一些复杂问题,其容易陷入局部最优的陷阱。
飞蛾火焰算法(MFO)具有结构简单、运算过程中的参数较少等优点,将其用于SVM参数c和g的优化,可以提高故障分类的精度。例如,HUANG Min-shui等人[14]使用MFO-SVM算法对桥梁结构损伤实现进行了识别,并取得了较好的识别效果。
综上所述,笔者提出插值多尺度排列熵(InMPE),用以充分提取时间序列的故障信息;然后,使用MFO-SVM多分类器,对InMPE故障特征进行故障识别,在此基础上提出一种基于InMPE和MFO-SVM的轴承故障诊断方法;最后,采用不同载荷及轴承状态下提取的故障信号制作样本集,对基于InMPE和MFO-SVM方法的故障识别准确率进行验证。
多尺度排列熵(MPE)是一种可以从多尺度全面表征时间序列复杂性的方法,其具体的计算步骤如下:
(1)
式中:τ为尺度因子;
2)对粗粒化后的序列重构,如下式所示:
(2)
式中:m为嵌入维数;λ为时间延迟;l=1,2,…,N-(m-1)λ为重构分量;
3)将式每一位置的元素按照数值大小进行升序排列,用p1,p2,…,pk表示每一种排列情况出现的概率,则归一化的PE可定义如下:
(3)
4)计算给定的所有尺度因子的PE,便可得到MPE。
在τ=2和3的情况下,MPE的粗粒化方式如图1所示。
图1 MPE粗粒化方式
由图1可知:传统的MPE的粗粒化过程是将原始序列按照尺度因子依次进行压缩。由于原始时间序列为有限长度,当尺度因子逐渐增加时,粗粒化后的序列长度变短,会导致熵值偏差增大。
此外,以τ=2为例,在MPE的粗粒化过程中,只能提取x1和x2之间,以及x3和x4之间的故障信息,却忽略了x2和x3之间的故障信息;同理,在τ=3时,只能提取x1、x2和x3之间的故障信息,而忽略了x2、x3和x4之间的有用信息。此时,所提取的熵值无法充分表征轴承的故障信息。
针对MPE算法提取故障特征的不足,笔者提出了插值多尺度排列熵(InMPE),以改进MPE的粗粒化过程。
具体改进算法如下:
1)当尺度因子τ=1时,仍为原时间序列;
(4)
(5)
4)以此类推,直至计算出所有尺度因子下的粗粒化时间序列为止。
在τ=2和3情况下,InMPE粗粒化方式如图2所示。
图2 InMPE粗粒化方式
由图2可知:在粗粒化过程中,InMPE算法时间序列中,除首尾两个数据点外,其余数据点均被使用两次,这样不仅改善了粗粒化带来的序列长度变短的问题,而且可以充分挖掘时间序列的故障信息,弥补了MPE算法的缺陷。
为了说明InMPE算法提取特征的有效性,笔者利用美国凯斯西储大学的滚动轴承振动数据对InMPE算法进行分析验证[15]。其中,InMPE有4个参数需人为设定,分别为尺度因子τ、时间延迟λ、样本长度N和嵌入维数m。在粗粒化时,对尺度因子τ的取值没有固定要求,一般τ大于10即可,此处取τ为20。时间延迟λ一般取为1。
为探究时间序列长度N对InMPE的影响,笔者取时间序列长度N=2 000、3 000、4 000、5 000、6 000的轴承内圈轻度故障数据样本作为研究对象,取嵌入维数m=3,提取它们的InMPE值。
为说明嵌入维数m对InMPE的影响,笔者取时间序列长度N为4 000的轴承内圈轻度故障数据样本作为研究对象,提取它们的InMPE值。
采用上述方法得到了不同参数对InMPE的影响情况,如图3所示。
图3 不同参数对InMPE的影响
由图3(a)可知:InMPE对N取值不敏感,笔者取样本长度N为4 000;
由图3(b)可知:当嵌入维数m从3逐渐增加至6时,时间序列InMPE曲线均保持相同的变化趋势。由此可知,InMPE受嵌入维数的影响小,在嵌入维数较小的情况下,熵值仍可以随尺度因子的增大而保持稳定变化趋势,笔者取嵌入维数m为3。
为说明InMPE在不同负载工况下的特征提取优越性,笔者以0 hp、1 hp、2 hp、3 hp负载下采集的内圈轻度故障轴承振动信号作为研究对象,并取样本长度N=4 000,嵌入维数m=3,时间延迟λ=1。
笔者采用上述方法得到了不同负载对MPE和InMPE的影响情况,如图4所示。
图4 不同负载对MPE和InMPE的影响
计算结果表明:在轴承故障特征的提取过程中,InMPE可以消除负载变化所造成的影响。由此可见,与MPE相比,InMPE更适用于变负载下的轴承故障特征提取。
MFO算法是一种受自然生物启发的智能优化算法。在MFO算法中,飞蛾表示问题的候选解,飞蛾的位置表示该问题的变量;飞蛾在空间中改变位置向最优位置靠拢,火焰表示飞蛾在当前迭代时所找到的最优位置[16]。
MFO算法的优化过程如下:
2.1.1 种群初始化
假设飞蛾种群和火焰的集合定义如下:
(6)
式中:M为飞蛾种群;m为单只飞蛾;n为飞蛾的个数;r为控制变量的数量;OM为飞蛾所对应的适应度值。
(7)
式中:F为火焰的位置;OF为火焰所对应的适应度值。
因为飞蛾与火焰是一一对应的,所以飞蛾与火焰的维度相同。
2.1.2 螺旋机制
种群中的每只人工飞蛾Mi围绕特定的火焰Fj进行位置更新,使用对数螺旋S(Mi,Fj)作为飞蛾的更新机制,如下式所示:
S(Mi,Fj)=Dij·eηt·cos(2πt)+Fj
(8)
式中:Dij为飞蛾到火焰的距离;η为螺旋线的形状;Fj为第j个火焰;t为[-1,1]内的随机数。
其中:
Dij=|Fj-Mi|
(9)
2.1.3 火焰更新机制
MFO算法每次迭代更新时,飞蛾会朝向较优的火焰做螺旋运动。使用计算式可以自适应地减少火焰数量,过程如下式所示:
(10)
式中:T为当前迭代次数;T0为最大迭代次数。
MFO算法伪代码如下:
用式(10)计算更新火焰数量;
计算飞蛾的适应度函数值;
if迭代次数为1
F=sort(M);
OF=sort(M);
else
F=sort(MT,MT-1);
OF=sort(MT,MT-1);
end
fori=1:n
forj=1:r
更新c和g;
计算飞蛾与火焰间的距离;
更新飞蛾与火焰之间的距离;
end
end
执行上述函数直至终止条件,此时最佳飞蛾作为获得的最佳近似值返回。
为解决支持向量机性能易受惩罚因子c和核函数参数g影响的问题,笔者使用MFO算法优化SVM参数。
MFO-SVM流程图如图5所示。
图5 MFO-SVM流程图
具体步骤如下:
1)输入训练特征样本集和测试特征样本集,确定适应度函数;
2)初始化MFO参数,设定种群规模n、最大迭代次数T0、螺旋函数常数η,确定SVM参数c和g的搜索范围;
3)在设定范围内随机生成飞蛾,计算各飞蛾的适应度函数值,找到最优飞蛾个体位置并保存在火焰矩阵F中;
4)判断迭代次数,当迭代次数T超过最大迭代次数T0时,输出最佳参数c和g,执行步骤6),否则进行下一步;
5)采用式(10)更新火焰数量,然后利用式(8)更新飞蛾和火焰的位置,计算飞蛾的适应度值,更新并保存飞蛾和火焰的空间位置,找到最优飞蛾个体位置,并返回步骤4);
6)用最优参数c和g训练SVM预测模型,并利用该模型对测试集样本进行故障分类;
7)分析测试结果,评估模型性能。
在获取轴承的振动信号之后,首先需要使用InMPE进行熵值特征提取,构成特征数据集;其次,划分特征样本的训练集和测试集,并利用训练集对MFO-SVM分类器进行训练,使用测试集对训练完成的MFO-SVM分类器进行测试评估;最后,进行轴承故障的识别与诊断。
滚动轴承的故障诊断流程图,即诊断模型如图6所示。
图6 滚动轴承故障诊断流程图
滚动轴承故障的具体诊断步骤如下:
1)假定滚动轴承有u种故障状态类型,每种类型采集v组样本,并根据信号数据分析确定InMPE的4个参数;
2)计算各样本的InMPE值,作为输入特征向量;
3)整理所有InMPE数据,根据故障类型设置u个标签,每种类型选取部分样本组成训练样本集,剩余样本组成测试样本集;
4)确定MFO初始参数(种群数量n、最大迭代次数T0和对数螺旋常数η),采用训练特征样本集对MFO-SVM分类器进行训练,得到最佳参数c和g及对应的最佳分类器模型;
5)用训练完成的MFO-SVM分类器,对测试特征样本集进行模式识别,根据分类器输出结果判断滚动轴承故障位置和故障程度。
为验证基于InMPE与MFO-SVM方法的有效性,笔者搭建了轴承故障诊断实验台。
其中,轴承型号为cbs6209,转速为1 000 r/min;传感器的采样频率为12 000 Hz。
使用激光切割的方法在轴承的内圈、外圈和滚动体分别切割0.3 mm、0.6 mm、0.9 mm的缺陷,对应轻度故障、中度故障和重度故障。
轴承故障诊断实验台如图7所示。
为了构造有效数据集,在0 N·m、6 N·m、12 N·m、18 N·m这4种负载工况下,笔者只采集健康轴承以及3种故障程度轴承的振动信号数据。
实验一共采集10种状态的滚动轴承振动信号,分别记为:正常NOR、内圈轻度故障IRF1、内圈中度故障IRF2、内圈重度故障IRF3、外圈轻度故障ORF1、外圈中度故障ORF2、外圈严重故障ORF3、滚动体轻度故障BEF1、滚动体中度故障BEF2、滚动体重度故障BEF3,每种状态都包含上述4种负载工况。
为研究时变载荷下的滚动轴承故障诊断问题,笔者将实验所采集的同一轴承在不同负载下采集的振动信号数据进行随机切分,并打乱混合,以构造出轴承在时变负载工况下的振动信号数据样本;将处于不同负载下的同一故障轴承的振动信号数据均标为一种标签,以达到构造时变负载工况下滚动轴承振动信号数据集的目的。
针对10种状态下的滚动轴承振动信号,笔者在4种定负载下各取50个样本,每个样本数据长度均为4 000(其中,每个标签对应同一故障轴承4种负载下的样本,即每个标签对应200个样本);对采集到的振动信号,按照3∶2的比例进行分割,得到SVM的训练集和测试集(样本数量分别为120和80)。
InMPE的参数与前文相同(即尺度因子τ=20、时间延迟λ=1、样本长度N=4 000、嵌入维数m=3)。
由于MFO-SVM的模式识别准确率和效率受火焰和飞蛾种群数量以及迭代次数的影响不大,笔者参照文献[17],取火焰数量和飞蛾数量为50,迭代次数为50,对数螺旋形状常数为1.5。
SVM中惩罚因子c与径向基核函数参数g取值范围分别为[0,100]和[0,1 000]。
4.3.1 故障识别准确率分析
为对比InMPE的特征提取性能,笔者从原始振动信号中分别提取MPE和InMPE,并分别构建特征数据集,使用MFO-SVM多分类器进行故障识别分类。
采用MPE/InMPE+MFO-SVM的识别结果如图8所示。
图8 MPE/InMPE + MFO-SVM识别结果
由图8(a)可知:基于MPE和MFO-SVM方法的故障诊断准确率为95.9%,相对于内圈中度故障类型以及滚动体重度故障类型,用其训练的SVM模型的识别准确率均低于90%。
其中:80个内圈中度故障测试样本中,有10个被误判到其他故障类型,这类测试样本的分类准确率为87.5%;80个滚动体重度故障测试样本中,有11个被误判到其他故障类型,这类测试样本的分类准确率为86.3%。
进一步分析发现,原本属于内圈中度故障的测试样本中,有9个被误判到滚动体重度故障;相反地,原本属于滚动体重度故障的测试样本中,有7个被误判到内圈中度故障。
这是由于这两种故障类型的样本出现了混叠现象,导致MPE提取的故障特征所训练的分类模型无法准确地判别故障类型。
由图8(b)可知:基于InMPE和MFO-SVM方法的故障诊断准确率达到98.5%。
在80个内圈中度故障的测试样本中,只有1个样本被误判,这类标签的分类准确率达到98.8%,高于MPE和MFO-SVM的87.5%准确率;在80个滚动体重度故障测试样本中,只有2个样本被误判,其单个标签的分类准确率为97.5%,同样高于MPE和MFO-SVM的准确率86.3%。
上述分析结果表明:相比基于MPE和MFO-SVM的方法,基于InMPE和MFO-SVM的方法更适合处理变负载工况下滚动轴承的故障诊断问题。
为说明小样本下InMPE和MFO-SVM的故障识别效果,在参数相同的情况下,笔者分别使用训练样本数量为20和40的训练MFO-SVM模型,使用数量为80的测试特征样本数据进行故障识别测试,得到小样本数量下故障识别准确率,如表1所示。
表1 小样本数量下故障识别准确率
由表1可知:在使用较少的训练特征样本集训练MFO-SVM分类模型的情况下,基于InMPE和MFO-SVM方法的平均故障识别准确率为98.13%,MPE-MFO-SVM方法的平均故障识别准确率94.5%。
该结果表明,样本数量对两种方法的识别准确率影响不大。
4.3.2 MFO-SVM分类器性能分析
为说明MFO-SVM分类器的优越性与高效性,笔者将其与粒子群优化支持向量机、遗传算法优化支持向量机和网格优化支持向量机(grid search SVM,GS-SVM)进行对比。
笔者提取振动信号的InMPE,并使用上述各种分类器进行10次试验,分别记录其故障平均识别准确率和平均识别时间。
各分类器的SVM参数c和g的取值范围均为[0,100]和[0,1 000]。
各分类器的其他参数设置如表2所示。
表2 各分类器的其他参数设置
不同分类器平均识别准确率和识别时间如图9所示。
图9 不同分类器平均识别准确率和识别时间
由图9可知:在平均识别准确率方面,MFO-SVM分类器的平均识别准确率达到98.53%,高于另外3种分类器;
在平均识别时间方面,PSO-SVM、GA-SVM和GS-SVM的识别时间分别是MFO-SVM分类器用时的18.2倍、1.5倍和1.2倍。
上述结果表明,MFO-SVM分类器具有优越性和高效性。
4.3.3 噪声背景下鲁棒性分析
实际运行中,滚动轴承的振动信号包含强烈的环境噪声,且其初期故障属于微弱故障,在强噪声干扰下,故障特征被一定程度隐匿,难以提取,这使滚动轴承故障诊断具有很大的挑战性。
在噪声背景下,为了探究InMPE提取特征的可靠性,笔者给所有信号样本添加信噪比为10 dB的白噪声,分别使用InMPE和MPE提取的故障特征训练MFO-SVM分类器,在模型训练完成之后,分别将其输入相对应的测试集进行故障分类,得到噪声背景下识别结果和混淆矩阵,如图10所示。
图10 噪声背景下识别结果和混淆矩阵
由图10可知:加入相同白噪声后,基于InMPE和MFO-SVM方法的识别准确率为92.4%,而基于MPE和MFO-SVM方法的识别准确率为80.0%。该结果表明,基于InMPE与MFO-SVM方法具有较好的鲁棒性。
由于在变负载工况下,提取滚动轴承故障特征较为困难,且其故障识别准确率也较低,为此,笔者提出了一种将InMPE与MFO-SVM相结合的滚动轴承故障诊断方法。首先,用InMPE来提取轴承振动信号的故障特征;随后,构建了MFO-SVM故障识别模型;最后,通过搭建滚动轴承故障诊断实验台,对基于InMPE与MFO-SVM方法的有效性和优越性进行了验证。
研究结论如下:
1)InMPE算法克服了MPE粗粒化过程中提取特征不充分的问题,因此,该算法更适合在变负载工况下提取滚动轴承的故障特征;
2)与常用的GA-SVM、PSO-SVM和GS-SVM方法相比,MFO-SVM的识别准确率和识别速度均更优;
3)在变负载轴承故障诊断试验中,InMPE和MFO-SVM方法识别准确率达到了98.5%,噪声背景下的识别准确率仍可达到92.4%,均优于对应的MPE和MFO-SVM方法。
目前,笔者仅对单一故障下的滚动轴承进行了故障诊断,而在实际工程中,更多的可能是同时存在多种故障。因此,在下一阶段,笔者考虑将基于InMPE与MFO-SVM的方法用于混合故障情况下的滚动轴承故障诊断。