卢艳静,许艳英,包宋建
(1.河南师范大学 电子与电气工程学院,河南 新乡 453007;2.三门峡社会管理职业学院 信息工程学院,河南 三门峡 472000;3.重庆科创职业学院 人工智能学院,重庆 402160;4.重庆文理学院 电子信息与电气工程学院,重庆 402160)
由于滚动轴承是各类工业设备中必不可少的零件,对其开展状态监测非常有必要[1]。在轴承的故障诊断中,信号处理、特征提取和模式识别是3个典型环节,而特征提取往往被认为是故障诊断的关键[2,3]。
滚动轴承的振动信号为非线性、非平稳的时间序列,线性方法对此不适用。目前,样本熵[4]、排列熵[5]、散布熵[6]等非线性分析方法被大量应用于故障诊断领域,并取得了不错的效果[7]。但上述方法都是从单一尺度开展信号的度量,而滚动轴承故障信号的动力学信息分布在多个尺度,只开展单个尺度的评估会造成动力学信息的丢失,进而无法准确地提取其中的故障信息[8]。
为此,学者们提出了多尺度分析方法,如多尺度样本熵(MSE)、多尺度排列熵(MPE)和多尺度散布熵(multiscale dispersion entropy,MDE)等,将单一尺度的熵值指标扩展为多尺度计算,从而实现从多个尺度分析时间序列复杂性的目的。
例如,孟宗等人[9]将MSE与局部均值分解相结合,用于滚动轴承的故障诊断,取得了不错的效果;然而MSE无法准确地分析短时间序列的复杂度。WU Shuen-de等人[10]将MPE用于滚动轴承的故障特征提取,支持向量机的分类结果验证了MPE的有效性;但是MPE忽略了信号的振幅信息。乔新勇等人[11]将MDE与变分模态分解相结合,用于柴油机的故障诊断,验证了MDE相较于MPE的优越性;但MDE需要设置大量的参数,参数敏感性较显著。
Lempel-Ziv复杂度(Lempel-Ziv complexity,LZC)是LEMPEL A等人[12]提出的一种测量时间序列复杂度的指标,其完全基于数据的固有特性,因而不需要设置任何参数,其泛化性较强。
YU Kun等人[13]在LZC指标的基础上,提出了多尺度LZC(multi-scale Lempel-Ziv complexity,MLZC)指标,并用于滚动轴承的故障诊断,取得了不错的效果;但是MLZC的粗粒化处理在进行粗粒化的过程中,子序列长度会随着尺度的增加而变少,这会造成信号中的有效信息丢失,进而影响对信号的描述。张小龙等人[14]将固有时间尺度分解和LZC指标相结合,提出了自适应多尺度LZC指标,实现了滚动轴承故障的准确识别目的;但是该方法需要对分解后的分量进行筛选,增加了不确定性。
针对MLZC的缺陷,笔者基于时移粗粒化处理的思想,对LZC进行改进,提出时移多尺度Lempel-Ziv复杂度(TSMLZC),以便于更加可靠地提取轴承振动信号的故障特征,并且减少设置的参数数量;在此基础上,提出基于TSMLZC和灰狼优化器(GWO)-支持向量机(SVM)的滚动轴承故障检测方法。
首先,利用TSMLZC对轴承振动信号进行分析,构造故障特征样本;随后,随机选择一部分样本对WOA-SVM进行训练,构建参数和泛化性最优的分类器模型;最后,将剩余的特征样本输入至优化后的分类器进行故障识别,利用2种滚动轴承故障数据对所提方法的有效性进行验证,并将其与其他故障诊断方法进行对比。
MLZC综合分析了信号在多个时间尺度下的结构复杂性,可以有效地描述信号的动力学变化状况。LZC算法的原理可以参考张超等人的研究[15]。
MLZC的详细算法如下:
对故障信号{x(i),i=1,2,3,…,N}执行粗粒化分析生成新的子序列:
(1)
式中:[]为向下取整函数;s为尺度因子。
分别计算各尺度粗粒化信号的LZC值,得到原始信号的MLZC。
然而,应用MLZC进行信号故障特征提取面临下列缺陷:
1)粗粒化造成序列长度减小。对x(i)进行尺度为s的粗粒化处理,生成的粗粒序列长度为[N/s]。以s=2为例,此时的粗粒化处理如图1所示。
图1 MLZC粗粒化过程
2)粗粒化操作的本质是在信号上引入了步长为s的滑动窗口,再对每个窗口的数值取平均,以此来获得粗粒化信号。信号中的每个数据仅使用一次,这造成不同窗口间元素的特征遗失(例如,当s=3时,粗粒信号遗漏了数据点x2、x3和x43个数据点的固有关系)。
为缓解MLZC遗漏故障信息和对数据长度的依赖,增加其描述信号复杂度的准确程度,笔者对MLZC进行了改进,提出了TSMLZC的思想。其主要原理描述如下:
对于信号{x(i),i=1,2,3,…,N},进行时移粗粒处理,获得时移粗粒信号:
yk,β=(xk,xk+β,xk+2β,…,xΔ(k,β)β+k)
Δ(k,β)=(N-β)/k
(2)
式中:k(1≤k≤s)为粗粒信号的起点;β(β=s)为时间间隔。
(3)
根据上述步骤,TSMLZC的时移粗粒化处理比传统粗粒化更优,对数据的利用更加充分,对长度不敏感,因而比MLZC更优。
尺度因子s=4时的时移粗粒化处理如图2所示。
图2 s=4时的时移粗粒化过程
由图2可以发现:时移粗粒化处理考虑了相邻数据点之间的联系,能够更加准确地度量时间序列的内在特性,从而获得更加准确的估计熵值[16]。
在TSMLZC中,仅需输入原始故障信号和尺度因子s,因为TSMLZC对参数不敏感。笔者将s设置为20。因为TSMLZC只对信号数据长度敏感,根据经验,数据长度较短时,会导致信号的复杂度估计偏差较大。
为了验证TSMLZC对数据长度的鲁棒性,笔者分析了10组不同信号长度的噪声(N=256,512,1 024,2 048,4 096,8 192)下TSMLZC和MLZC的复杂度分布;除此之外,还根据信号的复杂度均值波动来评价算法对信号长度的鲁棒性。
不同噪声信号长度下,TSMLZC和MLZC复杂度分布具体结果如图3示。
图3 不同噪声信号长度下TSMLZC和MLZC复杂度分布
由图3可以发现:与MLZC相比,TSMLZC在不同信号长度下的复杂度分布更平滑。其中,不同数据长度噪声(白噪声和Fn噪声)下平均MLZC的最大波动分别为0.176和0.417,而TSMLZC估计值的最大波动为0.047和0.245,均小于MLZC,这表明TSMLZC算法受时间序列长度的影响较小,能够更加准确地估计信号的复杂度。
同时,比较了不同长度下信号的复杂度估计值分布,当N小于1 024时,熵值存在一定的误差。这证明当长度小于该值时,TSMLZC和MLZC的稳定性较差,因而信号长度必须大于1 024。因此,笔者设置N=2 048。
在该实验中,TSMLZC用于提取故障特征,因而其能否准确分辨不同类型的信号是最关键的性能评价指标。
笔者分析了TSMLZC和MLZC对不同噪声(长度2 048的白噪声和Fn噪声)的分辨效果,并基于复杂度值分布和变异系数来估计不同多尺度方法的分类性能,其结果如图4所示。
图4 MLZC和TSMLZC对两种噪声的分辨效果
由图4可以发现:TSMLZC处理得到的变异系数远小于传统的MLZC,这表明基于时移粗粒化处理得到的多尺度信息更稳定可靠,间接验证了时移分割的操作能够很好地缓解传统多尺度粗粒化操作的缺陷;此外,比较MLZC和TSMLZC的分布,可以发现这两个方法在任何尺度上都没有出现混叠的现象,这证明其均有较好的信号分辨能力。
总之,根据上述结果,可以得出结论,即TSMLZC对不同类型的噪声信号具备有效的分辨能力。
为了对滚动轴承的不同工况和故障进行检测,笔者在采集到原始故障信号后,计算其TSMLZC构成故障特征数据样本,采用GWO-SVM多模式分类器进行工况识别(其中GWO-SVM分类器的参数设置和模型结构参考王贡献等人[17]的研究)。
基于TSMLZC和GWO-SVM的损伤识别步骤如图5所示。
图5 故障诊断模型的流程图
详细步骤如下:
1)预设轴承有h种工况,每种工况采集m组信号,每组信号长度设置为2 048;
2)求出每个样本TSMLZC值,作为分类器的输入特征向量;
3)将TSMLZC复杂度评估结果汇总,基于工况类型赋予其类别1~h,每种工况选择j个样本作为训练集,余下样本作为测试集,汇总后分别作为训练和测试数据;
4)采用训练数据对GWO-SVM多模式分类器进行训练,智能地设置SVM的最佳参数组合;
5)基于完备的GWO-SVM多模式分类器实现对测试数据的工况识别目标。
为验证TSMLZC+GWO-SVM在诊断滚动轴承故障中的有效性,笔者利用公开轴承数据进行分析验证。
其中,轴承为6205-2RS深沟球轴承,基于电火花技术分别在轴承上加工出单点故障,故障尺寸分别为0.177 8 mm、0.355 6 mm和0.533 4 mm,载荷0 hp,电动机转速为1 797 r/min;在12 kHz采样频率下收集正常、内圈故障、外圈故障和滚珠故障4种状态的振动信号。
为了开展故障类型和严重程度的检测实验,笔者将故障轴承依据故障尺寸分为轻度、中度和重度三种严重程度,总共获得10种类型的信号,对应标签为1~10,分别记为正常NOR、内圈轻度故障IRF1、滚珠轻度故障BF1、外圈轻度故障ORF1、内圈中度故障IRF2、滚珠中度滚珠BF2、外圈中度故障ORF2、内圈重度故障IRF3、滚珠重度滚珠BF3和外圈重度滚珠ORF3,每种状态挑选50个样本。
各种类型的轴承信号数据介绍如表1所示。
表1 轴承数据介绍
滚动轴承振动信号的波形如图6所示。
图6 0 hp负载下的轴承信号波形
随后,笔者采用TSMLZC为特征提取工具,对滚动轴承不同工况信号的特征进行提取。MLZC、MSE、MPE和MFE也被引入用于对比实验。所有的模型和实验都基于MATLAB2019b进行开发。
不同多尺度方法的参数设置如表2所示。
表2 不同多尺度方法的参数设置
5种特征提取工具所提取的故障特征如图7所示。
图7 5种特征提取工具提取的轴承故障特征
随后,笔者将故障特征输入至GWO-SVM分类器中进行故障识别,每组工况选择25个样本进行训练,25个样本进行测试。
5种方法的分类结果如图8所示。
图8 5种故障检测方法的分类结果
详细的分类结果如表3所示。
表3 5种故障检测方法的详细分类结果
从表3可以发现:TSMLZC+GWO-SVM的准确率最高,达到了98.8%,证明了其能够有效地识别滚动轴承的不同故障类型和严重程度。但其需要花费807.41 s来提取故障特征,时长远远高于其他4种方法,即其缺点在于效率偏低。
相比较而言,基于MPE+GWO-SVM方法的准确率也比较高,接近TSMLZC+GWO-SVM,同时其效率也较高,同样适用于滚动轴承的故障诊断。
但需要指出的是,TSMLZC+GWO-SVM在特征提取阶段无需设置额外参数,完全基于数据自身的固有特性来估计复杂度,而其他方法均需设置较多参数,因而TSMLZC+GWO-SVM能避免参数变动所导致的不利影响。
实验中所使用的振动信号采集自驱动端,该部分离轴承较近,因而振动传递过程中的损耗小,大量的振动信息得以保留。但在部分情况下,传感器只能布置在风扇端,而风扇所带来的环境噪声可能会削弱轴承故障所导致的振动。因此,有必要检验TSMLZC+GWO-SVM在使用基于风扇端数据时的有效性。
同时,为了检验该方法和其他对比方法在识别不同工况下故障诊断的准确率,笔者就不同负载下的振动识别进行了实验,得到了驱动端和负载端的不同负载下的识别准确率结果,如表4所示。
表4 驱动端和负载端的不同负载下的识别准确率 (%)
由表4可以发现:TSMLZC+GWO-SVM能够准确地识别不同工况的故障,准确率均高于98%。此外,该方法在准确率方面普遍优于其他4种方法,证明了该方法的鲁棒性。
为了验证TSMLZC+GWO-SVM故障诊断方法的性能,笔者利用另外的滚动轴承数据集进行实验[18]。该滚动轴承数据有两种系统负载,分别是0 V和2 V,与美国凯斯西储大学的轴承数据类似,不同负载对应的是电机转速差异,其它设置均不变。
文献[18]中提供的数据包含8个通道,通道1是电机振动,通道2、3、4分别是行星齿轮箱中的滚动轴承在X、Y和Z方向上的振动,通道5是电机扭矩,通道6、7、8是平行齿轮箱中的滚动轴承在X、Y、Z方向上的振动。
笔者首先使用0 V负载下的通道4数据。所使用的滚动轴承故障类型包含正常、内圈故障、滚珠故障、外圈故障和复合故障(内圈故障+外圈故障),对应标签为1~5,分别记为NOR、IRF、BF、ORF、CF。
每种状态挑选50个样本,轴承振动信号的时域波形图如图9所示。
图9 轴承振动信号的波形图
随后,笔者利用TSMLZC+GWO-SVM等5种故障诊断方法来诊断滚动轴承的不同故障类型和工况,其中25组样本作为训练样本,剩余25组作为测试样本。
5种方法的分类结果如图10所示。
图10 5种故障检测方法的分类结果
详细的分类结果如表5所示。
表5 5种故障检测方法的详细分类结果
由表5可以发现:TSMLZC+GWO-SVM的准确率最高,达到了94.4%,有7个被错误分类的样本,总体上能够证明其可以有效识别滚动轴承的故障类型。但同时该方法需要474.74 s来提取特征,时长高于其他方法,这证明该方法的效率偏低。
总体来看,该方法自身不需要设置参数,能够避免参数设置所带来的不确定性。此外,该方法能够取得较不错的故障识别效果,证明了其可观的性能,因此其可以用于滚动轴承的故障识别中。
随后,为了测试5种方法在基于不同通道信号和不同负载时的故障识别性能,笔者对不同负载下的8个通道的故障识别进行了研究,结果如表6所示。
表6 驱动端和负载端的不同负载下的识别准确率 (%)
由表6可发现:在利用TSMLZC+GWO-SVM对不同通道的数据进行特征提取时,所获得的识别准确率差异较大,这证明每个通道所包含的信息量具有较大的差异;而MSE、MFE和MPE方法的性能相对比较稳定,在多数时候准确率优于TSMLZC+GWO-SVM。
在采用通道1、通道3、通道4、通道5、通道6时,TSMLZC+GWO-SVM的准确率最高,这证明了该方法具有一定的诊断可行性;但是其对信号的来源有要求。
总体而言,TSMLZC+GWO-SVM能够在一定程度上对滚动轴承进行故障识别,并判断轴承的工况和故障类型。
针对滚动轴承的故障特征提取困难,以及常规方法需设置较多参数的问题,笔者提出了一种基于TSMLZC和GWO-SVM的滚动轴承故障诊断方法。
利用美国西储大学和国内东南大学2种滚动轴承数据对该方法和其他故障诊断方法进行了实验和对比,可以得出以下结论:
1)与MLZC相比较,TSMLZC方法在测量时间序列的复杂度方面更稳定,变异系数更小;
2)和基于MSE、MPE、MFE和MLZC的故障诊断方法相比,TSMLZC+GWO-SVM方法的准确率更高,基于美国凯斯西储大学轴承数据的准确率为98.8%,而东南大学轴承数据的准确率为94.4%,均高于其他几种方法;
3)在诊断多种工况的故障时,采用TSMLZC+GW-SVM的故障诊断方法也能够获得不错的识别准确率,证明其能够适用于多个工况下的故障识别问题。
虽然笔者开发的故障诊断方法具有一定的潜力,但是其在特征提取效率方面存在明显的不足。因此,笔者后续将就减小特征提取时间的问题进行研究,以提高该方法的故障诊断效率。