杨 岗,邓 琴,卫昱乾,徐五一,李 芾
(1.西南交通大学 机械工程学院,四川 成都 610036;2.西南交通大学 唐山研究院,河北 唐山 063000)
世界科技竞争日益激烈,大型机械设备的发展水平早已成为衡量一个国家综合国力和核心竞争力的标志。滚动轴承作为旋转机械的主要部件,在工业应用上发挥着非常关键的作用,它的安全运行关系到整机的使用寿命、可靠性和工作精度等[1]。旋转机械零部件常见的故障振动信号多以冲击特性为主,表现为非线性、非平稳等复杂特性。加速度传感器采集到的振动信号能够反映机械设备的运行状态,但是与此同时信号中也包含大量的干扰噪声,需要运用现代信号处理方法将冲击特征信号与干扰噪声信号分离开来,从而更有效地实现故障诊断[2]。
经验模态分解(Empirical Mode Decomposition,EMD)作为一种经典的时频分析法,在处理非线性、非平稳信号方面表现出色[3]。因此,EMD被广泛应用于轴承故障诊断领域。但是,EMD算法由于自身分解规则的不足,不可避免地存在模态混叠和端点效应,导致一些虚假IMF分量的产生,致使求取的包络均值误差很大。针对这一缺陷,文献[4]提出了集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)。该算法在原始信号的基础上,添加均值为零的白噪声以抑制或抵消信号本身的噪声,从而削弱EMD的模态混叠现象。然而,当处理的次数较少时,添加的白噪声往往不能忽略,甚至可能污染整个数据;当其处理次数过多时,又会耗费大量的时间。对此,YEH 等[5]通过向原始信号添加成对的正负噪声而提出了互补集成经验模态分解,并有效地解决了该问题。CEEMD算法具有EEMD算法相同的性能且计算效率更高。然而,EEMD和CEEMD算法分解信号得到的IMF中总会残留一定的白噪声,甚至影响后续信号的分析和处理。针对上述问题,文献[6]提出了自适应噪声完备集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)。CEEMDAN在EMD分解的每个阶段中,添加一定的自适应白噪声,以实现在较少的计算量下,其重构误差几乎为零[7]。另外,文献[8]提出一种具有自适应性的信号处理新算法-变分模态分解(Variational Mode Decomposition,VMD),该方法通过迭代寻找出变分模型的最优解,进而确定每个IMF分量的频率中心和带宽,有效地避免了EMD分解存在的不足。
EMD改进算法能够使EMD的模态混叠现象得到改善,但并不意味着能完全抑制。EMD及其改进算法的基本原理都是将信号分解成若干蕴含不同频率成分的模态分量与残余分量之和。在分解过程中,EMD及其衍生算法的分解效果会受到强噪声、异常信号干扰的影响,产生一些伪分量。因此,如何选取有效的IMF分量,使其既能保留较多的故障信息又能去除强噪声的干扰是该类算法故障诊断的关键。
本文介绍了EMD及其衍生算法的原理及应用,总结了目前该类算法在滚动轴承故障诊断领域中筛选敏感IMF的主要方法,并指出了其优缺点,最后对全文进行了总结和展望。
EMD算法的基本原理是将原始信号分解成一组IMF分量与残余分量之和,即:
(1)
式中:x(t)为原始信号,Ii(t)为第i个IMF分量,rn(t)为残余分量。其中,IMF的基本条件:过零点和极值点数目相等或相差1,且局部信号均值为0。
EMD算法的具体流程如图1所示。首先,确定原始信号x(t)的局部极值点,并用三次样条曲线将所有极大值点和极小值点分别连接起来形成上包络线E1和下包络线E2;然后计算上下包络线的平均值m,再用原始信号x(t)减去平均值m求得h,用IMF的基本条件判断h是否是x(t)的第一个IMF分量;如果h不是IMF分量,则把h作为原始数据,重复上述步骤。
图1 EMD算法的流程图
从分解过程可以看出,EMD本质上是一个高通滤波器,将原始信号分解成一组从高频到低频的IMF分量。然而,由于自身分解规则的不足,EMD难免会受到端点效应与模态混叠现象的影响,导致其分解效果不佳。为了解决这个问题,一些学者基于EMD先后提出了EEMD、CEEMD等改进算法。这里特别说明VMD算法,因为该算法与EMD有本质上的区别。VMD是基于约束性变分问题的框架,摒弃了EMD循环递归的处理方法。VMD通过对变分问题的求解将原始信号分解成指定个数的IMF分量。
其中,VMD中的“IMF”是一个调幅-调频信号,其表达式为:
uk(t)=Ak(t)cos(φk(t))
(2)
与EMD相比,VMD能在更为严格的约束条件下得到高质量的IMF分量。VMD在抗模态混叠、计算效率和噪声鲁棒性上具有明显的优势。但是,VMD并未完全消除端点效应和模态混叠现象。
IMF表示信号内蕴的简单振荡模式,即每个IMF分量只表征单一频率成分,这就赋予了瞬时频率明确的物理意义。加之EMD及其衍生算法适用于处理非线性、非平稳的信号,因此,广泛用于检测和诊断旋转机械的故障。
在机械故障诊断中,EMD及其衍生算法可以用来提取故障的特征频率。LIU 等[9]先通过EMD分解原始信号获得若干个IMFs,再结合Hilbert变换,最终成功提取出齿轮的故障特征频率。文献[10]提出将能量算子解调法应用于EMD分解的IMF,得到瞬时幅度和频率,以获得反映机械故障特征的包络谱。
此外,该类算法一般是作为神经网络、支持向量机等人工智能方法的前处理方法,用于抑制噪声和增强特征。此类方法通常先将原始信号分解成若干个IMF分量,再提取敏感IMF的峭度、均方根等时域特征或者计算敏感IMF的信息熵、排列熵等特征作为机器学习的输入,最后实现旋转机械故障的有效识别和分类。杨宇等[11]先提取敏感IMF的时域特征指标,再结合神经网络,最后,成功识别滚动轴承的工作状态和故障类别。向丹等[12]将IMF信号的样本熵作为流形学习的输入,有效地提高了滚动轴承故障诊断的效率。
综上所述,EMD及其衍生算法可以依据信号的内在特点,将信号分解为有限个IMFs的组合。IMFs从高频到低频进行排序,且分别蕴含不同振动模式。一般来说,高频IMF分量中包含更多故障信息,与此同时其中也往往夹杂着大量噪声,甚至有时完全由噪声构成。另外,该类算法分解时也会产生一些低频的虚假分量。因此,为了凸显故障特征和减少噪声干扰,选取合适的IMF进行信号重构是该类算法处理信号的关键。
EMD类算法分解得到的IMF大多数通常是噪声或干扰信号,只有少数分量能够反映出轴承故障特征。因此,需要通过一定的选取原则筛选出包含故障信息更丰富的有效IMF进行重构,从而达到降噪和增强故障特征的目的。本文根据选取的有效IMF特征数量,将选取准则分为单一特征参数法、多特征参数法、双值区间法等类别进行论述。
2.1.1 相关系数法
相关系数可以表征变量间线性相关程度[15]。在信号处理领域中,将相关系数作为指标,可以量化IMF分量与原始信号之间的关联程度。相关系数公式为:
(3)
马新娜等[13]将EEMD分解的若干个IMFs分别与原始信号进行相关性分析,根据相关系数的最大值,选出包含主要故障的IMF分量进行频谱分析,再通过自适应陷波器剔除主故障信息,然后将剩余的信号进行次故障诊断,最后成功解决了单通道下滚动轴承复合故障难以分离和识别的问题。相较于时域分析,频域分析更加简洁深刻。鉴于此,ZHAO 等[14]提出频域相关系数法,并选取相关系数值最大的前3个IMF分量进行后续处理,有效地抑制噪声和凸显故障特征。针对CEEMDAN分解的IMF分量可能包含与原始信号无关的伪分量,GAO 等[15]通过计算各分量频域相关系数,选择相关性较大的分量,剔除虚假分量。
目前,以相关系数作为筛选敏感IMF分量的准则被广泛应用于轴承故障诊断领域。然而,相关系数只考虑了各IMF与原始信号的线性相关程度,并没有考虑故障信息含量对故障特征提取的影响。而且,需要一定的先验知识来设置阈值,自适应性较差。
2.1.2 互信息法
互信息是对两个随机变量之间统计相关性的度量[16]。通过计算各IMF与原始信号间的互信息可以有效地识别虚假分量,达到“去伪存真”的目的,其公式为:
I(X|Y)=H(X)+H(Y)-H(X,Y)
(4)
式中:X和Y代表不同的2个随机变量,H(X)和H(Y)分别为变量X和Y的信息熵,H(X,Y)是X对Y的条件信息熵。互信息值越大,说明两随机变量的关联性越强,反之,则越相互独立。
由于相关系数无法反映变量间的非线性关系,钱林等[17]采用互信息法选取对故障信息敏感的IMF分量进行重构,有效地抑制了噪声的影响。刘长良等[18]通过计算各IMF与原始信号的互信息,并对其进行归一化处理和设定阈值,最终筛选出携带有效信息的敏感IMF。针对滚动轴承振动信号因工作环境恶劣等造成大量噪声淹没故障特征的问题,刘婷婷等[19]提出一种基于互信息的敏感IMF选取方法。该方法首先根据互信息挑选出对故障信息敏感的IMF分量进行重构,最后将重构信号分别作为模糊相关分类器的训练集和测试集,实现对滚动轴承的健康状态分类。
跟相关系数相比,互信息不仅能用来识别不同数据之间的线性相关性,对非线性相关性也同样适用。但是,互信息也需要人工经验设置阈值,且需要进行归一化处理。
2.1.3 峭度法
峭度可以检测由局部缺陷引发的冲击成分,对于早期故障较为敏感,适用于诊断表面损伤类故障,其数学公式为:
(5)
式中:E为数学期望,μ和σ分别为原始信号x的均值和标准值。
健康状态的轴承工作时,产生的振动信号满足正态分布,其峭度值K约为3。但是,当轴承具有局部缺陷时,峭度值K将增大。峭度值越大就代表轴承的故障程度越严重。因此,选择峭度值K较大的IMF分量进行重构,可以有效地避免无关分量的干扰。
为了提取轴承故障特征以及避免其他分量干扰,LEI 等[20]提出一种基于峭度的敏感IMF筛选方法。该方法从选定的敏感IMF及其频谱和希尔伯特包络谱中提取时域和频域特征,再结合小波神经网络,有效识别机车滚动轴承的健康状态。马增强等[21]首先利用VMD把故障信号分解成若干个IMFs,并通过峭度准则筛选出包含故障的主要信号分量进行重构,然后结合奇异值分解,有效消除了噪声干扰和提高了信噪比。针对振动信号的故障特征提取问题,DIE 等[22]通过峭度准则选择包含主要故障信息的IMF并进行重构,然后利用快速谱峭度图处理重构信号。经试验验证,该方法能够有效提取滚动轴承的故障特征,而且具有很好的降噪效果。
机械设备在实际应用中往往存在多个冲击源。因此,轴承因故障产生的信号中一般夹杂着许多其他干扰信号。这时仅采用峭度指标来衡量信号中的冲击成分,缺乏一定的说服力。
2.1.4 其他特征参数方法
方差能够表征轴承振动信号的波动特性,因此可以将方差贡献率作为选取敏感IMF分量的指标。方差贡献率越大,则表明该IMF分量对原始信号越有意义,反之,可作为伪成分去除。在强噪声和变负载工况下,文献[23]选取方差贡献值较大的IMF进行叠加,再将叠加信号作为改进神经网络的输入。经试验验证,该方法具有增强故障特征和降噪的效果。由于自身分解规则的缺陷,EMD分解会产生一些虚假的低频分量,针对这个缺陷,文献[24]利用方差贡献率检验IMFs,消除虚假分量。
度量因子能够衡量样本之间的相似程度。度量因子越小,表示IMF分量与原信号的相关度越强,即该IMF包含丰富的故障信息。彭畅等[25]利用基于距离的度量因子将最敏感的IMF分量筛选出来,然后将选定的IMF分量进行重构,重构信号的故障特征更加明显,最后结合快速谱峭度图,成功实现滚动轴承故障诊断。
信息熵作为评价信号或系统状态不确定性程度的有效指标,已经在轴承故障特征提取领域得到广泛应用[26]。当IMF分量中包含故障信号即周期性冲击时,IMF信号分量表现出有序性,其熵值也较小。基于此,李华等[27]提出基于信息熵最小值筛选IMF分量的方法,获得了包含周期性冲击信号多的IMF分量。为了更好地提取齿轮箱轴承故障特征,陈强[28]首先根据IMF最小信息熵原则改进VMD,然后利用Teager能量算子处理信息熵最小的IMF分量。
目前,学者们针对敏感IMF分量的选取问题,提出了一系列单一特征参数,并在实际应用取得一定的效果。但是通过上述可以发现,该方法主要是基于单一特征参数的大小关系,且需要人工经验设置筛选阈值。当各IMF的特征参数之间相差不大时,那么就会导致筛选阈值的不确定性。此外,单一特征参考数只是考虑滚动轴承故障特性的某一方面,并不全面,有可能会造成误诊或者漏诊。
多特征参数法即将多个单一特征参数进行结合并连续使用的方法。
2.2.1 峭度-相关系数准则
信号被EMD等算法分解后,获得的高频分量往往具有较低的信噪比。一般地,为了提高信噪比,直接消除这些分量即可。但是,当轴承出现故障时,高频分量通常包含大量的冲击成分,若直接舍弃,很可能丢失有价值的故障特征成分。因此,在这种情况下,将峭度和相关系数相结合作为IMF分量取舍的评判标准,既可以剔除虚假分量又可以达到降噪的目的。
唐贵基等[29]为减少噪声的干扰,将峭度与相关系数作为甄选敏感IMF分量的指标,并将所选的IMFs进行重构。经过试验验证,模拟信号的时域波形如图2所示,重构信号的波形如图3所示,与原模拟信号相比,重构信号具有明显的降噪效果。向玲等[30]综合考虑IMF分量的峭度与相关系数,挑选二者数值都较大的IMFs进行重构,有效地降低噪声的干扰。针对滚动轴承的振动信号易受到噪声干扰的缺陷,吕中亮等[31]提出基于峭度与相关系数相结合的敏感IMF选取方法。该方法不仅抑制了噪声,还增强了故障特征。
图2 模拟信号的时域波形
图3 重构信号的时域波形
2.2.2 方差贡献率-相关系数准则
从统计学上可知,方差反映了滚动轴承故障信号的波动特征,因此可以利用方差贡献率来选择含有波动脉冲的滚动轴承故障特征信号。相关系数可以反映各IMF与原始信号之间的线性相关性。通过方差贡献率-相关系数准则选取有效分量,可以在一定程度上减少虚假分量对故障后期识别的影响,提高滚动轴承故障识别的精度。
宋丹丹[32]针对EMD因过分解而产生虚假分量问题,提出用相关系数和方差贡献率来筛选真实IMF分量,并取得了较好的效果。CEEMDAN虽然能在一定程度上消除EMD模态混叠问题,但是也会产生一些虚假IMF分量,导致滚动轴承故障诊断结果出现偏差。针对这一问题,CHEN 等[33]将相关系数和方差贡献率作为指标,选取故障信息丰富的IMF分量,对不相关的虚假分量进行剔除,突出有价值的分量。BIE 等[34]为了准确识别故障类别和剔除干扰分量,采用相关系数和方差贡献率作为筛选IMF标准。经试验验证,该方法能够有效地选取敏感分量,并减少后续模式识别的计算量。
2.2.3 相关系数-排列熵准则
排列熵(Permutation Entropy,PE)是一种能够度量时间序列复杂程度的算法。该算法还能检测时间序列的动态突变以实现故障定位,具有计算快、鲁棒性强的优点,特别适用于非线性数据的处理。相关系数能够反映变量之间的线性关系程度,实现“去伪存真”。根据相关系数-排列熵准则来筛选IMF分量,可以有效地剔除干扰成分,弥补单独使用PE或相关系数而导致有效信息遗漏的不足。
GU 等[35]先利用PE检测CEEMD分解的异常分量并剔除,然后对剩余信号再进行CEEMD分解,选取相关系数较大的IMF分量进行希尔伯特包络谱变换,从包络图中提取故障特征。经试验验证,该方法不仅能有效地提取故障特征,而且对EMD的模态混叠起到一定的抑制作用。针对滚动轴承振动信号非线性、非平稳的特性,李长伟等[36]提出一种基于EEMD的相关排列熵的诊断方法。图4为仿真信号时域图,由图中EEMD分解的结果可知,c1为高频共振的衰减信号,c2和c3分别为调制信号和载波信号。表1为IMF的排列熵、峭度值和相关系数,根据表中的峭度值K可以看出c1为异常分量,但实际上c1是无效的衰减分量,而有用的c2和c3的峭度值反而比较小。因此,不宜选用峭度值作为筛选指标。此外,表1中c1和c2分量的PE较大,说明其含有较多的故障特征,但实际上c1是无效分量。通过相关系数可以发现c3分量应该包含大量故障信息,然而c1实际是虚假分量。综上所述,结合排列熵和相关系数可以提取到有效的IMF,剔除其他干扰分量,克服单独使用排列熵或者相关系数的缺陷。
表1 IMF的排列熵、峭度值和相关系数
图4 仿真信号时域图
2.2.4 综合评价指标
信号处理时,仅根据单一特征参数(如:峭度、相关系数等)选取富含故障信息的IMF,具有片面性。综合考虑多个指标的整体变化,形成一个综合评价指标,可以在一定程度上避免单一指标的缺陷。
互相关系数的取值需要先验知识且易受噪声干扰,以及峭度易忽略幅值较大且分布分散的分量,裴迪等[37]选择互相关系数与峭度值均较大的IMF分量进行重构,有效地抑制了低频噪声和幅值的干扰。文献[38]提出一个综合指标来选取CEEMD分解的敏感IMF。该方法是基于峭度、能量和近似熵的乘积。经试验验证,该方法能够有效地区分无关干扰信息。由于轴承故障信息只存在少数IMF分量中,文献[39]采用基于自相关脉冲谐波噪声指数、相关系数和峭度的综合指标来评价IMF分量。该方法克服了自相关脉冲谐波噪声指数易受干扰谐波的影响以及峭度易受噪声的干扰的不足。文献[40]根据EEMD熵、峭度与均方差归一化后的综合指标筛选敏感IMF分量,并用相关系数检验所有IMF分量的合理性。
与单一特征参数法相比,多特征参数法可以有效地避免单一特征参数的偶然性,考虑更多指标去综合评估敏感IMF分量,更具说服力。但是,多特征参数法也需要依赖人工经验来设置阈值。
区间是被广泛应用的一类数集。利用两值区间之间的“从属”逻辑关系取代单一特征参数和多特征参数法的大小逻辑关系,可以有效避免依赖人工经验设置筛选阈值的缺陷,使敏感IMF分量的选取更具有普适性[2]。
谱峭度图算法的本质是利用一个带通滤波器组不断划分信号的频率轴,并计算窄带信号的峭度值。由于峭度对冲击信号具有敏感性,在谱峭度图中,位于峭度值最大频带区间内的信号蕴含的冲击成分明显比其他频带区间信号的更为丰富。蒋超等[41]根据各IMF分量的谱峭度最大频带区间与原始信号谱峭度最大频带区间的从属关系,抑制噪声和干扰信号的影响。经试验验证,该方法不需要依靠人工经验,且克服了单一特征值参数或者多特征参数可能存在连续、界限难以区分的缺陷。何凯等[42]利用快速谱峭度图确定最佳IMF分量,再将选定的IMF分量进行求和重构,最后结合共振解调技术,有效地检测出轴承的早期故障。
频带熵可以用来描述时频域中每个频率成分的复杂性[43]。当滚动轴承发生故障时,滚动体表面和故障零件之间的相互作用带来一系列冲击信号,这些冲击信号又会引起瞬态振动信号。在频率分量变化缓慢或规则状态持续的情况下,该分量的频带熵值较小;在某段时间内,如果频率分量的波动很复杂,则其频带熵较大。李华等[44]提出一种利用频带熵来选取EEMD敏感IMF的方法。首先分别计算IMF分量和原始信号的频带熵,以频带熵为指标选择特征频带,然后判断各IMF分量特征频带与原信号特征频带区间的从属关系,保留敏感IMF,舍弃虚假分量,并将选定分量进行叠加重构。图5为频带熵选取的IMF1包络谱,图6为峭度选取的IMF4包络谱,对比图5和图6,基于频带熵的有效IMF选取方法具有明显的优势。
图5 频带熵选取的IMF1包络谱
图6 峭度选取的IMF4包络谱
由于EMD等算法(VMD除外)分解得到的IMF数量是自适应变化的,且周期性故障冲击特征往往被包含于少数IMF分量中,其余分量大多可视作噪声或干扰成分。因此,如何选取敏感IMF成了这类算法的一个重要问题。为了解决这个问题,相关系数、互信息、峭度等被相继引入。本文根据特征参考数引用的个数与逻辑关系,将现有敏感IMF选取方法分为单一特征参数法、多特征参数法以及双值特征准则,以下归纳了每种方法的优缺点:
(1) 单一特征参数法在故障特征信号选取中发挥着重要的作用,是评判IMF是否为冲击故障特征信号的重要依据。但是该方法只考虑了单一指标,筛选结果具有偶然性。此外,该IMF选取方法是建立在单一特征参数的大小逻辑关系上,其筛选阈值选取完全依赖于人工经验。
(2) 多特征参数法是通过多个指标进行综合评价,筛选出的敏感IMF更具说服力,并在实践中取得了一定的效果。但是该方法也是基于特征参数大小逻辑关系之上,依赖人工经验,自适应较差。
(3) 双值区间准则利用双值区间系数之间的“从属”关系代替了特征参数的大小逻辑关系,避免了筛选阈值选取严重依赖人工经验的不足,使冲击信号的选取更具普适性。然而该方法计算量偏大从而限制了其在故障实时诊断的应用。
EMD类算法由于背景噪声污染或自身分解规则的缺陷,会产生一些低频的、与原始信号并无关联的虚假分量。另外,EMD类算法分解的高频IMF通常包含轴承主要故障信息和大量噪声。因此,该类算法处理信号的关键在于筛选有用IMF分量进行重构。单一或者多个特征参考系数法的人为因素较大,自适应性较差,双值区间准则又略显繁琐。因此,基于EMD类算法的轴承故障诊断需要寻找一种具有普适性且计算量小的IMF筛选方法,能够有效降噪和增强故障特征,从而实现轴承故障诊断。