郑小霞,刘 静,魏彦彬,蒋海生
(上海电力大学 自动化工程学院,上海 200082)
滚动轴承在旋转机械上应用比较广泛,它的工作状态影响着运行机械的工作精度[1]。滚动轴承是发电机传动系统中最易受损的主要部件之一,若发生故障会对整个机组的运行状态产生很大影响,造成很大的经济损失[2]。因此,为保证发电机组的可靠性和安全性,降低维修成本,并提高其运行效率,对滚动轴承进行健康状态监测具有重要的意义[3]。
滚动轴承的振动监测信号是非平稳的复杂信号,其频率成分复杂,且根据实际状况的影响,该信号会不断发生变化,谐波、干扰与故障特征频率之间也容易出现重叠现象。因此,采用传统的方法难以提取其故障信息[4]。
小波包分解是一种典型的复杂非平稳信号处理方法,能对信号进行精确的处理,被广泛用于各类设备的状态监测中[5,6]。文献[7]通过小波包分解提取信号特征,进行了发电机组齿轮箱的故障诊断。文献[8]为了解决运行中监测信号噪声的影响,基于小波包分解,提出了一种评价不同频带故障的方法。
互补聚合经验模态分解(CEEMD)是由YEH J R[9]提出的一种常用的信号特征提取方法,能对信号进行很好的分解,并减少重构误差的产生。文献[10]通过CEEMD方法,将风速划分为一组固有模态函数,并结合极限学习机(ELM)实现了对风速的预测,但是该方法不能完全消除模态混叠。
对于提取的故障特征信号,需要选择合适的模型来进行设备的健康状态评价。隐马尔可夫模型(HMM)是由LeonardE.Baum提出的一种描述随机过程的概率模型,该模型对于复杂的时间序列有很好的建模能力,被广泛应用于设备的寿命预测和状态评价[11]。文献[12]通过隐马尔可夫模型进行了齿轮箱的功能退化检测,推导出了其性能的下降规律。但在实际应用中,隐马尔可夫模型容易出现过度拟合问题;而变分贝叶斯(VB)优化的隐马尔可夫(HMM)模型对发电机组轴承部件则有着更好的适用性。
综上所述,笔者提出一种基于小波包-互补聚合经验模态分解和变分贝叶斯-隐马尔可夫模型的滚动轴承健康状态评价方法,并利用轴承退化的实验数据对该模型进行验证。
互补聚合经验模态分解(CEEMD)适合非线性信号分析,可自适应地将复杂信号分解成由高频到低频的特征模态函数(IMF)[13]。CEEMD算法原理与EEMD算法一致,只是分解过程中加入了成对的白噪声,能够减少由白噪声引起的误差,更准确地对原始信号进行重构[14]。
由于原始信号中的频率成分比较复杂,CEEMD很难得到单分量IMF。针对这一问题,可选择小波包分解(WPD)对原始振动信号进行预处理,以降低振动信号的复杂性,抑制CEEMD分解过程中出现模态混叠问题。WPD不仅能对低频部分进行分解,对高频信号也有具很好的分解能力,保证其良好的分辨率。
应用小波包分解时,首先要根据分解的数据类型进行小波基函数的选取。笔者主要依据降噪后信号的完整度和准确度选择小波基函数。另外,小波包的分解层数的选取也很重要,分解层数过小,不能体现信号的细节信息;分解层数过大,计算量会增加。所以根据研究和计算,笔者采用db3小波基对原始信号进行3层分解,并计算第3层各节点信号的能量占比,取总能量高于80%,且能量较大的信号进行重构,由此可以消除大部分的干扰信号,为下一步的CEEMD分解奠定基础。
采用改进的CEEMD方法,首先要对原始信号进行小波包降噪,以降低信号的频率分量,再利用CEEMD将降噪后的信号分解为IMF分量,根据相关系数选择有效分量进行重构,最后提取出故障的特征信号。
HMM模型是一种用来描述含有隐藏未知参数的马尔可夫过程的统计模型,其状态序列为隐藏的马尔可夫链随机生成的不可观测序列;每个状态生成一个观测,再由此产生的观测的随机序列,称为观测序列[15]。
假设观测序列Y={y1,y2,…yr},可以表示为二变量过程(S,Y)={(st,yt),t=1,2,…,T}。隐含过程{st}是一个马尔可夫链。
隐马尔可夫模型可用θ=(π,A,B)来描述,分别定义为:
(1)状态转移概率矩阵:A={aij,i,j∈S},aij=P(st=j|st-1=i);
(2)发射概率矩阵:B={bim,i,m∈S},bjm=P(yt=m|st=i);
(3)初始状态分布:π={πi,i∈S},πi=P(s1=i)
假设A、B和π之间相互独立,先验概率为:
P(θ)=P(π)P(A)P(B)
(1)
由于狄利克雷分布与似然项共轭,所以选择参数π、A、B的先验概率为Dirichlet分布:
(2)
(3)
(4)
式中:uA,uB,uπ—狄利克雷分布参数;M—观测数目;I—状态数。
在贝叶斯算法中,对参数边缘化过程中需要进行积分运算,这个计算会影响信号处理的可行性,所以此处采用变分贝叶斯来解决这个问题。
logp(Y)=logp(Y,Z)-logp(Z|Y)
(5)
logp(Y)=log{p(Y,Z)/q(Z)}-
log{(p(Z│Y)/q(Z)}
(6)
两边积分为:
(8)
后验分布p(Z|Y)的估计和模型证据p(Y)可表示为:
logp(Y)=L(q)+KL(q‖p)
(9)
其中,定义:
(10)
(11)
式中:L(q)—下界;KL(q‖p)—q和真实后验p之间的KL。
使KL最小,相当于使L(q)最大,最大化过程即是通过迭代潜在变量和参量的后验概率。
隐马尔可夫模型求解参数时采用的是极大似然估计(maximum likelihood estimate,MLE),没有考虑模型的复杂性。而对于一个隐马尔可夫模型而言,其复杂性与模型中的状态转移矩阵A的连通度、隐藏状态数量t和发射矩阵B中,每个隐藏状态对应观察状态的概率分布有关。所以,在实际应用中,如果有很多观察数据,拟合参数的数量可能会超过可用的数据量,造成结果的不准确。
为解决这个问题,笔者提出了一种变分贝叶斯算法改进的隐马尔可夫模型,采用变分贝叶斯(VB)代替极大似然估计(MLE),来求解HMM中的模型参数,对发电机组复杂信号的建模具有更好的效果。
变分贝叶斯(VB)是一种在贝叶斯估计和机器学习领域中用于近似复杂积分的技术[16]。在贝叶斯算法中,在参数边缘化时往往需要积分运算,而在进行实际信号处理时,该运算会影响信号处理的可行性。采用变分贝叶斯则可解决了一问题。
变分贝叶斯(VB)本质上是一种近似算法,即对难以求解的后验分布进行近似求解。在变分推断中,经常用一个简单分布q(Z:φ)来近似复杂分布p(Z|Y,θold),从而得到一个局部最优,且有确定解的近似后验分布。
变分贝叶斯改进隐马尔可夫的具体步骤为:
在上文的HMM中,隐含状态和观测数据的似然函数为:
(12)
(13)
由贝叶斯公式得出参数的后验密度为:
(14)
其中,分母中的积分是无法处理的,因此,此处引进变分贝叶斯作为一种处理方法。
边缘似然表示为:
(15)
两边对其取对数,再取关于后验分布q(S,θ)的期望,有:
(16)
式中:q(S,θ)—潜在变量和参数的变分后验。
把它们的组合表示为Z(S,θ)。logP(Y)的估计可以通过使KL散度最小来实现,也等价为使下界最大。
下界可表示为:
(17)
(18)
对上式关于参量θ状态S的后验求偏导,可得到VBM-step和VBE-step中的迭代方程:
(1)VBM-step:
(19)
(20)
(21)
(2)VBE-step:
(22)
(23)
(24)
此处仍应用前向-后向算法,有:
(25)
(26)
设前向概率值为DI,其可表示为:
(27)
发电机组运行环境特殊,且难以取得完备的运行数据,故笔者将采集的健康状态信号作为模型训练样本,建立变分贝叶斯-隐马尔可夫(VB-HMM)健康状态模型;再将监测到的当前数据输入到模型中,得到当前状态与健康状态的接近度,实现对轴承的健康状态评价。
在所建立的VB-HMM模型中,每一组数据对应一个对数似然概率值,来表示健康状态评价结果。
建立发电机组滚动轴承健康状态评价模型的具体步骤如下:
(1)采用小波包分解对轴承振动信号进行预处理,提取能量较大且总能量高于80%的节点信号;
(2)将步骤(1)提取的节点信号进行CEEMD分解,取相关系数大于0.9的IMF分量作为特征信号;
(3)用健康数据训练健康状态模型;
(4)将样本数据输入到健康状态模型中,得到对数似然概率值,对训练结果进行分析。
此处笔者利用美国辛辛那提大学智能维护系统中心(IMS Center)提供的轴承全寿命疲劳试验数据进行轴承的退化过程验证。
该实验装置包括4个双列滚子轴承,笔者在每个轴承外座处安装一个采样频率为20 kHz的PCB353B33加速度传感器,并对轴承施加266 689 N的径向力。
实验中轴承传感器的布置示意图如图1所示。
图1 传感器布置示意图
笔者将轴承的部分故障原始信号进行小波包分解;采用db3小波基,将信号分解为3层,此时可保证故障信号完整,且可最大限度地消除干扰信号。
进行小波包分解后,第3层的8个频带节点的能量分布如图2所示。
图2 轴承故障振动信号频带能量分布
由图2可看出:轴承故障振动信号的能量主要集中在节点3和节点7,占到总能量的80%以上,因此,此处对节点3和节点7进行重构。
原始信号和重构后的信号频域波形如图3所示。
图3 原始信号和小波包分解后的频域波形
对轴承的原始振动信号进行小波包降噪预处理后,笔者根据能量分布提取能量较高的节点3和节点7,再进行CEEMD分解,以消除其他干扰信号和虚假分量,提取出故障的特征信号。
节点3和节点7分解后,IMF分量的时域波形如图4所示。
图4 IMF分量时域波形
两节点重构后的IMF分量与小波分解后的原信号的相关系数如表1所示。
表1 IMF分量与小波分解后的原信号的相关系数
提取相关系数高于0.9的分量作为故障特征信号,其余IMF信号与原信号相似性较低,作为干扰信号舍去。
笔者选择辛辛那提大学轴承疲劳数据中的SET-2中的849组数据作为实验数据,建立轴承的全寿命周期曲线。每组数据有20 480个数据。为方便后面的计算,把每组数据分为20段,每段1 024个数据;选择其中的200组健康状态数据训练健康状态的模型参数,剩余的649组作为测试数据;将所有数据进行小波包分解,并根据上文中的分析提取3、7节点的数据进行CEEMD分解,提取相关系数高于0.9的IMF分量作为特征向量,进行健康模型训练。
为比较隐马尔可夫模型(HMM)和变分贝叶斯-隐马尔可夫模型(VB-HMM)的区别,此处采用相同的数据分别对两种模型进行训练和测试,得到的结果如图5所示。
图5 似然对数曲线
图5中,为方便进行比较,两个曲线图取相同的纵坐标。从纵坐标来看,图5(a)曲线的极值相差70个单位的DI值,图5(b)中极值相差150个单位的DI值,所以图5(b)中的曲线变化趋势更加明显。
由图5可明显看出:200组后,图5(b)曲线开始明显下降,但图5(a)曲线没有表现出下降趋势;330组后,图5(b)曲线开始有大幅度振荡,图5(a)中只有较小幅度振荡。由此可见,变分贝叶斯-隐马尔可夫(VB-HMM)模型更适合轴承健康模型的建立。
再用图5(b)对实验台轴承的健康状态进行分析。图5(b)中,进行轴承健康状态检测的有649组数据。在实验开始的1组~200组中,曲线很平稳,且对数似然概率值(DI)较大,说明这200组数据是健康数据,轴承处于健康状态;随着时间推移,201组~330组的曲线开始缓慢下降,表明轴承性能逐渐偏离健康状态,开始劣化;在实验后期,331组~649组数据的曲线开始有较大波动且下降严重,并在最后下降到最低点,表明轴承性能处于严重受损状态。
由此可以看出:整个曲线可以描述轴承从健康状态到逐步劣化,再到失效的整个过程。所以,本文的健康状态评价模型能够准确地评价轴承的健康状态。
为了进一步说明采用变分贝叶斯-隐马尔可夫模型对轴承数据进行准确评价的有效性,笔者采用滚动轴承加速实验平台的数据进行验证。采用测量装置采集滚动轴承整个寿命周期的振动信号。其中,加速度计型号为DYTRAN3035B,振动信号的采样频率为25.6 kHz;每次采样间隔为10 s,采样个数为2 560个;滚动轴承的转速为1 800 r/min,载荷为4 000 N。
笔者将轴承振动信号的部分故障数据进行特征提取。首先对原始振动数据进行小波包分解预处理,分解后的能量分布如图6所示。
图6 轴承故障振动信号频带能量分布
图6中,该轴承信号的能量集中在节点6,所以笔者提取节点6进行信号重构,并进行CEEMD分解。
各IMF分量与小波分解后的信号的相关系数如表2所示。
表2 IMF分量与小波分解后的原信号的相关系数
笔者取相关系数高于0.9的IMF分量,作为特征信号进行模型训练;选取1 860组平台数据建立变分贝叶斯-隐马尔可夫模型。其中,取600组健康数据进行模型训练,取1 260组数据进行测试。
笔者将每组数据分成10段,每段256个点,得到的轴承的对数似然曲线如图7所示。
图7 似然对数曲线
从图7的实验台轴承全寿命周期曲线可知:
(1)前400组数据的DI值较大,表明轴承处于健康状态;(2)第400组开始,数据的DI值开始降低,表明此时轴承开始劣化并保持劣化状态继续运行;(3)第900组数据,DI值进一步降低,表明轴承状态持续劣化;(4)从1 200组数据到运行结束,轴承的DI值持续降低并出现最低点,表明轴承加速劣化直至失效。
由此可见,本文中的实验方法对实测平台数据仍然适用。
结合小波包-CEEMD特征提取和VB-HMM的优点,笔者提出了一种基于小波包-互补聚合经验模态分解和变分贝叶斯-隐马尔可夫模型的滚动轴承健康状态评价方法,建立了发电机组滚动轴承部件的健康状态评价模型;采用标准轴承数据和实验台实测数据进行了验证,很好地反映了轴承部件的性能退化过程,为制定运行维护策略提供了参考。
研究结果表明:该模型输出的对数似然概率值可作为指标进行状态评价;对数似然概率曲线的变化均能反映轴承的健康、劣化和失效的运行状态,该实验方法具有很好的适用性。