基于CSO-SVM的轴承健康状态评估研究

2022-09-29 08:13:02贾萌珊齐子元薛德庆朱常安
计算机测量与控制 2022年9期
关键词:时域鸡群轴承

贾萌珊,齐子元,薛德庆,朱常安,2

(1.陆军工程大学石家庄校区,石家庄 050003; 2.中国人民解放军61035部队,北京 100094)

0 引言

健康状态评估方法包括基于物理模型的方法和基于数据驱动的方法。基于物理模型的健康状态评估需要对机械系统深入了解,这对于复杂机械系统存在着建模难度大、验证困难等问题。近几年,随着人工智能技术的迅猛发展,基于数据驱动的健康状态评估得到了广泛应用。

轴承在运转一段时间后会出现一系列问题,如磨损或疲劳剥落等,从而影响机器的正常工作。设备大多数故障属于渐变故障,一般代表着因为损失或磨损引起的输出参数变化导致机械产生故障的过程,这类故障产生的概率与机械运转的时间相关,运转时间越长,发生故障的概率越大,可以通过仪器事先进行测试和监控。轴承的故障多由磨损引起,属于渐变故障,其耗损程度与使用时间呈正相关。因此,分析其故障机理以及研究其演化过程,可以有效控制和预防故障的出现。对轴承进行健康状态评估能够降低安全风险和维修成本,保证机械系统的安全运行。越来越多的研究人员专注于轴承健康状态评估,并取得了一系列成果。西北工业大学的史晓雪和吴亚锋等人提出了基于AGPF的滚动轴承性能衰退趋势预测,准确预测出了轴承性能衰退趋势,有利于进一步开展预测性维护[1]。

随着人工智能的发展,许多学者将基于数据驱动的健康状态评估方法引入到了轴承的健康状态评估过程。1992年Boser等人首次提出支持向量机(support vector machine,SVM)用于解决二分类问题。随着对SVM的不断改进,SVM能够完成回归(support vector regression,SVR)和分类(support vector classification,SVC)等学习任务,前者多用于分类,后者多用于预测,因此,SVM成为了机器学习领域典型方法之一[2]。

SVM的基本思想是将原数据样本通过一个非线性映射函数从原始空间映射到高维空间,并在高维空间寻找一个分类面。能够将样本分隔开,与最近的样本距离最大的分类面称为最优超平面。与传统的机器学习相比,SVM能够解决小样本问题、高维问题、局部极值问题和结构选择问题,被广泛应用于自然语言处理、计算机视觉等多个研究领域[3]。

但利用SVM进行解决故障诊断和健康状态评估等问题时,又存在着需要人工设置参数而导致自适应能力差的问题,进而导致分类精度的下降。因此,研究人员提出了使用优化算法对SVM的参数进行寻优选取,以提高SVM的分类精度。

宋立业、孙琳提出了基于EEMD-GSSA-SVM的滚动轴承故障诊断,结果表明,利用全局麻雀群搜索算法能够有效提高支持向量机的分类精度,得出了精确的滚动轴承故障诊断结果[4]。张吴飞、李帅帅等人提出了基于IGWO-SVM的轴承故障分类预测,通过改进灰狼算法收敛支持向量机的参数,并对数据进行训练优化,与其他主流分类模型相比分类精度进一步提高,验证了该算法的优越性[5]。时培明等人提出了基于粒子群优化的支持向量机齿轮智能故障诊断模型。该模型现了中速轴大齿轮不同故障类型的可靠识别,验证了粒子群算法对支持向量机参数优化的可靠性[6]。

因此,利用智能优化算法对其参数进行寻优,能够提高支持向量机的分类精度。应用在轴承健康状态评估领域中,可以提高对轴承健康状态评估的准确度,使其结果更加可靠。

1 数据预处理

1.1 经验模态分解(empirical mode decomposition,EMD)

从数据采集系统获得的数据通常为时域信号,且由于采集系统自身或环境因素影响,在信号中含有噪声,需要对数据进行适当的处理后再进行特征提取。

相对于常用于信号降噪处理的小波变换,经验模态分解不仅吸收了小波变换多分辨率的优势,还克服了小波变换中需选取小波基与确定分解尺度的困难。EMD是一种基于信号局部特征的信号分解方法,该算法不需要信号的频率、幅度等先验知识即可对信号进行分解处理,在分析非平稳非线性信号方面具有独特的优势[7]。轴承的振动信号是一种非线性、非平稳信号,因此EMD分解在处理轴承振动信号时具有一定的优势。

经验模态分解的主要思想是自适应地将输入信号分解为有限的单一频率零均值基本分量,这些基本分量称为固有模态函数(intrinsic mode function,IMF),且每一个IMF分量都是独立的。利用EMD分解,可以对轴承信号按照真实存在的不同尺度或趋势分量逐级分解,将轴承信号分解为一系列具有相同特征尺度的数据序列。与原始信号相比,具有更强的规律性。

EMD的分解式为:

(1)

IMF应满足条件[8]:

1)极值点的数目等于过零点的数目,或者二者差值相差为1;

2)包络线平均值在任何点上都为零(分别用极大值和极小值组成上包络线和下包络线)。

EMD的中心理念是提取出具有更高原始波形的相似性,同时也包含了更小的冲击信息的IMF成分,从而消除影响判断的噪声数据。

1.2 峭度准则

轴承的故障信号中往往存在着瞬时冲击。峭度是一个能够反应信号瞬时冲击强弱的时域参数,对该类冲击特征非常敏感,与轴承的尺寸、载荷、转速无关,因此常用于分析轴承振动成分的强弱和轴承故障诊断。

谱峭度(spectral kurtosis,SK)是一种能够描述轴承发生故障时的冲击特性频率变化的统计参数,能够有效的检测出轴承的故障冲击信号[9-10]。

谱峭度的计算公式:

(2)

式中,H(t,f)为信号x(t)在频率f处的复包络,由短时傅里叶变换计算。<·>,|·|分别代表数学期望和模。

其中:

(3)

式中,γ(t)为时间长度极小的窗函数。

根据EMD方法判断,滚动轴承正常工作的峭度值约为3,因此,当IMF分量峭度值K大于3时,该IMF分量中含有较多的故障信息。当K的值不断增大时,说明故障程度在不断加深。因此,在优选IMF分类时,选择K值较大的分类,即为需要保留的有用IMF分量。利用峭度准则,筛选出有效的IMF分量,并对有效IMF分量进行重构,达到剔除原始信号中噪声信号的目的[11]。

2 CSO-SVM健康状态评估模型

2.1 鸡群优化算法(chicken swarm optimization algorithm, CSO)

鸡群优化算法(CSO)是Meng等人在2014年根据鸡群的等级制度和觅食行为提出的一种优化算法[12-13]。鸡群优化算法集成了粒子群算法、遗传算法、蝙蝠算法等的优化特性。对鸡群生活规律抽象化得到了一种新的群智能全局优化算法。鸡群优化算法的主体思路是模拟鸡群等级制度和鸡群行为。该算法模拟了鸡群行为和鸡群的等级制度,根据不同鸡所遵循的差异化移动规律和鸡群中存在的等级制度、竞争关系,母鸡孵化后代以及小鸡成长为公鸡或母鸡等真实鸡群行为规律,实现了群智优化算法。

鸡群优化算法能够实现多子群协同搜索,并且具有优秀的自适应能力,广泛应用于计算科学、管理科学、工程科学等领域中。鸡群优化算法为全局优化问题提供了新的思路和解决途径[14]。

在鸡群的等级制度中,具有较强觅食行为的公鸡占优势,其周围围绕着小鸡和母鸡。这种等级制度会在觅食和搜索食物的过程中不断更新。在鸡群算法中,按照鸡的适应度值,将其分为若干子种群和类型,包括公鸡、母鸡、小鸡。其中,公鸡具有最高适应度值、并作为每一个子种群的领头。紧接着的几只鸡,作为母鸡的适应度值。而适应度值最低的鸡被随机分配到一个子种群中,相应地,确定了母鸡与小鸡之间的母子亲密关系。其等级制度一旦确立将数代保持不变,等级制度每隔G(G∈[2,20])代更新一次。每一组内,母鸡跟随公鸡觅食,同时也随机偷取其他组内食物,小鸡跟随母鸡觅食。每一只鸡的位置对应优化问题的一个解,而公鸡、母鸡、小鸡的位置迭代方式也有所不同,其流程图如图1所示。

图1 鸡群优化算法流程图

公鸡位置更新公式:

公鸡的觅食领域随着其适应度值增大而增大。适应度值较大的公鸡比适应度值较小的公鸡在食物竞争中更具有竞争性,能够在更广泛的领域内寻找食物。

xi,j(t+1)=xi,j(t)*(1+randn(0,σ2))

(4)

k∈[1,NR],k≠i

(5)

其中:randn(0,σ2)是高斯分布函数,其均值为 0、标准差为σ2,fi为个体适应度值,fk为个体k的适应度分配值,为个体k从公鸡的群体中随机选择出来的公鸡。ε为无穷小数。

母鸡更新公式:

母鸡可以在同一组中公鸡处获取食物,还可以窃取其他鸡所寻觅的食物,因此其在小组中具有独特的优势,因此适应度值较高的母鸡比适应度值较低的母鸡具有优势。

xi,j(t+1)=xi,j(t)+S1*rand(xr1,j(t)-

xi,j(t))+S2*rand*(xr2,j(t)-xi,j(t))

(6)

(7)

S2=exp(fr2-fi)

(8)

其中:r1为第i只母鸡所配公鸡的位置,r2为任一公鸡或母鸡个体编号,且r1≠r2,rand为[0,1]内的随机数。

小鸡位置更新公式:

小鸡跟随母鸡寻找食物。

xi,j(t+1)=xi,j(t)+FL*(xm,j(t)-xi,j(t)

(9)

其中:xi,j(t)为第t次迭代时第i只小鸡追随的母鸡的位置,FL(FL∈0,2])为跟随系数。

2.2 支持向量机(support vector machine,SVM)

支持向量机是一种基于统计学习理论的有监督机器学习,其主要思想是对结构风险最小化的近似实现[15]。支持向量机因其构造简便容易运行,在处理小样品数据分析、处理不确定性问题中具有一定的优势。

当支持向量机用于分类时,其目的是构建样本之间最优的分类界限,即边界函数,当样本为二维时,边界函数为一个线性函数或一组线性函数,在高维空间中,边界函数为一组超平面。

设一组带标签的样本集为:

Data={(x1,y1),(x2,y2),(x3,y3),…(xm,ym)}

式中,xi,yi为第i个样本输入值和输出值,xi∈Rd,yi∈R。SVM的回归函数为:

g(x)=wTψ(x)+v

(10)

式中,w为权值,(·)为映射函数,其目的是将输入映射到高维空间,v为偏移量。

拉格朗日函数[16-17]:

(11)

式中,ai为拉格朗日乘子;

最终回归函数:

(12)

其中:K(·)为径向基核函数:

(13)

式中,σ为核宽度。

2.3 鸡群优化算法改进的支持向量机(CSO-SVM)

由支持向量机的结构可知,核宽度σ和惩罚因子t直接关系到支持向量机的分类效果。其中,惩罚t的作用是平衡支持向量的复杂度与误差率。t取值越大,支持向量越多,模型越复杂;反之亦然,t取值越小,支持向量越少,模型越简单。核宽度σ反映单个样本对超平面的影响。σ越小,单个样本对超平面的影响越小;反之,σ越大,单个样本对超平面的影响越大。

因此,不合适的核宽度σ和惩罚系数t取值会使降低SVM的回归效果。采用优化算法对参数σ和t寻优能提高回归效果,进而提高SVM的分类精度。

基于CSO-SVM的轴承健康状态评估流程如图2所示。

图2 基于CSO-SVM轴承健康状态评估流程

基于上述EMD、CSO和SVM模型,构建CSO-SVM健康状态识别模型,步骤如下。

Step 1:对原始信号进行经验模态分解,根据公式(2)计算各IMF分量的峭度值,保留峭度值大于3的IMF分量,并重构信号,达到振动信号降噪的目的。

Step 2:降噪后的重构信号进行特征提取,利用熵权法进行特征降维,筛选出最能表现出轴承退化趋势的特征。然后对特征进行归一化处理,得到轴承的退化趋势曲线。

Step 3:利用CSO优化SVM的核宽度σ和惩罚因子t。分别对归一化后的数据进行训练和测试,得到最终识别结果。

Step 4:计算识别精度,并将上述结果与传统的分类模型进行对比。

3 实验验证

本文的数据来源为IEEE可靠性协会和FEMTO-ST研究所组织的IEEE PHM 2012数据挑战赛轴承全寿命数据[18]。数据采集过程采用两个振动传感器,其安装位置呈90°,第一个安装在纵向轴上,第二个安装在水平轴上。传感器的类型为微型加速度计,沿径向放置在轴承的外圈上。采样频率为25.6 kHz。采样间隔为10秒,一次采样时间持续0.1 s,即每次采集2 560个点,共2 802个训练样本。本文选用Bearing1_1数据的纵轴方向数据,对轴承进行健康状态评估。

3.1 轴承特征提取

轴承是旋转元件,且大多数振动数据包含周期性运动,但随着故障的进行,轴承退化的过程会存在大量的噪声。相较于其他的信号处理方法,EMD在处理非平稳非线性信号表现出了一定的优越性,因此,采用EMD对振动信号进行降噪处理。首先对信号进行IMF分解,挑选出峭度大于3的IMF分量。

根据公式(2),得出各IMF分量的峭度值。正常状态下轴承IMF分量的峭度值和故障状态下轴承IMF分量的峭度值分别如表1、表2所示。

表1 正常轴承信号各IMF分量峭度值

表2 故障轴承信号各IMF分量峭度值

由表1~2可见,失效后的信号中包含故障信息的IMF分量逐渐增多。以正常的振动信号为例,提取出IMF2、IMF3、IM4分量进行信号重构。正常状态下原始信号和重构信号如图3所示。

图3 正常状态下原始信号和重构信号

对振动信号时间域进行处理所得到的特征成为时域特征[19]。当轴承出现故障时,时域信号的概率和幅值会随之发生变化。但是,时域信号的统计特征计算简单,适用于在线监测,缺乏稳定性和敏感性。当信号呈现非周期和故障不典型的问题时,难以从时域波形上看出设备的故障状态信息。因此,在对轴承振动信号进行特征提取时,还应该考虑频域特征,对信号进行频谱分析,通过频谱分析,可以观察到信号在频域上的分布情况。当轴承发生故障时,其振动信号的频率结构发生改变,体现在不同频率成分的能量以及频谱的主能量谱峰位置的变化[20-21]。通过对轴承振动信号的时域信息和频域信息的描述,可以全面反映轴承的运行状态。

通过傅里叶变换,时域信号转化为频域信号,再根据频域信号反映出的频域特征进行统计分析。傅里叶变换公式为:

(14)

经过EMD和谱峭度法对轴承振动信号进行降噪处理,然后对轴承信号进行时域特征提取和频域特征提取。时域特征和频域特征能够反映振动信号的概貌,从全局的角度对振动信号进行描述。因此,本文综合利用时域特征和频域特征的参数,共提取了27维的时域、频域特征。

高维数据包含着大量的无关信息和冗余信息,对机器学习算法的性能产生负面影响。因此,面对高维数据时,特征降维能够有效地消除无关和冗余特征,提高挖掘任务的效率,增强机器学习的准确性,增强学习结果的易理解性。

基于数据驱动的健康状态评估方法中,大多采用将时域特征、频域特征笼统的进行模型训练,未注意到每个特征量来表征轴承健康状态。而特征指标的权重系数能够较为客观地反映轴承时域、频域特征的重要程度,因此本文利用熵权法来优选特征,达到特征降维的目的[22]。

熵权法赋权步骤。

1)归一化处理:

(15)

xij表示第i个采样点的第j个特征。

2)各指标的信息熵:

(16)

(17)

3)确定各指标权重:

(18)

利用熵权法计算时域和频域信号的权重,得到权重最大的三个特征,分别为偏斜度、方差、标准差。时域和频域特征权重如图4所示。

图4 时域和频域特征权重

偏斜度:

(19)

方差:

(20)

标准差:

(21)

根据所提取的特征,构建如图5所示的滚动轴承的退化趋势曲线。

图5 轴承退化趋势曲线

健康状态评估本质是识别轴承退化状态和不同退化阶段的模式。根据轴承退化曲线图可知,轴承的退化趋势从0~1代表着从健康状态逐步退化到故障状态[21]。可以确认轴承在0~1 400组样本时,轴承退化趋势相对稳定,认为轴承此时出具健康状态;在1 401~2 769组样本点时,退化趋势曲线的幅值小幅度高于正常状态下的幅值,并且以较低的斜率增加,此时轴承处于退化状态。在2 770~2 802组样本中,退化趋势曲线的幅值明显高于正常状态,并且以较大的斜率快速增加,此时认为轴承处于故障状态。根据上述分析,以退化趋势曲线的斜率为判断准则,将轴承退化状态分为三个阶段:健康、亚健康和故障。

3.2 基于CSO-SVM的轴承健康状态评估

首先对实验数据划分训练集和数据集,利用训练样本对CSO-SVM模型进行训练。利用训练好的模型对测试样本进行分类,并对模型的分类效果进行评估。进而得到基于CSO-SVM模型的轴承健康状态评估结果。

基于CSO-SVM的轴承健康状态评估结果如图6所示,对照组分别为传统的机器学习模型,基于SVM的轴承健康结果如图7示,基于极限学习机(ELM)的轴承健康状态评估结果如图8所示。

图6 CSO-SVM康状态评估结果

图7 SVM健康状态评估结果

图8 ELM健康状态评估结果

其中,1、2、3分别代表健康、亚健康和故障三个阶段。利用CSO-SVM的健康状态评估准确率为97%,而利用SVM和ELM的健康状态评估的准确率为分别为88.6%和87.5%。结果表明,基于鸡群优化算法的支持向量机(CSO-SVM)的评估精度远高于传统的机器学习模型。

在机器学习中,常用混淆矩阵来分析、总结分类模型的预测结果。其作用机理是,对集中记录的数据按照真实类别和分类模型预测的结果以矩阵的形式汇总。其中,混淆矩阵的行向量表示真实值,列向量表示预测值。CSO-SVM、SVM和ELM的混淆矩阵分别如图9、图10、图11所示。

图9 CSO-SVM混淆矩阵图

图10 SVM混淆矩阵图

图11 ELM混淆矩阵图

4 结束语

本文的数据来源为IEEE可靠性协会和FEMTO-ST研究所组织的IEEE PHM 2012数据挑战赛轴承全寿命数据。构建健康状态评估模型时,以支持向量机为基本模型,利用鸡群优化算法对支持向量机的超参数进行优化,进而达到提高支持向量机的分类能力的目的。最后应用轴承全寿命数据进行健康状态评估并得出以下结论:

1)利用经验模态分解(EMD)对轴承的原始振动信号进行分解、重构能够达到降噪目的。分解后的IMF分量中,峭度值大于3的IMF分量进行重构,这种方法对处理非平稳、非线性的信号的健康状态识别的精度较高,能实现对振动信号的降噪。

2)鸡群优化算法(CSO)具有良好的参数优化能力。利用鸡群优化算法对支持向量机(SVM)模型中的核宽度和惩罚因子的取值进行寻优。结果表明,与传统的SVM模型相比,该优化算法提高了SVM的分类精度,使得模型的优化效果更加显著。

3)实验结果表明,基于CSO-SVM的识别模型能够准确、快速地识别轴承的健康状况,为识别其健康状况提供了一种新思路。

猜你喜欢
时域鸡群轴承
林下养殖鸡群人工免疫失败的成因及应对措施
引起鸡群呼吸道疾病的因素
轴承知识
哈尔滨轴承(2022年2期)2022-07-22 06:39:32
轴承知识
哈尔滨轴承(2022年1期)2022-05-23 13:13:24
轴承知识
哈尔滨轴承(2021年2期)2021-08-12 06:11:46
轴承知识
哈尔滨轴承(2021年1期)2021-07-21 05:43:16
基于时域信号的三电平逆变器复合故障诊断
测控技术(2018年11期)2018-12-07 05:49:02
基于极大似然准则与滚动时域估计的自适应UKF算法
基于时域逆滤波的宽带脉冲声生成技术
基于时域波形特征的输电线雷击识别
电测与仪表(2015年2期)2015-04-09 11:28:50