磷虾算法优化多分类支持向量机的轴承故障诊断∗∗

2019-05-29 01:28吕震宇
制造技术与机床 2019年5期
关键词:磷虾降维特征参数

吕震宇

(山东职业学院,山东济南250104)

大型旋转机械正朝着自动化、精密化、复杂化方向发展,其发生故障不仅使生产线瘫痪,甚至造成较大的人员伤亡。研究表明旋转机械30%的故障由滚动轴承引起[1],因此对滚动轴承性能状态进行监测、故障诊断,对保护设备和人员安全、提高经济效益意义重大。

机械故障诊断的两个核心问题是特征参数的提取与模式识别[2]。特征参数有时域、频域、时频域三类。时域特征参数包括峰峰值、均方根、鞘度、裕度、峰值等,单一时域特征参数包含的有用信息不完全,对某些故障不敏感;频域特征参数包括均方根、频谱方差、频谱平均值等,单一频域参数难以对轴承的非平稳、非线性信号进行退化预测;时频域特征参数提取方法有EMD、小波变换等方法。总的来讲,基于单一特征参数的性能退化预测存在信息量少、抗干扰能力差等问题,因此现在的研究热点是基于多特征信息的故障诊断方法。模式识别方法包括专家系统、故障树、支持向量机、神经网络等方法。专家系统借助知识和数据库模仿专家推理过程[3],故障树通过逻辑图表逐层排查分析查找故障原因[4],支持向量机根据不同方法扩展为多类分类器用于故障类型识别[5],神经网络通过相互连接的神经元模拟脑神经,对故障类型进行识别[6]。这些方法在不同应用领域都取得了较好的故障诊断结果,但依然没有形成普遍适用的成熟技术,轴承故障位置与故障类型的准确识别依然是当前研究的热点。

本文为了提高轴承故障识别准确度,提出了CEEMD与小波包半软阈值去噪相结合的时频域特征参数提取方法,使用LLE算法进行特征参数降维,提出了磷虾算法优化多分类支持向量机的故障模式识别方法,并实验验证了此方法的故障识别准确度极高。

1 特征参数提取及降维

1.1 CEEMD与小波包相结合的时频域特征提取

振动信号特征参数包括时域、频域、时频域三类。时域特征参数有均值、均方根、峰峰值、峭度、波形因子、峰值因子、脉冲因子、裕度因子、峭度系数等。频域特征参数有幅值谱、功率谱密度等,时域和频域特征参数物理意义在学术百科中有具体介绍,这里不再赘述。

对于时频域特征参数的提取,有小波变换和经验模态分解等方法。当滚动轴承噪声信号较大而湮没有用信号时,小波包在去除噪声信号的同时也会去除部分有用信息;CEEMD方法直接将信号的高频部分作为噪声去除,同时也去除了高频部分的有效信息。本文将两种方法结合在一起,实现优势互补。

CEEMD算法原理可参考文献[7-8],小波包去噪原理可参考文献[9],两种算法都已经成熟,这里不再赘述。将CEEMD与小波包进行优势融合,提出了CEEMD与小波包半软阈值去噪相结合的时频域特征参数提取方法,具体流程如图1所示。

基于CEEMD和小波包相结合的故障特征提取方法具体步骤为:(1)将原始振动信号进行CEEMD分解,得到从高频至低频的IMF分量;(2)噪声信号一般存在于高频信号中,因此对高频段模态分量进行小波包阈值去噪;(3)使用去噪后的高频段模态分量和低频段模态分量进行信号重构,得到去噪后的振动信号。

在此需要明确的是,去噪后的高频段模态分量和低频段模态分量是本文使用的时频域故障特征参数。

在时频域特征参数提取和去噪过程中,最关键的是小波包阈值的选取。目前常用的阈值有软阈值和硬阈值两种:硬阈值对信号边沿信息保护效果好,但是会出现断点而丢失信息;软阈值去噪后信号边沿平滑,但压制了信号幅值大小而造成信号失真。因此本文提出了半软阈值去噪方法,在去除随机噪声同时,保持信号真实性和完整性。半软阈值为:

式中:η为半软阈值化后的小波系数;w为小波原始系数;sgn()为符号函数;T2>T1>0 为选取的阈值。

1.2 降噪效果仿真验证

使用CEEMD与小波包结合的方法进行时频域特征参数提取,同时达到了降噪目的。若此方法降噪效果好,说明提取的特征参数中含有更多的有用信息,而包含较少的噪声信息。因此通过算法的降噪效果验证特征参数提取方法的有效性。

使用式(2)仿真包含高斯白噪声的滚动轴承故障振动信号,为:

式中:s(t)为振动仿真信号;y0为振幅;fn为固有频率;g为阻尼系数;t为时间;n(t)为高斯白噪声。

未加入白噪声的仿真信号如图2a所示,加入高斯白噪声的仿真信号如图2b所示。

对含有高斯白噪声的仿真振动信号分别使用小波包硬阈值降噪、软阈值降噪、半软阈值降噪,结果如图3所示。

将图3中不同阈值去噪后的信号与图2a进行比较可知,硬阈值对信号边缘信息保护较好,但断点现象明显;软阈值去噪后信号边沿平滑,但存在明显失真;半软阈值去噪后信号与原始信号非常相似,体现了较好的去噪效果。为了准确比较三种阈值的去噪效果,分别计算三种阈值去噪后信号的信噪比,硬阈值、软阈值、半软阈值对应信噪比分别为0.559、0.565、0.799,证明了本文提出的算法在去噪和特征参数提取中的有效性。

1.3 特征参数降维

前文中提到了9个时域特征参数、2个频域特征参数,时频域使用CEEMD与小波包分解出的7个IMF分量,共18个特征参数,多特征参数存在相关性和信息冗余问题,需要进行降维。主成分分析与核主成分分析对非线性信号降维效果差。本文使用LLE算法降低特征参数维度。

局部线性嵌入算法(local linear embedding,LLE)参考泰勒级数的思想[10],将高维非线性平面划分为多个小区域,只要区域足够小,就可以认为是一个近似线性平面。 记X= {x1,x2,…,xn},xi∈Rd为 LLE 算法降维前的数据集合,Y= {y1,y2,…,yn},yi∈Rm为 LLE 算法降维后的数据集合,其中m<d。算法主要分为三个步骤:一是确定样本点Xi在高维空间的k个最邻近点,可以使用欧式距离作为判断方法;二是确定样本点与k个最邻近点的重构权值;三是将样本点映射到低维空间,得到低维数据集合Y。

为了对主成分分析法、核主成分分析法、LLE算法的降维效果进行验证,本文使用美国凯斯西储大学的实验数据,使用电火花在滚动轴承内圈上加工出单点故障,故障深度分别为0.007英尺(2.13 mm)、0.014英尺(4.27 mm)、0.021英尺(6.40 mm),分别对应为轻度损伤、中度损伤、重度损伤。每种损伤程度采集30组样本数据,每组数据包含100个数据点。分别提取90组样本数据的时域、频域、时频域等18个特征参数,而后使用主成分分析法、核主成分分析法、LLE算法降维,其中主成分分析法、核主成分分析法提取贡献率90%的特征参数,LLE算法将18维特征参数降为8维。三种方法降维后使用模糊C均值聚类法进行聚类,聚类结果如图4所示。图中横纵坐标均为特征参数归一化数据。

分析图4可知,主成分分析法降维后的聚类中心较近且比较密集,同时存在部分混叠现象,模式识别时容易产生错误;核主成分分析法降维后混叠现象明显改善,但是同一损伤程度的特征值较为分散,聚类效果不理想;LLE算法降维后的特征值不存在混叠现象,而且同一损伤程度的特征值聚类程度高,这说明特征值降维后不仅能够降低计算量,而且有利于故障类型识别。

2 轴承故障类型识别算法

本文使用支持向量机进行故障类型识别。为了得到最优的支持向量机参数,本文使用磷虾算法对支持向量机参数进行寻优。

2.1 支持向量机基本原理

支持向量机的思想是求取一个将两类样本完全分开,且样本距离最大的平面或超平面。以二维线性可分问题为例,对支持向量机原理进行介绍。

如图5所示,图中三角形和正方向分别表示两类样本,平面H为最优分类线(高维时称为最优分类面),H1、H2平行于H、且经过与H最近的样本点,H1与H2的距离称为分类间隔,H1与H2上的样本点为支持向量。

记最优分类线H为wx+b=0,将求解超平面问题转化为分类间隔最大问题,即:

式中:(xi,yi)i=0,1,2,…,l为训练样本集,当wxi+b≥1,yi=1;当wxi+b≤-1,yi=-1。

引入拉格朗日算子α,将式(3)转化为对偶问题,为:

根据极值原理,函数在导数为0处取得极值,则对式(4)求关于w、b的偏导,令其等于0,得:

将式(5)代入到式(4)中,就可以将构建最优超平面问题转化为对偶二次规划问题,即:

求解上式,可以得到分类线H为:

式中:b∗为最优偏置;α∗为最优拉格朗日系数。

对于线性不可分问题,使用转换函数ϕ(x)将低维样本数据转换到n维样本空间,此时最优分类超平面表达为:

求解最优超平面时,引入松弛变量因子ξ和错误惩罚因子C,此时目标函数与约束条件为:

引入拉格朗日算子α,使用满足Mercer条件的核函数κ(xi,xj)替代内积运算,最终得到最优分类超平面为:

本文使用的核函数为RBF核函数,即:

式中:σ为标准差,反映支持向量间的相关程度。

2.2 支持向量机多分类问题

支持向量机是二值分类器,当前较为成熟的支持向量机多分类算法包括一对一SVM分类、有向无环图SVM分类、基于投票的SVM分类、二叉树SVM分类等。本文结合二叉树法和投票法,提出图6多分类方法。

轴承状态分为正常状态、内圈故障、外圈故障、滚动体故障等四种状态。图6中A代表轴承正常状态,B代表内圈故障,C代表外圈故障,D代表滚动体故障。从图6中可以看出,首先判断轴承是否处于正常状态,若支持向量机1输出为正(+1)则轴承正常,若输出为负(-1)则不正常;当轴承存在故障时,再使用投票法决定故障类型。每个支持向量机输出为正(+1)时为第一个故障类型,输出为负(-1)时为第二个故障类型。

2.3 支持向量机参数优化

核函数参数σ与错误惩罚因子C对支持向量机分类精度和泛化能力影响较大。当σ过小时,支持向量间联系稀疏,系统复杂,泛化能力差;当σ过大时,支持向量间联系过于紧密,分类精度低。当C值过大时,训练精度高,但是泛化能力差;当C值过小时,对误差惩罚力度小,使得训练精度低,因此设置合适的参数值极为重要。本文提出了基于磷虾算法的参数寻优方法。

在磷虾算法中,磷虾密度和食物吸引是引导磷虾个体运动的主要因素。第i只磷虾的运动速度使用拉格朗日模型表示为:

式中:Xi代表第i只磷虾的位置;Ni代表第i只磷虾在其它磷虾个体引导下的运动速度;Fi为食物引导的运动速度;Di为磷虾的随机运动速度。

磷虾个体引导的速度向量Ni不仅受相邻磷虾个体的引导,也受当前全局最优磷虾个体的引导,即:

式中:Nmax为个体引导最大速度;为相邻磷虾个体对第i只磷虾的引导因子;为当前最优磷虾个体对第i只磷虾的引导因子;ωn∈[0,1]为个体引导行为的惯性权重;Ni(k-1)为k-1时刻的引导速度向量。

食物引导的运动速度Fi受食物和历史最优位置的影响,表达式为:

式中:vf为食物引导的最大速度;为食物对第i只磷虾的引导;为历史最优觅食位置对第i只磷虾的引导;ωf∈[0,1]为食物引导行为的惯性权重;Fi(k-1)为k-1时刻的食物引导速度向量。

随机运动速度Di为:

式中:Dmax为随机扩散最大速度;I为算法当前迭代次数;Imax为算法最大迭代次数;δ∈[-1,1]为随机方向矢量。

磷虾的状态更新为:

参数优化的依据为适应度函数。本文将分类器对测试样本分类准确率为适应度函数,即:

式中:r为分类正确率,寻优空间为0.01≤C≤1 000,0.01≤σ≤1 000。

3 实验验证

本文使用美国凯斯西储大学的实验数据,其实验平台如图7所示。图中驱动电动机为1.5 kW,测试轴承为SKF6203,电动机转速为1 797 r/min,采样频率为12 kHz,在轴承上分别加工内圈故障、外圈故障、滚动体故障等,使用加速度传感器采集轴承的振动信号。

本文随机选取了正常状态、内圈故障、外圈故障、滚动体故障等状态实验数据各200组,计算每组数据的18个特征参数后使用LLE算法进行降维,使用每种状态的前100组数据进行训练,另外100组数据进行验证。

为了形成对比,分别使用磷虾算法和粒子群算法对支持向量机进行参数优化,然后进行故障诊断。随机从4种轴承状态中各选取2组数据,对支持向量机输出数据进行比较,表1给出了基于磷虾算法支持向量机的输出结果,表2给出了表1的投票结果和诊断结果;表3给出了基于粒子群算法支持向量机的输出结果,表4给出了表3的投票结果和诊断结果。

表1 基于磷虾算法的各支持向量机输出值

表2 基于磷虾算法的投票结果与诊断结果

表3 基于粒子群算法的各支持向量机输出值

对比表1、表2、表3、表4可知,经磷虾算法优化后的多分类支持向量机的诊断结果与实验设置的轴承状态完全一致,且磷虾算法优化后支持向量机的输出精度非常高,输出结果中出现了16个1,其余数值非常接近于1,说明输出精度极高。粒子群算法优化的多分类支持向量机输出精度相对较差,输出结果中只出现了两个1,其余数值波动较大,与1值差别较大,说明支持向量机分类误差较大,所以在第7组数据中将滚动体故障误判为外圈故障,说明粒子群算法对参数的优化效果差于磷虾算法。

表4 基于粒子群算法的投票结果与诊断结果

统计两种方法对轴承各种状态下100组数据的诊断结果,粒子群优化的多分类支持向量机准确率为79%,而使用磷虾算法优化的多分类支持向量机准确率为100%,这是因为磷虾算法中邻域磷虾、食物、随机扩展等因素对磷虾的引导,使磷虾充分搜索寻优空间,找到了全局最优参数。

4 结语

通过本文分析,可以得到以下结论:(1)CEEMD与小波包半软阈值相结合的去噪方法,在滤除信号噪声基础上保证了信号完整性;(2)与主成分分析法、核主成分分析法相比,LLE算法降维后的特征向量,不仅没有类间混叠,而且类内聚敛效果好,体现了LLE算法处理非线性信号时的优越性;(3)磷虾算法优化多分类支持向量机对轴承故障模式具有更高的识别准确率,这是因为邻域磷虾、食物、随机扩展等因素对磷虾的引导,使磷虾充分搜索寻优空间,搜索到全局最优值。

猜你喜欢
磷虾降维特征参数
混动成为降维打击的实力 东风风神皓极
磷虾真是“虾无敌”
南极磷虾粉在水产饲料中的应用
强大的磷虾
冕洞特征参数与地磁暴强度及发生时间统计
融合LPCC和MFCC的支持向量机OSAHS鼾声识别
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
基于交通特征参数预测的高速公路新型车检器布设方案研究
基于视频的车辆特征参数算法研究