基于熵-流特征和樽海鞘群优化支持向量机的故障诊断方法

2021-03-31 07:29王振亚姚立纲蔡永武
振动与冲击 2021年6期
关键词:海鞘特征提取分类器

王振亚,姚立纲,蔡永武,张 俊

(福州大学 机械工程及自动化学院,福州 350116)

旋转机械设备故障诊断的关键在于从非线性、非平稳振动信号中提取故障特征信息,近年来,熵值特征提取方法被广泛应用于故障特征提取过程,如近似熵、样本熵、排列熵(permutation entropy,PE),多尺度熵和模糊熵等[1-2]。其中,排列熵具有计算速度快,抗噪能力强,适合在线监测等优点,因此在故障诊断领域应用较广,如Yan等[3]将PE作为旋转机械设备的状态特征值,取得良好实验效果;刘永斌等[4]利用PE有效监测滚动轴承状态变化。尽管PE在分析非线性时间序列的随机性和动力学突变等方面具有一定优势,但它忽略了非线性时间序列的振幅信息。针对这一问题,Fadlallah等[5]提出了保留时间序列振幅信息的加权排列熵(weightied permutation entropy,WPE)算法,在Shannon熵的计算过程以重构向量方差作为权值,提高算法鲁棒性和稳定性。Yin等[6]将WPE与多尺度熵相结合,提出多尺度加权排列熵(multiscale weightied permutation entropy,MWPE)算法,从多个尺度提取时间序列特征信息,以此克服WPE单一尺度分析的不足。但MWPE粗粒化方式定义的多尺度计算过程依赖于时间序列长度,导致熵值误差会随尺度因子增大而增加。针对这一问题,本文提出一种改进多尺度加权排列熵(improved multiscale weighted permutation entropy,IMWPE)算法,通过考虑同一尺度下多个粗粒化时间序列的加权排列熵值,弥补MWPE这一缺陷。

论文将IMWPE应用于旋转机械设备故障特征提取过程,考虑到提取的熵值故障特征具有高维、非线性、冗余等特性,因此,将流形学习算法应用于特征维数约简过程[7]。经典流形学习包括等度规映射(isometric mapping,Isomap)[8],局部切空间排列(local tangent space alignment,LTSA)[9],局部线性嵌入(locally linear embedding,LLE)[10]以及线性局部切空间排列(linear local tangent space alignment,LLTSA)[11]等。但上述方法均为无监督降维方法,维数约简过程没有利用样本标签信息,不适用于旋转机械设备故障信号此类具有诸多奇异数据点的情况[12]。故本文采用一种监督Isomap(supervised Isomap,S-Isomap)[13]流形学习算法对IMWPE特征集进行维数约简,提取出易于区分的低维、敏感IMWPE+S-Isomap熵-流特征集。

旋转机械设备故障诊断的本质在于模式识别,支持向量机(support vector machine,SVM)[14]具有较好的泛化性,并且能够有效避免局部极值,故在机械设备故障诊断过程有着较好的推广。但SVM在故障模式识别过程中,如何选取合适的参数成为了需要解决的一个重大问题。本文引入一种全新的元启发式优化算法——樽海鞘群优化算法(salp swarm optimization,SSO)[15-16]对SVM参数进行优化,提出一种基于樽海鞘群优化支持向量机(SSO-SVM)新算法。

依据上述分析,建立一种IMWPE+S-Isomap熵-流特征和SSO-SVM的故障诊断模型。将所提方法应用于行星齿轮箱故障诊断实验数据分析过程,结果表明该方法可有效、精准判别出各工况类型。

1 熵-流特征提取

1.1 改进多尺度加权排列熵

1.1.1 多尺度加权排列熵算法

多尺度加权排列熵能够有效衡量非线性时间序列复杂性和动力学突变。当旋转机械设备出现故障时,非线性动态复杂性也发生相应变化,因此可将其应用于故障特征提取过程。对于时间序列X{x1,x2,…,xN},MWPE的具体步骤如下:

步骤1利用式(1)对原始时间序列进行粗粒化重构,得到粗粒化序列Ys={ys(j)}。

(1)

式中,s为尺度因子。

步骤2计算不同尺度因子下,粗粒化序列Ys的加权排列熵值,表达式为

EM(X,m,τ,s)=EW(Ys,m,τ)

(2)

式中:m为嵌入维数;τ为时延;EW(·)为加权排列熵值,WPE具体过程参见Fadlallah等的研究。

1.1.2 改进多尺度加权排列熵算法

MWPE克服WPE单一尺度分析的不足,但该算法粗粒化过程中WPE熵值误差会随尺度因子增大而增加。因此,本文通过平均同一尺度因子下多个粗粒化序列的WPE熵值,从而避免因粗粒化时间序列变短而导致WPE熵值突变情况的发生,使计算结果更加精准。

对于时间序列X={x1,x2,…,xN},改进多尺度加权排列熵的具体过程如下:

(3)

当尺度因子为s,即可得到s个不同的粗粒化序列。

(4)

IMWPE计算结果与嵌入维数m,尺度因子s和时延τ有关。嵌入维数m设定过小,重构向量变短,算法将不能有效检测时间序列的动力学突变;反之,嵌入维数m设定过大,不仅增加计算量,而且无法有效反映时间序列的微弱变化,因此通常设定嵌入维数的取值范围为[4,7],本文设定为6。尺度因子s的选取没有固定标准,一般设定为s≥10,本文设定s=25。时延τ对IMWPE的影响较小,本文设定τ=1。

1.2 监督等度规映射算法

IMWPE提取的故障特征存在信息冗余和高维等特性,会影响最终识别结果。因此,本文采用监督等度规映射流形学习对该高维故障特征进行维数约简。对于输入样本集U=[u1,u2,…,uN]T而言,S-Isomap具体过程如下:

步骤1定义一个包含所有样本的邻域图G,构建监督型距离矩阵Ds={ds(ui,uj)}。若样本点ui是uj的K近邻点,则ui与uj有边连接,且边长为ds(ui,uj);否则无边连接

(5)

式中:d(ui,uj)为样本点ui和uj之间的欧氏距离;Lui为ui的标签信息;β用来抑制类间距离过快增长,定义为所有样本点欧氏距离的平均值;α用以调节不同标签样本点间的相似度。

步骤2利用Dijkstra方法计算最短路径,并将图G上任意两点之间的最短路径定义为两点之间的测地距离。

步骤3应用多维标度分析(multidimensional scaling,MDS)算法对测地距离矩阵进行低维映射,得到低维嵌入结果Y。

1.3 熵-流特征提取

根据上述理论基础,提出一种基于IMWPE+ S-Isomap的熵-流特征提取方法,具体步骤如下:

步骤1利用改进多尺度加权排列熵算法从多尺度全面提取旋转机械设备不同工况下振动信号的IMWPE熵值特征信息,合并成原始高维故障特征集。

步骤2采用监督等度规映射流形学习算法对原始高维特征集进行特征压缩,得到低维、敏感和易于区分故障类型的特征向量集。

2 樽海鞘群优化支持向量机

2.1 樽海鞘群优化算法

与传统群优化算法(如灰狼群、蝙蝠群、人工蜂群等)相比,樽海鞘群具有严格的等级制度,能有效避免“群”结构模式中由于领导者前期搜索不充分而陷入局部极值情况的发生。樽海鞘群优化算法的具体过程如下:

步骤1樽海鞘群体初始化——设捕食空间为M×B维欧式空间,其中M为樽海鞘种群规模,B为维数。食物位于F=[F1,F2,…,FB]T,樽海鞘位于Sn=[Sn1,Sn2,…,SnB]T,n=1,2,…,M。搜索上界为ub=[ub1,ub2,…,ubb]T,搜索下界为lb=[lb1,lb2,…,lbB]T。采用式(6)随机初始化樽海鞘种群

SM×B=rand(M,B)×(ub-lb)+lb

(6)

步骤2领导者位置更新

(7)

c1=2e-(4l/lmax)2

(8)

式中:l为当前迭代次数;lmax为最大迭代次数;c1为2~0的递减函数。

步骤3追随者位置更新

(9)

2.2 樽海鞘群优化支持向量机算法

鉴于樽海鞘群优化算法的优势,将其应用于SVM惩罚因子c和核函数参数g的优化过程,其中SVM的具体过程见Tong等的研究,本文设定SVM的内核函数为径向基核函数。樽海鞘群优化支持向量机的流程图如图1所示,具体步骤如下:

图1 SSO-SVM流程Fig.1 Flowchart of SSO-SVM

步骤1将训练集和测试集样本输入至SVM。

步骤2确定SSO算法参数,为全面搜索最优解,设定樽海鞘种群规模为20,迭代次数为100,搜索上界为[100,100],搜索下界为[0.01,0.01],根据式(6)随机初始化樽海鞘种群。

步骤3计算每个樽海鞘个体的适应度值,其中以训练样本三折交叉验证(即将训练数据均分成三个子集,然后依次对每个子集使用其余两个子集训练得到的分类器进行测试)所得平均识别率定为适应度值。

步骤4根据适应度值对樽海鞘个体进行降序排列,选出适应度最大值为领导者,其余为追随者,并定义领导者所处的空间位置为当前食物方向。

步骤5根据式(7)更新领导者位置,再根据式(9)更新追随者位置。

步骤6计算更新后樽海鞘个体的适应度值,并与当前食物的适应度值进行比较,若更新后的樽海鞘适应度值优于食物,则将该樽海鞘的位置定义为食物新位置。

步骤7重复步骤5~步骤6,直到满足迭代终止条件,输出食物坐标,即为最佳参数值(cb,gb)。

步骤8建立SVM的预测模型,并对测试集进行预测。

2.3 仿真实验

为了验证SSO-SVM分类器的优越性,将其应用于UCI数据库中的Iris数据集(数据集描述如表1所示)分类过程。此外,将该分类器与SVM,粒子群优化支持向量机(particle swarm optimization-SVM,PSO-SVM),灰狼群优化支持向量机(gray wolf optimization-SVM,GWO-SVM),人工蜂群优化支持向量机(artificial bee colony optimization-SVM,ABC-SVM)以及蝙蝠群优化支持向量机(bat algorithm optimization-SVM,BA-SVM)等分类器[17-19]进行对比(分类器参数设置如表2所示),各分类器对Iris数据集进行50次重复实验后的平均适应度值曲线以及平均识别率如图2所示。

表1 Iris数据集描述Tab.1 Description of Iris dataset

表2 分类器参数设置Tab.2 Parameters of different classifiers

据图2(a)可知,相较于其他群优化SVM分类器而言,SSO-SVM在较少的迭代次数下就能获取最佳适应度值,且SSO-SVM的最佳适应度值高于其他群优化SVM,验证了利用SSO算法进行SVM参数优化是有效可行的。此外,据图2(b)可知:①优化后的SVM对Iris数据集测试样本识别效果明显优于未经优化的SVM,这表明采用优化算法能够提高识别效果;②相较于其他群优化SVM而言,SSO-SVM对Iris数据集测试样本有着最高平均识别率,以此验证SSO-SVM分类器的优越性。

图2 不同分类器对Iris集的平均适应度值曲线和平均识别率Fig.2 Average fitness curves and average recognition rate of different classifiers on Iris dataset

3 旋转机械设备故障诊断模型

3.1 故障诊断模型

本文建立一种熵-流特征和SSO-SVM的故障诊断方法,流程如图3所示,具体步骤如下:

图3 故障诊断方法流程Fig.3 Flowchart of fault diagnosis method

步骤1在一定采样频率fs下,分别采集不同工况下的旋转机械设备振动加速度信号各Q组;随机选取每种工况下q组信号作为训练样本,剩余Q-q组作为测试样本。

步骤2利用IMWPE算法分别计算出训练和测试样本的IMWPE熵值,合并成原始高维故障特征集F(5×Q)×s,其中,s为尺度因子。

步骤3利用S-Isomap流形学习算法对原始高维特征集进行特征压缩,得到低维敏感的熵-流特征向量F′(5×Q)×d,其中,d为本征维数。

步骤4将训练样本和测试样本的低维特征集输入至SSO-SVM多故障分类器(采用一对一的方式)中进行识别与诊断,判断工况类型。

3.2 故障诊断实验分析

为验证所提方法的有效性,将其应用于行星齿轮箱故障分析过程。在Spectra Quest公司开发的动力传动系统故障诊断综合实验台进行太阳轮正常和具有磨损故障、裂纹故障、断齿故障、缺齿故障等5种工况(标签信息分别定义为1,2,3,4,5)实验数据的采集,实验平台及故障位置如图4所示。本次实验中,行星齿轮箱基本参数如表3所示,输入轴转速为25 Hz,负载电流为0.5 A,采样频率设定为7 680 Hz,通过滑动时间窗口(每个滑动窗口包含2 048个采样点)得到5种工况各100组样本,共计500组样本。此外,训练样本与测试样本按2∶8随机分配,共计100组训练样本,400组测试样本。行星齿轮箱5种工况时域波形如图5所示。

图4 行星齿轮箱故障诊断平台Fig.4 Planetary gearboxes fault diagnosis platform

表3 行星齿轮箱参数Tab.3 Planetary gearbox parameters

图5 行星齿轮箱5种运行状态振动信号的时域波形Fig.5 Time domain waveform of five operating states vibration signals of planetary gearboxes

为验证IMWPE熵值特征提取的有效性,将其与MWPE进行对比,其中,设置两种算法嵌入维数m=6,时延τ=1,尺度因子s=25。两种方法对行星齿轮箱5种工况分析结果如图6所示。据图6可知,对于同一工况而言,IMWPE与MWPE熵值曲线虽然较为接近;但当尺度因子大于1时,IMWPE熵值误差均低于MWPE,在高尺度下更为明显。这验证了IMWPE算法中采用改进粗粒化序列构造方式,能够弥补传统MWPE算法存在的熵值不稳定缺陷。此外,为进一步验证IMWPE的优越性,将IMWPE和MWPE提取的故障特征分别输入至SSO-SVM多故障分类器中进行识别与诊断,两种特征提取方法的识别结果和多类别混淆矩阵如图7所示。据图7可知,IMWPE的识别结果中,有37个样本出现类别误判现象,平均识别率达到90.75%。而MWPE的识别结果中,有47个样本出现类别误判现象,平均识别率为88.25%。上述分析表明IMWPE特征提取的优势。

图7 SSO-SVM多故障分类器对两种特征提取方法的识别结果和多类别混淆矩阵Fig.7 Recognition results and multi-class confusion matrices of two feature extraction methods based on SSO-SVM multi-fault classifier

图6 IMWPE与MWPE对行星齿轮箱5种工况分析结果Fig.6 Analysis results of five working conditions of planetary gearboxes using IMWPE and MWPE

IMWPE虽能提取出可以区分不同工况下的故障特征,但该特征集不可避免存在部分冗余信息,影响了诊断识别效果。因此,本文利用S-Isomap流形学习算法对IMWPE故障特征集进行维数约简。为验证该方法的有效性,将其与Isomap和LLTSA等方法进行对比。通过交叉验证确定3种算法最佳参数,具体设置如下:Isomap近邻参数为27;LLTSA近邻参数为30;S-Isomap近邻参数为27,α=0.3。3种方法降维后的三维可视化结果如图8所示。据图8可知,S-Isomap的可视化结果中,5类样本聚集性最好,各类样本可以明显区分,降维效果最佳;Isomap和LLTSA的可视化结果中,5类样本分布较为分散,并且存在严重混叠现象,降维效果较差,以上验证S-Isomap的有效性。

图8 3种算法降维后的三维可视化结果Fig.8 Three-dimensional visualization results of three algorithms after dimensionality reduction

此外,为进一步验证IMWPE+S-Isomap熵-流特征提取效果的优越性,将其与MPE,MWPE,IMWPE等熵值特征提取方法以及IMWPE+Isomap和IMWPE+ LLTSA等熵-流特征提取方法进行比较。分别将上述6种特征提取结果输入至SSO-SVM多故障分类器中进行识别与诊断,结果如表4所示。

表4 SSO-SVM多故障分类器对不同特征提取方法的测试样本诊断结果Tab.4 Test samples diagnosis results of different feature extraction methods based on SSO-SVM multi-fault classifier

据表4可知:① 在熵值特征提取方法中,3种熵值特征提取方法的平均识别率大小关系为:IMWPE>MWPE>MPE;② 与IMWPE特征提取(平均识别率为90.75%)相比,IMWPE+Isomap,IMWPE+LLTSA和IMWPE+S-Isomap等3种熵-流特征提取方法能够提高平均识别精度(分别提高了1.5%,1.25%和9.25%);③ 在熵-流特征提取方法中,IMWPE+Isomap和IMWPE+LLTSA熵-流特征的平均识别率均低于所提IMWPE+S-Isomap方法。分析上述结果的原因在于:① IMWPE熵值方法,既保留了MWPE考虑振动信号的振幅信息的优势(MPE未考虑),又克服了MWPE熵值误差会随尺度因子增大而增加的缺陷,因此,具有较高的平均诊断精度;② 熵-流特征提取方法,利用流形学习进行二次特征提取,能够去除冗余信息,因此识别效果优于原始IMWPE熵值特征提取;③ 与IMWPE+S-Isomap熵-流特征提取方法相比,IMWPE+Isomap和IMWPE+LTSA的无监督方式导致其无法在类别标签信息的指导下进行维数约简,出现一定数量样本类别误判现象的出现。上述分析表明IMWPE+S-Isomap熵-流特征提取方法能够有效提取出易于区分行星齿轮箱故障类型的特征值。

最后为验证利用SSO-SVM分类器进行行星齿轮箱故障诊断识别的优势,将其与现有的PSO-SVM,GWO-SVM,ABC-SVM以及BA-SVM等分类器进行对比。将IMWPE+Isomap,IMWPE+LLTSA和IMWPE+ S-Isomap等熵-流特征提取结果分别输入至上述5种分类器中进行诊断识别。其中,各分类器参数设置与表2相同,并且均采用一对一的方式建立多故障分类器。5种多故障分类器对3种熵-流特征提取结果的测试样本平均识别率如图9所示。

据图9可知,5种多故障分类器对IMWPE+S-Isomap熵-流特征提取的平均识别率均达到100%,验证该特征提取方法能够提取出易于区分故障类型的特征信息。此外,与PSO-SVM,GWO-SVM,ABC-SVM和BA-SVM等多故障分类器相比,SSO-SVM多故障分类器对3种特征提取结果的测试样本平均识别率均为最高,验证了SSO-SVM在行星齿轮箱智能故障诊断中具有较好的识别效果。

图9 5种多故障分类器对3种特征提取结果的测试样本平均识别率Fig.9 Average recognition rate of test samples for three entropy-manifold feature extraction results using five multi-fault classifiers

4 结 论

(1)提出IMWPE+S-Isomap的熵-流特征提取方法,实验结果表明,IMWPE算法克服了MWPE粗粒化过程的不足,提取得熵值更为稳定;S-Isomap流形学习算法降维效果优于Isomap和LLTSA;IMWPE+S-Isomap熵-流特征提取方法能够提取出易于区分行星齿轮箱故障类型的特征信息。

(2)研发樽海鞘群优化支持向量机分类器,将樽海鞘群优化算法应用于SVM的参数寻优过程,仿真实验和行星齿轮箱故障诊断实验分析表明,SSO-SVM识别效果优于现有的PSO-SVM,GWO-SVM,ABC-SVM和BA-SVM等分类器。

(3)建立基于IMWPE+S-Isomap熵-流特征和SSO-SVM的故障诊断方法,经由行星齿轮箱故障诊断实验分析验证表明,所提出方法能够有效、精准地诊断出行星齿轮箱的不同工况类型。

猜你喜欢
海鞘特征提取分类器
改进樽海鞘群优化K-means算法的图像分割
基于Daubechies(dbN)的飞行器音频特征提取
中国沿海污损性海鞘生态特点及研究展望
污损性海鞘的生态特点研究展望
Bagging RCSP脑电特征提取算法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
神秘胶球席卷海滩
基于MED和循环域解调的多故障特征提取
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别