基于局部切空间排列和K-最近邻分类器的转子故障诊断方法

2015-10-28 09:50刘立远
中国机械工程 2015年1期
关键词:高维特征提取分类器

孙 斌 刘立远 牛 翀

1.东北电力大学,吉林,132012  2.大唐保定热电厂,保定,071000

基于局部切空间排列和K-最近邻分类器的转子故障诊断方法

孙斌1刘立远1牛翀2

1.东北电力大学,吉林,1320122.大唐保定热电厂,保定,071000

为了解决大型机械设备故障数据难以准确快速提取的问题,提出了一种基于局部切空间排列(LTSA)和K-最近邻分类器的转子故障诊断模型。首先基于转子的振动信号构造一个高维多征兆矩阵,利用LTSA提取高维矩阵的低维特征向量,映射在可视空间里;然后将提取的低维特征向量输入K-最近邻分类器进行故障模式识别。试验和数据降维仿真过程表明,该模型的准确度和快速性均优于LTSA和神经网络以及LTSA和支持向量机组成的故障诊断模型。

局部切空间排列;K-最近邻分类器;模式识别;故障诊断

0 引言

现代大机组汽轮机转子的结构越来越复杂,出现故障的原因也日趋多样化,使得设备的故障诊断很难准确快速地进行,而提取故障特征又是故障诊断的关键步骤。早期人们通常利用时域、频域的特征参数分析来进行特征提取,然后应用人工神经网络等技术进行故障识别[1]。然而,单一的时域或频域特征都无法准确全面地描述故障特征,而高维多征兆特征的非线性信息中又存在冗余信息,必须人工去除冗余信息,提取主要特征。

特征提取方法有线性方法和非线性方法,线性判别分析(linear discrimination analysis, LDA)等算法称为线性降维方法,主要适合对具有线性结构的高维数据进行维数约简处理。2000年Science杂志上发表了3篇关于流形学习的论文[2-4],流形学习方法可以有效地对高维非线性数据进行维数约简、特征信息提取处理[5-6]。局部切空间排列(local tangent space alignment, LTSA)是一种经典的新型流形特征提取方法,在降维前后,数据的内在属性没有任何变化,相比拉普拉斯特征映射(Laplacian eigenmaps, LE)等流形学习算法具有更强的特征提取能力[7-8],分类效果和效率都要明显优于上述方法。

故障的特征信息提取之后,还需要用分类器进行模式识别来提高故障诊断精度。BP神经网络(BP neural network, BPNN)、支持向量机(support vector machine, SVM)等方法在应用过程中需要选择合适参数,所以需要消耗大量时间来进行参数调整和训练,存在结构难以确定等问题[9-11]。K-最近邻分类器(K-nearest neighbor,KNN)可以直接用训练样本的局部信息对测试样本进行分类决策,不仅结构稳定,而且具有集成高效的模式识别能力[12]。

本文提出了“原始故障信号-高维矩阵-LTSA-K-最近邻分类器”模型,该模型实现了故障诊断的准确化和快速化。

1 局部切空间排列和K-最近邻分类器原理

1.1局部切空间排列

LTSA通过无限靠近每一样本点的切空间来构建低维流形的局部几何空间,然后利用局部切空间排列得到整体低维特征坐标。过程如下: 首先,获得每个数据点的邻近点,局部的非线性几何特性近似用邻域中低维切空间的坐标来表示; 然后,利用变换矩阵把各数据点邻域切空间的局部坐标投影到规范的全局坐标上; 最后,把求解整体嵌入坐标问题演变为求解矩阵的特征值问题,从而把高维数据降到低维。设故障样本个数为N,故障样本维数为m,Y为高维故障样本集,高维样本集Y在Rm空间的数据集Y=[y1y2…yN],该算法的目的是从中提取出一个d(m>d) 维的主流形,局部切空间排列特征提取过程如下。

(1)样本点邻域的选取。基于每个样本点yi(i=1,2,…,N),以K-最近邻为标准,选取包括其自身在内的k个最短距离点作为邻域,样本点yi的近邻点构成一个邻域矩阵YNi=[yi1yi2…yij]。

(3)局部坐标的整合。根据k个局部投影Ai获得全局坐标{βi},对于所有的Li∈Rd×d和Ti=(β1,β2,…,βn),βi=(βi1,βi2,…,βik),利用最小化全局重构误差得到全局坐标:

(1)

1.2K-最近邻分类器

最近邻分类器的具体内容如下:先计算测试样本与各训练样本的余弦距离,找出距离最近的k个近邻,然后求出测试样本对训练样本各状态的隶属度,隶属度最大的为测试样本的状态。K-最近邻分类器具体计算步骤如下。

设测试样本经LTSA提取的特征向量为y0,y0和训练样本yi之间的余弦距离为

(2)

定义测试样本y0和Ei类样本的隶属度为

(3)

其中,KNN(y0)是y0的最近邻域集,δ(yi,Ei)是yi关于Ei的类属性,则使y0与之隶属度最大的E为y0所属类别,即

(4)

2 故障诊断试验

2.1试验数据的采集

转子振动试验台(图1)可以模拟振动信号,通过人为措施制造一些故障来模拟汽轮机转子的振动故障。试验装置包括转子ZXP-4A、振动试验台、41M/HG-2508型数字测振仪主机、信号采集器、电涡流传感器、计算机以及DASP等。模拟的故障分为3类,包括不对中、不对中加松动、转子质量不平衡。各种故障模拟的方法如下:不对中故障是将联轴器换成硬质橡胶管,并在轴末端的轴承座底垫上1个或2个垫片,人为地将轴承座扭转一定角度来实现;不对中加松动故障则是在不对中的试验中同时加入轴承座松动来实现;不平衡故障通过在临近电涡流传感器的转子转盘上旋入3~5个螺丝钉,螺丝钉要集中,以使转子发生质量不平衡故障。

图1 转子试验台

故障信号的原始振动频率分别为1000 Hz、1200 Hz、1400 Hz,转子转速分别对应为1000 r/min、1150 r/min、1200 r/min,采取样本点数为8000。在每个转速下每种故障取10组样本数据。

2.2构造高维矩阵

三类故障信号如图2所示。单一地通过分析波形图,或者研究时域、频域特征都不可能准确诊断故障特征类型,这是因为故障的特征没有被全面地描述,需要构造一个有效的高维空间来全方位地刻画故障特点。本文以相空间重构思想为基础,提出了一种新的高维空间构造方法,获得的高维空间能够使故障特征被全面刻画,该方法相对于相空间重构,对故障分类的效果更佳。设原始振动信号为S=[S1S2…Sn],构造高维空间的过程如下。

图2 故障振动

(1)找出S中所有的极值点,标记极值点的位置。

(2)对所有极值点取绝对值,再求其平均值,若极值点大于平均值,则保留极值点,否则去除它。得到的保留极值X=[X1X2…Xn]。

(3)以步骤(2)的保留极值作为基点截取长度为∂的m维相空间,每一个m维向量都是重构相空间中的点X1,X2,…,XN,即所要构造的m×N高维矩阵。有

X1=(X1,X1+τ,…,X1+(m-1)τ)

X2=(X2,X2+τ,…,X2+(m-1)τ)

XN=(XN,XN+τ,…,XN+(m-1)τ)

(m-1)τ=∂

其中,m为嵌入维数,τ为延迟时间。本方法和相空间重构的本质区别在于增加了步骤(1)、(2),使故障信息能被准确和全面地描述。嵌入维数m和延迟时间τ是决定重构相空间质量的两个重要参数。

2.3数据降维过程

分别用LDA、LE、LTSA三种方法对高维矩阵X进行降维,得到低维空间Y,然后映射到可视空间来完成视觉故障分类。经过深入研究得出结论,这三种方法的特征提取结果和样本长度、样本点个数关系不大,但是和近邻点个数、特征提取维数d密切相关。笔者通过多次模拟和分析得到了各种方法的最佳近邻点数和维数:LDA(d=2,k=15,d=3,k=20)、LE(d=2,k=12,d=3,k=10)、LTSA(d=2,k=16,d=3,k=18)。二维特征如图3所示,LDA方法的提取结果最差,故障状态样本分布较分散,无法判断故障种类。LE方法能把不同的故障区分开,但是不同的故障有交叉重叠现象。LTSA方法实现了三种状态样本数据的完全分离,并且各类状态样本平稳性较好,基本聚集在同一个局部区域。

(a)LDA特征

(b)LE特征

(c)LTSA特征图3 三种提取方法的二维特征分布

三维特征如图4所示,LDA的分类效果也较差,三种故障样本有交叠的部分,而且不同故障的类型距离也非常近,不能把故障区别开。LE效果稍好一些,不同故障相对较远,但是同种故障样本距离稍远,不利于分类。LTSA效果较好,不同故障点没有交叠的部分,而且相对距离较远,容易把不同的故障类型分辨出来。

综上所述,可以证明局部切空间排列算法能够很好地获取高维数据空间的几何结构特性,有效地完成了视觉故障分类。

(a)LDA特征

(b)LE特征

(c)LTSA特征图4 三种提取方法的三维特征分布

为了进一步将LTSA和其他特征提取算法效果作对比,将三种方法提取的特征向量送入支持向量机分类器进行模式识别。每类故障选用400个训练样本,100个测试样本,三种方法的邻域大小、约简维数设置保持一致。支持向量机选择高斯函数作为核函数,以核半径σ=0.99和误差惩罚参数λ=100作为最优确定参数,计算机配置为Core2 2.2GHzCPU,内存2GB。从表1可以看出,三种方法的样本训练时间和测试时间相差不大。但是LTSA+SVM的故障诊断模型中每种故障的诊断率和总体诊断率最高,充分体现了LTSA较高的综合性能。

表1 三种不同的特征提取方法的故障诊断精度比较

2.4K-最近邻分类器模式识别

为了验证KNN方法的有效性,分别采用BP、支持向量机、KNN作为分类器和LTSA组成故障诊断模型。BP网络模型选用运算速度最快、最稳健的Levenberg-Marquardt 算法,选用效率最高的高斯核支持向量机。每类故障也是选用800个训练样本,100个测试样本。

从表2可以看出,由于KNN直接用训练样本的局部信息对测试样本进行分类决策,LTSA+KNN构造的故障分类器效率非常高,而SVM和BP网络的训练过程需要反复迭代来确定参数,所以耗时较长。LTSA+KNN故障诊断率也非常高,说明该模型大大提高了故障诊断精度。

表2 三种不同的特征提取模型的故障诊断精度比较

3 结论

(1)本文将流形学习方法应用到转子故障诊断中,研究了局部切空间排列算法。通过和另外两种降维方法作对比,说明该算法成功提取了高维数据的低维流形特征,明显改善了故障模式识别的分类效果。进一步比较了这三种流形算法维数化简后的故障诊断精度,显示了LTSA的优越性。

(2)将LTSA+KNN和其他两种故障诊断模型作对比,由于KNN的故障诊断模型具有建模方法简单、人为确定参数少、识别精度高等优点,充分证明了该模型在运算速度和故障诊断率方面的可应用性。

[1]刘丽娟,陈果,郝腾飞.基于流形学习与一类支持向量机的滚动轴承早期故障识别方法[J].中国机械工程,2013,24(5):629-633.

Liu Lijuan, Chen Guo, Hao Tengfei. Incipient Fault Recognition of Rolling Bearings Based on Manifold Learning and One-class SVM[J].China Mechanical Engineering, 2013, 24(5): 629-633.

[2]Seung H S, Daniel D L. The Manifold Ways of Perception[J]. Science, 2000, 290(5500): 2268-2269.

[3]Roweis S, Saul L. Nonlinear Dimensionality Reduction by Locally Linear Embedding[J]. Science, 2000, 290(5500): 2323-2326.

[4]Tenenbaum J, Silva D D, Langford J. A Global Geometric Framework for Nonlinear Dimensionality Reduction[J]. Science, 2000, 290(5500): 2319-2323.

[5]Kouropteva O, Okun O, Pietikainen M. Supervised Locally Linear Embedding Algorithm for Pattern Ecognition[J]. Pattern Recognition and Image Analysis, 2003, 2652(9): 386-394.

[6]Liu Xiaoming, Yin Jianwei, Feng Zhilin, et al. Orthogonal Neighborhood Preserving Embedding for Face Recognition[C]//2007 IEEE International Conference on Image Processing(ICIP 2007).New York,2007: 133-136.

[7]万鹏,王红军,徐小力.局部切空间排列和支持向量机的故障诊断模型[J].仪器仪表学报,2012, 33(12):2790-2795.

Wan Peng, Wang Hongjun, Xu Xiaoli. Fault Diagnosis Model Based on Local Tangent Space Alignment and Support Vector Machine[J]. Chinese Journal of Scientific Instrument, 2012, 33(12): 2790-2795.

[8]李锋,汤宝平,董绍江,等. 基于正交邻域保持嵌入特征约简的故障诊断模型[J].仪器仪表学报, 2011, 32(3):622-627.

Li Feng, Tang Baoping, Dong Shaojiang, et al. Fault Diagnosis Model Based on Feature Compression with Orthogonal Neighborhood Preserving Embedding[J]. Chinese Journal of Scientific Instrument, 2011, 32(3): 622-627.

[9]陈法法,汤宝平,苏祖强,等. 基于等距映射与加权KNN的旋转机械故障诊断[J].仪器仪表学报, 2013, 34(1):216-220.

Chen Fafa, Tang Baoping, Su Zuqiang, et al. Rotating Machinery Fault Diagnosis Based on Isometric Mapping and Weighted KNN[J]. Chinese Journal of Scientific Instrument, 2013, 34(1): 216-220.

[10]李胜,张培林,吴定海,等. 基于渐近式权值小波降噪和算法的液压泵Adaboost故障诊断[J].中国机械工程, 2011, 22(9):1067-1071.

Li Sheng, Zhang Peilin, Wu Dinghai,et al. Fault Diagnosis for Hydranlic Pump Based on Gradual Asymptotic Weight Selection of Wavelet and Adaboost[J]. China Mechanical Engineering, 2011, 22(9): 1067-1071.

[11]于德介,陈淼峰,程军圣,等. 一种基于支持向量机预测器模型的转子系统故障诊断方法[J].中国机械工程,2006, 17(7):696-699.

Yu Dejie,Chen Miaofeng,Cheng Junsheng,et al. Fault Diagnosis Approach for Rotor Systems Based on Support Vector Machine Predictive Model[J]. China Mechanical Engineering, 2006, 17(7): 696-699.

[12]宋涛,汤宝平,李锋. 基于流形学习和K-最近邻分类器的旋转机械故障诊断方法[J].振动与冲击,2013,32(5):150-153.

Song Tao, Tang Baoping, Li Feng. Fault Diagnosis Method for Totating Machinery Based on Manifold Learning and K-nearest Neighbor Classifier[J] Journal of Vibration and Shock, 2013, 32(5): 150-153.

(编辑陈勇)

Rotor Fault Diagnosis Methods Based on Local Tangent Space Alignment and K-Nearest Neighbor

Sun Bin1Liu Liyuan1Niu Chong2

1.Northeast Dianli University,Jilin,132012 2.Datang Baoding Thermal Power Plant,Baoding,Hebei,071000

In order to solve the problem that the large mechanical equipment failure data is difficult to accurately extract, this paper put forward a kind of rotor fault diagnosis models based on LTSA and KNN. The vibration signals of rotor structure were used to construct dimensional matrix, then the low dimensional feature vector of high dimension matrix in the LTSA was extracted,and projected into the visual space.And the extracted low dimensional feature vectors were put into the KNN in order to do fault pattern recognition. Finally, experimental and data dimension reduction simulation process shows that the accuracy and rapidity of the method with LTSA and KNN are better than the fault diagnosis model by neural network and support vector machine.

local tangent space alignment(LTSA); K-nearest neighbor(KNN); pattern recognition; fault diagnosis

2013-08-09

TH165< class="emphasis_italic">DOI

:10.3969/j.issn.1004-132X.2015.01.013

孙斌,男,1972年生。东北电力大学能源与动力工程学院教授、博士。主要研究方向为设备状态监测与故障诊断。刘立远,男,1987年生。东北电力大学能源与动力工程学院硕士研究生。牛翀,男,1989年生。大唐保定热电厂助理工程师。

猜你喜欢
高维特征提取分类器
有向图上高维时间序列模型及其在交通网络中的应用
基于深度学习的高维稀疏数据组合推荐算法
基于特征选择的SVM选择性集成学习方法
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
基于深度优先随机森林分类器的目标检测
基于差异性测度的遥感自适应分类器选择
高维洲作品欣赏
Bagging RCSP脑电特征提取算法
基于矩阵模型的高维聚类边界模式发现