基于决策树与多元支持向量机的齿轮箱早期故障诊断方法

2016-09-07 05:50陈志刚杨建伟汪耀林
计算机测量与控制 2016年1期
关键词:齿轮箱决策树分类器

张 亮,陈志刚,杨建伟,汪耀林

(1.北京建筑大学 北京市建筑安全监测工程技术研究中心,北京 100044;2.中原输油气分公司,山东 德州 253052)



基于决策树与多元支持向量机的齿轮箱早期故障诊断方法

张亮1,陈志刚1,杨建伟1,汪耀林2

(1.北京建筑大学 北京市建筑安全监测工程技术研究中心,北京100044;2.中原输油气分公司,山东 德州253052)

齿轮箱部件的故障形式多样,典型故障训练样本数量有限;为了提高齿轮箱故障诊断的精度和效率,提出了基于决策树与多元支持向量机的齿轮箱早期故障诊断方法;利用决策树分类速度快、效率高的优点和支持向量机在小样本二元分类方面突出的特点构建多元分类识别模型,在不同故障情形下提取齿轮箱振动信号典型特征参数作为故障特征向量训练模型,并对样本进行测试;实验结果表明,该方法在小样本情况下识别效果明显优于神经网络方法,同时在识别效率方面比常规多元支持向量机方法有了较大的提高。

齿轮箱; 决策树; 支持向量机; 故障识别; 神经网络

0 引言

齿轮箱作为传递动力的常用装置广泛地应用于各种工程机械上。在绝大多数工程施工场合下,由于设备工作强度大、环境恶劣,齿轮箱容易受到损伤,发生故障的概率较大[1]。齿轮、轴、轴承都是齿轮箱中的易损零件,据统计约有80%的机械故障是由它们的损坏而引起[2]。其中,齿轮是较早容易出现损坏的零件。由于早期故障的特征信号能量变化微弱,特征参数的提取困难和表征不明显对诊断模型的要求更严格。

目前,齿轮箱故障诊断的传统方法并不适用于支持向量机数量大、故障样本数目有限,甚至缺少的情况[3]。在非线性、小样本问题中,支持向量机(Support Vector Machine,SVM)理论因为在样本训练以及泛化能力方面表现出色而被广泛地运用到医学、诊断等诸多领域[4]。决策树(Decision Tree)方法的基础是对数据进行科学的归纳、学习,并从无规则的数据中得出能对数据进行分类的规则。形成的分类模型不仅可以减少支持向量机的训练数量,而且还可以提高向量机的分类效率和准确率[5]。采用决策树和支持向量机相结合的方法来构建多元分类器,在识别效果和效率方面比传统神经网络方法和常规多元支持向量机更具优势。

1 基于决策树的支持向量机

1.1决策树基本思想

决策树是一个代表对象属性与对象值之间映射关系的预测模型[6]。如图1所示决策树包含三部分,根节点、分支节点和叶节点分别表示不同属性的对象,分叉路径代表某个可能的属性值。决策树分类过程包含两个步骤:首先是建立合理的决策树模型。第二步是利用上一步中的决策树模型对新的数据进行逐级分类[7]。

图1 决策树结构

在分类阶段,决策树结构中每个节点都可以完成一个分类子任务。决策树的逻辑结构有两种,一是自下而上的凝聚结构,二是自上而下的划分结构[8]。因为只需遍历部分分类器,所以分类效率和精度比较高。

1.2支持向量机基本理论

支持向量机的基本思想:通过定义适当的内积核函数,将输入空间的数据通过非线性变换,首先转换到一个高维空间,然后在这个新空间中就可以对数据进行最优线性分类面的求取。

支持向量机方法的最优分类面是在线性可分的情况下提出的。图2为最优分类面,图中的五角星和圆圈图案分别表示两种数据样本,H为两种样本的分类线,H1、H2分别为各类中离分类线H最近且平行的直线,H1、H2之间的距离称为分类间隔(margin)[9]。最优分类线即为分类间隔最大的分类线,而且能使两类样本正确分开。

图2 最优分类面示意图

在线性不可分的情况下,图2所示的最优分类面在实际应用中可能存在某些样本不能被超平面正确分类,超平面约束条件为:

式中, b为阈值;ω为分类面的法向量。对于非线性最优分类面的求解需要引入拉格朗日乘子

其中:ai≥0,i=1,2,…,l;L的极值点为鞍点,可取L对ω和b的最小值ω=ω*,b=b*,以及对a的最大值a=a*。

在线性可分条件下,原问题经过变换成为对偶问题,即求解如下对偶式的极大值

(2)

针对线性不可分问题,首先把测试样本x映射到某个高维的特征空间H,并且在H中使用线性分类器。因此,选取适当的内积函数K(xi,xj),就可以在最优分类面中把非线性分类变换为线性分类,这时目标函数转变为:

其中:常量C是对越界样本的惩罚系数,控制对错分样本的惩罚程度。

若ai*为最优解,则决策函数可表达为

(4)

其中:

详细推导过程参见文献[10]。

选择核函数的形式与得到的支持向量存在因果关系。常用的核函数有4种,其中最为常用的Gauss径向基核函数[11]。

1.3多元分类支持向量机

1.3.1一对多支持向量机

支持向量机“一对多”算法是多值分类最早使用的方法[12]。该方法用二分类支持向量机依次将每一类从其他所有的类别中区分开。一对多方法在对n类问题进行分类时,需要训练n个支持向量机。

一对多方法的分类过程思路清晰,但存在着如下不足:①采用一对多方法,每个分类器的正样本的数量一般远远小于负样本的数量,这会大大的降低分类的准确率;②每个支持向量机的训练都要用到所有的训练样本,计算效率较低。

1.3.2一对一支持向量机

对于一个n类问题,一对一方法对样本中的每一个类别对都需构造一个支持向量机,所以共需训练n(n-1)/2个支持向量机。虽然一对一方法需要训练的支持向量机的个数多于一对多方法,然而,训练每一个支持向量机仅需所有样本中的两类样本。这种方法的训练速度较“一对多”方法更快。

文献[13]对上面所提到的几种多值支持向量机分类算法进行了比较,认为一对一的方法分类效果较好,但是其计算代价大,一对多的方法计算代价较小,但是其分类效果一般。

1.4基于决策树的支持向量机

支持向量机在小训练样本情况下具有很好的泛化性能,但对于多分类问题往往需要构造多个分类器,而且诊断时间长。本文采用决策树和支持向量机相结合的方法建立齿轮箱多类故障识别模型。

基于决策树的支持向量机将多分类问题分解为一序列的二值分类问题,这些二值分类分布于决策树的各个节点上。分类时,决策树根节点和分支节点按不同属性逐级划分为若干个子集合,直到得到所有的叶节点,在按属性划分子集合的时候根据实际情况选用一对多或一对一支持向量机分类模型。以划分6类为例,图3即为其中一种决策树分类示意图,逐级地把6类输入样本划分到所属类别。

从图3可以看出,基于决策树的支持向量机综合考虑了一对多分类模型向量机数目少,一对一多分类识别准确率较高和决策树分类效率高的优点。

本文实验对象主要是齿轮箱齿轮故障,在上述原理基础上构建基于决策树的多分类支持向量机故障诊断模型。以正常齿轮、齿面磨损、齿面胶合和齿根裂纹四类故障识别为例,其分类模型如图4所示,由于设备多数情况下处于正常运行状态,

图3多分类支持向量机决策树结构示意图

实际测试中较易获取齿轮箱正常运行状态样本,同时,判别齿轮箱正常运行与发生其他故障相对容易,因此,第一层决策以排除非故障样本为主要目的,所以采用一对多分类器,可快速判别非故障样本;第二层决策中再采用一对一算法对3类故障进行识别,此时仅需构造3个一对一分类器。该模型仅需构造4个支持向量机,比2.3.2中一对一方法4*(4-1)/2=6减少了2个支持向量机,理论上训练和测试用时会减少,从而提高诊断效率。

图4多分类支持向量机的决策树分类效果示意图

齿轮箱发生故障的位置可能涉及齿轮、轴、轴承等关键部件。由于各部件又都有其不同的故障类型,因此在对齿轮箱进行诊断时,为提高诊断效率,应先判断其故障所在部件,而后再针对该部件判断具体的故障类型。因此,对于齿轮箱故障未知情况下,第一层决策可设计为判别故障发生部件 ,第二层决策再对具体部件故障形式进行再判别。

2 实验结果与分析

2.1实验平台

实验采用DDS动力传动故障诊断综合实验平台。该齿轮箱由滚动轴承支撑的2级平行轴齿轮箱和一个励磁制动器组成。可用于齿轮箱动力学和声学行为、健康维护、基于振动的诊断技术、润滑调节或磨损颗粒分析等方面的研究工作。

图5中根据实际使用情况,将加速度传感器安装在输入轴与输出轴的轴承端盖处,径向、轴向方向共4个测点同时采集振动数据。

图5 齿轮箱故障信号采集系统示意图

在该实验台齿轮箱上分别模拟1正常齿轮、2齿轮齿面磨损故障、3齿轮齿面胶合故障和4齿轮齿根裂纹故障。每种齿轮的典型故障进行多次实验,把能反映故障规律的多组特征向量作为该种故障训练的样本。

先测得在正常工况下振动信号,然后对故障齿轮进行测试。实验中,采用压电式IEPE加速度传感器采集振动数据,设置采样频率为10 kHz。提取每种状态下原始样本各20组,每组样本连续采样。

2.2齿轮箱特征的提取

振动信号的各种特征参量对故障信息的表达能力各有侧重,本文参考文献[14]选取了峰值系数、峭度指标、偏度指标、有效值、标准差来描述信号的波形特征。由于这些时频域参量存在着量纲差别,因此,在建模之前先进行归一化处理,使之转化为[0, 1]的数据。故障特征向量如表1所示。

表1 信号样本特征向量表

2.3学习训练

选取齿轮箱4类样本每类5组,共20组信号样本对图4中的模型进行学习训练并构造对应的支持向量机决策函数。

结合所构建的多分类支持向量机的齿轮箱故障诊断模型,经过分析本文选用径向基核函数,训练步骤如下:

(1)将信号数据转化为Libsvm软件包要求的可识别格式[11];

(2)将训练样本进行尺度变换,将样本集映射至[-1,1]上 ;

(3)模型参数训练(惩罚因子C与核函数参数);

(4)利用步骤(3)中得出的C与为模型参数,将步骤(2)中缩放后的训练样本用此模型进行训练;

(5)向训练好的模型中输入测试样本,检测分类结果;

依次利用上述样本数据对支持向量机分类器进行训练获得最优分类函数,最终获得分类器参数优化得惩罚因子C=2,核函数的径向基参数。

2.4测试

为了测试上述分类器识别效果,用8组已知待测试样本对分类器进行验证测试,以验证该分类器的泛化能力及准确率。表2给出了不同的支持向量机决策函数对待诊断样本的输出结果。第一列数据中,把正常齿轮①从故障齿轮②③④快速判别出来,其结果为正值则判断为正样本,即正常齿轮,识别结束;为负则归为另外三组类型中,属故障齿轮,则需要进行一对一分类识别,如表中第二、三、四列。

表2 待测样本的输出结果

根据决策结构中各独立支持向量机的输出结果隶属度,判断待诊断样本的归属,当其中某一个SVMi,j对故障样本x判断为第i类故障时,第i类的票数加1,反之,第j类的票数加1。依据样本在各类故障模式的综合得分来判断其故障类型,各测试样本的最终得票情况如表3所示。

表3 基于决策树支持向量机的分类结果

由表3可得,根据本文所提的诊断决策规则得出的诊断结果与设置的样本故障类型完全吻合。

2.5与常规方法比较

为了进一步比较基于决策树支持向量机与传统神经网络和常规多元支持向量机的分类效果,采用20组样本对不同模型进行实验,分类效果如下表4所示。

表4 支持向量机与BP神经网络的识别结果比较

由表4可以看出,根据实际故障构建相应的决策树支持向量机识别效果与常规多元支持向量机方法相同,都明显由于传统神经网络方法,但是使用决策树支持向量机的分类识别时间比常规支持向量机方法缩短了约35%。

3 结论

(1)本文结合决策树决策效率高和SVM中“一对一”以及“一对多”多值分类方法的优点设计出了基于决策树和支持向量机的齿轮箱故障识别模型。将该模型应用于小样本数目的齿轮箱的故障识别,从测试结果和训练分类结果可以看出采用决策树支持向量机诊断方法在小样本情况下和齿轮箱早期故障方面具有较强的识别能力和分类效果,明显优于传统神经网络方法。

(2)采用决策树和支持向量机相结合的方法构建决策树形式的支持向量机模型,其识别效果与一对一多元支持向量机相当,但在学习训练和测试用时方面比常规支持向量机更短,随着分类数量的增加,效果更为明显,因而比常规支持向量机更有效率。

[1] 艾延廷,费成巍.基于支持向量机的转子振动故障融合诊断技术[J].沈阳工业大学学报,2010,32(5):527-531.

[2] 吴德会. 一种基于支持向量机的齿轮箱故障诊断方法[J]. 振动、测试与诊断,2008,04:338-342.

[3] Schlkopf B, Smola A J. Learning with Kernels, Support Vector Machines,Regularization, Optimization and Beyond[J].The MIT Press,2001.

[4] 何学文,赵海鸣.支持向量机及其在机械故障诊断中的应用[J].中南大学学报,2005,36(1):98-101.

[5] Matthias Rychetsky, Stefan Ortmann, Manfred Glesner. Support vector approaches for engine knock detection [C]. International Joint Conference on Neural Networks, Washington DC, 1999:969-974.

[6] 冯少荣.决策树算法的研究与改进[J].厦门大学学报(自然科学版),2007(4):496-500.

[7] 程珩,黄超勇,张永刚.基于粒子群优化决策树的齿轮箱故障诊断[J].振动.测试与诊断,2013(1):153-156.

[8] 孙昌儿,刘秉瀚. 一种新的SVM决策树[J]. 福州大学学报(自然科学版),2007(3):361-364.

[9] Vapnik V N. The nature of statistical learning theory[M].New York: Spring-Verlag,1999.

[10] 王宏漫,欧宗瑛.采用PCA/ICA特征和SVM分类的人脸识别[J].计算机辅助设计与图形学学,2003,15(4):417-420.

[11] 郑勇涛,刘玉树.支持向量机解决多分类问题研究[J].计算机工程与应用,2005,41 (23): 190-192.

[12] 王国鹏,翟永杰,王东风,等.模糊支持向量机在汽轮机故障诊断中的应用[J].华北电力大学学报,2003,30(4): 47-50.

[13] 王华忠,张雪申,俞金寿.基于支持向量机的故障诊断方法[J].华东理工大学学报,2004,30(2):179-182.

[14] Saravanan N, Kumar Siddabattuni V N S, Ramachandran K I. Fault diagnosis of spur bevel gear box using artificial neural network (ANN), and proximal support vector machine (PSVM) [J]. Applied Soft Computing, 2010, 10(1):344-360.

Early Fault Diagnosis of Gearbox Based on Multiclass Support Vector Machine and Decision Tree

Zhang Liang1,Chen Zhigang1,Yang Jianwei1,Wang Yaolin2

(1.Beijing Engineering Research Center of Monitoring for Construction Safety, Beijing University of Civil Engineering Architecture, Beijing100044,China; 2.Zhongyuan Oil & Gas Transportation Sub-Company, Dezhou253052, China)

Failure form of gear box parts is varied, and typical faults have limited training samples. In order to improve the accuracy and efficiency of gearbox fault diagnosis, decision tree with multiple support vector machine (SVM) was proposed based on the early gearbox fault diagnosis methods. Classification based on decision tree on the advantage of fast speed, high efficiency and support vector machine (SVM) in binary classification has outstanding characteristics of small sample build multivariate classification model, in different typical fault case to extract the gearbox vibration signal characteristic parameters as the fault feature vector training model, and testing samples. The results show that this method not only can complete the model learning training in the case of small samples ,but also has been greatly improved over the neural network method in terms of the recognition performance,and can be effectively applied to gearbox fault diagnoisis. The results show that this method not only can complete the model learning training in the case of small samples,but also ha.

automatic transmission;decision tree;support vector machine;fault identification;neural network

2015-09-22;

2015-11-09。

国家自然科学基金项目(51004005);北京市优秀人才培养资助项目(2013D005017000013);北京市属高等学校高层次人才引进与培养计划项目。

张亮,男(1990-),北京人,研究生,主要从事物流自动化技术与装备方向的研究。

陈志刚,男,博士,副教授,硕士生导师,主要从事机电设备状态监测与故障诊断、城市地下管道安全检测方向的研究。

1671-4598(2016)01-0012-04

10.16526/j.cnki.11-4762/tp.2016.01.004

TP274.2

A

猜你喜欢
齿轮箱决策树分类器
风电齿轮箱轴承用钢100CrMnSi6-4的开发
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
基于实例的强分类器快速集成方法
提高齿轮箱式换档机构可靠性的改进设计
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于决策树的出租车乘客出行目的识别
杭州前进齿轮箱集团股份有限公司
基于肺癌CT的决策树模型在肺癌诊断中的应用