杨兴林, 周望存, 张 静, 任鹏举
(1. 江苏科技大学 能源与动力工程学院,江苏 镇江 212003)(2. 北奔重型汽车集团有限公司, 内蒙古 包头 014000)
基于粗糙集和SVM理论的柴油机故障分类预测诊断
杨兴林1, 周望存1, 张 静1, 任鹏举2
(1. 江苏科技大学 能源与动力工程学院,江苏 镇江 212003)(2. 北奔重型汽车集团有限公司, 内蒙古 包头 014000)
文中利用粗糙集和SVM理论相结合的方法对柴油机故障进行快速准确分类预测诊断.首先对收集的故障特征数据进行预处理,再运用粗糙集理论进行属性约简得到最优决策属性表,然后使用SVM理论中的分类预测规则对最优决策属性表进行诊断分类,得出诊断结果.通过实例分析验证了该诊断方法优于单一的粗糙集诊断和SVM诊断.
粗糙集; SVM理论; 柴油机; 属性约简; 分类预测; 诊断
粗糙集理论[1-2]在数据挖掘中广泛被应用,它是一种新型的数学工具,在处理含糊问题和不确定性信息中取得很好的效果,该理论自从被提出后,在人工智能领域上受到广泛研究和发展.它是20世纪80年代初由波兰数学家提出来的[3].它与传统处理不确定性的方法有很大的差别,传统方法对不确定性问题的描述和研究是通过概率论方法来解决的[4].
支持向量机算法(supportvectormachine,SVM)作为专门对有限样本进行预测的学习方法[5-6],它的研究基础并不是传统的经验风险最小化原则,而是构建了一种新的结构方法,其学习方法的运用能很好解决一些高维有限样本的模型构造问题,而且所构造的模型具有很好的泛化性能.该方法在故障诊断的应用上展现出了很强大的功能[7-8].
文中结合两种理论算法的特点,运用基于粗糙集和SVM理论相结合的故障分类预测诊断方法来实现对柴油机的故障诊断.
1.1 连续属性的离散化
离散化定义[9]:假设a是一个连续属性,它的域为[amin,amax],对属性值的域进行划分πa:πa={[d0,d1],[d2,d3],…,[dk-1,dk]},把这种划分的方法称之为离散化,其中:d0=amin,dk=amax,di-1 文中采用等频率间隔划分法算法的改进算法来对故障特征数据进行离散化处理.等频率间隔划分法算法的定义[10]:一个属性集为U,这个属性集中最大属性值为xmax,最小属性值为xmin,假设实际给定的参数为l,对这个属性集中的所有取值进行从小到大排列, 排列后在将其均分成l份,则得到断点集.可知每一小份中所包含属性的个数是相等的.假设所有属性上的实例从大到小排列为x1,x2,…,xl,xl+1,…,x2l,x2l+1,…,xn,其中,x1=xmin,xn=xmax,则得到的断点分别为(xl+xl+1)/2,(x2l+x2l+1)/2,… 改进的算法是在等频率间隔划分法算法的基础上将用平均数求断点变为用平均概率来求断点.求断点公式为: k=(ηlP(xl)+ηl+1P(xl+1))/(ηl+ηl+1) 式中:ηl和ηl+1分别为xl与xl+1出现的概率;xl与xl+1为相邻的两个属性. 1.2 属性重要度的约简 不同条件属性对决策属性而言有不同的重要度,相同的条件属性对不同的决策属性的重要度也是不同的.决策属性的重要性是从条件属性对其进行分类的能力上判断,分类能力高,则重要度越好,反之亦然;使用依赖度γR(D)来对分类能力进行判断, a对R的重要性定义为: sgf(a)=γR(D)-γR-{a}(D) 上式是从集合R中去掉属性a后进行分类时,分类后U/D的正域的变化情况.相比较没有去除a时的分类情况,如去掉属性a后分类能力改变很小,则a的重要性就高;反之,其重要性就很低. 基于属性重要度的约简算法: 1) 输入:一个系统决策表S. 2) 输出:属性最优决策表. 3) 步骤: ① 计算决策属性相对条件属性的相关性; ② 计算整个决策表中的核属性集; ③ 对每个非核属性进行属性重要度计算,选取重要度最高的非核属性集; ④ 将计算得到的最高非核属性集与核属性集相组合就是一个相对约简,也就是属性最优决策表. 假设已知一个系统的故障训练数据样本集为: T={(x1,y1),…,(xk,yk)}∈(X×Y)k,xk∈X=Rn,yk∈Y={1,2,…,m},i=1,…,k 式中:k为训练样本的容量;n为故障特征的个数;m为故障的类别标号. 基于支持向量机的故障诊断过程如图1. 图1 支持向量机的故障诊断流程 根据流程图可以看出这种诊断方法分6个小部分,为了方便,这里把它分为3部分来分析,但对于支持向量机理论而言,由于分类的不同,导致分类诊断方法也不同.分类诊断方法可分为:一对一分类和一对多分类.诊断方法也就有一对一分类诊断法和一对多分类诊断法. 2.1 一对一分类诊断分析法 1) 准备数据 准备数据包括对数据的整理以及对数据的初步处理,即对数据进行归一化处理.对数据归一化处理的好处是把有量纲的数据转换为无量纲的数据,消除量纲对后续诊断方法的影响. 对训练样本中的yk∈Y={1,-1}做出改变,如故障属于故障m中的第1种故障,那么第1种故障表示为y1=1,如果不是,则为-1;对故障诊断的l类多分类问题的研究中,每建立一个支持向量,对故障第m类表示为yi=1,对故障第n类表示为-1,这里m=1,2,…,l,n=m+1且≤l-1. 2) 建立分类模型 在使用支持向量机对训练样本进行训练时,对核函数和惩罚参数的选取非常重要,当选取到合适的值时,对训练样本进行二次优化求解得到(ω*,b*)和对应的支持向量α*,对2)进行[m(m-1)]/2次运算,一共能得到的支持向量机诊断模型个数是[m(m-1)]/2. 3) 进行故障诊断 输入测试样本到2)中计算得到的模型,进过分析就可以判断故障的类型.如输出的结果为1,则故障属于m类中的故障;如是-1,则不属于m类中的故障. 2.2 一对多分类诊断分析法 1)首先也是准备数据阶段,在这个阶段与一对一分类诊断不同的是对训练样本的调整上不一样,对不属于m的所有样本表示为yi=-1,每增加一个支持向量,故障s的类别都会改变.对故障诊断的l类多分类问题中,s=1,2,…,l,这些值一次取得. 2)在分类器的建立上与上述一对一分类诊断分析法是一致的,但这里只重复计算m次,得到m个分类模型. 3)每一个测试样本输入训练好的诊断分类器,应该只有一个结果为1,如出现多个1,则要重新训练. 在对数据进行处理时,非实时的诊断可以将数据集全部进行归一化处理,测试和训练数据一起处理.而实时诊断时,对训练数据的处理需要视情况而定. 文中采用的是粗糙集与SVM相结合的方法来进行柴油机故障的分类预测诊断分析.融合理论的故障诊断流程设计如图2.该方法克服了单一诊断方法的一些缺陷,提高了诊断的准确率. 该故障诊断方法的基本步骤: 1)首先确定研究对象,文中的研究对象为柴油机. 2)对特征参数进行选取,考虑需要收集什么样的特征数据对故障进行分析诊断,确定收集的参数后收集数据,对其进行适当的整理.文中对柴油机的活塞、活塞环、缸套在不同磨损程度情况下气缸盖上的振动信号进行数据采集,作为所需的诊断特征参数. 3)对特征数据进行归一化处理或离散化处理,数据的处理要遵守规定的原则,避免数据处理后遗失其数据本身所携带的特性. 4)使用粗糙集理论中的属性约简对经过离散化的数据进行约简处理,求得属性最优决策集. 5)对经过粗糙集理论处理后的数据进行有效分类,选取合适的故障数据作为训练样本,利用SVM理论建立以训练样本为基础的训练模型. 图2 融合理论的故障诊断流程 6)从故障数据中选取一定的样本作为测试样本,用来检验训练模型的训练能力,将测试样本放入训练模型中进行训练,由于训练模型是以支持向量机理论为基础建立的,测试样本经过训练后得出预测结果. 7)对6)中的训练结果进行分析总结,与实际情况进行对比,可以得出训练模型的训练精度,从而能够判断出该诊断方法对故障预测结果的准确率. 8)对诊断结果进行分类、总结. 4.1 实验与数据获取 在某型号柴油机上进行数据测试与收集.在柴油机外壳上用加速传感器测量振动信号,收集柴油机的活塞、活塞环、缸套处于3种异常情况和正常情况,共4种状态下的振动信号.该柴油机的额定功率为162 kW,额定转速为1 800 r/min.选取的柴油机故障对应的编号以及故障描述如表1. 柴油机的工作是由进气、压缩、燃烧膨胀和排气这4个过程来完成的,从而引起活塞反复运动,整个过程中活塞、活塞环、缸套都将处于振动状态中,每个部件的振动信号必然能很好反映其工作状态.由于测点位置与方向对信号的有效性及对故障的敏感性影响极大,为了获取准确的振动信息,选取在柴油机的气缸盖中心以及气缸盖边缘布置测点,缸盖中心布置一个测点,缸盖四周边缘的测点位置可以多选几个,由于缸盖的形状特征,在选取的每个测点位置只测量垂直方向的振动,在选取的测点位置用加速度传感器测量振动信号. 文中提取了缸盖振动信号频域功率谱中能够区分不同故障的最大振动加速度、振动加速度均方根、总功率、特征功率频谱、平均功率谱来作为特征参数.这些参数能够反映所需了解的故障特征,同时也可以作为粗糙集知识系统中的属性,对所选取的每一个特征进行编号(表2). 表1 故障描述 柴油机试验测取了8组正常状态的振动数据,5组磨合状态的振动数据,6组磨损状态的振动数据,6组损坏状态的振动数据.表3为所收集的试验样本数据,表中d为1代表正常,d为2代表磨合,d为3代表磨损,d为4代表损坏. 表2 故障属性 表3 不同特征的振动信号数据集 4.2 故障数据处理 1) 离散化处理 根据上文介绍的离散化数学方法对收集的特征数据集进行离散化处理,得到的决策表如表4. 表4 离散化后的决策表 2) 属性约简 利用粗糙集理论对经过离散化处理的决策表进行属性约简,删除决策表中重复的行,根据属性约简算法分析,得出属性A,B为整个决策表中的核属性,则{A,B,C},{A,B,D},{A,B,E}为整个决策表的最小属性约简集. 属性约简的目的是在保持信息系统能力不变的情况下,删除其中不相关或不重要的属性,使整个属性集变得简洁明了,能更直观反应出整个决策表的特性.对C,D,E属性进行属性重要度分析,得出属性C相对于和属性的重要度最高.综上所述,我们选取{A,B,C}作为整个决策表的最优属性约简集,最优决策系统如表5. 表5 属性最优决策表 4.3 SVM的分类预测与结果分析 选用支持向量机理论进行分类回归预测时,参数的选择非常重要,不同的参数对分类的结果和效率影响很大.在运用支持向量机理论时,核函数的参数以及函数形式决定了分类器的类型以及其繁琐程度. 选取表4中属性{A,B,C,D,E}中的13个数据作为训练样本,12个数据作为测试样本(4种故障类型的样本数量分别为4,2,3,3).在matlab7.0环境下采用LIBSVM进行分类预测诊断,取惩罚参数C=10,参数g=0.01.得出分类诊断结果如图3,诊断率为91.666 7%,分类预测时间为0.093 s,只有1个样本分类诊断错误. 图3 故障数据的实际与预测分类 选取属性最优决策表的属性{A,B,C}中的特征值,利用支持向量机来进行预测诊断时,由于约简后样本量很小,有些决策属性只剩下两个,不适合运用LIBSVM进行分类预测诊断,所以采用径向基核函数.同样在matlab7.0环境下进行诊断分析,取惩罚参数C=10,参数g=0.01,经过预测诊断,预测结果完全正确,预测诊断时间为0.082 s. 通过对比可知,约简后的故障数据通过支持向量机进行分类预测诊断的准确率要比没有经过约简处理进行诊断的准确率高,同时分类预测的速度也比较快.通过实例证明,基于粗糙集和SVM理论的故障分类预测诊断方法取得了很好的效果,通过属性约简剔除了数据中冗余的变量,保留了最主要的信息,得到了小样本的最优决策表,完全符合支持向量机对小样本的处理条件,更利于支持向量机理论对最优决策表进行分类预测诊断,提高了其诊断速率与准确度. 1)柴油机的振动特征能够很好反应其各部件的性能状态,通过对振动信号的收集能够获得很完善的故障数据,对振动信号的处理和分析能够有效找出各个部件的故障特征. 2)利用离散化的方法对收集的故障特征数据进行处理,再运用粗糙集理论中的属性约简算法对数据进行处理后,能够提高支持向量机分类预测诊断的速率. 3)通过实例验证故障诊断过程中,先对故障特征数据经过属性约简,再进行支持向量机分类预测,得到的结果要比没有经过粗糙集属性约简处理诊断的结果更准确. References) [ 1 ] Pawlak Z.Rough sets[J].InternationalJournalofComputerandInformationSciences,1982,11:341-356. [ 2 ] 刘启和,陈雷霆,闵帆,等.基于数据库系统的Rough集模型的扩展[J].控制与决策,2006,21(12):1374-1378. Liu Qihe,Chen Leiting,Min Fan,et al.Extension of rough set model based on database systems[J].ControlandDecision,2006,21(12):1374-1378.(in Chinese) [ 3 ] Chouchoulas A,Shen Q.A rough set-based approach to text classification[J].LectureNotesinComputerScience,1998,17(10):118-129. [ 4 ] 孙青青,李龙澍,李学俊,等. 基于粗糙集与证据理论的测试用例优化研究[J].计算机应用研究,2012,29(7):2534-2536. Sun Qingqing,Li Longshu,Li Xuejun,et al.Research on test case optimization based on rough set and D-S theory[J].ApplicationResearchofComputers,2012,29(7):2534-2536. (in Chinese) [ 5 ] 申秀敏,左曙光,李林,等. 车内噪声声品质的支持向量机预测[J]. 振动与冲击,2010,29(6):66-68. Shen Xiumin,Zuo Shuguang,Li Lin,et al.Interiror sound quality forecast for veheicles based on support vector machine[J].JournalofVibrationandShock,2010,29(6):66-68. (in Chinese) [ 6 ] 满瑞君,梁雪春. 基于多尺度小波支持向量机的交通流预测[J]. 计算机仿真,2013,30(11):156-159. Man Ruijun,Liang Xuechun.Traffic flow forecasting based on multiscale wavelet support vector machine[J].ComputerSimulation,2013,30(11):156-159. (in Chinese) [ 7 ] 易辉,宋晓峰,姜斌,等. 样本不均衡条件下基于自调整支持向量机的故障诊断[J].北京理工大学学报,2013,33(4):394-398. Yi Hui,Song Xiaofeng,Jiang Bin.Fault diagnosis based on self-tuning support vector machine in sample unbalance condition[J].TransactionsofBeijingInstituteofTechnology,2013,33(4):394-398. (in Chinese) [ 8 ] 赵海洋,徐敏强,王金东. 改进二叉树支持向量机及其故障诊断方法研究[J]. 振动工程学报.2013,26(5):764-770. Zhao Haiyang,Xu Minqiang,Wang Jindong.An improved binary tree SVM and application for fault diagnosis[J].JournalofVibrationEngineering,2013,26(5):764-770. (in Chinese) [ 9 ] Skoweon A,Rauszer C.The discrnibility matrices and functions in information systems[M]∥Slowinski R.Intelligent decision support:handbook of applications and advances of the rough sets theory.Dorrecht:Kluwer Axademic Publisher,1992:331-362. [10] 袁小宏,赵仲生,屈梁生.粗糙集理论在机械故障诊断中的应用研究[J].西安交通大学学报,2001,35(9):134-137. Yuan Xiaohong,Zhao Zhongsheng,Qu Liangsheng.On the application of rough set theory in mechanical fault diagnosis[J].JournalofXi′anJiaotongUniversity,2001,35(9):134-137. (in Chinese) (责任编辑: 童天添) Rough sets and SVM theory based on the fault of diesel diagnosis classification prediction Yang Xinglin1, Zhou Wangcun1, Zhang Jing1, Ren Pengju2 (1.School of Energy and Power Engineering,Jiangsu University of Science and Technology, Zhenjiang Jiangsu 212003, China)(2. Beiben Trucks Group Co.Ltd., Baotou Inner Mongolia 014000, China) In this paper, we combine rough set with the theory of SVM to achieve rapid accurate classification projections for diesel engine fault diagnosis. We first preprocesses the collected fault feature data, uses rough set theory to attribute reduction for getting the optimal decision attribute table and then uses the theory SVM classification prediction rules for diagnosis classification of optimal decision attribute table so as to conclude the diagnosis. The example shows that this diagnostic method is better than single diagnosis of rough set and SVM. rough set; SVM theory; diesel engine; attribute reduction; classification; diagnosis 10.3969/j.issn.1673-4807.2014.03.009 2014-02-24 杨兴林(1964—),男,教授,研究方向为船舶轮机系统与设备设计制造及性能优化、船舶空调系统及节能减排技术、船舶先进制造技术.E-mail:Hcyangxl2010@189.cn U661.44;O327 A 1673-4807(2014)03-0244-062 支持向量机理论的分类预测诊断思想
3 融合粗糙集和SVM理论的诊断系统设计
4 应用实例分析
5 结论