基于邻域属性重要度与主成分分析的齿轮箱故障特征约简

2016-07-26 01:42古莹奎潘高平朱繁泷承姿辛
中国机械工程 2016年13期
关键词:支持向量机齿轮箱主成分分析

古莹奎 潘高平 朱繁泷 承姿辛

江西理工大学,赣州,341000



基于邻域属性重要度与主成分分析的齿轮箱故障特征约简

古莹奎潘高平朱繁泷承姿辛

江西理工大学,赣州,341000

摘要:为有效降低齿轮箱故障特征的维数并提高诊断效率,提出了基于邻域属性重要度与主成分分析法相结合的齿轮箱故障特征约简方法,并利用支持向量机和BP神经网络对诊断的准确率进行对比分析。针对齿轮箱中具有不同程度裂纹的齿轮,选取其时域、频域和基于希尔伯特变换的36个特征;将邻域模型引入到特征属性的约简,构造前向贪心算法,以邻域属性重要度较大的9个特征作为特征集,提取累积贡献率达到95%以上的主成分,分别输入支持向量机和BP神经网络分类器中进行分类识别,并与不经过特征优选的主成分特征融合相对比。结果表明,采用基于邻域属性重要度与主成分分析法相结合的特征约简方法,既可以降低齿轮箱故障特征的维数,又不影响对其运行状态的表征,有助于识别不同裂纹水平的齿轮,与不经过特征优选直接进行融合的方法相比,所提出方法诊断准确率更高,训练时间更短。

关键词:齿轮箱;特征约简;邻域决策系统;主成分分析;支持向量机

0引言

由于齿轮箱中齿轮、轴承和轴系的结构较为复杂,工作状况各异,多种故障相互耦合,使得齿轮箱的故障模式与故障征兆之间通常呈现为非线性的映射关系,因而,对齿轮箱进行故障诊断和运行状态分析时,首先要合理提取可有效表征齿轮箱运行状态的特征,并对其进行优选和降维,删除冗余,在此基础上采用合适的方法对所选特征进行融合分析。特征的优选与融合方法在一定程度上可以提高状态识别与故障诊断的准确率。目前,对于齿轮箱的故障诊断,已有时间同步平均、包络解调、小波变换、希尔伯特变换和盲源分离等多种方法[1]。在故障特征的提取方面,林近山等[2]提出了一种基于多重分形去趋势波动分析的齿轮箱故障特征提取方法;王卫国等[3]提出了一种基于EEMD-CWD的齿轮箱振动信号故障特征提取方法;雷亚国等[4]将自适应总体平均经验模式分解方法用于行星齿轮箱的故障检测中。在故障特征的融合方面,学者们引入互信息[5-6]、粗糙集[7]、证据理论[8]、支持向量机(support vector machine, SVM)[9-11]及神经网络[12]等理论与方法,取得了较好的效果。以上单一融合方法尽管在故障特征的降维与压缩方面有着积极的作用,但随着信息量的增加,采用单一的方法仍然难以对信息进行有效的处理(尤其是当冗余信息较多时)。事实上,对于大多数的分类器方法,如SVM和贝叶斯等方法,若能获取一组简洁不冗余的信息作为输入变量,则分类器可能更为简单和有效。因而,在获取大量可以从不同角度表征设备运行状态的特征信息后,如何优选和高效利用信息成为特征融合时亟待解决的问题[1]。

针对齿轮箱的故障诊断,为去除冗余信息,降低特征的维数,进行特征的有效融合,笔者在前期的工作中分别提出了基于主成分分析(principal component analysis,PCA)的齿轮箱故障特征融合分析方法和基于邻域属性重要度的齿轮箱故障特征优选方法[13-14]。为验证特征优选对特征融合的影响,本文在以上工作的基础上,将基于邻域粗糙集属性重要度约简方法与主成分分析法相结合实施齿轮箱故障特征的优选与融合,在此基础上利用SVM和BP神经网络对融合前后故障诊断的准确率进行对比分析。

1齿轮箱特征定义及其分类

表征系统性能的特征并不是唯一的,为了对性能进行全面的评估,往往采用特征群的形式对系统性能加以表征。但是,不同特征量定义对系统的影响程度是不一样的,在进行故障的分类与诊断时,要选取合适的方法对特征进行分类、筛选和融合[15]。本文沿用前期工作中的齿轮箱特征定义、分类及编号方法[13-14]。共选用36个特征,其中齿轮箱时域故障特征16个,基于频域的故障特征13个,基于Hilbert变换自定义的故障特征7个,有关特征的描述见文献[13-14]。

2齿轮箱振动实验

沿用文献[13]中的实验方案,如图1所示。图中齿轮3是测试齿轮,其裂痕宽度为0.4 mm,深度为1/4齿宽。通过更换齿轮3可以测得不同裂纹的齿轮箱振动信号。文献[13]中对齿轮箱中各个齿轮的齿数、齿轮的数量、齿轮的故障状态以及实验参数进行了详细的描述。通过采集具有不同程度裂纹齿轮的振动信号,提取其有效状态特征。对特征进行优选,以此优选子集作为故障分类器的输入,实现对裂纹的识别。

图1 实验设备结构图

实验方案如下:①设置两种不同的电机转速,旋转频率分别为30 Hz和40 Hz;②设置两种不同的负载,即无负载和50%满负载,分别记为0和h;③设置三种不同的齿轮裂纹,即正常、25%裂纹和50%裂纹,分别记为L0、L1和L2。

实验中改变电机转速和齿轮箱负载以模拟齿轮箱的工作状况,采集齿轮箱不同运行工况下垂直方向的振动信号并记录。每种工况取10组数据,共计120组数据(表1)。每组信号都提取36种特征,获取120×36的特征全集矩阵。由此可以获取齿轮箱中齿轮3不同裂纹的36种特征参数变化趋势。

表1 120个样本的分组及实验工况描述

3基于邻近粗糙集属性重要度的属性约简

由于实验中实际获取的信息格式多样,故在进行融合之前需要对连续型的信息进行一定的预处理。不同的处理方法会对数据的隐含信息和数据的精确性产生影响。由于邻近粗糙集不需要对连续型的数据进行离散化预处理,可有效避免数据离散化对数据精确性的影响,因而采用基于邻近粗糙集属性重要度的属性约简方法能够有效处理数值型特征的属性。该方法的关键在于确定正域样本。由于邻域半径越大,所得邻域集合的样本数量就越多,因而邻域半径对正域的确定起着决定性的作用。在邻域半径的取值上,可以将邻域半径设为唯一值,也可以采用基于数据分布标准差的邻域计算方法。另外,重要度下限的设定对属性约简和约简子集的分类精度也有着重要的影响。在此采用邻近粗糙集前向贪心算法,优先保留重要度大的属性,从而可以排除计算中删除重要属性的可能性,以保证所得到的约简子集分类具有较高的准确率[14]。

3.1前向贪心数值属性约简

在不影响决策系统能力的前提下,将决策系统中不必要、冗余的属性删除的过程称为约简。

给定一个邻域决策系统NDS=〈U,A,D〉,B⊆A,∀a∈A-B,定义a相对于子集B的重要度[16]

SIG(a,B,D)=γB∪a(D)-γB(D)

(1)

式中,U为论域;A为属性集;D为决策属性;γB(D)为决策属性D对条件属性B的依赖度。

(2)

其中,PosB(D)表示邻域决策系统的正域。正域的数值可以反映分类问题在给定的属性空间里的可分离程度,正域越大,表明各类的重叠区域越少。

由式(1)可知,属性a对于决策属性D的重要度即为从条件属性集B中删除属性a后,决策属性D对条件属性B依赖度减小的程度。

前向贪心数值属性约简算法如下[14]:

(1)对决策表NDS=〈U,A,D〉,设置邻域半径集合,给出重要度的下限;

(2)∀a∈A,计算邻域关系Na;

(3)初始化约简集合,置Φ→red,其中red为属性约简子集;

(4)对任意ai∈A-red,计算SIG(ai,red,D)=γred∪a(D)-γred(D),定义γΦ(D)=0;

(6)按正域的大小,从大到小依次计算重要度,比较重要度大小。若 SIG(ak,red,D)>0,则red∪ak→red转步骤(4),否则, 返回red,结束,输出属性约简子集red。

3.2基于邻域属性重要度的齿轮箱特征优选

结合本实验数据的特点,应用以上特征约简算法进行优选,计算中重要度下限取0.05,结果见表2。最优特征子集由重要度大的前9个特征组成,信息压缩量达到75%。表2中,X(n)为离散信号序列,N为数据长度,f(n)为n时刻功率频对应的频率值,r(n)为残差信号。

表2 基于邻近粗糙集属性重要度选出的特征名称及其重要度

3.3优选特征的变化趋势分析

文献[15]中,对基于邻近粗糙集属性重要度的属性约简算法的准确性与泛化性进行了实验验证分析,结果证明了所提出的方法具有良好的推广性和泛化性。将最优特征子集输入到故障分类器中能够有效提高故障识别的准确率,各特征能很好地表征齿轮箱的运行状态。此处以重要度最高的特征10为例,分析优选特征随转速、负载和裂纹类型变化而变化的趋势,由此证明特征10作为优选特征的合理性。

图2 正常齿轮特征10随转速和负载变化趋势

图3 25%裂纹齿轮特征10随转速和负载变化趋势

图4 50%裂纹齿轮特征10随转速和负载变化趋势

分析转速和负载对正常、25%裂纹和50%裂纹齿轮特征10的影响,变化趋势如图2~图4所示。由图看出,各负载下不同裂纹齿轮的特征10的值都随转速的增大呈下降的趋势,其中尤以0负载下的变化最为明显;3种裂纹状态的齿轮在50%满负载下,特征10的值随转速变化最弱;4个转速变化区间中,特征10在转速45 Hz到50 Hz区间内的变化幅度最大;通过与其他转速区间的对比可知,各工况下特征10的值随转速的增大,其下降速率也增长。

分析裂纹和转速对正常、25%裂纹和50%裂纹齿轮特征10的影响,变化趋势如图5~图7所示。

图5 0负载下特征10随转速和裂纹增长变化趋势

图6 50%满负载下特征10随转速和裂纹增长变化趋势

图7 满负载下特征10随转速和裂纹增长变化趋势

从图5~图7可以发现,特征10随转速的增大呈现出递减的趋势,25%裂纹齿轮特征10的值最小,50%裂纹齿轮特征10的值最大,正常齿轮特征10的值始终介于两者之间;如图7所示,在满负载下特征10表现出较强的规律性,不同程度裂纹齿轮的变化趋势一致,说明高负载下更有利于通过特征10的变化判断齿轮箱运行状态。

通过额定转速下特征10随负载和裂纹增长的变化趋势分析可知,转速越高,负载对特征10的影响越大;在齿轮发生裂纹初期,特征10在各负载各转速下均呈现出下降趋势,在低转速下表现最为明显,这对齿轮裂纹早期监测具有一定意义。

4基于特征优选与PCA相结合的齿轮箱故障特征融合

4.1特征融合方案分析

为证明提出的特征优选方法在故障特征融合方面的优越性,以下按照两种方案进行故障特征融合分析。

4.1.1融合方案一

不经筛选将36种特征直接进行PCA融合,提取累积贡献率达到95%以上的7个主成分(累积贡献率达95.3148%),如图8所示。特征维数从36降到7,比例达到80%,在信息压缩方面成效显著[13]。

图8 方案一累积贡献率达95%的7个主成分

4.1.2融合方案二

先按基于邻域属性重要度的特征优选方法从36种特征中选出重要度大的9个特征组成最优特征子集,将9维特征子集进行PCA融合,累积贡献率达95%的主成分如图9所示。方案二前6个主成分累积贡献率达到96.9982%,而方案一前7个主成分累积贡献率为95.3148%,特征维数降低了,而累积贡献率反而上升了。与方案一中的主成分1贡献率相比,方案二主成分1所占贡献率相对减少,其值为33.9380%,与主成分2比较接近。主成分1的贡献率降低,使得各主成分间贡献率更为平均,虽然特征维数的压缩量降低,但从侧面也表明最优特征子集各特征均含有较多的故障信息。

图9 方案二累积贡献率达95%的6个主成分

图10 方案二中前6个主成分随样本变化趋势

图10为方案二中利用PCA方法融合后的前6个主成分特征波形图。图10中,主成分1很好地结合了各参数对状态表征的优点,其变化趋势较为明显地表征了不同状态下的齿轮箱,对不同的工况敏感程度也较高。

将36个特征、方案一和方案二融合的结果分别输入到支持向量机中进行分类。在分类过程中,SVM分类器核函数采用径向基(RBF)函数,函数参数g=1/4,σ=2,采用一对多算法计算。PCA融合前后的故障诊断准确率见表3。

表3 融合前后的故障诊断准确率(SVM)

为避免结果的偶然性,同时用BP神经网络分类器进行结果比较。在比较过程中,BP神经网络采用三层结构,输入层节点个数为3,对应3种不同的故障状态,网络传递函数采用log-sigmoid函数,训练次数设为200,网络性能目标设为0.001。PCA融合前后的故障诊断准确率见表4。

表4 融合前后的故障诊断准确率(BP)

对比表3和表4,将全部特征进行优选后进行PCA融合,之后输入SVM(BP)进行诊断,结果特征维数较没有进行优选之前有更大的降低,由7维降低到6维,但在诊断的准确率和分类器的运行时间方面更显优势,在准确率方面大幅度提高,达到98%(91%)以上,运行时间上显著缩短,充分证明了邻域属性对富含机械运行信息特征优秀的判断和选择能力。

4.2分析讨论

图11和图12分别为齿轮箱实验方案一和方案二基于融合后前3个主成分所绘制的样本分布图。

图11 方案一前3个主成分的样本分布[14]

图12 方案二前3个主成分的样本分布

3种不同状态的齿轮基本上可以通过前3个主成分特征来表征。文献[13]已经证明,不同状态的齿轮样本区分度较为明显且集中度高,只有正常齿轮在负载为0、转速为40 Hz工况下的样本和25%裂纹齿轮在负载为0、转速为40 Hz工况下的样本较难区分,如图11圆圈处所示。正常状态与25%状态的振动信号相似度较高,这也是早期故障检测的难点,且绘制参考仅为贡献率前3的主成分,其累计贡献率为81.1271%,含有原特征集合的故障信息量不高,也是导致图11中出现部分样本难以区分的原因。因而也提示在进行特征融合分析时,为保证诊断的精度,不宜对信息进行过度的压缩。而从图12来看,图中样本难以区分的情况明显较少,25%裂纹和50%裂纹齿轮在不同工况下分布非常集中,可区分度极高,由此可见,基于邻域属性重要度的故障特征选择能有效地克服不同转速和不同负载对故障识别的影响,有助于进行故障识别的推广和泛化。

5结束语

本文提出了基于邻域属性重要度的特征选择与主成分分析法和支持向量机相结合的齿轮箱运行状态分析和故障诊断方法,该方法不但利用了邻域属性对富含机械运行信息特征优秀的判断和选择能力,而且结合了主成分分析法出色的融合去除冗余信息的特点,同时又结合了支持向量机分类器良好的分类性能,从而使得该方法在实现特征降维的同时又能够有效地表征设备的运行状态。齿轮箱实验的结果显示,采用该方法,在故障特征信息降维的效果上更加明显,从原有的36维故障特征,通过选择和融合的方法降至6维,最大程度地压缩了信息量,同时又提高了故障诊断的准确率,能有效地识别不同裂纹齿轮,克服复杂工况对故障诊断工作带来的干扰。

参考文献:

[1]雷亚国, 何正嘉, 林京, 等. 行星齿轮箱故障诊断技术的研究进展[J]. 机械工程学报, 2011, 47(19): 59-67.

Lei Yaguo, He Zhengjia, Lin Jing,et al. Research Advances of Fault Diagnosis Technique for Planetary Gearboxes[J]. Journal of Mechanical Engineering, 2011, 47(19): 59-67.

[2]林近山, 陈前. 基于多重分形去趋势波动分析的齿轮箱故障特征提取方法[J]. 振动与冲击, 2013, 32(2): 97-101.

Lin Jinshan, Chen Qian.Fault Feature Extraction of Gearboxes Based on Multifractal Detrended Fluctuation Analysis[J]. Journal of Vibration and Shock, 2013, 32(2): 97-101.

[3]王卫国, 孙磊. 基于EEMD-CWD的齿轮箱振动信号故障特征提取[J]. 兵工学报, 2014, 35(8): 1288-1294.

Wang Weiguo, Sun Lei. Gearbox Vibration Signal Fault Feature Extraction Based on Ensemble Empirical Mode Decomposition and Choi-Williams Distribution[J]. Acta Armamentarii, 2014, 35(8): 1288-1294.

[4]雷亚国, 孔德同, 李乃鹏,等. 自适应总体平均经验模式分解及其在行星齿轮箱故障检测中的应用[J]. 机械工程学报, 2014, 50(3): 64-70.

Lei Yaguo, Kong Detong, Li Naipeng, et al. Adaptive Ensemble Empirical Mode Decomposition and Its Application to Fault Detection of Planetary Gearboxes[J]. Journal of Mechanical Engineering, 2014, 50(3): 64-70.

[5]曾令男, 丁建伟, 赵炯,等. 基于互信息的复杂装备高维状态监测数据相关性发现与建模[J]. 计算机集成制造系统, 2013, 19(12): 3017-3025.

Zeng Lingnan, Ding Jianwei, Zhao Jiong, et al. Detecting and Modeling for Associations Between High-dimension Condition Monitoring Data of Complex Equipment Based on Mutual Information[J]. Computer Integrated Manufacturing Systems, 2013, 19(12): 3017-3025.

[6]Peng H C, Long F H, Ding C. Feature Selection Based on Mutual Information: Criteria of Max-dependency, Max-relevance, and Min-redundancy[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(8): 1226-1238.

[7]Qu J.Support-vector-machine-based Diagnostics and Prognostics for Rotating Systems[D]. Edmonton: University of Alberta, 2011.

[8]Otman B, Yuan X H. Engine Fault Diagnosis Based on Multi-sensor Information Fusion Using Dempster-shafer Evidence Theory[J]. Information Fusion, 2007, 8(4): 379-386.

[9]聂磊, 黄圣国, 舒平, 等. 基于支持向量机(SVM)的民用飞机重着陆智能诊断研究[J]. 中国安全科学学报, 2009, 19(7): 149-154.

Nie Lei, Huang Shengguo, Shu Ping, et al. Intelligent Diagnosis for Hard Landing of Aircraft Based on SVM[J]. China Safety Science Journal, 2009, 19(7): 149-154.

[10]丁世飞, 齐丙娟, 谭红艳. 支持向量机理论与算法研究综述[J]. 电子科技大学学报, 2011, 40(1): 2-10.

Ding Shifei, Qi Bingjuan, Tan Hongyan. An Overview on Theory and Algorithm of Support Vector Machines[J]. Journal of University of Electronic Science and Technology of China, 2011, 40(1): 2-10.

[11]Lee M C. Using Support Vector Machine with a Hybrid Feature Selection Method to the Stock Trendprediction[J]. Expert and Systems with Application, 2009, 36(8): 10896-10904.

[12]Lei Y G, Zuo M J. Gear Crack Level Identification Based on Weighted K Nearest Neighbor Classification Algorithm[J]. Mechanical Systems and Signal Processing, 2009, 23(5): 1535-1547.

[13]古莹奎, 杨子茜, 朱繁泷. 基于主成分分析的齿轮箱故障特征融合分析[J]. 中国机械工程, 2015, 26(11): 1532-1537.

Gu Yingkui, Yang Zixi, Zhu Fanlong. Gearbox Fault Feature Fusion Based on Principal Component Analysis[J]. China Mechanical Engineering, 2015, 26(11): 1532-1537.

[14]古莹奎, 孔军廷, 朱繁泷. 基于邻域属性重要度的齿轮箱故障特征优选方法[J]. 煤炭学报, 2015, 40(增刊2): 560-567.

Gu Yingkui, Kong Junting, Zhu Fanlong. Gearbox Fault Feature Optimal Selection Based on Neighborhood Attribute Importance[J]. International Journal of Coal Science & Technology, 2015, 40(S2): 560-567.

[15]Abu-mahfouz I A. A Comparative Study of Three Artificial Neural Networks for the Detection and Classification of Gear Faults[J]. International Journal of General Systems, 2005, 34(3): 261-277.

[16]胡清华, 于达仁, 谢宗霞. 基于邻域粒化和粗糙逼近的数值属性约简[J]. 软件学报, 2008, 19(3): 640-649.

Hu Qinghua, Yu Daren, Xie Zongxia. Numerical Attribute Reduction Based on Neighborhood Granulation and Rough Approximation[J]. Journal of Software, 2008, 19(3): 640-649.

(编辑王旻玥)

收稿日期:2015-09-14

基金项目:国家自然科学基金资助项目(61164009, 61463021); 江西省自然科学基金资助项目(20132BAB206026); 江西省青年科学家培养对象计划资助项目(20144BCB23037); 江西省教育厅科学技术研究项目(GJJ14420)

中图分类号:TH132.41; TH165.3

DOI:10.3969/j.issn.1004-132X.2016.13.016

作者简介:古莹奎,男,1976年生。江西理工大学机电工程学院教授、博士。主要研究方向为机械装备可靠性与健康管理。发表论文40余篇。潘高平,男,1990年生。江西理工大学机电工程学院硕士研究生。朱繁泷,男,1989年生。江西理工大学机电工程学院硕士研究生。承姿辛,女,1991年生。江西理工大学机电工程学院硕士研究生。

Gearbox Fault Feature Reduction Based on Neighborhood Attribute Importance and PCA

Gu YingkuiPan GaopingZhu FanlongCheng Zixin

Jiangxi University of Science and Technology, Ganzhou, Jiangxi, 341000

Abstract:A gearbox fault feature reduction method was proposed to reduce the feature dimension and improve the accuracy of diagnosis based on neighborhood attribute importance and PCA. The SVM and BP neural network were used to analyze the diagnosis accuracy. The 36 features of different crack gears in gearbox were selected based on time-domain, frequency-domain and Hilbert transform. A forward-greedy numerical attribute reduction algorithm was established to select the optimal features based on neighborhood model. The 9 features with higher attribute importance were selected as the feature set. The principal components which had more than 95% cumulative contribution rate were extracted from the optimal feature set and input into the SVM and BP neural network classifier for identification. The results of the above method were compared with the PCA method without the optimal feature selections. Results show that the feature dimension may be reduced, the operating status of the gearbox may be indicated and the gear crack levels will be identified by using the proposed feature fusion method. Compared with the fusion method without the optimal feature selections, the diagnosis accuracy of the optimal feature selection is higher and the training time is shorter.

Key words:gearbox; feature reduction; neighborhood decision system; principal component analysis(PCA); support vector machine(SVM)

猜你喜欢
支持向量机齿轮箱主成分分析
风电齿轮箱轴承用钢100CrMnSi6-4的开发
提高齿轮箱式换档机构可靠性的改进设计
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
基于熵技术的公共事业费最优组合预测
SPSS在环境地球化学中的应用
基于支持向量机的金融数据分析研究
杭州前进齿轮箱集团股份有限公司