基于贝叶斯网络的轴裂纹故障诊断模型

2013-08-02 00:47李鸿光孙树栋司书宾司佳佳
机械制造 2013年1期
关键词:贝叶斯分类器裂纹

□ 李鸿光 □ 孙树栋 □ 司书宾 □ 司佳佳

西北工业大学 现代设计与集成制造技术教育部重点实验室 西安 710072

机械故障[1]指机械系统(零件、组件、部件或整台设备乃至一系列的设备组合)已偏离其设备状态而丧失部分或全部功能的现象。如果能够对机械的运行状态进行监测,并在故障发生前发现故障并采取相应措施,开展预先维护,对于保障设备正常运行、避免严重故障危害是非常有效的。对于旋转设备,一般可以通过采集实时振动信号,并通过对数据进行分析提取振动特征,从而建立振动幅度、频率与设备状态间的映射关系,达到预先维护的目的。

贝叶斯网络[2,3](Bayesian Networks,BN)是一种有向无圈图。它通过基于概率推理的图形化网络,表示变量的不确定状态及变量之间条件依赖关系。目前贝叶斯网络在统计决策、医疗诊断、专家系统以及处理不确定性信息的智能化系统等领域的应用已十分广泛,是进行数据分析和不确定性推理的重要工具。

本文基于故障模拟器采集到的轴裂纹故障数据集,分别用常用的贝叶斯网络分类器,如朴素贝叶斯(Naïve Bayes,NB)[3,4]、 增 强 朴 素 贝 叶 斯 (Augmented Naïve-Bayes,ANB)[5]、 树型朴素贝叶斯 (Tree Augmented Naïve-Bayes,TAN)[6]和无监督贝叶斯网络(General Beyasian Network,GBN)[7]进行诊断模型构建和性能分析,为轴裂纹故障诊断提供了方法依据。

1 轴裂纹故障数据收集

机械故障仿真器/模拟器(MFS)是一种用于机械健康检测的测试设备。此设备可模拟各种机械轴的常见故障,诸如:轴裂纹不平衡、轴不对中、弯曲轴、裂纹轴、滚珠和油膜轴承缺陷、带传动故障、齿轮箱障、电机故障、压缩机故障及泵故障等。本文涉及的有关故障模拟器的实验主要是:将以下故障件在故障模拟器上以不同状态运行,并收集它们的故障数据。

此故障件包括一根直径为 4.5 in(1in=25.4 mm)、通过带4个螺栓的转盘来模拟裂纹的轴、一根有裂缝及填充物的轴、一根有深度V型裂纹缺口的轴,如图1所示。

图1 轴裂纹研究套件

1.1 实验描述

分别取正常轴(T)、裂纹轴 1(L-1)、裂纹轴 2(L-2)、裂纹轴3(L-3)在故障模拟器上运行。其中用转盘上的4个螺栓紧固的轴裂纹套件模拟正常轴,用松动1个螺栓的套件模拟L-1,用松动2个相邻螺栓的套件模拟L-2,用松动3个螺栓的套件模拟L-3,分别收集它们在故障模拟器上转速处于60 Hz时的系统运行状态数据。

1.2 原始数据收集

本数据集取自故障模拟器实验中,此数据集记录了轴在正常状态和故障状态(裂纹)下传感器所收集的振动数据。目标变量为State(轴状态),属性变量包括:tach、Hz、L-V、L-H、R-V、R-H。 模型涉及的变量描述如表1所示。

表1 实例变量描述

从收集的数据中随机抽取出12 000条数据,建立数据集,其中取2/3为训练集,1/3为测试集,表2列出了数据集属性。

表2 数据集属性

2 轴裂纹故障诊断贝叶斯网络模型

2.1 贝叶斯网络诊断模型建立方法

确定已有数据集D的目标变量T和属性变量P;整理数据集D,按照变量分布概率随机生成原则补充缺失数据,遵照平均分布原则将连续变量离散化。

为了防止过度拟合,保证各分类器的精度,将数据集按照2∶1的比例随机抽样,2/3作为训练集Dtrain,1/3作为测试集Dtest;利用训练集数据Dtrain分别建立多种贝叶斯网络分类器模型;对于已建立好的贝叶斯网络模型,利用测试集Dtest验证分类器的分类精度和结构复杂度,并与用Dtest测试得到的精度进行比较。

2.2 常用贝叶斯网络分类器

NB分类器[4]是一种结构简单、实践有效的贝叶斯分类器,它包含一个根节点、多个叶节点,其假定给定目标变量C、各属性变量Xi相互条件独立。该分类器采用的局部独立假设简化了对训练数据的条件概率分类,尽管这个假设过于理想化,但这种分类器在实践中的分类精度较高,而且它的结构简单,易于理解,计算复杂度低,学习效率高,因此在实践中得到广泛应用。

ANB分类器在NB分类器基础上松弛了属性变量之间的条件独立假设,使属性之间存在一定的依赖关系,即在属性之间增添连接弧,这些弧称为扩展弧。从节点Xi到Xj的扩展弧表示属性Xj对分类的影响也取决于Xi的值。

TAN分类器[6,8,10]是NB分类器的扩展,它松弛了各属性变量的条件独立假设,允许属性变量所对应的节点之间由连接弧连接。TAN分类器松弛了属性变量之间的条件独立假设,这使它具有两方面的优势:一方面,继承了ANB结构中类节点作为分类节点特殊地位的优势,可以有效避免由于马尔可夫链的存在而导致分类精度的下降;另一方面,由于强制属性节点间只能形成树结构,因此可以充分利用图论中最大权重生成树算法实现对最优网络结构快速搜索,极大地提高了计算效率,保证在网络结构满足增强树结构的条件下,可以逼近真实的类条件概率分布,同时也更好地表达了属性间的相互关系,并在多数情况下获得了良好的分类精度,得到了广泛应用[9]。

GBN分类器[7,11]是一种无约束的贝叶斯网络分类器。前三种分类器均将目标节点作为一个特殊的节点处理,而GBN分类器则把目标节点当作普通的节点,通过贝叶斯网络学习算法构建基于所有节点的贝叶斯网络模型。然后,以目标节点为中心寻找最优贝叶斯网络结构的马尔可夫覆盖(Markov blanket,MB)节点。给定目标节点的MB,则目标变量条件独立于网络中所有其它变量,这样就大大降低了贝叶斯网络模型的复杂度。

2.3 建立诊断贝叶斯网络模型

利用训练集数据和Bayesialab仿真软件建立分类器模型,对于连续变量采用决策树分布离散化,按上述数据集所建立的NB、ANB、TAN、GBN分类器模型如图2所示。

图2 轴裂纹故障诊断贝叶斯网络模型

2.4 诊断贝叶斯网络模型推理

根据上述模型,用测试集对模型的分类效果进行测试,各贝叶斯分类器的测试集混淆矩阵见表3。表4列出了基于混淆矩阵计算的各分类器在训练集和测试集上的分类精度,其中分类精度较高的用字体加粗表示。从表3可以看出,每一种贝叶斯分类器的训练集和测试集的分类精度基本相等,说明该数据集的贝叶斯分类器模型具有良好的泛化能力。

表3 轴裂纹故障贝叶斯分类器混淆矩阵

表4 贝叶斯分类器分类精度

3 诊断贝叶斯网络模型验证

根据上述模型,用测试集对模型的分类效果进行测试,由上述实验及表3、表4可分析得知,目前为止分类精度最高为74.09%,表明直接建模精度不高,应该寻找其它的方法建模来提高诊断系统的精确度。表4列出了基于混淆矩阵计算的各分类器在训练集和测试集上的分类精度,其中分类精度较高的用字体加粗表示。从表3可以看出,每一种贝叶斯分类器的训练集和测试集的分类精度基本相等,说明该数据集的贝叶斯分类器模型具有良好的泛化能力。另外通过分析还可得出如下结论。

(1)由于NB分类器只考虑属性变量与目标变量之间的关系,忽略了其它属性变量之间的关系,所以其分类精度明显低于其它三种分类器,TAN分类器总是表现一般,ANB分类器和GBN分类器表现得比较好。

(2)由以上建模得知,目前为止分类精度最高为74.09%,接下来可以继续讨论其它建模方法。

4 总结

本文通过故障模拟器收集轴裂纹故障数据,以各实例集的训练集为基础,利用BayesiaLab仿真软件实现各贝叶斯网络分类器的建模;以测试数据集为基础,利用各贝叶斯网络分类器模型对测试数据进行分类;通过对各模型精度的比较,从众多数据中和NB、ANB、TAN和GBN网络模型中找出了最佳诊断模型。

[1] 李海军,马登武,刘宵.贝叶斯网络理论在装备故障诊断中的应用[M].北京:国防工业出版社,2009.

[2] 张连文,郭海鹏.贝叶斯网引论[M].北京:科学出版社,2006.

[3] 王建林,王学玲.数据挖掘中的贝叶斯分类器[J].长春理工大学学报,2006,29(3):51-53.

[4] 谢斌.朴素贝叶斯分类在数据挖掘中的应用[J].甘肃联合大学学报(自然科学版),2007, 21(4):79-82.

[5] Cheng Jie,GreinerR.Comparing Bayesian Network Classifiers [C].Proceedings of the 15th Annual Conference on Uncertainty in Artificial Intelligence,San Francisco:Morgan Kaufmann,1999.

[6] FR Iedman N,Geiger D,Goldszm IDT M.Bayesian Network Classifiers[J].Machine Learning,1997,29:131-163.

[7] Munteanu P,Bendou M.The EQ Famework for Learning Equivalence Classes of Bayesian Networks [C].Proceedings of IEEE International Conference on Data Mining,Washington DC:IEEE Computer Society,2001.

[8] Bart Baesens,Geert Verstraeten,Dirk Van den Poel,et al.Bayesian Network Classifiers for Identifying the Slope of the Customer Lifecycle of Long-life Customers [J].European Journal of Operational Research,2004,156(2):508-523.

[9] 李旭升,郭耀煌.灵活的增强朴素贝叶斯分类器[J].信息与控制,2007,36(6):690-695.

[10] 孙笑微,赵大宇,李晓毅,等.基于数据挖掘的TAN分类器的研究与应用 [J]. 计算机技术与发展,2006,11(16):140-142.

[11] 蔡志强,孙树栋,Yannou Bernard,等.基于贝叶斯网络分类器的产品故障率分类研究[J].计算机应用研究,2009,26(9):3307-3309.

猜你喜欢
贝叶斯分类器裂纹
基于扩展有限元的疲劳裂纹扩展分析
Epidermal growth factor receptor rs17337023 polymorphism in hypertensive gestational diabetic women: A pilot study
BP-GA光照分类器在车道线识别中的应用
微裂纹区对主裂纹扩展的影响
贝叶斯公式及其应用
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于贝叶斯估计的轨道占用识别方法
一种基于贝叶斯压缩感知的说话人识别方法
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别