基于数据挖掘技术的炮兵雷达故障诊断

2011-06-22 12:46单显明
火控雷达技术 2011年3期
关键词:数据挖掘关联故障诊断

单显明

(沈阳炮兵学院 沈阳 110161)

1 引言

数据挖掘是从大量的、不完全的、有噪声的、模糊的数据中,提取隐含在其中的有价值的知识。数据挖掘技术是基于大型数据库或数据仓库的新型信息分析技术,目前已在很多领域已得到成功应用。某型炮兵雷达自装备部队以来,在使用过程中的故障明显增多,往往是一个很小的故障就可能导致整个雷达无法正常工作,已影响到了该雷达的日常训练和战斗力的形成。针对这一问题研制了基于数据挖掘技术的炮兵雷达故障诊断系统,实现了雷达故障的快速检测及定位,提高了该雷达的综合保障能力。

2 数据挖掘的概念及过程

2.1 数据挖掘的概念

炮兵雷达故障诊断技术的发展经历了三个阶段。由于以前机器设备比较简单,第一阶段故障诊断主要依靠领域专家或维修人员的感觉器官、个人经验及简单仪表,对诊断信息只作简单的数据处理。第二阶段以传感器技术和动态测试技术为手段,以信号处理和建模处理为基础的现代诊断技术,在维修工程和可靠性工程中得到了广泛的应用。第三阶段随着计算机技术、数据挖掘、机器学习和人工智能技术特别是专家系统的发展,故障诊断技术进入以知识处理为核心的智能诊断技术阶段。

数据挖掘(Data Mining),又称为数据库中的知识发现,就是从大量数据中获取有效的、新颖的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识[1]。数据仓库(Data Warehouse)就是一个用以更好地支持企业或组织决策分析处理的、面向主题的、集成的、不断更新的数据集合[2]。数据挖掘是面向数据库的,数据挖掘算法的大部分时间都花费在对数据库的访问上。数据仓库技术可以大大减轻数据挖掘中对数据管理的压力,并能提供超大规模长时间的历史数据,基于数据仓库的数据挖掘技术更有利于有价值模式的挖掘,是数据挖掘的重要发展方向。

2.2 数据挖掘的过程

数据挖掘的工作过程如图1所示,数据挖掘的过程主要包括数据的清理与集成、数据的选择与变换、数据挖掘及模式的评估与表示等四个步骤[3]。

图1 数据挖掘的过程

a.清理与集成

首先对炮兵雷达分系统的状态数据进行采集,由数据输入端送到数据挖掘系统,根据用户的数据挖掘请求,消除噪声或不一致数据,组合多种数据源数据,提取相关数据,形成数据仓库或数据库。

b.选择与变换

对数据仓库中的状态数据进行相应的选择与变换,如消除噪音、数据标准化、数据变换(平滑、聚集、概化)、数据归约(离散化),通过汇总或聚集等操作将数据变换或统一成适合挖掘的形式。

c.数据挖掘

根据炮兵雷达系统的特点,使用相应的数据挖掘算法提取数据模式。

d.模式的评估与表示

使用可视化和知识表示技术,识别表示知识的真正有趣的模式,向用户提供挖掘的知识。

3 数据挖掘的算法

数据挖掘主要包括关联分析、序列模式分析、聚类分析、分类分析等算法[4,5]。

a.关联分析

关联分析利用关联规则进行数据挖掘,其目的是挖掘隐藏在数据间的相互关系,生成所有具有用户指定的最小置信度和最小支持度的关联规则。在数据挖掘研究领域,对于关联分析的研究开展得比较深入,人们提出了多种关联规则的挖掘算法,如Apriori、Stem 等算法。

b.序列模式分析

序列模式分析目的是为了采掘出数据之间的联系,但序列模式分析的侧重点在于分析数据间的前后关系。如运用序列模式分析销售记录,可以发现客户潜在的购物模式,例如客户在购买微波炉前常购买何种商品。

c.聚类分析

聚类分析法的输入集是一组未标定的记录,输入的记录没有进行任何分类,其目的是根据一定的规则,合理地划分记录集合,并用显式或隐式的方法描述不同的类别。主要的聚类技术包括基于划分的聚类、层次聚类和基于模型的聚类。另外还有预测模型、偏差检测、数据库分段、联系分析、可视化等相关算法。

d.分类分析

分类分析就是通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其它数据库中的记录进行分类。目前主要的分类方法有判定树归纳、贝叶斯分类、后向传播的神经网络技术、k-最邻近分类法、基于案例的推理、遗传算法、粗糙集理论和模糊集方法等。

4 故障诊断系统架构

基于数据挖掘技术的某型雷达故障诊断系统架构如图2所示。用户通过软件接口输入雷达诊断信息至智能诊断子系统,信息处理与诊断推理模块利用知识库中的知识,根据故障信息诊断故障设备,最后利用知识库对所有诊断方法得到的结果综合决策,判断具体的故障类型,并将诊断结果在用户界面显示。其中知识库是基于征兆库、传统专家经验诊断规则和数据挖掘诊断规则的混合系统,各诊断机制充分发挥各自的优点。征兆库存放经过数据库处理并提取的系统推理所需要的征兆事实,知识库的维护包括扩展、修改和删除操作。知识库采用传统经验、专家经验、粗糙集知识及关联规则等数据挖掘方法来获取诊断知识。关联规则挖掘从特征数据中挖掘出特征变量间隐含的因果或关联关系,可用于故障趋势预测的挖掘。

图2 故障诊断系统架构

5 故障诊断模型

故障诊断的目的是从大量的炮兵雷达监测信息中发现潜在的规律,提取有用的知识,智能地判断雷达当前运行状态,发现隐含的或已经存在的故障。故障诊断模型如图3所示。

图3 故障诊断模型

数据挖掘是一个需要经过反复多次处理的过程,它可利用不断充实的诊断知识库和恰当的算法,逐步挖掘真实的故障机理及诊断规则。首先将原始数据整理为与挖掘主题相关的信息,然后根据关联规则算法对指定数据集进行知识的提取。通过对挖掘结果进行一致性、合理性检查,与预期目标进行对比。如果结果与预期目标偏差较大,返回算法设计阶段,调整或重新设计挖掘算法。如果偏差较小,返回算法设计阶段,对挖掘算法进行调整。如果结果理想,返回数据阶段,扩大数据集,重新开始一次挖掘过程。重复上述步骤,直至达到最优结果。

6 故障诊断仿真

关联规则挖掘能发现隐藏在海量数据中的有关联关系对故障诊断有价值的数据,对决策的生成具有重要的实用价值。由于炮兵雷达各单元间存在着紧密的联系,某一单元设备故障会导致与之联系的其它设备工作于非正常状态之下,因此在异常数据中采用关联规则进行挖掘是非常合适的,首先发现异常数据,按置信度从高到低的规则排序,从数据中发现那些置信度和支持度都大于给定值的强壮规则,即可能为引起故障的原因。数据挖掘关联规则采用Apriori算法实现,首先根据某型雷达接收系统电路图及故障现象进行信号检索建立检测属性表,然后对检测属性表进行处理得到故障统计表,如表1所示。其中编号1-9分别为-15V电压、调幅1电压、中频信号、调相电压、本振信号、+12V电压、+5V电压、跟踪板电压、激励信号。仿真时支持度和置信度的阈值过小,则产生大量弱关联规则并延长挖掘时间,反之则可能遗漏有价值的关联规则,应用中应先在较小的样本中通过修改阈值进行交互式挖掘,以确定合适的阈值,然后再对海量数据进行挖掘,并采用支持度或置信度排序技术。本文采用支持度为14.6%,置信度为65%,相关度为1。

表1 故障统计表

对以上故障结果数据采用Apriori算法多次扫描得到的几组异常变量及挖掘结果,篇幅所限以下仅列出二组数据挖掘结果,如表2所示。

表2 异常数据挖掘结果

分析以上数据可知,接收系统某一设备故障时会导致与之联系的其它设备工作异常,例如 5号设备异常时,1、3、6、7 异常的概率为 100%,4、8、9异常的概率为 17%,3、6、7、1同时异常的概率为100%;9号设备异常时,2、3、1异常的概率为100%,5、6、7 异常的概率为 50%,2、3、1 同时异常的概率为100%。分析结果与雷达实际故障相同,说明仿真算法是正确的。

7 结束语

本系统利用数据挖掘的思想,建立了基于数据挖掘的雷达故障诊断系统。利用该方法建立的故障诊断系统具有自学习的能力,随着在线故障数据不断地加入数据库中,系统故障诊断的准确性会不断提高,实践证明该系统具有较高的实用价值。

[1]施晓华.数据挖掘技术在图书馆学科数据馆藏分析中的应用[J].情报杂志,2011,40(1):53-55.

[2]李洁,杨金会,滕振芳.数据仓库及数据挖掘技术在超市中的应用[J].煤炭技术,2010,25(2):36-38.

[3]贺清碧,胡久永.数据挖掘技术综述[J].西南民族大学出版社(自然科学版),2006,25(3):56-58.

[4]王光洪,蒋平.数据挖掘综述[J].同济大学学报(自然科学版),2004,55(2):12-15.

[5]王光洪,蒋平.基于关联规则数据挖掘技术的电网故障诊断[J].电力系统保护与控制,2009,37(9):8-14.

猜你喜欢
数据挖掘关联故障诊断
改进支持向量机在特征数据挖掘中的智能应用
基于包络解调原理的低转速滚动轴承故障诊断
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
“一带一路”递进,关联民生更紧
数控机床电气系统的故障诊断与维修
奇趣搭配
软件工程领域中的异常数据挖掘算法
智趣