浅析数据融合与数据挖掘

2013-09-03 06:32唐生枝
中国信息化·学术版 2013年7期
关键词:数据融合数据挖掘

唐生枝

【摘 要】数据挖掘和数据融合是两种分析处理海量数据、提取有用知识的技术。两者的目标和原理各不相同,但功能上相互补充,可进行深层次的结合渗透,有效地完成复杂的数据分析工作。文章以网络安全应用中的网络故障管理实例,分析了两者集成运用的优势。

【关键词】数据融合,数据挖掘,知识发现

【中图分类号】 C37【文献标识码】A【文章编号】1672-5158(2013)07-0172-01

在信息时代,信息量的爆炸式增长使得信息的获取、传输、存储、转换等信息处理技术得到了长足进步。数据融合与数据挖掘作为信息处理技术两大分支在这一过程中萌生,并得到了人们的重视和研究。

数据融合源于传感器技术的发展,是帮助人们处理复杂多变的外部环境产生的信息,评估环境状态和目标信息,对战局和威胁的提供全面和及时的信息处理技术。数据挖掘用以帮助人们从积累的“过量信息”中,撷取事先未知的潜在有用的信息和知识的信息处理技术。

一、网络故障管理系统中应用

随着网络应用的发展,网络规模以及网络的数量得到了蓬勃发展。为了更好的对网络进行有效的管理,及时排除网络故障,让网络持续稳定地运行将数据融合作为,网络故障的管理也就有着突出的重要性。

将数据融合作为数据挖掘的数据准备阶段,在网络故障管理方面,二者合理的结合使用,利用数据融合技术分析网络运行中产生的状态数据,处理结果形成数据集,在这个数据集的基础上利用数据挖掘技术,获得安全规则,发现异常,判断网络故障。系统结构如图所示。

① 数据融合模块

网络故障管理系统中数据融合模块是对网络中多处来源的数据进行处理和组合,从而产生新的有意义的信息。这里的多处来源的数据是指网络运行中产生的描述网络运行的状态信息。

网络管理中的数据具有多源性、分布性、异构性的特点,它们主要来自网络的数据、系统日志、网络管理查询信息等。而另一方面,目前数据挖

掘一般对象是静态的数据集,解决这些矛盾的方法是数据挖掘和数据融合技术集成。

网络故障信息中的告警数据是含噪声的、并且大量都是重复的。主要包括告警丢失、错乱、延迟以及重复告警、误告警等方面。利用数据融合的关联技术,根据数据之间的相似性,将来源数据进行处理,以减少重复数据的数量。

② 数据挖掘模块

在网络管理的数据挖掘中,关联规则和序列模式是最常见的挖掘知识,二者挖掘知识的角度不同。关联规则是从网络告警信息中发现告警与告警之间、告警与故障之间、告警与业务之间的相关性,即在一个告警信息发生之后,另一个告警、故障、业务发生的可能性。而序列模式把告警信息序列看作以时间为主线的有序序列,在一定的时间间隔内挖掘知识,注重告警信息的时间性。

在数据挖掘阶段,网络的管理者必须对系统设置相应的参数,这些参数用于描述网络的运行状态。例如当某项低于或者高于某一值时,认为网络该方面产生故障。并且根据值的大小,采取不同的措施,发出告警信息或者仅写入日志。有时还要根据参数值的时间变化,分析故障产生的概率。对于不同的参数,挖掘算法得出的结果和提示都不尽相同,因此系统的性能对人工干预的程度有着依赖性。

二、应用分析

在网络管理系统应用中,数据融合模块与数据挖掘模块处于串联处理关系,两者位置不能够颠倒,首先由数据融合模块对来源数据进行数据处理,形成相应的数据集,提供给数据挖掘模块使用、分析。

参考文献

[1] 习慧丹.数据挖掘研究综述.电脑与信息技术,2012(1)

[2] 王惠中,彭安群.数据挖掘研究现状及发展趋势.工矿自动化,2011(2)

[3] 孟珍伟,杜友福,秦建超.现代数据挖掘技术与发展.中国科技信息,2007(2)

猜你喜欢
数据融合数据挖掘
数据挖掘技术在内河航道维护管理中的应用研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
多传感器数据融合技术在机房监控系统中的应用
《可靠性工程》课程教学的几点思考
基于数据融合的家庭远程监护系统研究
基于R的医学大数据挖掘系统研究
船舶动力定位中的数据融合技术文献综述
基于信源编码的数据融合隐私保护技术
一本面向中高级读者的数据挖掘好书