数据挖掘在企业信息化管理中的应用研究

2012-08-07 01:38广西财经学院信息与统计学院赖振丹
中国商论 2012年7期
关键词:数据挖掘数据库信息

广西财经学院信息与统计学院 赖振丹

太原科技大学应用科学学院 庞宁

中国电信广西分公司 陈伟平

1 数据挖掘理论概述

1995年在美国计算机学会ACM会议中第一次提出了数据挖掘概念。所谓数据挖掘,就是指在诸多不完全、存噪且模糊的原始数据中将未知的具有潜在价值的信息及知识进行提取的过程。数据挖掘属于一门交叉学科,广泛涉及信息检索、模式识别、人工智能等诸多领域。在数据挖掘研究进程中,先后出现了诸如知识发现、数据融合等专用术语。随着互联网的不断发展,Web中的信息量迅猛增加,这些信息表现出量大、动态分布以及异质等方面的特征,将以往数据挖掘思想及方式融入到Web数据中,即产生了Web数据挖掘这一新的研究分支。

为了避免诸如噪声等不利因素的影响,在实施数据挖掘前需要采取预处理措施,从而使原始数据维数得到适当控制,同时提升数据质量及挖掘速度;完成数据预处理之后,需要分析数据发掘模式,这也是最为关键的一个环节。数据发掘可以发现的模式主要有以下几类:(1)聚类,以数据相同点和不同点的发现为重点,对一组对象属性做出描述,依据一定的原则对没有标识的对象进行类属划分;(2)关联规则挖掘,在数据挖掘范畴之中,最为关键的一个分支就是关联规则挖掘,最初是由R.Agrawal等在研究市场购物篮问题时提出的。划分依据不用,关联规则的分类也有所区别:以所处理的变量为依据,可以将其划分为布尔型关联规则以及多值关联规则;以所涉及的数据维度为依据,又有单维及多维之分;(3)序列模式,所谓序列模式,主要指的是存在于时序数据集当中的数据相互间所存在的因果关系模式,频繁出现于事件序列之中的时间序列就是序列模式挖掘。除此之外,还存在统计分析、分类以及特征规则等数据挖掘方法。

2 数据挖掘在企业信息化管理中的实际运用

信息化的浪潮在世界各地,各行各业掀起,信息化的层次也在不断演进,从MRPⅡ、ERP到CRM,从数据仓库(Data Warehouse)到数据挖掘(Data Mining),每一次变革都极大地推动着企业信息化的升级和企业管理水平的提高。随着世界生产技术的进步,社会生活的多元化,社交活动的复杂化,特别是电子信息技术的迅速发展与广泛应用,改变了以往基本依赖人工操作的数据存储变成了电子版本的数据资料,这一变革使得各种管理工作越来越依赖于对信息的管理。信息作为一种资源,使得人们的工作、生活以及思维方式发生了重大的变革,为企业的生产与经营提供了日益完善的手段。企业经营的百分之八十的时间用于信息的传输与处理,信息的采集、传输、加工和利用成为人们特别是信息工作者的主要活动。一些西方发达国家从事信息处理工作的人数多,在20世纪80年代就已经占职工总数的50%以上,而美国1993年政府报告“国家信息基础结构:行动计划”中指出“2/3的美国劳动者从事与信息有关的工作,其余1/3工作在高度依赖于信息的产业部门,”这种职工可以成为“知识工作者”,他们主要就是收集、传输和加工信息,包括编辑文件、写报告、分析信息、作计划等。所以现在各行各业对信息的管理要求越来越大。

随着社会主义市场经济的不断发展,以及市场竞争激烈程度的日益加大,对于企业发展而言,通过有效可行的方式进一步增进与广大客户之间的交流及了解,提升企业盈利能力成为当前所面临的一大发展性问题,同时也使企业更加深刻地认识到了在企业信息化管理过程中应用数据挖掘的重要性及必要性。在一定意义上讲,企业盈利来源于广大客户,利用数据发掘,在对客户数据进行准确地分析的基础上,有助于发掘消费模式,实现对企业的投资经营风险的有效控制,并进一步搞好与客户之间的关系。在此本文主要以银行及电信两大行业为例,对数据挖掘在企业信息化管理中的实际运用进行分析和探讨。

在电信领域中,当前不少电信企业都已经从自身实际状况出发,建立起规模与自身能力相符合的数据仓库系统,借助数据挖掘技术实现对数据中有价值的相关信息的有效提取,并以其作为预测未来企业经营状况、确定今后经营发展战略的依据。例如,呼叫时间具有多维性,对于诸如此类的电信数据,借助数据挖掘中的多维分析等相关技术,将有助于深入了解当前的数据通信情况,并明确最佳客户以及流失的客户,这对于促进企业经营业绩的不断提升将会产生极为深远的影响。

除电信行业之外,银行领域对数据相关技术的运用也受到越来越多的关注,一些银行为了向评估风险以及经营预测等方面的工作提供帮助,还专门成立数据挖掘部门。例如,美国一家著名银行利用数据挖掘技术对银行客户消费规律进行分析,在对过去一段时间内客户需求趋势分析的基础上,对客户今后的行为加以预测,进而使该银行的市场竞争优势有了很大程度的提升。现如今,在数据挖掘技术基础之上所研发的实时营销工具,可以及时将数据挖掘模型与客户交互予以集成,不但可以将各个营销环节进行有效的整合,而且还能根据不同客户的具体要求为其提供有针对性的服务。比如,客户在对银行的站点进行访问的过程中,相应的系统将会及时地处理该客户的访问信息,并以最终的处理结果为依据对银行当前所实行的战略予以适当的调整和完善,以便银行所作出的经营管理决策的科学性和准确性,只有这样才能确保客户对银行服务的满意程度不断提高。当前在银行金融领域中,数据挖掘相关技术发挥越来越重要的作用。

商业智能(BI,Business Intelligence)最早由Gartner Group的Howard Dresner在1989年首次提出,在我国由于各种原因,信息管理系统的发展处于初级的数据处理阶段,虽然如此,我国的技术人员可以通过一定的技术研究,利用现有的资源和力量,开发多种适合于本企业或本行业的管理信息系统,这对于部分企业或者部门都是非常有必要的。近年来,我国国内也正在对于基于.NET的数据挖掘开发进行大量的研究工作,崔艳在其研究中介绍了ASP的概述、特点和编程中的对象和内置控件、ASP网页的结构和运行环境论述了ASP访问WEB数据库的原理和实现步骤,并结合例子说明ASP如何使用MYSQL数据库。刘丽娟在其研究中认为为了适应电子商务的发展要求,数据挖掘应该不断的发展,并且与其他的技术兼容性应该提高,接下来其对数据挖掘技术在电子商务中的应用进行了探讨。童慧认为Web挖掘包括了Web内容挖掘,Web结构挖掘和Web使用挖掘三个研究方向。每一种挖掘都有其特定的意义,文中专门指出了Web使用挖掘的体系结构及其技术,并介绍了它们在个性化站点中的应用情况。而且,目前中国权威的计算机信息赛迪网也发布了基于空间数据库的数据挖掘技术,一种新的数据挖掘系统结构也出现在人们的视野中。该系统的基本结构与一般数据挖掘系统相同,仅在数据挖掘和数据管理中增加了有关空间信息的抽取、空间数据管理和空间分析的功能,并建立了一个人机接口处理用户的指令和显示挖掘结果。而要实现了一个基于Oracle Spatial的分布式空间数据挖掘原型系统,至少要包括五个部分。(1)图形用户界面:用于进行交互式的挖掘并显示挖掘结果;(2)数据准备模块:进行数据的选择、预处理和转换;(3)挖掘模块:聚类、分类、关联规则等空间数据挖掘功能及挖掘结果的评价;(4)空间数据管理模块:执行数据准备模块及挖掘模块指定的空间操作;(5)数据库服务器:管理作为挖掘目标的空间数据和非空间数据及概念层次库、挖掘结果库。

商务智能活动在美国和欧洲比在世界上任何其他地区都要发达,欧美的企业已经认识到商务智能的重要意义,因而对它寄予很高的期望,希望能够通过商务智能充分利用企业以往对信息技术的投资、改善决策、提高利润、提高运营效率和增强透明度。不过,就算是在世界上商务智能最发达的这些地区,企业对商务智能的部署也多是部门性的和战术性的。

图1 欧美企业商务智能投资的增长

从目前来看,基于Windows环境的开发工具已经有很多了,但是目前还缺少一种相对高效而且成熟的开发语言,C++语言在很多的大型的复杂项目中仍然作为主要的开发语言在使用。在数据库的应用程序开发中,对数据库进行访问的模块开发具有非常重要的意义,这一部分技术主要包括了ADO、开放的数据库连接ODBC、对象的连接与嵌入数据库等等。上述技术中,每一种都有各自的优点和特色,在实际的应用过程中,要根据应用程序的实际需要进行选择,而要做到这种程度,首先就要对上述的访问技术有一个清晰的认识。

一般而言,在应用程序无需底层控制时,ADO具有较为明显的优势,在数据库是AQL类型的时候,选择ODBC技术具有一定的优势,在Jet数据源条件下,DAO技术效率更高。ADO技术和OLEDB技术在执行速度方面更具有优势,在非关系型数据库条件下如果需要进行相互操作,那么就非常的合适。而Jet能够支持两种格式的SQL语法,其一为老SQL语法贵发,而另一种则是目前新型的SQL语法规范,因而更具通用性。但是,我们也要注意,只有用户使用ActiveX Data Objects和Jet OLEDB provider的时候,才能够使用新的语法。我们通过使用Access程序,能够利用DAO及时直接访问SQL数据库。但是,在实际的设计过程中,DAO需要根据Access的要求来建模,因此,DAO技术是连接Access数据库最有效、最快捷的一种技术。但是,如果面临对Access以外的数据库进行访问,则会因为涉及不同语法之间的转换,而导致效率的降低。

3 结语

随着现代化信息技术的发展,社会各界对数据挖掘的关注程度越来越高,特别是有关Web数据挖掘技术的研究,更是进一步拓展了该领域的研究范围,新数据挖掘方法相继出现,企业信息化管理中应用的数据挖掘技术也日益成熟。虽然当前数据挖掘技术的发展还存在一些有待进一步深入研究的问题,但数据挖掘技术所带来的极大的社会及经济效益是无可置疑的,其在现代化信息社会的发展过程中起到了不可替代的重要作用。

[1]赵爱琴.数据挖掘在电信行业精确营销中的研究与应用[D].西南财经大学,2008-12-01.

[2]徐河杭.面向PLM的数据挖掘技术和应用研究[D].浙江大学,2010-07-01.

[3]吴常辉.基于关联规则的数据挖掘方法及其在电子商务网站中的应用研究[D].合肥工业大学,2010-04.

[4]张红艳.数据挖掘技术在企业人力资源管理中应用的研究[D].吉林大学,2005-05-24.

猜你喜欢
数据挖掘数据库信息
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
订阅信息
数据库
数据库
数据库
数据库
展会信息
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议