Excel2010数据挖掘工具的应用研究

2015-02-09 12:22熊文君
读写算·教研版 2014年24期

熊文君

摘 要:21世纪以计算机信息技术为代表的新科技革命不断深入,社会经济的发展使得人类积累的数据逐渐庞大,海量信息内后蕴含无限的应用价值。信息挖掘技术就是在海量信息中搜寻有价值、有用途的信息。Excel2010就是当今一项简单实用、功能丰富、应用广泛的数据挖掘工具,本文详细分析了Excel2010的功能,并从统计数据信息和支持多种算法两个方面探究Excel2010的应用。

关键词:Excel2010;数据挖掘工具;功能与运用

中图分类号:G642 文献标识码:B 文章编号:1002-7661(2014)24-005-01

数据挖掘是指从海量的数据中搜寻有价值、有趣模式的过程,试图在随机的、无规律的、大量的、模糊的数据中提取人们所不知道的但存在潜在利用价值的数据信息。数据挖掘是知识发现的过程,能够帮助人们快速整理、寻找目的信息,提高数据信息利用效率。Excel作为Micrsoft Office应用办公软件中的常用组件,具有高效的计算功能和直管的图表界面,是当下最流行的办公应用软件。而Excel2010则是一款功能强大、应用广泛的数据挖掘工具,本文将对其功能和应用做详细阐述。

一、Excel2010数据挖掘工具

Excel2010数据挖掘工具具有创建、测试、管理数据挖掘结构和模型的功能,能够为用户提供快速直观的应用界面,同时SQL中数据自定义功能不会丧失,并能够对存储在Excel表格中的数据进行相关性分析和汇总,支持数据建模、图形展示结果的功能。使用Excel2010进行数据挖掘时,需要具备数据挖掘外接程序和Microsoft SQL两种技术支持,本文所介绍的Excel2010是在windows2007版本下的Microsoft SQL2012和Office2012数据挖掘外接程序[1]。Excel2010由用户界面、数据知识库(评估模式和数据挖掘搜索引擎)、数据库服务器以及数据清理、集成和选择组成,整个数据挖掘系统均可以与互联网和其他信息总库相连接。Excel2010采用外接程序实现数据挖掘功能,主要包括三个板块:一是Excel表格工具,用户可以通过简单的鼠标和键盘操作,对表格中的数据进行各种运算和相关性分析;二是Visio数据挖掘模板。用户可以通过Visio以图形方式呈现数据结果,方便用户更直观简洁地理解。三是Excel2010数据挖掘客户端,用户可以通过Analysis Services 访问其他数据库或互联网数据,从而扩大信息搜索范围。

二、Excel2010数据挖掘工具的功能应用

1、数据准备

Excel2010中具备浏览、查看、删除、标记、分类、整理等多种数据管理功能,方便用户在进行数据挖掘操作时做好数据准备[2]。浏览数据和查看数据是Excel2010中最基本的功能,能够明确判定单个行或列中数据的分布情况和数据性质。清除或删除数据是Excel2010一大主要功能之一,用户可以通过标记、修改或删除没有利用价值的数据以达到运用目的。分类数据是Excel2010中常见的功能之一,通过各种分类方法将不相关的、无规律的数据继续拧有规律、有计划的排列组合,方便后期数据挖掘。

2、数据建模

数据建模是指根据Excel2010表格数据库中数据进行关联性分析,预测数据趋势,方便后期查找和分类。数据建模是建立在Analysis Services 基础之上的,数据分析或数据分类过程中能够生成一个分类模型,系统根据模型中列和行的值来预测某一单位列中的值。预测模型,它通过提取数据模式中的关联模式来预测连续的数字或日期。聚类分析模型,它能够针对特征相同或相似的数据或行组进行归纳。关联模型能够检测多个事务中存在关联性的数据,比如学生信息系统模型中,将学生的姓名、班级、学号、成绩等进行关联性分类。

3、检测与评估模型

检测和评估模型是指创建用于分析数据挖掘方案的图表,以提升图或散点图的方式清楚直观地将分析结果展示出来,方面用户评估模型的性能。比如公司企业的年度利润收益状况图表就是医用走势图或柱状图展示出来的。

4、管理与连接

Excel2010数据挖掘客户端,用户可以通过Analysis Services 访问其他数据库或互联网数据,从而扩大信息搜索范围。

5、统计数据信息

Excel2010最基本的功能就是数据挖掘,而数据挖掘是数据统计最典型的功能,能够支持海量数据、多种性质数据的统计分析操作,帮助人们获取目的信息数据。

6、支持多种数据算法

Excel2010作为一种数据挖掘工具,它的数据模型功能是通过各种复杂的算法来实现的。以Microsoft SQL2012中的Office Excel2010为例,其中包括分类算法、回归算法、分段算法、关联算法、顺序分析算法等等,这些算法为实现数据建模中的分类模型、聚类分析、逻辑回归、统计学分析等等具有重要作用。

Excel2010作为一款永永快速直观工作界面和高效创建管理数据的数据挖掘模型,能够帮助人们从海量无规律的数据中提取有应用价值的数据,简化操作程序,提高工作效率。Excel2010数据挖掘工具主要具备数据准备、数据建模、检测与模型评估、模型用途以及管理和连接五大方面的作用,在快速高效统计数据信息和支持多种数据算法方面应用广泛。

参考文献:

[1] 吴 丹.Excel2007数据挖掘工具的研究与应用[J].数据库与信息管理,2013,9(8):1736-1738.

[2] 徐军伟.程国忠.Excel2010数据挖掘工具的应用研究[J].电脑知识与技术,2014,10(1):4-7.endprint