基于关联规则的数据挖掘技术的研究与应用

2017-01-12 09:42李悦孙健邱志祺
现代电子技术 2016年23期
关键词:关联规则信息管理系统数据挖掘

李悦+孙健+邱志祺

摘 要: 通过对目前我国信息化的发展现状及问题进行详细分析,找到基于关联规则的数据挖掘技术与我国各单位信息管理中的契合点,提出了基于关联规则的数据挖掘技术系统的设计方案。该方案有助于我国各单位优化资源配置,促进领导的决策合理性,进而对于提高我国各单位的综合实力,推动全面发展具有很强的现实意义。

关键词: 数据挖掘; 信息管理系统; 关联规则; 分类挖掘

中图分类号: TN911?34 文献标识码: A 文章编号: 1004?373X(2016)23?0121?03

Application and research on data mining technology based on association rules

LI Yue1, SUN Jian2, QIU Zhiqi3

(1. Modern Technology and Education Center, North China University of Science and Technology, Tangshan 063000, China;

2. Dean′s Office, North China University of Science and Technology, Tangshan 063000, China;

3. College of Information Engineering, North China University of Science and Technology, Tangshan 063000, China)

Abstract: The information development situation in our country and its problems are analyzed in detail. The integrating point of data mining technology based on association rules and information management in China′s each unit is found out. The design scheme of data mining technology system based on association rules is proposed. This scheme is helpful to optimize the resource allocation of all units in China, promote the decision?making rationality of the leader, and has great practical significance to improve the comprehensive strength of all units in China and promote the comprehensive development.

Keywords: data mining; information management system; association rule; classification mining

0 引 言

随着信息技术在各单位信息管理中应用的逐渐普及,信息管理系统中积累了海量的数据,本文以我国高校为例,深刻研究了高校信息管理系统,在管理信息化的条件下,对这些长期积累的海量数据进行分析和挖掘,挖掘出其中隐藏的、未知的规则和信息,将分析结果用于高校管理的分析与决策上,辅助管理者的决策,还可以为我国高校优化资源配置提供可靠的数据,节约成本,为我国高校的发展发挥着重要的作用。

1 数据挖掘的定义及技术分析

1.1 数据挖掘的定义

数据挖掘技术是一门新兴学科,集众多学科交叉融合而成的工具和技术,其中包含了数据库技术、统计学、人工智能、信息检索、模式识别等多种技术。数据挖掘(Data Mining)是指从海量的数据或数据库中分析和提取出人们感兴趣的知识的过程。这些数据知识是隐含的、事先未知的,将数据挖掘技术应用到高校信息管理上是非常有益的,可以全面地分析课程设置,教学过程等各方面因素的内在联系,是一种决策支持的过程。

1.2 关联规则分析

数据挖掘的技术方法有很多种,其中关联规则挖掘是目前使用频率最多,应用范围最广的数据挖掘技术之一。关联规则反应了事物与其他事物之间的相互依存性和关联性,可以通过研究分析海量数据,捕捉其中的相互关联和重要关系,反应数据的不同规律,预测时间的发展趋势。关联规则是易于理解和解释的一种技术,应用分析广泛,是许多其他数据挖掘方法的基础。

其中,Apriori算法是关联规则挖掘方面很有影响力的算法,通过项目集元素数目的不断增长来逐步完成频繁项目集的发现,是挖掘产生布尔关联规则所需频繁项集的基本算法。利用Apriori算法迭代识别所有的频繁项目集,发现计算量最大的部分,从频繁项目集中构造置信度不低于用户设定的最小置信度的规则。具体算法流程如图1所示。

2 数据挖掘技术在高校管理中的应用

数据挖掘技术应用到高校管理工作中,可以通过对信息系统中的海量数据的相互之间的关系进行分析,发现其中一些潜在的联系和客观规律,可以对高校管理的决策支持等工作提供极大的帮助,为改进高校管理提出了指导性的建议,使得高校管理系统在高校信息化的建设中发挥更大的作用。

2.1 数据挖掘技术在教学评估中的应用

高校员工的评价结果是日常工作情况的重要表现,是高校信息管理工作的一个重要组成部分,也是目前高校进行职称评定,绩效评定的有效标准。但是影响高校员工的评价因素有很多,包括员工年龄、工作时间、政治面貌、学历、职称等很多方面。如何通过这些现有数据判断哪些或者哪个因素对于高校员工考评的影响最大,可以通过关联规则数据挖掘的Apriori算法进行数据分析,对各方面的数据进行充分挖掘,得到有价值的信息作为高校员工考评的评价依据,以达到对高校员工管理的改进的有效支持,极大地提高了高校人事管理的效率,使高校实现科学化、正规化管理。

摘 要: 通过对目前我国信息化的发展现状及问题进行详细分析,找到基于关联规则的数据挖掘技术与我国各单位信息管理中的契合点,提出了基于关联规则的数据挖掘技术系统的设计方案。该方案有助于我国各单位优化资源配置,促进领导的决策合理性,进而对于提高我国各单位的综合实力,推动全面发展具有很强的现实意义。

关键词: 数据挖掘; 信息管理系统; 关联规则; 分类挖掘

中图分类号: TN911?34 文献标识码: A 文章编号: 1004?373X(2016)23?0121?03

Application and research on data mining technology based on association rules

LI Yue1, SUN Jian2, QIU Zhiqi3

(1. Modern Technology and Education Center, North China University of Science and Technology, Tangshan 063000, China;

2. Dean′s Office, North China University of Science and Technology, Tangshan 063000, China;

3. College of Information Engineering, North China University of Science and Technology, Tangshan 063000, China)

Abstract: The information development situation in our country and its problems are analyzed in detail. The integrating point of data mining technology based on association rules and information management in China′s each unit is found out. The design scheme of data mining technology system based on association rules is proposed. This scheme is helpful to optimize the resource allocation of all units in China, promote the decision?making rationality of the leader, and has great practical significance to improve the comprehensive strength of all units in China and promote the comprehensive development.

Keywords: data mining; information management system; association rule; classification mining

0 引 言

随着信息技术在各单位信息管理中应用的逐渐普及,信息管理系统中积累了海量的数据,本文以我国高校为例,深刻研究了高校信息管理系统,在管理信息化的条件下,对这些长期积累的海量数据进行分析和挖掘,挖掘出其中隐藏的、未知的规则和信息,将分析结果用于高校管理的分析与决策上,辅助管理者的决策,还可以为我国高校优化资源配置提供可靠的数据,节约成本,为我国高校的发展发挥着重要的作用。

1 数据挖掘的定义及技术分析

1.1 数据挖掘的定义

数据挖掘技术是一门新兴学科,集众多学科交叉融合而成的工具和技术,其中包含了数据库技术、统计学、人工智能、信息检索、模式识别等多种技术。数据挖掘(Data Mining)是指从海量的数据或数据库中分析和提取出人们感兴趣的知识的过程。这些数据知识是隐含的、事先未知的,将数据挖掘技术应用到高校信息管理上是非常有益的,可以全面地分析课程设置,教学过程等各方面因素的内在联系,是一种决策支持的过程。

1.2 关联规则分析

数据挖掘的技术方法有很多种,其中关联规则挖掘是目前使用频率最多,应用范围最广的数据挖掘技术之一。关联规则反应了事物与其他事物之间的相互依存性和关联性,可以通过研究分析海量数据,捕捉其中的相互关联和重要关系,反应数据的不同规律,预测时间的发展趋势。关联规则是易于理解和解释的一种技术,应用分析广泛,是许多其他数据挖掘方法的基础。

其中,Apriori算法是关联规则挖掘方面很有影响力的算法,通过项目集元素数目的不断增长来逐步完成频繁项目集的发现,是挖掘产生布尔关联规则所需频繁项集的基本算法。利用Apriori算法迭代识别所有的频繁项目集,发现计算量最大的部分,从频繁项目集中构造置信度不低于用户设定的最小置信度的规则。具体算法流程如图1所示。

2 数据挖掘技术在高校管理中的应用

数据挖掘技术应用到高校管理工作中,可以通过对信息系统中的海量数据的相互之间的关系进行分析,发现其中一些潜在的联系和客观规律,可以对高校管理的决策支持等工作提供极大的帮助,为改进高校管理提出了指导性的建议,使得高校管理系统在高校信息化的建设中发挥更大的作用。

2.1 数据挖掘技术在教学评估中的应用

高校员工的评价结果是日常工作情况的重要表现,是高校信息管理工作的一个重要组成部分,也是目前高校进行职称评定,绩效评定的有效标准。但是影响高校员工的评价因素有很多,包括员工年龄、工作时间、政治面貌、学历、职称等很多方面。如何通过这些现有数据判断哪些或者哪个因素对于高校员工考评的影响最大,可以通过关联规则数据挖掘的Apriori算法进行数据分析,对各方面的数据进行充分挖掘,得到有价值的信息作为高校员工考评的评价依据,以达到对高校员工管理的改进的有效支持,极大地提高了高校人事管理的效率,使高校实现科学化、正规化管理。

IF期末成绩等级=B,AND平时成绩等级=C,THEN是否优秀=N;

从上面的生成规则可以看出:期末考试成绩等级为A,且平时成绩等级为B以上者,成绩为优秀。

(4) 生成分类规则

通过对学生成绩进行数据挖掘,找出影响学生成绩的主要因素以及之间的关系,为教学管理部门提供高校教学中学生的知识、技能、能力之间的关系,以明确今后学生学习的重点和难点。

2.3 数据挖掘技术在高校课程设置中的应用

目前,高校学生的课程安排是相互联系的,是循序渐进的。在学习专业课前,要将先开设的课程学好,才能继续下面课程的学习。如果先开设的课程没有学好,就会影响后面课程的学习。另外,由于授课教师,班级学生的总体成绩等因素,学生的成绩有时会相差很大。教务管理人员和任课教师可以利用关联规则对课程数据进行挖掘分析,发现数据中隐藏的前期课程和后期课程的相互关联,为今后课程进程的开展提供重要的决策和理论支持。

可以通过查找存在于项目集合或者对象集合之间的频繁模式,查到相关性或者因果结构,是当前数据挖掘研究的主要模式之一,确定数据中不同领域之间的联系,利用关联规则分析课程安排的不同顺序与学生最终取得考试成绩之间的关联关系,从而得出教学计划中的课程安排的顺序与学生的考试成绩之间的关系,得出教学计划中课程之间的关系,进而合理设置专业课程。

3 结 语

如今,数据挖掘技术在高校信息管理领域中的应用日益广泛,也已经取得了一定的成绩。但是,还存在着一些不足,需要进一步的完善。主要包括以下方面的研究:首先,挖掘工具要更标准,使用更便捷。目前,挖掘工具都是针对某一具体的高校信息系统,而没有统一规范化的适用于所有系统的工具。这种情况不便于使用者更好更快地掌握,给推广挖掘工具的工作带来了困难。其次,挖掘工具操作复杂,只有从事信息工作方面的人员才能使用自如,对于广大普通管理者和从事信息管理的管理者来说掌握起来需要花费很长的时间。所以,研究一种简单、友好、方便快捷,并且通用的挖掘工具是目前高校信息处理工作的研究重点。

参考文献

[1] 朱铁樱,骆爽.数据挖掘技术在高校管理决策中的应用[J].计算机时代,2015(3):39?43.

[2] 朱丽丽.基于数据挖掘技术的高校教务管理的应用与研究[J].数字技术与应用,2014(31):239?240.

[3] 江敏,徐艳.数据挖掘技术在高校教学管理中的应用[J].电脑知识与技术,2012(24):541?545.

[4] 吕慎敏.基于数据挖掘的高校教学管理决策支持系统研究[D].济南:山东师范大学,2012.

[5] 杨恩震.浅论计算机技术在教学管理中的运用[J].湖北函授大学学报,2012,25(2):28?29.

[6] 高晓佳.数据挖掘在教育信息化中的应用研究[J].电脑知识与技术,2012,8(5):1199?1200.

[7] 孙中祥,彭湘君,杨玉平,等.数据挖掘在教育教学中的应用综述[J].智能计算机与应用,2012,2(1):78?81.

[8] 张海燕,李娟.B/S 架构的高校教学管理系统研究与开发[J].农业网络信息,2012(1):109?111.

猜你喜欢
关联规则信息管理系统数据挖掘
三维可视化信息管理系统在选煤生产中的应用
信息管理系统在工程项目管理的应用
探讨人工智能与数据挖掘发展趋势
基于三维TGIS的高速公路综合信息管理系统
基于并行计算的大数据挖掘在电网中的应用
关联规则挖掘Apriori算法的一种改进
基于关联规则的计算机入侵检测方法
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究