数据挖掘技术在高校教务管理中的应用研究

2015-09-10 07:22邹星
决策探索 2015年22期
关键词:项集教务决策树

邹星

高校教务管理系统在高校管理中具有举足轻重的地位。伴随着高校的扩招、学生数量的急剧增加以及学分制的确定,原本复杂的教务管理工作变得更加复杂。教务管理所使用的教务管理系统虽然能够完成日常事务工作的处理,但却不能解决信息查找、信息分析等问题,无法为管理人员提供决策支持,满足不了现代高校管理的新需求。数据挖掘技术可以发现海量数据之间隐藏的关联及相互之间的影响作用,为管理人员提供决策帮助。本文研究的重点就是在现有的教务管理系统之上,利用数据挖掘技术解决目前高校教务管理中普遍存在的数据分析问题,达到提高高校管理的质量和水平的目的。

一、数据挖掘的过程

第一,明确业务应该处理的对象。应该对于问题进行明确的界定,对于数据挖掘的目标的确定是保证数据挖掘的开端,也是非常重要的一个环节。虽然对于数据进行挖掘最后的结论是不可预测的,但是对于问题所进行的探索是非常清楚的。如果盲目地对数据进行挖掘,就会降低数据挖掘的准确性。

第二,数据准备工作。这个过程需要完成的工作主要有数据选择、数据处理、数据转换。数据选择主要是对和业务对象相关的所有的有用信息进行搜索,从而在里面选择最合适的信息。数据处理主要研究数据本身的质量,其目的是为了更好地完成数据分析工作,并且确定进行数据挖掘的类型。数据转换主要是为数据转换确定合适的分析模型,这个模型的建立需要充分考虑数据的算法,建立真正合适的分析模型。

二、关联规则算法与决策树算法在教务管理中的应用

(一)关联规则算法

关联规则能够非常清晰准确地表达数据库中每一个子集的基本情况。使用关联规则进行数据分析时,主要工作方式就是通过对数据库、关系数据库和其他儲备信息库进行分析,从而寻找出项集之间存在的关联性。关联规则挖掘是数据挖掘的重要组成部分。所谓关联规则,是指能够达到预定目标要求的规则。举一个简单的例子,在一个蕴含式子中:形如这样的一种蕴含式子:X-Y。其中:X表示规则前件,Y表示规则后件。关联规则的强度值通常用客观兴趣度衡量。客观兴趣度衡量是一种评价关联模式的质量的数据驱动的方法。它使用从数据推导出的统计量来确定模式是否是有趣的,可用支持度或置信度来评价。令I=(i1,i2,i3,…,im)是挖掘数据库D中所有项的集合,集合T={t1,t2,t3,…,tn}是所有事务的集合,包含零个或多个项的集合称为项集。如果项集X是事务t1的子集,则称事务t1包含项集X。在事务集T中包含项集X的事务个数称为项集X的支持度计数M(X)。

(二)决策树算法

决策树算法就是以实际案例进行归纳总结而得出的一种学习算法,主要的运算原理即是在无顺序、无规则的元组中找到决策树表示形式的分类规则。其递归方式采用的是自项而下的方式,在决策树的内部节点中去完成属性值的比较,并且根据不用的属性值进行自上而下的分支,在分类的过程中要学习叶节点自身的特性和规律,只有把握住其内在规律才能够在从根到叶节点的运算过程中不出现错误。决策树的构造过程中不需要掌握非常高端的计算机知识,只需要掌握基本的知识就能够完成其构建过程,因此这种算法在数据挖掘过程中受到非常广泛的关注。

(三)关联规则算法与决策树算法在教务管理中的应用

当前研究的高校教务管理系统中就已经应用了很多的关于关联算法和决策树算法,因为这两种算法的综合应用性比较强,所以依据其自身的挖掘目的和数据分析的特点所设计的数据挖掘系统就具有非常强大的适用性。通过数据挖掘就能够将教师的年龄、工作、学历、课时等基本信息很快地搜索关联起来,这样对提高教学质量和教师的自身素质有很大的帮助。因为相对来说,高校的教务管理系统中有很多的教师信息,这样就会导致学生和教师的信息非常庞杂,庞大的数据系统会使教务管理系统在运作时所需要处理的数据变得更多。

决策树在高校教务管理信息系统中所发挥的作用非常大,主要就是用于对相关数据信息的预处理。在预处理的过程中,首先应该完成的就是相关的决策树模型构建,在构建决策树模型以后,往往会存在一些不需要处理的分支,这些分支的存在对于正常的教务管理工作有很大的影响,所以说,在构建决策树以后首先应该完成的就是剪枝工作,剪枝工作的质量和效率对于决策树自身存在的合理性有很大的影响。对于分支决策树进行合理的剪枝,就能够让决策树剪枝工作顺利完成,这样也就能够保证其预期具有较高的效率。在构建决策树的过程中,一定要注意构建合理科学的决策树。

三、结束语

在当前的学校教务管理系统中,信息量的快速增加会给教务管理人员带来很大的挑战。因此在当前的科技环境下,应该将数据挖掘技术的相关算法广泛应用在学校的教务管理系统中,这样就能够促进教务管理系统进一步改革和完善,为管理人员决策提供重要的依据,从而使教务管理工作变得更有科学性和针对性。

猜你喜欢
项集教务决策树
教务排课对高等院校教学运行的作用分析
一种针对不均衡数据集的SVM决策树算法
浅析高校教务管理存在的问题及对策
决策树和随机森林方法在管理决策中的应用
基于决策树的出租车乘客出行目的识别
浅谈新形势下高校教务管理人员的素质与培养
以培养方案为核心的教务管理系统开发的探索与实践
基于肺癌CT的决策树模型在肺癌诊断中的应用
关联规则中经典的Apriori算法研究
一种频繁核心项集的快速挖掘算法