刘小桃 林延庆
摘 要: 在高校教务管理工作中,对学生的成绩进行管理分析是基础与核心。通过对学生成绩的分析,得出学生实际学习状况与教师的教学情况,反映高校的教学质量。近年来,教育事业不断改革与发展,学生人数逐年增多,每年高校都将学生的信息进行存放,而这些信息一般只用于核对与备案,造成严重的信息浪费。利用数据挖掘技术,对学生的成绩进行挖掘分析,进而得到潜在影响学生成绩的因素,并以其指导高校管理工作,指导教师教学工作,意义重大。本文针对数据挖掘在高校学生学习成绩分析中的应用进行了探究,旨在提高高校教学质量。
关键词: 数据挖掘 成绩分析 教务管理工作
在我国高校的教务管理中,采用的基本都是基于数据库的系统软件。教务软件中存有大量的学生数据,但一直没有发挥数据的作用,可利用数据挖掘技术,从中挖掘出隐藏的重要信息,用以指导教学工作。随着数据挖掘技术的成熟,应用的范围不断扩大,越来越多的高校采用数据挖掘技术指导教务的管理工作,为教学工作提供参考。
一、数据挖掘技术涵义
(一)数据挖掘的概念
数据挖掘是一种数据处理技术,一般是指在大量数据中,通过算法发现数据中隐藏信息的过程,从属于数据库的知识发现。数据库利用统计、情报检索、专家系统、在线分析处理、机器学习等方法与工具,对繁杂的数据进行分析、归纳与总结,通过搜索数据的内部信息,为高校的教务管理提供决策依据。
(二)数据挖掘的过程
数据挖掘过程是一个需要循环往复的过程,要做到精益求精,如果经过一次的数据挖掘没有得到有效的信息,就要重新进行数据的选择和处理,直到得出对我们有用的信息为止。一般情况下数据挖掘分为五个阶段:一是了解数据挖掘的概念,明确其目的;二是做好数据挖掘的准备工作;三是数据挖掘有很多种方法,依据实际情况选择合适的算法,对要处理的数据进行数据挖掘;四是對数据挖掘得出的信息进行分析,给予用户能够接受的知识;五是将通过数据挖掘得到的信息运用到对应的领域中,发挥数据挖掘的指导与参考作用。
(三)数据挖掘常用的方法
聚类分析法、统计分析法、模糊集方法、关联规则方法、神经网络方法、决策树方法、覆盖正例排斥反例法、粗集理论方法等。
二、成绩分析中应用数据挖掘的方法
(一)关联规则算法
1.应用关联规则算法的内容。关联规则的算法是指在大量的待处理数据中找到各事物之间的联系,是数据挖掘中的重要课题。关联是指在两个事物或者两个以上事物之间必然存在着某些规律性,运用关联规则就是要获取数据之间隐藏的重要信息。在成绩分析中运用关联规则,查找影响成绩的因素,针对试卷得分情况,对学生的成绩进行总结,分析得分情况与课程之间的相关性。
2.运用关联规则算法的挖掘过程。一是对数据库中的内容进行分析与识别,在进行数据挖掘之前,首先要定义最小的支持度,在最小支持度的基础上进行原始数据的挖掘,得到的项集应不小于最小支持度;二是产生强关联规则,利用频繁项集产生规则,得到的规则的置信度与最小置信度相比,要比最小置信度大或者与最小置信度相等。
3.关联规则的具体应用,下表为应用关联规则中某专业成绩不及格的挖掘规则。
依据上表得出如果最小的支持度为0.55,最小的置信度为0.35,那么1、2、4、5就为强关联规则,在课程1不及格时,课程3与6不及格的概率就会高,这就说明课程一影响课程3与课程6;课程4也受到课程2的较大影响;课程2受到课程5的影响。
4. Apriori算法的数据挖掘。Apriori算法是一种频繁项集算法,用来发掘相关规则。Apriori算法应用的非常广泛,核心思想是在候选集生成与情节向下的封闭检测的阶段下,进行频繁项集的挖掘。具体内容包括:一是依据数据挖掘的要求,建立相应的事物数据表,对于优秀成绩进行保留,其他的做删除处理;二是建立频繁项集数据表,用A、B表示项目名称并做相应的记录;三是删除表中支持度的计数小于最小的支持度记录,从而得到最终的频繁1项集;四是计算后几个频繁项目集的结果;五是删除最终的频繁项集中比最小的置信度阈值小的记录,进而得到最终的规则信息。
关联规则数据见下表:
通过置信度的计算,删除小于最小置信度阈值的记录,得到最终的关联规则,见下表。
(二)决策树算法
应用决策树算法是将预测的内容用树的模型表现出来,树的根节点作为数据的结合空间,树的分支表现每一个分类问题,作为单一的属性测试存在,树的叶子节点是数据分割的分类,从根节点到叶子节点的路径就是相应的类别预测。
应用决策树算法要收集学生的基本个人资料、学生出勤情况,以及对课程的喜爱程度、上机练习情况与基础程度等,再结合学生的成绩进行分析,得到的数据用来指导教学工作,以提高教学质量。
高校中影响学生成绩的因素的决策树如下图:
依据决策树得到:上机情况最为影响学生的成绩,造成学生低下。教师可以决策树得出的结论为参考,加强学生管理工作,在上机情况上加以重视,重点解决成绩不理想的问题。
三、成绩分析中应用数据挖掘的优势
在学生的成绩分析中应用数据挖掘技术可以有效指导教学,提高对教学有益的信息,具体内容包括:
(一)帮助学校全面掌握学生的学习情况,通过数据挖掘对学生的成绩进行深层次的分析,了解学生对课程内容的实际掌握情况,便于对学生整体情况的掌握。
(二)有助于对课程相关性的分析,通过分析不同专业的核心课程,掌握学生对课程的理解程度、得分情况,进而得到课程之间存在的联系,便于学校合理地安排课程。
(三)通过数据挖掘得到学生入学时的成绩,再依据学生现在的成绩,将二者结合进行分析,得到学生这一学年的学习状况,得出课程对学生的影响,便于更好地指导学生学习。
四、结语
随着高校的不断发展,学生的成绩数据逐年增多,运用数据挖掘技术分析学生的学习成绩非常有必要。通过数据挖掘技术,发现相关数据间的联系,从而提高分析成绩效率,也在一定程度上使成绩的分析结果更准确更具科学性。在实际工作中,要将数据挖掘的众多方法结合起来运用,便于发现数据中的隐藏信息。高校要加强对学生成绩的分析,提高教学质量,保证教学目标的实现。
参考文献:
[1]朱明.数据挖掘导论[M].合肥:中国科学技术大学出版社,2012.
[2]郑岩.数据仓库与数据挖掘原理及应用[M].北京:清华大学出版社,2011.
[3]范明.数据挖掘概念与技术[M].北京:机械工业出版社,2012.
[4]刘美玲.树蕨挖掘在高校教学与管理中的应用[J].计算机工程与技术,2010.
[5]王耀.浅谈数据挖掘在教务管理中的应用[J].电子商务,2013.