数据挖掘如何应用于高校教学

2014-03-18 01:41刘巍董哲宇
中国教育网络 2014年11期
关键词:数据挖掘教学管理算法

文/刘巍 董哲宇

数据挖掘如何应用于高校教学

文/刘巍 董哲宇

随着高校教务管理信息系统应用的不断深入,其中存储的数据信息不断增多,如何充分利用这些数据,从中提取有效信息成为教育工作者日益关注的问题。数据挖掘的应用在一定程度上解决了这一问题。

教务管理信息系统已经普遍应用在我国高校教学管理中,随着其使用频率的不断上升,系统中积累的数据越来越多。教务管理系统中包含了教学所有环节的数据信息,包括专业计划、开设课程、课程安排、学生信息、学生选课、学生成绩等,具有数据量大、数据杂、蕴含信息多、数据表间相互关联多等特点。但现行大部分教务管理系统,除了进行简单查询、修改、单表统计功能外无法实现对数据的详细、高层次分析,很难发现数据中存在的规则,因此如何对这些数据进行重新利用,从中发现有价值的知识,已经成为教学管理人员关注的问题。

数据挖掘技术的功能与教育应用

数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,应用数据挖掘来进行教务数据处理,可以发掘其中蕴含的规律,把这些规律运用到教育教学管理中,将有助于教育教学改革,提高办学水平及管理水平。

数据挖掘技术从一开始就是面向应用的,但在教育领域,数据挖掘还是一种全新的技术。它关注从教育环境产生的数据中发现隐含的知识,这些数据可以是从历史的或者正在运行的教育系统数据库中获得;它的主要作用是对数据库中的大量数据进行抽取、转换,通过数据分析发现其中隐藏的模式、关联、数据反常等对教育和教学决策的起到积极作用的关键性数据。数据挖掘更主要是为教学决策提供真正有价值的信息,进而获得更好的教学效益,例如利用数据挖掘分析结果可以改进教学效果,提高学生成绩,找到影响教师教学和学生学习的因素。随着这项技术的成熟,其在高校教学、管理中的应用更加广泛。

在数据挖掘教育实践应用过程中需要选择合适的数据挖掘功能建立对应模型来解决问题,数据挖掘的主要功能包括分类、估计、预测、关联、聚类、描述和可视化等,通过文献调研发现目前在教育教学管理中应用的主要有分类、预测、关联、聚类等。

分类是最常见的数据挖掘功能之一,分类过程实际上是建立某种模型,然后将其用于对未分类数据进行分类。决策树、最紧邻技术、神经网络等都是最常用的分类技术。

预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类和特征进行预测。预测关心的是精度和不确定性,如由学生以往课程成绩预测学生转专业或学籍异动情况。预测通常使用回归分析、时间数列分析和人工神经网络等方法。

关联是要发现大量数据之间有趣的关联或相关联系,从而为某些决策提供必要支持,它是数据库中存在的一类重要的、可被发现的知识,被广泛应用于决策支持系统。例如,从学生选修课程的倾向可以了解学生需求从而为课程开设提供参考。

聚类是把一组个体按照相似性归成若干类型,它的目的是使同一类别之内的相似性尽可能大,而类别之间的相似性尽可能小。聚类技术主要包括传统的模式识别方法和数学分类学,例如,将成绩好的和成绩不好的学生分别聚类,分析不同类型学生特点。

在国外高校教育教学管理中的应用

在国外高校的教育教学管理中,数据挖掘技术应用比较普遍,己成为提高教学管理质量和教学水平的有力工具。例如美国的学校能够以85%的准确度预测学生的升学率,这样学校就可以把注意力集中那些容易辍学的学生身上,此外数据挖掘还被用于评价学生学习成果、指导学生课程选择等多个方面。

表1中呈现了数据挖掘技术在国外高校教育教学管理中最常应用的几个领域的简单概括。表中根据教育教学环节进行划分,按照数据挖掘所选取的数据内容,数据挖掘功能选择、分析的内容、希望达到的效果等方面呈现数据挖掘在招生、计划、咨询、教学运行过程、学籍等多个环节及其子环节中的应用情况。

表1 数据挖掘在国外高校教育教学管理中应用

在国内高校教育教学管理中的应用

我国高校中对数据挖掘技术的应用起步较晚,但进入21世纪后发展相当迅速,已经开始应用于教育教学管理的各个方面。在国内教育研究领域主要利用数据挖掘进行计划、学籍管理、教学运行过程、招生、就业等数据的深层分析。表2中是通过文献研究,对国内高校数据挖掘教育教学数据挖掘技术在教育教学管理中应用分析及建议。

从表2以及数据挖掘在高校教育教学应用的相关文献中我们可以发现,数据挖掘在我国高校教育教学管理领域应用中存在如下特点及问题。

1.数据挖掘在教育层面上的研究处于发展的初级阶段,但发展速度很快,已经应用于招生、就业、教学计划安排、课程安排、课程相关性分析、学生评价等多个方面,而且应用领域还在不断扩展。

2.采用的数据挖掘算法较单一,多数采用分类的决策树算法或关联规则Apriori算法,很少能将多种算法结合起来综合分析应用。

3.多数研究停留在理论阶段,实际应用较少。国外的数据挖掘教育领域研究注重实践应用,注重结果推广及根据挖掘结果改进教育教学,注重其能对教育教学高效发展的贡献,而中国高校目前关于数据挖掘教育应用的研究多停留在理论阶段,多数研究分析了数据挖掘在教育数据分析应用中的可行性、可以应用的具体领域、可以分析的内容等信息,但具体的实践操作较少。具体实施数据挖掘的研究,将其结果推广到教育教学实践应用的较少。

表2 对国内高校数据挖掘教育教学数据挖掘技术在教育教学管理中应用分析及建议

4.选取数据量不足,覆盖范围小。已有研究中大多选取学校中某一个专业或者一两个班级的学生信息进行挖掘分析,没有面向全校更广泛的区域,数据挖掘的数据量及受众面受到一定影响。

综上分析,在中国高校教育教学中数据挖掘的具体应用的深入和广度都有待提高,在今后的应用中可以在以下方面加以改进;

1.根据学校特点选择数据挖掘算法。每一类数据挖掘功能中都有多种实现算法,因此在实践应用中应从学校数据情况、挖掘目的、算法特点等方面综合考虑,选择符合学校实际的数据挖掘算法。

2.注重数据采集。由于教务数据量大且杂,因此在进行具体问题挖掘时,至少应选取2~3个学年的同类数据,才能保证得到较好的结论。

3.关注挖掘结果的实践应用。在根据研究内容,完成数据挖掘得出指导性结论后,应将结论应用于实践,并选取后续对应数据进行分析或进行问卷调查以检验挖掘结论的正确性,同时根据验证情况对建设意见进行修改,这样才能更好地利用数据挖掘指导教育教学改革。

(作者单位为北京工业大学教务处)

猜你喜欢
数据挖掘教学管理算法
教学管理信息化问题研究
探讨人工智能与数据挖掘发展趋势
新时期高中教学管理改革与实践
谈教学管理的艺术
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
Travellng thg World Full—time for Rree
进位加法的两种算法
一种改进的整周模糊度去相关算法
一种基于L-M算法的RANSAC图像拼接算法
高级数据挖掘与应用国际学术会议