魏艳
摘 要:随着信息技术的迅猛发展,大数据也无声无息地逐步地深入到我们的现实生活和工作学习中。教育大数据挖掘就是将大量的零碎的教育信息转化为对于我们有用的信息和知识。本文介绍了国内外教育数据挖掘技术的研究现状,總结了数据挖掘技术的关键技术及分析模式。
关键词:教育大数据挖掘;学习分析;关键技术;
根据IBM 公司最新估计,全球人类和计算机等硬件设备每天产生的数据量达到2.5EB(1EB=109GB=1015KB)。这些数据的来源是多元化的,比如:电子邮件、网页访问流量、博客、监控摄像机、气象传感器、学术研究、社交网络(QQ、微信)、学生数字档案袋,等等,这一切都在以前所未有的速度向我们袭来。教育领域的大数据从横向和纵向两个角度更加全面和真实地反映教育的实施背景、过程和结果。
1.国内外研究现状
美国新媒体联盟发布的2010年度和2011 年度《地平线报告》,都先后预言了数据挖掘技术将在未来的4到5年内成为各领域各行业发展的主导力量。Romero&Ventura;(2007)以及Baker &Yacef;(2009)对10 余年的教育数据挖掘研究进行了分析,归纳出5 类教育大数据挖掘的方法,它们是聚类;预测;关系挖掘;可视化技术等等。另外,随着教学管理系统的不断升级,开始了利用学习分析技术对学习者行为分析的研究,Romero,C.等人(2005)对Moodle 学习平台的日志分析就是应用了该模式。伴随人们在学习知识的过程中的深入分析和不断研究以及坚持不懈的深入实践,除了数据挖掘研究方法以外,那些本来是属于社会科学领域的方法,例如:话语分析、内容分析、社会网络分析等方法渐渐地变成了学习分析中非常重要的方法,这些技术中的最典范的一个应用就是师生交互行为分析。
在国内,伴随着各种教学资源的通过网络进行共享,越来越多的学习者可以自行制定一些适合自己的学习策略,通过网络也能够自由的进行在线学习和自主学习。
2.关键技术
在教育领域中,有两个技术非常重要,分别为:教育大数据挖掘与分析、学习分析。虽然这两个概念没有严格的区别,但它们已经有了不同的研究历史,并发展成为截然不同的研究领域。
2.1 教育大数据挖掘和分析
利用数据来作出决策并不是一件新鲜事,已广泛应用于商业领域。商业公司利用复杂的计算机算法来分析用户数据,被称为商业智能。商业智能技术能够从收集的数据中辨别过去的模式和规律,同样,也可以创建模型来预测未来的趋势和模式。
数据分析技术,从广义上讲,就是利用计算机科学技术、数学和统计学技术,从非常庞大的数据库中,集中提取有用的信息。关于数据分析的一个早期应用案例,就是利用相关数据来探索在线行为,即进行网站使用的分析,利用该工具,可以了解网页的整体访问量、访问者来自何处,以及是通过哪个链接访问本站的等等。网站分析还被人们用来了解、改善使用网站的体验的一种有效方式。不过,互联网公司现在已经开发出了更精细的技术,用来跟踪用户与网站之间的一些复杂交互行为,诸如此类的跟踪包括:在新技术影响下用户购买习惯的变化,电子书中被勾画、标记最多的段落,从浏览历史来预测可能感兴趣的网页,以及游戏玩家的行为是如何随着时间的变化而变化的等等。从理论层面上讲,在网络上的所有行为都能被跟踪和分析。
分析这些新的行为事件,需要利用的新技术正是大数据技术。大数据分析是商业智能的演进,它能解决传统数据库技术中来源广泛且数量庞大的非结构化文本、图形图像以及视频等数据。
教育数据挖掘是当前新兴的研究领域,它利用计算机和心理学方法来研究和了解学生是如何学习的。早期教育数据的挖掘主要是网站日志数据的挖掘,而如今的教育大数据挖掘技术通常强调分析碎片化的学习信息,并用自适应软件来进行干预。在建立自适应学习系统中,预测模型扮演一个非常关键的角色。
概括起来,教育数据挖掘构建模型可以回答以下几个问题:
1.何种主题顺序对一个特定的学生最有效?
2.何种学生行为与更多学习相关?
3.何种学生行为表示满意、投入或学习进步?
4.什么样的在线学习模式会更有利于学生的学习?
5.什么将预测学生学习成功?
2.2学习分析
2.2.1 学习分析要解决的问题
学习分析指的是通过对学生在学习进程中输出的各种信息进行分析、说明,认识并剖析学生在学习进程中产生的问题、并对学生的下一步的学习进行有效的指引。相关数据均来自学生的显性和隐形的行为,学习分析就是利用这些行为过程中产生的相关数据,通过教育大数据挖掘技术建立的模型进行准确的分析,从而来帮助教师更好地理解教与学的关系,以达到教学相长的目的。
与教育数据挖掘不同,学习分析不强调碎片化学习,而是更关注对教育系统的整体理解,并为人为决策提供支撑。因此,学习分析的重点是为教育资源的再分配提供决策支持,以适应不同学生的学习需求。
概括起来,学习分析系统应用模型能回答下列问题:
1.什么时候学生落在课程的后面?
2.何时学生存在不能完成的学习任务?
3.什么阶段学生不希望被干预?
4.什么课程最适合一个特定的学生向下学习?
学生是否需要学习顾问的帮助?
2.2.2 学习分析关键技术与主要工具
(1) 聚类.聚类是将大量不同的的数据分类聚集,聚集到不用类别的群的过程。聚类分析与传统的分类方法不同,它没有预定的标准,而是自动的划分为未知类别的过程。一般来讲,所运用的方法不同,那么最后所得到的结果也会不同。聚类分析经常使用的算法,一般分为以下几类:层次聚类算法、密度聚类算法、划分聚类算法、模型聚类算法和网络聚类算法。
(2)预测.根据已知的数据集或信息集表现出来的规律,构造每个数据类别的分类,并且建立相应的数据模型,来对数据的发展趋势或规律做出合理化预测。
(3)关系挖掘.关系挖掘是从大量的数据集合中发现他们之前存在的频繁的关系,并且利用这些事务性的关系和规律而进行的预测。关系挖掘进程一般分为两步:第一步,需要发现数据集合存在的频繁关系;第二步,挖掘出适合预测关联的规则。
(4) 可视化技术.可视化技术是利用直观化的图形、图表、图示等描述数据,让人们更加容易理解,从而更容易判断和区分数据。该技术的特别之处在于以图形、图表、图示等艺术性效果,来实现与人们的双向交流和沟通。可视化一般分为以下七个步骤,分别为:获取、分析、过滤、挖掘、表示、修饰和交互。截止到目前,可视化技术已成为教育大数据挖掘领域中不可缺少的一项重要技术。
3 结束语
大数据时代,教育領域的数据存量相当的庞大,教育领域中各类学习管理系统里的有关学习和学生的信息数据也逐渐地增多,利用数据挖掘技术将教育中存在的大量数据资源进行有效的提取,并以此来分析其内部的各种关联和各类规律,从而形成一套比较成熟的学习行为模式,在很大程度上会非常有助于学习者的个性化的自主学习以及教学效果的改善和教学质量的不断提升,以上这些已经成为教育教学变革中的重要依据。综上所述,教育大数据的挖掘随着信息技术的不断发展,已经成为当前人们关注的热点,在教育教学领域的应用也将会更加广泛,会更好地为教育教学变革和教学管理提供服务。
参考文献
[1]黄荷.今日谈:大数据时代降临[J].半月谈,2014,(17).
[2]顾小清,张进良,蔡慧英.学习分析:正在浮现中的数据技术[J].远程教育杂志,2013,(1).
[3]魏顺平.在线学习行为特点及其影响因素分析研究[J].开放教育研究,2014,(4).
[4]魏顺平.挖掘大数据时代下教育数据的价值[J].开放教育研究,2012,(4).
[5]胡祖辉,徐毅.大数据背景下高校教育数据的分析与应用研究[J].现代教育科学,2017,(1).
[6]李施,李艳华,赵慧琼.教育大数据挖掘技术与应用案例分析[J].中国教育网络,2017,(5).