摘 要:随着移动学习和在线学习的普及,教育数据也进入了大数据时代,教育大数据应用一般有教育数据挖掘和学习分析两类。文章分析了教育数据挖掘的工作流程和常见数据挖掘技术,探讨了学习分析关键技术,分析了自适应系统并总结出该系统会越来越受欢迎。
关键词:大数据;教育数据挖掘;学习分析;自适应系统
作者简介:王若明(1979— ),男,湖北荆州人,讲师,高级项目经理,信息系统项目管理师,硕士;研究方向:大数据。
随着互联网、物联网、云计算技术的发展,社会进入了大数据(Big Data)时代。在教育界,大规模开放式在线课程(Massive Open Online Courses,MOOC)的推广、以智能手机为代表的移动学习的普及,使数据呈爆炸性的增长,形成了教育大数据。大数据一般有3V特征:大规模性(Volume)、多样性(Variety)和高速性(Velocity)[1],目前教育大数据应用主要有教育数据挖掘和学习分析两类。
1 教育数据挖掘
数据挖掘(Data Mining)的作用是从数据中获取隐藏的模式与知识,教育数据挖掘是从教育大数据中获取隐藏的模式与知识。教育数据挖掘应用了计算机科学与教育学的理论和技术,可以促进学生有效学习,改进和优化教学资源和教学顺序,判断学生的学习趋势。
1.1 工作流程
数据挖掘一般有预处理、数据挖掘和评估3个阶段。教育数据挖掘是在教育环境下进行数据挖掘,包括教育环境、数据、预处理等,工作流程如图1所示。
图1 教育数据挖掘工作流程
1.2 常见数据挖掘技术
常见数据挖掘技术有关联规则、聚类分类、协作过滤等。
(1)关联规则技术,找出数据集中相关数据项之间隐藏的依赖关系,最终用关联规则的形式表示。最经典的案例是沃尔玛超市“尿布与啤酒”故事,经典的算法有Apriori等。
(2)聚类分类技术,根据数据的相似程度,将数据集中分成许多组,组内数据具有较高的相似度,组外数据几乎不相似,该技术的特点是无监督学习,有K-meas等算法。
(3)协作过滤算法(Collaborative Filtering,CF),挖掘与用户兴趣相似的邻居用户,同时将邻居用户喜欢的对象推荐给用户,CF利用“用户—项目评分矩阵”对用户兴趣进行建模。
2 学习分析
学习分析是测量、收集、分析和报告有关学生及其学习环境的数据,用以理解和优化学习及其产生的环境的技术[2],对后续的学习给予预测与建议。目前流行的学习分析关键技术有网络分析法、话语分析法和可视化技术等。
网络分析法主要研究兩部分:节点和节点间的联系,在教育环境中,利用网络分析法来分析学习者之间的联系对其学习效果的影响,目前网络分析法工具有很多,如SNAPP,Gephi,UCINET等。
话语分析法是研究人们交流过程中使用的话语,即基于语言学的话语分析,在教育环境中,主要是研究学习过程中学习者学习交流所使用的话语。话语分析法可以应用不少工具,如WMatrix和Wordle等。
可视化技术是利用计算机的高速运算和处理能力,从海量数据中发现相关规律,并用散点图、思维导图、动态热度图等图形向用户呈现,帮助用户分析。
3 自适应学习系统
自适应学习系统是教育数据挖掘和学习分析两类技术的综合应用,利用在线学习系统(如“学堂在线”等MOOC平台)内存储的学习行为数据,结合教育数据挖掘和学习分析两项技术,为学习者提供高效的学习资源,也为教学中的其他相关人员提供帮助,提高教学效果和改善教学流程[3]。
3.1 工作流程
自适应学习系统有6部分:内容传递模块、学习者数据库、预测模块、显示模块、自适应模块和干预模块,其流程如图2所示[4]。
3.2 自适应方法
自适应学习系统最关键是生成自适应方法,本文研究的自适应方法均是基于模型的。
Alferez等[5]基于非功能性要求(Non-Functional Requirement,NFR)模型,是对非功能性需求进行建模与分析,并进行精化分解,另外在模型中添加了“度量标准”,这些标准一一对应非功能性目标。
Alferez等[6]研究了基于目标模型,目标模型不仅描述系统的功能需求,还描述系统的非功能需求。在该模型中,目标分解成一个个子目标,子目标代表一种方案,许多子目标可以组成一个个合适的自适应方案。
Elkhodary等[7]研究了基于特征模型,对功能性需求进行建模,一般用特征模型来建模软件配置的空间,自适应操作其实是组合一系列合适的特征。
Pietschmann[8]研究了基于体系结构模型,对系统的构件与构件之间的交互进行建模,构件一般代表系统的主要计算元素,也可以代表系统的数据存储。
4 结语
现在,教育数据挖掘和学习分析技术在教育中的应用,受到很多学习者的热爱,随着大数据技术的发展,尤其是在线教育的推广,自适应学习系统或个性化学习模式会越来越受欢迎。
[参考文献]
[1]孟小峰.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013(1):146-169.
[2]SIEMENS G.What are learning analytics[EB/OL].(2010-08-25)[2019-12-20].http://www.elearnspace.org/blog.
[3]李艳燕,马韶茜,黄荣怀.学习分析技术:服务学习过程设计和优化[J].开放教育研究,2012(5):18-24.
[4]徐鵬.大数据视角分析学习变革:美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013(6):11-17.
[5]ALFEREZ G H,PELECHANO V.Context-Aware autonomous Web services in software product lines[C].Beijing:International Software Product Line Conference,2011.
[6]BENCOMO N,BELAGGOUN A.Supporting decision-making for self-adaptive systems:from goal models to dynamic decision networks[C].Springer:International Conference on Requirements Engineering:Foundation for Software Quality,2013.
[7]ELKHODARY A,ESFAHANI N,MALEK S.Fusion:a framework for engineering self-tuning self-adapive software systesms[C].Santa Fe:Proceedings of the 18th ACM SIGSOFT International Symposium on Foundations of Software Engineering,2010.
[8]PIETSCHMANN S.A model-driven development process and runtime platform for adaptive composite Web applications[J].Journal on Advances in Internet Technology,2010(2):277-299.
Design of education big data adaptive system based on data mining and learning analysis
Wang Ruoming
(Department of Computer Science, Guangdong Huali Technician College, Guangzhou 511325, China)
Abstract:With the popularization of mobile learning and on-line learning, education data has also entered the age of big data. This paper analyzes the working process and the common data mining technology of educational data mining, discusses the key technology of learning and analysis, analyzes the self-adaptive system and summarizes the more and more popular the system.
Key words:big data; educational data mining; learning analysis; adaptive system