李彤彤,黄洛颖,邹 蕊,武法提
(1.天津师范大学 教育科学学院,天津 300387;2.北京师范大学 信息网络中心,北京 100875;3.北京师范大学 教育学部 教育技术学院,北京 100875)
基于教育大数据的学习干预模型构建*
李彤彤1,黄洛颖2,邹 蕊3,武法提3
(1.天津师范大学 教育科学学院,天津 300387;2.北京师范大学 信息网络中心,北京 100875;3.北京师范大学 教育学部 教育技术学院,北京 100875)
学习分析是利用预测模型及学习过程中产生的数据,分析、预测学习者未来表现并发现潜在问题以实施干预的技术。在学习分析过程中,学习干预作为与教学过程直接相联的部分,是改善、提升学习成效的关键。然而,当前国内外已有的学习干预方面的相关研究大多从微观层面上列举了部分干预措施,缺乏整体性和系统性的考虑。该研究构建了基于教育大数据和学习分析的、以干预引擎为核心的“状态识别—策略匹配—干预实施—成效分析”四环节循环结构干预模型,该模型主要关注学习者的学习风格类型、学习进度水平、学习互动水平、学业成就水平四方面的状态特征,并针对这四方面的状态水平设计了具体的干预策略、干预时机以及干预方式,以期为在线学习环境中的学习干预理论研究与实践应用提供参考。
干预模型;干预策略;学习分析;教育大数据
学习分析技术作为一种能够在海量数据中提取隐含、潜在应用价值信息的工具,可以对学习者、教师、管理部门等相关利益方进行干预支持,改善对教与学的理解,促进和优化学习效果和环境,进而提升数字时代的教育内外部效益[1]。西蒙斯指出,学习分析是运用智能数据、学习者产生的数据及分析模型,来发现信息和社会联系并预测和建议学习的技术[2]。从学习分析的定义中可以看出,学习分析不仅是判定学生是否处于危险之中,更重要的是依据分析结果进行适当的干预,为学生提供个性化指导,对有风险的学生进行干预,使之顺利完成教学目标[3]。干预是学习分析技术改善、提升学习者学习成效的最直接环节,对保持学习状态至关重要[4]。如何进行适时适当的干预、构建能够有效提高学习效果的干预模型已经成为学习分析领域的重要议题。
有研究者指出,学习干预的相关研究非常重要但是很少被关注[5]。目前对于学习干预的研究大多是从分类的视角出发,在微观层面上提出了几种常见的干预方式,还远不够深入和系统。本研究在分析国内外学习干预相关研究的基础上,梳理了已有的干预方式和干预内容,构建了基于教育大数据分析的、以干预引擎为核心的“状态识别—策略匹配—干预实施—成效分析”四环节循环结构干预模型,以期为学习干预的理论研究与实践应用提供参考和借鉴。
1.学习干预的界定
在传统教学领域,学习干预一直作为一个约定俗成的概念存在着,它包括一切对学习者学习产生影响的介入手段。但是,随着学习分析技术的发展,基于教育大数据的学习干预需要有别于传统教学环境下的干预手段,由此学习干预的概念再度引起教育技术研究者的关注。张超在对教育教学中干预特征分析基础上,对远程教学环境中的学习干预进行了如下界定[6]:“学习干预是学习服务提供者为改善学习者学习绩效和解决学习问题而针对学习者采取的各种间接的接入性策略与行为的综合,其最终目的是帮助学习者发展特定的知识、技能和态度。”陈珊指出[7],学习干预是立足于学习者出现的各种困难和难题,更有针对性地为其提供的各种支持,包括资源和活动等。
在本研究中,我们以学习分析技术为基础和依据,探讨基于教育大数据的学习干预模型的构建。作为教育大数据重要应用之一,学习分析可以通过分析学习者的学习情况等过程数据,构建学习者学习行为预测模型,进而获得并预知学习者的学习状态,如学习进度、学习路径等[8-10]。由此,我们将学习干预界定为“为了帮助学习者克服学习困难、顺利完成学习,以基于学习过程的教育大数据的分析为基础,针对每位学习者的具体学习状态而实施的各种支持性策略和指导性活动的综合。”
2.学习干预的方式
对于学习干预的方式,李艳燕等[11]进行了系统深入的研究,从干预的性质、规模、主体等维度区分了干预的内容。从性质的角度,干预可以分为教学和社会干预,教学干预指一切教学元素的干预,如学习路径建议、学习资源推荐等,而社会干预指学习心理疏导、伙伴推荐等;根据干预的规模,干预可以分为个人和班级干预;根据干预的主体,干预又可以分为人工和自动干预,人工干预主要应用于传统课堂教学,教师发现问题后,直接对学习者进行教学干预,例如增加练习、谈话,调整授课方式和学习活动等,而自动干预主要指非正式学习或混合学习中技术支持下的干预,如个性化学习系统或自适应学习系统实施的干预,教师利用设备对学习者移动终端进行干预等。张超[12]则将干预目标群体和干预形态视为干预分类体系的基本变量,并综合这两个维度,提出了“学习干预的二维分类框架”,得出了四类不同的学习干预方式,即个体化—结构化,个体化—非结构化,集体化—结构化,集体化—非结构化。此外,也有研究者针对教师主导和学生自主学习两种教学模式提出了不同的干预机制[13]。
3.学习干预的具体方法
随着学习分析技术在教育大数据中应用研究的不断深入,研究者在实践应用领域中也开展了关于学习干预具体方法的相关研究。如普渡大学的“信号项目”致力于从学习管理系统、课程管理系统、课程成绩簿中收集信息来划分危险学生的层次,并用绿色、黄色和红色来标示危险等级,并针对处于“危险”状态的学生进行个别化指导[14]。北亚利桑那大学的评价绩效状态系统能够收集学习者在课堂中的表现评级,并通过邮件发送给学习者,邮件主要包括出勤情况、学习成绩和课业问题三类[15]。在开放学术分析项目中,学习者的学习数据经过学习分析处理后,形成学术警告报告,被识别为处于危险状态的学习者将会获得系统提供的自动干预,共有两种,即警告信息和参加在线学术支持环境[16]。其中,警告信息针对那些对于顺利完成课程任务存在风险的学生,警告信息的内容包括学习现状、详细学习建议和指导等。要求参与在线学习支持环境的学生,将进入一个在线学习支持网站,其中包含可汗学院视频、Flat World开源教科书等开放教育资源,同时他们还会得到来自同伴或专业教学人员提供的学习指导。当学生多次处于危险状态时,警告信息将会变得越来越严厉。
4.学习干预模型的提出
干预模型从系统和整体的角度指导整个干预过程的设计与实施,对于干预过程的顺利开展和干预目标的实现都起着重要的指导作用。当前关于学习干预理论层面上的研究,较多地探讨了设计干预措施的基本原则、建议,以及微观层面的干预方式及内容,还没有较为系统和完整的干预模型。实践层面上,已有的项目和系统通过自动、半自动等方式实现了有效干预,其中涉及的干预机制等为本研究设计干预模型提供了借鉴和参考。
基于对已有研究的综合分析,我们提出了如下图所示的基于教育大数据的学习干预模型,该模型以干预引擎为中心,以发现学习者的学习困难、提升学习者的学习效果为目标,包括学习者学习状态识别、干预策略匹配计算、干预策略实施、干预效果分析四个循环的环节。
基于教育大数据的学习干预模型图
(1)干预引擎是模型的核心,起着关键的调控作用,它监控着每一环节的实施状态,并适时对干预过程进行调整,以保证干预朝着有效的目标进行。
(2)对学习者学习状态的准确识别和判断,是干预策略选择和实施的起点和关键环节。学习者状态识别是指基于教育大数据来获取学习者的状态信息,识别出学习者学习状态的关键特征,从而定位学习者的学习阶段,判断学习者的学习状况。基于教育大数据的学习分析技术能够有效地支持教师收集、分析、输出学习者相关教育大数据并得出其学习状态,如学习任务完成情况、学习内容掌握情况等,从而为学习者状态识别提供有效的支持。
(3)干预策略匹配计算是指依据学习者学习状态的关键特征,从干预策略库中筛选相关的干预策略,并与学习者学习状态的关键特征进行匹配计算,得出匹配度较高的最佳干预策略。匹配合适的干预策略是干预实施效果的重要保障,干预策略匹配计算又依赖于存储的干预策略,因此,学习干预模型构建的关键是设计干预策略库与匹配机制。
(4)干预策略实施是指根据最佳干预策略,以恰当的干预方式,将合适的干预内容推送给学习者。
(5)干预效果分析:干预是一个系统性的、循环往复的过程。干预模型始于经过学习分析得出的学习者学习状态数据,然后判断识别学习者学习状态的关键特征,同时从干预策略库中筛选相关的干预策略,并与学习者学习状态的关键特征进行匹配计算,将匹配度较高的干预策略(包括干预方式及具体干预内容)推送给学习者,实施干预策略后,干预引擎将持续跟踪学习者的学习状态,一方面是判断已实施干预策略的效果,另一方面是及时发现学习者新的学习状态以备选择并实施新一轮的干预,依次循环往复。
学习者学习状态的准确识别是干预策略准确选择且有效实施的必然前提。随着数字化学习的普及和流行,教育领域已经部署了众多的学习管理系统,学习者在各种学习终端的支持下的各类学习系统中都产生并保留了大量的学习记录[17][18]。这些记录中隐藏着有关学习者的大量的多维的信息,通过恰当的技术对这些数据进行聚类与分析,可以获得、跟踪和掌握学习者的不同学习特点、学习需求、学习基础和学习行为等不同类型的数据[19],从而能够为学习者的状态识别提供依据。
1.教育大数据的获取与分析方法
教育大数据得以有效利用的根本前提是首先能够基于技术手段获取到教育大数据,并将数据获取并加以分析,从而获得对学习者有用的关键信息。目前已有众多研究者对教育大数据的获取进行了研究,为基于教育大数据应用的相关研究提供了思路。牟智佳[20]提出电子书包中教育大数据的获取来自于数据捕获、多感知数据和实时传感数据三个方面,可以通过多个软件实现对多种数据的记录。顾小清等[21]将学习者在学习过程中的学习行为、学习活动、学习进程以及与之交互的学习环境等数据概括为学习者的学习经历数据,并利用“活动流”来描述学习经历及用Statement记录学习经历的方式来获取学习者的学习数据。而对教育大数据的分析,目前常用的方法包括内容分析法、社会网络分析法和回话分析等。
2.学习者学习状态数据及水平识别
要准确地识别学习者的状态,需要有针对性地收集教育大数据。那么为了实施有效的学习干预,需要获取哪些数据?我们对已有的在线学习者学习行为及学习模型的相关文献进行了调研分析,孟玲玲等[22]从学习分析工具的角度,提出要对学习者的学习进度等网络学习数据、知识建构过程等学习内容数据、学习能力和学习水平等学习能力数据、学习轨迹及特征等学习行为数据进行分析,从而准确地获得学习者的学习状态特征。李艳燕等[23]提出应通过分析教与学过程的交互数据、教学资源数据、学习者之间的网络关系数据、学习者的特征数据、学习者行为与情感数据等来表征学习者学习特征。许陵等[24]从生物信号的角度,分析学习者在学习过程中的心理和生理状态,用以观测学习者注意力下降或者出现疲劳等学习状态。
学习过程中,学习者往往会在多个方面有不同的表现,在本研究中,我们主要考察学习者的学习风格、学习进度、互动水平、学业成就四个方面的状态水平,相应地,主要采集学习者的以下数据,如表1所示。
表1 学习者状态数据及状态水平判定
(1)学习风格类型识别是干预引擎采用某种算法,基于量表采集的数据以及学习者的浏览记录等学习风格相关的数据综合判断,将学习者定位为不同的学习风格类型。
(2)学习进度水平识别是指干预引擎基于学习者的学习路径、学习内容等数据,判断学习者的学习进度。
(3)学习互动水平识别是指干预引擎综合学习者的交互频率、交互内容、社会网络关系三方面的数据,判断学习者的交互频率、交互深度、交互广度三方面的互动水平。其中,交互频率是指学习者参与互动的次数,可以通过如登录次数、发帖次数等数据反映出来;交互深度则包括学习者所发表的交互内容的质量,可以通过对交互内容的内容分析得到的结果反映出来;交互广度是指学习者在交互过程中所形成的社会网络的规模以及学习者在社会网络中所处的位置,可以通过交互的社会网络分析得出。
(4)学业成就水平识别包括对学习者整体成绩水平的判定和学习薄弱点的记录,整体水平通过学习者的成绩数据来反映;学习的薄弱点则根据学生在某个知识点的学习时长以及错题记录来判定。
在识别学习者状态的基础上,干预引擎会针对学习者的具体状态从策略库中选择并计算最优匹配的干预策略,以对学习者进行有效地干预,帮助学习者将学习状态调整到更为优化的水平。因此,干预策略库的设计对于实施有效干预并提升学习成效起着至关重要的作用。我们首先针对四个方面的学习者状态,给出了具体的干预策略、不同策略的干预时机以及干预方式,如表2所示。
表2 干预策略设计
从表2中我们可以看到,干预策略匹配的重点在于一方面将学习者的学习状态可视化,可视化的目的在于让管理者、教师和学习者都能清楚地了解学习者所处的状态,可视化的方法则多种多样,如学习进度条、完成百分比、目标达成程度、学习路径图、社会网络图谱、薄弱知识点列表、成绩分布图、成绩排名、参与互动的次数显示、发言质量评价等;另一方面,干预引擎会根据学习者的状态来进行干预,具体的干预方式包括提醒、推荐/推送、会话的方式,其中可以采用消息、邮件、页面弹出窗口来对学习者进行适时的提醒;推荐/推送则是指智能地根据学习者的状态向学习者推送相关的资源、学习建议指导、学习工具、学习伙伴等;会话则是指由智能机器人或教师与有学习困难的学生进行文字、语音或视频的会话,以半人工或人工的方式进一步了解学生的学习状态和困难,以采取更为有效的干预措施。
当然,在实际的情形中,学习者的这四个方面状态并不是孤立的,干预引擎在整个过程中始终持续地同时监控着学习者在这几方面的状态水平,并在恰当的时机给学习者提供相应的干预。
1.干预策略实施
为学习者匹配合适的干预策略后,干预引擎将向学习者实施干预。实施干预可以采用自动干预、手动干预两种方式。自动干预是由干预引擎或干预系统自动完成的,实施过程不需要教师等人员的参与,但需要教师将干预策略的实施规则进行设计,如干预策略所面向的受众范围或辐射区间、干预实施的时间、频率及频次等。手动干预是指干预实施的过程由教师等教学相关人员手动完成的,如向学生发送个性化学习指导、建议等信息。随着干预引擎的不断智能化、学习者数据的大量堆积、干预策略的逐渐丰富,干预策略将更多地由干预引擎自动实施,达到科学、及时、准确的干预效果。
2.干预效果分析
干预引擎向学习者实施干预后,学习者将会收到相应的干预,并按照干预要求去改进或加强学习。干预引擎将继续跟踪学习者的学习状况,分析、评价干预策略的实施效果,一方面,将实施效果作为一个属性填充到干预策略库中对应策略的属性中,为后续类似的干预策略匹配计算提供参考;另一方面,依据实施效果,干预引擎将进行是否需要再次干预的判断,如果实施效果良好,即学习者的学习状况得到了改善,干预引擎则开始追踪学习者新的学习状态,如果干预策略实施效果较差,学习者学习状况依然不乐观,干预引擎将进行二次干预,依次循环往复。
在线学习环境下学习干预的目的是促进学习者学习目标的达成,它应当建立在对教育大数据的挖掘、分析基础上,并以识别学习者的学习状态作为干预的起点,同时针对学习者的学习状态适时地采用恰当的方式进行干预。而且,干预过程是一个循环往复的过程,需要对学习者学习过程和状态的持续跟踪、分析与判断。本研究设计四环节的循环结构干预模型,同时对学习者状态识别以及干预策略进行了细化设计。但是,对于其中教育大数据的具体采集方法、干预策略的具体实施方法,本研究还缺乏详细设计,这也是下一步研究的方向所在。
[1] 胡艺龄,顾小清,罗九同,陈婧雅. 教育效益的追问:从学习分析技术的视角[J].现代远程教育研究,2014,(6):41-48.
[2] Siemens, G., & Baker, R. S. J. d. Learning Analytics and Educational Data Mining: Towards Communication and Collaboration [A].Simon Buckingham Shum. Proceedings of the Second International Conference on Learning Analytics & Knowledge[C]. New York: ACM,2012.252-254.
[3][14] 李逢庆,钱万正.学习分析:大学教学信息化研究与实践的新领域[J].现代教育技术,2012,(7):5-10.
[4][6][12] 张超.教师远程培训的学习干预研究[D].上海:华东师范大学,2010.
[5] Clow, D. The learning analytics cycle: closing the loop effectively [A].Simon Buckingham Shum. Proceedings of the Second International Conference on Learning Analytics & Knowledge[C]. New York: ACM,2012.134-138.
[7] 陈珊.促进问题解决的学习干预设计与应用研究[D].上海:华东师范大学,2014.
[8][18] 刘凤娟.大数据的教育应用研究综述[J].现代教育技术,2014,(8):13-19.
[9][17] 魏顺平.学习分析技术:挖掘大数据时代下教育数据的价值[J].现代教育技术,2013,(2):5-11.
[10] 徐鹏,王以宁,刘艳华,张海.大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013,(6):11-17.
[11][23] 李艳燕,马韶茜等.学习分析技术:服务学习过程设计和优化[J].开放教育研究,2012,(5):10-24.
[13] 曹晓明,朱勇.学习分析视角下的个性化学习平台研究[J].开放教育研究,2014,(5):67-74.
[15] 李青,王涛.学习分析技术研究与应用现状述评[J].中国电化教育,2012,(8):129-133.
[16] Sandeep M. Jayaprakash, Erik W. Moody, Eitel J.M. Lauría, James R. Regan, Joshua D. Baron. Early Alert of Academically At-Risk Learner: An Open Source Analytics Initiative[J]. Journal of Learning Analytics, 2014,(1):6-47.
[19] 姜强,赵蔚,王朋娇,王丽萍.基于大数据的个性化自适应在线学习分析模型及实现[J].中国电化教育, 2015,(1):85-92.
[20] 牟智佳.电子书包中基于教育大数据的个性化学习评价模型与系统设计[J].远程教育杂志,2014,(5): 90-96.
[21] 顾小清,郑隆威,简菁.获取教育大数据:基于xAPI规范对学习经历数据的获取与共享[J].现代远程教育研究,2014,(5):13-23.
[22] 孟玲玲,顾晓清等.学习分析工具比较研究[J].开放教育研究,2014,(4):66-75.
[24] 许陵,冉新义,陈梅芬.基于生物信号的远程学习过程监控系统研究[J].现代远程教育研究,2014,(5): 105-112.
责任编辑:李馨 赵云建
The Construction of a Learning Intervention Model Based on Big Data Analytics
Li Tongtong1, Huang Luoying2, Zou Rui3, Wu Fati3
(1.College of Education, Tianjin Normal University, Tianjin 300387; 2. Information and Network Center, Beijing Normal University, Beijing 100875; 3.Faculty of Education, Beijing Normal University, Beijing 100875)
Learning analytics aims to analyze and predict learners’ future performance, find potential problems and implement intervention according to the prediction model and big data generated in the learning process. As it is attached directly to teaching process, learning intervention is the key to improve learners’ learning performance. However, most of existing researches on learning intervention propose intervention measures from micro-level, lack of systemic and integral consideration. This paper constructs a learning intervention model based on learners’ big data analytics, which is a loop structure with intervention engine as its core. The intervention model consists of four parts: learners’ status identi fi cation, intervention strategy matching, intervention implementation,and intervention effectiveness analysis. As to learners’ status, the model mainly focus on learning style, learning progress, interaction level, and learning performance. We also propose the typical intervention strategies, intervention occasion, and speci fi c intervention means according to learners’ status level in this model. The signi fi cance of this model is that it can provide reference for academic research and practical application of learning intervention in online learning environments.
Intervention Model; Intervention Strategies; Learning Analytics; Big Data
G434
A
1006—9860(2016)06—0016—05
李彤彤:博士,讲师,研究方向为数字化学习环境与学习分析(sdltt@126.com)。
黄洛颖:硕士,研究方向为教育大数据应用(huangluoying2008@126.com)。
邹蕊:在读硕士,研究方向为网络教育应用。
武法提:教授,博士生导师,研究方向为数字化学习环境与学习资源设计。
2016年2月16日
* 本文系2014年全国教育科学“十二五”规划教育部重点课题“基于教育大数据的学习分析工具设计与应用研究”(课题编号:DCA140230)研究成果。