基于大数据的学习分析研究综述

2017-05-30 13:57郭炯郑晓俊
中国电化教育 2017年1期
关键词:理论框架学习分析应用研究

郭炯 郑晓俊

摘要:随着大数据时代的到来,不断涌现的海量学习数据需要使用新的方法与工具进行处理,学习分析应运而生并成为教育研究与应用领域的热点问题。该文基于文献分析法,对国内外2010年以来关于学习分析的期刊论文进行梳理,根据研究重点不同分为理论框架、模型研究、学习分析技术基础、学习分析工具、应用研究、面临挑战等六大类,并对每一类的重要研究成果进行了梳理与介绍,以试图呈现该领域的整体脉络。在此基础上,提出学习分析发展中亟待解决的问题包括理论基础与理论框架的明确、学习分析相关标准的建立等。

关键词:大数据;学习分析;理论框架;学习分析工具;应用研究

进入21世纪以来,伴随着移动互联网技术、云计算、物联网技术的发展,大数据应运而生,其研究与应用不断向前发展。2011年6月,世界知名咨询公司麦肯锡发布了《大数据:创新、竞争和生产力的下一个前沿》报告,系统阐述了大数据的概念、核心技术、应用领域,引发了各行各业对大数据的关注。维克托·迈尔·舍恩伯格及肯尼斯·库克耶在其2012年出版的著作《大数据时代》中指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据的核心就是预测,它将为人类的生活创造前所未有的可量化的维度,并且已经成为了新发明和新服务的源泉。我国政府在2015年8月发布了《促进大数据发展行动纲要》,以推进大数据产业发展,深化大数据在各行业的创新应用。大数据在教育领域的应用,正不断推动着教育信息化变革的进行。美国联邦政府教育部技术办公室于2012年4月10日发布《通过教育数据挖掘和学习分析改进教与学:问题简介》,指出在教育中有两个特定的领域会用到大数据:教育数据挖掘和学习分析。

在线学习、云计算出现之前,人们已经开始对教育数据进行收集、分析与利用。20世纪90年代,在智能导师系统(ITS)研究中,研究者和设计者已经开始应用复杂的学习分析方法,这些数据分析的方法被沿用到后来的在线学习环境中。ITS的研究者中,聚焦于研究学生学习过程数据的提取与阐释的部分学者,与关注其他种类学习过程数据的研究者共同建立了国际教育数据挖掘协会,并于2008年召开第一次会议,其协会杂志《教育数据挖掘》于2009年出版了第一期。因此,教育数据挖掘的相关研究可以看作从ITS时代就已经开始了。另外,随着大数据时代的到来,不断涌现的海量学习数据需要使用新的方法与工具进行处理,学习分析应运而生。学习分析作为一个新的研究领域,其研究者关注学习过程与学习环境大数据的处理、在线学习环境设计、学习理论的发展以及在线数据使用中的伦理问题。2011年召开了第一届国际学习分析与知识大会,同年成立了学习分析研究协会(Society for Learning Analytics Research,简称SoLAR)。

一、研究方法

本研究基于文献调研,以“学习分析”为关键词,在CNKI数据库中,以“核心期刊”为筛选条件,检索得到结果89个,手动排除与本研究相关度较低的结果9个,得到期刊论文80篇。利用CiteSpace对80篇论文进行关键词分析,得出与“学习分析”共同出现频数最高的关键词包括“数据挖掘”“大数据”“MOOC”“教育数据挖掘”“教育大数据”“学习行为”“个性化学习”“在线学习”“可视化”“智慧学习”“电子书包”“教学设计”“分析模式”等,结合对论文标题、摘要的梳理,发现国内关于学习分析的研究多集中在理论引介、研究综述、应用模型设计与论证等方面,实证性研究仍属少数。在SSCI数据库中,以“Learning Analytics”为关键词检索,限定领域为“教育与教育研究”,共得到结果387个,将记录导出至Histsite中进行引文关系分析,共得到核心被引文献16篇,其研究内容分布在学习分析的理论探讨、学习分析模型研究、学习分析技术基础、学习分析工具、学习分析应用研究、学习分析面临的困难与挑战等方面。因此,本文尝试从以上几个方面对当前的研究进展进行梳理与总结。

二、学习分析的涵义与理论基础

(一)学习分析的涵义

George Siemens认为学习分析通过应用智能化数据、学习者数据与分析模型,实现对信息与社会性连接的发掘,并为学习提供预测与建议。SOLAR的成员在第一届学习分析与知识大会之前开设了一门MOOC——学习与知识分析(Learning and Knowledge Analytics),在课程介绍中将学习分析定义为“为了理解和优化学习与学习发生的环境,对学习者及其所处境脉的数据进行的测量、收集、分析与报告”。该定义之后得到LAK11与会学者的认可并被广泛引用。Slade和Prinsloo认为学习分析是对学习者生成的、可提供行为参考的数据进行收集、分析、利用与传播,从而为学习者提供适当且有效的认知、管理支持。以上定义把学习分析定位在技术的范畴,Martin与Sherin则将学习分析作为一个新的学习科学方法集,指出学习分析通过开发工具与技术实现对学习过程与学习结果数据的抓取、存储,基于大量数据发现模式,以生成性和可利用的形式呈现这些数据,并将数据与智能化工具整合以实现学习环境的个性化与优化。

研究者根据自己的理解与实践基础,给出了学习分析的不同定义,但综合而言,学习分析的工作对象是关于学习者与学习过程的数据,要实现的目的是对学习与学习环境的优化,采用的手段是开发特定工具与技术。学习分析目前并未发展为一门独立学科,仍是一个较为松散的新兴研究领域,既包括通过开发特定工具与技术,对学习者与学习过程数据进行挖掘与处理,以实现学习或学习环境的优化与个性化的实践活动,也包括探讨学习分析基本理论与框架,进而促进学习理论与教学设计理论不断向前发展的研究。

(二)学习分析的理论基础

Elias认为学习分析从多个相关领域汲取养料,如商务智能、网站分析、学业分析、教育数据挖掘、行动分析、数据挖掘等。George Siemens总结了推动学习分析发展的相关领域和教育研究活动,包括社会网络分析、用户建模、教育和认知建模、数据库中的知识探索等。Macfadyen等人认为学习分析需要解读海量数据呈现出的特征、问题或规律,必须依靠学习理论、组織行为理论、优秀教学实践案例、知识社区、学生动机、毅力与动机等研究领域的知识。可以发现,尽管数据挖掘、网络技术、学习理论、教学理论、社会网络都为学习分析的研究与实践提供了理论依据,但学习分析的理论基础并未系统化、明朗化,这是学习分析向前发展必然需要解决的问题,也为学习分析的理论研究提出了亟待解决的课题。

三、学习分析模型研究

学习分析模型的建立,有助于学习分析研究与实践中更为系统有效地设计研究方案,提升效率,可为学习分析系统平台与学习分析工具的设计、开发、应用与推广提供参考与指导。研究者提出的学习分析模型,主要包括两类:过程性模型与框架性模型。

(一)过程模型

学习分析过程模型着眼于学习分析的流程,重点探讨学习分析活动的要素与各环节之间的递进作用与影响,对于学习分析实践与学习分析工具的开发具有更重要的指导意义。

1.学习分析过程模型

2010年8月,George Siemens在第一届学习分析与知识大会召开之前,提出学习分析的过程模型(如图1所示),指出学习分析通过应用智能数据、学习者数据和分析模型来发现隐藏的信息与社会联系,并对学习做出预测与建议。他认为学习分析的一个重要目标是重构教学、学习与管理的过程。因此学习分析的最终落点应体现在学习预测、干预、个性化与自适应等方面。其中,要实现学习的个性化与自适应,应结合技术、社会、教育等因素从整体性角度多方面考虑。西蒙斯的这一模型为之后学习分析模型的提出与不断完善奠定了基础。

2.学习分析持续提升循环模型

Elias分析了Baker的“知识系列”、MacEwan等人的“网站分析目标”、Campbell等人的“五步分析”、Dron等人的“合作应用模型”等框架,提出了学习分析的持续改进模型(如图2所示)。

该模型基于计算机(Computers)、理论(Theory)、人力(People)、组织因素(Organizations)等四方面资源,实现数据收集、信息处理、知识利用三个关键环节的循环提升。其中,数据收集环节包括数据捕获与选择,信息处理环节包括信息汇总和报告、预测,知识应用环节包括信息提炼与应用。该模型还特别强调将学习分析的成果共享,以扩大学习分析的作用范围,并促进新一轮学习分析的优化。

3.学习分析循环模型

Clow指出通过采取干预措施实现反馈的完整回路对于学习分析尤为重要,因此他提出了学习分析的环状模型(如图3所示)。学习者(Learners)、数据(Data)、度量(Metrics)、干预(Interventions),四个要素首尾相接,形成循环。在这个模型中,干预措施并非一定要施加于最初的学习者,如一位教师可以将对一次期末考试的分析与反馈结果应用至下一轮同一年级学生的教学中。

4.学习分析的生命周期模型

Khalil与Ebner等人综合2015年之前的大量会议文集、工作坊成果、期刊论文等相关研究,提出了学习分析的生命周期模型(Learning Analytics Life Cyele),认为学习分析包括四个主要部分,即学习环境(Learning Environment)、大数据(Big Data)、分析(Analytics)、行动(Act),学习分析的一个周期始于学习环境,止于适当的干预行动,上一个周期的结束同时是新的学习分析周期的开始(如图4所示)。同时,学习分析的整个过程都会受到8种因素的制约,包括隐私(Privacy)、数据存取权限(Aceess)、透明性(Transparency)、政策(Policy)、安全(Security)、准确性(Aeeuraey)、限制条件(Restrictions)、所有权(OwHetship)等。

(二)框架模型

学习分析框架模型将学习分析看作一个系统整体,不再局限于学习分析的过程,而是在明确学习分析内部各要素、环节的基础上,进一步讨论学习分析的理论构建框架及其与外部环境的相互影响。

1.学习分析的六维关键因素设计框架

学习分析需要面对一些可能存在的人类或社会一般性问题,如能力、伦理等,以及一些受数据、算法特性带来的局限。为使学习分析能够更好地兼顾这些问题,立足于学习分析的内部要素与外部影响因素,Greller和Drachsler提出了学习分析的六维关键因素设计框架(如下页图5所示)。区别于常见的过程模型,该框架包括六种关键因素,分别为:利益相关者(Stakeholders)、目标(Obiectives)、数据(Data)、工具(Instruments)、外部约束(External Constraints)和内部局限(Internal Limitations),并为每种关键因素给出了典型的例证,因此这一框架既可以为学习分析的程序设计提供任务清单,也可作为不同境脉下学习分析变量对比的参照模型。

2.学习分析四维参考模型

Chatti与Dyckhoff等学者指出学习分析过程应该是迭代循环的,通常包括三个重要步骤,即:数据收集与预处理、分析与行动、后续处理。他们提出了包括“数据与环境(what?)”“利益相关者(Who?)”“目标(why?)”“方法(How?)”的学习分析四维参考模型(如图6所示),为每个要素提供相应的例证,并明确了四个维度上的多种挑战与研究需要。

3.学习分析概念框架

李艳燕与黄荣怀等提出了学习分析的概念框架(如图7所示),认为学习分析应包含五个基本组成要素:学习过程、学习环境、教育环境、受众、五个环节。其中五个环节作为一项重要的组成要素,又包括数据采集、数据存储、数据分析、数据表示、应用服务等内容。应用服务主要为绩效评估、过程预测与活动干预。学习分析涉及对象主要为学习者、教师、教育管理者三类。

不同模型都体现出数据在学习分析中的基础与核心地位,因此科学合理地获取并分析数据,是学习分析的基础工作。同时,学习分析的最终目的是优化学习与学习环境,因此,合理的干预措施或建议是学习分析的意义所在。学习分析模型有助于研究者在研究過程中对研究方案进行系统化,制定合理的问题解决策略,将学习分析的成果有效的用于学习过程与学习环境的优化,但各种学习分析模型各有优势,在实际应用与研究中应结合现实,有选择地参考、利用研究模型,灵活处理实践中的具体问题,才能提升学习分析效率,将学习分析的研究与应用不断向前推进。

四、学习分析的方法与技术基础

学习分析在发展过程中,借鉴了多个相关领域的方法与思想,包括商务智能、网站分析、学业分析、行动分析等。此外,数据挖掘、数学与统计方法、文本与语义分析、可视化技术、社会网络分析等也是进行学习分析的关键技术。还有学者认为,定性分析的方法也应在学习分析中占有一席之地。

(一)商务智能、网站分析、学业分析与行动分析

商务智能是在商业领域中形成的一套较成熟的方法,它将信息技术与战略性思考相结合,综合大量数据,以提升用户的决策制定能力。

网站分析指通过实验、测试、度量等客观科学的方法,对网站浏览与利用的用户数据进行收集、分析与报告,目的是为了更好地了解网站的线上措施与布局改变的效果。网站分析同时也是一种获得商务智能的有效方法,如基于网站分析结果确定广告在网页中的位置,可以提升广告投放的效益。

Goldstein等认为学业分析即商务智能中的原则与方法在教育领域的应用,旨在研究教育教学中的技术和管理因素,为高等教育机构收集、分析和使用学习与教学中的数据提供技术支撑和方法指导。Campbell与Oblinger认为高等教育面临的重大挑战之一即学生成就,衡量学生成就往往参考在校率与毕业率两大指标。学业分析将大数据与统计方法、预测建模方法结合,可以提高院校进行相关决策的能力。

行动分析以学业分析为工具,给出行动指导、立足服务的体系结构、信息与服务一揽子解决方案、课程变革模式、教师实践改良等多方面的参考,以提升绩效降低成本,其根本目的仍然指向提高学生成就。因此,学业分析和行动分析可以看作院校或国家层面对学习分析的应用,主要用于为教育决策者提供建议和参考,以提高教学质量和学生成就。

(二)教育数据挖掘

教育数据挖掘是数据挖掘技术在教育领域的应用,其研究聚焦于数据分析的技术与方法,是分析与解释学习数据最为常用的方法。决策树算法、分類、聚类、多元线性回归等数据挖掘技术被用在学习分析中,以实现各种分析目的,如预测在线学习绩效、了解各种学习影响因素之间的相关性、发现问题学生、为教师提供在线评估工具等。

(三)统计与数学方法

统计与数学方法在学习分析的研究中被大量应用,如平均值、中值、标准偏差等描述性统计指标。此外,在学生特征总结、建立评分体系、分析学生问题解决行为并完善智能导师系统等研究中,各种数学与统计方法常常与数据挖掘一起被应用其中。

(四)文本分析与语义分析

文本分析将文本资料转化为计算机可以识别处理的信息,进而提高文本处理的效率。语义分析则应用语义学原理提高数据处理质量,更准确地识别出数据的意义。文本分析与语义分析技术,多用于在线环境中的讨论分析、自然语言处理的相关研究中,如评估在线环境中的学生回答、促进学生协同写作、分析论坛帖子以实现某种预测、论坛自动化语言检测以实现学生的自我训练等。

(五)可视化技术

可视化技术依靠计算机的强大处理能力,将海量数据以图形或图像的形式呈现在人们面前,并可以通过交互手段控制数据的抽取和画面的显示,帮助人们分析、理解数据,发现隐含于数据之中的规律。应用可视化技术,以流程图、思维导图、热度图、3D图、散点图、评估模型等形式呈现统计信息,对所有学习分析相关人员都十分有用:可以追踪学习者学习行为,以促进人们对学习过程的了解、反思与意义建构,帮助学习者确立学习目标并记录实现目标的过程;使在线课程中的教师能够快速了解学习过程的某些特点,进而采取对应措施提升课程绩效,改善学生学习体验;为教育决策者提供财务决策的依据;呈现动态热度图,提供不同地区或国家的总体教育程度、认知能力对比,为教育宏观调控提供参考和依据。

(六)社会网络分析

社会网络分析(Soeial Network Analysis,SNA)源自社会学研究,是用于研究社会成员之间关系的一种定量方法,使研究者可以对组成网络的成员和他们之间的关系进行更为细致的考察。伴随着在线学习和各种新媒体的发展,SNA被用于分析在线学习中的交互现象并探索其中规律。通过处理学习环境数据,呈现可视化结果,SNA还可以帮助教师理解课堂氛围。由于SNA需要大量计算,所以多使用软件实现。王陆将SNA软件分为商业化与自由软件两大类,并按照可视化与非可视化两个指标,将23种社会网络分析软件划分为自由可视化、商业可视化、可视化、自由非可视化、商业非可视化五种,重点介绍了NetMiner、Pajek和UCINET三种典型的社会网络分析软件的特点与使用方法,并给出了评价与使用建议。

(七)定性分析

定性分析关注对数据的解释性描述。当前应用于学习分析的定性分析方法主要有两种:情绪智力与质性社会网络分析。情绪智力以情绪为基础,与心理学和社会学相关。新英格兰大学基于对学生积极或消极情绪信息的挖掘,开发了一个预警引擎并将其整合进学校的学生管理平台中。该引擎设置了多方面的指示器,生成综合报告发送给教师,帮助他们了解学生在课程中的参与情况,从而采取相应措施,保持或提升学生的听课率。质性社会网络分析主要以虚拟人种志的方法展开观察、访谈和调研,收集到的质性数据通过建立社会网络的形式转化为更广泛的情境性成果。

五、学习分析工具

学习分析产生于教育大数据的浪潮之中,其面临的首要问题即处理大量的学习者与学习过程数据;其次,学习分析的最终目的是实现对学习过程与学习环境的优化,因此势必惠及教师、学生、教育决策者等广泛的人群。处理海量数据,必然要求实现数据抓取、处理过程的自动化与智能化;惠及各种人群,必然要求操作的简单与功能的友好丰富。学习分析工具正是为了满足以上需要,为实现学习分析而开发的各种程序的集合,使用学习分析工具可以使学习分析事半功倍,使不具备学习分析专门技术的教师、学生、研究者都可以便利地进行学习分析,深入理解学习活动,提高其研究与实践活动的效率。因此,学习分析工具应该具备的基本特点包括:服务对象多元化、界面操作简单化,平台接口标准化、数据获取自动化、数据处理智能化、结果呈现可视化、分析功能多样化和反馈提示实时化。孟玲玲、顾小清等根据分析对象与类型侧重的不同,将学习分析工具分为五类:学习网络分析工具、学习内容分析工具、学习能力分析工具、学习行为分析工具、其他综合分析工具。Verbert和Govaerts等人根据学习分析工具应用的环境不同,将其分为支持面对面教学的工具、支持小组合作的工具、支持混合学习或在线学习的工具。

本文认为学习分析工具服务对象不同,其结构、功能、呈现形式等均有较大差别,据此可以将学习分析工具划分为支持教师教学的学习分析工具、支持学生个性化学习的学习分析工具、支持教育决策的学习分析工具。

(一)支持教师教学的学习分析工具

支持教师教学的学习分析工具通常为教师提供学生学习活动和成绩的反馈,并以可视化的形式呈现结果,如LOCO-Analyst、SNAPP等。LOCO-Analyst基于LOCO(Learning Object Context Ontologies)框架,集合文本挖掘、语义分析、可视化等技术,为教师提供网络学习环境下学生学习情况的反馈,包括学生完成或参与的学习活动、网络学习内容的使用情况及可理解性、虚拟学习环境中的学生交互活动三方面,反馈以主题、模块、不同类型的学习资源、单个学生等多种形式呈现,帮助教师更好地理解和优化整个教学过程。SNAPP(Social Networks Adapting Pedagogical Practice)是一款基于社会网络分析开发的实时诊断工具,可以嵌入Blackboard、WebCT、Moodle等多种学习管理系统或浏览器,自动提取学生交互数据。SNAPP应用发帖、回复、受关注主题、主题拓展程度等因素分析论坛交互并以社交网络图的形式实时呈现给教师,帮助教师识别孤立学生、网络互动的中心学生、潜在的学习表现良好或不良的学生,以采取适当的干预措施。Hughes和Dobbins对英国利物浦约翰摩尔大学e-Register系统中的学习数据进行分析、建模,结合学生出勤率、学习投入程度等因素预测可能退学的学生,并基于对数据的统计生成学习仪表盘,该仪表盘可供开设MOOC的教师整合进其课程系统中,为教师进行教学内容与教学策略调整提供依据。

(二)支持学生个性化学习的学习分析工具

支持學生个性化学习的学习分析工具可以通过追踪学生在线学习行为,将其以可视化的形式呈现给学生,帮助学生对自身学习的各方面获得更为清晰的认知,促进反思,进而调整学习策略,以获得更成功的学习。学习仪表盘是学生个性化学习支持工具的典型代表,可被看作一类关于个人资讯的特殊应用程序。学习仪表盘从LMS(Learning Manage System,学习管理系统)、在线课程平台或社交媒体(如Twitter、博客)中获取数据,可以追踪学生的作品提交、观点表达、发帖情况、在线交互、资源使用、练习与测验、在线学习时间等情况,以可视化的形式生成报告,帮助学生了解自己的课程学习情况,如典型错误、对不同主题的掌握水平、练习结果,学习进度等。学习仪表盘可以促进学生的自我评估与元认知发展,帮助学生调整学习进度,制定适合自己的学习计划,实现更有效率的个性化学习。美国普渡大学的Course Signals是利用学习仪表盘提高学生学习绩效、保持和提升学生课程完成率的成功典范。值得注意的是,学习仪表盘并非只能用来支持学生学习,也可以用来向教师呈现课程中的学生学习情况,为教师做出相应调整并给出提示与依据,如可汗学院的学习仪表盘,既有教师界面,也有学习者个人界面。

(三)支持教育决策的学习分析工具

支持教育决策的学习分析工具通过对大量教育数据的收集与处理,为教育研究者或决策者提供科学严谨的研究途径和更有说服力的决策依据。英国的教育标准办公室(office for Standards in Education)研发了学校数据仪表盘(School Data Dashboard)。该仪表盘以图表形式呈现学校的测验成绩、提升情况、学生到课率以及其它情境因素的数据,使对传统的学校检查、评估、判断日趋以数据为导向,更为客观。培生集团的“The Learning Curve”(学习曲线)是一个在线教育数据库,拥有来自OECD、UIS、EIU等多个国际组织、50个国家近70个指标25年以上的相关数据,为使用者提供三类数据分析方法:不同年份教育与社会经济各因素(教育投入、产出、社会经济环境)相互影响及变化趋势、不同年份各国教育成绩对社会经济各因素的影响、热度地图。三类分析方法都可供使用者在线选择不同的参数组合形式,根据不同需要定制分析结果,所有结果都以可视化形式呈现,使分析者可以在最短的时间内了解所分析问题的概貌。The Learning Curve可以为教育决策者提供学生学业成绩与社会经济各因素之间相互关系的可视化分析,从而为决策者制定相关政策提供基于大数据和广阔视野的客观依据。

六、学习分析应用研究

学习分析系统基于对大量学习数据的获取与分析,建立预测模型,可以对学生可能取得的成就或遇到的困难做出预测,为教师或教学管理者采取相应干预措施提供参照,以实现个性化学习环境或个别学习指导。越来越多的学习管理系统、在线学习平台开始应用学习分析技术,如Blackboard、Desire2Learn、Moodle等在线平台都向用户提供了学习分析工具;Coursera、Udacity、edX、可汗学院等慕课平台也开始应用学习分析技术提升其学习服务能力。学习分析促进学习的应用主要集中在两个方面:(1)建立预测模型,导向学习干预措施;(2)提供学习分析报告,促进反思与策略调整。

普渡大学将Course Signal系统与于LMS系统整合,基于学生人口学信息、学习经历、与LMS/VLE等系统的互动、曾修课程成绩等四方面数据,建立预测模型,对照预测模型,将学生的学习情况以红灯、黄灯、绿灯标示。红灯表示学生处于学习困境、面临课程学习失败的危险,黄灯表示学生可能遇到学习困难、需要帮助,绿灯则表示学生基本可以顺利完成课程学习。教师可以根据信号灯的提示,发现问题学生,从而采取干预措施,包括在学生个人的学习管理主页上显示信号灯、发私人邮件提醒学生、发送文档信息、推荐学习顾问以供咨询、推荐可用的学习资源、与学生约谈等。该系统被证明可以有效提高学生成绩,提升学生选修课程的完成率,激发学生学习主动性,使教师可以更好地为学生提供个别化指导。戴心来等人应用学习分析对网络论坛讨论区中的交互数据进行分析,提取学习者的社会网络结构特征,对学习者进行类型划分,探究不同学习者的认知特征,据此做出教学干预,以实现促进虚拟学习社区发展的目的。

可汗学院通过学习仪表盘,向教师、学生与家长提供学习报告。可视化的报告形式使用户可以一目了然的了解学生的学习进展与知识掌握程度,教师可以筛选出遇到困难的学习者或多数人难以掌握的知识点,进而安排针对性的教学活动;家长可以了解孩子的学习进展,并提供必要的帮助和引导;学生可以更清楚地把握自己的学习状况,对学习活动进行调整与规划,承担更多的责任,实现个性化学习。PBS Kids(美国公共电视网旗下儿童类节目网站)与CRESST(the National Center for Research on Evaluation,Standards and Student Testing)合作,对儿童在该网站的学习数据进行分析,为家长提供定制的学习报告,使家长可以清楚地了解孩子的学习情况并为孩子提供有针对性的帮助。该项研究的结果表明,学习分析报告提升了家长对孩子学习的监督意识,使他们与孩子在学习方面的互动更为融洽。国内的“快乐学”教学系统整合了“智能分析”与“学习分析”模块,基于智能数据分析,可以为教师提供学情分析,帮助老师有效提升教学效率;为学生提供学情分析报告,使学生对自己的学习情况一目了然,实现有针对性的學习。

七、学习分析发展的挑战与展望

学习分析在大数据的浪潮中应运而生,为人们提供了基于海量教育与学习数据发现规律与问题解决策略的方法与工具,同时也带来了数据分析与应用过程中必然要面对的问题。

(一)学习分析的发展,受到相关数据采集与处理技术的局限

大数据是学习分析得以实施的前提,当前大数据应用于教育面对多方挑战:首先,数据存储技术、数据处理与分析技术受到计算机硬件发展水平和计算能力的限制;其次,数据采集技术与分析技术仍处在不断发展中,距离智能化、自动化、系统化仍有较大差距;第三,数据兼容性问题,使数据的跨平台操作与数据共享很难实现。此外当前大量数据库未能实现互联,大量学习相关数据如学籍信息、考试数据、人口学数据、经费数据、教师数据、资源数据都分布在不同的部门与管理系统中,导致学习分析多集中在对学习过程数据的分析,难以实现立体化分析,其分析结果与发挥作用的领域仍然十分有限。

学习分析基于各种数据实现对学习的描绘,典型的评测指标包括登录次数、花费时间、点击率、访问资源类型与数量、个人作品与观点、测试成绩等,但这些终究只能体现出学习者在线学习的局部信息。因此,应用学习分析技术建立的预测模型无法做到完全精准。尽管这些模型具有一定的预见性,但由于数据收集的局限性,难以更准确地预测学生的学业成绩。正如可汗学院在教师指南中所言,学习分析报告旨在提供学习者学习投入与技能掌握程度的评测,但技术并非绝对可靠,任何技术都会有误差,因此解读学习报告仍需结合常识与理论,做出综合判断。

当前学习分析多采用定量研究的方法,对于学习过程中的质性数据较少兼顾。对此有学者提出了虚拟民族志的方法对学习网络进行分析,以探索数据背后的行为动因。还有研究者加入了学习者自我报告的方法,以获得情感、态度等方面的质性数据,将其纳入学习分析中,以得到更为贴近真实的研究结果。因此,在学习分析中,如何在量化分析的基础上,结合真实情景中的细节、情感、背景、社会关系等因素,发展出更为完善的研究框架与方法,使学习分析结果不断接近学习的真相,应是学习分析研究的一个重要趋势。

(二)隐私与伦理问题

伴随着网络与移动通信技术的发展,人们可以利用各种终端设备随时随地接入网络,使得各种数据的即时、多样化收集成为可能,也促成了大数据时代的到来。学习分析的对象是学习者与学习相关数据,因此数据收集与应用过程中必然设计到隐私与伦理问题:数据的来源除学习者、指导者、管理者、研究者的人口学资料外,还包括学习与管理过程的相关数据,这些数据的利用是否应考虑到相关人物的隐私,是否应征求其同意?应用数据进行分析或研究的实施者,是否有数据的使用权,所获得的数据是否应该进行匿名化处理?学习分析被用来预测可能退学或退出课程学习的学生,或用来预测学生可能获得的成绩,教师或管理者在得到这一结果后,通常会采取干预措施,是否有给学生贴标签之嫌?数据的使用权如何限定?学生或教师作为数据生成者是否有机会了解数据如何被使用以及数据分析的结果?数据的安全性如何保证?

以上问题伴随着学习分析的发展涌现出来,涉及到的隐私与伦理、数据使用权、数据安全、数据透明性等多个方面。问题的解决需要政府与教育管理部门、研究组织、研究者共同努力,制定统一的法律、政策、规范,从而为学习分析的研究与应用提供良好的外部环境与机制。

(三)学习分析标准的研究与制定

学习分析能够挖掘出教育现象背后隐藏的信息或规律,从而为学习成果预测、教学干预、实现学习的个性化与自适应提供支持。但当前学习分析的应用多集中在研究领域,实践应用与推广仍不理想。究其原因,学习分析的数据来源主要包括各种学习或课程管理系统、社会网络平台、客户端软件等,各种系统的架构体系不同,数据结构不同,采集方法也不同,数据的互通性(Interoperability)在很大程度上成为学习分析系统共通共用、进行推广的障碍。

xAPI(Experience Application Programming Interface)是ADL(Advanced Distributed Learning,美国国防部“高级分布式学习”组织)针对当前不断发展的学习应用技术的需求,基于活动流(Activity Streams)概念,提出的在线学习标准。xAPI的提出是建立在对SCORM模型(Sharable Content Obiect Reference Model)缺点与不适应性进行全面分析基础之上的。SCORM仅能基于网络会话对学习经历数据进行记录,其记录的学习经历具有一定的局限,缺乏持续性及环境化的信息,而且不适用于移动终端数据的采集和记录。xAPI提供了存储学生学习经历数据的互操作数据模型,实现了正式学习环境与非正式学习环境、在线与离线学习环境、不同学习设备与平台之间数据的规范封装与互通。xAPI通过将数据存储在LRS(Learning Record Store,学习记录仓库)中,突破了单一学习管理系统的局限,使数据可以在不同学习管理平台与设备之间传播与交换。xAPI自2012年提出以来,仍然在不断发展与完善中,但其提供的数据标准与存储结构,为学习分析的实现提供了极大便利。

除数据互操作性之外,统一的数据字典(Data Dictionary)有助于实现教育数据存储的一致性,避免数据交换时的模糊混淆,使系统开发时有规范可循;学习成果标准提供学习者能力指标体系,充分利用语义技术,使计算机能够更好地理解并处理学习结果数据。此外,学习分析对象种类、分析层次、分析结果类型与呈现形式,均应结合教学、学习、管理、研究的不同,进行梳理,以为学习分析实践与研究提供指导与参考。

学习分析标准体系可以在数据源与学习分析之间架设桥梁,有助于实现学习大数据的跨平台操作,进一步提升学习分析与数据挖掘的效率,最终实现学习的智能化与自适应。

(四)学习分析理论体系的建立与完善

学习分析可以为教学、学习、管理、开发提供有力的数据分析支持,势必推动教育模式的不断革新与教育理论的创新。然而,学习分析作为新兴的研究领域,涉及数据挖掘、网络技术、学习理论、教学理论、社会网络等多种理论与方法,其理论基础与自身理论框架仍未系统化、明朗化。学习分析在实现有效教学与有效学习过程中的地位与作用如何,学习分析在促进学生实现深度学习中应如何发挥作用;各学科理论如何有效支持学习分析实践,如何基于认知理论与学习科学原理对学习分析的结果做出符合理论规律与现实的解释;各种方法与技术在学习分析中扮演着何种角色,其协同发挥作用的机制如何,这些问题的回答都需要对学习分析理论体系的梳理与构建。学习分析理论体系的建立,一方面依赖学习分析实践的不断发展与尝试,一方面依赖于广大研究者的不断探索与总结,理论的完善又会指导并促进实践的不断演进,从而实现学习分析理论与实践循环前进的良性发展。

学习分析作为快速发展的新兴研究领域,目前虽未形成脉络清晰的理论体系,但不可否认它为大数据环境下的教育实践与研究提供了更为高效的方法,迎合了当前在线学习、个性化学习的需要,可以为在线学习、个性化学习、教育管理、教育研究提供科学客观的依据与宽广的视野,随着技术的发展与相关政策、规范的建立,学习分析必然为教育信息化提供强大助力,在更广阔的领域发挥作用。

猜你喜欢
理论框架学习分析应用研究
慢性肾衰中医PRO量表理论框架模型的构建
大数据思维下教学过程数据分析及应用研究
在线学习过程管理大数据的建设与应用
非营利组织信息披露与审计机制:国际视野与一般框架
简析小学劳动与技术教育的有效合作学习
浅析大数据在教育中的应用
进驻数字课堂的新兴教学媒体
AG接入技术在固网NGN的应用研究
分层教学,兼顾全体
从系统功能框架下的语篇分析到其经济性初探