数据表征学习过程及其应用

2015-07-08 08:58:12张艳霞孙洪涛李爽陈丽
中国电化教育 2015年9期
关键词:学习分析学习过程

张艳霞 孙洪涛 李爽 陈丽

摘要:教育信息系统中存储着大量不同格式和不同粒度级别的学生数据,这些数据为利用学习分析技术发现和解决学生学习过程中的问题提供了可能。然而,如何使用恰当的数据表征学生的学习过程,对研究者来说仍存在很大挑战。本文首先从数据来源、具体数据项、数据项收集方法、在学习分析中的应用四个方面对现有学习分析研究中使用的数据集进行了整理和归纳,然后对现有数据集的研究现状、未来发展趋势进行了讨论和分析。以期呈现现有学习分析领域数据集应用的概貌,为后续学习分析中数据集的研究奠定基础。

关键词:学习分析;数据集;学习过程

中图分类号:G434

文献标识码:A

一、引言

学习分析源于商业智能和网站分析,是用户数据分析在教育领域的应用,指的是对教育领域的“大数据”处理和分析[l]。在各种教育媒体大量出现,学习资源网络化、网络学习方式普及化,学习行为、学习情境和学习结果数据丰富化和可获得化的背景下产生。在2011年举行的首届学习分析技术与知识国际会议(International Conference on LearningAnalytics and Knowledge.LAK)上提出了学习分析的定义,指出学习分析是测量、收集、分析和报告有关学生的学习行为以及学习环境的数据,用以理解和优化学习及其产生的环境的技术的总称[2]。即学习分析是对学习者在学习平台中随机产生的各种零散的数据进行存储、收集、筛选、提取,并在对获取的数据进行分析的基础上对学习者的学习效果和状态进行评估和预测[3]。

从其定义可知,数据是学习分析的关键前提。Greller等人提出了确保学习分析向有效改善教育或学习效果方向发展的六个要素:受益者、目标、数据、设备、内部限制、外部限制[4]。学习分析从根本上是收集和分析学生学习过程中生成的各种数据[5]。这也进一步说明数据是学习分析的重要基础。Siemens指出学习分析产生的最主要原因是现在可获得大量的数据,如学生上传下载资源的频率、在测试上花费的时间、点击观看视频的次数、参与学习活动的类型等。基于这些数据,我们可以构建学生模型,预测学生辍学的可能性;对学生已有的知识结构进行评估,帮助学生知道自己所处的学习状态及下一步应该学习什么;呈现学生的学习轨迹,为学生提供个性化的学习支持[6]。

最近几年,各类教育教学软件和网络学习资源在教育中的普遍应用、大量课程管理数据库和学生信息数据库的建立为学生学习过程中产生的数据提供了大容量的存储空间。各类在线学习平台、教育信息系统和在线学习APP中存储着大量的数据。这些数据记载着学生的学习状态和学习过程[7]。它们为研究者提供了进行广泛研究尝试的潜在数据源。学习分析的开展有赖于高质量的数据。理想情况下,研究者希望捕捉到能够准确反映学生真实学习过程或状态的数据。然而,这些数据通常是以不同的格式和粒度级别被存储,并且存储的位置由学生信息管理系统和课程管理系统向分布式的个人学习空间扩展,这给研究者从大量杂乱的数据源中挑选出能够反映特定学习过程或状态的数据带来了一定的难度。在学习分析中采用哪些数据才能更加深入全面地描述和解析学生的学习过程及状态是学习分析技术应用者比较关注的问题,并且该问题一直没有得到很好的解决。如何选择适当的数据集合(Dataset),从而开展存储、收集、提取、分析和报告是学习分析研究中的一个重要前提[8]。

学习分析中的数据集特指与学生学习属性和学习环境相关的原始数据项或者用于表征学习行为或学习环境的聚合数据项的集合。数据集是学习分析和教育数据挖掘领域各种数据模型建立的基础。另外,学习分析中各种学习结果和学习行为的预测、学习工具的开发以及学习资源的推荐都是通过对各类数据集中具体数据项的分析来实现。数据集是学习分析技术得以发展的前提和基礎。因此,对学习分析中使用的数据集进行概述和分析,将为研究者从大量杂乱的数据源中挑选出能够反映特定学习过程或状态的数据提供参照。另外,对学习分析中数据集的整理和分类也可能为学生动态模型的建立、学习分析T具的开发等提供更准确的数据选择依据。

二、文献来源与分析框架

笔者在Google Scholar中以“LearningAnalytics” “Learning Analytics Research” “LearningAnalysis为关键词,对2011-2014年学习分析领域的相关论文进行了检索,检索结果包括学习分析技术与知识国际会议(LAK)及其他涉及学习分析主题的会议(AIED、ECTEL、RecSys等)中的文献。通过筛选,学习分析中数据集相关的文献最终获得了133篇文献。

学习分析领域关于数据集的研究处于起步阶段,国外有研究者开始进行初步的尝试。Drachsler等人对技术增强学习领域中来自不同学习推荐系统(MovieLens,BookCrossing,EachMovie)中的公开数据集从数据能够表征学习情景的程度、可重复性、用途等方面进行了整理和分析,并在此基础上提出了三条帮助研究者根据特定的情景选择合适的数据集的指导建议[9]。2012年,Verbert等人在Dracbsler研究的基础上进行了扩展,提出了一个教育数据集的分析框架,并且对教育数据集在共享和重用中存在的挑战和未来发展趋势进行了讨论和分析。Verbert等人提出的数据集分析框架由数据集属性、数据属性、学习分析的目标三个部分[10]。数据集属性是对数据集的整体描述,主要是指数据集的来源;数据属性是在一个更精细的粒度水平上对数据集进行描述,主要包括组成数据集的各个数据元素,即数据项有哪些;学习分析的目标用来映射数据集及其所包含的数据项在学习分析中的潜在有用性。同时,他们还指出通常不同的数据集在收集方法上存在一定的差异性。借助该数据集分析框架,研究者能够较为直观地、清晰地发现学习分析中数据集的特点。

本研究在Verbert等人提出的数据集分析框架基础上,提出了数据来源、数据项、数据收集方法以及在学习分析中的应用这四个方面,作为对学习分析中的数据集研究进行分析的框架。主要回答以下四个问题:

(1)数据集中的数据主要来源于哪些数据系统?

(2)数据包含哪些数据项,可以归为哪个类别?

(3)如何收集这些数据?

(4)可用于学习分析中的哪些问题情景?

三、文献分析结果

依照前述分析框架,笔者对筛选出的133篇文献进行了分析。

通过图1可以发现,现有研究中学习分析的大部分数据来自学习管理系统和网络课程。

MOOC虽然属于网络课程的范畴,但由于其大规模性和开放性引起了研究者的关注,MOOC开始出现在学习分析领域,有研究者开始研究如何利用学习分析技术来促进MOOC中学习的有效发生。随着社会媒体在学习中的广泛应用,越来越多的研究者开始关注各类社交媒体中学生产生的各类数据。

研究中一般不会明确指出采用了哪种类型的数据集,但会对收集的数据项进行描述。根据其描述进行整理和归类,发现现有学习分析相关研究中使用的数据集主要可以分为网络学习行为数据集、情境数据集、注意元数据集,如下页图2所示。

互联网大数据时代,学生的很多学习行为都发生在网络环境中。这些学习行为数据通常在学生察觉或者不察觉、主动或者被动的情况下被记录在学习平台或系统中[11]。学习分析通过对学生在线学习行为数据的分析,以倒溯方式考察影响行为产生动机和需求等因素,以及行为背后所隐藏的学习目的、学生个性特征、学习环境等元素,最终目的是优化学生的学习过程以及学习行为发生的环境[12]。学习行为时学习分析关注的重心,网络学习行为数据在全部学习分析数据集中占很大的比重。

此外,情境数据能够表征学生学习行为发生的环境特点。移动互联网的发展,使得利用情境数据提高个性化服务的精确性和学生的满意度成为个性化服务领域的研究热点之一。越来越多的在线教育机构开始关注如何通过对学生学习情境数据的分析,为不同情境下的学生精确推荐符合其实际需求的学习资源或服务。情境数据集成为学习分析领域关注的另一类数据集。

注意元数据主要用来表征学生注意力分配方面的特点。通过抓取学生的注意元数据(如:眼睛移动的范围,鼠标点击的频率等),形成学生注意力数据流,进而捕获学生对学习资源、软件应用等的偏好,及其交互方式[13]。学习分析领域通过收集和分析学生的注意元数据,了解学生学习过程中的资源偏好及其与学习内容之间的交互方式。目前,注意元数据集在学习分析中应用比较广泛。学习分析中的数据主要通过基于代理服务器和基于Weh日志挖掘的方法获取,如图3所示。在学习分析中应用体现在预测学生表现、构建学生模型、促进学生反思和保持注意力等六个方面,如图4所示。

通过以上分析可以发现学习分析数据集的总体状况。其中,网络学习行为数据、情境数据和注意元数据是现有学习分析研究数据集的主要来源。这三类数据集在数据来源、数据项构成、数据收集方法和学习分析应用方面有着较大的差异,对各个数据集的深入分析有助于进一步了解现有数据集研究现状,为应用数据集开展实验研究和工具设计奠定基础。

四、对三大类数据集的分析

(一)网络学习行为数据集

网络学习行为数据集是指用于描述学生学习过程中产生的各种行为的要素及其属性的数据集。

1.数据来源

现有研究中网络学习行为的数据集主要来源于传统学习管理系统、智能导师系统和白适应超媒体系统、个人学习环境。

基于传统学习管理系统中的数据对网络学习行为进行分析、描述和可视化是学习分析中的研究焦点[14]。这主要与传统学习管理系统中数据的易获性、封闭性和连续性有关。

智能导师系统和白适应超媒体系统其本质是个性化的學习支持服务系统,能够更有效地支持学生个性化的学习。部分研究者通过对这些个别化学习支持系统中数据的分析来形成能够体现学生个性化学习过程与策略特征的用户视图。

随着各类移动设备和社会性软件在学习中的应用,学生的学习不再局限于单一、封闭的学习系统,学习开始跨平台、跨系统。部分研究者开始关注学生个人学习环境中产生的数据集,希望通过对个人学习环境中学生行为数据的分析,挖掘学生的学习兴趣,进行资源推荐,可视化学生的学习路径[15]。

2.数据项

Verbert等人提出了一个用于描述学生行为特征的数据集,见图5。该数据集中包含五大类数据项:(1)描述行为主体(Learner/Teacher)特征的数据项;(2)描述行为客体(Resource)特征的数据项;(3)描述行为类别(Type)的数据项;(4)描述行为结果(Result)特征的数据项;(5)描述行为发生情境(Context)特征的数据项。

上述学生行为数据集中不仅包含了用于描述行为本身属性的数据项,而且包含了用于描述行为发出者、行为对象、发生的情境以及产生的结果特征的一系列数据项。研究者可以根据研究的目的以及学习系统存储数据的特点对上述数据模型中的数据项进行筛选。

3.数据收集方法

基于计算机和网络平台的网络学习行为数据项采集的常用方法主要有三类,基于服务器端的采集、基于客户端的采集以及服务器端与客户端相结合的采集。

基于服务器端的数据采集在现有学习分析研究中应用较多。服务器端的数据采集主要包括Web日志挖掘和通过代理服务器进行采集。这两种方法都存在一定的局限性。基于Web日志挖掘的局限首先在于Web日志的不易获得性,即使得到了,也和Web安全的相关原则有冲突,而且只能获取学生通过该Web服务器时留下的日志数据。基于代理服务器的采集只能得到在该网站进行学习的注册学生的学习行为数据,这在一定程度上会导致未注册学生的学习行为数据的流失。这样的数据系统开发要与网站程序的设计以及数据库设计同步进行,才能做到无缝集成,专用性强,灵活性较差[17]。

基于客户端的采集主要包括客戶端JavaScript采集和浏览器插件采集。使用开源软件进行数据流捕

获,然后处理并输出为文本,最后使用文本挖掘的成熟算法进行处理[18]。这种获取基于随机样本,样本容量可以取的很大,即使出现丢包

情况,也能接近实际情况[19]。

为了获取能够描述学生多种学习行为的数

据,少量研究开始采用服务器端与客户端相结

合的方法进行数据收集。一方面通过服务器端

获取学生在正规学习系统中产生的数据,同时

通过开源的JaveScript或浏览器插件跟踪获取学

生在自己客户端进行的各项操作行为。

4.在学习分析中的应用

网络学习行为数据集在学习分析中的应用主要表现在:(1)通过对学生网络学习行为数据

集中各个数据项的提取、整合、分析后挖掘出

学生在线学习的学习兴趣、学习方式和学习习

惯等方面的模式规律,针对挖掘出的模式规律

有针对性地为学生提供个性化、智能化的学习

资源和服务。(2)提取分析学生学习过程中与

教师、学生、资源、工具应用进行交互产生的

行为数据,形成学生交互过程的可视化数据图

表,对学生交互水平进行评估。(3)监测学生学习过程中的不良学习行为,开发远程学生辍学预警系统,帮助远程教育机构及时发现潜在辍学者,并提供及时干预。(4)根据对学习系统中大量学生网络学习行为数据的分析,预测相同情景中具有相似行为数据的学生的学习表现,包括学生的知识水平、行为表现等。

(二)情境数据集

情境数据集是指用来描述学生学习情境特征的数据集,其学习情境中可以包括是人、位置,或者与学生和应用交互相关的真实或虚拟的对象,包括学生和应用本身[20]。

1.数据来源

用于刻画学生学习情境特征的数据集主要来源于各类移动终端设备、泛在智能学习环境。随着网络的普及、虚拟环境、仿真技术和人机交互的迅速发展,人们可以不受时间和空间的限制,在移动环境中随时获取自己所需要的信息和服务,进行移动学习。研究者开始关注移动学习所具有的特点,希望通过对各类移动终端设备和泛在智能学习环境中与学习相关的数据进行分析,判断学生与各种学习应用之间的关系以及学生之间的关系[21]。 2.数据项 情境描述为人机交流的环境中所包含的各种信息,包括个人基本信息、计算机运行的平台和网络信息以及人所处的环境信息[22]。情境数据集中所包含的数据项应该分为描述个人基本信息的数据项,描述计算机系统或运行平台和网络特征的数据项以及用于描述个人所处环境特征的数据项。情境数据集中所包含的数据项范围广泛,具有复杂性、多变性和丰富性等特点。对情境数据集中的数据项进行合理的整合和分析能够为特定情形中的情境主体提供完整的特征描述。

3.数据收集方法

情境数据集中各类数据项的收集主要通过将传感器置人移动终端中白动获取学生的情境数据日志。在当今移动设备越来越普遍的环境下,通过各种传感器获取底层的情境数据变得越来越容易,这为更好地基于学生特定的学习情境为其提供个性化的学习资源提供了数据支撑。

4.在学习分析中的应用

情境数据集在学习分析中的应用主要表现为:(1)在对移动环境中学生学习相关情境数据的采集、分析和利用为学生构建一个稳定并且可扩展的智能学习空间,如白适应性超媒体系统、智能导师系统等。(2)基于情境数据集的学生个性化需求推送。通过对学生问题及问题情境数据的析取和重组形成学生所需知识产品动态信息,并以不同的表现形式推介给学生。

(三)注意元数据集

注意元数据集是用于描述学生某个特定情景下发生的一系列行为的数据项的集合[23]。

1.数据来源

注意元数据集中的数据项大多来自各类与学生学习相关的数据系统。这些系统可以是个人信息管理系统、学习对象保存系统、知识管理系统、工作流系统、学习管理系统、网络浏览器、制作工具(如OpenOffice、PowerPoint等用于制作新资源、修改新资源的行为)、视频会议系统。 2.数据项 Wolper等人提出了一个用于捕获学生在不同应用中的注意元数据的集合,并以图的形式形象化表示模型中所包含的数据项,如上页图6所示。

上述数据集中不仅包含了用于描述学生行为本身的数据项,也包含了描述行为处理的对象及发生的情景特征等方面的数据项。这一数据集为研究学生多种类型的观察注意焦点提供了可能。

2011年,Maren Schffeel等人在上述数据集基础上进行了修改,提出了以事件为起始点的情景化注意元数据集,如图7所示,更适用于分析和评估学生观察注意力水平。

3.数据收集方法

Claudia Roda等人将注意元数据项的收集方法归纳为:心理生理学观察(通过脑电图、心电图获得心跳、心律变化等获得)、物理观察(通过鼠标移动、眼球移动跟踪、观察击键、声音检测等获得)、应用程序收集(利用Attention Recorder等收集并利用APML描述应用程序与环境的交互信息)、用户的输入(为用户提供输入自己的兴趣爱好、学习需求、改进建议等)4大类[26]。

由于利用应用程序进行注意力元数据项的自动收集具有简化用户任务,保持检查统一性等优势,而在学习分析中被广泛使用。但现有研究中还主要停留在通过开源代码应用程序对学习管理系统或个人信息管理系统的日志文件进行自动获取。另外,有少量研究者采用LinuxKernel的核心部件Inotify,通过Java编程实现jNotify的事件监听器来跟踪学生计算机桌面系统中的文件变化,或者利用JavaMail的应用程序接口来跟踪电子邮件客户端用户对电子邮件的处理顺序和动作[2]。

物理观察和心理生理学观察两种方法需要比较精密的仪器,数据收集相对耗时较长,在学习分析领域应用较少。由于学生通常具有一定的保密心理,通常不太愿意主动向系统输入自己的需求、爱好等个人信息,通过用户输入收集数据项的方法在学习分析相关研究中也很少现。

4.在学习分析中的应用

注意元数据捕获学生行为发生的时间、地点(在哪些学习应用程序中发生)、主要行为(如下载/上传资源、发帖或回复等)等方面的细节,这类被采集到的数据能够更加真实地还原学生的学习过程或学习轨迹。

注意元数据集在学习分析中的应用

主要表现在:(1)对学生的学习兴趣和目

标进行分析,进而向学生推荐满足其个

性化需求的学习资源;(2)通过对多个学

生相关的注意元数据的获取和分析,构

建更加真实反映学生行为的学生模型,

突破传统静态的学生行为模型;(3)学习

平台性能和资源应用效果测试;(4)虚拟据

社区可以以注意元数据为依据进行虚拟兴趣小组的划分,实现组内资源共享;(5)根据收集到的注意元数据判断学生的注意力分配特点及存在的问题,并对其注意行为进行干预。

五、数据集整体应用现状

目前,各类数据集被广泛应用到学习分析中,为回答“谁在学” “学什么” “怎样学” “学的结果如何”等问题提供了新的途径。在数据来源、数据项、收集方法和学习分析应用四个方面体现出了各自的特点和趋势。

(一)数据来源由集中式教育信息系统走向分布式学习环境

学习分析通过对教育数据集进行分析来支持学习过程。学习分析中使用到的教育数据集其来源主要有7类:学生信息系统(SIS)、传统学习管理系统(LMS)、网络课程、社交媒体、自适应智能教育系统(包括智能导师系统、白适应超媒体系统)、个人学习环境、公共数据系统。Chatti等人对学习分析中的数据来源进行了分类,指出教育数据集的来源主要可以分为集中式的教育系统和分布式的学习环境[28]。

集中式的教育系統主要以学生信息系统、传统学习管理系统、白适应智能教育系统为代表,如Moodle,Blackboard。集中式的教育系统中存储着大量的学生活动和交互的日志数据。例如登录或退出平台、阅读、下载或上传学习材料、参与测试、添加评论等。这类教育系统中的数据集通常用于发现和分析正规学习环境中学生的学习特点,以此来对学生的学习结果或学习行为进行评价、预测或干预。

各种开源、社会性软件的出现让学生进行跨平台、跨系统的学习成为可能,教师开始注重学生之间思想内容的碰撞,各种生成性内容大量产生。随着用户生成性内容的大量产生,基于分布式学习环境中的教育数据集的学习分析变得越来越重要,并逐渐受到关注。社交媒体和个人学习环境是分布式学习环境的最好体现。社交媒体和个人学习环境中的数据来源于正式和非正式学习过程中,它们以不同的形式存在不同的空间、时间和媒介中。学习和知识的创造往往是分布在不同的媒介和网络环境中的[29]。因此,通过对分布式学习环境中的教育数据集进行分析了解学生学习和知识创造的过程是非常有必要的。

另外,云技术的发展为学生学习过程中产生的数据提供了无限存储空间,Dietze等人开始关注相互链接的数据云,希望通过探究不同数据集之前的联系来实现资源的推荐poJ。目前这方面的研究还处于起步阶段,但未来这应该会成为学习分析中数据集的一个重要来源。

(二)各类数据集所含数据项之间存在重合,但侧重点有所不同

数据项是数据集中具有更好粒度水平的可用数据元素,包括与学生行为有关的数据信息、学生/教师人口统计学信息、学习资源相关信息、学习情境数据、表示学习结果的数据信息五大类。

各类数据集在数据项上存在一定的重合,但侧重点有所不同。网络学习行为数据集中更多关注行为类型特征数据项,情境数据集中主要关注表征学生网络或平台特征方面的数据项,注意元数据集主要关注学生注意力分配特点方面的数据项。学习分析所解读的数据通常不局限来源于单一数据集,需要根据学习分析的目标整合多种类型数据集中的数据项。

(三)自动获取将逐渐成为主要的数据收集方法

现有学习分析中数据的收集方法由基于代理服务器和Web日志挖掘的方法逐渐向基于服务器和客户端相结合的方法转变,利用开源软件或程序进行数据的自动获取,但目前自动获取的数据大部分来源于集中式的教育系统,分布式学习环境中相关数据集的获取还存在一定的难度。

(四)推荐与构建动态学生模型是数据集在学习分析中的主要应用体现,智能化学习环境的构建逐渐引起关注

数据集在学习分析中的应用总结为六个方面:(1)预测学生的表现和建构学生动态模型;(2)推荐相关的学习资源,包括学习材料、学习工具、学习群体等;(3)促进学生的反思和注意力;(4)监测学生的不良学习行为;(5)评估学生之间的交互效果;(6)构建持续、动态、可扩展的智能个性化学习空间。

各类数据集都可以应用于推荐和构建动态学生模型。网络学习行为数据集在交互效果预测、监测不良学习效果方面应用广泛,情境数据集在构建智能学习空间中应用广泛,注意元数据集更多的应用于对学生注意力分配特点和干预效果的预测。

整体来说,学习分析中的数据集的类别在不断地扩充,出现了学生知识领域数据集、学习资源推荐系统数据集,但这些数据集都是以上面三种数据集为基础,根据研究目的,从上面三种数据集中的数据项进行重新筛选和整合而成。

六、数据集应用面临的挑战

各类数据集在学习分析中得到广泛应用,并且数据集的种类在不断地扩展,但在应用的过程中依然面临着大量的挑战。

(一)缺乏利用数据来描述学习的标准

各个教育机构或教育者对学习描述存在很大的差异,缺乏描述学习的通用数据模型。这导致他们对学习行为的拆分标准存在很大的差异,进而导致学生学习过程中产生的数据大部分是以不同的形式存储在不同的学习系统、工具和应用中。通常相同类型的数据项在不同的学习系统或平台中有着不同的表达形式,不同系统或平台上的交互数据缺乏统一的描述和存储标准,从而阻止了不同的系统或平台中数据之间的共享和重复使用。为了确保数据能够在不同系统或平台中实现共享和互操作,学习分析领域需要研究通用的数据模型来对学习者的学习进行描述。未来数据集中数据项的共享和重用在学习分析领域需要进一步的探索和研究。

(二)学生学习过程中产生的数据没有被全部记录

数据集来源在不断扩展,但具体实践中,学习分析相关研究的数据集主要还是来源于单一的集中式教育系统。这些教育系统具有固定的功能,一般只能记录某几类学习数据。学生在学习过程中产生的有些能够反映其特定学习习惯的数据并没有得到记录。这可能会导致具体学习分析中获得的数据并不是学生在学习过程中产生的全部数据,进而导致在此基础上通过学习分析获得的学生学习规律或产生的预测结果并不能真实、正確地表征学生的学习过程。未来,综合单一数据系统中的数据项,构建聚合数据项的数据模型,获取能够正确反映学习过程的数据应该是未来数据集在学习分析中的一个应用方向。

(三)数据收集和处理技术有待进一步提高

数据集的来源由集中式教育系统向分布式学习环境扩展,学习分析领域希望能够自动获取学生的全量数据,现有的数据收集方法虽然已经开始向自动获取转变,但这种方法获取的数据还局限于单一的学习系统或平台,获取的数据并不能映射学生的全部学习过程。未来需要开发出能够实时自动抓取学生在不同学习系统或平台上产生的全部数据的数据收集T具。

(四)数据收集使用隐私性问题

在数据收集和使用的过程中通常会涉及到学生隐私权和机构、组织对数据收集使用的许可问题。在对学生数据进行收集和分析前,研究者通常需要告知学生,并且需要得到本人的许可后才能收集和分析他们的个人信息。同时,还需要得到这些数据的组织或提供者的同意和批准。但学生一般不希望透露自己的个人信息,并且大部分组织或机构不愿意提供自己系统或平台上的数据。学习分析实践中存在着学生在学习中产生了“大数据”,但研究者却苦于无法获得这些“大数据”的现象。学习分析领域还需要制定相应的制度来扩大数据的公开性。同时,组织或机构之间应该建立比较友好的数据共享关系。

参考文献:

[1]殷丙山学习分析技术将成未来关注重点-2012年和2013年《新媒体联盟地平线报告(高等教育版)》比较解读…中国教育网络,2013(10):35-36.

[2][8]Siemens,G.,&Gasevic,D.Proreedings of the lst conference onLearning Analytics and Knowledge[M].New York,NY:ACM, 2011.1-185

[3]高键,张海,王以宁.教育中的大数据如何改变学习?——极具潜力的学习分析技术领域新进展j忡国信息技术教育2013,(8):195-197.

[4] Greller,W.,&Drachsler,H.'l'ranslating learning into numbers:AgenPric framework for learning analytics[J]. Lducational Technologyand SoCIety,2012,19(3), 42-57.

[5][6]魏雪峰,宋灵青.学习分析:更好地理解学生个性化学习过程——访谈学习分析研究专家George Siemens教授[J]中国电化教育,2013,(9):1-4.

[7]孙洪涛.学习分析视角下的远程教学交互分析案例研究[J]中国电化教育,2012,(11):40-46.

[9] H.Drachsler,T.BogPrs,R.Vuorikari,K.Verhert,E. Duval,N.Manouselis,G.Beham,S. Lindstaedt,H. Stern,M.Friedrich, and M.Wolpers. Issues and considerations regarding sharable data sets forrecommender svstems in technology enhanced learning[J]. ProcediaComputer Science, 2010,1(2):2849-2858.

[10] Verbert, K., Manouselis,N.,Drachsler, H.,&Duval,E.Dataset-Driven Research to Support Learning and Knowledge Analytics[J].Lducational Technology&Society, 2012,15 (3), 133-148.

[11][12]郁晓华,顾小清.学习活动流——一个学习分析的行为模型[J].远程教育杂志,2013,(4):20-28.

[13] Valentin Butoianu, Philippe Vidal, Katrien VerVbert, Erik Duval,Julien Broisin. User Context and PPrsonalized Learning:a Federationof Contextualized Attention Metadata[J]. Joumal of Universal ComputerScience, 2010?16(16), 2252-2271.

[14] ll-Hyun Jo,Dongho Kim,MPPhyun Yoon. Analyzing the Log Patternsof Adult LearnPrs in LMS Using Learning Analytics[DB/OL].http://dx.doi.org/10.1145/2567574.2567616,2015-06-16.

[15] Koulocheri E,Soumplis A,Xenos M.Applying Learning Analyticsin an Open Personal Learning Lnvironment:A QuantitativeApproach[DB/OL].https://www.infona.pl/resource/bwmeta l.element.ieee-art-000006377407, 2015 -02-12.

[16] Verhert, K., Manouselis,N.,Drachsler, H.,&Duval,E.Dataset-Driven Research to Support Learning and Knowledge Analytics[J].Lducational Technology&Society, 2012,15 (3), 133-148.

[17][19]廖競,张晖.一种灵活的网络学习行为数据采集与分析系统[J]信息与电脑(理论版),2011,(1):85-86.

[18] Lyndon Walker. Twitter Learning Analytics in R. ascilite Conference,http://www.ascilite.org/conferences/Wellington12/2012/images/ustom/walker,- lyndon一- twitter learning.pdf,2015-05-15.

[20] Dey A K,Abowd G D,Salber D.A Conceptual Framework and a Toolkitfor Supporting the Rapid Prototyping of Contex- aware Applications[J].Joumal of Hunan Computer Interar,tion,2001,16(2):97-166.

[21] Simon Knight, Simon Buckingham Shum ,Karen Littleton. Epistemology,Pedagogy, Assessment and Leaming Analytics[DB/OL]. http://oro.open.ac.uk/3663 5/1/LAK13 0/c20Fmalo/c20paper.pdf,2015 -04-16.

[22]乔哲峰.自适应情景感知中间件的情景数据预处理模型研究与实现[D].上海:华东师范大学,2011.

[23] Chair's Message of CAMA 2006[EB/OL]. http://portalparts. acm.org /1190000 /1183604/fm/front matter.pdf,2015-4-18

[24] MarinWolpers, Jehad Najjar, Katrien Verhert, et a.l. ContextualizedAttention Metadata Across System Boundaries[LB/OL]. http://ariadne. cs. kuleuven. ac. be/cam a2007/slides /Wolpers.ppt, 2015-4-18.

[25] Maren Scheel, Katja Niemann, Abelardo Pardo,Derick Leony, MartinFriedrich, Kerstin Schmidt,Martin Wolpers, and Carlos Delgado Kloos.Lsage Pattern Recognition in Student Activities[J]. Towards UbiquitousLeaming Lecture Notes in Computer Science,2011,(6954):341-355.

[26] Claudia Roda, 'l'hierry Nabeth. Supporting Attention in LearningEnvironments: Attention Support Services and InformationManagement[EB/OL].http: / /www. ac. aup. fr/croda /publications /Ecte107.Pdf, 2015-4-18.

[27] Belizki J, Costache S, Nejdl W. Application independent nwtadatageneration[DB/OL]. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.86.2212&rep=repl&type=pdf, 2006.

[28] Chatti M A, Dyckhoff A L, Schroeder U, et al. A reference,e model forLearning analytics[J]. International Journal of Technology EnhanedLearning, 2012, 4(5-6): 318-331.

[29] Suthers D. & Rosen D. A unified framework for multi-level analysisof distrihutecl learning[DB/OL]. http://lilt.ics.hawaii.edu/papers/2011/Suthers-Rosen-LAK-201 l-Final.pdf, 2011.

[30] Dietze S, Drachsler H, Ciordano D. A SurVP.y on Linked Data andthe Social Web as facilitators for TEL recommender systems[M]. NewYork: Springer, 2014.47-75.

作者简介:

张艳霞:在读硕士,研究方向为教师网络研修(zhangyanxia16@163.com).

孙洪涛:高级工程师,研究方向为远程教学交互、学习分析和教师专业发展(sunhtao@gnlail.com)。

李爽:副教授,硕士生导师,研究方向为远程教育基本理论、远程学习支持、学习分析(lilybnu@bnu.edu.cn)。

陈丽:教授,博士生导师,北京师范大学远程教育研究中心主任、交互媒体与远程学习实验室主任,研究方向为远程教育的理论与实践(lchen@bnu.edu.cn)。

How to Use the Data to Describe the Learning Process

-A Review of Data Sets Used in Learning Analytics

Zhang Yanxial.2, Sun Hongta03,Li Shuangl.2, Chen Li4 (l.Research Centre of Distance Education, Beijing Normal University, Beijing 100875; 2.Interactive Media and Distance Learning, Beijing Normal University, Beijing 100875;3.Education Technology Center, Minzu University of China, Beijing 100081; 4.Capital Institute for the Learning Society, Beijing Normal University, Beijing 100875) Abstract: Huge amount oflearners' dataset is stored in education information systems with different formats and different granularity levels. These data provide the possibility to find and solve the problems of students in the learning process using learning analytics. However, how to use the appropriate data to describe the learning process of learners is still a great challenge for researchers. The data set is one of the core issues of Learning Analytics research. This article firstly provides a review of the typical data sets of learning analytics. Then we analyze and compare the objectives of analysis, the categories of models, the sources of data, the specific data items and the methods of analysis of the typical data sets. Finally, this paper presents the summary and analysis of the current situation and trend of research on data models of learning analytics. Tlus article shows a general picture of data sets in the field of learning analytics and lays the foundation for subsequent research in the future. Keywords: Leanung Analytics; Data Sets; Learning Process

收稿日期: 2015年6月22日

責任编辑:赵兴龙

猜你喜欢
学习分析学习过程
大数据思维下教学过程数据分析及应用研究
在线学习过程管理大数据的建设与应用
计算机组成与结构课程教学的探讨与实践
信息技术支撑下的课堂应如何评价
简析小学劳动与技术教育的有效合作学习
新课改下提高数学课堂教学有效性的思考
高职日语课程形成性评价方式探讨
求知导刊(2016年30期)2016-12-03 10:41:35
基于学习过程的高中区域地理教学调查与分析
浅析大数据在教育中的应用
人间(2016年28期)2016-11-10 23:13:41
生本教育理念下的美术教学研究
成才之路(2016年25期)2016-10-08 10:45:16