王红
摘要:随着网络技术、数据采集技术的快速发展,以及大数据的不断崛起,大量的教育大数据以各种方式得到收集。使用恰当的数据表征学习过程,利用数据分析技术发现学习者学习过程中的问题,对学习者、教学者和管理者具有及其重要的意义。本文基于当前学习分析现状,发现当前学习分析的相关研究中数据采集方面存在的不足,从不同角度体现数据表征内容和数据表征结果,对教育领域学习分析平台的开发及学习活动分析有一定的意义。
关键词:学习分析;教育大数据;数据表征
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2019)19-0027-02
学习分析和教育數据挖掘,是教育大数据的两个主要应用领域。[1]美国新媒体联盟(NMC)在地平线报告中连续四年把学习分析作为影响教育发展的趋势和关键技术[2][3][4],而学习分析在许多方面指的是应用于教育领域的“大数据”分析。[5]目前绝大多数的学习者的数据来源于固有的平台数据,平台开发者根据平台不同的应用开发出相应功能的平台采集学习者的数据。然而学习者的学习状态受到很多其他因素的影响,而这对采集数据的完备性具有极大的挑战,通过多样的数据表征还原教学活动的真实状态具有现实的研究意义。
1 教育大数据与学习分析
1.1 教育大数据
大数据从产生之初一个特定领域的词汇到目前各行各业都在不断挖掘与探索的热词,大数据的核心特征常被概括为“4V”,即数据量大(Volume)、输入和处理速度快(Velocity)、数据多样(Variety)和精确性(Ve-racity)[6]。教育大数据是大数据的一个子集,特指教育领域的大数据,是指整个教育活动过程中所产生的以及根据教育需要采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合。[7]教育大数据简而言之就是教育活动中的对象在教育活动或学习环境中一切行为数据的集合。教育活动的对象即教师、学生、教学活动管理者;教育活动对象所处的教育活动或学习环境分别是教学过程、学习过程、教育管理过程;教育大数据采集的数据即为教育对象在教育活动中做了什么以及如何做所产生的巨大的数据集。
1.2 学习分析
学习分析的定义源于美国高等教育信息化协会的“下一代的挑战”,即使用数据和模型预测学生收获和行为具备处理这些信息的能力[8]。第一届“学习分析和知识国际会议”提出学习分析是用于对学习者及其学习环境数据进行测量、收集、分析和报告,以理解和优化学习和学习环境的技术。[9]学习分析的定义自源起到后来的不断发展,其对象主要是学习者及学习者所处的环境,主要目的是通过多样化的数据预测学习者的学习行为,指导学习者的学习行为,调整或修正学习者的学习行为,促进学习者的发展。学习分析是根据学生活动,基于活动数据,依托技术背景,通过不同视角,分析学生行为,以修正学生活动,优化学习环境从而促进学生发展为主要目的的过程。
1.3 教育大数据与学习分析
学习分析是基于学习者在学习过程及学习环境中的一系列行为产生的数据进行的,学习者在学习过程及学习环境中的一系列行为数据是教育大数据的一个子集。
2 现阶段学习分析中的数据表征不足
2.1 现阶段学习分析中的数据
学习者、教学者在学习环境中的一举一动、一言一行都可以转化为数据。学习者通过学习平台完成各种学习任务所产的行为与活动都可以作为大数据的来源。何克抗指出目前学习分析技术所需数据的主要来源有:数据仓库中的基本信息数据;用户在网络中的浏览记录;学习平台和各类学习系统中通过数据库采集的数据。[10]张艳霞,孙洪涛指出网络学习行为数据、情境数据和注意元数据是现有学习分析研究数据集的主要来源。[11]布朗(Brown,2012)从数据内容表征的角度将学习分析研究对象划分为个性特征指标(dispositional indicators)和行为表现指标(activity and performance indicators)。[12]前者主要是值与学习者自身相关的数据,这些数据具有较高的客观性,后者主要是指学习者在学习过程的各种学习行为产生的数据。
2.2 数据表征存在的不足
尽管当前对于学习分析过程中的数据进行了相关研究,对由于数据来源的广泛性,数据完备性更备受关注和考验。现有的学习分析对数据采集及数据表征存在不足,主要体现在以下几个方面。
(1) 对学习者产生的文本数据的采集与分析不够完善
当前大多数学习平台将学习者参与讨论、测评等通过文本的形式存储下来,对数据的处理大多数停留在对学习者参与的积极性,但对学习者对学习内容的具体掌握情况的分析及判断存在片面性。同时,对文本数据的采集绝大多数通过让学习者写的方式,但是对于特定的学习内容,学习者直接表达出来会对学习者的学习状态有更好的预测和指导作用,有声思维相关研究在语义编码方面也存在较大难度,因此将有声思维相关技术结合到平台中的研究较少。
(2) 对学习者生理数据的采集具有一定的局限性
通过学习平台对学习者在线活动数据进行采集,但是对学习者的生理表征,相关数据的采集有一定的困难。尽管学习者的生理数据可以通过各种可穿戴设备的得到采集,但是由于网络学习平台使得学习者与教学者、管理者处于时空分离的状态,对于远程学习者通过可穿戴设备体现学习者生理变化受到学习环境的限制。通过可穿戴设备采集学习者生理数据就目前大多数学习平台,比较适合于管理者、教学者与学习者能够处在同一现实学习环境中。
(3) 采集数据的连续性不足
开发者进行平台开发时大多数考虑到平台特定的学习对象以及其对学习内容的阶段性需求,但是对学习者学习前状态了解的较少。对学习者各种数据的采集仅是对学习者当前阶段的数据的统计。信息化时代,数字土著越来越多,如果可以通过特定的平台形成学习者特有的电子档案,跟踪学习者不同阶段学习状态的变化,对学习者、教学者、管理者都将是一笔财富。
(4) 线上-线下结合不足
大部分的学习平台仅通过线上方式采集学习者在线学习行为产生的相关数据,线上-线下相结合的方式,更能够反应学习者最真实的学习状态。通过线下访谈,观察,问卷等方式对学习者产生的学习数据进行采集统计。但是,线下的大多数方式要求学习者与教学者,管理者能够处于同一现实学习环境中,对于远程学习者的效果或许不佳。
3 学习分析中的数据表征内容与表征结果
3.1 从数据类型上体现数据表征内容
基于当前各类学习分析平台和学习分析工具,将数据按照数据的不同特征进行划分。教育大数据也具有大数据的“4V”特性,从不同的角度对采集到的数据可进行不同类型数据的划分。
(1) 从数据事实性的角度
从数据事实性的角度,将数据类型分为静态数据(如年龄、身份、学历等)和动态数据(如浏览时长、脑电变化数据等),所谓静态数据即与学习者直接相关的事实性数据,动态数据集由于学习者一系列学习行为所产生的数据。
(2) 从资源类型的角度
从资源类型的角度,将数据类型分为文本(如参与讨论的内容、搜索的关键词等)、图片(图片关注时间、关注次数等)、视音频(如浏览视频次数、点击视频次数等)、动画及其他数据(如学习者心跳速率、情绪状态等),对于不同的数据表现形式,进行相应的文本分析、图文分析、视频分析、音频转换分析、生理分析。
(3) 从数据的获取设备要求的角度
从数据的获取设备要求的角度,将数据类型分为行为数据(如下载文件、拖动滚动条次数等)和生理数据(表情特征、脑认知活动、注意力水平等),行为数据即学习者外显能够直接通过学习平台表现出来的以及能够直接记录下来的数据,生理数据即需要依托多种可穿戴设备(如,视觉跟踪器、脑电仪器、心脏速率监视器等)反应出来的学习者学习过程中内隐的数据。
3.2 从用户的出发体现数据表征结果
教育大数据视野下,数据的表征可以依据不同的目的分别从学习者、教学者、管理者的角度出发(即“Who”),考察不同的用户在不同的情境下(即“Where”),所发生的不同的行为(即“What”),从而分别对不同用户产生了什么样的影响(即“How”),从而进行综合考察。例如,通过学习者在课堂(学习过程)中抬头和低头次数和时长的统计了解学生课堂关注度;通过教师在(教学过程)中提问时学生举手次数了解知识的难易程度;通过管理者在学习平台上发布资源后学习者的点击及阅读数量确定发布该类型资源的情况。
4 结束语
本文对教育大数据视角下学习分析中有关数据表征进行了一定的研究,教育大数据的大量涌现,信息技术的不断发展,二者相结合的教学模式中,对数据表征的要求会越来越高。如何才能够提高数据表征有效性,对学习者学习预测与评估、教学者教学效能改进以及管理者资源配置提供相对准确的服务与建议在未来的发展中也具有极高的意义与价值。
参考文献:
[1] 王良周,于卫红.大数据视角下的学习分析综述[J].中国远程教育,2015(03):31-37.
[2] JOHNSON L, ADAMS BECKER S, WITCHEY H, et al. The NMC Horizon Report: 2011 Museum Edition[J]. Austin, Texas: The New Media Consortium, 2011.
[3] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2013 higher education edition[J]. 2013.
[4] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2012 higher education edition, Austin [J].http://www.nmc org/publications/2013-horizon-report-higher-ed, 2013.
[5] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2013 higher education edition[J]. 2013.
[6] 刘雍潜,杨现民.大数据时代区域教育均衡发展新思路[J].电化教育研究,2014(5):11-14.
[7] 杨现民,唐斯斯,李冀红.发展教育大数据:内涵、价值和挑战[J].现代远程教育研究,2016(01):50-61.
[8] 吴永和,陈丹,马晓玲,等. 学习分析:教育信息化的新浪潮[J]. 远程教育杂志,2013,31(4):11-19.
[9] Siemens G. Learning and knowledge analytics-knewton-thefuture of education? [EB/OL].[2017-01-17].http://www.learning -analytics.net/?p=126.
[10] 何克抗.學习分析技术在我国的新发展[J].电化教育研究,2016,37(07):5-13.
[11] 张艳霞,孙洪涛,李爽,等.数据表征学习过程及其应用——学习分析数据集国际研究综述[J].中国电化教育,2015(09):85-93.
[12] 吴青,罗儒国.学习分析:从源起到实践与研究[J].开放教育研究,2015,21(01):71-79.
【通联编辑:光文玲】