面向在线教学平台的数据可视化方法及应用

2018-03-21 11:32刘海李姣姣张维张昭理易泽顺
中国远程教育 2018年1期
关键词:教育大数据数据可视化智慧教育

刘海 李姣姣 张维 张昭理 易泽顺

【摘 要】

随着在线教学平台在国内高校的兴起,学生学习行为数据呈几何级数增长。如何对海量数据进行处理分析,挖掘教学环境中存在的不足,帮助教学者优化教学内容和教学过程,逐渐成为教育研究者关注的热点。本文在分析教学平台数据特点的基础上,提出了一系列面向教学场景的数据可视化方法。通过数据可视化方法的编程实现,教师可以为学生直观地呈现知识,及时了解学生学习状况,并有针对性地进行课堂教学、教学评价等;学生可以形成知识框架与互联体系,促进知识表达与内化,并完成自我评估、发现自己的学习问题;教学管理者可以掌握教师教学效果和学生学习情况,调整教学管理与决策的目标。本文结合自主研发的在线教学平台——师大云课堂,将实现的数据可视化方法应用到实际教学,产生了良好的实践效果,有效地促进了智慧教育发展。

【关键词】 教育大数据;数据可视化;在线教学平台;教学研究;智慧教育

【中图分类号】 G434 【文献标识码】 A 【文章编号】 1009-458x(2018)1-0037-08

一、引言

随着信息技术的日益发展,人们开始通过计算机技术和互联网技术进行教学内容的传播和学习。《国家中长期教育改革和发展规划纲要(2010-2020年)》明确指出“信息技術对教育具有革命性影响”。因此,许多学校及教育机构都研发了自己的在线教学平台,对教学理念、教学模式、教学环境等方面进行变革与创新,有效地提高了教育信息化水平(蔡慧英, 等, 2013; 荣荣, 等, 2014; 刘婷婷, 等, 2016)。在线教学平台的兴起,也引发了在线学习的热潮,越来越多的学习者参与其中。同时,平台汇集了大量的学习者和学习资源,以及学习者在学习过程中产生的各种行为数据,蕴含着大量有价值的信息。因此,如何提高人们快捷理解数据的能力,将数据转换成人们更容易理解的形式,是一个亟待解决的问题。

针对上述问题,数据可视化技术作为一种直观呈现海量数据的方式,越来越受到人们的关注和重视。相关研究表明,大脑处理的信息多数与视觉有关,处理与视觉相关信息的脑细胞超过80%。人眼对可视符号的感知度比对文本或数字要快得多。可视化技术将数据信息以“一图胜千言”(Labrinidis & Jagadish, 2012; 邓烈君, 等, 2016)的表达方式呈现,充分利用了人们对可视模式快速识别的自然能力,完美地提高人们理解及分析数据的速度,帮助人们更有效地对海量数据进行挖掘,从而突破教育大数据分析的桎梏。

本文在阐述和探究数据可视化的内涵及技术分类的基础上,分析了在线教学平台中的数据类型特点,提出了一系列面向教学场景的数据可视化方法,并在华中师范大学国家数字化学习工程技术研究中心自主研发的在线教学平台——华师大云课堂中应用实践,以期对用户(包括教师、学生和教育管理者三种角色)产生积极的影响。

二、数据可视化内涵及相关工作

(一)数据可视化

数据可视化,目前存在着多种不同的定义形式。从广义讲,数据可视化囊括了较成熟的科学可视化和较年轻的信息可视化。除此之外,还包含了在此基础上发展起来的知识可视化(Card et al., 1999; 李芒, 等, 2013)。从狭义讲,数据可视化是指运用计算机图形学知识和图像处理技术,以可交互式图形图像的方式来展现数据的理论、方法和技术(陈为, 等, 2013; 斯蒂尔, 等, 2011),其可视化对象仅仅为狭义理解的数据。结合自主开发的云课堂教学平台,对以下教育教学数据进行了可视化:课程和课堂的建设情况、教学中的资源建设情况、教师参与云课堂情况和学生在线学习行为数据等。

(二)数据可视化分类

数据可视化分类是可视化研究的关键环节。将数据可视化进行分类能够指导人们设计出合理的可视化方案,促进可视化技术从理论研究走向实际应用阶段。数据可视化有不同的分类,从文献常用的角度可将可视化分为科学计算可视化、数据可视化、信息可视化和知识可视化四种类型。Shneiderman(1996)依据数据类型将数据可视化分为一维数据可视化、二维数据可视化、三维数据可视化、多维数据可视化、时间序列数据可视化、层次结构数据可视化和网络结构数据可视化等几种数据类型。Keim(2002)提出了一种基于可视数据分析技术的可视化分类方法,认为数据可视化技术、数据类型和交互变形技术三个要素构成了数据可视化。基于这三个要素将数据可视化技术分为以下四种类型(如图1所示)。

1. 基于几何的数据可视化

基于几何的数据可视化技术是通过几何学中的投影和变换来实现对多维数据的可视化(Sibbet,2010)。标准2D/3D技术是在数据可视化过程中应用最广泛的一种可视化技术,常用的可视化图形有柱状图、饼图、折线图等,本文将其归为几何技术中的一种。几何技术分为两种:几何变换技术和几何投影技术。几何变换技术是以二维图形点、线、面等表示多维数据的一种映射变换技术;几何投影技术是以几何投影的方式来表示将要可视化的数据。常用的基于几何的可视化技术包括平行坐标(Parallel coordinates)、散点图(Scatter plots)和地形图(Landscapes)等。

2. 基于图标的可视化技术

基于图标的可视化技术也是常见的可视化技术之一(Nahum & Stephen, 1997)。将可视化数据中的每一项记录都映射成一个小图标,N个小图标表示N条数据项,且每个小图标之间是相互独立的。基于图标的可视化技术包括彩色图标(Color icons)、枝形图(Stick figures)、切尔诺夫脸(Chernoff faces)等,适用于属性值在二维平面上容易展开的数据集。

3. 面向像素的可视化技术

面向像素的可视化技术是由德国慕尼黑大学的Keim教授提出的,在此技术上成功研发了VisDB可视化系统(Keim & Kriegel, 1994),该系统充分展示了面向像素的技术在可视化方面的优势。面向像素的可视化技术的主要思想是将每一数据项的N个属性值映射到N个带有颜色的屏幕像素上。每个屏幕反映一个属性,每一个像素反映一个属性值,像素不同的颜色代表属性值的大小。面向像素的可视化技术适用于维度高、数据量大的数据集,能将不同维度的数据集在不同的窗口密集显示。这种屏幕划分技术所呈现出的可视化结果充分解释了“物以类聚”的含义,有利于用户对数据集的宏观掌控。

4. 基于层次的可视化技术

基于层次的可视化技术主要针对具有层次结构的数据集,如文件组织结构、家族图谱、人事组织等(任磊, 等, 2014; 陈谊, 等, 2016; 李志飞, 等, 2016)。该技术的基本思想是把所有维划分成子集,即子空间,将这些子空间按层次进行可视化。典型的基于层次的可视化技术有n-Vision技术、锥形数(Cone trees)、树图(Treemap)、维栈(Dimensional stacking)等。

三、在线教学平台数据特点及可视化方法

本团队自主研发的在线教学平台——师大云课堂(如图2所示),分为PC端和移动端两种版本,为学习者提供多种学习方式。依据师大云课堂在实际运行时采集的学习行为数据,对在线教学平台的数据特点进行分析,并将数据分为低维数据、高维数据、层次数据、文本数据、地理数据和关系数据六种数据类型(如图3所示)。根据数据不同的类型提出不同的可视化方法,使可视化结果能够满足各类用户的实际需求。

(依据师大云课堂在实际运行时采集的学习行为数据情况)

(一)低维数据

低维数据中包含了一维线性数据、具有两种属性的二维数据和具有立体属性的三维数据。一维数据分为定量型和非定量型两种。定量型采用有向线段上的点映射,非定量型则一般运用色块展示。

针对二维数据的可视化,本文根据视觉通道的不同分为两种:基于位置的方法以及基于颜色和面积的方法。基于位置的方法是指数据的两个维度映射为位置来表现差异,其中典型的统计图包括柱形图、折线图和简单散点图。基于颜色和面积的方法是指数据的一个维度映射为颜色,另一个维度映射为面积,这类方法包含饼图和蓝丁格尔玫瑰图等。

针对三维数据的可视化,本教学平台采用分类降维法与面积映射法,将三维数据变为二维数据进行展示。分类降维法适合第三个维度是分类字段的数据,通常用颜色或者分组对其进行映射,如有色散点图、分组柱形图或折线图。面积映射法适合第三个维度是连续字段的数据,一般运用面积对其进行展示,如气泡图等。

(二)高维数据

高维数据具有多个独立属性,如何将多个属性呈现于二维空间内是高维数据可视化的难点。高维数据的可视化需要先降维。降维方法有很多种,从方法上分可以分为线性和非线性两类。线性的方法有MDS(多尺度分析)、NMF(非负矩阵分解)及PCA(主成分分析)等;非线性的方法包括LLE(局部线性嵌套)和ISOMAP(等距特征映射)。针对高维数据,本平台采用的数据可视化的方法包括两类:基于几何图形的方法和基于图标的方法。基于几何图形的方法主要包括散点图矩阵、平行坐标和平行集可视化;基于图标的方法通过具有多个容易识别的特征图标来展现高维数据,每一个特征映射一个维度。比较著名的是切尔诺夫脸谱图和雷达图。

(三)层次数据

多层次数据本质上是树状结构数据,节点之间既有并列关系又有从属关系。非根节点有且只有一个父节点,父节点与其子节点是一对多的关系,节点之间关系可以分为兄弟关系和父子关系。本教学平台中实现的层次数据可视化方法主要有节点链接法和空间填充法。节点链接法用线条表示节点之间的父子关系,用点表示每一个数据实体;空间填充法有代表性的是Treemap矩形树图布局,用递归的方法以嵌套的方式对矩形进行划分,每个矩形区域表示一个数据实体,矩形的子区域表示其子代节点。

(四)文本数据

文本数据可视化将文字中隐藏的规律以视觉容易捕获的形式表达出来,同时提供必要的交互方式使人能快速获取其中蕴藏的有用信息。在师大云课堂平台中,文本可视化方式主要有基于文本内容的可视化和基于文本关系的可视化。基于文本内容的可视化,典型的有标签云(Tag cloud)(Gas & Wattenberg, 2008; 张昭理, 等, 2017);基于文本关系的可视化,它的关注点主要是文本语义之间的关系和文本的内部结构,如Word Tree、Phrase Net等。

(五)地理数据

地理数据可视化指通过在可视化过程中加入地理维度,同时运用具体的视觉表征和人的视觉能力使空间的上下文(Context)和问题显现出来的方法和技术(Kwan, 2000)。地理数据可视化与GIS(地理信息系统)密不可分。地理信息系统是以计算机为基础的工具,包含分析、存储、处理、可视化地理信息几个部分。针对地理类数据的展现形式,本教学平台实现方式大致分为三类,分别是基于点、线和区域的展现方式。

(六)关系数据

关系数据不同于层次数据,没有固定的自顶向下或由底向上的层次关系,反映了数据之间存在的直接或间接的关系,表达方式更加自由。关系数据的可视化即图的可视化。本教学平台采用的是基于边和节点的可视化。为避免大量节点的重叠,使用的是力导布局方式。

四、可视化方法在教学平台中的实现与应用

将上述可视化方法编程并实现,集成于师大云课堂教学平台中。目前,云课堂已在学校教学中得到广泛应用,学校的领导、教師及学生都在云课堂上进行管理、教学及学习。华师大云平台上已开设了6,000多门课程,超过45,000个课堂,用户数量(包括教育管理者、教师、助教及学生)达到4万人,上传资源70余万条,总容量超过15TB。这些数据蕴含了平时教师的教学方式和学生的学习行为。基于该教学平台,学生不仅能够在课堂上进行学习,还可以在食堂、实验室、户外及寝室等任何互联网覆盖的地方通过云课堂进行学习(如图4所示)。将可视化技术应用于实际教育教学,对学生、教师和教育管理者都产生了良好的应用效果。

(一)学生:内化学习,促进自我评估

目前,云课堂的使用人数达到4万人,其中学生的人数已超过3.4万人,超过全校总学生人数的80%。为满足学生的需求,本平台记录了他们各个学期所选修的课程以及课程的教学内容和各个课程所取得的成绩,还记录了课堂的平均成绩、课堂的教师、班级成员分布及资源建设情况等。

如图5(a)所示,外圈是某位大三学生所有选修课程的平均成绩,中圈实线所覆盖区域为每门课程的班级平均分数,内圈虚线为各个课程的及格线。当鼠标停在某门课程时,会出现该课程的平均分数和学生的个人成绩。通过这张图,学生可以一目了然地看出自己的学习成绩与班级平均水平的差距,从而能够对成绩较差的课程进行有针对性的学习。

如图5(b)所示的是计算机学院某位大一学生在第二学期的期末考试成绩。该图不仅清晰地展示出该学生每门课程的最终成绩,还将学生每门试卷中各个题型的总分以及学生的得分呈现出来。如该学生的英语学科总分为78分,其中选择题得分与总分比为13/15,完形填空为14/20,阅读理解为26/30,改错为6/10,写作为19/25。从此图可以看出,该生的失分项在完形填空和写作。应当在后期的英语学习过程中着重练习完形填空,并多看多写英语作文。同理,通过该图可以看出“高等数学”和“C语言程序设计”等其他学科中存在的问题,对于此学生可以有针对性地进行补习。

如图6所示,以“教与学”课程中的“学习理论”一章为例,将该章的教学内容以思维导图(赵国庆, 2012)的形式呈现出来,使学生对将要学习的知识在课前有一个整体的概念。学生通过此图可明确看出,“学习理论”这一章节共有五种学习理论,分别是学习的实质与类型、联结学习理论、认知学习理论、人本主义学习理论和建构主义学习理论。在每个学习理论下还有更细化的分支。在授课过程中,教师利用此类型导图,使教学内容更加形象具体,加深学生对内容的理解和记忆。思维导图中各个分支所代表的教学内容可以合拢。利用这个特性,教师可以突出教学重点和难点,并引导学生发散思维。另外,还可以在该图的分支上做标记,标识出学习内容的重难点,以便学生有针对性地进行课后复习。通过思维导图,学生在头脑中形成了清晰的知识结构,对知识的理解和记忆也更加深刻,达到事半功倍的学习效果。

(二)教师:教学反馈,优化教学环节

随着信息技术与课程整合理论的提出,教师也越来越倾向于线上、线下相融合的混合式课堂教学。使用云课堂平台教学的教师也越来越多,意味着教师对在线教学平台的要求越来越高。教师希望不仅能够在教学平台上进行教学,与学生进行沟通,还能够给自己的授课带来反馈,课后可以根据教学反馈及时对教学方法和教学模式做出适当调整。

图7展示了“数字化教学系统开发”课程的学生学习成绩图,并以学生的总成绩由低到高进行排序。实心圆圈折线代表学生的总成绩,实心菱形折线代表平时作业成绩,实心方框折线代表在线学习时长。观察得出,总成绩与平时作业的成绩有较紧密的关系。平时作业完成得越好则总成绩分数高的概率越大,反之,平时作业完成得差则总成绩分数较低。然而,在线学习时长对总成绩的影响却没有这个规律,部分学生在线学习的时间较长,但总成绩却相对较低。教师了解这种情况并找出原因后,对这些学生开展了个性化教学与辅导。

图8显示了学生在“马克思主义基本原理”这门课的论坛讨论情况,统计了学生在课下对教学内容进行主题讨论并发帖的情况。根据每个主题下回帖数量,设定主题字体的大小及颜色。学生回的帖数越多,则字体越大,颜色也越深。根据此图,教师可以快速分析出学生感兴趣或者有疑问的知识点。如“马克思恩格斯的奋斗历程对你的启迪”“马克思主义物质观的基本内容及其当代价值”“社会意识和社会存在的辩证关系”等,讨论的主题较多。针对这些主题,教师将在下一节课中给学生更加详细的讲述或答疑。

图9呈现了学生在云课堂学习的时空分布情况。图9(a)和9(b)展示了学生移动学习的空间位置分布,可以看出学生学习的主要位置集中在学校7号、8号、9号教学楼这3个地方。在其他地方,包括学生宿舍、餐厅、操场等,也有部分学生通过云课堂进行学习。观察得出,云课堂移动端支持多场景的学习方式,在教学楼学习的学生最多。图9(c)不仅反映出了24小时学生平均在线学习的人数,还分别展示了24小时使用PC端、移动端(Android和iOS)在线学习的人数。图9(d)展示了从8月下旬到10月上旬每天在线学习的人数,也将学习的人数按PC端和移动端进行了划分,可以看出大部分学生是通过PC端来进行学习的。因此,教师应尽可能地将课堂教学内容及资源上传到云课堂,满足学生随时随地学习的需求。

(三)教育管理者:科学管理,协助教育决策

学校领导及管理层需要掌握云课堂的整体使用情况。如研究生和本科生分别开设的课程数、课堂数、使用云课堂的学生人数,以及各个学院的教师人数、上传资源的数量和容量等方面,以便规划下一步教学任务和教学决策。

图10展示了云课堂的课程、课堂、教师、学生和资源的整体概貌。图的左侧展示了课程、课堂的开设情况和学生的使用情况,其中本科生人数有26,044人,开设的课程数为5,480门,课堂数为44,632节;研究生人数有8,246人,开设的课程数为405门,课堂数为752节。右侧上半部分展示的是上传资源的数量及容量,并对资源的类型进行了划分,分为文档、视频、音频、动画、图片和压缩包六种。从图中可以看出文档的上传个数最多,表明教师在教学过程中還是倾向于使用word、ppt、txt等文本文档。因此,可以鼓励教师在将来的教学中适当地使用视频、动画等教材,提升学生的学习兴趣,增加课堂效率。右侧下半部分是各个学院的教师人数,因为全校学生必修“大学生英语”或“研究生英语”,还有部分学生会选修特色英语,可以看出外国语学院的教师人数最多,达到191人。而湖北经济与社会发展研究院的特色英语教师人数最少,仅有1人,学校领导重视学院的发展,对这个刚开设的学院将根据现实需求决定引进若干人才。

图11展示了化学学院在云课堂任课的教师数据集的可视化情况。教育管理者可以点击任意教师的图标,查看教师教的所有课程,以及某一门课程的具体教学情况。

综上所述,数据可视化技术可以帮助教学管理者建立学习者模型,对学生的在线学习表现进行分析,进而发现课程设计上的问题,完善教学设计与系统功能,提供更好的教学支持服务,促进教学组织的发展。

五、结论与展望

在线教學数据可视化是大数据发挥教育价值的重要环节,本文将在线教学平台使用过程中产生的教育数据分成六大类:低维数据、高维数据、文本数据、层次数据、关系数据和地理数据。在分析了教学平台的数据特点基础上,本文提出了一系列面向教学场景的数据可视化方法。通过数据可视化工具和技术,教师可以为学生直观呈现知识,及时了解学生学习状况,进行课堂教学、教学评价等。学生可以形成知识框架与互联体系,促进知识表达与内化,并自我评估,及时发现自己的学习问题。教学管理者可以掌握教师教学效果和学生学习情况,调整教学管理与决策的目标。数据可视化方法在实际教学中进行应用,并以师大云课堂为例进行技术实现和展示,解决了本校教育教学中的实际问题,产生了良好的应用效果,有效地促进了智慧教育的发展。

根据实际应用的情况,在线教学平台的数据可视化研究还存在以下不足之处:第一,收集到的数据不能涵盖所有在线学习平台的数据类型(如时序性数据),云课堂投入使用的时间不够长;第二,不能满足部分用户自主指定图表类型的需求,本文只是根据数据类型提供特定的可视化结果。在未来的研究中将针对数据为用户推荐多种可视化布局类型,以增强用户的体验。数据可视化作为教育信息化发展的重要途径,在教育领域的应用还处于初步探索阶段,需要我们不断地探讨与实践。

[参考文献]

蔡慧英,陈婧雅,顾小清. 2013. 支持可视化学习过程的学习技术研究[J]. 中国电化教育(12):27-33.

陈为,张嵩,鲁爱东. 2013. 数据可视化的基本原理与方法[M]. 北京: 科学出版社.

陈谊,甄远刚,胡海云. 2016. 一种层次结构中多维属性的可视化方法[J]. 软件学报(05):1091-1102.

邓烈君,王小根,王露露,等. 2016. 可视化教学生态化发展的知识图谱分析[J]. 中国远程教育(12):15-21.

李芒,蔡旻君,蒋科蔚,等. 2013. 可视化教学设计方法与应用[J]. 电化教育研究(03):6-22.

刘婷婷,陈增照,刘三女牙,等. 2016. 创新信息技术支撑教学变革——以苏州市“未来教室”教育信息化建设为例[J]. 中国教育信息化(18):12-15.

李志飞,张昭理,刘海,等. 2016. 信息技术驱动下资源环境学科的教育创新[J]. 中国教育信息化(12):30-33.

任磊,杜一,马帅,2014. 大数据可视分析综述[J]. 软件学报(09):1909-1936.

荣荣,杨现民,陈耀华. 2014. 教育管理信息化新发展:走向智慧管理[J]. 中国电化教育(03):30-37.

斯蒂尔,伊林斯基,祝洪凯,李妹芳. 2011. 数据可视化之美[M]. 北京:机械工业出版社.

张湘. 2014. 英语阅读教学中的图式交互可视化研究[J]. 中国电化教育(03):123-128.

张昭理,李志飞,刘海,等. 2017. 利用电子双板的知识可视化教学研究[J]. 中国远程教育(3):16-21,79.

赵国庆. 2012. 概念图、思维导图教学应用若干重要问题的探讨[J]. 电化教育研究(05):78-84.

Card, S. K., Mackinlay, J. D., & Shneiderman, B. (1999). Readings in Information Visualization: Using Vision to Think. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA.

David, Sibbet. 2010. Visual Meetings: How Graphics, Sticky Notes and Idea Mapping Can Transform Group Productivity. New Jersey: John Wiley & Sons:1-10.

Keim, D. A., (2002). Information visualization and visual data mining. IEEE Transactions on Visualization and Computer Graphics, 8(1):1-8.

Keim, D. A., & Kriegel, H. P. (1994). VisDB: database exploration using multidimensional visualization. IEEE Computer Graphics and Applications,14(5):40-49.

Gas, F. B., & Wattenberg, M.(2008). Timelines: Tag clouds and the case for vernacular visualization. Interactions, 15(4):49-52.

Kwan, M. P. (2000).Interactive geovisualization of activity-travel patterns using three-dimensional geographical information systems: a methodological exploration with a large data set.Transportation Research Part C Emerging Technologies, 8(1):185-203.

Labrinidis A., & Jagadish, H. V. (2012). Challenges and opportunities with big data. Proc VLDB Endow, 5(12): 2032-2033.

Nahum, D. G., & Stephen, G. E. (1997). Information Visualization. IEEE Computer Graphic and Applications, 17(4):29-31.

Shneiderman, B. 1996. The eyes have it: a task by data type taxonomy for information visualizations. IEEE Symposium on Visual Languages, Boulder, CO,336-343.

收稿日期:2017-04-10

定稿日期:2017-08-01

作者简介:刘海,博士,副教授,硕士生导师;李姣姣,在读硕士;张维(通讯作者),博士,副教授,硕士生导师;张昭理,博士,教授,博士生导师;易泽顺,在读硕士。华中师范大学国家数字化学习工程技术研究中心(430079)。

责任编辑 韩世梅

猜你喜欢
教育大数据数据可视化智慧教育
“教育大数据”视角下的精准教学的研究
教育大数据在教育管理中的运用分析
大数据时代背景下本科教学质量动态监控系统的构建
可视化:新媒体语境下的数据、叙事与设计研究
我国数据新闻的发展困境与策略研究
基于R语言的大数据审计方法研究
高校智慧教育生态发展新挑战
教育大数据研究综述
基于知识图谱的智慧教育研究热点与趋势分析
“互联网+教育”变革路径研究进展