王楠 张玮
摘 要:网络学习者的资源应用行为分析是学习分析领域的研究重点。本研究通过文献分析,系统梳理了国内外学者关于资源应用行为分析的研究成果,提出了“收集-分析-应用”于一体的资源应用行为分析框架,将分析过程具体区别为描述型、诊断型和预测型三种类型,并采用“python”语言及“django”框架设计和开发了基于该框架的资源应用行为分析系统,同时利用edX和案例网络教育学院的真实数据对系统可用性进行了验证。本研究对于探索网络学习者资源应用行为特征,实现更为有效和精准的远程学习指导都有着重要意义。
关键词:网络学习者;资源应用行为;行为分析系统;系统设计
中图分类号:G420 文献标志码:A 文章
一、引言
随着信息技术的不断发展,教育信息化的水平也在不断提高。越来越多的人开始使用网络进行学习,这些新技术的应用也带了教育数据的爆发式增长,探究数据的奥秘无疑将成为未来教育领域的研究热点之一。学习分析、教育数据挖掘、教育大数据等方法的提出都是对这一数字时代的呼应。网络学习行为是发生于e-Learning环境中的、与学习相关的各种行为,其行为主体是学习者,行为客体则主要为数字化学习资源[1]。根据穆尔的学习行为交互分类理论,学习过程中有三种交互类型:学习者与学习内容的交互、学习者与教师的交互、学习者与学习者的交互网络学习交互行为。本研究所关注的资源应用行为,其研究的主要对象就是关注学习者与学习资源的交互,相对于网络学习行为而言,资源应用行为更直接和具体,因而数据更容易被记录和分析。
毫无疑问,数据分析方法和分析技术在在线教育领域的应用已经越来越多,其研究成果层出不穷,处于快速发展之中。比如社会网络分析工具“SNAPP”能够从学习管理系统中获取数据,通过可视化的方法显示学生之间互动情况;同时,已有内容分析工具能够利用视觉分析技术,获得学习者学习过程信息。本研究关注于网络学习者资源应用行为分析系统的设计与实现,一方面旨在弥补现有学习平台分析功能的匮乏,已有的众多在线学习平台大多不具有深层次意义上的分析功能,或者甚至就没有相应功能,其分析过程和方法的标准化也根本无从谈起;另一方面则是力图使得面向学习者的行为分析可以更为便捷。
二、研究目标和方法
本研究的目的在于设计开发网络学习者资源应用行为分析系统。基于已有研究,本文通过文献分析对国内外学者关于资源应用行为分析模型以及主要分析方法进行梳理,在此基础之上提出了资源应用行为分析框架,将分析过程分为描述型、诊断型和预测型,模型从宏观角度对资源应用分析系统的开发提供了建设性的意见;基于此框架,研究设计和开发了资源应用行为分析工具,此工具实现接收教师或教学工作者上传的资源应用行为数据,并通过系统内部的分析过程反馈分析结果,最终实现描述型、诊断型和预测型三方面核心功能。本研究的技术路线经历了理论建构、技术实现、应用验证三个阶段,相应地综合应用了文献分析、技术开发等研究方法。
理论建构阶段。主要研究了行为科学与行为主义学习理论、学习分析技术、学习者分类模型,并在此基础之上,依据网络学习者与学习资源交互的环境特点,提出了网络学习者资源应用行为分析模型并建立了三个维度的分析方法。
技术实现阶段。主要研究可视化技术,数据分析方法,机器学习算法用来分析网络学习者资源应用行为数据,以期评估学习过程,诊断学习情况,预测未来表现等。
应用验证阶段。主要是在资源应用行为分析模型的基础之上,通过使用Web开发技术以及数据分析方法、机器学习算法开发和实现网络学习者资源应用行为分析工具,工具能够接收上传的学习相关数据,通过选择不同的分析方法获取分析结果。最后使用工具分析案例网院成人教育的数据和部分MOOC开源数据来验证工具的可用性。
三、相关研究
国外对于资源应用行为的研究更多偏向于应用实践方面。自2012年学习分析技术提出以来,越来越多的学者开始关注并研究学习者在网络学习中的学习行为。美国普渡大学通过建立预测模型和使用相关可视化技术,对学习者的学习情况进行实时跟踪,当学习者可能出现学业不通过等危险情况时,可视化信号就会将此信息传递给教师和学生,以便改善学习者的学习效果[2]。A Anderson、D Huttenlocher等人通过对Coursera平台上的课程数据分析得出课程参与度与学生绩效的关系,優秀学习者的学习习惯以及激励机制对学生参与度的影响[3]。麻省理工学院的PJ Guo、J Kim、R Rubin分析了edX上690万条视频观看记录,统计分析后得出结论:少于六分钟的视频最吸引人[4]。本研究调研了现阶段关于资源应用行为的国内研究,时间范围从2004年到2016年,共搜索出1130篇文献。纵观目前国内的研究成果,发现大体可以分为以下几个方向:
(1)关于网络学习行为的理论研究,其中包括天津外国语大学杨丽娜等关于行为动机的研究,文中从心理因素、技术因素和资源因素三个方面建立了行为发生的前因模型,并对提出的因素进行了验证[5];华中师范大学彭文辉在对学习行为内涵深入研究的基础上,提出了一个学习行为的OCCP分类模项,以及网络学习行为的“S-F-T”三维分类模型,这两种模型是抽象和形式化描述学习行为序列的基础[6]。辽宁师范大学李玉斌等学者以计划行为理论为指导,构建起具有9个潜在变量的网络学习行为模型(USEBM)[7]。
(2)关于网络学习行为分析系统的研究,其中包括陕西师范大学王丽娜以对网络学习行为系统分析为基础,结合网络学习行为评价的目的和指标,设计了网络学习行为的评价模型[8];华中师范大学黄克斌等通过分析常见的网络学习行为量化参数,设计了一个智能化的网络学习行为分析系统[9];中南大学吴玲艳运用Web Services和Web日志挖掘等技术,设计并初步实现了包含行为采集、行为统计分析、学习评价三个模块的网络学习行为分析评价系统[10]。
(3)关于行为指标的分析研究,国家开放大学魏顺平等通过记录学习者对网络课程不同模块的浏览及跳转数据,分析学生对资源的使用情况[11]。国防科学技术大学范洁通过对决策树中C4.5算法的研究,提出了一种基于属性相关性的C4.5决策树规则生成算法预测学生成绩[12]。东北师范大学马杰等人运用多元回归分析预测与学生课程总分呈显著相关的教学模块,通过预测模型快速定位重点模块,从而提高教学效果[13]。
综上所述发现,国内外在资源应用行为的研究上收获颇丰。各种模型、各种系统、各种分析方法层出不穷。将这些研究仔细分析对比以后不难发现,虽然学者们在各自研究的基础上都取得了一些突破,但大家更多是依照自己的研究领域和方向,以及能够获得的资源设计分析系统和方法,而各种方法和系统之间差别较大,没有形成一个统一的体系或者框架。这就导致研究成果的实践性比较差。现如今,越来越多人来到线上进行学习,但是在线平台和系统的不同也导致了数据整合上的困难,虽然大数据分析技术已逐渐的成熟,但是在基础设施的建设上如达不到一定的统一,这将使得未来对网络学习者资源应用的分析过程变得更加复杂。
四、前期研究
本研究在对这些学习分析模型进行分析总结的基础之上,加之对学习者在网络学习环境中的资源应用行为进行了相关研究,提出了网络学习者资源应用行为分析框架,如图1所示。本模型主要借鉴了学习分析模型中的三个主要过程和循环结构。
资源应用行为的整个分析过程主要是由数据收集、数据分析和知识应用三个部分组成。第一个阶段是数据收集。收集的数据主要来自于在线学习平台的数据库以及日志文件,数据库和日志文件里保留了学习者与网络学习资源交互的大部分行为数据。由于数据的来源不同,所以需要将收集到的数据进行相应处理,其中包括标准化处理、删除存在误差的数据以及对空值进行填充等。资源应用行为分析模型中使用的数据是学习者与网络学习资源交互时产生的行为数据,这些数据可以根据不同的特点分为行为过程数据和行为结果数据。其中,行为过程数据是指网络学习者在学习过程中与学习资源交互时产生的操作型数据,例如:登陆时间、登陆时长、练习时长等。行为结果数据是指由一连串操作行为以后产生的结果型数据。例如:学生练习的成绩、系统对学生的学习情况的评价、是否通过考试等。
第二个阶段是数据分析。数据分析阶段基于数据分析方法、機器学习算法等,对数据进行分析。此模型中将数据分析分为三种不同类型的分析,主要包括:描述型分析、诊断型分析、预测型分析。描述型分析是根据事先分析的成果,将某些数据集中,以某种直观、概括、全面的形式将需要表达的信息展现出来。教师可以通过这些直观的结果迅速发现整个学习过程中的一些特点,总结出一些规律等。由于学习者心理因素、成长环境等因素的不同,导致在在学习过程中表现出特点也有所差别,识别出这些不同不仅可以帮助教师更好的了解学习者,为个性化教学提供保障。诊断型分析就是利用资源应用行为数据建立学习者分类模型,接着再根据模型对学习者进行分类,并针对不同的学习者提供个性化的指导方法,改善学习结果。教师需要根据诊断的结果,按照学习者的偏好和习惯组织学习活动和资源,以便取得更好的教学效果。预测型分析主要是根据学习者在学习平台中留下的行为数据,使用机器学习算法建立数据与数据之间的关系,最终达到预测学习绩效的目的。此类型的分析可以帮助教师找到那些可能无法通过考试的学习者,教师需要对这些学习者采取必要的措施以改善学习行为。
第三个阶段就是知识应用。知识应用的对象主要是教师、学生以及从事教学相关的工作者。经过相应的数据分析以后,教师根据分析的结果,结合自身教学经验和已知的学生特点进行相应的知识应用。由于分析类型的不同,知识应用的方法也不相同。可以分为可视化、个性化和预测三种。可视化是指将数据库中的数据用图表的方式呈现,利用计算机的处理能力将海量的数据转换成直观可见的图形图像,将复杂不容易理解的信息表示出来。个性化是根据诊断型分析中分析结果,通过网络学习者在学习过程中资源应用行为的不同表现,诊断出属于具体的类别,然后针对不同类型的学习者,提供个性化的指导方法。预测是将当前学生的资源应用行为放入预测型分析模型中,对学生下一阶段学习结果或者学习行为进行预测。
最后,模型还强调了循环结构,模型将知识应用的结果反馈给收集数据、分析系统的管理者,或者教辅人员根据返回的结果重新设计和改善收集的数据,提高分析的准确度。需要注意的是,整个分析过程是在宏观和微观环境下工作的,这里的环境包含了影响整个分析过程的各方面要素条件。
五、系统设计及开发
1.系统设计原则
根据资源应用分析工具自身的特点和使用环境,整体的设计都需要遵循以下几个原则:
(1)简便性
分析工具的使用者大多是一些计算机技术能力较弱的教师,对于他们来说只需要掌握一些简单的操作获得自己想要的结果。所以在这个系统的功能设计和流程设计中一定要注意操作的简便性,能够使计算机水平一般的人也能够使用此工具。
(2)独立性
如上所说,工具的分析功能可能随时需要调整,在这个过程中就需要注意系统的独立性。其中每个分析功能需要独立出来,当系统需要改变某个分析方法的时候,要保证其能够不影响其他功能的分析过程。
(3)可扩展性
可扩展性能够保证系统对变化及时做出反应。系统的功能不仅需要调整,更多的时候需要增加某个某块或某种功能,此时较强的可扩展性能够使系统迅速适应这种变化。
(4)准确性
毋庸置疑,此工具最主要的功能就是分析方法的使用。而这些分析方法必须保证其一定的准确性,只有正确的分析结果才能帮助教师了解和改善学习者的学习情况。
2.系统设计思路
分析工具的整个工作过程可以看做是一个“黑盒”,工具的使用者只需要按照工具给出的格式上传数据,具体分析功能将交给系统来完成。使用者在上传文件之后,点击自己需要分析的部分就可以获得相应的分析结果。因此,根据系统功能确定系统的输入和输出,系统的输入是用户上传的学习者相关数据,系统的输出是具体的分析结果,如图2所示。