付丽琴
摘要:教师职能已由传统的课堂讲授转变为设计、组织、帮助与指导学生的学习,而学习分析成为了现代教学中必不可少的辅助手段。与此同时,大数据技术的出现为数据的分析应用提供了全新的思维和方式,大大推动了教学的个性化、适应性研究。本文以大数据为背景,结合云存储技术,以教师教学设计为应用目标,讨论学习分析的内容和关键技术,包括学生学习体验数据的获取、存储和分析。
关键词:学习分析;大数据;云存储;教学设计
引言
随着Internet、4G等信息技术的普及,以及MOOC等开放教育资源的日渐丰富,学生获取知识的渠道快速增加,基本实现了随时随地的学习。学习方式的改变导致了教师角色的转变,教师不再是知识的唯一传授者,而成为学生学习的干预者和引导者,教师职能由传统的课堂讲授转变为设计、组织、帮助与指导学生的学习。在此环境下,教师的主要任务就是为学生量身定做最合适的学习环境和个性化指导,具体包括两个方面:一是设计以学生为中心的教学方案,二是设计以学生为主体的教学形式。为了完成此任务,教师不仅要充分利用知识的结构和内在联系,而且更多地依赖于对学生状况的了解,只有预先了解学生的学习特点,才能做出恰当的教学设计。因此,学习分析成为现代教学中的必要的辅助手段。2013年美国新媒体联盟(NMC)的《地平线报告》提出,2~3年内学习分析这项技术将会被广泛接受。
联合国在2012年发布的大数据白皮书“BigData for Development:Challenges& opportunities”中宣告了大数据时代的到来。大数据时代为数据的分析应用提供了全新的思维和方式。在高容量、高速度、多样化数据结构的大数据时代,我们不仅可以借助云服务端来存储海量的结构化、半结构化和非结构的数据,还可利用数据分析和数据挖掘技术从这些海量数据中提取具有重要价值的信息,从而对包括教育领域在内的社会各个领域的发展产生巨大的推动作用。
“数据驱动学校,分析变革教育”的大数据时代已经来临,大数据技术使得我们可以获取每个学生的海量时空轨迹的行为数据,包括学生在学校里发生的每一件事情,学习过程中的全部表现,以及在家用计算机终端学习过程中的一举一动;然后,基于大数据的云计算平台,教师不但可以对反映学生学习成果的各种量化或质性数据进行分析预测,还可以对学生在学习活动中以及虚拟情境中的非结构化行为进行分析,最终利用学习分析的结果做出最适合学生的教学设计,并且为学生推荐学习轨迹。
一、学习分析的内容
以学生为中心的教学设计,包括为学生设计合理的学习任务单和课堂教学形式,提供相关的教学视频和学习资源等。大数据时代的教学设计依赖于教师对学生学习状况的了解,学习分析是从整个系统的角度出发帮助教师做出教学决策,学习分析需要对学生学习过程中形成的海量数据进行解释和分析,以评估学生的学术进展,预测其未来表现,并发现影响学生学习系统的因素,其目的是评估学生、发现潜在问题并最终优化学习,对象是学生及其学习环境,基础是海量数据。
为了准确地了解每个学生的学习需求,不仅要对学生当前的学业表现进行多元化评价,还要在一定程度上预测学生的未来表现,要对每个学生进行全方位的发展性评价。为此,我们需要全面地跟踪记录一个学生的所有表现,既有量化的也有行为表现的,既有课内的也有课外的。根据大数据时代学生学习方式的多样化和灵活性特点,学生的学习数据包括线上数据和线下数据两种。对这些数据进行挖掘和分析,可以全面跟踪和掌握学生的学习行为、学习过程和学习特点。学习是学生与学习内容、教师、合作同学和学习环境之间的复杂交互过程。
(一)线上学习的评估内容包括:
1.学生在线学习表现的统计描述,包括学习时间的投入(如学生在某个知识点上花费的时间)、学习活动频次(如学生对某个知识点浏览的次数)、学习资源浏览(如学生对教学视频中某个片段浏览的次数)、考试成绩等;
2.学习者自主学习路径,包括学习者提问、回答相关问题和师生交流(如师生交互行为分析、师生发帖的内容分析、师生交互的社会网络分析);
3.影响学习者在线学习表现的各种因素,如学习者的兴趣爱好;
4.各种虚拟情境下的学生表现,包括社会态度、责任感、处事方式等。
(二)线下学习的评估内容包括:
1.学生在学习不同模块的阶段性成绩和课堂观察结果;
2.实训表现及过程感受;
3.实习、实训等环境的适应情况;
4.学习活动中与人沟通交流、团队合作的表现。
二、学习数据的获取与存储
(一)学习数据获取
学习数据是指通过对学生学习过程中所产生的学习日志进行滤处理后得到的数据。学习数据的类型非常丰富,其中一部分数据是事后搜集的,如采用传统的考试分数采集的定量数据,以及通过文件、档案记录、深度访谈、参与式观察等多种方法采集得到的质性数据等。大部分学习数据是在学生学习过程中自然发生的数据,是即时产生的,需要实时采集。实时数据的采集主要依赖于传感器、射频识别技术或专门软件等,例如,我们可以利用图像传感器捕捉学生在观看教学视频时的视线移动,用专门软件跟踪记录学生学习时长和完成习题检测的全过程,包括读题的时间、做题的顺序、做题时间、解答过程等;为了研究学生的学习与心理动态,可以在线采集他们的行为踪迹、交友网络和微博等半结构或非结构数据;为了了解学生的价值、态度和道德养成,可用软件记录学生对学术活动和社交活动的参与情况等。
经过各种渠道获取的学习分析数据的种类和结构非常复杂,只有少部分是结构化数据,大部分是难以计量和分析的非结构化数据,如学生的学习路径、学习体验及学生对环境的感受等等,这些数据用传统数据处理方法有很大的困难,需要先将结构复杂的数据转换为单一的或是便于处理的结构,然后才能做数据分析。
除直接采集的数据外,还可以利用其他信息化管理系统中的数据,如学生处、教务处等高校业务部门的数据管理系统中的数据。由于不同部门运用不同的数据系统软件,各个运行数据库除包含进行学习分析所需的有用信息外,还会掺杂很多干扰信息,因此需要将多种来源的数据进行筛选,以主题为目标,建立以分析为主要功能的数据集合。
(二)学习数据存储
将结构和非结构化的学习数据及时存储到数据中心是实现数据访问和实时分析的必要前提。直接采集或从各部门数据库得到的学习数据具有不同格式,传统数据存储的方法需要解决过滤后数据的异构性问题,如采用联邦式、基于中间件模型和数据仓库等方法。云存储技术不但能够兼容不同结构的数据,而且屏蔽了数据丢失、病毒入侵等问题,是安全可靠的数据存储技术。利用云存储技术来构建学习数据的存储环境,根据数据的类型、结构不同而选择不同的数据存储方案,使各种类型的数据实时高效地同步到数据中心。
要对海量数据进行有效的分析,还需将这些来自前端的数据导人到一个集中的大型分布式数据库,或者分布式存储集群。云计算开源平台Hadoop提供了分布式文件系统、分布式数据库以及数据分析处理等功能模块在内的完整生态系统,现已经发展成为目前最流行的大数据处理平台。基于Ha-doop来构建学习数据存储平台,具有数据管理方便、访问速度快等优点。
三、学习分析
学习数据分析是对教学内容、教学环境和学生学习活动中产生的各种结构和非结构化数据进行相关性分析的过程。在进行学习分析时,采用面向主题的数据组织方式。主题(subject)是在较高层次上将信息系统中的数据进行综合、归类和分析利用的一个抽象概念,每一个主题基本对应一个分析领域。根据教学设计需求,我们选择三个主题实现学习分析:学生学习成果、学习体验和学习能力,其中,学习能力既反映了学习的效果,又是预测学生未来学习表现的关键因素。
每个主题细分为几项内容,每项内容都是若干分析对象数据的一个完整描述。Fulks认为,学生学习成果是期望学生在经过学习后应该获得的、具体的、可测量的目标和结果,包括认知、技能、态度等,因此,反映学习成果的内容应当包括知识掌握程度、知识应用的能力、口头与书面表达的能力、独立制订计划的能力、创业能力、社会能力和社会责任意识等;学习体验是指学生在学习过程中对学习内容、任务安排、教学环境等的感受,以及实训感受和对学习成果的满意度等;学习能力指学生获取信息、接受知识和应用知识的能力,具体包括:学习速度、领悟能力、独立思考能力、获取与利用信息的能力、分析判断与决策的能力、遇挫表现、学习活动中的应急和应变情况、与其他学习者的互动与合作等。
在Hadoop平台上,利用分布式数据库或者分布式计算集群,来对存储于其内的海量学习数据进行分析整理,如对学生的学习行为、学习成果等非结构数据进行维度分析和关联规则分析等以推断出各种类数据间的细微差异与关系,所得出的信息以可视化技术直观地显示,为教师教学决策及时提出预警和帮助。
四、结束语
大数据技术可以高速实时地处理不同结构的复杂海量数据,并对大量不相关信息进行深度复杂分析,可以帮助推动教学的个性化、适应性研究。利用大数据技术和云计算提供的软件、存储、安全等技术,对学生学习活动中产生的数据进行分析,了解学生真实的学习状况,使教师能够根据学习者的需要选择和设计教学内容,是提高教学质量的有效途径。