王焕民
兰州交通大学机电技术研究所 甘肃兰州 730070
目前,在线教育系统记录存储了海量教育大数据,这些数据多处于闲置状态,其隐藏的潜在学习分析价值未被充分挖掘应用,造成了教育大数据的极大浪费。本研究旨在通过对在线教育大数据进行数据挖掘分析,提取有价值的数据信息,分析学习者的历史学习行为、学习轨迹、学习活动等,揭示潜在的学习需求与学习偏好,协助学习者制订个性化的学习方案,为不同学习个体推荐适用的学习课程、学习资源、学习模式,帮助教师优化完善在线教育课程设计,辅助管理者做出科学的教育决策,促进在线教育资源优化。
随着大数据的传播与应用,研究者将这一理念引入教育领域,提出了教育大数据(Big Data in Education)的概念。目前,学术界对教育大数据尚未有明确的定义。我国学者杨现民等认为,教育大数据是指根据需要从教育活动过程中采集到的、存在潜在教育分析价值并促进教育发展的数据集合[1]。教育大数据直接产生于各类教育活动,每个教育相关方既是教育数据的消费者,也是教育数据的生产者[2]。教育大数据可以在提升教育质量、实现个性化学习、辅助教育科学决策、优化教育资源等方面发挥重要作用。
教育数据挖掘(Educational Data Mining)是大数据在教育领域的主要应用,其价值在于通过数据挖掘揭示学习过程中存在的潜在关联关系和关联规则,促使教育评价从宏观群体评价走向微观个体评价[2]、从单一评价走向综合评价、从经验主义走向数据主义,优化学习行为和教学行为,促进教师开展精准教学,帮助学习者实现个性化学习,开展以教育数据分析为支持的教育决策,提升教育危机预防与安全管理能力。
学习分析(Learning Analytics)的定义起源于美国高等教育信息化协会的“下一代的挑战”计划,主要指使用数据和模型预测学习者收获和具备处理这些信息的能力[3]。美国新媒体联盟对学习分析的定义为[4]:利用数据采集工具和统计分析技术,分析研究学习者参与学习活动、学习过程、教学活动的相关数据,进而对学习、评价和教学进行干预和修正。我国学者顾小清等认为[5],学习分析是运用数据分析模型和分析方法分析并解释与学习活动、学习行为相关的数据信息,以探究学习行为和学习过程,发现学习规律,为学习者提供学习表现反馈,促进更加有效的学习。
在线教育(Online Education)是一种通过信息通信技术增长知识和技能的方式[6]。在线教育系统是指利用教育信息技术和网络技术,结合教育理论和教育思想构建出来的网络化教学环境。主流学历教育在线教育系统主要包括普通高校网络与继续教育学院在线教育系统和广播电视大学在线教育系统。学历教育在线系统作为学习、教学、教学管理等集中式在线教育环境,是学历教育在线教育大数据的主要数据来源,是构建在线学习分析系统的数据基础。
目前,在线教育系统仅是简单记录和存储教育数据和学习行为数据,或是进行简单的分析应用,这些数据蕴含的巨大教育价值和学习分析价值未被充分挖掘应用,造成了教育数据资源的极大浪费。
本文在研究[7]的基础上,结合在线教育大数据的主要数据来源、服务对象、主要功能等,提出在线学习分析系统的系统架构(如图1所示),整个系统架构由在线教育系统、数据预处理、学习分析引擎、显示面板、利益相关者5个模块构成。
图1 在线学习分析系统的系统架构
由图1可知,与传统学习分析系统不同,在线学习分析系统的利益相关者还包括研究者。研究者主要研究学习分析系统本身,如哪些学习分析服务能够在最大程度上帮助学习者管理自身的学习,管理者如何通过新的视图改变教育决策过程,哪些系统特性是学习者、教师、管理者最需要的等问题。
需要注意的是,在线学习分析系统架构中的各模块并不是孤立存在的,各模块之间存在一定的关联性。根据图1箭头指示的数据流向可知,前一模块的输出数据作为后一模块的输入数据,整个系统架构形成了一个封闭式的数据流循环,学习者、教师、管理者既是教育数据的生产者,也是教育数据的消费者。教育利益相关者与学习分析系统的交互有效地促进了教育大数据的动态再生。
在线学习分析系统的技术架构自下而上分为数据采集层、数据存储管理层、分析应用层(如图2所示)。
数据采集层将源数据预处理后传输给数据存储管理层。数据存储管理层将数据存储在数据仓库。分析应用层基于数据仓库实现数据的挖掘、统计、分析,将分析结果通过数据接口进行Web集成与展示,最终为学习者、教师、管理者提供分析应用服务。在整个技术架构中,教育数据的质量监控与安全管理贯穿整体流程,以确保教育数据在每个环节的可控性与安全性。
图2 在线学习分析系统的技术架构
3.2.1 数据采集层
与传统教育数据相比,学习分析系统的源数据具有来源多样、数量庞大、格式不统一等特点。数据采集层主要完成源数据的采集和预处理,将源数据经过析取、清洗、转换等一系列ETL处理后传输到数据存储管理层,同时控制接口数据源的获取、转换和加载,以及ETL过程中数据的审核、监控与调度。为了保证数据的正确性,在ETL的每一个环节都必须对数据进行审计。
3.2.2 数据存储管理层
在线学习分析系统教育数据的存储和管理主要由数据仓库完成。在数据仓库的基础上,对于某些特定主题的学习分析应用,可以对数据进行进一步组织,根据分析主题的需要创建相应的数据集市。还可以根据关键部门、重要领导、分支机构等关心的分析主题、数据粒度、数据层次为其构建数据集市。为频繁访问数据仓库的关键部门建立相应的数据集市,能够提高系统对访问的响应速度,提升系统性能(数据集市的数据直接来自数据仓库)。
3.2.3 分析应用层
分析应用层从数据仓库或数据集市获取教育数据,通过学习分析引擎和预定的分析模型对数据进行多种类型的分析,自下而上包括分析手段、Web集成与展示、分析应用3个模块。其中,分析应用主要围绕某个具体的分析主题为用户提供分析应用服务,针对学习者的分析应用包括学习需求分析、知识推送、学习方案推荐等;针对教师的分析应用有教学模式分析、教学效果分析、教学设计分析等;针对管理者的分析应用有管理模式分析、资源利用分析、风险预警等。
3.3.1 预测学习需求 揭示学习偏好
学习需求揭示了学习者的学习动机,包括内容兴趣和过程兴趣两个部分,前者指学习者对学习目标及主题感兴趣,后者则反映学习者对学习策略的可预期[8],二者共同决定学习者对后续学习的参与程度。在线学习分析系统通过挖掘分析在线教育活动过程中产生的学习行为数据,发现其中隐藏的关联关系和关联规则,进而预测学习者的学习需求,揭示学习者的学习偏好,提取有效的个性化学习模式,为在线教育系统进行智能化知识推送,为不同学习个体选择适用的学习课程、学习模式、学习资源提供决策支持。
3.3.2 提供个性化的学习支持服务
在线学习分析系统的核心功能之一是在保护学习者个人隐私的基础上,有针对性地提供个性化的学习支持服务,主要包括根据潜在的学习需求协助学习者制订适宜的学习方案;根据隐性的学习偏好主动进行知识推送,根据学习轨迹、学习兴趣、学习特点搜索、过滤知识,有针对性地主动推荐学习者感兴趣的学习资源与知识,包括个性化的学习路径、学习活动、学习任务等;推荐满足个性化学习需求的学习模式,提升学习者的自主学习能力和自我管理能力。
学习者通过学习分析系统提供的个性化学习支持服务可以清晰地知晓自己当前的学习状态与未来可能的学习结果[9],从而提前采取措施,修正学习行为、变更学习计划。
3.3.3 帮助教师完善课程设计
在线学习分析系统可以挖掘、提取在线教育活动过程中隐藏的教学数据,主要包括学习课程的访问、教学活动的参与、线上教学互动活动的设计、线下学习任务的部署、学习效果评价、学习考核等,这些数据为教师改进、调整教学设计与教学策略,重构教学计划提供支持,帮助教师完善学习课程的设计与制作,促进教师开展适宜的教学干预,促进教与学。同时,系统能有效找到提高课程资源质量、提升课程整体设计水平的切入点,提升在线教育辅导教师、课程责任教师的教学能力,促进教学效果提升。
3.3.4 辅助管理者做出科学的教育决策
在线学习分析系统通过分析教育教学管理各方面的数据,揭示其中存在的问题或风险,为管理者进行教育教学决策提供支持。管理者通过学习分析系统提供的管理类分析数据可以对自身的教育决策行为和教学管理行为进行干预,及时修正教学管理制度、改革教学评价体系、促进各项教学计划的有效实施。借助管理类数据分析结果还可以制订科学合理的教学管理制度、合理评价教师的教学情况和学生的学习情况、及时预防和控制教育决策过程中存在的风险。
3.3.5 促进在线教育资源优化
在线学习分析系统通过挖掘提取在线教育活动过程中隐藏的学习者使用学习资源的情况、资源的使用率、使用频次等数据,可以建立在线教育资源的优劣、好坏、使用方式是否便捷等的评价和反馈机制,促进在线教育资源建设者完善资源的设计、开发与制作,提高资源质量,优化资源使用方式;帮助资源管理者对在线教育资源进行整合优化,保留优质资源,淘汰低质资源;辅助教师从众多在线教育资源中遴选优质、适用的资源应用于在线教学,为在线教育教学资源的优胜劣汰提供有效的遴选机制和手段。同时,学习分析系统还可以建立在线教育课程资源和学习资源的反馈评价机制,为学习者提升学习效果、教师提升教学质量提供资源保障。
构建基于教育大数据的在线学习分析系统,将大数据思维应用于在线学习、教学、管理过程,跟踪学习者的学习轨迹,分析学习者的学习行为,揭示学习需求和学习偏好,监控和管理在线教育教学质量,评估在线教育的学习效果、教学效果、资源适用度等;提取有效的个性化学习模式,提升在线教育学习者的自我管理能力和学习能力,实现深度学习;辅助在线教育者掌握学习者的学习需求和学习动因,从而提供个性化的学习、教学与支持服务;促进在线教育教学效果的提升,推动在线教育教学模式改革[9],为教学管理和教育科学决策提供支持,促进在线教育资源的完善优化。