季瑞芳 李 蕾
学习分析是为了评估学术进步、预测未来的表现和发现潜在的问题而对学生产生的广泛的数据进行解释的行为。其目标在于使学校和教师能够根据每个学生的需要和能力提供与其相适应的教育机会[1]。学习分析技术是回归教育本质,以学习者为对象,以教育数据驱动的方式改进教学实践、促进学习者个性化发展的方法和技术。
地平线报告对学习分析的介绍最早出现在2011年,随后2013年和2014年的报告中也均有提及,其预测学习分析作为影响基础教育领域的新兴技术将得到广泛应用。2017年地平线报告指出:未来2~3年“分析技术”将进入基础教育教学应用,美国IT研究与咨询公司高德纳(Gartner)公司发布的信息指出2017年是数据和分析迈向主流的一年[2]。分析技术通过各种工具和应用程序将数据转化为可执行的信息,而把那些与学习者能力和进步相关数据进行收集、筛选、整合、分析,将对激发学生个性化和适应性学习有潜在的作用。
个性化学习的实现,也越来越需要借助大数据和学习分析技术,从海量的数据信息中发现学习发生的机制,挖掘学生学习规律的变化,找到数据背后隐藏的学习行为产生的原因和相互的关联性,预测学生学习的趋势并提供更加精准的学习内容和反馈建议。教育信息化在基础教育的普及和学习分析技术的不断发展为学生个性化学习提供了可能。
2011年,首届学习分析与知识国际会议(LAK)对学习分析进行了定义,认为学习分析是以理解和优化学习及其发生的环境为目的,对学习者及其所处情境的数据进行的测量、收集、分析和报告。2012年Siemens进一步总结提炼指出,学习分析是“关于学习者以及他们的学习环境的数据测量、收集、分析和汇总呈现,目的是理解和优化学习以及学习情境”[3]。美国发布的《通过教育数据挖掘和学习分析促进教与学》报告指出,大数据在教育中的应用包括两大领域:教育数据挖掘和学习分析技术。教育数据挖掘是利用数据挖掘技术、统计学及机器学习算法,分析教学数据,从而预测学生未来的学习趋势;学习分析技术是利用数据收集工具与分析技术,研究分析学生学习参与、学习表现、学习过程的相关数据,运用不同的分析方法和数据模型解释这些数据,学习分析技术的应用能直接影响教学实践,促进个性化教与学的实现,优化学习路径,改进教育决策。教育数据挖掘的目的在于建立算法和模型,学习分析技术则是利用已有模型和方法分析教学过程和行为,改进教和学的实践[4]。
学生学习过程中产生各类数据,这些数据构成了学习分析的基础。数据来源有两类,一类是明确的显性的学生行为,如完成作业和考试;另一类是隐性行为,包括在线社交、课外活动、发表在论坛上的帖子以及其他不能直接评估学生进步的活动。林炜婷等将数据分为结构化数据和非结构化数据[5]。数据是学习分析技术的基础要素,通过对数据进行整理、加工和分析可获得教育者希望了解的关于教学和学生学习的基本情况,为后续改进提供参考和依据。从数据分析的技术角度看,学习分析的过程是对数据进行一系列加工处理的过程,包括收集数据(如学习者数据、智能数据、个人学习档案)、存储数据、清洗数据、整合数据、分析数据、数据可视化和执行(如预测、干预、教学改进)。
魏顺平将学习分析用到的数据处理方法总结为两类,一类是数据挖掘方法,如统计分析、聚类、预测、关系挖掘、文本挖掘等;另一类是分析技术,如内容分析、话语分析、社会网络分析、系统建模等技术[6]。顾云峰等从学习分析应用领域不同所使用技术及工具不同的角度,将学习分析技术分为预测建模分析(回归分析、聚类分析、决策树等方法)、解释建模分析(认知模型、学习因素分析、SimStudent自动认知模型)、内容分析(基于学习资源、基于学生学习成果、基于学生社交互动的内容分析)、话语分析、其他(学习分析仪表盘、多模态语言分析、自然语言处理技术等)[7]。
孟玲玲等对学习分析工具进行了研究和分类,包括学习网络分析工具、学习内容分析工具、学习能力分析工具、学习行为分析工具和其他综合性分析工具。学习网络分析工具以学习个体在学习平台上的活跃度和与同伴的互动影响为分析目的,关注学习个体的社交网络;可用工具有SNAPP,Gephi,NetMiner,UCINET,Pajek,GUESS,JUNG,NodeXL,Cohere。学习内容分析工具以学习内容本身和师生交互产生的内容为分析对象,使研究者更清晰地认识学习发生的过程,为学习者推荐个性化学习内容和指导;可 用 工 具 有 WMatrix,CAT-PAC,LIWC,Nvivo,Atlas.ti,Wordle,LOCO-Analyst等。学习能力分析工具以学习者的学习能力、学习水平为分析对象,通过量表、博客或考试等形式对学生的探究意识、创造力、心理弹性等进行评估,常用的工具有ELLIment,Enquiry Blogger,Socrato。学习行为分析是为了了解学习过程的发生机制,获取学习者的学习需求、学习进展,进而优化教学路径,提供个性化学习的可能;工具有Google Analytics,Mixpanel。综合性分析工具包括WEKA,SPSS,SSAS等[8]。
教育领域对学习分析技术的应用正趋于成熟,教育机构能够利用学习分析技术探索更加适用的教学法,为学生提供高质量、个性化的学习体验,对学生学业成就进行预测和及时纠偏,教育管理部门可依据学习分析指导教育决策的制定。
可汗学院的学习系统是使用学习分析技术协同创建自适应和个性化学习体验的一个典型案例。它是一个智能、自适应的在线学习平台,利用大数据和学习分析技术为翻转课堂教学实践的开展提供了有力支撑。其学习分析功能主要有前测分析、学习问题诊断及学习活动统计分析,通过可视化技术为学生和教师提供帮助。在美国,很多基础教育学校正在使用可汗学院的视频及教学分析工具开展教学试验,取得了显著的效果。在可汗学院的学习系统中用户分为“学生”“教师”和“家长”。学校使用可汗学院进行教学实验,实际是进行了翻转课堂的教学[9]。学生在家学习可汗学院的视频并做测试,教师不再面对全班进行教授,而是留出更多的空间和时间让学生进行相互协作、探究讨论,教师在课堂上有大量的时间对学生进行个别化的针对性指导。
可汗学院通过学习分析技术将学生学习行为和结果进行可视化呈现。教师作为教练可以在可汗学院的学习系统中查看学生学习进度情况、学生知识技能掌握程度情况及个别学生的学习状况[10]。教师可实时查看学生的知识点掌握情况(如图1所示),图1中每一列为1个视频知识点,每一行为1个学生对这些知识点的掌握程度。深灰色表示已经掌握,浅灰色表示学生正在学习该知识点,黑色则表示学生在这个知识点上遇到困难。教师通过图表能清晰地看到每个学生的学习状态,并能针对性地及时跟进学习困难的内容,而且教师能够在线向学生推荐视频和练习题,进行线上线下个别辅导。系统中评估学生是否掌握知识点的标准是通过学生做测试的结果判断的。
图1 知识点掌握情况可视化分析图(来源:萨尔曼•可汗的TED演讲—《用视频再造教育》)
从学生角度看,可汗学院的学习系统能够通过分析学生对当前知识的掌握程度,决定是否推动学生进入下一阶段的学习。教师通过系统提供的学习进展评估,结合数据及时调整教学和课程内容,让学生达到熟练掌握的程度。数据分析可使学生每天的学习情况可视化,学生能了解自己在某一天学习了哪些视频,完成了哪些测试,耗时多长时间,掌握了哪些知识,获得能量点和徽章的情况(如图2所示)。学习系统还能将学生观看视频和做测验和练习的情况进行比对(如图3所示),内部环形是学生观看视频的名称和时长,外部环形是学生做测验和练习的时长及答题情况统计,能够显示在没有提示情况下答对题目的数量。
图2 按时间统计的学习情况(来源:萨尔曼•可汗的TED演讲—《用视频再造教育》)
图3 学生看视频与做测验的对比统计(来源:萨尔曼•可汗的TED演讲—《用视频再造教育》)
学习分析联盟(LAC)将教育者、研究人员及数据科学家联系起来,建立伙伴关系,为学校、教师和学生提供可视化的学习和测评分析。
学习分析联盟(LAC)利用学习分析的各种技术及工具,分析有关教学和学习的信息。使学校领导者能更深层次理解教学和学习发生过程及其中的问题,提供更好的问题解决方案和更为明智的决策建议。该联盟开发的可视化学习分析平台符合欧盟GDPR(通用数据保护规范)和美国FERPA(家庭教育权利和隐私法案)标准,保证了学生数据信息的安全性,平台能够定制开发并直接集成到学生信息系统中。LAC的可视化学习分析平台能为学生、教师和学校领导者提供相应的支持,如为学生提供反思学业成就的反馈系统、对困难学生提供额外支持的预警系统,帮助教师规划教学、改善现有课程、开发新课程的支持系统,为学校领导者提供有效性决策和措施的决策系统。
其学习分析平台的功能包含基于不同考试测评系统进行的数据分析,如能够跟踪学生MAP学业测试、ISEE学业测试、IB国际预科证书课程等不同标准考试的成绩,并对学生的学业成绩进行对比分析(如图4所示),提供年度趋势报告和预测分析。同时,也能为教师和学生提供数据概况分析(如图5所示)、学生支持及推荐学习内容、情感分析(如图6所示)等。
图4 读写能力评估(Literacy Assessments)(来源:学习分析联盟官网—www.analyticscollaborative.org)
图5 学生测评数据概况(来源:学习分析联盟官网—www.analyticscollaborative.org)
图6 学生情感分析(来源:学习分析联盟官网—www.analyticscollaborative.org)
GISMO(Graphical Interactive Student Monitoring Tool,图形交互学生监控工具)是能在MOODLE平台使用的图形交互学生监控系统,能对学生学习某一门课程的行为进行跟踪,随时提取学生行为数据。通过可视化图形分析结果,教师可以发现学生学习行为的共同特点,也便于及时发现学习遇到障碍的个别学生。数据分析结果呈现的角度分为4个维度:学生访问课程的情况、资源被使用的情况、学生参加交互活动的情况、学生测评完成情况等[11]。学生访问课程的情况(Student):可以统计每个学生访问课程的时间(Accesses by Students),也可汇总某段时间内课程每天的整体访问量(Accesses Overview)和资源被所有学生访问的情况(Accesses Overview on resources)。资源被使用的情况(Resources):每个学生访问每个学习资源的次数(Students Overview)、每个资源被访问的总量(Accesses Overview)。学生参加交互活动的情况(活动)反映了学生在课程里参加人机交互和社会网络交互的情况。学生测评完成情况呈现了学生作业和测验的结束时间、学生完成情况、教师是否评分等信息。图7展示了每个学生完成每一个作业的情况,空白表示未完成,实心方形表示已完成且已评分,空心方形表示已完成但未评分。结合测评完成情况、测评得分情况及测评对应资源的访问量(如图8所示),教师可以分析知识点的难易程度,根据学生的掌握情况及时调整线上线下教学内容,既能够把握整体学习情况,又能对个别学生提供针对性、个性化辅导。
图7 GISMO学生测评完成情况(来源:北京开放大学学习平台—elearning.bjou.edu.cn)
图8 GISMO显示的每个知识点的访问量(来源:北京开放大学学习平台—elearning.bjou.edu.cn)
学习分析技术是综合教育学、计算机科学、统计学、大数据科学、人工智能等多学科知识对教育现象进行研究的理论和技术。一线教育工作者在这方面缺乏相关的知识储备,所以建立一套适用的学习分析系统,使之在教学实践应用中发挥应有的作用就需要教育工作者、研究人员和技术专家合作,发挥各自的专业所长,设计开发出能够在教学中真正用得上、易用、好用的学习分析系统,离开其中一方都可能事与愿违。这也是教育与技术深度融合的体现,技术是为教育服务的,单纯的技术需求比较容易实现,但教育机构应该分析自身教学实践面临的问题、要达到的目的,梳理出自身的需求,之后寻求技术帮助解决教育教学问题。在技术与教育融合的改革中,教育是根本,技术是手段,技术应该服从教育目标和定位。
基于学习分析技术的教学管理系统,为学生和教师提供了更加个性化的学习和教学环境,这使得学生和教师需要重新定位自身的角色。对于学生来说,需要逐渐培养主动学习和个性化学习的意识,通过学习过程中的可视化分析结果逐步增强自我认知和理解,反思和改进新环境下的学习方法。对于教师来说,教师由原来的知识传授者转变成学生学习的组织者和引导者,这需要教师适应角色转变,发展教学研究的能力,对学生学习行为和知识习得过程进行更深入分析,随时调整评价机制和教学决策。也要求教师具有更多的教学设计和内容开发的能力,利用好现代化教学工具,成为学生学习的指导师。
目前在网络学习环境下,教育者和研究人员比较容易获取学生的学习行为数据,进而利用学习分析技术进行相应的教学研究、及时调整教学策略。随着混合式教学在基础教育中应用的不断推广,学生线上学习有相应的数据记录,但学生线下学习的行为变化、情感动态是比较难获取的[12]。所以混合学习环境下,学习分析的难点在于如何采集学生线下学习的有效数据。但随着一些辅助工具的出现,教师和研究人员可将学生线下完成的作业、试卷等扫描成电子版并完成自动判分、自动统计等工作[13]。随着学习分析技术研究的进展,真实学习情境中的数据收集成为可能,学习分析的结果也将更加深入和全面,研究人员已经在实验通过眼帘间距和嘴角弧度判断学习者的学习注意力与愉悦度,进而推测学习者的学习情绪。