基于LSA的在线教育行为模式可视化分析

2020-02-05 02:19魏莉韩艳辉
电子技术与软件工程 2020年7期
关键词:残差可视化学习者

魏莉 韩艳辉

(1.山西广播电视大学 山西省太原市 030027 2.国家开放大学 北京市 100039)

在线教育盛行,信息数据量正呈几何级指数增长,通过挖掘和分析在线教育数据,可以获得其背后隐藏的巨大价值。在线教育是在“互联网+”的大下背景产生的,在线教育数据成为新的教学要素,在线学习行为成为分析学生效果的核心资产。国家开放大学基于Moodle 的学习平台能够记录每个学生的学习行为,为分析学生的学习状态提供数据基础,结合数据分析技术,有助于教师发现学习者的学习行为模式,预测学习者的表现和风险,及时有效的干预调整,使得教师的个性化教学成为可能。

LSA(Lag Sequential Analysis,滞后序列分析法)是学习行为模式分析的重要方法之一,是由Sackett 于1978年提出的,可以用于检验某一行为发生之后出现另外一种行为的概率在统计意义上的显著性[1]。运用LSA 可以帮助教师把握学生潜在的行为模式,从行为视角增强学习效果,有效指导后续教与学活动的设计与实施。GSEQ(General Sequential Querier)软件可以用于分析在线教育中教师和学生在线行为序列模式,提高数据分析处理的效率。

近年来,LSA 被广泛应用于知识建构行为模式分析、学生行为模式分析、师生交互的话语分析、学习社区信息交互分析、学习过程分析与学习效果预测,线下课堂互动效果分析等[2-9]。可是,整体上结合教师和学生的在线行为模式分析的实证研究较少。学生和教师是在线教育的重要角色,“教”与“学”的行为数据为分析师生互动行为模式提供了有价值的数据。

本研究选取国家开放大学开设的《媒体辅助英语教学》在线课程作为研究对象,该课程在教学平台上组织实施教学活动,引导学习者自主学习;不设终结性考试,采用百分之百形成性考核的方式,教师和学生的在线行为过程完整的记录下来,使得行为日志数据能够较客观、准确地反映学习者的学习状态。

1 数据收集与分析

本研究采用LSA 和相关性分析法对教师和学生的行为频次和行为转换频次进行统计分析,对教师和学生的在线行为模式进行可视化分析。

1.1 研究对象

本研究对象是《媒体辅助英语教学》2018年秋季学期在线课程,课程团队将整个在线学习活动划分为七个模块,分别是一、学习指南和破冰行动;二、媒体辅助中学英语教学的基本原理介绍;三、常用办公软件的英语教学;四、应用语法和词汇训练;五、阅读训练;六、听说训练;七、写作训练[10]。核心教师13 名,学习者共计80 名,课程总时长约十周,全体师生的在线行为记录106176 条,其中教师行为记录50502 条,学习者行为记录55674 条。

表1:教师高频在线行为编码

表2:学生高频在线行为编码

分析学习者每个模块的在线行为的频次、类型和路径等,能够帮助教师清晰准确的了解学生的个性化特征,及时调整教学策略。课程团队设置了“光荣榜”,激发学生的参与热情,师生形成良性的在线互动。

1.2 数据筛选、编码

在线行为场所主要包括课程页面、讨论区、成绩、作业、学习文件、互动评价和调查问卷等10 处。每种场所又有多种行为方式,包括浏览、上传、更新、创建和提交等。将在线行为场所和行为方式组合起来分析,共有32 类行为。统计各类行为数据,筛选频次前10 的教师和学生的高频行为并对其编码,表1 为教师高频在线行为编码、表2 为学生高频在线行为编码。

1.3 数据分析

表3:残差表(部分)

图1:不同阶段教师的在线行为转换图

图2:不同阶段学生的在线行为转换图

分析表1、表2 的高频行为场所主要分布在讨论区、互动评价、系统、文件等。对比表1 和表2 的高频行为可以看出,行为场所高度重合,教师的行为频次普遍高于学生,分析各类行为中教师的行为频次和学生的行为频次的相关性,皮尔逊相关性系数达到0.835,可见一致性很高。教师在讨论区积极引导学生参与形成良性互动,互动评价方面,课程中设置学生之间互评,参与度高,互动评价任务极大激发了学生的学习动力,增强了学生的评价能力和互相学习的能力,促进了他们的个性发展和全面提高。

2 核心行为序列分析

本研究采用LSA 和信息数据可视化开源工具Gephi 对教师和学生的行为模式进行可视化分析。研究过程可分为两个部分。第一,分析整个学习过程中“教”和“学”行为在不同学习阶段的行为模式;第二,分析教师和学生行为模式的相关性。

2.1 基于LSA的行为模式分析

将整个课程的七个教学模块分为两个阶段,阶段一包括该课程的模块一、二、三和四,阶段二包括模块五、六和七。

行为分析流程如下:

(1)收集在线行为日志数据,选取时间、姓名、行为类型等特征信息,按照行为发生的时间生成教师和学生的核心行为编码序列;

(2)使用GSEQ5 软件,按照格式要求输入三个阶段的行为编码序列。下文为学生行为转换编码序列的部分序列:

(3)分析行为序列后得到频率转换表及残差分析表,频率转换次数表体现了某一个行为之后发生另外一种行为的频率,残差表用于体现两个行为之间的前后转换关系的显著性。

当残差标准值z-score 大于1.96 时,表示行为转换频次达到统计上的显著性水平,见表3,以第一阶段教师行为转换的残差表(部分)为例,表3 中TL 行为之后发生TL 行为的调整后的残差值为31.51。

(4)筛选意义显著的行为序列,根据调整后的残差值表,筛选残差表中z-score>1.96 的数据,表3 中“TL →TL”、“TS →TL”、“TG →TL”、“TC →TS”、“TL →TC”、“TC →TC”、“TS →TG”都是显著的行为转换关系。连续发生同一行为表示该行为的稳定性高。对筛选后的数据运用Gephi0.9.2 软件生成行为序列有向路径转换图,可更直观地呈现各种行为之间的转换,如图1、图2 所示。设定行为编码为图的节点标签,边的信息包括源节点(source)、目标节点(target),权重(weight),箭头连线表示了行为发生的顺序。节点直径越大表示该行为发生的频率越高,边越粗表示权重越大,连接两个行为之间的关系越强,即发生上一行为后发生下一行为的概率越高。

2.2 结果分析

如图1 所示,对比教师在不同阶段的在线行为转换图,第一阶段中有两个孤立节点HE 和HP,边数为16;第二阶段中无孤立节点,边数为22。第一阶段的平均度数1.6,第二阶段平均度数为2.2,高于理想顺序状态下的平均度数2,表示教师的行为种类较为丰富,路径选择较为丰富。图中有很多节点的自环现象,自环的边越粗自环现象越明显,表明该行为具有较高的稳定性,如TL、TC、XG、XX、XL、HL、HP 等,可见讨论区和互动评价等场所的转换行为频繁而稳定。

如图2 所示,对比学生在不同阶段的在线行为转换图,第一阶段中有两个孤立节点HC 和HS,边数为13;第二阶段中无孤立节点,边数为22。第一阶段的平均度数1.3,第二阶段平均度数为2.2,超过高于理想顺序状态下的平均度数2,表示学生的行为种类和路径选择较为丰富,提升明显。第一阶段中,“TC →TS →TL”行为转换显著,第二阶段中“TC →TS →TL”形成闭合循环路径,可见学生在讨论区的行为频繁且稳定性高。第二阶段中“HC →TL →TS”行为转换显著且形成闭合循环路径,可见学生参与互动评价的积极性高。

分析教师和学生在两个阶段的行为转换残差值,教师在各阶段的行为转换中概率前5依次为“HP→HP”、“HE→HE”、“XG→XG”、“TC →TS”和“HP →HP”。学生在各阶段的行为转换中概率前5 依次为“TC →TS”、“HS →HC”、“TL →TL”、“HL →HS”和“TC →TC”,可见教师和学生的在线行为转换具有较强的相似性。将教师和学生的“TC →TL”和“TC →TC”两种行为转换分别做双变量相关性分析,结果显示相关性在0.01 水平上显著正相关,皮尔逊相关性系数分别为0.891 和0.873。可见教师和学生在讨论区频繁交流,可谓同频共振。

3 结论

本研究根据国家开放大学Moodle 学习平台上的教师和学生的在线学习行为数据进行滞后序列分析,并通过Gephi 将行为模式可视化,使得教师能够更直观的了解学习过程中的行为模式变化。

研究发现,学生在讨论区和互动评价区的行为转换频率较高,而在学习文件、系统等场所的行为转换频率相对较低。在该课程的在线教学过程中,教师针对学生的行为特征在讨论区和互动评价区与学生充分交流,极大调动了学生的积极性,此外教师还需要发挥线上学习资源在知识呈现方面的优势,优化知识构建,基于学生的需求提供更适合的学习资源提升教学的质量。

在线教育行为模式分析表明,学生的在线学习需要教师精心安排教学活动并不断引导。滞后序列分析方法可以帮助教师开展学习路径的设计与优化,可视化学生的学习路径,还可结合聚类等方法用于分析学生的行为模式与学习成绩的相关性分析,以帮助教师依据在线行为序列的分析结果,及时调整教学策略,做好个性化学习支持服务,促进学生的参与,提高学习的效果。

猜你喜欢
残差可视化学习者
基于CiteSpace的足三里穴研究可视化分析
基于双向GRU与残差拟合的车辆跟驰建模
基于Power BI的油田注水运行动态分析与可视化展示
基于残差学习的自适应无人机目标跟踪算法
你是哪种类型的学习者
基于CGAL和OpenGL的海底地形三维可视化
十二星座是什么类型的学习者
基于递归残差网络的图像超分辨率重建
“融评”:党媒评论的可视化创新
汉语学习自主学习者特征初探