乐惠骁 范逸洲 贾积有 汪琼
摘要:基于中国大学MOOC平台上《翻转课堂教学法》MOOC中17204名学习者的行为日志数据,在为学习者的页面访问记录赋予有意义的行为编码标签,建立其学习路径模型后,使用统计和共现分析的方法,研究其中优秀学习者的学习行为模式特点。研究发现,优秀学习者总行为序列长度显著高于其他学习者,上线学习的次数显著地多于其他学习者;但是每次上线学习发生的有意义的交互行为的数量与其他学习者相仿,学习时长也相仿;其参与和回答教师的提问、复习已学过的内容、参与论坛互动的行为在其总学习行为中占比更多,而学习全新内容、参与测验、把握全局等行为的占比较少。研究用共现分析的方法分析了学习者每次上线产生的行为之间的共现关系,发现优秀的慕课学习者在学习新内容时更少发生走神和中断的情况,且其每次上线的目的更鲜明,学习主题更突出。研究的发现揭示了优秀慕课学习者学习行为模式的特征,有助于改进慕课教学。此外,共现分析的方法也为行为数据的挖掘提供了新的思路。
关键词:慕课;行为模式;学习路径;共现分析
中图分类号:G434 文献标识码:A
一、引言
慕课这一概念自2008年提出至今,已经经历了10年的发展,在线开放课程已经成为如今教育的重要一部分。教育部在《2018年教育信息化和网络安全工作要点》中强调要形成国家教育资源公共服务体系,认定第二批国家精品在线开放课程(MOOC)500门以上,体现了在线开放课程正在逐步融入主流、常态的高等教育体系。在慕课发展的过程中,如何提升慕课的教学质量向来是研究的焦点。
目前,对于“如何提升慕课教学质量”的回答主要集中于两方面。一方面从政策建议入手,以教学系统的制度变革等手段在宏观上来推进慕课教学质量的提升;另一方面,也是如今被讨论得更多的,是健全和完善慕课平台的学习支持服务,为学习者提供更加全面、个性化的学习指导和更好的人机交互体验,或使用策略来激发学习者的学习动机,以此类方法提升教学质量。在与后者相关的研究视域下,提升慕课教学质量的问题成为了一个工程问题——如何设计能有效支持学习者学习的系统并实现它。在技术高度发达的今日,各种技术的应用愈发成熟,对于教育技术研究者来说这个问题的难点更多地在于设计上。大多数学者的选择是在教学理论和教学经验的基础上进行设计。然而,归纳式的教学理论是否能很好地贴合大量涌现的慕课教学的实际场景是—个值得商榷的问题。在这种抽象的理论到实际设计过程中,真实的、来自实践的经验是弥补理论到实践之间沟壑的重要依据。在数据技术愈加完善的今日,慕课平台上的学习者行为数据无疑是这些依据的重要来源。行为是经典心理学关注的焦点,对行为的研究能揭示学习者学习的一般规律,利用数据挖掘的手段对慕课平台上产生的学习行为数据进行分析,有助于加深对慕课教学的理解。
在这样的背景下,我们开展了这项研究。本研究以中国大学慕课《翻转课堂教学法MOOC》中的学习者产生的行为数据为研究对象,使用数据挖掘的方法探究优秀慕课学习者行为模式的特点。本研究是数据驱动的研究,关注的问题是优秀的慕课学习者在在线课程平台中学习行为模式的特点。本文对“优秀的慕课学习者”的操作定义是按照慕课课程评价标准,获得了优秀评价的学习者,即最后的结业成绩达到了80分以上的学习者。这一部分的学习者是具有相当的代表性和特殊性的学习者群体。其代表性在于,他们是课程希望培养的学习者,其学习表现满足了教学方的期望。他们自身的学习特点(如学习策略等)有着一定的特殊性,对他们的行为数据进行研究可以提供关于“如何促进学习”的有效信息。通过对比他们与其他学习者的学习行为模式,揭示他们的特征,可以帮助研究者更好地理解真实的慕课教学。
二、相关研究
已有许多学者开展了基于学习行为数据的研究。大多数的研究致力于建立起一种“行为模式一学业表现”的关系,揭示平台中学习者活动的行为并予以分析,研究中难点在于:如何对学习行为进行表征和建模;如何探究行为模式与学习者学业表现之间的关系。
对学习行为建模中重要的一步在于从数据中提取需要的特征。研究者可以根据数据集中的字段信息或理论需要,结合字段的信息形成需要的变量来表征某些行为模式的特征。如贾积有等提出在线学习活动指数OLAI这一指标来表征学习者参与在线学习活动时的特征;如今对于学习行为的研究不再局限于对静态的属性分析,许多研究者已经开展了对于学习者行为的动态特征,即行为序列的研究。对行为序列的研究中一种常用的方法是给用户行为进行编码:如杨现民等对用户的页面浏览行为进行编码,用滞后序列分析的方法寻找值得解读的行为模式。对于序列行为的研究,可以采用时间序列的方法用离散随机过程表征学习者的行为序列,并进行进一步的数据挖掘,如Maldonado等使用时间序列的方法从数据中寻找有理论价值的行为模式,Davis等也做了相似的研究,用离散随机过程对学习者的学习行为进行建模,并以状态间的转移为基本单位分析学习者在线学习行为的模式。
另一个重点在于如何发现行为模式与学业表现之间的关系。经典的研究方法是是采用相关分析、因果分析等统计手段探究表征学习模式的变量与表征学业成就的变量之间的关系,并给予理论解读。如贾积有等对北京大学六门慕课的数据进行分析并探究学习活动行为对学业成绩的影响。如今,越来越多的研究也加入了一些数据挖掘的方法,如聚类分析,主要解决研究者单纯从现有模型出发无法从数据中有效提取信息的问题:如李爽等通过相关分析、LSA和聚类分析等手段研究学习者行为与课程成绩的关系以及行为模式和特征,王改花等用特征聚类的方法對网络学习者进行分类。Vaessen等采用聚类和回归算法研究智能学习系统中学习者的求助策略与学习成绩的关系。其中,聚类分析可以在数据层面将学习者的一些信息挖掘出来,并给予研究者以启发。
三、研究设计
(一)研究问题和框架
本研究的研究问题是优秀的慕课学习者在慕课平台中的行为模式的特点是什么。更具体地说,是要回答两个问题:
1.优秀的慕课学习者在线行为序列的长度以及各类行为占比与其他学习者相比有什么不同?
2.优秀的慕课学习者每一次上线学习产生的各类有行为的共现(Co-Occurence)情况与其他学习者相比有什么不同?
研究用基于规则的机器自动标注的方法为学习者产生的行为数据赋予有意义的编码,并为其建立学习路径模型。研究将数据集中的学习者按照最终学业表现分为了四组,并探究各组成员在线行为中各类有意义行为占行为总数的比的差别。通过对行为编码的共现分析回答第二个问题。
(二)数据集
研究的对象是中国大学慕课上《翻转课堂教学法》MOOC共计13期的学习者,时间跨度从2015年3月至2017年12月。他们所有学习课程期间的浏览页面记录被系统后台页面所记录并形成了数据集。数据集中能提供的信息包括浏览记录编号、学习者编号、学期编号、学业成绩、上线时间、下线时间和浏览页面的名称。该课程在平台上有较大的影响力和相对较大的学习者群体。然而,在线教学情境复杂,学习者组成相当多元且表现出的学习行为也相当驳杂,故研究最终只保留最终获得了成绩且上线学习次数超过3次的17204名学习者作为研究对象,因为他们在课程中花费的精力相对来说更多,是在课程设计之初所期望的学习者对象。
(三)术语定义
1.学习路径
学习路径(Learning Path)是学习者完成教学活动时参与不同教学活动模块的路径记录。例如,在—个基于Web的教学系统中,一个学习者的学习路径可以用其访问的页面、在页面中停留的时间、点击的控件等人机交互行为来描述。在本文中,学习路径中的基本元素是学习者的行为编码,本文提出了以下几种行为编码来赋予学习者学习路径中不同行为及意义,并形成了行为编码词典,如表1所示。
经过编码后的学习路径可以通过一个数字编码的序列进行表示,如“024411117801111245550”表示的就是某学习者两次登陆进行学习的学习路径。如何在大量的页面访问中识别到有意义的信息,首先需要对每个学习者的学习记录进行编码,即为学习者访问每个页面的记录打上有理论意义的标签。在编码过程中,有大量页面停留时间在5秒及以下,本文将这些页面访问记录识别为行为噪音并予以剔除。
2.RSBC
对于不同学习者,某个行为编码在其所有学习路径中所有行为中的占比(Ratio of Specific Behavior Codes,简称RSBC)是不一样的。例如,对于学习者A,其学习路径中的所有行为用“2441111780”这样—个行为序列表示,则其“1”行为出现的频数为4,而序列中所有行为的个数为10,故其编码1的RSBC为25%。一个学习者不同编码行为的RSBC是一个有意义的指标,通过对学习者不同编码行为的RSBC的解读,可以从学习者的行为中了解一个学习者的学习的常态。例如,有的学习者偏好以课程视频为主要内容,快速浏览过整个课程获取其需要的知识,也有的学习者喜好通过与同伴的交流和互动加深对知识的理解。深入挖掘一门课程中不同学习者RSBC的信息对揭示学习者的学习模式和策略有极大的意义。
四、数据挖掘和分析
(一)为学习者建立学习路径模型
首先根据每个学习者的数据为课程平台上的所有学习者建立学习路径模型。将每个学习者每次进入课程的在线会话记录编码后合并,共得到17204条记录。统计所有學习者的行为频次及占比,结果如表2所示,表中的列表示行为编码,为所有学习者每种行为出现的频数以及其占行为总数的比。
(二)学习者分组
本文的研究问题是探究优秀的慕课学习者的学习行为模式有什么样的特点,本文采用比较研究的思路,依据学习者在平台上的学业表现对学习者进行分组,并通过组间的学习行为之间的比较来研究优秀学习者的学习行为模式的特点。研究将学习者分为以下四组:第一组为成绩在[0,20)区间内的学习者,第二组为成绩在[20,60)区间内的学习者,第三组为成绩在[60,80)区间内的学习者,第四组为成绩在[80,100]的学习者。从成绩的直方图分布来看这是一个U型(如图1所示),即成绩较差和较好的学习者较多,但是成绩中等(20-60)分的学习者较少,故依此划分了[0,20),[20,60)和[60,100]这三个区间。但是对于有获得证书需要的学习者来说,是否获得优秀(80分)的评级是一个较为重要的变量,对其最终表现出的在线行为有着较强的影响,故最终将学习者群体划分成了四个组,人数分别为8609、1596、2503、4496人。
(三)不同组学习者行为占比及行为序列长度的比较和解读
研究对不同组学习者的RSBC和行为序列长度绘制箱形图并比较,其结果如下页图2所示。
下页图2中有12张箱型图,图中依次是行为编码0-9在不同组学习者的RSBC、行为序列长度以及成绩的箱形图。前10张小图的纵轴为行为编码的RSBC,横轴为学习者分组1到4,分别是成绩由低到高的四个组。箱形的上沿和下沿分别是该组样本的上四分位数和下四分位数,箱形中间的黑线表示其样本的中位数。(文中若如无特殊说明,所报告的组间均值差异均通过了显著性水平为0.05的双样本t检验)
1.不同组学习者行为序列长度和时长的比较和解读
行为序列长度指学习者学习路径中各编码数量的总和,学习者在平台上有意义的访问页面的行为越多,则其行为序列的长度也就越长。四组学习者的行为序列长度的均值大小为又X4>X3>X2>X1。需要说明的是,所有编码在不同的学习者组中出现的频数的均值的大小的排序均为X4>X3>X2>X1,即优秀的慕课学习者的与平台发生交互的次数更多。
第四组学习者的行为序列长度明显高于前三组,这说明第四组学习者与平台发生的交互更多。以所有学习者为样本,学习者的行为序列的长度与其学习成绩有极强的正相关,其皮尔逊相关系达到了0.8,且在0.05的显著性水平下显著,是预测学习者表现的一个十分有效的指标。
此外,各组学习者的所有学习行为序列的长度、一学期中的上线次数、每次上线发生的有意义交互行为的数量中蕴藏着许多有价值的信息。以每次的信号行为,即页面停留时间在45分钟以上的行为,作为一次学习者一次线上学习的开始和结束,可以统计每个学习者上线学习的次数以及每次上线发生的交互行为的数量。图3左侧的箱形图展示的是四组学习者上线学习次数的统计结果,四组学习者的上线学习次数的均值大小为X4>X3>X2>X1,一结果说明成绩越好的学习者,其上线参与学习的次数越多。但是,各组学习者上线学习的过程中他们与平台进行交互的行为频数是否有差异呢?图3右边图的结果显示四组学习者每次上线与平台发生有意义交互行为的次数之间的差异并不大:四组均值分别为14.95、15.41、14.57、15.21。
统计各组学习者每次上线学习的时长,发现其差别也不大。四组的均值分别为34.35分钟、33.69分钟、32.36分钟和35.47分钟,第四组学习者的平均每次上线时长稍长于其他几组。
2.不同组学习者各RSBC差异的比较
从编码1的RSBC来看,四组学习者的编码1的RSBC的均值大小为X1>X2>X4>X3。編码1是学习新内容的行为,由表2可知,在所有学习者中,编码1的RSBC达到了23.6%,在学习者的所有学习行为中占有很大的比重。四组学习者间的差异也显示了,成绩较差的两组学生(组1、组2)的编码1的RSBC较高,其观看新内容在所有学习行为中占有了很大的比重;而成绩达到了及格及以上的两组学生(组3、组4)其编码1的RSBC又相对较低,而成绩较好的那组(组4)的RSBC更高。
编码2的意义是复习已经学过的内容。各组编码2的RSBC的均值差异情况为为X4>X3>X2>X1,除1、2两组之间的均值差异外,其余各组之间的均值差异皆通过了显著性水平为0.05的双样本t检验。这一结果说明学业表现更好的学习者的所有学习行为中的复习行为所占的比例相对来说更高,且第四组学习者的编码2的RSBC是所有组中最大的。
编码3的意义是浏览和回答课堂讨论区中的教师提问。各组编码3的RSBC的均值情况为X4>X3>X2>X1。这说明学业表现更好的学习者的所有学习行为中浏览和回答课堂讨论区中教师的提问这一行为在其所有学习行为中的占比会更高。
编码4的RSBC代表的是参与论坛互动(发帖或者回帖)在学习者的学习行为中所占的比例。在整个学习者群体中,编码4的RSBC的平均值是4.6%,是一个占比相对较小的行为。四组学习者的编码4的RSBC的均值的情况为X4>X3>X2>X1。这说明成绩更好的学生所有学习行为中参与论坛互动的行为比例在四组中是最高的。
编码5的RSBC代表的是参与测验这一行为在学习者的学习行为中所占的比例,整个学习者群体的编码5的RSBC的均值呈现一个倒U型的分布:均值大小为X3>X2>X4>X1。这一结果有许多值得解读的地方:优秀学习者的学习行为中测验行为对应的编码的RSBC并没有成绩中等的两组(组2、组3)高,说明这两组的学习者在参与测验上所花费的时间相对来说会比最优秀的学习者更多。值得注意的是,这种“更多”是一种“相对”的行为占比上的更多,而非“绝对”的行为数量。各组学习者样本的编码5出现的平均频数为:X4>X3>X2>X1,值分别为109.6、86.7、45.5、7.8。对这一现象可以给出这样一种可能的解释:优秀的慕课学习者更愿意参加测验,但是他们也会花费相对其他学习者更多的精力在获取成绩以外的地方。
编码6的RSBC是学习者浏览公告、评分标准、课程日历、章节介绍、章节回顾等行为在学习者所有行为中所占的比例。四组学习者的编码6的RSBC的均值大小为X1>X2>X3>X4。说明优秀学习者的浏览公告等与知识内容不直接相关的这些行为在其所有学习行为中占比相对其他组来说更少。
编码7出现的频数是最少的学习行为。对各组的编码7的RSBC的均值之间的差异进行t检验,在0.05的显著性水平下发现只有第一组学习者的编码RSBC高于其他三组学习者,但是其他三组学习者的组间并无显著差异。对于第一组学习者,由于其课程的参与度不高,其各种行为会呈现出更散乱、随机的特征。但是其余三组学习者的编码7普遍较低,说明其求助行为在总行为中的占比较少。
编码8出现的频数也不高,其RSBC的均值与编码7的情况相反,在0.05显著性水平的t检验下,发现只有第四组学习者RSCB的均值显著高于其他三组,这一发现暗示了优秀学习者的学习行为中中断或走神所占的比例会比其他学习者高。对于这一问题的发生机制,会在后文进行探讨。
编码9的RSBC是寻找行为在学习学者所有行为中的比例,在0.05显著性水平的t检验下,第四组学习者的RSBC仅与第一组学习者有显著差异,且第四组高于第一组。与对编码7的情况的解读相似,对于这种情况的一种猜想是:第一组学习者的课程参与度不高,其学习行为更为随意,目的性更少。而第四组学习者每次学习的目的性更强,在不熟悉页面间导航结构的情况下更容易出现寻找行为。
3.对各组学习者编码8的RSBC差异的因果推断
结合之前关于优秀学习者上线更为频繁的结论,不难发现优秀学习者的总在线时长更长。这给解释编码8的情况——优秀的慕课学习者的走神和中断行为提出了新的问题:从学习疲劳理论的角度来看,高强度的学习导致学习疲劳会使学习者产生抑郁情绪,情绪沮丧、心情郁闷、动机缺乏、效能感降低等反应,频繁的上线学习导致的学习疲劳可能是走神和中断现象出现的一个原因。毫无疑问,优秀的慕课学习者更易发生学习疲劳。那么,优秀学习者的编码8的RSBC偏高是否能由其长时间频繁的学习所解释呢?
研究使用倾向得分匹配方法(PSM)对数据集中的学习者个体进行匹配,需要控制的混淆变量是每次的平均在线时长和登录次数。理论上而言,倾向得分匹配方法(PSM)通过再抽样或基于接受干预的概率(即倾向值)将未被干预的成员与被干预的成员进行匹配来平衡数据,经过倾向得分匹配方法处理后,以成绩是否超过80分作为原因变量,处理组(80分以上的学习者)与控制组(80分以下学习者)的学习者的平均在线时长和登录次数是一致的。
使用Logit模型估计倾向值,使用遗传算法匹配前三组中倾向值与第四组相近的学习者,最终匹配到4496名处理组的学习者和2101名控制组的学习者,匹配的效果如表3所示。
从表3来看,经过匹配后,可以发现控制组和处理组的这两个变量的值几乎相同,偏差均在5%以内,匹配效果较好,可以认为已经在数据中控制了这两个变量。
对匹配后的控制组和处理组的编码8的RSBC进行t检验,检验结果显示控制组编码8的RSBC为0.0161,处理组的编码8的RSBC为0.0147,且在0.01的a值下显著。
控制了学习疲劳这一因素后的结果与未控制的结果恰恰相反。结果表明若比较两个平均在线时长和上线次数都相似的优秀学习者和普通学习者,优秀学习者发生走神、中断等行为的频率在统计意义上会比普通学习者更低,他们的学习会显得更专注。
4.优秀学习者行为占比及行为序列长度的特征
至此,研究能回答第一个研究问题,并对优秀慕课学习者的特点有—个大概的描述:首先,优秀的慕课学习者在平台上的活动更多,在线时间更长,与平台的内容发生的交互更多。但是其有记录的每次上线学习过程中与平台发生的有记录的行为次数、在线时长与其他学习者相仿,但是其上线学习的次数明显高于其他学习者。其次,比较其在平台中的各种行为的占比与其他学习者的区别,他们参与和回答教师的提问、复习已学过的内容、参与论坛互动的行为的占比更多,而学习全新内容、参与测验、把握全局等行为的占比较少。一点有意思的发现是,他们的走神和中断行为的占比比其他学习者更多,但是若控制了学习疲劳这一变量,则他们发生走神、中断等行为的频率比普通学习者更少,表明他们的学习更专注,而中断、走神等行为的偏高可能是他们调节自身认知状态的一种表现。要进一步了解其特点,需要进行下一步更深入的挖掘。
(四)不同组学习者一次学习中各行为的共现分析和解讀
从之前的分析中可以发现,优秀的慕课学习者每次上线学习过程中与平台发生的有记录的行为次数与其他学习者相差不大,但是其每次上线的学习行为模式是否会有差别?统计学习者每一次上线记录(以信号行为为分割)中的各行为编码的共现次数并对其进行共现分析,可以从中发现学习者的一次线上学习过程中,哪几类行为更倾向于同时出现。
在共现分析中,因为信号行为标志着一次在线学习的开始和结束,故对其信号行为的分析意义不大,本研究只研究编码为1-9的各行为的共现情况,并对结果进行可视化。
1.可视化方法
对学习者一次学习行为中各行为的共现情况进行分析的第一步是计算其各编码之间的支持度。
某一或某组学习者,其整个课程的学习过程中编码行为X和编码行为Y在某一次上线学习中同时出现的概率可以用关联规则R:X→Y的支持度来表示:
其中,L为学习者一次上线产生的学习路径中包含了编码Y的记录的集合count(X U L),表示在一次上线中某学习路径同时含有编码X和Y的次数,IDI表示在所有的上线记录构成的集合中出现的,含有编码Y的一次上线记录的个数。
可以用图的方式对四组学习者的各编码行为间的共现关系进行可视化。可视化的思路为用图的顶点表示1-9的行为编码,顶点间边的长度表征编码间的共现关系,两个编码同时出现的频率越大,顶点间边的长度越小,两个顶点的距离越近(如图4所示)。
图中有连线的顶点表示其代表的两个编码之间的支持度大于0.7,即在一次学习中共同出现的概率大于0.7。
2.学习者行为编码共现情况
从图中可以发现,四组学习者的一次学习行为编码的共现情况有一些普遍的规律:
(1)四组学习者中编码8(走神或中断)和编码9(寻找行为)与编码2(复习)、5(参加测验)、6(把握全局)、7眯助)的共现概率较大,说明学习者在进行复习、参加测验、浏览公告、在论坛寻求帮助等行为时有很大概率走神、中断学习或者在页面中迷航。
(2)图中四组学习者的编码2、5、6、7彼此之间的距离都很近,说明这几类行为在一次学习中同时发生的概率很高。这可能是学习者学习的—种共同的模式:有计划地在某次上线时专门进行复习并参加测试。
除此以外,能在图4中能发现优秀学习者的一些特点:
前三组学习者的编码1(学习新内容)与编码8和9都有连线,说明其一次学习中在学习新内容时更易发生走神、中断和在页面中迷航的情况。然而对于第四组学习者,即优秀的慕课学习者而言,他们的编码1与编码8、9没有连线,说明其在学习新内容时相对更不容易发生走神和中断的情况。而除此以外,优秀学习者与其他学习者一样,其编码8与编码2、5、6、7的共现较多,在进行复习、参加测验、浏览公告、在论坛寻求帮助等行为时容易走神。
同时,第四组学习者的编码1与3(回答教师的提问)的距离是最近的,说明优秀慕课学习者学习新内容和回答教师提问更易在一次学习中同时发生。
更重要的是,优秀的慕课学习者每次上线学习的主题更突出。从图中可以发现,对与其他几组学习者相比,第四组学习者的编码1与其他编码的距离普遍显得更远,仅与编码3距离相对较近。这说明除了回答教师提问外,优秀慕课学习者的学习新内容的行为是较为独立地,与其他行为共现的概率不高,这暗示了他们的每一次上线学习可能都有较强的目的性和专一性——只学新内容,或者只复习。第四组学习者编码4(参与论坛互动)的情况也印证了这一猜想:它与其他的编码的距离也较远,说明该行为发生的独立性也更高。如前文所说,编码2、5、6、7可以被视作一种学习主题(复习并参加测试),而在各组学习者行为呈现出的共现情况来看,由于第四组的编码1和4的距离较远,可以将第四组学习者的编码1和编码4也视作两种独立的每次上线学习主题的核心:以学习新知识为主题或者以论坛互动为主题。而其他学习者的编码1和4的距离很近,并不能划分出独立的学习主题。故可以认为,优秀的慕课学习者每次上线学习的主题更突出。
3.优秀学习者一次上线中各行为編码共现的特点
至此,优秀的慕课学习者的特点又增添了更多的细节:首先,他们与其他学习者一样,会有计划地在一次学习中同时进行复习、提问求助、参加测试,而且容易在期间发生走神和页面间的迷航。但是他们在学习新的学习内容时更专注,不易发生学习中断的情况,对页面间的结构也更了解。同时,他们更倾向于在学习新内容的同时回答教师的提问,而且他们每次学习的主题更突出。
五、结语
优秀的学习者的学习模式有什么样的特点?通过上述的分析,可以总结出以下几点:
首先,从学习投入上看,研究发现优秀的慕课学习者在在慕课平台上产生的有意义的交互行为的数量显著地多于其他学习者,故其学习投入比其他学习者更多,这是优秀学习者的一个重要特征。
其次,从学习策略上看,具体到RSBC,优秀的慕课学习者的学习策略有着这样的特点:
第一,参与和回答教师的提问、复习已学过的内容、参与论坛互动的行为的占比更多,而学习全新内容、参与测验、把握全局等行为的占比较少。
第二,从编码间共现分析的结果来看,他们的每次上线学习显得更有目的性,学习的主题更鲜明。
第三,他们更倾向于在学习新内容的“同时”去回答教师的提问。事实上,在课程设计时学习者回答教师提问是穿插在新的教学内容之中的,优秀的学习者更倾向于遵从这种教学的引导,而这种遵从也能促进他们的学习。
第四,优秀的慕课学习者的走神和中断行为高于其他学习者。经过进一步分析,结果表明如果控制了学习疲劳这一因素,优秀的慕课学习者发生走神和中断的频率会比其他学习者更低,他们的学习会更加专注。结合共现分析的结果来看,他们在学习新内容时的走神和中断却更少。优秀的慕课学习者每次上线产生的有意义编码序列的长度与其他学习者相仿,但是他们的上线学习次数更多。这暗示着优秀的慕课学习者在高学习投入的学习过程中更专注,且偏好用休息等方式及时调整自身的状态,避免在学习新内容时发生学习疲劳的情况。
从优秀的慕课学习者表现出的学习策略来看,引导学习者参与论坛互动和进行复习,是有效促进学习者学习的手段,慕课设计者可以在设计中更多地加以考虑。
需要说明的是,本课程的设计中论坛互动是评价的一部分,学习者可能会以成绩为目的去进行论坛互动。在数据中,暂时没有办法将这两部分的效应进行分离。优秀的慕课学习者,在本文的操作定义的语境下只是成绩得到了优秀的学习者,但是他们是由两部分可能的人构成的:真正以学习知识和内容为目标的学习者与以获得证书为目标的功利学习者——虽然他们表现出相同的行为,但是其学习动机与最终的习得的效果一定有差别。然而成绩较低的第一组学习者中可能也不乏学习投入较高,但是不愿意参加测试的学习者,因为他们将课程作为获取学习资源的平台而不愿参加到学习评价中来。本研究并没有办法将这两类“优秀学习者”在数据层面上分离开来,这是研究的一大缺憾。
作者简介:
乐惠骁:在读硕士,研究方向为人工智能与教育、学习分析(interesting@pku.edu_cn)。
范逸洲:在读博士,研究方向为学习分析(yizhou0034@126.com).
贾积有:博士,教授,研究方向为人工智能与教育(ljy@pku.edu.cn)。
汪琼:博士,教授,研究方向为e-Learning学习环境与学习设计(wangqiong@pku.edu.cn)。