刘智 王亚妮 郑年亨 刘三蚜 孙建文 杨重阳
摘要:由于教学方式的灵活性与学习的可控性,小规模限制性在线课程(small Private Online Course,SPOC)在高等教育学府教学实践中备受欢迎,而目前针对高校SPOC环境下学习行为模式和规律的研究还甚少。该文以华中师范大学自主开发~JSPOC平台StarC中125175B在校大学生在一学年内的学习行为记录作为研究对象,并对其学习行为进行了实证观察、编码与分析。首先邀请两名专家对行为数据进行编码,提取学生学习行为的二阶转移序列,然后对编码数据采用频率统计分析和二阶序列分析以发现高校SPOC教学中学生行为序列的概率分布和状态转移模式。在此基础上,采用滞后序列分析法(Lag Sequential Analysis,LSA)提取每个年级学生最显著的行为模式,据此发现不同年级群体行为操作的规律性,并对不同年级下学生行为模式的差异性进行分析。最后,评估了学习平台的可操作性、可扩展性与局限性并为今后SPOC环境下学习行为的研究提出建议。
关键词:学习行为;二阶序列分析;转移序列;SPOC;差异性
中图分类号:G434 文献标识码:A
一、引言
当前,慕课(Massive Open Online Courses,MOOCs)的应用在教育技术领域中引发了广泛关注。与传统线下课堂相比,慕课更具备开放性与自主性。但近两年的研究表明,慕课平台学生注册数的大幅增长引发了学习质量的危机,多数学生仅注册而不参与学习,慕课中产生的高辍学率与低完成率问题已成为限制其发展的一大挑战。为克服这些问题,Fox提出仅用于校内教学的小规模限制性在线课程(Small Private Online Collfse,SPOC)概念,SPOC参考慕课的运行过程,并将其用于课堂教学的补充,是慕课的继承和发展。与慕课相比,SPOC主要关注于课程具体内容的深入教学和对学生知识能力的重点培养,其学生规模较小,每门课堂均设置准入条件,少数具备资格的学生才能被纳入课堂。其小规模与限制性的特点利于教师对课堂实施高效管理和个性化教学,以此增强学生的学习体验,也有助于促进师生交流,使学生更容易获得学业成功。Piccioni等人的研究发现,将SPOC应用于计算机科学课程时,学生在每个课程单元下的平均参与率达到71%以上,且学生上交的编程作业有80%符合习题要求。罗九同等人通过案例分析发现,设计良好的SPOC可以更契合本校或多校联合教学的模式,提高学生的学习效果。
SPOC提供了一个适应于各种教学方法的混合式学习平台。Zhang等人近期的一项研究表明,与传统课堂相比,学生在融合混合式教学的SPOC平台中学习效率更高且学习状态更加稳定。该研究还显示,学生的学习效果受到其学习时间和学习资源利用率的共同影响。虽然学习效果可以通过实验或相关分析进行检测,但是学习成效较好的学生的学习方式及其学习过程中的隐含行为模式尚不清楚。除此以外,学生在SPOC平台中的学习动机尚不确定,Ziebarth等人的一项日志分析显示,在考试期间,学生瀏览视频的次数呈现上升趋势,这表明获得更好的考试成绩可能是学生在SPOC平台中参与学习的目标之一。Piccioni等人发现,与浏览视频相比,学生更倾向于参与在线测验和练习。这一发现也让研究者认为,测验与练习是帮助学生在SPOC中持续深度学习的一种有效教学活动。
系统日志包含大量有效的学习过程信息,可以用于分析学习行为和成效间的关系,但由于学习行为具备复杂性、时序性以及动态性,仅分析系统日志中行为状态的分布难以准确甄别学习过程中显著的行为模式及其演化过程。基于以上问题,采用时间序列对学生行为模式进行更为细粒度的分析和挖掘显得尤为重要。
二、e-Leaming环境下行为序列分析的研究概述
本研究主要采用滞后序列分析法(Lag SequentialAnalysis,LSA)对SPOC环境下的学生行为的转移模式进行分析和挖掘。LSA是挖掘显著行为模式的一种有效方法,目前主要用于在线论坛的交互讨论和游戏型教学情境下显著行为序列的检测。应用LSA方法可综合分析学生在线学习的外显行为与内隐行为,帮助研究者了解学生的知识创生、知识共享和知识建构过程。近年来,e-Learning环境下学习行为的序列分析主要关注于不同学习群体的行为差异性研究和行为演化趋势探讨,其中不同的群体又分为不同性别,不同学业表现和通过聚类或特定测量机制(学习风格、学习动机等量表)所划分的群体等。这些研究基本停留在对学生短期行为的观察和统计上,且大部分研究中涉及的实验数据规模较小,研究结果存在一定的局限性。Kapur根据学业成就将印度首都两所高中的177名高二理科生随机分为两组,收集并编码了各组学生在协作学习中的讨论方式,并采用序列分析鉴别不同群体学习过程中的转移情况。Hou和Wu跟踪了在线网页设计课程下40名大学生的学习过程,对学生在课程同步讨论时所产生的信息进行编码,并使用序列分析来分析高质量讨论与低质量讨论群体间的行为模式差异。Yang等人跟踪了79名学生学习用Java进行安卓APP开发的过程,对学生在线测验的行为进行编码与序列分析,重点分析了实验组和对照组学生行为模式的异同和前后测中行为模式的差异,研究发现前测与后测并不会影响学生进行在线测验的行为模式。
相比M00C环境下的学习行为研究,SPOC环境下的相关研究还较少。尽管SPOC有助于促进区域化和校内教学与管理,但其仍是一个较为封闭的系统,其中隐藏的潜在问题可能会抑制学生知识能力的全面发展。Hou等人的研究发现,教师通过在私有学习环境中设置干预机制来提高学生的学习质量时往往会遇到困难。Park的研究表明,理解学生的学习行为与动机能帮助教学管理者创设吸引学生积极参与的学习情境,从而帮助他们适应在线学习模式。因此,SPOC环境下的行为分析对于学生行为偏好与学习模式的挖掘、学习环境的重构以及学习体验的提升具有重要的研究意义和应用价值。
三、研究设计
(一)研究场景
StarC是华中师范大学基于SPOC概念设计开发的在线学习平台(http://moocapp.starc.tom.cn/application/mooc/)。该平台采用云计算架构,融合同步和异步的多元互动学习模式,为在校大学生提供多种学习服务。参考M00C的基本学习元素,平台嵌入多种学习资源(如视频、课件、测验、作业等)和互动学习情境(如讨论、答疑与聊天室、学生互评等)。该平台主要包括资源、通知、作业、成员和统计五大模块。学生参与课堂学习的主要模块为资源模块,其组织结构如图1所示。当学生进人资源模块之后,屏幕左方自动显示课程章节列表,每章包含若干学习单元。当选中一个学习单元,屏幕右方自动展示该单元对应的学习活动,学生进入学习活动可查看相应的教学课件资源。一个活动通常包含多个课件,且每个课件区域包含多个文件,如幻灯片、视频、音频、测验和图片等。
(二)研究问题
本研究旨在对高校SPOC环境下的大规模的时序学习行为进行归纳、整理和分析,并挖掘群体学习行为模式与不同年级学生的行为序列差异性。基于本文研究目的,本文提出了以下3个研究问题:
1.学生所体现的不同行为具有怎样的频率分布?单一行为之间具有怎样的差异?
2.StarC中群体学习行为具有怎样的模式?群体学习行为序列具有怎样的特点?
3.不同年级学生具有怎样的行为特征?不同年级学生的行为模式具有怎样的差异?
(三)研究对象与数据来源
本研究选取2014年9月之前在StarC平台注册的12517名华中师范大学在校大学生为研究对象,其中包括3997名大一新生,4329名大二学生,4021名大三学生和170名大四学生。后续分析的数据采集于平台自2014年3月21号至2015年3月4号共计348天的日志记录,共涉及2642门课程,平均每门课程包含22名学生。
(四)研究方法
基于数据的便捷性、完整性与一致性考虑,本研究采用教学专家所设计的系统点击流编码规则对行为数据编码,并进行编码有效性检查。研究方法如下:
首先,收集学习系统中学生每次登录登出过程中产生的点击行为,共计23项,由两名来自系统开发团队的专家对各行为作出解释。为便于进一步处理,将行为数据与学生信息相整合并构建事件表(学生学号、系统角色、域名、时间戳、事件背景与事件类型)。采用xAPI(学习经历数据规范API)标准进行学习经历的量化,将每一个学习活动映射为一个{学生、动作、对象、结果、内容、时间戳和权限}形式的元素表。其次,邀请两名从事在线学习行为分析的专家对以上行为进行总结,并抽取其中最关键的8个行为进行编码解释,编码方案如右表1所示。根据编码准则,系统记录的所有学生的行为/事件日志被自动编码为8个行为类别,并由系统开发人员和教学技术专家检验分类结果的有效性。在对所有数据完成编码的基础上,计算单个行为发生的频次,根据编码行为的时间顺序展开二阶序列分析,计算行为转移概率和序列联合转移概率,最后得到调整的残差表(如:Z值表)。
本研究共编码产生14426772个行为,这表明学生平均每天产生41456.24个行为记录,这种大规模数据有助于对学生的长期学习行为进行代表性分析。N-gram滑动模型可自动抽取n阶序列,曾被成功应用于行为预测和语言模型中。本研究对编码后的行为数据采用N-gram方法,通过计算机编程自动构建出学生学习行为的二阶转移概率矩阵,并以此刻画学生的行为序列模式。N-gram滑动模型伪代码如图2所示。
N-gram模型主要用于非結构化数据中细粒度判别信息的提取。模型参数如下:Si表示完整的序列S中第i个行为,N表示子序列所包含的行为个数,利用S序列可抽取出N-1步转移子序列,如:根据时间先后顺序,一个完整且连续的行为序列为“A→B→C→D→E”,则二阶序列可被抽取为:“A→B→C”“B→C→D”和“C→D→E”。同时,这些序列的联合转移概率也可以根据行为状态之间的转移概率来计算。
四、研究结果与分析
(一)学生在线行为统计与分析
各年级学生的编码行为频度如表2所示,由表2可知,全体学生中发生频率最高的行为是参与学习活动(LA),其次是观看课件(CW),进入学习单元(Lu)和选择课程(CS)。发生频率最低的行为是查看同伴信息(MB)。这一结果表明,资源模块下,参与学习活动学生在StarC进行学习时最主要的学习行为。在其他独立模块中,查看作业(HW)是发生频率最高的行为,其次是查看统计结果(SR),这一结果与Sinha等研究者的研究结论相似。尽管查看作业(HW)是辅助功能区最活跃的行为,但其发生频率却明显低于LA(参与学习活动)和CW(观看课件),这反映出学习活动是SPOC环境的主要元素,作业则是SPOC环境下进行学习效果评价的基准。同时也表明SPOC更侧重于关注学生的学习过程。另一方面,从MB(查看同伴)行为的统计结果中发现,学生较少关注相同课程下的其他学生的个人信息,在学习互动方面的表现不积极,这意味着SPOC平台应增加一些互动功能以促进同一课程下的学生的多模式通信(如:同步聊天,音频/视频会话等)。
为评估单一行为在各年级组间的差异性,对.编码行为开展单因素方差分析,选取显著性水平为0.05,计算F统计值和p值,比较各样本所代表的总体均数是否相等。原假设H0为单一行为在四个年级组间没有显著性差异,当p值小于显著性0.05时拒绝原假设。实验结果表明:七种编码行为在各年级组间具有显著性差异,分别为:CS(选择课程)(F=4.26,p=0.006),LU(进入学习单元)(F=2.78,p=0.041),LA(开展学习活动)fF=3.02,p=0.030),AN(查看公告)(F=8.7,p<10-4),HW(查看作业)(F=5.63,p=0.001),MB(查看同伴信息)(F=4.77,p=0.003)及SR(查看统计结果)(F=9.19,p<10-5)。多种行为在年级组间的显著差异映射出不同年级组间的学习模式可能具有显著性差异。由表2可知,行为CW(观看课件)与LA(开展学习活动)的频度较高,学生操作较活跃,为评估CW与LA在全体学生中的差异性,对CW与LA采用配对样本t检验,检验结果表明:全体学生CW(观看课件)行为的发生频率明显低于LA(开展学习活动)行为(t检验统计结果为:t0.05,3=2.50,p=0.044),这表明学生可能仅单击进入学习活动区,并未开展实质性的浏览课件行为,由此反映出系统课件区资源设计可能存在不合理性,无法有效激发学生的学习兴趣。对表2中各行为进行纵向比较发现,高年级组的CW(观看课件)行为最不活跃,这表明高年级学生在查看课程辅导资料时可能更缺乏耐心。产生这种现象的可能原因在于高年级学生的课程任务较少,他们主要面临就业问题,因此其可能更倾向于获得社会经验而不是继续在SPOC中学习理论课程。
(二)群体学习行为模式分析
以往对学习者行为序列模式的研究往往采用一阶序列分析法,所得序列形如“A→B”结构,此方法仅考虑一步转移,忽视了过渡信息的复杂性。为捕捉深度连续的行为模式,本研究对编码数据进行二阶序列分析,计算学生行为序列的二阶频率转移矩阵和概率转移矩阵,并通过计算z值寻找显著的行为模式,计算公式如公式(1)至公式f4)所示。其中Oi为二阶序列i发生的次数,N1为第一步子序列与序列i相同的二阶序列总数,N2为最后一个行为与序列i相同的二阶序列总数,N为二阶序列总数,z值大于1.96则表明该序列显著,z值越高表明显著性越强。由于二阶序列包含多方向与多组合的复杂过渡事件,为便于直观观察,选取最显著的8个行为模式进行可视化,分别为:CS-HW-CS、LU-LU-LU、LU-LA-CW、LA-CW-LA、AN-HW-MB、HW-CS-HW、HW-MB-SR和MB-HW-AN,群体行为转移序列如下页表3所示。
观察表3可知,序列LA-LU-CW的z值最高,表明该行为序列显著性最高,学生群体在StarC平台学习时最倾向于遵循LU-LA-CW路径。此外,HW-CS-HW、LU-LU-LU、CS-HW-CS、LA-CW-LA、HW-MB-SR和MB-HW-AN等二阶序列模式也具有较高的z值。表3中AN、CS、HW和MB之间的转移关系较为复杂,CS-HW-CS、AN-HW-MB、HW-CS-HW、HW-MB-SR和MB-HW-AN这五个二阶序列包含AN、CS、HW和MB中至少两种行为,其中序列AN-HW-MB和MB-HW-AN的转移概率较高,反映了个体行为经常在AN与MB之间往返,这表明在线学习情景下学生查看作业,查看公告和查看同伴信息的行为之间具有一定的序列相关性。
(三)不同年级学生的学习行为模式分析
为了进一步探讨行为模式在年级上的差异性,对各年级学生的编码行为分别进行二阶序列分析,鉴于直观性考虑,选取各年级学生行为转移最显著的三个二阶序列进行可视化。
大一学生行为转移如右图3所示。由图3可知,行为序列CS-HW-SR(z=34.62)的概率最高,这表明大一学生在进入某一门课程之后,可能会优先查看教师布置的课堂作业,其视完成学习任务为SPOC学习的主要目标。这与MOOC中无约束学习方式有所区别,MOOC中的课件是学生学习的核心,而作业是大多数学生的附加任务,很多MOOC学习者并不是为了完成任务而参与学习。其余两个较为显著的序列为HW-CS-MB(z=23.70)和LA-SR-AN(z=21.57),子序列LA-SR表明行为LA与SR之间有很强的关联性,这意味着大一学生更倾向于在离开学习活动模块之后直接查看统计结果。他们可能关注于自己的历史行为数据和在线学习表现,如学习时长与活跃度,两者都是评估学生最终成绩的关键指标。
大二学生行为转移如右图4所示,由图4可发现,大二学生与大一学生最显著的三个行为序列相同,为CS-HW-SR(z=113.98)、HW-CS-MB(z=68.1 2)和LA-SR-AN(z=35.73),但大二学生在这几个序列中的z统计值明显高于大一学生,这表明大二学生在参加学习活动和查看作业的过程中更加积极主动,这可能是由于相比大一学生,大二学生的在线课程更多、学业任务更重,因此他们会更加自主地展开学习。
大三学生行为转移如图5所示,其最显著的三个序列为CS-HW-SR(z=109.86)、HW-CS-SR(z=82.26)和CS-CS-LU(z=35.66),相比其他年级的学生,大三年级学生选择课程单元的行为较显著(CS-CS-LU),这表明大三学生可能会反复选择课程和学习单元,他们可能并不准备学习某一门课程,因此倾向于结合自身的学习情况挑选自己认为较重要的课程与学习单元进行针对性学习。
大四学生行为转移如图6所示,其最显著的三个行为模式为CS-HW-SR(z=24.00)、CS-CS-LU(z=13.77)和CS-LA-CW(z=8.04),与其他年级学生相比,大四学生在CS-HW-SR序列上表现出更低的显著性,其他年级学生在完成作业之后,倾向于离开当前课程并查看自己在该课程中的统计结果(如:学习时间、每个练习的得分、整体学习进度等),这表明大四年级学生在StarC中对自己学业表现的关注程度较低。
五、结论与建议
本研究对高校SPOC学习平台中共计12517名学生在一学年中的学习行为数据进行了观察、编码和分析。通过频率统计分析,二阶序列分析和转移概率分析,探讨研究问题,并对SPOC环境下的大学生群体学习行为模式和不同年级组之间学生学习行为模式的差异性进行分析。基于以上量化分析结果,对本文的研究结论系统归纳和梳理,并对未来的研究以及SPOC平台的设计提出相关建议。
1.在单一学习行为转移的频率分布方面,该平台在资源模块中设置了嵌套的学习路径,以帮助学生通过循序渐进的方式掌握所学知识。四种学习行为(CS、LU、LA和CW)的统计分析证实,这种嵌套的学习路径对大多学生具有良好的适用性(约占学习活动的87%),比较多种行为频度发现,学生浏览课件的频度显著低于参与学习活动的频度,反映出当前课件的设计水平不能适应教学培养机制或不能有效激发学生的学习兴趣,因此,对课件的数量和质量进行同步控制可能有助于提高学生的学习参与度。
2.在群体学习行为序列方面,一方面StarC平台所嵌套的学习路径引导学生按照LU-LA-CW的流程进行学习,这使得初学者可以直接采取有效的学习顺序,减少重复尝试所不必要的时间。另一方面,序列分析的結果反映出学习行为主要在LU、LA和CW之间转换,这表明这些行为之间具有显著的连续性。根据二阶序列分析,本研究得出以下结论:(1)当AN、HW、MB~SR出现在二阶序列的中间位置时,该学生有极大的概率会离开当前课程;(2)多数序列以查看作业为中间环节,这表明完成作业是学生在此学习平台上的主要动机;(3)学生倾向于通过查看可视化的学习统计结果来追踪其历史学习过程,这表明学生很关注自己在StarC中的表现。在虚拟学习环境中,学习成绩的可视化已被证明有助于培养学生的反思意识。由于学生通常需要在分析学习目标和查看作业时回顾学习内容,平台各模块的独立化可能影响学生的反思性学习过程,本研究建议在平台的资源模块中嵌入更多具有反思机制的学习情境,例如在课程学习模块中添加评论、讨论和互评功能来丰富学习场景,从而培养学生资源模块的黏性。
3.在每个年级的行为转移方面,本研究评估了单一行为及行为模式在不同年级学生间的差异,分析结果显示,大二学生为学习行为活跃度最高的群体,大四学生行为活跃度显著低于其他年级。大一新生倾向于查看的任课教师的教学通告和自身学习状态的可视化图形之后,对以往的学习活动进行回顾,导致这种现象的可能原因是大一新生初次接触在线学习平台,他们对平台的操作不够熟练,需要通过反复地回溯各种单元活动来消化知识,这种反思性学习方式可能有助于个体学习过程的优化。大二学生在与CS(选择课程)和HW(查看作业)相关的操作上表现更活跃,这可能是因为大二学生的学业任务比其他年级学生更重,因此他们对解决作业问题的关注程度更高。同时,大二学生需要选择多门课程来取得学分,因此其行为经常在不同的课程之间频繁转移。大三学生在登录平台后,通常首先访问学习单元以提高其活跃度与学习时长,然后查看同伴信息,统计结果或课程公告。这意味着,大三学生视学习绩效可视化为重要反馈与激励。就大四学生而言,其课业任务较轻,因此平台学习资源可能并不适用于面临就业的学生,建议将专业化岗位指导作为一个单独的模块加入到StarC平台,以满足大四学生的个性化需求。
本研究利用高校SPOC平台上在校大学生的大规模学习数据,进行群体行为模式分析和年级组之间学习行为模式的差异性比较,旨在挖掘高校学生潜在的学习行为模式或习惯,并以此评估当前模块的可改造性。本研究主要采用二阶序列分析挖掘群体与不同年级组的细粒度学习行为模式。在今后的研究中,希望将学生的情感、学习兴趣、认知、社交和知识水平与行为序列进行联合分析,并利用自动序列模式挖掘与社区发现技术以进一步提升高校SPOC学习平台的个性化与智能化导学水平。
收稿日期:2017年2月25日
责任编辑:宋灵青