基于行为序列分析对在线学习参与模式的探索

2017-05-30 13:40李爽钟瑶喻忱程罡魏顺平
中国电化教育 2017年3期
关键词:在线学习聚类分析

李爽 钟瑶 喻忱 程罡 魏顺平

摘要:该文基于开放大学2131名学生在课程Moodle平台上的日志数据,通过相关分析、滞后序列分析和聚类分析对在线学习行为序列和参与模式进行了实证探索。研究发现,15个Moodle平台日志记录行为所形成的122个行为序列中,有36个行为序列与成绩显著相关,其中包括四个测试行为相关序列与成绩呈中度相关。研究采用滞后序列分析发现六个发生概率达到显著性水平的行为序列,并构建出在线学习行为转换模式。通过聚类分析,研究将学生样本根据其行为序列特征划分五种类型,并定义出五种在线参与模式:低投入式、浅层次投入式、绩效投入式、循序渐进式和随机参与式。文章最后从行为序列分析的价值、有效的行为序列与模式以及对在线学习行为转换特征的反思等方面对研究结果进行了讨论与总结。该文期望该研究能够为在线学习的分析、评估与促进提供有益的研究视角和研究支持。

关键词:在线学习;在线参与模式;行为序列;滞后序列分析;聚类分析

一、引言

基于学习数据分析与挖掘在线学习特征与规律是优化在线教学和支持服务的重要依据。目前,大部分在线学习数据的分析以考察和评估学生的在线参与度为主。相比之下,对学生在线学习方式与过程的分析和挖掘较少。学生究竟是如何基于学习管理系统和在线学习平台进行学习的,他们的参与方式、学习路径与行为模式是怎样的,是否与教学预期相符,存在怎样的局限?等问题仍然需要更多研究的关注。

滞后序列分析法(Lag Sequential Analysis,ISA)是Sackett提出的一种检验行为序列显著性的方法。该方法通过分析一种行为在另一种行为之后出现概率的显著性探索人类的行为模式。近年来,该方法被应用在对学生各类学习活动参与行为和方式的分析中,如分析在线平台或空间中的讨论、协作问题解决或协同翻译行为,分析在线教育游戏系统或活动中学生的操作行为或参与方式,分析学生应用思维导图工具学习的行为模式,分析学生在博物馆绘画欣赏活动中的行为特征等。已有研究中,应用LSA分析在线协作知识建构行为的研究占较大比重。可是,整体上对学生参与学习管理系统或学习平台的学习过程与行为模式分析较少。学习管理系统等各类学习系统日志记录了学生登录系统后的主要行为事件信息,包括行为主体、动作类型、行为发生模块等信息,这些数据为分析学生登录平台后的行为轨迹和行为模式提供了有价值的数据。

鉴于此,本研究将基于滞后序列分析法对开放大学在线课程Moodle平台上的学生行为数据进行分析,探索远程学习者基于Moodle的学习行为转换特征及其在线参与模式。

二、研究方法

本研究综合相关分析、滞后序列分析、聚类分析等方法,在行为序列分析基础上,通过挖掘日志数据探索开放大学学生基于课程Moodle平台学习的行为转换特征与参与模式。

(一)研究问题

1.学生基于Moodle平台的行为序列与课程成绩是否显著相关?相关水平如何?

2.学生基于Moodle平台学习所形成的行为序列中,有哪些序列的出现概率达到显著性水平,由此所反映的在线学习参与模式与特征是怎样的?

3.案例课程中学生根据其行为序列特征可以被聚为几类,各类学生基于Moodle平台的在线学习参与模式与特征是什么?

(二)案例课程与数据样本

研究以国家开放大学一门教育专科公共必修课2014年秋季学期Moodle平台记录的2131名学习者日志数据为样本。该课程采用基于Moodle的在线学习与地方学习中心支持下的自主学习相结合的远程教学方式,课程持续六个月,共36学时。在线课程在开放大学网络课程中具有一定代表性,以理论知识讲解为主,学生基于Moodle平台的学习活动包括系统学习课程理论知识、与教师和同伴互动、做测试题、做作业、自主学习其他课程资源等。课程计分作业包括Moodle平台上三个在线测试任务和一个社会实践调查。在线测试任务允许学生分多次完成和多次尝试,以尝试的最高分计人成绩。实践调查由各地学习中心根据本地实际情况组织实施,允许学生线下提交调查报告。

课程Moodle数据库中的log表记录了学习者在平台上的各类行为信息。本研究分析的2131名学生在课程2014年秋季学期中共产生191979条log记录数据,这些数据是本研究的数据样本。研究重点分析log表记录的Time、UserID、Module、Action字段,考察学生在线学习的行为序列与转换模式。

(三)数据处理与分析

通过分析课程log表中记录的学生动作,研究筛选掉发生频次极少的偶发型动作类型,主要聚焦21个动作,并将其归纳为15种行为,作为行为序列分析的行为对象。这15种行为分别在log记录的五个模块(Module)中发生,包括论坛(Forum)、测试(Quiz)、作业(Assign)、页面(Page)和资源(Resource)。表1呈现了15种行为所属模块,包含的动作(Action)以及研究编码。

本研究将一种行为向另一种行为的转换定义为一个行为序列,并用两种行为的编码组合表示两种行为形成的序列,组合中行为编码的前后顺序代表该序列中行为转换的方向,如先发帖(F1)后搜索帖子(F2)的行为序列表示为F1F2。研究定義的15种行为理论上能够建立210个行为序列,但是数据分析表明学生样本在案例课程学习中只产生了122个行为序列。

在行为序列分析前,研究首先需要通过对log表原始数据的计算获得学生样本在案例课程中产生的行为序列。由于课程Moodle数据库log表并不记录学生登人登出平台的信息,所以研究需要设定最大登录时长将log表记录数据切分为每次登录的数据。通过抽样分析高分学生的log数据,研究将学生单次登录行为间最大时长设定为两个小时,即当log表中两行为间的时差超过两个小时,研究便将后续发生的行为视为第二次登录的行为。基于此规则,研究采用Python语言编写算法获取学生每次登录在15种行为间的转换频次,从而获得学生样本在课程学习期间产生的行为序列数据。之后,研究采用相关分析考察行为序列与学生绩效的关系,采用滞后序列分析法分析发生概率达到显著性水平的行为序列,构建行为转换模式,并采用两步聚类法将学生样本根据其行为序列特征进行聚类分析。

研究采用SPSS19.0对行为数据进行描述性统计、相关分析、z分数转换与聚类分析。

三、研究结果

(一)行为序列与成绩的相关分析

将学生在课程期间产生的行为序列总频次与学生课程成绩进行Pearson相关分析,结果表明二者呈中度正相关(r=0.373,p<0.01),表明学生在学习中形成的行为序列数越多,学习成绩就越好。那么是否所有行为序列与学习成绩都相关呢?研究进一步将122个行为序列与学习成绩进行Pearson相关分析,结果显示有36个行为序列与成绩显著相关,如表2所示。

四个行为序列与成绩呈现中度相关(r=0 35~0.449),这些序列都与测试活动有关,分别是学生提交试题后查看试题答案(Q4Q5)、保存本次答题后提交试题(Q3Q4)、做题后保存本次答题(Q2Q3)、查看试题答案后再浏览试题(Q5Q1)。Q4Q5与成绩具有最高相关,该序列体现了知识强化与信息再加工的过程。排名第二的Q3Q4既可能是学生完成模拟测试并提交,也可能是完成计分测试任务并提交,前者体现了学生在自我评价中的坚持性,后者则是绩效投入的表现。排名第三的Q2Q3体现了学生对当次做题尝试的重视,隐含了他们下次继续作答的意愿,进而反应出学生对测试行为的管理和计划。Q5Q1反应出学生查看试题答案后对其他试题的好奇或是重做试题的兴趣。这两个意愿都体现了学生对更多训练以获得好成绩的渴望,是绩效投入的表现。分析课程四个在线测试任务的参与度发现,不计分的模拟测试只有5000多条log记录,显著少于另外三个log记录数在3万~6万条的计分测试任务。可见,大部分测试相关序列可能主要发生在计分任务中,这或许也是相关序列与成绩更相关的原因之一。

八个行为序列与成绩呈现低度相关(r=0.105-0.276),涉及测试行为、论坛行为与内容页面浏览行为间的转换。值得注意的是浏览试题后做题(Q1Q2)、浏览帖子后发帖(F3F1)两个序列与成绩具有相对较高的相关(r>0.2),这可能是因为两个序列分别体现了学生在测试和交互活动中认知的深入过程和实质性参与。

24个行为序列与成绩呈现弱相关(|r|=0.043~0.097),这些序列涉及页面、测试、作业、论坛模块间的多种行为转换。分析这些序列发现他们尽管能够体现学生在线参与具有一定的主动性和多样性,如存在跨模块的行为转换,可是,同时也体现了学习的浅层次、无序和随意特征,因此它们与成绩呈弱相关,甚至负相关。与成绩呈负相关的三个序列A3P1、P1A3、Q2R1可能就是因为这些序列不太符合认知规律,体现出在线活动的随意性。

(二)滞后序列分析

研究进一步采用滞后序列分析法考察在课程Moodle平台上出现概率达到显著性水平的行为序列,并基于此构建学生样本在线学习的行为转换模式。

研究首先基于对学生样本产生行为序列频次数的统计,形成15个学习行为间的转换频次表,如表3所示。表中行行为表示首先发生的行为,该行对应的列行为表示紧接着该行行为之后发生的行为,表格中的数据代表行行为转化为列行为所形成的行为序列出现的次数。如表3中第1行第9列中的数字174表示,浏览内容页面行为(P1)紧接着浏览作业行为(A1)发生的总频次为174次,即序列A1P1发生总频次为174。从表3可以快速发现出现较多的行为序列,如Q1Q2(10576次)、P1Q1(7879次)。

在行为转换频次表基础上计算每个序列发生频次的z分数从而获得残差表(如表4所示)。只有当z分数大于+1.96才意味着相应行为序列出现的频次达到了统计上的显著性水平(p<0.05)。根据表4,有六个行为序列出现概率达到了显著性水平,即P1Q1、Q192、Q2Q3、Q3Q4、Q4Q5和Q5Q1。其中,P1Q1、Q1Q2、Q4Q5、Q5Q1体现了学生经历在线学习过程中认知逐渐深入的过程,Q2Q3和Q3Q饭映了学生为了课程学习目标或优异成绩对测试行为的管理,是自我监控的表现。根据这六个行为序列,研究构建如图1所示的在线学习行为转换图,图中箭头上方的数值代表每个行为序列的z值,箭头代表行为转换的方向。

根据图1,案例课程2131名学生登录Moodle后主要的行为转换发生在浏览课程内容页面与测试活动之间。由图可知:若是学生登录平台后首先浏览课程内容页面,那他们之后较少去论坛交流,而更倾向于去测试模块尝试测试任务或模拟试题;学生在测试模块的活动通常遵循着循序渐进的评价步骤,如浏览题目后做题(Q1Q2),做题后保存本次尝试并查看答题进度(Q2Q3),在最后一次答题后提交试题(Q3Q4),提交后回顾试题并查看答案(Q4Q5),查看答案后还会倾向于浏览其他试题或已做试题(Q5Q1)。课程允许学生分多次完成试题,Q2Q3、Q3Q4较高的出现概率表明学生倾向于分多次完成一个测试任务,每次答题后保存答题进度,但不提交试题,在最后一次答题后,学生查看答题进度发现已经完成所有题目或达到预期,便提交试题。Q4Q5序列出现在图1中表明学生在测试活动中往往會对自己的学习进行相对完整的评价,他们倾向于了解正确答案,并在对照答案的过程中对已学知识进行强化和精加工。Q5Q1序列的出现反映出学生在测试活动中为获得更好表现和达到课程目标投入更多努力的意愿。

然而,该行为转换图也反应出学生在线学习的一些局限。如,缺乏Q2Q4表明学生较少将测试任务作为正式的测试活动一次性完成,而是倾向多次答题,在每次测试中发现学习局限,再去补充学习。这某种程度上反映出学生不愿选择具有较高认知挑战的任务,也反映出他们在测试中的坚持性和专注度可能不高。Q3P1的缺乏表明,学生并没有将在线课程内容页面作为试题解惑和补充学习的主要资源,Q5P1的缺乏同样表明了这一点。学生可能更倾向于选择阅读纸质教材或通过线下辅导补充学习和答疑解惑。此外,整个转换图中,缺乏与在线交互行为相关的转换,表明与教师和同伴的论坛交互没有成为学生进行内容内化、加工的重要方式,也没有促使学生产生新的学习问题与需求。

(三)基于行为序列的聚类分析

研究采用两步聚类法将122个行为序列作为分类变量对2131名学生样本进行聚类,获得稳定聚类结果为五类。五类学生中,第四类的学生占比最大,达到35.6%,其次是第三类(21.2%)和第二类(19.9%),最后是第五类(12.7%)和第一类(10.6%)。分析五类学生的行为转换情况发现,第一类学生人均产生的行为序列总数非常低(3.99次/人),所有行为序列人均产生频次都低于1次。第二类学生比第一类学生人均产生的行为序列总数明显增多,达到13.83次/人,与成绩中度相关的四个行为序列人均产生频次数都达到了1次,但是,行为序列频次还是相对后三类显著偏低。后三类学生的人均行为序列数显著提升,均在20次以上,其中第五类最高,达到33.79次从。由于篇幅限制,本文仅将五类学生行为序列与成绩相关系数大于0.1的12个关键行为序列的人均产生频次统计结果呈现在表5中。

分析五类学生在36个与成绩相关的行为序列的人均转换频次分布情况(如图2所示),发现二、三、四类学生行为序列分布整体相似,行为转换的峰点主要出现在P1Q1、Q1Q2、Q2Q3、Q3Q4、Q4Q5和Q5Q1六个序列上,在作业和论坛模块的行为转换发生很少,甚至为零。第五类学生与这三类学生相比,除了上述几个行为序列之外,A1A2、A4A1和F3F1等序列也达到接近1或大于1次。第一类学生整体行为转换频次很少,因此,峰点较少,主要分布在P1Q1和Q1Q2上,且已有峰值都在1次以下。

研究进一步采用滞后序列分析法检验五类学生发生概率达到显著性水平的行为序列,以考察五类学生的行为转换特征。研究最终获得前四类学生的行为转换图,如图3所示。第五类学生没有产生显著的行为转换,因此未能形成行为转换图。通过分析五类学生在线学习产生的行为序列和行为转换模式,研究将五类学生的在线学习参与特征分别定义为低投入式、浅层次投入式、绩效投入式、循序渐进式和随机参与式。

第一类学生在线学习的行为转换非常少。他们通常登录Moodle后的主要行为轨迹是浏览内容页面后去浏览试题(P1Q1),然后尝试做几道题目(Q1Q2)便离开。这类学生对于是否获得好成绩并不重视,他们不保存答题历史、不提交试题,对答案也没有兴趣。这类学生整体在线参与度也非常低,每个行为人均产生频次不到1次(0.79次/人)。由此可知,在线课程并不是这类学生远程学习的主要活动,他们缺乏在线学习的动力与兴趣,整体投入较低,故此研究将这种在线参与模式定义为低投入式。成绩分析表明,这类学生80%平时成绩不合格,低分学生占比在五类学生中最高。因此,这类学生是在线辅导和支持需要重点关注的对象,他们往往面临较大的学业失败或辍学风险。

第二类学生与第一类相比行为转换模式中增加了Q2Q3,意味着他们可能有以后继续答题的计划。可知,这类学生最初的测试尝试并不是一种随意行为。然而遗憾的是,他们大多数情况下并没有上线完成试题并提交。由此可见,他们缺乏较强的绩效动机,对在线学习的自我监控投入不足。该类学生在线学习中的行为转换频次尽管高于第一类,却仍显著少于后三类,表明这类学生登录平台后通常学习行为单一,每次的在线学习缺乏多样性和深入性。综上,研究将这种在线学习参与模式定义为浅层次投入式。成绩分析表明这类学生的成绩均值和及格率都低于后三类学生。

第三类学生在课程平台上的人均行为转换频次较前两类显著增加,且主要聚焦在测试模块,行为转换模式增加了Q3Q4、Q4Q5和Q5Q1序列,体现出这类学生参与测试活动较为完整,将测试作为知识强化或精加工的方式。行为统计结果显示,这类学生对浏览页面、论坛活动兴趣不大,而专注在测试活动中。考虑到案例课程中大部分测试都是课程的计分任务,这类学生在测试活动中的较高参与和认知投入反映了他们对于课程成绩的高度重视。综上,研究将这种在线参与模式定义为绩效投入式。成绩分析显示,这类学生的成绩平均分最高,且成绩差异较小,可见这种在线参与模式对学生成绩确实产生了显著的积极影响。

第四类学生在线学习时产生的人均行为转换频次比第三类略低,可是行为转换模式增加了P1Q1序列,表明這类学生在测试活动前倾向于先浏览课程内容页面。这种先学习内容再评测的学习路径更符合认知规律和课程预期。因此,这类学生不仅在乎测试表现,而且相比其他五类学生能够更合理的利用在线课程资源来促进学习。综上,这类学生重视课程的在线活动,具有适当的绩效动机,他们按照课程要求较合理的利用在线资源,按部就班的学习,在线学习更符合循序渐进的认知规律与需求,研究将这种参与模式定义为循序渐进式参与。这类学生占比最大,他们的行为转换模式是该课程学生在线学习的代表性参与模式。成绩分析显示,这类学生成绩均值仅略低于第三类,排名第二,分数差异性不大,且高分学生在五类中比例最高。

第五类学生人均产生的行为转换总数最多,行为统计显示其参与度也整体较高,但是尚未发现出现概率达到显著性水平的序列。可知,他们的在线学习缺乏相对稳定的行为模式,在线学习的随机性较大。因此,研究将其参与模式定义为随机参与式。成绩分析显示,这类学生成绩均值位居第三,成绩的差异性较大。

四、讨论与总结

(一)行为序列为分析在线学习提供重要视角

以往对在线学习的研究较多关注学生参与度。参与度主要反映学生在学习中投人的精力和时间,可以被观测,然而,学生行为上的参与量并不代表他们认知投入的水平,因此在线参与度指标对成绩的预测力较为有限,许多指标无法预测成绩,甚至与成绩不相关。与参与度相比,行为序列能更细致的反映学生在学习投入中的行为轨迹、意愿与认知过程,表征信息加工、策略应用、努力管理等认知投人,体现投入质量。因此,行为序列指标对成绩的影响会更显著。本研究中,学生行为序列总数与成绩的相关度(r=0.373)显著高于样本在线总时长与成绩的相关(r=0.192,p<0.01),浅层次投入式学生和随机参与式学生尽管都具有较高的参与度,但是由于缺乏稳定深入的在线学习参与模式,所以成绩整体低于循序渐进式参与的学生,以上发现在某种程度上佐证了行为序列的重要性。

此外,行为序列与转换模式分析为教师呈现了更全面的在线学习景图,帮助教师发现在线学习路径、行为模式和认知过程,为有效监控和促进在线学习过程和认知发展提供了重要依据。本研究对在线行为转换模式的分析以及在线参与特征的聚类都建立在行为序列分析基础上,相关分析结果为教师掌握和分析学生样本的在线参与模式、特征与局限,进而实施有针对性的在线辅导与干预提供了重要依据。

(二)有效的行为序列与模式

发现和定义对学术成就具有促进意义的行为序列与模式是基于序列分析促进学习的前提。在相关分析中,本研究发现与学习成绩具有更高相关的行为序列包括体现绩效投入、认知深化和对学习自我监控等三类序列。绩效投入是学生投入到与课程成绩直接相关的考试与任务活动中,如做作业、模考和参加考试等,因此对成绩的影响显著。后两类序列均体现了学生的认知投入,大量文献指出,认知投入是学生学习中的心理投入,反应了学生应用的认知策略、对努力的管理和元认知水平,对学术成就具有更强的预测力。

有效的在线学习参与模式应该能够体现学生在线学习过程中认知活动的多样性、认知的深入过程以及以目标为导向对学习行为的管理与调控。本研究聚类分析显示:绩效投人式的学生的成绩均值最高,这与学生为获取好成绩在测试活动中的努力管理投入密切相关,但是这类学生高分学生比重较低,与该模式在促进认知发展全面性与深人性存在局限有关;浅层次投入式的在线学习行为单一、缺乏多样性与延展性,随机参与式学生的在线活动随意性较大,缺乏符合认知规律的稳定模式,因此两类学生的成绩均值都不高;循序渐进式的参与更遵循学生在线学习的认知需求与规律,因此该类学生拥有较高的平均成绩,且高分学生占比最高。

行为序列与模式受在线学习环境和教学因素的影响,本研究只是对一门案例课程的研究,未来需要更多研究探索不同在线学习环境和教学情境下学生的有效行为序列与转换模式,以及预警序列和模式。

(三)对在线课程建设的启示

本研究基于行为序列分析所发现的在线学习参与特征和模式为建设基于LMS的在线课程提供了有益启示。

围绕知识点的资源设计与开发一直是在线课程建设的重要任务。可是,本研究发现学生对以知识点讲解为主的在线资源的兴趣和访问可能会远低于预期。案例课程中学生基于LMS的学习行为序列中较少出现内容页面浏览行为,仅有一个序列(P1Q1)达到显著性水平,Q1P1、Q3P1和Q5P1等序列都未能达到显著性水平,P1R1或R1P1序列数也整体较低。进一步统计显示,页面浏览行为(P1)发生频次总数也并不突出,远远低于测试题尝试的行为(Q2)的频次。上述结果意味着学生样本并没有将知识点讲解类的在线资源作为认知解惑和深化的首选资源,他们对这类资源访问量有限,也较少打开内容页面中辅助认知的相关文档资源。笔者认为,这可能与现有在线资源与纸质教材和学习资料并没有本质差异有关。大多数资源尚未发挥在线资源在知识呈现、组织和促进教学交互方面的独特优势,学生通过线下纸质材料自学或面授辅导同样可以完成课程要求的知识点学习。因此,在线资源对其吸引力并不大。由此可见,进一步挖掘和增强在线资源的独特优势,如提升资源的个性化推送、与学生的互动能力、资源的演化能力等,实现线上和线下资源的优势互补,是未来在线课程资源建设的重要方向。

本案例中,显著的行为转换主要发生在测试活动中。这与课程将在线测试作為课程评价的一部分密切相关,反映出学生在线学习投人具有较强的绩效导向特征。然而,该特征可能会影响学生学习的多样性和深入性。由此,在线课程一方面需要考虑如何激发学习的内在动机,让学生对课程内容本身产生兴趣,从而激励其更全面的参与到各类学习活动,另一方面需要将与学习重难点所需的各类学习活动有效纳入课程学习评价框架中,确保学生在课程重难点学习中,拥有更完整的学习体验。

此外,案例课程中也没有出现与论坛互动相关的显著行为转换,表明课程缺乏基于论坛的社会性知识建构和社会交往。这在某种程度上影响了学生在线学习的认知多样性与深入性。这既可能与案例课程作为基础理论课没有强调互动讨论有关,也可能与课程还存在QQ等其他互动途径有关。实际上,缺乏论坛互动是很多在线课程低参与度的突出表现,究其根源,除了因为在线课程整体对教学互动的重视和设计不足之外,更重要的是当前学历教育在线学生的学习动机仍然以获得学历和学位的外在动机为主。因此,笔者认为面对外在动机较强的学生群体,在线课程不能依赖学生自发互动,而应根据课程学习需求,设计清晰、合理的学习路径,将社会性交互与知识建构有效纳入到在线学习路径中,使其成为学生在线认知发展的重要环节。

综上,有效的在线学习参与模式是确保在线学习真正发生与深层次学习的前提条件。行为序列分析表明,学生的在线学习需要引导。故此,在线课程建设的重点不应是单纯的资源建设,而应重视在线学习路径的设计与优化,通过学习路径设计引导资源和学习活动的设计开发,借助更明确、可视化的学习路径为学生提供在线学习脚手架,促进有效在线参与模式的形成,实现在线学习与认知发展。

猜你喜欢
在线学习聚类分析
开放大学:过去充满传奇但前景依然未卜?
基于学习行为数据的在线学习时间规律探析
信息化环境下高职英语教学现状及应用策略研究
农村居民家庭人均生活消费支出分析
基于混合式学习理念的大学生自主学习能力的培养研究
基于SOA的在线学习资源集成模式的研究
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究