程光胜
(宁夏财经职业技术学院 信息与智能工程系,银川 750021)
随着信息技术的快速发展,学习方式、形态及环境已经发生了翻天覆地的变化。新一代信息技术逐渐融入教育教学活动,在线学习催生出虚拟学习、移动学习、泛在学习、数字化学习、智能学习、智慧学习等概念。与传统学习相比,在线学习表现出技术支持、交互与协作、时空分离、自主与适应等特征[1]。受到新型冠状病毒肺炎疫情的影响,在线学习不再是以往传统学习的补充,而成为学习常态,在线学习优势日益凸显,掀起了教育信息化新的浪潮,推动教育教学深度改革。
通过对在线学习行为及学习效果的研究,从理论层面,有助于从数据科学角度探索信息化教育教学模式,丰富学习分析领域的理论内涵,并进一步挖掘在线学习环境下促进学习的作用机制和内在逻辑;在实践层面,可以发现行为数据背后的规律,对于优化在线学习平台、调整教学决策和精准干预,具有重要的指导作用。
在线学习行为是在学习动机的驱使下,学习者通过在线学习平台或环境提供的各项学习活动,实现整个学习的过程集合。从外在表现来看,就是学习者和学习环境之间的一系列操作和交互,这些操作和交互最终被系统记录下来形成学习行为数据。以超星学习通为例,系统会记录任务点完成情况、音视频观看详情、参与主题讨论、投票、抢答、问卷活动等学习行为数据,这些数据为分析学习行为模式提供数据基础。
在线学习行为方面,国内外相关学者也做了大量的研究。欧阳嘉煜等提出通过特征工程方法来识别学习分析中的行为模式,并将其运用到“投机取巧(Gaming the System)、挫折与困惑(Frustration and Confusion)、注意力集中与粗心(Engaged Concentration and Careless)、心不在焉与不假思索(Off-Task and Without Thinking Fastidiously)”等经典的行为模式中[2]。马志强等通过描述性、诊断性、预测性三个维度,从整体上探究个体与群体、群体之间的行为差异,并采用滞后序列分析等方法进行了实证分析[3]。程光胜基于Hadoop框架和R语言实现了学生行为特征的分析,从学生管理角度为学校的高层决策提供智力支持[4]。
学习效果方面,江波等研究发现,学习过程中的行为序列数据更能反映学习者学习行为轨迹,同时可以较准确地预测出学习者的学习成就,为教师的精准干预、教育教学绩效提供有价值的建议[5]。赵呈领等从网络学习资源视角,将具有相似访问网络学习资源行为的学习者进行了聚类,针对不同的类型与学习资源之间开展Kruskal-Wallis检验和Mann-Whitney U检验,并从提升学习成效方面提出了学习资源建设的措施和建议[6]。沈欣忆等基于MOOC平台上产生的学习行为数据,运用Python技术以及Stata采用抽样逐步回归方法,建立学生在线学习行为与在线学习绩效评估模型,并提出促进MOOC学习绩效提升的教学策略建议[7]。马忠玲利用SPSS对学生的在线学习情况进行统计和分析,并从性别、学习行为特征、学习成绩等方面探索了在线学习行为与学习效果之间的内在联系,并给出了提升成人学习者教学质量的意见和建议[8]。
上述文献为本文研究提供了思路,但大部分是基于本科层次的学生,在分析中关注特殊群体学生,忽视对在线学生学习的整体性分析,缺乏对学习行为数据的具体解释。在基于超星学习通的混合式教学环境下,一方面为学生提供规模化的在线学习环境,另一方面也辅助教师开展正常的线上线下实际教学。因此,本文基于超星学习,立足高职学生学习实际,分析在线学习的各项学习行为与学习效果之间的关系,从而发现行为背后的潜在规律,并从优化资源、学习空间组织视角给出相关的建议和措施。
通过对高职学生在线学习数据的有效分析,发现学生的在线学习行为模式,进而建立学生学习行为对学习效果的影响模型,从而为教师优化教学策略、有效开展在线教学、精准指导学生学习提供有效信息和建议。
学生参与在线学习所体现出的固有行为模式,是行为、习惯、兴趣、认知、情感等融合在一起的多元结构,而且认知和情感因素对学习效果也有很重要的影响,但是鉴于数据采集、处理和分析的复杂性,以及容易受到人为干预等原因。因此,认知和情感因素在本研究过程中不作为影响因素。
本文的研究对象是高职学生。与普通本科学生相比,大部分高职学生存在学习目标不明确、学习自主性不强、缺乏学习动力、学习能力和学习效率相对较弱、对问题的理解和钻研不够深入,且创造性思维、能力和水平不够突出等问题。同时,近年来高职院校的学生来源拓宽,从而使得高职学生的学习基础、学习风格、学习习惯以及学习能力等方面存在很大差异。因此,无论是在传统课堂教学中,还是网络化线上学习环境中,表现出的在线学习行为也多种多样。
本文分析数据来源于超星学习通平台上Java Script程序设计课程的在线学习数据。该门课程的学习通过任务点来完成指定的学习任务,任务点设置为观看课程视频、书面作业、阅读文档片段等。任务点的核心是课程的音视频数据,学生在观看的过程中,系统会记录观看时长,以及反刍比(视频观看时长/视频实际时长*100%);在学习过程中可以参与具体的讨论,系统会记录总讨论数、发表讨论以及回复讨论、获赞数等;章节学习次数反映学生学习该门课程的频繁度,以及具体的学习时段;成绩数据有章节测验和期末考试成绩;最后的总成绩由上述学习数据和成绩数据按照不同的比例加权计算得出。
因此,结合研究的实际目标,采集的数据有:登录次数(x1)、任务点完成次数(x2)、视频观看总时长(x3)、重复观看视频次数(x4)、发表讨论数(x5)、回复讨论数(x6)、学习次数(x7)、作业完成次数(x8)、平时测试成绩(x9)、期末考试成绩(y)。
本研究使用Excel和SPSS软件对所得数据进行加工。利用Excel对从超星学习通获取学生学习数据进行初步汇总与分析,然后统一导入到SPSS中,对其进建模并深入分析。因此,在研究方法上,采用数量分析法和实证建模法,以具体的学生学习行为数据探索学习者之间相似的行为特征,并构建在线学习行为和学习效果之间的量化方程,前者采用聚类分析方法,后者采用回归分析方法。
职业教育人才培养的目标是为社会和国家培养更多高素质技术技能人才、能工巧匠、大国工匠。因此,学生的学习效果具体体现为:技术技能的提升、职业素养的养成、学习态度的转变、学习兴趣的培养、学习能力的增强、工匠精神的塑造等多个方面。可以看出,学习效果具有综合性、抽象性和多样性,这也决定了学习效果量化的复杂性。所以,在本文的实证分析中,为了降低这种复杂性,简化数据处理,基于传统和一般认识,以学习成绩反映学习效果,从而构建在线学习行为与学习效果之间的关系。但是,学习成绩仅仅是学习效果的一部分,二者之间不存在等价关系,也不存在严格的因果关系,这里特此说明。
学生学习数据包含了很多关键信息,在综合比较相关文献的基础上,本文采用聚类方法研究在线学习行为模式。由于没有特定类别的数据标签,不适合使用分类,因此通过聚类将相似的学习者聚为一起。常见的聚类方法有层次聚类和K均值聚类,二者各有优缺点和不同的应用场景。本文首先对数据采用层次聚类确定聚类的数目,然后以此为基础进行K均值聚类,进而发现不同类别下的共性行为。
通过层次聚类可以得到Agglomeration Schedule,然后通过Excel利用样本个数减去Stage列创建新的一列,命名为“类别数”,然后通过升序排列该列数据,再以“类别数”为横轴,表中的“Coefficients”列为纵轴,绘制折线图,具体结果如图1所示。
图1 在线学习行为层次聚类结果
图1可以看出,整条折线明显下降且逐渐趋于水平,当类别数取3或4时,与之前的近乎垂直下降相比,明显趋缓。因此,3或4可作为K均值聚类中类别数的输入,本文设定为4。
在具体执行K均值聚类前,首先对各指标数据进行标准化变换,即:各指标数据减去均值然后除以样本标准差,标准化变换后各指标数据的平均值为0,标准差为1。这样一方面消除了各指标数据量纲不同带来的影响,另一方面可以缩小聚类分析中的偏差。利用SPSS对学生行为K均值聚类后,生成的方差分析和聚类结果分别如表1和表2所示。
表1 方差分析ANOVA(方差分析)
表2 学生在线学习行为聚类结果Final Cluster Centers(最终聚类中心)
从方差分析(ANOVA)呈现的结果来看,这9个变量的F检验都非常显著,说明这些变量在聚类分析中都起到了作用。结合在线学习行为数据和具体的聚类结果,可以将在线学习行为分为如下四种模式:(1)“学习慵懒型”:在各项学习行为上表现都不积极,不重视学习,主动学习能力很差;(2)“积极应付型”:登录次数比较活跃,发表和回复讨论积极,但是观看视频、作业完成等其他学习行为都很低;(3)“认真拘谨型”:各项学习行为突出,但是发表讨论和回复讨论较低,即在认真学习过程中,缺乏学习的互动性,可能跟不擅长社交等有关;(4)“认真活跃型”:各项学习行为均表现得非常显著。
上面对学习者的行为进行了聚类分析,通过聚类分析对相似行为的学生进行了类型划分,从而为教师开展针对性教学提供依据。从学习效果方面来看,学生的在线学习行为体现了学生学习的多方面信息,比如学习认知、学习习惯、学习风格、学习态度等,不同的学习行为可能会产生不同的学习效果。因此,这里对其进行具体研究,采用定量方法揭示学习行为与学习效果之间的关系。张红艳等认为,学习行为是预测学生学习效果的重要变量[9],这说明各种学习行为变量和学习效果变量之间是有关系的。探讨变量之间的数量关系,从已有研究文献来看,主要有决策树、神经网络(深度学习)、随机森林等方法。决策树方法基于规则产生结果输出,因此可解释性很强,但是对于连续性数据变量而言,其效果并不理想。神经网络方法在预测学习效果上,虽然可以有较高的准确率,但是指标的解释性很差[10],并且容易出现过拟合。随机森林方法可得到较高的准确率,但是对数据量的要求较高,当样本量较小时,准确率的波动很大、稳定性减弱[11]。由于回归模型的简单性和很强的解释性,因此,这里采用线性回归模型来构建学习行为变量和学习效果变量之间的回归模型。
回归模型描述了因变量的平均状态随自变量变化的情况,通过最小二乘法,按照偏差平方和达到最小的原则,使得观测值和理论值之间的偏差平方和最小。
在SPSS中,以y为因变量,x1,……,x9为自变量,建立线性回归模型,由于不同变量对被解释变量的影响不同,或者甚至没有影响。因此,在回归方法中,选择逐步(Stepwise)回归,回归结果如表3和表4所示。
从表3和表4可以看出,模型的整体拟合效果较好,修正可决系数达到0.82。ANOVA方差分析表显示,F检验显著性Sig≈0.000,说明学习成绩y对作业完成次数x8、任务点完成次数x2、平时测试成绩x9、学习次数x7的线性回归高度显著。从Coefficients系数表中得到回归方程为:y=65.208+1.308*x8+0.822*x2-1.088*x9+0.077*x7,各项系数的t检验显著性Sig≈0.000同样高度显著,从该方程可以看出,x2对期末考试成绩的影响最大。但是,在回归方程中,x9前的系数为-1.088,这与常规不相符合,可能与多重共线性有关,通过Collinearity Diggnostics输出发现,Eigenvalue值为0.002,而Condition Index达到47.894,说明x9变量的引入存在多重共线性。删除x9后,重新建立回归模型,发现修正可决系数为0.675,较之前的0.82降低很多,这说明x9引入到模型中是有必要的,因此加入x9后出现多重共线的原因可能跟数据的样本容量有限有关,如果样本数据增大,关于x9多重共线性会减弱很多,x9前的系数会得到有效修正。
表3 模型概要Model Summarye
表4 各系数t统计检验Coefficientsa
从上面的定量分析和实证研究来看,在线学习环境下的学习行为存在特定的行为模式,这些行为模式可从学习认知、学习习惯以及学习主体本身的特征等方面进行解释,不同的行为模式可为教师的分类教学和指导提供有力的支持,比如对“学习懒惰型”,需要加强平时的思想教育,转变学习观念和端正学习态度,建立对知识掌握和技能习得的正确认知;对“积极应付型”,需激发其学习兴趣,帮助树立学习目标,通过阶段性目标达成,使学生客观认识自我,建立信心;“认真拘谨型”,要重视学生的沟通交流能力,因为在社会环境中,沟通本身已经成为一种生产力,表述更专业就是思想的流动模式与生产力的增长和创造性输出有着直接的关系[13];对“认真活跃型”,通过参加各项技能大赛、“互联网+”大学生创新创业大赛等,进行系统化和综合化培养,培养创造性思维和能力。
从学习行为和学习效果的回归结果来看,在线学习过程中的作业完成次数、任务点完成次数、平时测试成绩以及学习次数对学习成绩存在正向影响。在其他因素保持不变的前提下,作业完成次数、任务点完成次数、平时测试成绩以及学习次数这些行为中的一个或多个增减会使得学习成绩也发生相应的增减。事实上,这些行为也反映出学生在学习过程中的时间、精力的投入,对学习内容的感兴趣程度,以及对其钻研的情况,也进一步印证了“一份付出、一份收获”的道理。因此,作为教学一线教师,在布置作业时,要结合高职学生的学情和学习特点,一方面通过作业激发学生学习动力,增强学习的自主性,另一方面要有培养高职学生探究问题能力的意识。在设置任务点时,适时提供学生表达的机会和互动的空间,让学生能够将学习过程中的所思所想以及疑问表达出来,一方面能够显示记录学生的学习过程,让学生获得学习的成就感,另一方面通过记录和表达能够引发学生积极主动地思考。平时测试是对学生阶段性学习的一个检测,对最终的学习成绩也有很大影响,因此也十分有必要,能够起到查缺补漏、阶段性预警的作用。学习次数在一定程度上反映了学生的勤奋程度或者对课程的兴趣度,老师可以适度关注学习次数高的这部分学生。
定量化的分析结果也为重新组织教学空间提供了有效依据。因此,可从在线学习行为等方面入手,优化在线学习环境中的学习资源配置,激发学生学习兴趣,从而提高学习效果。
从设置的任务点类型来看,学生更加偏好视频学习资源,这就要求对在线课程的资源开发上,要提供高质量的视频资源。从学生学习视频资源的统计数据来看,短视频的资源更受学生欢迎和喜爱,这是因为人在接受知识时,高度的注意力是有一定时间限制的,而且相关研究也表明,分散学习或碎片化学习能够加强学习者对知识的记忆和理解[12]。因此,对于知识点和技能点很多的教学内容,在开发视频资源时,做到适度拆分,形成逻辑上连续的多个短视频集合,也可以将一个复杂的知识点或技能点分解到多个视频资源中,这样可促进知识的有效迁移。同时,要创新资源形式,丰富学习资源,根据内容变化保持适度更新,提高资源的新颖度,激发学生的学习兴趣,从而提高在线学习效果。
从建模结果来看,学生作业也是影响学习效果的一个关键变量,因此,设计高质量的作业也是提升学习效果的一个重要途径。作业的高质量设计表现在:(1)控制难度,要让学生通过作业提高学习的成就感和自信心;(2)体现重点和难点,通过重点和难点巩固每次学习的内容;(3)减少题量,如果长时间的在线学习和在线作业,就会引起学生在线学习的厌恶感,这样不但没有起到提高学习效果的目的,反而会降低学习效果;(4)有一定的激励措施,对符合要求的作业要有奖励(比如加分),优秀的作业放到展览区示范,增强学生的自我效能感,从而促进深层次的学习。
教师要积极关注学生的学习数据,通过学习数据识别“困难”学生、“中间”学生和“优秀”学生,针对不同层面的学生进行线下个性化的辅导和教学,让学习有困难的学生能够及时跟进,让中间群体的学生能够尽最大努力向优秀靠近,让优秀的学生更加优秀。分层次开展个性化教学,能够让不同层面的学生体验学习提升所带来的成就和快乐,从而会促进学习态度的转变,提升主动学习意愿,达到“教育终极关怀”的教育目标。
不同的在线学习平台会提供不同的工具和方法,比如学习打卡、主题讨论、问卷调查等,这些工具的使用可能会激发学生上课的兴趣,但是跟学习效果关联性较弱,而且过度使用可能会适得其反,进一步降低学习兴趣。归根到底,这些工具是一种浅层的师生、生生互动的弱交互工具,无法实现深度沟通、情意表达和思维方式的培养。因此,老师在教学过程中,要灵活把握这个“度”,让工具和方法为教学目标服务。
在线学习是当前信息化教学环境下学生学习的主流方式,在线学习行为分析是学习分析的一个重要内容,通过对数据的分析和挖掘,理解、优化学习过程,提高教与学的质量和效果。本文结合高职院校学生在线学习的实际,选择超星学习通平台上JavaScript程序设计课程的学习数据,对高职学生的在线学习行为和学习效果进行了分析与建模,从而发现不同学生相似的在线学习行为,以及影响学习效果的主要因素,并根据这些分析结果提出了相关的建议和措施。但是,由于课程采集的数据有限,分析结果是建立在小样本基础上,所以与大样本下的在线学习行为还有一定的差距。因此,在后续的研究中,根据职业院校学生的成长实际,界定学习效果,并随着在线学习行为数据规模化,计划从学习动机、学习偏好、学习认知、学习情感、学习环境等方面开展详细的研究,为实施个性化、适性化的精准教育提供进一步的探索。