梅鹏江,陈逸菲,宋 莹,孙 宁
(1.南京信息工程大学自动化学院,江苏南京 210044;2.南京信息工程大学滨江学院,江苏无锡 214105)
受疫情影响,为响应教育部“停课不停学”号召,各院校积极开展线上教学。随着在线教学的普及,各高校平台服务器积累了大量与学习相关的数据,通过对这些数据的分析,帮助教师了解学生的学习情况。张岩等[1]通过分析混合式教学环境下学习者一般特征、心理特征、课堂行为特征,对不同学生进行分类和识别;贾积有等[1]对北京大学6 门课程的学习行为数据进行整理与分析,从中发现学生网上学习行为对学业成绩的影响;李封等[3]提出学习者学习行为属性模型,基于该模型对学习者学习行为进行分析研究,以此为依据调整课程组织和教学方式,从而达到最优的教学效果;李爽等[4]从行为投入的角度出发,对在线学习行为投入分析框架进行构建,并对在线学习行为投入测量指标进行选取;危妙等[5]利用数据分析,对“优课联盟”平台上学生的学习行为以及学习成效进行分析,找出平台应用中存在的不足并提出建议;蒋卓轩等[6]针对平台用户在线学习特点,分析挖掘6 门课的海量学习行为数据,将学习者进行分类,深入考察学习行为与学习效果之间的关系。以上学者对于学生学习特征进行了分析,但是他们都忽视了数据的时效性。本文数据是教师在线授课采集,准确度较高,能真实反映学生在线学习情况;课下学习数据中,剔除期末考试前学生突击数据,这样更能客观反映学生平时的学习习惯。
本文以笔者学校开设的微机原理及单片机技术课程作为研究对象。该课程自2020 年2 月17 日至2020 年5月6 日采用线上教学,之后采用混合式教学,收集80 名学生在学习通平台上各种访问记录近4.8 万条。以这些数据为基础,分析学生学习过程中的行为特征、学习状态和习惯。本研究结果可用于纠正不佳的学习习惯,帮助教师调整教学进度和方式方法。
衡量学生学习质量以教学大纲为标准,课程以教学大纲中学业表现指标和学习过程投入指标作为参考,前者包括随堂测验得分、阶段测验得分、章节测验得分;后者包括课堂抢答、课堂问卷、课堂投票、视频反刍比、章节学习次数等。期末考试成绩最能直接反映学生学习质量,故本文用线下的闭卷期末考试作为学习质量指标,通过求解皮尔斯相关系数挖掘出与学习质量有关的特征,如式(1)所示。
式(1)中,X、Y是两个特征,Xi、Yi表示特征X、Y的第i个数值代表X、Y特征下的均值。皮尔森系数等于协方差除以标准差,因此避免了指标量纲不同的影响。在计算各指标的相关系数之前,需要对学习通平台上获取的数据进行预处理,即相关数据类型转换、归一化,使各个指标处于同一数量级。
本文将学习通平台上的数据分成学业表现指标和学习过程指标投入两大类[7]。前者直观反映学习效果,后者体现学习积极性和学习态度,根据学习环节不同又细分为2 个子类:在线学习过程指标和自主学习过程指标。表1给出根据式(1)计算得到的各指标与期末成绩的相关性。
本文将学习过程指标细分为自主学习过程和课堂在线学习过程两部分,前者有视频反刍比、章节学习次数;后者有课堂抢答、课堂问卷和投票。如表1 所示,课堂在线学习过程中课堂抢答与期末考试的相关性是51.03%,课堂问卷、投票与期末考试的相关性是51.50%。自主学习过程中学习视频反刍比与期末考试的相关性是60.04%,说明该特征对期末考试的影响较大,而章节学习次数对期末考试的影响更大,高达72.17%。
Table 1 Correlation between each index and final score表1 各指标与期末成绩相关性(%)
本文主要分析期末成绩表示的课程学习质量与这两大指标的相关性。需要注意的是,由于签到率相关性仅41.4%,明显低于其它指标,因此不予讨论。
微机原理及单片机技术课程共17 周,学习通平台记录有学生随堂测验、章节测验得分、阶段性考试得分等,可直观反映学习效果。而期末考试因为在线下进行闭卷测试,测试题型丰富,主观性试题多,更能全面考察学生的学习质量[8]。通过Anaconda 软件将学业表现3 个特征与期末考试成绩以可视化形式展现,如图1 所示,横坐标是学生学号,纵坐标是归一化后的期末成绩。
特征之间相关系数越大,说明两个特征之间关联越大,反之越小。表1 中,学业表现相关的前3 个特征与期末考试成绩的关联性分别是55.67%、49.02%、49.98%,除了随堂测验之外都低于第2 大类指标,其原因如下:
(1)随堂测验以客观题为主,时效性强。从数据来看大部分学生随堂测验分数都在及格线以上,高于期末卷面及格率。原因是随堂练习大多以选择题形式考察,而期末考试则以主观性试题为主,难度更高。随堂测验与期末成绩相关性比章节测试和阶段考试高出近5%,达55.67%,原因是随堂测验一般是教师在上课前几分钟发布,并限定短时间内完成,学生能翻阅参考资料的时间有限,以独立完成为主。
(2)章节测验完成的时间段不同。从平台记录的时间看,有预习时完成的,出错可能性大;有课后完成的,降低了出错的可能性;部分学生不是独立完成的,所以会出现相关性不是很大的情况。
Fig.1 Academic performance图1 学业表现
(3)在线考试非封闭性。阶段测试是返校前在线完成的,虽然可以设置测试具体时间,但是不能完全确保学生独立完成考试,故相关性不如随堂测验。
通过以上分析,可知这些指标不能完整反映学生掌握知识点情况,但为教学过程中必要的参考,是不可或缺的。
学习视频反刍比明显没有章节学习次数贴合期末成绩,原因是部分学生存在登录视频不看只为完成任务的情况。而章节学习次数更贴合,是因为优秀的学生在遇到难点时会反复观看章节内容,学习不好的学生却不会花费大量时间去重复学习,具体情况如图2 所示。
课堂问卷、投票、课堂抢答等指标可以清楚地刻画学生在课堂上的表现。表1 中课堂抢答与期末考试的相关性只有51.03%,原因是部分成绩良好的学生性格较为内向,不太好意思参加课堂互动,觉得自己懂了就可以,没必要在课堂上表达。课堂问卷、投票与期末考试的相关性是51.50%,从图3 可知学生普遍在问卷和投票中得分较高,其原因是教师在课堂上考察学生对某一知识点的掌握,不论对错参与即可得分,所以提高了学生参与互动的积极性。
综上,通过对不同指标进行相关性分析,发现各指标对期末考试成绩有影响,其中以视频反刍比、章节学习次数体现最为突出。所以在平时教学过程中,教师可通过这两个指标及早发现学习态度不端正、成绩不好的学生,给予适当的提醒和监督。
本文通过对学业表现和学习投入指标进行聚类分析[9-11],得到学生不同的学习类型,从而发现优秀学生的共性,及时对学习习惯不好的学生提出预警。采用PyCharm软件对数据进行k 均值聚类。首先将数据降维,然后评估不同k 值聚类效果,发现在4 层聚类时效果最佳,故选取聚类数为4 时的情况进行分析,结果如表2 所示。
Table 2 Mean values of various student behavior data表2 各类学生行为数据均值
Fig.3 Online classroom learning process图3 在线课堂学习过程
在聚类数为4 时,得到每一类学生的期末考试等级、课程访问数、视频反刍比、讨论次数、课堂抢答、作业得分以及阶段测试得分的均值,如表2 所示。以期末考试成绩得分作为标准,将学生分为学霸学习者、积极学习者、一般学习者、懒散学习者,下面对这些类别的学校行为进行分析[12-15]。
第1 类学生,能够积极主动登录平台学习,其访问数、章节学习次数几乎是第4 类学生的4 倍,能够积极参与到课堂活动中,课堂抢答速度快,上课专注,紧跟老师节奏,考试成绩优秀,说明这类学生属于刻苦用功的学霸。教师可鼓励他们参加比赛,扩充知识面,同时适当组建班级帮扶组,让学霸给懒散学习者(第4 类学生)和一般学习者(第3 类学生)提供好的学习思路和学习方法。
第2 类学生,能够完成在线学习平台上所有任务点,章节测验和阶段性测试均能取得好成绩。但是该类学生的课堂抢答得分低于第3 类学生,是由于这类学生喜欢自己闷头学习,自己解决问题,课堂抢答比较低调,没有第3类学生爱表现。正是如此,教师最有可能忽略他们。教师应该多和这类学生交流,学生在得到老师的关注下学习会更主动,学习成绩会更上一层楼。
第3 类学生,能完成基本的章节学习和视频观看,在访问数、章节学习次数、视频反刍比上都是懒散学习者的1.4 倍左右,而课堂讨论、课堂抢答是懒散学习者的5 倍左右,甚至超出了第2 类学生。该类学生有一定的学习热情,课堂积极回答问题,但成绩不是很理想,原因是他们课后不主动学习、投入学习的时间精力不够。对于这类学生教师应该多督促他们课后学习,多加以鼓励和鞭策。
第4 类学生,访问学习平台比较随意,偶尔登录,登录次数不及平均数,对于章节的学习较少,视频反刍比也小,基本不参与课堂讨论,不积极主动地参与课堂互动,注意力不集中,容易走神,课后作业和阶段性测试分数较低。这些学生缺乏自主学习热情,学习效果也很差,故将他们划分为懒散学习者。教师需要经常与这类学生沟通,课堂上主动给他们提问,课后督促他们观看视频,完成章节学习。
本文对疫情期间线上教学中学生学业表现和学习投入指标进行分析,通过对学生学业表现分析,发现大部分学生在随堂测验、章节测验、阶段性考试的得分都能及格,但期末测试相当一部分学生卷面不及格,两级分化严重,这说明平时学业中的成绩并不能完全反映学生对知识点掌握的真实情况。而在学习投入指标中也有相似情况,课堂抢答、问卷和投票得分都不错,但是期末成绩不理想,这可能是学生在课堂上听讲,但课后预习复习被忽略;视频反刍比、章节学习次数指标与考试成绩最相关,验证了学习优秀的学生课后所花费的精力远高于其他学生。
需要指出的是,数据分析需要数据的积累,数据量的规模不同会对分析结果造成影响,本文使用的数据量不大。随着在线教学及混合式教学工作的深入,课程数据量会越来越大,学生的行为数据也会越来越多,随之得到的数据分析结果会越来越准确[16]。在今后的工作中会将学生提交作业的时间、访问时间段等进一步深入分析,以此获取更为准确的学生学习习惯数据,帮助教师洞悉学生学习行为,强化对学生的教育和监督。