甘才军
摘 要:针对现有教学信息系统在学生课外学习主动性促进方面存在的不足,设计并实现了一种可针对学生实验课程成绩进行主动式预警的系统。该系统根据学生以往实验报告及教师批阅信息,利用贝叶斯分类器对学生实验课程最终考核成绩提前作出预测并及时发出预警,以督促学生在课外更加主动地学习。将该机制应用于《C程序设计实验》教学改革中,结果表明,该系统能在结课前有效预测学生最终考核成绩,且启用成绩预警后,学生及格率相比从前提高了12%以上。
关键词:实验教学;成绩预警;贝叶斯分类器;互联网+
DOI:10. 11907/rjdk. 191836 开放科學(资源服务)标识码(OSID):
中图分类号:TP319文献标识码:A 文章编号:1672-7800(2020)005-0128-04
0 引言
我国高校正进行着新一轮以工程认证为动力、持续推进教学改革的浪潮。此次改革倡导的OBE(Outcome-based Education)理念已深入人心,其核心是“以学生为中心”。课程改革是教学改革的落脚点,而实验课程又是课程改革的关键一环。当前,在高校压缩课堂学时的大趋势下,实验课程往往成为学时压缩的重点。如何在课堂学时有限的情况下改善实验教学效果,成为实验教学改革的重点问题。解决该问题的关键需要回到“以学生为中心”这一根本原则上,达到“教为不教,学为学会”[1]。为此,要设法引导学生自己愿意学、主动学。由于实验课堂学时通常有限,因此实验教学改革的关键在于课外。以我校《C程序设计实验》为例,该门课程只有16个学时,学生很难在这么短的时间内掌握程序求解过程中的问题分析、程序编写、错误纠正等基本方法和思路,唯有在课外投入足够多的时间,方能达成课程目标。
为提高学生课外学习的积极性,近年来各高校纷纷推进基于“互联网+”的教学信息系统[2-4]以及基于信息系统的教学模式[5-10]。这些改革举措主要是从教学资源共享、师生互动两个层面上为师生提供便利,使学生随时随地都能进行课外学习,并能与任课教师进行交流。这些信息系统确实在一定程度上提高了教学效率,对提升学生学习兴趣起到了一定作用,但这类系统在促进学生学习积极性方面仍然有待改善,主要体现在缺乏对学生学习结果的预测,以及建立在结果预测上的行为预警,也即缺乏“目标导向”,而这也正是OBE理念的关键之一。
近年来,国内外不少高校积极探索如何对学生学业与课程成绩进行预测,并据此改善教学,即“学习预警”。学习预警是指按照一定标准综合评估学生的背景信息、学习行为、考试成绩等因素,按照评估结果向学生、教师等发出提示信号,并及时提供有效且针对性强的干预建议[11]。如胡树煜[12]介绍了锦州医科大学根据实践经验制定的一套符合医科学业特点的学业预警管理办法[12];韩丽娜[13]以某班学生某门课程学习信息数据为挖掘对象,采用贝叶斯分类模型进行成绩预测,准确率达到83%;陈子健等[14]从教育数据中挖掘影响在线学习者学业成绩的影响因素,并基于集成学习方法构建学业成绩预测模型;刘毓等[15]提出基于遗传神经网络的预测模型,利用基础课程成绩预测目标课程成绩;Yao[16]从数千名学生智能卡中收集纵向行为数据,提出3种主要行为判别因素:勤奋、有序和睡眠模式,依据这3种行为模式进行学生学业成绩预测,建立一个基于学习—排名算法的多任务预测框架,用于学业成绩预测。
上述关于学习成绩预测的研究主要还是针对学业,而非特定课程,且侧重于预测方法论,鲜有文献就该预警行为对教学效果的影响(实际上是对学生课外学习积极性的影响)进行评估。针对这一问题,本文利用自行开发且已投入使用多年的实验教学信息管理系统收集的学生课外实验报告相关信息,设计并实现了能够对实验课程最终成绩进行预测的朴素贝叶斯分类器,在此基础上实现了一个主动式成绩预警子系统,最后以《C程序设计实验》教学为例,评估该系统的实际应用效果。
1 基于朴素贝叶斯分类器的成绩预警
1.1 朴素贝叶斯分类器基本原理
朴素贝叶斯分类器[17]假设对所有已知类别c(c∈Y, Y={ck|k=1,2,…,N}),事例所有已知的d个属性(A1,A2,…,Ad)相互独立。基于这一假设,若已知类先验概率P(c)、类条件概率[P(xi|c)](xi为属性Ai上的取值,即Ai=xi),则可根据事例属性向量的观测值x=[x1,x2,…,xd],利用朴素贝叶斯公式预测该事例所属类别为:
式中,[Dc,xi]表示Dc中在Ai上取值为c的样本组成的集合,Ni表示Ai上取不同值的个数,|.|表示集合样本个数,可见朴素贝叶斯分类器意义明确,通过简单统计即可得到结果,因而易与数据库查询相结合,相比SVM、神经网络等分类器更容易集成到现有系统。因此,朴素贝叶斯分类器已应用于现有教学信息系统中[18-20]。
1.2 成绩预测朴素贝叶斯分类器设计
本节以程序设计类实验课程为例,在本文自行开发的实验教学信息系统所能实现的范围内,讨论用于实验课程最终成绩预测的朴素贝叶斯分类器设计。在该应用背景下,前述事例对应的是“学生学习某实验课程”。要应用贝叶斯分类器,须确定类别集Y和与Y关联的属性集{Ai|i=1,2,…,d},下面对此作进一步分析。
1.2.1 类别集与属性集确定
由于高校大多采用'A'~'E'五级评分制(若为分数,可通过简单判别转换为五级制)。因此,待预测的学生成绩类别集Y={c1='A',c2='B',c3='C',c4='D',c5='E'}。
如何设计属性集(或特征向量)是构造成绩预测贝叶斯分类器的关键。这组属性应该是信息系统中可追踪,且能够反映学生课外学习积极性的因素。本文对自行开发的实验教学信息管理系统中记录的信息进行分析,归纳出如表1所示的一组属性:A1反映学生提交实验报告的积极性,A2反映教师对学生实验报告的评价,两个属性从不同角度反映了学生课外在这门实验课上的学习积极性。若学生在A1上表现非常积极,且在A2上也得到较好评价,则说明学生课外学习积极性很高。有A2佐证,可避免A1的片面性,有A1存在,可以防止教师评价主观性太强带来的误差。
1.2.2 属性观察值计算
表1中的A2可直接将教师对实验报告的批改结果作为观测值,比较容易计算。这里重点讨论A1属性值计算。在实际信息系统中,A1这类较为模糊的属性无法直接观察到,但可通过系统记录的实验报告提交时间间接计算得到,即根据时间信息设定一种计算规则,得到相对客观的计算结果。本文设定计算规则如下:
1.2.3 朴素贝叶斯分类器训练与测试
用于成绩预测的贝叶斯分类器训练目标是估计式中的类先验概率和类条件概率。待估计的类先验概率有 P(ck)(k=1,2,…,5)共5個;对于A1,待估计的类条件概率有P(x1=n|ck)(n=0,1,…,3,k=1,2,…,5)共20个;对于A2,待估计的类条件概率有 P(x2=n|ck)(n=0,1,…,5,k=1,2,…,5)共30个,即:通过对给定数据集D的训练,要估计出55个概率值,还要对模型进行评估。本文采用“留一法”划分训练集和测试集,训练与测试步骤如下:
上述模型中的55个估计量可存储在表格中,预测时只需查询表格,以提高预测速度。同时,程序可每隔一段时间根据数据库中的新增数据更新这些估计量,以提高分类器的泛化性能。
1.3 成绩预警执行流程
基于朴素贝叶斯分类器的成绩预测机制可由学生自己请求触发,也可在学生登录查看课程相关信息时,由系统根据实际情况(如学生成绩可能不及格)自动触发。分类器根据学生当前实验报告提交情况及批阅成绩,预测其课程最终成绩类别,并依据预测结果发出相应学习指导信息,该机制工作流程如图1所示。
2 教学改革试验与分析
以我校非计算机专业学生《C程序设计实验》课程的成绩预测为例,开展相应教学改革试验,对上述朴素贝叶斯分类器实际性能与基于贝叶斯分类器的成绩预警机制在实验教学中的效果分别进行评估。
2.1 分类器性能评估与分析
随机选取2014~2017级共20 000人(排除重修学生)在笔者开发的“实验教学信息管理系统”(该系统已投入使用长达8年)中的实验报告提交记录及最终成绩记录,按照上文所述方法和步骤,最终得到容量为20 000、带类别标签的数据集D。在D上使用“留一法”进行模型训练与评估,估计器性能评估结果如表2所示(权重:wk=0.125)。
在表2中,Q表示基于前N次实验数据的预测结果,Q反映课程进度。从该结果可以看出,当Q较小时,即课程进度越靠前,预测越不准确。因为学生在课程开始阶段可能学习不够认真,但在后续阶段端正了学习态度,从而较好地达成了学习目标。第3次课程以后,能够更加准确地预测学生最终成绩。因为通过之前的多次观测,已能够较好地记录到学生课外对于本门课程的学习主动性,因此预测准确率得到了较大提升。接近课程结课的几次实验估计准确率则达到83%以上,且较为接近,说明所依赖的属性值计算结果已经较为准确地反映了学生本门课程的课外学习表现。
2.2 预警机制对教学效果影响评估与分析
随机从2018级选课学生中选取200人,再将200人随机分为A、B、C、D共4组(各50人),A组启用预警机制,其余3组不启用预警机制。4组学生在结课时,分别统计本组所有人、排名前10、排名中间20、排名最后20人的最终成绩平均值以及各组在A1、A2上的平均值(本组所有人属性值之和/本组人数),结果如表3所示。
对比表3各组统计结果,分析可知:
(1)启用成绩预警的分组,《C程序设计实验》课程最终成绩平均分比其它组别高9分左右,而及格率比未启用预警的组别高出至少12%,说明启用基于贝叶斯分类器的预警机制确实在一定程度上提升了教学效果。
(2)不同组别在排名前10平均成绩这一项上相差不大,在排名后20平均成绩统计项上相差最大,启用成绩预警的组别比未启用预警的组别平均分至少高出13分,说明启用基于贝叶斯分类器的预警机制对于成绩较差学生学习主动性的提升效果更加明显。另外,启用成绩预警机制的组在A1、A2属性上的均值明显高于其它组,说明成绩预警机制可有效提高学生的课外学习积极性。
3 结论与展望
基于实验教学信息系统中记录的学生实验报告完成情况,以课程最终成绩等级为类别标签,设计并实现了能够在结课前对学生最终成绩进行预测的朴素贝叶斯分类器,给出该分类器所依赖属性集的计算法则,并以《C程序设计实验》为例,通过教学改革实验,对所设计分类器的预测准确率与基于该分类器预警机制的教学效果分别进行评估。结果表明,本文提出的分类器能够有效预测学生最终成绩。基于该分类器的预警机制能提升学生课外学习积极性,从而能较为显著地提高课程达成度。
然而,本文的课程预警功能相对粗放,在精度上仍有提升空间。下一步工作是继续提高课程成绩预测准确率,并探讨如何基于更大的教学数据集,使用新方法发现(如深度学习)与课程成绩有关联的因素(如先修课程成绩),并构建更精确的成绩预测模型,提供更精准的学习指导及预警信息。
参考文献:
[1] 李志义. “水课”与“金课”之我见[J]. 中国大学教学,2018(12): 24-29.
[2] 谢敏. “互联网+教育”背景下的教学智慧研究[D]. 长春:吉林大学,2016.
[3] 杨晓,施於人,王国超. “互联网+实验教学”的建设问题研究[J]. 现代教育技术,2016(7): 106-112.
[4] WANG Z, CHEN C, GUO B, et al. Internet plus in China[J]. IT Professional,2016, 18(3): 5-8.
[5] 孙丹丹,史晓东. 基于“微实验”的翻转课堂教学模式探索[J]. 实验技术与管理,2019, 36(3): 56-58.
[6] 华驰,顾晓燕. “互联网+”背景下的实验实训教学体系设计[J]. 实验技术与管理,2016(3): 172-176.
[7] 周冲. 基于“互联网+”的混合式教学分析[J]. 阴山学刊(自然科学版),2017(2):1-3.
[8] 李松,刘秀琴. “互联网+”大学物理实验教学体系构建[J]. 实验技术与管理,2017(1): 172-174.
[9] 刘骏飞. 浅谈互联网+背景下的课堂教学改革[J]. 赤峰学院学报:自然科学版,2016(5): 243-244.
[10] 王竹立,李小玉,林津. 智能手机与“互联网+”课堂——信息技术与教学整合的新思维、新路径[J]. 远程教育杂志,2015(4): 14-21.
[11] MACFADYEN L P,DAWSON S. Mining LMS data to develop an "early warning system” for educators: a proof of concept[J]. Computers and Education,2010, 54(2): 588-599.
[12] 胡树煜. 医学院校学生学业预警促进学风建设研究[J]. 中国高等医学教育,2018(8): 47-48.
[13] 韓丽娜. 贝叶斯分类模型在学生成绩预测中的应用研究[J]. 计算机与数字工程, 2018, 46(10):106-108,123.
[14] 陈子健,朱晓亮. 基于教育数据挖掘的在线学习者学业成绩预测建模研究[J]. 中国电化教育,2017(12): 75-81.
[15] 刘毓,杨柳,刘陆. 基于遗传神经网络的学生成绩预测[J]. 西安邮电大学学报,2019, 24(1):83-88.
[16] YAO H, LIAN D, CAO Y, et al. Predicting academic performance for college students[J]. ACM Transactions on Intelligent Systems and Technology,2019, 10(3): 1-21.
[17] 周志华. 机器学习[M]. 北京:清华大学出版社, 2016.
[18] 梅晓晴. 朴素贝叶斯分类法在考试管理中的应用[J]. 数字技术与应用,2018(3): 73-74.
[19] 陈纪铭. 基于朴素贝叶斯分类算法的学员流失预警应用研究[J]. 福建电脑,2017, 33(8): 105-106.
[20] 姜利群. 基于朴素贝叶斯分类的Java课程网络答疑反馈系统[J]. 电脑知识与技术,2016, 12(23): 206-208.
(责任编辑:黄 健)