周剑 薛景 韩崇 肖甫 孙力娟
摘 要: 利用已有成绩对未来成绩进行准确预测,对提高教学质量有重大意义。文章提出了基于BP神经网络的学生成绩预测方法,并将其应用于南京邮电大学C语言课程的期末成绩预测,以及某高中高考成绩预测。通过对比分析,说明该方法的应用条件,验证该方法的有效性。最后分析该方法应用于教学的具体方式。
关键词: 成绩预测; BP神经网络; 大学课程成绩; 高中高考成绩; 教学质量
中图分类号:G642 文献标志码:A 文章编号:1006-8228(2018)12-71-04
Abstract: It is of great significance to improve the teaching quality by accurately predicting future performance with existing performance. The student performance prediction method based on BP neural network is proposed in this paper. And the proposed method is applied to the final performance prediction of C programming language course in Nanjing University of Posts and Telecommunications, and the performance prediction of college entrance examination in a high school. Through comparison and analysis, the application condition of the proposed method is illustrated, and the effectiveness of the proposed method is verified. Finally, the specific application of the proposed method in teaching is analyzed.
Key words: performance prediction; BP neural network; college courses performance; college entrance examination performance; teaching quality
0 引言
学生成绩是评价教学质量的重要依据。随着信息化技术的普及,学校教学管理系统及课程作业系统中,以电子数据形式积累了大量的学生作业成绩和考试成绩。如何对这些成绩数据进行有效挖掘以提高教学质量,是值得研究的问题。学生因个体差异,导致学习效果会存在很大的差异[1]。如果能利用学生已有成绩对该学生的未来成绩做出预测,并以预测结果为依据,适当地更改教学策略并对学生进行提示[2],可以提高教学质量。
成绩预测最初采用基于人工的预测方法,由教师或者科研人员人工收集数据,并根据经验对成绩进行估计。该类方法不仅工作过程复杂,而且计算量大、耗时长。随后出现了基于数理统计的预测方法,如最小二乘回归、灰色模型等[3-4]。该类方法采用数学建模对学生成绩进行预测,然而该类方法对于非线性数据的预测能力不强,无法准确刻画学生成绩变化特点。近些年,基于机器学习的预测方法发展迅速,如贝叶斯网络、支持向量机、神经网络等[5-9]。该类方法具有很强的非线性建模能力。
BP(Back Propagation)神经网络[10]是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络之一。本文提出基于BP神经网络的学生成绩预测方法,对南京邮电大学某年级C语言课程的期末成绩以及某高中高三学生的高考成绩进行预测。
1 学生成绩数据描述
本文作者所在的南京邮电大学C语言课程组采用自主开发的网上作业平台(https://c.njupt.edu.cn/),学生平时作业都是在该平台上完成,因此平台积累了大量学生作业成绩数据。南京邮电大学某年级C语言课程的成绩数据描述如表1所示。对于该大学课程成绩,本文通过BP神经网络,根据五次平时作业成绩来预测期末考试成绩。
某高中,在高考前一个多月内对高三学生进行三次模拟考试,该高中高考的成绩数据描述如表2所示。对于该高中高考成绩,本文通过BP神经网络,根据三次模拟考试成绩预测高考成绩。
2 基于BP神经网络的学生成绩预测方法
2.1 BP神经网络结构
BP神經网络拓扑结构包括输入层、隐含层和输出层。Robert已经证明只有一个隐含层的BP神经网络可以逼近闭区间内的任意连续函数,所以一个三层的BP神经网络,可以完成任意的n维到m维的映射。因此,本文建立三层BP神经网络结构的预测模型。隐含层神经元数量根据公式确定,其中ni为输入层神经元数量,no为输出层神经元数量,a为调节常数。
大学课程成绩预测中以5次平时成绩作为输入,期末成绩作为输出,网络结构为5-10-1,如图1(A)所示。高中高考成绩预测中,以3次模拟考试成绩作为输入,高考成绩作为输出,网络结构为3-8-1,如图1(B)所示。
2.2 BP神经网络计算过程
设输入层的输入为已有成绩x1,x2,…,xi,xno,则隐含层第j个神经元的输出如公式1所示。其中,wij表示输入层神经元i与隐含层神经元j之间的权值,θj表示隐含层神经元j的阈值,g()是隐含层神经元的激活函数,本文采用tansig函数。
输出层唯一的神经元的输出,即预测的成绩如公式⑵所示。其中,wjo为隐含层神经元j到输出层神经元o的权值,θo为输出层神经元o的阈值,f()为输出层神经元的激活函数,本文采用线性传递purelin函数。
2.3 BP神经网络训练过程
BP神经网络训练的主要目的是反复修正权值和阀值,使误差函数值E达到最小,如公式⑶。其中,为实际的成绩,为预测的成绩。本文使用梯度下降法,根据使E减小最快的方向来调整权值和阀值。
本文基于BP神经网络的学生成绩预测方法总体流程如图2所示。
3 实验与分析
本文收集到南京邮电大学某年级424名学生的C语言课程成绩作为大学课程成绩预测的样本数据;收集到某高中758名学生的高考成绩作为高中高考成绩预测的样本数据。对于大学课程成绩预测和高中高考成绩预测,均采用70%的样本数据作为训练样本,30%的样本数据作为测试样本。在Matlab上实现本文方法,对成绩进行预测。对大学课程成绩预测结果如图3所示,对高中高考成绩预测结果如图4所示。
从图3和图4中可以看出,高中高考成绩的预测结果优于大学课程成绩的预测结果。BP神经网络预测结果依赖于输入与输出的相关性。高中高考成绩预测中,输入是高考前一个月内三次模拟考试成绩,且这三次模拟考试均有教师监考,因此,模拟考试成绩能反映学生的真实学习效果,和高考成绩相关性较大。大学课程成绩预测中,输入是一个学期内五次平时作业成绩,这五次作业时间跨度较长,且无法保证是学生独立完成的,因此与期末考试成绩相关性较弱。另一方面,高中高考成绩预测中样本数量也多于大学课程成绩预测中样本数量。因此,将BP神经网络应用于成绩预测,需要有一定数量和质量的训练样本作为保障。
为了验证本文方法的有效性,将BP神经网络与传统最小二乘回归进行对比,预测精度和均方误差结果如表3和表4所示。从表中可以看出,无论对于大学课程成绩预测还是高中高考成绩预测,本文基于BP神经网络的预测方法均优于传统最小二乘回归预测方法。
本文预测方法应用于教学的具体方式如下。①如果班级中个别学生的预测成绩较低,则可以找这些学生谈话,敦促这些学生的学习并帮助他们改进学习方式,以期提高最后的考试成绩。②如果班级中大部分学生的预测成绩较低,则教师需反思自己的教学策略,改进教学方式。③该预测方法也可以应用到考试后学生成绩分析,将预测结果与实际考试结果对比,对于相差较大的学生,根据实际情况分析原因,比如是由于平时作业抄袭,还是由于最后考试紧张,并以此对教学方式进行反思。
4 结束语
随着信息技术的普及,学校教学管理系统以及课程作业系统中积累了大量的成绩数据。利用已有成绩,对未来成绩进行预测,可以让学生和教师对学习和教学效果进行预判,也有助于改善学生的学习方式和教师的教学策略,从而提高教学质量。本文提出了基于BP神经网络的学生成绩预测方法,详细介绍了网络结构、计算过程、训练过程。通过大学课程成绩预测与高中高考成绩预测的对比,分析了BP神经网络应用于成绩预测的条件。通过BP神经网络与最小二乘回归的预测结果对比,验证了本文方法的有效性。最后分析了该方法在教学中的具体应用方式。
参考文献(References):
[1] 颜士刚.现代信息技术异化的根源分析及其消解的可能性[J].现代教育技术,2009.1:8-11
[2] 唐婧.数据挖掘算法在计算机教学成绩预测中的应用[J].信息与电脑,2017.18:34-36
[3] 李敬文,陈志鹏,李宜义等组合预测模型在高考数据预测中的应用研究[J].计算机工程与应用,2014.50(7):259-262
[4] 刘昊.基GM(1,1)与反向传输神经网络的大学生体育成绩预测[J].南京理工大学学报,2017.41(6):760-764
[5] Kotsiantis S, Pierrakeas C, Pintelas P. Predicting students' performance in distance learning using machine learning techniques[J]. Applied Artificial Intelligence,2004.5:411-426
[6] Djulovic A, Li D. Towards freshman retention prediction: a comparative study[J]. International Journal of Information & Education Technology, 2013.5:494-500
[7] Romero C, Espejo P G, Zafra A, et al. Web usage mining for predicting final marks of students that use moodle courses[J]. Computer Applications in Engineering Education,2013.1:135-146
[8] 張莉,卢星凝,陆从林等.支持向量机在高考成绩预测分析中的应用[J].中国科学技术大学学报,2017.47(1):1-9
[9] 黄建明.贝叶斯网络在学生成绩预测中的应用[J].计算机科学,2012.39(11):280-282
[10] Rumerlhar D E, Hinton G E, Williams R J. Learningrepresentation by back-propagating errors[J].Nature,1986.323(3):533-536