张钢
(广东工业大学自动化学院,广东 广州 510006)
深度学习技术在高校教学质量评价中的应用研究
张钢
(广东工业大学自动化学院,广东 广州 510006)
作为确保和促进高等教育教学质量不断提高的重要手段之一,教学质量评价正在被广泛研究。有效处理和分析高校教学过程中收集到的庞大原始数据,能够为教学质量评估及其相关改进措施的制定提供决策支持。针对原始教学数据多样性且数量大的特点,提出了一种使用深度学习技术的教学质量评估模型,采用MatConvNet构建深度神经网络,对多种原始数据进行有机融合,能够对教学质量实现比较准确的评估,有一定的实用价值。
深度学习;教学质量评价;深度神经网络;数据融合
作为确保和促进高等教育教学质量不断提高的重要手段之一,教学质量评价正在被广泛研究,有效处理和分析高校教学过程中收集到的庞大原始数据,能够为教学质量评估及其相关改进措施的制定提供决策支持。教学质量可以定义为某一学校所培养的人才在素质、知识、能力等方面与学校教育目标、办学目标相符的程度[1]。更具体地,是指某一门课程教学之后,学生在知识掌握、能力发展、素质提高等方面的水平与课程要达到的目标要求相符的程度[2]。高校教学质量评价本质上是对学生素质、知识、能力变化程度的评价。
当前国内外对高校教学质量评价进行了多层次的研究,主要采用评价指标体系的方式对教学活动、学生的学习效果及反馈进行评分,进而通过对指标体系进行加权或套用数学模型计算出代表高校教学质量的分数[3]。研究者们对指标体系进行设计,使之适用于不同的教学过程:设计指标用于描述教学程序执行的规范化程度和教学资源利用的效率;设计评估问卷了解学生对教师开展教学活动的评价,从而对教师教学活动的质量进行打分;设立教学督导,对课堂教学、教案、作业批改、考试等进行随机的监督,借助督导的经验对以上环节的实施质量进行评价[4]。
目前高校教学质量评价主要存在两个困难,其一是教学原始数据的多样性和数量巨大,使用传统的基于确定公式的指标计算的评价方法难以得到有效的评价;其二是教学过程是一个主观性很强的过程,其中蕴含了十分复杂的内在规律,使用一般意义上的分析模型难以得到较为接近实际情况的评价[5,6]。也正是因为这样的原因,目前高校的教学质量评价多采用由教学督导打分与客观指标(如考试成绩、出勤率、作业上交情况等)结合的方式进行判断[7-9]。
为了应对以上的困难和挑战,提出一个基于深度学习模型的教学质量评价模型。深度学习(Deep Learning)是近年来非常活跃的一个机器学习研究分支,通过增加模型的深度和广度,即增加从输入端到输出端的运算个数和模型的通道数,提升模型的参数规模,使模型具有表达复杂函数的能力。自2006年Hinton教授在《Science》上发表的深度神经网络训练方法的文章[10]之后,深度学习迅速成为研究热点,在图像分类、人脸识别、语音识别、人工智能等方面都有广泛的应用[11]。在教学质量评价上使用深度学习是合适的,大量的成功应用案例表明,深度学习模型在处理数据多样性和提取复杂的隐含规律方面十分有效,能够有效地对专家的专业知识和经验进行建模。
本模型为一个具有标准化输入层、全连接层、屏蔽层的深度神经网络,其中输入层为一组实值输入的神经元,对输入进行归一化后,把结果输出到与它相邻的全连接层,输入层的标准化函数为:
其中v为输入数据分量,vmin和vmax分别表示在训练数据集中该分量的最大值和最小值。经过输入层标准化后,得到的数值在区间[0,1]中。
全连接层中的每一个神经元与其相邻层的所有神经元都有边相连,每条边有一个权值,其取值范围是[0,1]。先对所有输入进行加权求和,然后再输入到一个非线性激活函数,本文采用的是Sigmoid函数,得到一个实值输出,如公式(2)所示:
其中fi为全连接层中的第i个神经元的输出,M为前一个层的神经元个数,vj为前一层的第j个神经元的输入,wji是连接前一层的第j个神经元与当前神经元的边的权值。
图1 深度神经网络结构示意图
屏蔽层按照预先设定的百分比,使上一层神经元的输出变为0,并且该层输出不为零的神经元与下一层的所有神经元之间是全连接。在本文的工作中,根据文献[12]的结论,预设随机屏蔽的百分比为30%。
整个深度神经网络按照每两个全连接层后紧跟一个屏蔽层,根据问题的复杂程度决定需要多少个这样的组合。图1展示了深度神经网络的基本结构。
最后由一个softmax输出层得到模型对于教学质量的评估分值,softmax函数对输入分量执行连续最大化的求值,设v=(v1,v2,…,vn),softmax函数以连续的方式求出v中最大的分量的标准值,即:
其中u是一个模为1的方向向量,u*是最优方向向量,∇xf(x)是某个神经元的误差值,‖∙‖2是2范数。通过调整训练强度,可以改变网络在训练过程中的收敛速度。
采用本校本科教学过程中收集到的原始教学数据,主要分为两大类,一类是专家和学生评教指标,另一类是客观指标。表1展示了两大类指标的具体情况(部分)。
网络的训练采用误差反向传播梯度下降的方法,基于多元函数的方向导数从后往前求出每个神经元的误差,然后据此调整神经元之间连接的权值,具体计算方法见公式(4)(5):
表1 教学数据的主要指标(部分)
表1中的学生评教指标为一个问卷,包含20条选择题,在本研究中,我们把每道选择题的回答转化为一个布尔向量,输入到模型中。
整个数据集的规模为5个学年106门专业课共67188条评教信息,每条评教信息包含26个字段,其中部分字段显示在表1中。对于连续字段,直接输入模型,由标准化输入层对其值进行标准化。对于离散字段,按照1-of-k编码的方式转化为布尔向量,之后输入模型训练。经过转化后,每条评教信息的维数扩展为64。每个评教信息同时包括一个6维的目标向量,用于表示该条评教信息所反映的教学质量。
采用深度神经网络作为评价模型,模型的结构如图1所示。在本应用案例中,采用如表2所示的深度神经网络。
表2 深度神经网络的结构
其中类型列的ABCD分别代标准化输入层、全连接层、屏蔽层和输出层。输入和输出列表示每一层输入和输出的维数。Func列表示每一层的激活函数,对于类型为C的屏蔽层,该列表示随机屏蔽的百分比。
整个模型的实现和训练在著名的深度学习项目MatConv-Net[13]中进行,该项目是基于Matlab的深度学习算法实现,包括网络配置、训练算法和各种主流的已经训练好的网络模型。
为了验证模型的有效性,把数据集分为训练集和测试集两个部分,其比例从1∶9至9∶1,先用训练集训练出一个深度神经网络,然后再把测试集的数据输入到已经训练好的神经网络,得到一组输出,把该输出与测试集的真实输出进行比较,确定误差。考虑到输出是一个表示教学质量的6维实值向量,我们采用平均平方误差来衡量输出值与真实值之间的差异,如公式(6)所示:
其中hij为模型对第j个测试样本的第i个输出分量。
对于每种比例的数据集随机划分均进行10次,测试结果见表3。
表3 不同划分比例下的测试结果
表中的MSE列为均方误差,其计算公式为上述公式(6)。从表3中可以看到,在训练集与测试集比例为6∶4的时候,模型有最低的测试误差。同时也应该注意到,并非越多训练数据模型的效果就会越好,这是由于在训练数据过多的情况下,会引起模型对已有数据的过度拟合,模型的泛化能力反而会下降。
图2 全连接层与屏蔽层组合对预测结果的影响
同时我们报告不同的深度神经网络配置对模型预测结果的影响。改变网络中类型为BBC的层组合的数量,从2至10,对于每一种配置,均运行一次网络的训练和预测,并记录MSE,其结果如图2所示。从图中可以看出,在组合数为8的时候网络的预测性能达到最佳值。
本文研究了深度神经网络在教学质量评价中的应用,并报告了一个应用例。深度神经网络具有强大的表达能力,能够很好地处理教学活动数据的多样性和海量性,能够有效提取影响教学质量的深层次规律,可以作为高校教学质量评价的辅助手段,有助于减低在评价过程中主观因素对评价结果的影响。在今后的研究工作中,我们将对教学质量的原始数据进行进一步的整理,同时引入新的表达能力更强大的深度学习模型和更有效的评价体系,以建立更智能化的评价模型。
[1]Daniel Hickmott,et al.2016.Building apostrophe power:lessons learnt for serious games development[C]. In Proceedings of ACSW'16.ACM,New York,NY,USA,Article 70,10 pages.
[2]William L.Honig.2013.Teaching and assessing programming fundamentals for non-majors with visual programming[C].In Proceedings of ITiCSE'13.ACM,New York,NY,USA,40-45.
[3]A.M.Whale,B.M.Scholtz,and A.P.Calitz.2015.Classification of Heuristics for Components of e-Learning[C].In Proceedings of SAICSIT'15,ACM,New York,NY,USA,Article 43,11 pages.
[4]Charles Garrod,Jeffrey Forbes,Colleen Lewis,and Peter-Michael Osera.2016.Mentoring Student Teaching Assistants for Computer Science[C].In Proceedings of SIGCSE'16.ACM,New York,NY,USA,702-702.
[5]Ana M.Santos.2015.Theoretical-methodological proposal to evaluate the quality of educational websites to support education[C].In Proceedings of TEEM'15.ACM,New York,NY,USA,397-401.
[6]黄岚.国内外大学评价体系的发展比较与演进方向探析——第三方评价的视角[J].南京理工大学学报(社会科学版),2016,29(2):73-79.
[7]姜文彪,陈正伟,裘君英,等.电工电子技术实践教学评价体系设计——以“卓越工程师教育培养计划”为背景[J].浙江科技学院学报,2016,27(4):307-310.
[8]杨晓明,龙文碧,吕路平,等.基于高校学生满意度的教学质量评价研究——以北京科技大学为例[J].北京科技大学学报:社会科学版,2015(3):102-113.
[9]袁建林,袁景.辽宁省高校教师教学质量评价[J].当代教育实践与教学研究(电子版),2015(7):219-220.
[10]Hinton,G.E.&Salakhutdinov,R.R.Reducing the dimensionality of data with neural networks[J].Science,2006,313,504-507.
[11]Bengio,Y.Deep Learning of Representations:Looking Forward[C].Proceedings of the First International Conference on Statistical Language and Speech Processing,Springer-Verlag,2013:1-37.
[12]Krizhevsky,A.;Sutskever,I.&Hinton,G.E.ImageNet Classification with Deep Convolutional Neural Networks[C].Advances in Neural Information Processing Systems,2012.
[13]MatConvNet--Convolutional Neural Networks for MATLAB[C].Proceeding of the ACM Int.Conf.on Multimedia,2015.
Research on theApplication of Deep Learning Technology in University Teaching QualityAssessment
Zhang Gang
(Guangdong University of Technology,Guangzhou 510006,Guangdong)
As one of the key methods for ensuring and improving the teaching quality of university,teaching quality assessment has been widely studied.Effectively processing and analyzing the big original dataset collected during teaching procedure can provide the basis of decision support for teaching quality assessment and policy making.Considering the diversity and huge volume of original teaching data,this paper proposes a teaching quality assessment model based on deep learning technology,in which a deep neural network is implemented by MatConvNet and applied for data fusion.The model achieves good performance in university teaching quality assessment which illustrates its application value.
deep learning;teaching quality assessment;deep neural network;data fusion
G434
A
1008-6609(2017)10-0006-04
张钢(1979-),男,广东人,工学博士,讲师,研究方向为机器学习。
广东省自然科学基金项目,项目编号:2016A030310340;广东工业大学高教研究基金项目,项目编号:2016GJ12;广东省教育评估协会2015年度研究课题,项目编号:G-11。