吴祎 周强 胡胜 赵进博
摘要:现有的课堂教学评价指标体系间存在高度的非线性,数据冗余等特征。针对此课堂教学评估方法无法消除数据之间的冗余和捕捉非线性规律导致预测精度较低的问题,提出一种基于主元分析的神经网络教学质量评估方法。首先构建影响课堂教学质量评估的因素体系,利用主元分析法消除数据的冗余信息,选择贡献率大的主成分因子作为网络输入,然后构造神经网络模型对教学质量进行评估。通过收集陕西科技大学30 名教师的评价数据进行实例验证,结果显示基于主元分析的评估模型在简化 BP 神经网络结构的同时,也提高了课堂教学质量评估的预测效果。
关键词;教学质量评估;主成分分析 BP神经网络;特征提取
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2015)34-0157-03
Abstract: Currently, the classroom teaching evaluation system exist characteristics which integrates highly nonlinear, data redundancy and other features together. Considering the problem that traditional classroom teaching and assessment methods can not eliminate the redundancy between the data and capture nonlinear law, a method of classroom teaching evaluation based on Principal Component Analysis (PCA) and neural network is presented in this paper. Firstly, the principal component analysis (PCA) is used to eliminate redundant information of assessment data, and the principal component factor which contribution rate is large are selected as the input of the network. Secondly, the BP neural network was introduced to evaluate the teaching quality. Finally, thirty teachers evaluation data are collected to verify proposed method. The result demonstrates that the model can simplify BP network model effectively and improve teaching quality assessment prediction accuracy. So this paper proposed a simple and effective approach to evaluate the classroom teaching quality.
Key words: teaching quality evaluation; Principal Component Analysis (PCA); neural network; feature extraction.
教学质量是教育的生命线,开展教师课堂教学质量评价对于引导教师不断进行教学内容、教学方法的改革,提高课堂教学质量和水平具有积极意义和重要作用[1]。但教学质量的评估是一个复杂的多因素系统,其评估体系中有定量指标,也有定性指标,并且指标体系间存在高度的非线性,数据冗余等特征,从而增加了评估的难度。如何根据复杂的评估体系建立科学合理的课堂教学质量评估模型是高等院校关心的热点问题。
长期以来,不少学者对课堂教学质量评估进行了深入研究,取得一定成果:文献[2-3]等运用模糊数学的基本原理,对教师课堂教学质量进行了模糊综合评判;文献[4]利用层次分析法建立了学生评价教师教学质量的定量评价模型;文献[5]利用齐次马尔可夫链分析法,结合学生的考试成绩,对教师的教学效果进行了综合评价。文献[6-7]等利用神经网络技术建立三层神经网络模型,对高校教师课堂教学效果进行预测。取得一定效果。
但神经网络没有考虑有考虑输入变量的选取。输入变量过多时,网络结构复杂,加重了神经网络的训练负担,学习速度急剧下降;同时,主观选择很有可能包含与输出相关性很小的输入变量,增加了陷入局部极小点的可能性,非但不能提高预测精度,反而降低了神经网络预测的性能[8]。只有从中找出一组合适的决策变量才能有效地解释评估指标体系的变化关系,才有可能对各种评估体系条件下课堂教学评估做出准确的预测。
为此,本文提出一种基于主元分析的神经网络教学质量评估模型。首先利用主元技术对包含各种评价指标体系的输入变量进行筛选,消除指标数据的冗余信息,然后构造神经网络模型对教学质量进行评估。最后通过实例进行验证本文所提方法的有效性。
1 基于主元分析的神经网络模型
1.1 主元分析法
主元分析[9](Principle Component Analysis, PCA)是一种线性特征提取方法。将选出的课堂教学质量影响因素的指标重新组成一组相互无关、信息不重叠的几个综合指标代替原有指标,从实际需要出发提取几个较少综合指标尽可能多地反映原有指标信息,揭示课堂教学质量影响因素的普遍信息和特殊信息。其基本思想是通过对输入变量进行变换,在数据空间中找出了一组正交矢量来最大可能地表示数据方差,以便将数据从原始高维空间映射到由正交矢量构成的子空间,达到提取特征和降低变量维数的目的。主要算法步骤如下:
1)原始数据的标准化:设[X=(X1,X2,…,Xp)]为特征参数观测矩阵,[Xi=(X1i,X2i,…,Xni)T],[p]为变量数,[n]为样本数。为消除原变量的量纲不同、数值差异过大带来的影响,对原变量作标准化处理。即:
2)计算相关系数矩阵:[R=rijp×p],[rij=k=1nxkixkjn-1]式中[rii=1,rij=rji,rij]是第[i]个变量的第[j]个指标的相关系数。
3)计算特征值和特征矢量:由特征方程[λu=Ru]解得特征值[λ=(λ1,λ2,…,λp)] [λ1≥λ2≥…≥λp≥0]和特征矢量[u=(u1,u2,…,up),] [uj=(u1j,u2j,…,upj)]。
4)确定主元:根据主成分的累计方差贡献率来确定。当前m个主元累积贡献率之和[i=1mαi≥85%] ,则选择前m个主元[Y1,Y2,…,Ym]作为新特征矢量,最后根据综合得分[Z=i=1pαiyi],其中[αi]为第[i]个主元的信息贡献率,即可进行评价。
1.2 主元分析的神经网络模型基本框架
主元分析方法的优势在于其能够有效地去掉数据的冗余信息,简化数据输入,但它无法捕捉课堂教学评价影响因素的非线性关系,不能直接用来进行课堂教学评估预测。
而BP神经网络模型有很优异的非线性建模能力,能够很好地捕捉到数据中的非线性特征。本文以课堂教学质量评估为研究背景,充分发挥主元分析和BP神经网络的优势,建立基于主元分析的神经网络课堂教学质量评估模型,优化BP神经网络结构,加快学习速度,提高教学质量评估效果。其基本流程如图 1所示。
2 主元分析的神经网络课堂教学质量评估实例
2.1 教学质量评估对象
本文以陕西科技大学的教学质量评估为研究对象。教学质量综合评估包括教学督导组评分、教师同行评课和学生网上评教三部分。
陕西科技大学将学生该评价指标体系设计成由 3 项评价因素(一级指标)和 21 项(二级指标)两级指标构成,具体见表 1。
依据上述评价指标体系,选取理学院的30位教师评价实体,通过学生给每位教师评分,在得到每位教师各指标得分的原始数据后,对它们进行预处理:
a. 对每位教师的每项指标得分均去掉 5 个最低分和 5 个最高分后取平均值,依次得到该教师的 21 项指标的得分值;
b. 对每位教师的得分值数据进行归一化处理,处理后的数据处于 [-1,1] 之间。数据[Xi]归一化函数公式如下:
c. 同时选取学校教学督导组专家对每位教师课堂多次听课后的综合评价值作为此教师的教学质量评价结果得分值,并把它们作为网络的期望输出值。经过以上处理和设置,得到 30 位教师的数据如表 2 所示。
2.2 教学评估质量数据的主元特征提取
经过预处理之后的样本数据进行相关分析,发现各变量指标之间存在着极显著的相关关系,各指标间的相关系数高达 0.85 以上,表明他们存在信息上的冗余,有必要对数据进行主成分分析,以消除数据间的冗余,同时去掉那些带有较少信息的坐标轴,以达到降低维数目的。
利用主元分析对求取原始数据的特征值[λ1,λ2,…,λ21](3.5155, 2.0830, 1.4841, 1.0014, 0.9159, 0.7271, 0.5657, …, 0)。取前7个较大的特征值,方差贡献率之和为 91.69%。对应的特征矢量 E 如表 3 所示。
利用特征矢量与原始数据相乘得出原始数据的主成分如表 4 所示。
2.3 BP神经网络教学质量评估
将最终得出的表 4 主成分作为决策变量输入到 BP 神经网络中进行预测,网络输入层的节点为 7([<]21,21为原始数据矢量),神经网络的输出(模型预测值)为每个老师的课堂教学综合评价得分。模型采用三层神经网络,即一个输入层,一个隐含层,一个输出层。隐含层和输出层神经元个数分别为 7 和 1 。神经元激活函数采用对数 S 型函数。网络的学习率 a = 0.1,学习允许误差 e=0.00001。数据分为两部分:从预处理后的 30 组数据中随机产生 24 组数据训练网络,余下的 6 组数据用于网络测试。基于主元分析的神经网络预测输出的结果如图 2 所示。图3为网络训练的次数,由图可知,批次训练 3 次就达到了网络所要求的精度。
2.4 不同网络模型的评估效果对比
为了验证本文提出的模型的优劣性,与单独采用BPNN神经网络预测进行比较,其网络结构和算法设置如表 5 所示。
显而易见,经过主元处理之后的质量评估预测模型(PCA+BP 总误差 0.0487)优于 BP 预测模型(BP 总误差 0.1332)。同时,采用主元分析方法处理原始数据,使网络输入维数由原来的 21 维降到了 7 维,同时消除指标之间的相关性,缩短了训练时间,提高了网络预测的精度。
3 结束语
本文提出了一种新颖的课堂教学质量评估模型。将主元分析方法与 BP 网络模型有机结合,并应用到高校课堂教学质量评估过程中。利用主元分析技术将教学质量评估数据进行降维,提取主元特征的同时降低了 BP 预测模型化网络结构复杂度。实验结果表明,本文方法在高校课堂教学质量评估预测过程中速度更快,具有良好的预测精度和泛化能力。
参考文献:
[1] 丁家玲, 叶金华. 层次分析法和模糊综合评判在教师课堂教学质量评价中的应用[J]. 武汉大学学报, 2003, 56(2): 241-245.
[2] 吴虹. 基于模糊综合评判法的高校教师教学质量评价体系的构建[J]. 统计与决策, 2010 (3): 166-168.
[3] Xuefeng Q. Teaching quality evaluation system based on GEAHP fuzzy comprehensive evaluation [J]. Microcomputer & Its Applications, 2011(11): 26.
[4] 赵立新, 王石安, 赖元峰. 教学质量评估的定量比较评价模型[J]. 数学的实践与认识, 2005, 35(1): 12-17.
[5] 冯虹, 邹华, 魏文元. 马尔可夫链在教学质量评价中的应用[J]. 天津师范大学学报, 1999, 19(1): 5-9.
[6] 杨新佳, 龙熙华, 韩波. 基于 BP 神经网络的教学质量评价模型研究[J]. 教育教学论坛, 2011(14): 222-223.
[7] 孙晓玲, 王宁, 梁艳. 应用 BP 神经网络的教学评价模型及仿真[J]. 计算机仿真, 2010(11): 314-318.
[8] Kohzadi N, Boyd M S, Kermanshahi B, et al. A comparison of artificial neural network and time series models for forecasting commodity prices[J]. Neurocomputing, 1996, 10(2): 169-181.
[9] Johnson R A, Wichern D W. Applied multivariate statistical analysis [M]. Englewood Cliffs, NJ: Prentice hall, 1992.