卢铮松 李珂珂
【摘要】在研究生网上课程评价系统收集的大量数据基础上,构建了一种基于人工神经网络的多指标课程评价模型,并将网上调查的结果以连接权的方式赋予该评价模型进行训练。通过实际评价数据的验证,该模型能够准确地按照实际评价的过程进行工作。
【关键词】评价模型;人工神经网络;课程评价
【中图分类号】G420 【文献标识码】A 【论文编号】1009—8097(2009)10—0053—05
一 引言
目前,我国高等教育面临着培养大批创新人才和为国家自主创新做出更大贡献两大任务,对研究生教育已经从注重培养数量转变为注重培养质量。研究生的课程教学过程,是研究生培养质量控制中一个重要环节,因此对于研究生课程教学质量的评估,也成为提高培养质量的重要课题之一。
然而,对研究生课程教学质量进行评价,是一项复杂的系统工程。在课程评价中涉及的因素较多,在评价中通常采用的问卷调查,由于指标和权重的确定带有很大的主观性,调查对象的反馈也存在部分无效信息或噪声数据,因此并不能完全客观地反映课程教学水平的高低。
随着研究生培养工作的不断发展,在课程调查方面已经积累了大量原始数据。通过数据挖掘技术,利用已经存在的大量研究生培养和课程调查数据,将其转换成有用的信息和知识,建立一个完善的研究生课程评价体系和课程评价模型,能够为课程评价提供高效客观的结论,并以此为参考,不断提高研究生的课程教学质量和培养质量。
本文试图在构建研究生课程评价体系的基础上,基于数据挖掘技术,通过数据分析和机器学习,提出一种基于人工神经网络的多指标综合评价模型。该评价模型不仅可以模拟调查者对课程进行评价,而且还具有很强的容错能力,非常适合大规模的评价系统。
人工神经网络(Artificial Neural Network,简称ANN)是近年发展起来的一门处理复杂系统的理论,其特有的信息处理能力和独到的解算能力在很多方面都呈现出广阔的应用前景。ANN主要解决数据挖掘的分类和回归任务,它基于并行处理的机制,从结构上对人类的思维过程进行模拟,从而能实现人类思维的某些功能,如学习、逻辑推想、联想记忆和自组织等[1]。相对于判定树算法,ANN可以找出输入属性和可预测属性之间平滑而连续的非线性关系。ANN已经在信号处理、模式识别、目标跟踪、机器人控制、专家系统、组合优化、网络管理等众多领域的应用中获得了引人注目的成果。特别是在解决非线性系统的问题的方面,具有独特的优势。
二 研究生课程评价体系构建
通过对某重点高校2007-2009年网上课程评价设计的调查问卷进行总结,以及对网上课程评价系统获取的原始数据整理和汇总,并参考部分典型的课程教育质量评价体系,可以从课程内容、教学过程、教师情况等三个方面来构建课程评价体系。具体的评价指标详见表1。
三 基于神经网络的研究生课程评价模型
1 BP神经网络的构建
目前人工神经网络的算法模型有很多种,其中BP神经网络是被广泛应用的一种重要网络形式,主要用来进行非线性系统的输出输入映射关系建模。其主要结构是由一个输入层,一个或多个隐含层,一个输出层组成,各层由若干个神经元(节点)构成,每一个节点的输出值由输入值、作用函数和阈值决定[2]。
本文采用的是如图1所示的隐含层为一层的三层BP神经网络模型。
(6)利用输出层各单元的一般化误差 与隐含层各单元的输出 来修正连接权 和阈值 。
(7)利用隐含层各单元的一般化误差 ,输入层各单元的输入 来修正连接权 和阈值 。
(8)随机选取下一个学习样本向量提供给网络,返回到步骤(2),直到m个训练样本训练完毕。
(9)重新从m个学习样本中随机选取一组输入和目标样本,返回步骤(2),直到网络全局误差E小于预先设定的一个极小值,即网络收敛。如果学习次数大于预先设定的值,则网络无法收敛。
(10)学习结束。
3 研究生课程评价模型中的BP神经网络设计
在研究生课程评价模型中的BP神经网络中,共有21个指标作为输入的神经元;输出层只有一个神经元,即研究生培养质量评价值,它是一个取值范围是[0,1]的代数值。
隐含层的神经元数目选择是一个十分复杂的问题,往往需要根据设计者的经验和多次试验来确定,因而不存在一个理想的解析式来表示,更不能机械地按照Kolmogorov定理来简单地确定隐含层的神经元数目。隐含层的神经元数目与问题的要求、输入和输出单元的数目都有着直接关系。若隐含层节点数太少,网络可能根本不能训练或网络性能很差;若隐含层节点数太多,虽然可使网络的系统误差减小,但一方面使网络训练时间延长,另一方面,训练容易陷入局部极小点而得不到最优点,也是训练时出现“过拟合”的内在原因。
本文的具体应用当中,根据下面的经验公式来确定隐含层节点数[4],在编程实现时分别选取高、中、低三个不同数值来观察网络性能,当网络的评价误差最小时,网络中间层的神经元数目就是最佳值。
(7)
其中S为隐含层节点数,m为输入层节点数,n为输出层节点数,S取值范围为5~15。
根据公式(7),我们首先将隐含层神经元数目设为5,然后逐步增加到10和15。多次试验之后,通过对这3种情况下的误差进行对比,发现隐含层神经元个数为10时,该B-P神经网络的预测性能最好。因此,本应用中,隐含层神经元数目设为10。
由于应用神经网络模型需要进行数据的预处理,即对输入进行归一化。同时课程评价调查中定性因素较多,对于每个指标的选项采用计分法,共分为1.0、0.7、0.5、0.3、0.1五个等级[5]。通过网络评价系统,让指定范围的研究生(如指定班级、指定专业等)对调查问卷进行评价,得出各个指标的评分值。
表2中以U5课程内容包含信息量、U9对创造性思维的鼓励程度和U18讲解清晰逻辑性强三个指标为例,说明评价指标归一化处理参考对照表。
四 研究生课程评价模型的应用验证
该应用的样本来自于天津大学研究生课程评价与调查系统2007年到2009年的课程评价调查数据。在2007年到2009年间,对当年的一年级研究生进行了15门课程共6次评价调查活动,共计2992人次参与了问卷调查,生成有效调查记录2972份。在评价系统中可进行调查结果的统计工作,统计页面如图2所示。
本文对调查结果进行了适当整理。首先将不同时期不同内容的调查问卷按照评价体系指标进行了归纳,剔除了个别只针对具体课程的问题。其次是对各项评价指标进行了归一化处理。最后,对单门课程的调查问卷结果进行统计,得到每门参与调查课程各项指标的平均得分。最后统计结果如表3所示。
将各项指标的平均得分输入BP神经网络模型中,进行学习训练。通过对训练结果进行测试,误差达到所要求的范围之内则说明学习成功。一旦学习成功后,神经网络就可再现调查对象们作为整体的经验、知识和直觉思维,从而降低评价过程中的人为因素影响,较好的保证了模型计算的客观性。
该应用具体步骤如下:
(1)按照图1的网络设计结构,隐含层神经元的传递函数为S型正切函数。由于输出已经被归一化到区间[0,1]中。因此,输出层神经元的传递函数可以设定为S型对数函数。下面代码片段用来创建一个符合本文应用的BP网络(本文所有代码均为MATLAB7.1代码):
threshold = [0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1];
net = newff ( threshold, [10,1], {'tansig','logsig'}, 'traingdx');
其中,threshold设定了网络输入向量的取值范围[0,1],网络所用的学习函数为traingdx,该函数以梯度下降法进行学习,并且学习速率是自适应的[6]。
(2)利用参与调查课程的前10个样本数据进行训练。训练参数的设定中,训练次数为1000次,精度设为0.0001,其它参数取默认值。网络训练代码如下:
net.trainParam.epochs =1000;
net.trainParam.goal=0.0001;
net=init(net);
net=train(net,P,T);
变量P和T分别表示网络的输入向量和目标向量。训练结果如图3所示,经过478次训练后,网络的目标误差达到要求。
图3:实际的MATLAB7.1训练结果收敛图
(3)利用后5个样本数据进行测试。测试代码如下:
Y = sim(net,P_test);
测试结果如表4:
由表4可见,预测误差达到预期效果。因此,该模型可以满足实际的应用要求[7]。
五 结论
由于对研究生课程进行评价的因素相对较为复杂,各项目权重的衡量属于非线性问题,因此尽管有较多的调查结果,但对于某门课程效果的评价过程还是比较困难的。本文通过分析具体调查项目和结果的基础上,提出一种基于BP神经网络的课程评价模型。该模型通过BP网络对历史课程调查数据的分析和学习,能够对研究生课程进行评价分析。通过实例验证,该模型的评价效果达到了预期的要求。
此外,该课程评价模型在实际应用中尚存在部分问题,主要是评价结果统计时的归一化无法对定性指标进行处理,如“课程主要提高了哪方面的能力”这样的问题无法纳入该体系中,需要在今后的研究中进一步完善。
参考文献
[1] 徐宗本,张讲社,郑亚林.计算智能中的仿生学:理论与算法[M].北京:科学出版社,2003:138-139.
[2] CALLAN R. Artificial Intelligence [M].黄厚宽, 田盛丰, 等译.北京: 电子工业出版社, 2004:252-254.
[3] Lili Rong.Building a three-layer BP neural network by fuzzy rules [A].Proc of the 9th International Conference on Neural Information Processing[C], 2002:452-456.
[4] 周开利.神经网络模型及其MATLAB仿真程序设计[M].北京:清华大学出版社,2005:70-80.
[5] 庞玉成.基于人工神经网络的项目集成管理绩效评价研究[J].施工技术,2008,37(2):22-24.
[6] 冯楠,李敏强,寇纪淞,等.基于人工神经网络的IT项目风险评价模型[J].计算机工程与应用,2006(6):24-26.
[7] Liang Haifeng.An adaptive BP-network approach to short term load forecasting [A].
Proc of the 2004 IEEE International Conference on Electric Utility Deregulation [C].2004:1004-1019.