韦艳玲
摘要:采用遗传神经网络,对高校计算机等级考试进行过级预测。该算法采用三层BP 神经网络, 加入遗传算法对网络输入进行了优化,能够预测学生的过级情况。教师可针对可能不通过的学生进行强化训练,为学生顺利过级及教师教学提供一定的的帮助。
关键词: 遗传神经网络;高校计算机等级考试;预测
中图分类号:TP311.13文献标识码:A 文章编号:1009-3044(2012)30-7329-03
许多大专院校都规定:学生必须要取得全国高等学校计算机等级考试合格证。许多高校很重视该种考试的“过级率”,广西高校计算机等级考试联考还就考试的“过级率”分别对本科和专科进行排名,作为衡量各校计算机基础教学成绩的重要标准。所以,有必要对高校计算机等级考试的过级情况进行研究和分析,对该种考试过级情况进行预测,对可能不过关的学生进行强化训练。
影响学生高校计算机等级考试是否过级的因素多而复杂。BP神经网络通过合理的样本训练、学习专家的经验、模拟专家的行为,具有并行处理自组织、自适应、自学习能力以及较高的容错性等优点,遗传算法可以优化神经网络,提高神经网络的泛化能力,提高预测精度。遗传算法与神经网络的结合弥补了BP网络学习过程收敛速度慢,可能陷入局部级小的不足。能较好的处理像过级预测这样多因素、非确定性、非线性问题。
该文结合遗传算法的神经网络技术对高校计算机等级考试预测的相关数据进行挖掘,神经网络的初始权值先用遗传算法处理,经过遗传算法操作以后,选出适应值最高的个体将权值付给BP网络作为初值,再由BP网络在全局搜索过的基础上进行局部搜索,训练出最优网络,从而预测学生的过级情况,达到了对学生过级进行预测的目的,为教师指导学生等级考试过级提供有益的帮助,对提高高校计算机教学水平和教学质量具有一定的指导意义。
1 遗传神经网络算法
1.1 BP 神经网络介绍
BP(Back Propagation)网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。它可以模拟人的大脑,将大量的神经元连接成一个复杂的网络,利用已知样本数据对神经网络进行训练,让网络存储变量间的非线性关系,然后利用存储的网络信息对未知样本进行分类。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。一般情况下,神经网络模型由三个层次组成:输入层、中间层和输出层。神经网络的训练根据与训练集中历史样本数据进行对比反复的进行,并不断的修改连接强度(权值),当输出结果与已知结果的吻合度达到一定的精度或满足其他结束条件时,就停止对网络的训练,此时就可用测试集中的数据对系统进行评价。
1.2 遗传算法的计算步骤
遗传算法的计算步骤:
1)参数编码.首先将问题求解的参数变量转变成遗传个体,这过程称其为参数编码。
2)选择操作:可以保持种群中的优质个体继续遗传,将上一代种群中的优质个体直接传递给下一代个体,增大优质个体遗传到下一代的概率,适应度较差的个体被淘汰。
3)交叉运算:通过不断的杂交和基因重组繁衍后代,从而使父代优良的特性能保留到下一代中,保证了种群数量的多样性。
4)变异运算:保持了种群的多样性,通过变异使种群产生新的个体,此外它还可以有效地控制搜索结果,以免陷入局部最优解,使遗传算法的搜索空间扩大,提高其全局的搜索能力。
1.3 遗传神经网络计算步骤[1-3]
步骤1 确定神经网络的拓扑结构。
步骤2选择染色体种群大小、交叉和突变的概率,并定义训练的次数。定义适应性函数来度量单个染色体的性能或适应性。
步骤3编码,得出初始种群。
步骤4解码得到权值和阈值,赋给新建的BP神经网络。
步骤5 使用样本训练和测试网络,测试误差。
步骤6计算适应度,选择适应度高的染色体进行复制
步骤7进行交叉和突变操作。
步骤8得到新的种群。
步骤9用新的种群(子代)取代初始种群(父代)。
步骤10 回到步骤4,重复这个过程,直到迭代次数上限或是误差达到训练标准。
步骤11 将把最后一代群体中的所有个体解码,输出满足条件的网络权系数和网络。
步骤12 输入检测样本,检验网络的泛化能力。
上述算法通过BP 神经网络与遗传算法结合计算稳定了训练次数和最终权值,大大加快了训练速度。
2 遗传神经网络预测
2.1 数据来源及数据预处理
前期工作是通过设计问卷调查表,得到有效问卷调查表,通过清洗,共得到255个有效样本。在本实验中,随机选取的155数据用来形成规则,余下的100数据用来测试[4]。
数据值设定如下:
所学专业:有“理工、管理、文史、艺术” 四档,分别用 “4、3、2、1”表示;纪律情况:有“好、一般、差”三档,分别用 “3、2、1”表示;学习情况:有“很好、较好、一般、差”四档,分别用 “4、3、2、1”表示;对本课程兴趣程度:有“高、中、低”三档,分别用 “3、2、1”表示;是否常上机练习:有“是、非”两档,分别用 “2、1”表示;班上学习风气:有“好、一般、差”三档,分别用 “3、2、1”表示;教学经验:有“丰富、一般、少”三档,分别用 “3、2、1”表示;责任心:有 “强、一般、较差”三档,分别用 “3、2、1”表示;课程目标:有“高要求、一般要求”两档,分别用 “2、1”表示;“课程难易度”有“偏难、适中、偏易”三档,分别用 “3、2、1”表示。另外,“过级否”这一输出字段有“通过,不通过”两种情况,分别用 “1、0”表示。
把“所学专业(sxzy)、纪律情况(jlqk)、学习情况(xxqk)、对本课程兴趣程度(xqcd)、是否常上机练习(csjlx)、班上学习风气(bf)、教学经验(jxjy)、责任心(zrx)、课程目标(kcmb)、课程难易度(Kcnyd)、试卷难易度(sjned)”作为条件属性,把“过级否(gj)”作为决策属性。
2.2 神经网络算法实现
首先确定神经网络的拓扑结构。对一般应用而言,三层网络是较好选择。隐含层神经网络个数确定,可用以下公式:隐含层神经网络个数=2*输入层隐含层神经网络个数+1。
本文中,样本有11个输入参数,1个输出参数,所以这里隐含层神经网络个数取23。BP神经网络的拓扑结构为11-23-1。共有11*23+23*1=276个权值,23+1=24个阈值,得出遗传算法优化参数的个数为300个。隐含层传递函数采用S型正切函数tansig(),输出层传递函数采用S型对数函数logsig()。
适应度函数:选择预测样本的预测值与期望值的误差矩阵的范数为目标函数的输出,采用适应度分配函数FitnV=ranking(obj),其中obj为目标函数的输出。选择算子:采用随机遍历抽样。交叉算子:采用单点交叉算子。变异:以随机方式选出发生变异的基因,1变0,0变1。运行参数设定:种群大小:30;最大遗传代数:30;变量的二进制位数:10;交叉概率:0.01;代沟:0.95。
3 结果及分析
得到优化化的权值和阈值的训练误差变化曲线(如图1所示),预测值的准确率为93.4%,准确率是比较高的;根据预测结果,针对可能不通过的学生进行强化训练,学生很有可能过关;该文作者积极把此算法应用于实践。在2012年6月的全国高校计算机过级考试中,该文作者所教的两个班级均取得了好成绩,一个班过级率达到100%,一个班过级率也达到了98%,说明了遗传神经网络对高校计算机等级考试预测的应用是有效的,对学生顺利过级及教师教学可提供一定的的帮助。
参考文献:
[1] 余凡,赵英时,李海涛.基于遗传BP 神经网络的主被动遥感协同反演土壤水分[J].红外与毫米波学报,2012,31(3),283-288.
[2] 李海侠.遗传神经网络滑模控制在交流伺服控制中的应用研究[J].机械设计与制造,2012,(7):142-144.
[3] 黄学雨,马欣.基于遗传神经网络的股指预测[J].现代计算机,2012,(5),30-32,39.
[4] 旷昀.BP算法在高校计算机等级考试过级预测中的应用[D].北京:北京工业大学,2007.