基于GA—SVM的高职学生综合素质评价模型

2014-05-10 17:41王静
广西教育·C版 2014年3期
关键词:综合素质评价

王静

【摘 要】引入GA优化算法对SVM模型的参数进行优化,把优化后的算法应用于高职学生综合素质评价,构建一个学生综合素质的评价模型。实验表明,优化后的SVM模型泛化能力更好、预测的准确率更高,能有效地对学生的综合素质进行评价。

【关键词】GA算法 SVM模型 综合素质评价

【中图分类号】 G 【文献标识码】A

【文章编号】0450-9889(2014)03C-0055-03

学生的综合素质是一个学校办学水平的反映,如何对高职学生的综合素质进行科学、合理地评价成为各个高职院校改革研究的重点。对学生综合素质的评价属于非线性的数学问题。支持向量机( Support Vector Machine,简称SVM) 是一种新型的机器学习方法,具有良好泛化能力,在处理非线性问题时更容易逼近问题的解决。但SVM模型的分类性能受其参数的影响,这些参数的确定带有很大的随机性。为了解决这个问题,引入具有智能全局搜索能力的遗传算法 (Genetic Algorithm,简称GA)对SVM模型的参数进行优化,构造一个基于GA算法优化的SVM模型(简称GA-SVM模型)。实践表明,在学生综合素质评价中GA-SVM模型具有更好的非线性逼近能力,具有一定的应用前景。

一、GA优化的SVM评价模型

(一) SVM模型的基本原理。SVM模型是一种新型的机器学习方法,它源于统计学和结构最小化原则。它的基本思想是在有限的样本中,对问题的复杂性和算法继续学习能力进行折中,使模型获得更好的泛化能力。如图1所示。图1中的实心点和空心点分别代表两类不同的样本,H1和H2是两根平行于分类线的直线,H1和H2之间的距离称为分类间隔(Margin)。

图1 支持向量机原理示意图

设样本集(xi,yi)线性可分,其中i=1,2,L,n。n为样本数量,输入向量x∈Rd,类别标号y∈[1,-1]。在d维空间中,线性判别函数的基本形式为g(x)=wgx+b。设分类面方程为,其中w是一个向量,该向量垂直于超平面,b称为超平面偏置。我们把能将两类样本准确区分,并且使得这两类样本之间的分类间隔最大的那个面称为最优分类面。求解最优分类面,实际上就是找到w和b的最优值,也就是在条件,i=1,....,n下,求解函数的最小化,即

(1)

在所有的样本里,如果该样本满足,且与分离线(平面)的垂直距离最小,则称之为支持向量。以上的讨论都是假设所有的样本是线性可分的情况下给出的。然而,在现实的应用中,很多数据都是非线性的。为了解决非线性问题,通过对公式(1)引入常数因子C和松弛因子,把每一个样本点通过函数转换到高维特征空间再对它们进行线性回归。则转换公式可以表示为:

其中,i=1,....,n

对公式(2)引入拉格朗日函数,把问题转化为对偶问题。在给定的约束条件和(i=1,....,n)下,对求解,即

(3)

其中为拉格朗日乘子。对公式(3)求解,结果为:

(4)

运用公式(4)即可求出样本x的类别。

本文采用径向基函数作为SVM模型的核函数:

(5)

从公式(2)和公式(5)可以看出,SVM模型的整体性能很大程度上由常数因子C和径向基函数的参数来决定。因此,为了能更好地选择这两个参数,我们引入具有全局搜索能力的GA算法对这两个参数进行优化,使得SVM模型具有更好的泛化能力和逼近精度。

(二)基于GA优化的SVM评价模型。GA算法是一种模拟生物进化过程的优化算法,在该算法中,问题的解空间用一种给定的编码来表示,求解问题的目标作为算法的适应度函数。GA算法在初始状态会随机产生一个编码群体,在这个群体之上通过选择算子、交叉算子以及变异算子完成整个算法的运算机制。经过算法的迭代,群体内的个体不断接近问题的最优解。

本文采用实数对GA算法进行编码,利用GA算法对SVM模型的常数因子C和径向基函数的参数进行优化的基本步骤如下:

Step1:问题的初始化。随机生成初始种群N,种群中染色体的编码由C和组成,算法的最大迭代数为,迭代变量k=0。

Step2:进行选择操作。群体内的每个染色体能否被选择参与下一轮的进化由选择算子决定:

(6)

其中,是染色体的适应度函数,本文采用MAPE的倒数作为适应度函数,×100%,为实值, 为预测值。

Step3:进行交叉操作。随机生成一个数rc=random[0,1],若rc

Step4:进行变异操作。变异操作的算法为: 。其中,V和V'分别是父染色体和子染色体,N(0,1)是高斯变量且均值为0、方差=0;Pm是变异概率;是染色体V的适应度函数。

Step5:当时,算法结束,输出最优的C和;否则,k=k+1,跳转到Step2。

(三)基于SVM的多分类器。从SVM模型的基本理论来看,它本身就是一个二分器,仅能解决两种不同类别的分类问题。然而,现实中需要解决的往往都是多分类的问题。有学者对基本的SVM模型进行了推广,使它能解决多种分类的问题。实现SVM模型多种分类的基本思路是:构造多个SVM的子分类器,每个子分类器都由两种不同类别的样本构成,样本的选择是随机的。对于一个有m个样本的集合,则可构造m(m-1)/2个子分类器。设有A和B两类样本组成的训练集,A集合的类别标记为正,反之B集合的类别标记为负。以此思想构造的SVM多分类器需要解决的优化问题是

公式(7)需要满足的条件为:

当获得子分类器后,就可以使用子分类器对样本数据进行测试。在测试的过程中,分别对m(m-1)/2个子分类器进行测试,并统计各个样本类别的分数,测试数据的类别即为测试过程中得分最高者所对应的类别。

二、高职学生综合素质评价体系构建

影响高职学生综合素质的因素很多,各因素之间的关系相互联系又互有影响,因此整个评价过程是一项复杂的系统工程。为建立规范、合理、科学的评价指标体系,必须坚持评价的多维化、评价主体的多元化、评价方法的多样性以及评价功能的多元化原则。当前,各高职院校对学生综合素质的评价也进行了多方面的探索,取得了很多经验。通过广泛查阅资料,在借鉴姚宏、叶宁《高职院校学生综合素质评价指标体系研究》一文的基础上,本文采用的学生综合素质评价体系如表1所示。

通过表1可以看到,影响学生综合素质的指标很多。在以往的评测中,大多采用发放调查问卷的形式收集相关数据,最后由辅导员对每个学生的信息进行统计,这种方法所得数据可用性差,在这里我们对所有的指标采取量化的方式进行数据的收集。首先对所有一级指标用A、B、C、D和E进行区分,每个二级指标都有相应的编号,实际使用的时候是一级指标的字母加上对应二级指标的编号。如:A1、A2等。每个二级指标的分值都是满分10分,每个一级指标都占总分值的20%,由此可知每一名学生的评价分值可以用如下公式来进行计算:综合素质评价总分=A×20%+B×20%+C×20%+D×20%+E×20%。每一项一级指标的分值都由它对应的二级指标来确定,比如C指标对应有6项二级指标,则C=(C1+C2+C3+C4+C5+C6)×100/60。评价的最终结果用Y来表示,总共分为优秀、良好以及差三个等级,为了便于SVM模型处理,这三个等级的分值分别是1、0和-1。参见表2。

三、具体应用

(一)数据采集。考虑到每个人主观性会造成在打分时存在不同程度的个人倾向,为了保证评价结果的科学性和权威性,采用教师和学生相结合,多人打分取平均值。具体做法是,按照表1的指标设计调查表,对柳州职业技术学院财经系2011级财会专业1班共43人进行评价测试。组织该班级的任课教师共5人对全班43名同学进行打分,学生则分为4组,每组11人,其中一组10人,每组同学互相打分。最终形成的数据如表3所示。

为了消除数据间的差异,使SVM模型具有更快的处理速度和处理精度,对采集到的所有样本进行归一化处理,归一化处理公式为:

(8)

(二)评价模型的具体应用。本实验在P4 2.8GCPU、2G内存的硬件条件下,在WinXp系统中采用matlab7进行编程实现。取前35笔数据作为训练样本,后8笔数据作为测试样本。实验中用到的部分参数为:种群规模N=200,交叉率Pc=0.75,变异率Pm=0.05 。通过对SVM参数的优化处理,最终建立SVM的综合素质评价模型。同时为了验证经过GA优化的SVM模型和未优化的SVM模型性能上的差别,后8笔测试数据分别采用GA-SVM模型和SVM模型进行测试,结果如表4、表5所示。

从表4、表5中可以看出,SVM模型和GA-SVM模型预测误差都控制在2%以内,说明它们在进行非线性数据预测中,预测精度很高。通过表4和表5的比较不难看出,通过GA优化后的SVM模型比未优化的SVM模型具有更好的泛化能力和预测精度。这是因为GA-SVM模型在GA算法的优化下,拓展了解的空间,在GA算法强大的全局搜索能力下得到了更优化的参数C和 ,从而获得更好的学习精度,提高了未知样本的预测率。

综上所述,学生综合素质是反映学校办学质量的一项重要指标,同时也是企业用人的一项重要指标。因而,对学生综合素质评价一直是当前高职院校改革和探索的问题。本文利用GA算法对SVM模型的参数进行了优化,并成功地应用于学生综合素质的评价。实验结果表明,优化后的SVM模型泛化能力更好、预测的准确率更高,具有一定的应用前景。

【参考文献】

[1]刘伟,孙林.基于支持向量机的课堂教学质量评价[J].合肥工业大学学报(自然科学版),2010(7)

[2]周燕军.基于遗传算法的学生综合素质评价[J].长江大学学报(自然科学版),2008(4)

[3]李波.支持向量机在高校教学质量评价中的应用研究[J].计算机仿真,2011(10)

[4]陈良堤,徐高欢.基于多分类SVM的教学质量评价模型研究[J].黑龙江教育,2007( 11)

[5]姚宏,叶宁.高职院校学生综合素质评价指标体系研究[J]. 四川教育学院学报,2011(12)

[6]朱海林,宋承祥,刘弘,等.基于支持向量机的教学质量评价研究[J].山东师范大学学报(自然科学版),2008(4)

【基金项目】广西教育科学“十二五”规划课题 (2011C0187)

【作者简介】王 静(1980- ),女,江苏南京人,柳州职业技术学院财经与物流系讲师,研究方向:思政教育、职业技术教育。

(责编 卢 雯)

当获得子分类器后,就可以使用子分类器对样本数据进行测试。在测试的过程中,分别对m(m-1)/2个子分类器进行测试,并统计各个样本类别的分数,测试数据的类别即为测试过程中得分最高者所对应的类别。

二、高职学生综合素质评价体系构建

影响高职学生综合素质的因素很多,各因素之间的关系相互联系又互有影响,因此整个评价过程是一项复杂的系统工程。为建立规范、合理、科学的评价指标体系,必须坚持评价的多维化、评价主体的多元化、评价方法的多样性以及评价功能的多元化原则。当前,各高职院校对学生综合素质的评价也进行了多方面的探索,取得了很多经验。通过广泛查阅资料,在借鉴姚宏、叶宁《高职院校学生综合素质评价指标体系研究》一文的基础上,本文采用的学生综合素质评价体系如表1所示。

通过表1可以看到,影响学生综合素质的指标很多。在以往的评测中,大多采用发放调查问卷的形式收集相关数据,最后由辅导员对每个学生的信息进行统计,这种方法所得数据可用性差,在这里我们对所有的指标采取量化的方式进行数据的收集。首先对所有一级指标用A、B、C、D和E进行区分,每个二级指标都有相应的编号,实际使用的时候是一级指标的字母加上对应二级指标的编号。如:A1、A2等。每个二级指标的分值都是满分10分,每个一级指标都占总分值的20%,由此可知每一名学生的评价分值可以用如下公式来进行计算:综合素质评价总分=A×20%+B×20%+C×20%+D×20%+E×20%。每一项一级指标的分值都由它对应的二级指标来确定,比如C指标对应有6项二级指标,则C=(C1+C2+C3+C4+C5+C6)×100/60。评价的最终结果用Y来表示,总共分为优秀、良好以及差三个等级,为了便于SVM模型处理,这三个等级的分值分别是1、0和-1。参见表2。

三、具体应用

(一)数据采集。考虑到每个人主观性会造成在打分时存在不同程度的个人倾向,为了保证评价结果的科学性和权威性,采用教师和学生相结合,多人打分取平均值。具体做法是,按照表1的指标设计调查表,对柳州职业技术学院财经系2011级财会专业1班共43人进行评价测试。组织该班级的任课教师共5人对全班43名同学进行打分,学生则分为4组,每组11人,其中一组10人,每组同学互相打分。最终形成的数据如表3所示。

为了消除数据间的差异,使SVM模型具有更快的处理速度和处理精度,对采集到的所有样本进行归一化处理,归一化处理公式为:

(8)

(二)评价模型的具体应用。本实验在P4 2.8GCPU、2G内存的硬件条件下,在WinXp系统中采用matlab7进行编程实现。取前35笔数据作为训练样本,后8笔数据作为测试样本。实验中用到的部分参数为:种群规模N=200,交叉率Pc=0.75,变异率Pm=0.05 。通过对SVM参数的优化处理,最终建立SVM的综合素质评价模型。同时为了验证经过GA优化的SVM模型和未优化的SVM模型性能上的差别,后8笔测试数据分别采用GA-SVM模型和SVM模型进行测试,结果如表4、表5所示。

从表4、表5中可以看出,SVM模型和GA-SVM模型预测误差都控制在2%以内,说明它们在进行非线性数据预测中,预测精度很高。通过表4和表5的比较不难看出,通过GA优化后的SVM模型比未优化的SVM模型具有更好的泛化能力和预测精度。这是因为GA-SVM模型在GA算法的优化下,拓展了解的空间,在GA算法强大的全局搜索能力下得到了更优化的参数C和 ,从而获得更好的学习精度,提高了未知样本的预测率。

综上所述,学生综合素质是反映学校办学质量的一项重要指标,同时也是企业用人的一项重要指标。因而,对学生综合素质评价一直是当前高职院校改革和探索的问题。本文利用GA算法对SVM模型的参数进行了优化,并成功地应用于学生综合素质的评价。实验结果表明,优化后的SVM模型泛化能力更好、预测的准确率更高,具有一定的应用前景。

【参考文献】

[1]刘伟,孙林.基于支持向量机的课堂教学质量评价[J].合肥工业大学学报(自然科学版),2010(7)

[2]周燕军.基于遗传算法的学生综合素质评价[J].长江大学学报(自然科学版),2008(4)

[3]李波.支持向量机在高校教学质量评价中的应用研究[J].计算机仿真,2011(10)

[4]陈良堤,徐高欢.基于多分类SVM的教学质量评价模型研究[J].黑龙江教育,2007( 11)

[5]姚宏,叶宁.高职院校学生综合素质评价指标体系研究[J]. 四川教育学院学报,2011(12)

[6]朱海林,宋承祥,刘弘,等.基于支持向量机的教学质量评价研究[J].山东师范大学学报(自然科学版),2008(4)

【基金项目】广西教育科学“十二五”规划课题 (2011C0187)

【作者简介】王 静(1980- ),女,江苏南京人,柳州职业技术学院财经与物流系讲师,研究方向:思政教育、职业技术教育。

(责编 卢 雯)

当获得子分类器后,就可以使用子分类器对样本数据进行测试。在测试的过程中,分别对m(m-1)/2个子分类器进行测试,并统计各个样本类别的分数,测试数据的类别即为测试过程中得分最高者所对应的类别。

二、高职学生综合素质评价体系构建

影响高职学生综合素质的因素很多,各因素之间的关系相互联系又互有影响,因此整个评价过程是一项复杂的系统工程。为建立规范、合理、科学的评价指标体系,必须坚持评价的多维化、评价主体的多元化、评价方法的多样性以及评价功能的多元化原则。当前,各高职院校对学生综合素质的评价也进行了多方面的探索,取得了很多经验。通过广泛查阅资料,在借鉴姚宏、叶宁《高职院校学生综合素质评价指标体系研究》一文的基础上,本文采用的学生综合素质评价体系如表1所示。

通过表1可以看到,影响学生综合素质的指标很多。在以往的评测中,大多采用发放调查问卷的形式收集相关数据,最后由辅导员对每个学生的信息进行统计,这种方法所得数据可用性差,在这里我们对所有的指标采取量化的方式进行数据的收集。首先对所有一级指标用A、B、C、D和E进行区分,每个二级指标都有相应的编号,实际使用的时候是一级指标的字母加上对应二级指标的编号。如:A1、A2等。每个二级指标的分值都是满分10分,每个一级指标都占总分值的20%,由此可知每一名学生的评价分值可以用如下公式来进行计算:综合素质评价总分=A×20%+B×20%+C×20%+D×20%+E×20%。每一项一级指标的分值都由它对应的二级指标来确定,比如C指标对应有6项二级指标,则C=(C1+C2+C3+C4+C5+C6)×100/60。评价的最终结果用Y来表示,总共分为优秀、良好以及差三个等级,为了便于SVM模型处理,这三个等级的分值分别是1、0和-1。参见表2。

三、具体应用

(一)数据采集。考虑到每个人主观性会造成在打分时存在不同程度的个人倾向,为了保证评价结果的科学性和权威性,采用教师和学生相结合,多人打分取平均值。具体做法是,按照表1的指标设计调查表,对柳州职业技术学院财经系2011级财会专业1班共43人进行评价测试。组织该班级的任课教师共5人对全班43名同学进行打分,学生则分为4组,每组11人,其中一组10人,每组同学互相打分。最终形成的数据如表3所示。

为了消除数据间的差异,使SVM模型具有更快的处理速度和处理精度,对采集到的所有样本进行归一化处理,归一化处理公式为:

(8)

(二)评价模型的具体应用。本实验在P4 2.8GCPU、2G内存的硬件条件下,在WinXp系统中采用matlab7进行编程实现。取前35笔数据作为训练样本,后8笔数据作为测试样本。实验中用到的部分参数为:种群规模N=200,交叉率Pc=0.75,变异率Pm=0.05 。通过对SVM参数的优化处理,最终建立SVM的综合素质评价模型。同时为了验证经过GA优化的SVM模型和未优化的SVM模型性能上的差别,后8笔测试数据分别采用GA-SVM模型和SVM模型进行测试,结果如表4、表5所示。

从表4、表5中可以看出,SVM模型和GA-SVM模型预测误差都控制在2%以内,说明它们在进行非线性数据预测中,预测精度很高。通过表4和表5的比较不难看出,通过GA优化后的SVM模型比未优化的SVM模型具有更好的泛化能力和预测精度。这是因为GA-SVM模型在GA算法的优化下,拓展了解的空间,在GA算法强大的全局搜索能力下得到了更优化的参数C和 ,从而获得更好的学习精度,提高了未知样本的预测率。

综上所述,学生综合素质是反映学校办学质量的一项重要指标,同时也是企业用人的一项重要指标。因而,对学生综合素质评价一直是当前高职院校改革和探索的问题。本文利用GA算法对SVM模型的参数进行了优化,并成功地应用于学生综合素质的评价。实验结果表明,优化后的SVM模型泛化能力更好、预测的准确率更高,具有一定的应用前景。

【参考文献】

[1]刘伟,孙林.基于支持向量机的课堂教学质量评价[J].合肥工业大学学报(自然科学版),2010(7)

[2]周燕军.基于遗传算法的学生综合素质评价[J].长江大学学报(自然科学版),2008(4)

[3]李波.支持向量机在高校教学质量评价中的应用研究[J].计算机仿真,2011(10)

[4]陈良堤,徐高欢.基于多分类SVM的教学质量评价模型研究[J].黑龙江教育,2007( 11)

[5]姚宏,叶宁.高职院校学生综合素质评价指标体系研究[J]. 四川教育学院学报,2011(12)

[6]朱海林,宋承祥,刘弘,等.基于支持向量机的教学质量评价研究[J].山东师范大学学报(自然科学版),2008(4)

【基金项目】广西教育科学“十二五”规划课题 (2011C0187)

【作者简介】王 静(1980- ),女,江苏南京人,柳州职业技术学院财经与物流系讲师,研究方向:思政教育、职业技术教育。

(责编 卢 雯)

猜你喜欢
综合素质评价
小学生综合素质评价存在的问题及改进措施
电子平台为评价信度“保驾”
普通高中综合素质评价中“写实记录”的功能与操作
普通高中综合素质评价中“写实记录”的功能与操作
“综合素质评价”改革朝哪里去?
中小学综合素质评价的价值取向和育人导向探析
新课程小学生评价工具设计与应用撷谈
高考改革且变且思且行
学生综合素质评价有效实施策略