高小明
(闽南理工学院,福建 泉州 362700)
应用主成分分析对学生综合素质进行评价
高小明
(闽南理工学院,福建 泉州 362700)
运用主成分分析方法,对高校学生的综合素质进行评价。避免传统方法在综合评价中对指标的主观选择及对权重的主观判断,使权重的分配更合理,尽可能地减少重叠信息的不良影响,克服变量之间的多重相关性,简化系统分析。
主成分分析;综合素质;评价
高校在对学生的综合素质进行评价时,传统的做法是从现有的指标中精选出若干个有代表性的指标,但人为地精选指标难免带有主观随意性,可能丢失部分有价值的原始信息。
而利用主成分分析法对多维变量进行降维,降维后的变量是原变量的线性组合,并能反映原变量绝大部分的信息,使信息量损失最小,对原变量的综合解释能力强。该方法通过主成分的方差贡献率来表示变量的作用,可避免在系统分析中对权重的主观判断,使权重的分配更合理,尽可能地减少重叠信息的不良影响,克服变量之间的多重相关性,简化系统分析。
从实际的运行结果来看,应用主成分分析法对高校学生的综合素质进行评价总体上是合理的,这能为大学生在校期间创造一个相对公平的育人环境,因此是有积极意义的。
1.1 什么是主成分分析
在实际问题中,研究多指标(变量)问题是经常遇到的,在很多情况下,不同的指标之间具有一定的相关性。由于指标较多并且指标之间有一定的相关性,增加了分析问题的复杂性。主成分分析就是将原指标重新组成一组新的相互无关的综合指标以代替原指标,同时根据实际需要从中可取几个较少的综合指标尽可能多地反映指标的统计方法叫做主成分分析或主分量分析。
将原来p个指标作线性组合,作为新的综合指标,然后从中选取若干个,准则如下:用Fi(i=1,2,…)表示综合指标,选择其中方差最大的(方差越大包含的信息越多)那个综合指标作为第一个综合指标,标记为 F1,称为第一主成分,即Var(F1)最大。如果第一主成分不足以代表原来p个指标的信息,再考虑选取第二个综合指标,为了有效反映原来信息,F1已有的信息就不需要出现在F2中,用数学语言表达就是Cov(F1,F2)=0,称F2为第二主成分,依此类推可以构造出第三、四,…,第p个主成分,虽然这样做会损失一部分信息,但是由于它使我们抓住了主要矛盾,并从原始数据中进一步提取了某些新的信息,因而在某些实际问题的研究中得益比损失大。
2.2 主成分分析法及其主要研究思路
由提供的信息得到原始资料矩阵:
表示矩阵X的列向量,为简单计,不妨设X1,…,XP已经过标准化。
原始数据来源:漳州师范学院**级数学与应用数学专业本科班37位同学2003-2004学年各门课程的成绩。(成绩见附录一)
该学年该班同学共修了10门课程,每位同学均有成绩,即没有缺失值。具体的指标为:X1:高等代数,X2:数学分析1,X3:C语言,X4:英语1,X5:心理学,X6:邓小平理论, X7:英语2,X8:常微分,X9:近世代数,X10:数学分析2。
3.1 标准化
一般情况下,进行主成分分析,由于原始数据各指标的量纲不同,分析时需进行标准化处理,具体步骤是:
(1)中心化
(2)标准化
3.1 建立相关系数阵,求特征值和单位特征向量
表1
对表1的分析:表1中的主成分的特征值与方差贡献率都是按从大到小排列,4个主成分可以解释所有变量总方差的85.89%,这意味着在新的指标体系中4个指标就可以反映样本差异的85.89%。
表2
对表2的分析:根据表2提供的数据可建立主成分Fi的线性表达式
第一主成分是专业素质变量,包括高等代数,数学分析1,常微分,近世代数,数学分析 2,这也是数学专业学生学习的主要专业课,从评价这个传导机制上给予正确引导。第二主成分是人文素质变量,包括C语言,英语1,英语2。这是学生学习专业课程必不可缺的基础内容。第三主成分是思想道德素质,即邓小平理论。第四主成分是身心素质,即心理学。
按照各主成分的线性表达式计算出具体得分,以各主成分的方差贡献率为权重系数,计算出每个学生的综合得分,进行排名,排名的结果是:
名次 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19座号29 4 37 25 12 6 2 22 7 21 17 3 18 11 14 10 19 16 5名次 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37座号 28 20 26 15 35 8 13 34 1 23 27 9 30 36 32 24 31 33
最终的评价结果总体上是符合实际情况的。因此主成分分析法是一种科学,简便的评价方法。
附录一
[1] 阎慈琳. 关于主成分分析做综合评价的若干问题[J]. 数理统计与管理,1998,(2).
[2] 黄宁. 关于主成分分析应用的思考[J]. 数理统计与管理,1999,(5).
[3] 张祟甫,陈述云. 成分数据主成分分析及其应用[J]. 数理统计与管理,1996,(4).
[4] 方开泰. 实用多元统计分析[M]. 上海:华东师范大学出版社,1986.
Use the Principal Component Analysis to Evaluate College Students’ Comprehensive Qualities
GAO Xiao-ming
In conventional synthetic evaluation, we choose index and judge weight coefficient subjectively, in this paper we use the principal component analysis to evaluate college students’ comprehensive qualities, so the distribution of weight coefficient is more rational, and we can reduce the vicious influence of overlapping information as much as possible, overcome relevant between variances, simplify the systematic analysis .
Principal component analysis; Comprehensive qualities; Evaluation
O212.4
A
1008-7427(2012)05-0113-02
2012-03-08