对不同学校类别教育经费投资问题的主成分分析

2014-05-30 21:26孙梦野
新校园·上旬刊 2014年4期
关键词:主成分分析教育

孙梦野

摘 要:21世纪是知识经济的时代,教育在推动国家经济发展中占有重要的战略地位。本文根据我国各地区教育经费投资的特点,利用R软件对不同学校类别教育经费的投资进行主成分分析,初步建立了一套以5个变量为指标的教育投资发展评价体系,从总体上为我国教育投资提供了一定的参考价值。

关键词:教育;R软件;主成分分析

一、主成分分析法

主成分分析(Principal Component Analysis,PCA)也称主分量分析或矩阵数据分析,是统计分析常用的一种重要方法,是一种将数据集简化的技术,在系统评价、质量管理和发展对策等许多方面都有应用。主成分分析法利用降维的统计原理,将多指标转化为少数几个综合指标的统计分析方法,这些主成分能够反映原始变量的大部分信息,通常情况下它们表示为原始变量的线性组合。

二、主成分分析法思想

主成分分析的基本思想:设x=(x1,x2,……,xp)是一个P维随机向量,其二阶矩存在,记E(X)=L,D(X)=,选取常数向量I,在Ii′Ii=1,i=1,2,……P的条件下,考虑它的线性变换:

Y1=I′1X=i11X1+…+i1pXp

Y2=I′2X=i12X1+…+i2pXp

YP=I′PX=iPPX1+…+iPPXp

如果用Y1来代替原来的P个变量x1,x2,…,xp就要求Y1尽可能多地反映原来P个变量的信息,由理论知道Var(Y1)越大表示包含的信息越多。如果一个主成分不能够完全代表原P个变量的信息,可以采用Y2,若想有效地代表原变量的信息,原来的Y1的信息就没有必要出现在Y2中,也就是Cov(Y1,Y2)=0。求Y2就是在约束条件下求I2,使得Var(Y2)达到极大,所求得的Y2称为第二主成分。同理可以定义第三主成分、第四主成分。为第i个主成分Yi(i=1,2,…P)的贡献率,它的大小可以反映了x1,x2,…,xp的信息多少。使用主成分分析的目的就是为了减少变量的个数,因此一般不用P个主成分,而是根据问题的需要用m(

三、结果分析

选取的教育经费的指标为:x1为国家财政性教育经费,x2为预算内教育经费,x3为民办学校教育经费,x4为社会捐赠经费,x5为事业收入。利用R软件分析,结果如下:从表1可以看出,第一主成分特征值大于1,第一、二、三主成分的方差贡献率分别为67.21%,24.71%,6.9%,前三个主成分的累积方差贡献率为98.85%,大于85%,已包含全部信息的绝大部分,因而可以用彼此不相关的3个综合指标Y1,Y2,Y3代替原有的7个指标的信息。

表1 主成分特征值、方差贡献率、累计方差贡献率表

[Component&Standard deviation&Proportion of Variance&CumulativeProportion&1&2.3421544&0.7836696&0.7836696&2&0.9251628&0.1222752&0.9059448&3&0.60549516&0.05237491&0.95831969&4&0.4675298&0.0312263&0.9895460&5&0.263739449&0.009936928&0.999482920&]

表2 因子系數

[&Comp.1&Comp.2&Comp.3&Comp.4&Comp.5&x1&0.409&&0.433&-0.192&0.293&x2&0.405&&0.451&-0.216&0.318&x3&0.287&0.698&-0.581&&0.301&x4&0.346&-0.451&-0.432&-0.666&-0.197&x5&0.420&&&0.183&-0.491&]

根据5个指标的系数(表2),可以得到以下结果:

Y1=-0.338x1-0.337x2-0.337x3-0.418x4-0.399x5

Y2=0.513x1+0.514x2-0.189x3+0.292x4-367x5

Y3=0.911x3-0.186x5

第一主成分Y1对应系数的符号都为负,其值在-0.419~-0.337之间,说明各类学校教育经费投资情况不是很好,但也有一定的发展。

第二主成分Y2对应系数有正有负,说明有某些不确定的因素对教育经费的投资产生了影响。

第三主成分Y3对应系数有正有负,说明某些不确定的因素对教育经费的投资产生了影响。

参考文献:

[1]李艳双,曾珍香,张闽,于树江.主成分分析法在多指标综合评价方法中的应用[J].河北工业大学学报,1999,28(2):94-97.

[2]白奕.多指标综合评价的主成分分析模型及原理[J].陕西师范大学学报(自然科学版),1998,26(2):105-106.

[3]吴国富,安万福,刘景海.使用数据分析方法[M].北京:中国统计出版社,1992.

[4]薛毅.数学建模基础[M].北京:北京工业大学出版社,2004.

[5]秦宛顺.教育投资决策研究[M].北京:北京大学出版社,1992.

猜你喜欢
主成分分析教育
国外教育奇趣
题解教育『三问』
软件工程教育与教学改革
什么是“好的教育”?
教育有道——关于闽派教育的一点思考
办好人民满意的首都教育
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用