张淑丽
本文利用因子分析的结果再通过主成分分析对所选指标进行综合评价时,主要是将原有的信息进行综合,然后根据各变量的方差贡献率大小来给主成分赋权,因为方差贡献率反映了各个主成分信息含量的多少。最后,将各地区的最终所得分数进行比较排序。
一、因子分析
首先,利用因子分析对表示我国各地区的基本经济状况个指标进行信息提炼,选取的指标有:X1:人均GDP(单位:元),X2:固定资产投资总额(单位:亿元),X3:在岗职工人均工资额(单位:元),X4:地方政策预算内收入(单位:亿元),X5:城乡居民年底储蓄余额(单位:亿元),X6:工业总产值(单位:亿元),X7:客运量(单位:万人),X8:货运量(单位:万吨)。首先利用SPSS软件分析各因子的共同度,得到如下结果表明:变量共同度反映每个变量对提取出的所有公共因子的依赖度,从表中可以已看出,除了客运量外的其他7个变量的变量共同度都达到了80%甚至90%以上,说明提取的因子应经包含了原始变量的大部分信息,因子提取的效果是比较理想的。
继续用SPSS得到因子的碎石图,得到:前2个因子的特征根普遍较高,而从第3个因子开始之后的特征根普遍较低,连接成了平缓的折线,这说明提取两个因子是比较适当的。
从表-1中看出,每个因子在不同原始变量上的载荷没有明显的差别,为了提取公共因子,便于对公因子进行命名,需要对因子载荷进行旋转。旋转方法采用方差最大旋转法,旋转后结果如见表-1:可以看出经过旋转后的载荷系数已经明显地两级分化了。第一个公因子在X1、X2、X3、X4、X5、X6、X7上有较大的载荷,说明这七个指标有较强的相关性,可以归为一类,因此命名因子1为“社会因子”;第二个公共因子在X3上有较大的载荷,因此命名为“工资水平因子”。根据该表可以写出每个原始变量的因子表达式:
X1=0.988F1+0.079F2;X2=0.917F1-0.232F2;X3=0.013F1+0.966F2;
X4=0.903F1+0.389F2;X5=0.930F1+0.272F2;X6=0.963F1+0.093F2;
X7=0.885F1-0.037F2;X8=0.845F1-0.318F2。
根据软件分析得到因子得分系数矩阵,根据表中的因子得分系数和原始变量标准化值就可以计算每个观测值的各因子的得分。则可表示成:
F1=0.166X1+0.164X2-0.031X3+0.140X4+0.149X5+0.161X6+0.152X7+0.155X8
F2=0.026X1-0.208X2+0.733X3+0.264X4+0.174X5+0.037X6-0.059X7-0.271X8
注:其中是原始变量标准化后的数据。
二、主成分分析:
根据因子分析得出因子载荷阵,其中兩个变量分别命名为a1、a2,经过计算得到变量的特征向量z1、z2,根据结果可得主成分的表达式:
根据所得的主成分可得综合得分的计算公式为:
根据上式计算全国31个地区的基本经济状况的综合得分,并可据此排序,得到结果表明:上海、北京地区的综合得分排在第一,而且从两个主成分因子中也可以看出上海地区存在显著地优势,从第3-9名中的地区,明显和前两名有差异,其余的归为一类,显然这三类地区之间的基本经济状况有着明显差异。
三、结论
通过因子分析和主成分分析对各地区的基本经经济状况进行综合评价和排序后,我们不难发现上海、北京等地相对于其他地区有绝对优势,西藏、天津、广东、浙江、江苏、宁夏、青海等地区分布在第二类,其余的省市均分布在第三类。从表-6中,比较综合排序和平均工资排名,不难发现各地区基本经济状况和在岗职工平均工资水平密切相关。一般的,我们都认为西藏、青海等地是欠发达地区,但可能由于人口密度小、就业人数占人口比例小等因素,导致分析结果与一般观念的不同。总体来看,我们应该从教育、人民生活基本状况等基础方面对基本经济状况较差的地区进行提高。