【摘要】本文运用23个重要指标来量化我国31个省市经济社会发展综合水平,通过对数据的分析揭示发展现状和存在的问题。首先运用因子分析方法得到了反映各地经济社会发展水平的四个因子:生活美好程度因子、发展潜力衡量因子、经济及科技进步因子和生活与经济可持续发展因子;之后从地区间发展差距、可持续发展与人口控制等方面分析了目前各地发展情况并提出建议。研究结果较全面地展示了各地发展综合水平,得到了因子得分排名与综合因子得分排名,对明确经济发展阶段、掌握当前发展的优点和不足有积极意义。
【关键词】经济社会发展水平因子分析
一、研究背景及问题的提出
(一)研究背景
党的十七大以来,我国各项事业全面发展,发展协调性日益增强,经济社会实现又好又快发展。在十八大召开之际,本文希望利用23个能够基本反映我国经济、社会、生活质量、收入与消费等情况的指标来量化我国31个省市社会经济发展建设情况。相信建立科学的评价体系,对于各地把握自身社会经济状况,了解发展优势和不足之处、明确与国内其他地区的差距有良好作用。
(二)问题的提出
在综合评价各个地区社会经济发展之前,需要围绕以下几个问题展开讨论:
1. 如何构造评价指标体系。由于单一指标只能反映经济社会的某一个方面,为反映经济全貌就必须构造指标体系,这就必须充分考虑应该选择哪些指标及选择的角度。体系构造将会直接影响到评价结果的准确性和科学性。
2. 如何选择综合评价方法。不同的指标在不同的地区之间各有长短,可能导致在进行对比分析时难以直接得出结论。因此,在确定评价指标体系后,还需要选择科学的综合评价方法以把分散的个别指标综合在一个高度概括的指标中,用它来评价一地的综合发展、建设水平,并据此做出总体性的判断。
3. 如何具体实现综合评价过程。由于给定评价过程一般比较复杂,尤其是当评价对象的范围较大、评价指标较多时更是如此。所以在确定了评价指标体系及综合评价方法后,还需要考虑应以何种手段实现。
4. 如何对结论进行分析和说明,即如何借助相关统计理论知识对综合评价结论进行分析和说明的问题,比如,对于因子分析方法,应该如何解释因子的含义及综合得分的含义等。
二、本文使用的统计方法简介
在本文的分析中主要使用到因子分析方法。
(一)因子分析的思想
人们在对现象进行观测时,往往会得到大量指标(变量)的观测数据,这些数据在带来信息的同时,也给数据的分析带来了一定困难;另外,这众多的变量之间可能存在着相关性,实测到的数据包含的信息有一部分可能是重复的。因子分析法就是在尽可能不损失信息或者少损失信息的情况下,将多个变量减少为少数几个潜在的因子,这几个因子可以高度地概括大量数据中的信息。这样既减少了变量个数,又同样地能再现变量之间的内在联系。本文基于因子分析的思想,根据各指标相关性大小将它们分组,使得同组内的指标之间相关性较高,不同组的变量之间的相关性较低,通过对相关矩阵内部结构关系的研究,找出影响城市经济发展状况的几个综合指标,称之为主因子。以主因子为评价指标体系,进行综合评价与分析。
(二)因子分析的数学模型
用p个经济指标变量x1、x2、x3、…、xp对某个经济系统进行评价。在p个经济变量中,每个变量都含有该经济系统的m个方面,这m个方面称为p个经济变量的公因子。而在每个经济变量中m 个公因子不能说明的方面称为该经济变量的特殊因子。因子分析的模型为:
(1)
其中μi为xi的平均值,fi为公因子,εi为特殊因子(i=1,2,…,p),它们都是不可观测的随机变量。公因子出现在每一个经济变量xi的表达式中,可理解为每个经济变量共同具有的公共因素。每个公因子 (至少对两个经济变量有作用,否则它将归入特殊因子。每个特殊因子)仅仅出现在与之相应的第i个经济变量的表达式中,它只对这个经济变量有作用,称为第i个变量在第j 个公因子上的载荷,即第i个经济变量能说明经济系统第j个方面的程度。
(三)因子分析法的步骤
1.建立关于指标体系的原始矩阵Z;
2.原始数据标准化,得到标准化矩阵X;
3.计算X的相关系数矩阵R;
4.解出特征方程|R-λE|=0,计算相关矩阵的特征值λi,若,则根据方差累计贡献率(一般取值在85%以上)确定因子P的个数;
5.计算特征向量和初始因子载荷矩阵A;
6.找出因子载荷系数绝对值大于0.4的量。在某个因子上的得分,就等于把所有载荷的系数绝对值大于0.4的变量的观测数据(标准化)与对应因子载荷的乘积的代数和;
7.如果因子意义不明显,不妨对初始因子进行旋转,一般采用方差极大(Varimax)旋转,得到旋转后的主因子解B;
8.构造主因子得分和综合因子得分;
9.根据主因子和综合因子得分情况,给出相应的评价。
(四)因子分析法的特点
首先,因子分析法通过对原始变量的标准化处理和数字变换,消除了指标间的相互影响,消除了由于指标分布不同,数值本身差异造成的不可比。从数据源头保证了评价的质量。
第二,因子分析法能将构成指标体系的众多原始所载信息浓缩并转存到因子中,并可根据实际问题所需要求的精度,通过对主因子数目的控制,调转存信息量的大小。
第三,因子分析法进行综合评价,可以估计出评价结果的准确程度及误差大小,通过对主因子的确定可以找出影响各单位经济效益的主要方面及提高经济效益的对策取向。
第四,因子分析法科学性强,其数据处理全过程的电算化,可以方便地得出客观的评价结果,从而易于抓住主要矛盾,达到对事物的认识,以更好地支持决策,同时也大大提高了评价本身的效率。
三、我国31省市社会经济发展建设综合水平的因子分析
(一)指标及数据的建立
根据2011年中国统计年鉴,本文利用因子分析法综合评价我国31省市2010年社会经济发展的综合水平,采用的指标体系是根据社会发展和现代化的内涵,参照美国社会学家英格尔斯提出的十个现代化指标,并根据我国具体情况确定的,基本能够全面反映社会发展进步的各个方面,突出反映了以人为本的全面发展,也反映发展与人口的增长有密切的关系。具体指标如表一所示。
表1 我国31省市社会经济发展建设综合水平评价指标体系
指标代码 具体指标内容 指标代码 具体指标内容
X1 人均GDP(万元) X13 互联网普及率(%)
X2 人均全社会固定资产投资(万元) X14 预期寿命(2000年数据)
X3 电力消费量占发电装机容量比(%) X15 初中及以上文化水平比例(%)
X4 单位地区生产总值能耗(等价值) (吨标准煤/万元) X16 失业率(%)
X5 第三产业产值占总产值比重(%) X17 生活垃圾无害化处理率(%)
X6 人均资本形成总额(万元) X18 按地区分大中型工业企业研究与试验发展经费(万元)
X7 货物进出口总额(万美元) X19 “三废”综合利用产品产值占GDP比重(%)
X8 城镇居民平均每人全年家庭收入(元) X20 万人专利授权数(个)
X9 城镇居民家庭平均每人全年消费性支出(元) X21 人均城市绿地面积(公顷/万人)
X10 农村居民家庭人均纯收入(元) X22 有线广播电视入户率(%)
X11 人均人民币储蓄存款(万元) X23 每千人口医疗卫生机构床位(个)
X12 人口自然增长率(‰)
(二)数据处理
数据的中心标准化由SPSS自动完成。按照上述因子分析法的步骤,首先看对数据进行因子分析是否合适。在表一看到,KMO检验与Bartlett's Test检验的结果均表明本文采用的数据完全可以进行因子分析。
表2 KMO检验与巴氏球检验结果
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .734
Bartlett's Test of Sphericity Approx. Chi-Square 918.442
df 253
Sig. .000
表3 各指标的特征值与方差比
Total Variance Explained
Component Initial Eigenvalues Extraction Sums of Squared Loadings
Total % of Variance Cumulative % Total % of Variance Cumulative %
1 13.23 57.53 57.53 13.23 57.53 57.53
2 2.27 9.85 67.38 2.27 9.85 67.38
3 1.65 7.17 74.55 1.65 7.17 74.55
4 1.47 6.41 80.96 1.47 6.41 80.96
5 0.98 4.25 85.22
6 0.92 4.00 89.22
7 0.67 2.89 92.11
8 0.54 2.34 94.45
9 0.35 1.51 95.96
10 0.25 1.10 97.06
11 0.15 0.65 97.71
12 0.14 0.61 98.32
13 0.08 0.36 98.68
14 0.08 0.36 99.03
15 0.07 0.32 99.35
16 0.05 0.22 99.57
17 0.04 0.16 99.73
18 0.03 0.11 99.84
19 0.02 0.07 99.91
20 0.01 0.05 99.96
21 0.00 0.02 99.98
22 0.00 0.01 99.99
23 0.00 0.01 100.00
Extraction Method: Principal Component Analysis.
从表三和图一的结果可见,前四个特征值的累计贡献率为81%,大于80%。因此这里可以选择四个公共因子。为了使公因子的意义更清晰,先对因子载荷矩阵进行方差最大旋转变换,表四是旋转后的因子载荷矩阵。
表4 旋转后的因子载荷矩阵
Rotated Component Matrix(a)
Component
1 2 3 4
X1 0.558 0.694 0.380 0.185
X2 0.886
X3 0.788 0.257 0.260
X4 -0.186 -0.179 -0.700 0.142
X5 0.931 0.132 0.131
X6 0.271 0.848 0.224
X7 0.422 0.814
X8 0.618 0.420 0.541 0.342
X9 0.615 0.446 0.519 0.229
X10 0.618 0.517 0.495 0.189
X11 0.836 0.449 0.246
X12 -0.770 -0.219 0.224
X13 0.687 0.468 0.431 0.102
X14 0.418 0.565 0.549 -0.133
X15 0.469 0.647 0.309 -0.357
X16 -0.642 0.177 -0.305
X17 0.209 0.139 0.782
X18 0.892 0.101
X19 -0.475 -0.321 0.552
X20 0.531 0.323 0.631 0.338
X21 0.621 0.376 -0.206
X22 0.567 0.527 0.523 0.214
X23 0.698 0.589
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
aRotation converged in 9 iterations.
从表四中可以看出,在第一公共因子中,指标X3,X5,X8,X9,X10,X11,X13,X16,X21、X22和X23负荷相对较大,它们分别代表了电力消费量占发电装机容量比、第三产业产值占总产值比重、城镇居民平均每人全年家庭收入、城镇居民家庭平均每人全年消费性支出、农村居民家庭人均纯收入、人均人民币储蓄存款、互联网普及率、失业率、人均城市绿地面积、有线广播电视入户率和每千人口医疗卫生机构床位,这些变量与人民实际享有的生活水平与生活质量有密切关系,于是我们可以将第一公因子命名为“生活美好程度因子”。
在第二个公因子中,指标X12、X13、X14、X15、X16、X17、X18负荷相对较大,它们分别代表了当地的人均GDP、固定资产投资占财政一般支出与公共支出的比、人均资本形成总额、人口自然增长率、初中及以上文化水平比例。这些变量与经济发展的后劲与潜力有密切关联,我们将第二个公因子命名为“发展潜力衡量因子”。
在第三个公因子中,指标X4、X7、X14、X18和X20负荷相对较大。它们分别代表了单位地区生产总值能耗(等价值)、货物进出口总额、2000年预期寿命、按地区分大中型工业企业研究与试验发展(R&D)经费、万人专利授权数。可将其命名为“经济及科技进步因子”。
在第四个公因子中,X17、X19负荷相对很大。它代表了生活垃圾无害化处理率和“三废”综合利用产品产值占GDP比重。可将该公因子直接命名为“生活与经济可持续发展因子”。
综上所述,某一地区的社会经济发展建设水平,可以综合地概括为表现在生活美好程度因子、发展潜力衡量因子、经济及科技进步因子和生活与经济可持续发展因子四个方面。
表5 因子得分系数
Component Score Coefficient Matrix
Component
1 2 3 4
X1 0.004 0.123 -0.007 0.075
X2 -0.141 0.301 -0.066 0.060
X3 0.189 -0.060 -0.068 -0.009
X4 0.105 0.018 -0.277 0.148
X5 0.299 -0.114 -0.180 0.054
X6 -0.057 0.248 -0.114 0.132
X7 -0.022 -0.122 0.273 -0.016
X8 0.033 0.006 0.061 0.160
X9 0.036 0.017 0.058 0.090
X10 0.031 0.043 0.045 0.067
X11 0.176 0.001 -0.101 0.012
X12 0.167 -0.253 -0.061 0.159
X13 0.080 0.019 0.011 0.015
X14 -0.053 0.089 0.132 -0.136
X15 0.007 0.126 0.024 -0.261
X16 -0.201 0.190 -0.020 0.069
X17 0.014 0.007 -0.070 0.483
X18 -0.186 -0.043 0.382 -0.005
X19 -0.134 -0.033 0.081 0.361
X20 -0.001 -0.020 0.127 0.153
X21 0.140 -0.104 0.051 -0.174
X22 0.004 0.053 0.065 0.082
X23 0.146 0.086 -0.160 -0.043
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
Component Scores.
由表五,可以写出因子得分函数:
F1=0.004X1-0.141X2+0.189X3+0.105X4+0.299X5-0.057X6 - 0.022X7 + 0.033X8+0.036X9+0.031X10+0.176X11+0.167X12+0.080X13-0.053X14+0.007X15-0.201X16+0.014X17 -0.186X18 -0.134X19 -0.001X20 +0.140X21 +0.004X22 +0.146X23(2)
F2、F3与F4同理可示。由因子分析的要求可知,因子之间相关性不大。
以各因子的贡献率占四个主因子的贡献率的比例作为权重,构造综合因子得分为:
将31个省市的观测值中心标准化后代入上述因子得分函数,即样本的因子得分,具体排名情况见表六。
表6 各省市四个因子及综合因子得分排名
地区 省市 生活美好程度因子 发展潜力衡量因子 经济及科技进步因子 生活与经济可持续发展因子 综合得分排名
华北地区 北京 排在前8名 排在前8名 排在前8名
天津 排在前8名 排在前8名 排在前8名
河北
山西
内蒙古 排在前8名
东北地区 辽宁 排在前8名
吉林 排在前8名
黑龙江 排在前8名
华东地区 上海 排在前8名 排在前8名 排在前8名 排在前8名
江苏 排在前8名 排在前8名 排在前8名
浙江 排在前8名 排在前8名 排在前8名
安徽 排在前8名
福建 排在前8名
江西
山东 排在前8名
华中地区 河南
湖北 排在前8名
湖南
华南地区 广东 排在前8名 排在前8名 排在前8名
广西 排在前8名
海南 排在前8名 排在前8名
重庆
西南地区 四川
贵州 排在前8名 排在前8名
云南 排在前8名
西藏 排在前8名 排在前8名 排在前8名
西北地区 陕西
甘肃
青海
宁夏 排在前8名 排在前8名
新疆 排在前8名 排在前8名
四、结论
(一)本文研究结论
本文首先运用了因子分析方法对23个指标进行分析,得到了影响各地经济社会发展建设的四个因子:生活美好程度因子、发展潜力衡量因子、经济及科技进步因子和生活与经济可持续发展因子。研究结果较全面的展示了各地经济社会发展建设的全貌,并得到了各省市综合排名。总的看来,各省市发展状况呈如下几方面特点:一是京、津、沪、广东、江苏、浙江等省市综合表现好,多项因子得分位居前列,说明这些地区经多年发展在经济建设、人民生活、科技进步等方面都居于领先地位。二是经济及科技进步比较快的省市集中在华东地区,反映出该地区在激发经济活力、提升科技水平等方面的不懈努力成果显著。三是东北三省发展潜力较大,表明老工业基地期待以跨越式发展收获中远期经济社会发展的长足进步。四是当前天津的快速发展具有可持续性,在较高平台上仍然具有较大的发展潜力和空间。在今后的发展中,还需要继续重视民生,使人民生活更加美好;同时,在经济创新和科技应用等方面应持续努力。
(二)就分析结果总结问题并给出建议
通过对数据结果的分析,31省市经济社会发展建设还存在着一些问题,现将问题与有关对策总结如下:一是地区差距仍然较大。由因子分析中各地综合得分可知,由于各地在资源禀赋等方面的不同,其经济社会发展建设和现代化水平有很大差异。经济社会发展建设居前的6省市全部是东部地区,居后的省市大多为中西部地区。从具体指标看,人均GDP差距显著,科教相关指标差距也很大。数据表明东部地区具备率先实现现代化的条件,这种地区差距将在较长时期内会一直存在,但自“十一五”以来呈不断缩小趋势。年鉴数据显示2006年上海人均GDP比贵州人均GDP高出近10倍,2010年仅高出4倍左右。只有逐步缩小差距才能实现优势互补、资源共享、全面发展。中西部地区也应因地制宜,发挥自身特点和优势,向东部地区学习发展经验,解放思想,力争尽快缩小差距。二是在经济高速增长的同时必须继续不断追求与环境和谐共处的可持续发展。除综合得分非常靠前的地区之外,包括经济发展水平较高的地区在内,很多地区可持续发展水平还比较低。这表明资源高效利用和循环使用仍是经济发展过程中需要长期关注的重要方面。三是控制人口增长的基本国策不能放松。人口数量是各项指标的分母,而近年来我国人口增长率仍然较高,如不严加控制将影响经济社会发展建设目标的实现,影响人民生活质量的提高。因此,无论是发达地区还是欠发达地区都应严格控制人口总量,控制较好的地区应巩固防止回升。
五、本研究的不足之处及改进方向
从数据方面来看,本文的数据来源是2011中国统计年鉴,其中预期寿命是2000年人口普查数据,该项数据比较陈旧。数据结构的是根据前人研究结果,比照经济社会发展建设评测的特点和研究目的而设定的。由于在社会经济问题的研究中,研究结果对于研究方法和数据结构的依赖性相对自然科学研究较大;因此本文结论、建议的给出完全根据基于本文使用的数据结构的分析。
本研究的改进包括以下两方面的工作:一是建立更加有效、针对性更强的指标体系,以便更清楚地反映、说明问题。二是与经济社会发展的不同阶段相对应,指标体系的设计必须考虑动态适应性和历史衔接性,如何解决这个问题还需要进一步分析研究。
参考文献
[1]高惠旋. 应用多元统计分析[M]. 北京:北京大学出版社, 2004.
[2]何晓群. 多元统计分析[M]. 北京:中国人民大学出版社, 2000.
[3]朱庆芳. 全面建设小康社会的发展目标评价指标体系与人口发展的关系.2005.
[4]薛薇. 统计分析与SPSS的应用[M]. 中国人民大学出版社. 2005.
[5]易丹辉. 社会经济统计[M]. 中国人民大学出版社. 2003.
[6]党的十六大报告全文http://www.cs.com.cn/csnews/2002 1118/300508.asp
[7]党的十七大报告全文http://news.sina.com.cn/c/2007-10-24/205814157282.shtml
[8]中国统计年鉴-2011 http://www.stats.gov.cn/tjsj/ndsj/2011/indexch.htm
作者简介:杨光,女,任职于国家统计局天津调查总队。
(责任编辑:李敏)