我国各省市政公用设施的因子聚类分析

2016-06-20 14:52陈思颖
2016年18期
关键词:引言因子分析

陈思颖

摘要:城市市政公用设施是城市基础设施的重要组成部分,是城市化的重要基础和前提。本文以2014年全国31个省份的12项指标为研究对象,利用因子分析法将12项指标提取为四个分子,计算出31省份出各个因子及综合因子的得分及排名。在因子分析基础上,对31个省份城市进行聚类分析,并比较聚类分析分类结果与因子分析的结果。

关键词:市政公用设施;因子分析;聚类分析一、引言

改革开放以来,随着我国经济的快速发展,城市化建设的步伐不断加快,城市市政公用设施水平伴随着城市化不断提高。自1990年到2003年以来,我国市政公共设施固定资产年均增长率高达26.4%。城市市政公用设施是城市基础设施的重要组成部分,是城市化的重要基础和前提。良好的城市市政公用设施,能够提高城市的环境水平,提供一个良好的生活、工作环境,为其它产业的发展的重要前提。本文以《中国统计年鉴2015》为数据来源,选取2014年全国31个省份的市政公用设施的代表性指标,进行因子分析和聚类分析,希望能够得出各个省份之间市政公用设施的聚类结果,对各省份提高市政公共设施水平有一定的指导意义。

二、指标及研究方法的选取

(一)指标的选取

根据科学性、客观性、代表性、可操作性的原则,本文选取的指标为:城市用水普及率、城市燃气普及率、每万人拥有公共交通车辆、人均城市道路面积、人均城市公园绿地面积、每万人拥有公共厕所、实有道路长度、城市桥梁数量、城市排水管道长度、城市道路照明灯、建成区面积、供热总量。

(二)因子分析的理论介绍

因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以较少几个因子反映原始资料的大部分信息的统计学方法。

因子分析具有以下特点:因子变量的数量远少于原有指标变量的数量;因子分析是根据原始变量信息进行重新组构能够反映原有变量的大部分信息;因子变量之间不存在相关关系;因子变量的是对原始变量信息的综合和反映。

(三)聚类分析理论介绍

聚类分析是一种探索性分析的方法。它的实质是建立一种分类方法,将样本数据按亲疏程度进行分类。层次聚类分析是根据观察值或变量之间的亲疏程度,将最相似的对象结合在一起,以逐次聚合的方式将观察值分类,直到最后所有的样本都聚成一类。

根据研究对象的不同,层次分析聚类分为Q型聚类和R型聚类。Q型聚类是对样本进行聚类,R型聚类是对指标进行聚类。本文采用主要方法为Q型聚类。

三、实证分析

(一)因子分析的过程

首先对我国31省份的市政公用设施进行因子分析。因子分析的核心问题是构造因子变量和对因子变量进行命名解释。本文主要采用SPSS20.0进行因子分析。

1、确定待分析的原有若干变量是否适合于因子分析

进行因子分析之前,必须检验变量是否适合因子分析。本文主要采用Bartlett球形检验和KMO检验进行分析,检验结果如表1。从表1可知,KMO值为0.700,取值大于0.6,适合因子分析,Bartlett球形检验给出的相伴概率为0.000,小于显著性水平0.05,因此拒绝Bartlett球形检验的零假设,认为适合因子分析。

3、因子变量的命名解释

经过因子分析得到的F1,F2,F3,F4是对原变量的综合,对新因子变量进行命名,主要通过对载荷矩阵的值进行分析,得到因子变量和原变量之间的关系,从而对新的因子变量进行命名。

4、计算变量因子的得分

根据输出的因子得分系数矩阵,可以建立因子得分函数,从而得出各个因子的得分,再根据因子的方差贡献率的比重作为权重进行加权汇总,从而得出各个省份的市政公用设施的综合得分。

根据回归法计算得到的因子得分系数矩阵如表4所示。

(二)聚类分析的过程

在因子分析的基础上,根据四个因子的得分,进行系统聚类分析。主要采用利差平方和法进行聚类。

进一步,我们可以得到聚类的具体结果。

表5各省份城市的市政公用设施聚类结果第一类北京、山西、辽宁、黑龙江、陕西、青海、新疆第二类天津、上海、江苏、浙江、福建、河南、湖北、湖南、广东、四川第三类河北、内蒙古、吉林、贵州、云南、西藏、甘肃、宁夏第四类安徽、江西、山东、广西、海南、重庆从聚类结果来看,第一类地区主要分布在北部,其发展较早,城市建设起步也较早,因此,其市政公用设施水平也相对较高。青海、新疆属于西部地区在公园绿地面积和城市道路面积的因子得分上较高,但其综合得分却靠后,说明它们的市政公用设施建设的不均衡。

第二类地区主要分布在沿海和中部地区。这些省份大多属于发展较好的省份,各方面发展也比较均衡,因此市政公用设施水平也比较高。

第三类地区大多分布在西部地,这些省份的各项因子得分都比较。同时这些省份的发展比较滞后,属于经济欠发达地区,市政公用设施也难以与城市建设同步,与第二类省份的市政公用设施建设存在显著差异,需要进一步提高。

第四类地区发布比较广, 主要是处于中间水平上的省份。这些省份在各个因子得分上不均衡,使得其综合排名处于中间水平。队伍这些省份,应该具体找出其市政公用设施某个方面的不足,引起政府重视,有利于提高其市政公用设施水平。

四、结论

本文应用因子分析和聚类分析对2014年我国31个省份的市政公用设施进行评价。根据因子分析的结果可知,各个省份的市政公用设施水平主要受到桥梁和排水管道长度F1、建成区面积F2、公园绿地面积F3、城市道路面积F4四个因子的影响。进一步,我们将四个因子作为系统聚类分析的指标,从而剔除传统聚类分析各个指标不存在的相关关系,使得分析结果更具科学性和客观性。

参考文献:

[1]谢蕾蕾,宋志刚,何旭洪 SPSS统计分析实用教程 2013

[2]黄昊泽,张春梅,我国长三角百强县市政公用设施与市容建设水平的因子聚类分析[期刊论文]-科技经济市场2013(11)

猜你喜欢
引言因子分析
校企合作背景下高职院校学生管理制度的探索
解读《欧也妮·葛朗台》中金钱禁锢下的人生
基于思维导图的线性代数复习策略
提高小学低段课堂写字有效性的研究