◇王春
基于综合主成分的部分省市城市设施水平研究
◇王春
城市居民对城市环境的要求日益剧增,所以就有必要研究一下我国部分省市的城市设施水平。本文以我国部分省市城市设施水平为研究对象,引据《中国统计年鉴—2014》中国部分省市的城市设施水平的数据,选取恰当的变量,据以统计分析做出综合评价结果。
基础设施;主成分方法
10.13999/j.cnki.scyj.2016.11.014
城市基础设施是城市生存和发展所必须具备的工程性基础设施和社会性基础设施的总称,是城市中为顺利进行各种经济活动和其他社会活动而建设的各类设备的总称。它对生产单位尤为重要,是其达到经济效益、环境效益和社会效益的必要条件之一。
城市经济、市民生活的正常运行是以城市基础设施为前提条件的。城市基础设施中的供水、排水、网络、燃气、绿化、道路、交通、电力、通信等设施,都在城市的经济生产中产生巨大影响。
1.主成分分析简介
主成分分析也称主变量分析,主要是运用降维的思想,在损失很少信息的前提下,用较少的指标来代替较多的指标,而这些较少的指标既综合反映了原来较多的信息,相互之间又是无关联的。
2.主成分分析法的计算步骤
(4)将标准化后的指标变量转换为主成分
U1称为第一主成分,U2称为第二主成分,…,Up称为第p主成分。
(5)对m个主成分进行综合评价
对m个主成分进行加权求和,即得最终评价值,权数为每个主成分的方差贡献率。
1.资料来源及评价指标选取
(1)数据来源
数据来自《中国统计年鉴—2014》(二十五、城市、农村和区域发展25-12分地区城市设施水平(2013年)),2013年分地区城市设施水平的数据来自国家统计局工作人员统计结果。
(2)评价指标选取
根据《中国统计年鉴—2014》选择的样本数据,选取如下六项指标作为分地区城市设施水平的评价指标体系。
城市用水普及率(%)用X1表示;
城市燃气普及率(%)用X2表示;
每万人拥有公共交通车辆(标台)用X3表示;
人均城市道路面积(平方米)用X4表示;
人均公园绿地面积(平方米)用X5表示;
每万人拥有公共厕所(座)用X6表示。
2.综合主成分分析
(1)使用SAS软件对相关数据进行分析
根据SAS程序得到的输出结果,原始变量的简单统计量的值和相关系数矩阵。主成分分析方法适用于变量之间存在较强相关性的数据,当原始变量之间存在较强的相关性的时候,运用主成分分析能起到很好的降维作用,即所得主成分浓缩原始变量信息能力差别不大。结果显示X1,X2,X3,X4,X5之间均呈现正相关,且变量之间的相关程度均大于95%,运用主成分应该会有较好效果的。
由原始数据输出结果给出了相关阵的特征值(Eigenvalue),特征值越多,它所对应的主成分变量包含的信息就越多。第 1个至第 6个变量主成分的贡献率分别为 44.10%、22.92%、16.39%、10.56%、5.26%、和0.77%。
由输出结果可知:前三个主成分的累计贡献率达到83.41%。在通常情况下,选取主成分的个数以累计贡献率达到85%以上为宜。83.41%累计贡献率基本符合条件,即基本保留了原指标的信息。为使主成分的代表性更强,从而使综合评价函数的结果更能接近实际,这里选择前三个主成分代表整个指标体系,反映城市设施水平情况。
由输出结果可以得到各个主成分的具体表达式如下:
第一、二和三主成分都是X1至X6标准化后变量(我们仍记为X1至X6)的线性组合,且组合系数就是特征向量的分量。下面考察一下每个主成分的具体含义:第一个主成分的系数全部为正,而且除了X4以外是所有系数均接近,因此可以作为城市设施水平的综合指标。第二个主成分在X1、X6前的绝对值系数较大,分别为城市用水普及率和城市污水处理能力,因此可以看成是城市基础设施中的用水系统能力。第三个主成分在X4前的系数较大,X4表示城市基础设施水平中的人均城市道路面积,故此主成分可以用来描述城市道路人均占有情况。
(2)对相关数据进行分析
本文研究部分省市城市设施水平有6个指标,这6个指标有很强的相关性,通过主成分计算,我们可以选取三个主成分,这三个主成分具有明显的实际意义,在第一主成分中变量的系数相当,所以第一主成分可以看成X1,X2,X3,X4,X5,X6的综合变量,可以解释为第一主成分反映部分省市城市设施水平。
根据以上对相关数据分析讨论得知关于部分省市城市设施水平的主成分为F1、F2、F3,使用SAS程序可以得出F1、F2、F3三个主成分的主成分得分。
由SAS软件输出结果以及讨论分析可知综合主成分为:
综合主成分得分见附表。
(3)结果讨论
a.主成分分析结果分析讨论
对于主成分分析的结果,根据输出结果及相关分析可以知道第一个主成分可以作为解释城市设施水平的综合指标,第二个主成分可以看成是城市用水系统的综合指标。第三个主成分可以用来表示城市道路人均占有率综合指标。可以看出北京、天津、河北、上海、江苏、浙江、福建等地区城市设施水平排在全国前列。分析内在原因,这些地区经济发展均属全国领先水平,经济发展带动了城市设施水平,最终相互影响、相互促进;用水系统综合指标较高的是江苏、安徽、山东、海南等地区。而上海、北京这两个一线城市表现就比较糟糕,而内蒙古的地域宽广,形成一个天然的缓冲带,所以即使没有优良的排水系统也可以有很好的表现。
b.综合主成分结果分析讨论
由以上讨论结果可以看到按照综合主成分得分排序后,北京、上海等一线城市城市设施水平综合指标排名靠前,江苏地区排名第一,另外一些沿海城市的排序也比较靠前,而西部(引自百度百科:中国西部地区包括重庆、四川、贵州、云南、广西、陕西、甘肃、青海、宁夏、西藏、新疆、内蒙古等十二个省、市和自治区。土地面积681万平方公里,占全国总面积的71%)欠发达地区的城市设施水平排名靠后,这与实际情况也比较接近。究其原因,首先,江苏地区近年来在经济发展和城市建设方面取得了较好的成绩,所以城市设施综合指标水平力压北京、上海一线城市,成为第一。其次,北京、上海等一线城市,由于有大量的农民工涌入,造成城市较为拥挤,且城市基础设施人均占有率低。最后,西部地区经济较为落后,城市设施水平较低,不过西部地区具有广泛发展产业的资源、地域宽广等优势,因此城市经济有着较好的发展前景,城市基础设施也有较大的发展机会。
附表 综合主成分及排序
[1]潘胜强,马超群.城市基础设施发展水平评价指标体系[J].系统工程.2007(07).
[2]刘俊昌.我国城市设施水平的综合评价 [J].统计与决策. 2008(01).
[3]童其慧.主成分分析方法在指标综合评价中的应用[J].北京理工大学学报(社会科学版).2002(01).
[4]王鑫鳌.论城市基础设施的特点和作用[J].城市开发.2003 (09).
(作者单位:上海海事大学2015级应用统计专业)