以国民经济发展指标划分江苏各城市经济竞争力

2015-05-29 16:14尹楠
中国经贸导刊 2015年14期
关键词:聚类分析

摘要:本文以2013江苏统计年鉴中的市县经济发展各项指标为依据,收集整理了十个能够反映国民经济发展的指标,利用多元统计聚类分析法中的离差平方和法和多维标度法得出江苏各城市经济竞争力的地域划分。聚类分析的结论表明,根据江苏各城市经济竞争力的聚类分析所得出的地域划分结论,和一般意义上我们认为的江苏经济发展的地域划分,即苏南、苏中和苏北的地域划分大体上是吻合的。由两种聚类法作出的聚类分析谱系图和多维标度图可以大致了解各地区经济竞争力的水平。

关键词:聚类分析 Ward法 多维标度法

一、引言

按照传统的江苏经济发展的地域划分方法,一般可以分为苏南、苏中和苏北三个主要区域,由于长期以来经济基础、交通运输、政府投入等方面存在差异,三个地域的经济发展状况有一定的差异,从而导致三个地域所在城市国民经济发展的相关数据指标存在一定的差距。根据2013年江苏统计年鉴中的有关数据,本文以江苏十三个地级市按国民经济发展的一些数据指标为依据,利用多元统计聚类分析法中的离差平方和法(WARD)和多维标度法(MDS),对江苏各城市的经济竞争力水平的差异情况作出一个地域划分,以验证江苏各城市的经济竞争力水平是否符合我们一般意义上认为的地域划分:即苏南、苏中和苏北的地域划分。

二、基本分析思路

(一)两种分析方法的原理

离差平方和法(WARD)属于一种常用的系统聚类的分析方法,其基本思想是先将多个样品各自看成一类,然后规定类与类之间的距离,选择距离最小的一对合并成新的一类,计算新类与其他类的距离,再将距离最近的两类合并,这样每次减少一类,直至所有的样品都成为一类为止。[1]

多维标度分析(MDS)则是另外一种聚类分析方法,它是以空间分布的形式表现对象之间相似性或亲疏关系的一种多元数据分析方法。其主要结果可以用多维标度图形象直观的表示出来。

多维标度法的计算实现步骤主要包括以下几步: 首先确定研究目的,选择需要进行比较分析的样品和变量,然后计算样品间的距离矩阵并分析样品间的距离矩阵;选择适当的维数,得到距离阵的古典解,将各个样品直观的表现出来并对结果进行解释,最后再验证模型的拟合效果。[2]通常要通过两步来完成:首先,构造一个f 维坐标空间,并用该空间中的点分别表示各样品, 此时点间的距离未必和原始输入次序相同,通常把这一步称为构造初步图形结构;其次,逐步修改初步图形结构,以得到一个新图形结构,使得在新结构中,各样品的点间距离次序和原始输入次序尽量一致。[3]

(二)两种分析方法的优缺点

本研究中所使用的两种分析方法中,离差平方和法(Ward)能够比较清晰直观地用谱系图的形式表示出结果,但难以得到结果之间的差异。而多维标度法(MDS)不仅能够在图中直观地表示出结果,而且能够得出维度上的坐标值,从坐标值能够得出各分析对象之间的距离。但多维标度法选用的维度不宜过多,最多用二维或者三维的空间分布图表示,如果维数过多,将很难在图中表示出来。综合以上两种方法进行研究和分析,能够更好地得到最终的分析结论。

三、实证分析过程

(一)指标体系的选择

为了对江苏十三个地级市的经济竞争力进行分析评价,对于聚类分析统计指标的选择,以2013年江苏统计年鉴中的市县经济发展指标为标准,收集了十个能够反映国民经济发展的相关指标。[4]在作具体分析时,可分别用x1、x2、x3、x4、x5、x6等变量名表示,各项指标如下:

X1——人均地区生产总值:按各地区常住人口计算人均数值,因各地区人口基数不一样,人均指标更加能够反映经济竞争力。

X2——第三产业占GDP的比重:第三产业属于新兴产业,对经济的可持续发展有着重要的作用。

X3——公共财政预算收入占GDP的比重:公共财政预算收入高占GDP比重高,表明政府在保障和改善民生、维持国家行政职能正常运转、保障国家安全等方面投入更多。

X4——外贸依存度:即进出口总额、出口额或进口额与国民生产总值或国内生产总值之比,是开放度的评估与衡量指标。

X5——城镇非私营单位在岗职工年平均工资:在岗职工的年平均工资是一项反映经济竞争力的重要指标。

X6——城镇居民人均可支配收入:指反映居民家庭全部现金收入能用于安排家庭日常生活的那部分收入。它是家庭总收入扣除交纳的所得税、个人交纳的社会保障费以及调查户的记账补贴后的收入。

X7——城镇居民人均生活消费支出:通过居民平均每人全年消费支出指标来综合反映城镇居民生活消费水平。

X8——城镇居民恩格尔系数:是食品支出总额占个人消费支出总额的比重。系数低表明更加富裕。

X9——城镇居民人均住房建筑面积:是指按居住人口计算的平均每人拥有的住宅建筑面积。

X10——人均居民储蓄存款:年末人均储蓄存款余额。

(二)实证分析

由于本研究中所使用的两种分析方法的原理和计算过程较为复杂,如用手工计算,其计算过程将会十分繁琐。为了便于研究的进行,采用数据分析软件R语言进行研究和分析。

使用离差平方和法(WARD)进行聚类分析时,首先需要确定聚类过程中类的个数。Bemirmen(1972年)提出了应根据研究目的来确定适当的分类方法,并提出了一些根据聚类图来分析的准则[5]。在这里为了验证江苏传统经济地域的划分,即一般意义上苏南、苏中和苏北区域的划分,把类的个数也确定为三个,这样便于验证江苏十三个地级市根据国民经济发展的指标所统计出的竞争力水平是否也符合苏南、苏中和苏北的地域划分。在R中根据聚类分析的谱系图显示,南京、苏州、无锡和常州被划归为一类,南通、镇江、扬州和泰州被划归为一类,剩余的城市被划归为另外一类,如图1中左图所示。

在进行多维标度(MDS)分析时,将研究数据转换为距离数据后,生成两种相互联系的结果——对象的空间分布图与对象在各维度上的解为坐标值。前者以后者为基础。依据空间分布图进行聚类发生困难或可能产生偏差时,就需要运用研究对象在各维度上的坐标值进行聚类分析[6]。本文在维数中选择了二维,因为二维平面图能够比较直观的表示出各地区的位置,在R语言中根据二维坐标值绘制出江苏十三市经济竞争力的二维标度图,结果显示无锡和苏州在图中的坐标值位置很近,并且和其他地区的差异非常大,可以划归为一类;南京和常州的坐标值位置相近,可以划归为一类;镇江和南通的坐标值数据所反映出的经济竞争力处于上升的势头;扬州和泰州的坐标值很近,大致反映了两市的经济竞争力水平相似;徐州、盐城、连云港、淮安和宿迁属于最后的一类,它们在图中的坐标值数据相近,如图1中右图所示。

四、分析结论

无论是采用系统聚类分析中的离差平方和法,还是采用多维标度法,对江苏十三市经济竞争力的聚类分析的结果大致是相同的,综合考虑离差平方和法和多维标度法得出的结论,根据谱系图和二维标度图得出三类地域划分如表1所示。从表1可以看出,江苏十三个地级市按国民经济发展的指标统计出竞争力水平的系统聚类分析的结论,和一般意义上我们认为的江苏经济发展的地域划分,即苏南、苏中和苏北的地域划分大体上是吻合的。由离差平方和法(WARD)和多维标度法(MDS)作出的聚类分析谱系图和多维标度图可以大致了解各地区经济竞争力的水平。■

参考文献:

[1]汤银才.R语言与统计分析[M].北京:高等教育出版社,2005

[2]王斌会.多元统计分析及R语言建模[M].广州:暨南大学出版社,2011

[3]张文彤,董伟.SPSS 统计分析高级教程[M].北京:高等教育出版社,2004

[4]江苏省统计局.江苏统计年鉴[R].北京:中国统计出版社,2013

[5]任雪松,于秀林.多元统计分析[M].北京:中国统计出版社,2011

[6]揭水平.多维标度法的聚类分析:问题与解法[J].统计与决策,2009(11)

(尹楠,1982年生,江苏镇江人,南京晓庄学院商学院讲师。研究方向:企业信息化)

猜你喜欢
聚类分析
基于谱聚类算法的音频聚类研究
基于Weka的江苏13个地级市温度聚类分析
我国中部地区农村居民消费行为阶段特征分析
基于聚类分析的无须人工干预的中文碎纸片自动拼接
浅析聚类分析在郫县烟草卷烟营销方面的应用
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究