ESDA技术在县域经济差异研究中的应用——以山西省为例

2013-10-26 11:09降惠张丽李杰降伟
关键词:县域数据挖掘山西省

降惠,张丽,李杰,降伟

(1.长治医学院 计算机中心,山西 长治046000;2.山西农业大学 信息科学与工程学院,山西 太谷030801;3.中国共青团长治县委员会,山西 长治047100;4.山西农业大学 马克思主义学院,山西 太谷030801)

常言道,“郡县治天下安,县域强则国家富”。自古以来,县域经济就是国民经济的重要组成部分。在党的十六大提出壮大县域经济的战略后,山西省县域经济发展取得了显著的成效。然而,在县域经济快速发展的同时也出现了许多经济发展不平衡的现象。长期以来,在山西省119个县市中,形成了孝义、河津、柳林、介休等生产总值超过百亿元经济强县,但也有平陆、方山、兴县、平顺、黎城等经济相对较弱的县区[1]。适度的区域经济差异对整个宏观经济发展有着积极的推动作用[2]。但是如果不加以科学有效的控制和利用,对发达和不发达地区经济发展都会产生严重影响。因此,研究山西省县域经济差异迫在眉睫。

目前,对区域经济差异的研究大都采用传统统计学和数学分析方法。但随着经济指标的变化,这些传统的方法已越来越凸显滞后性和局限性,一定程度上已经不能及时、准确反映山西省县域经济发展的总体格局和动态演变。随着计算机科学技术的快速发展,空间数据挖掘技术已趋于成熟。与以往的统计学方法相比,空间数据挖掘技术更能够反映经济指标的空间相关性,能够更加客观准确地反映一定地区,一定时期内某些经济指标的变化,为经济学专家学者以及各级政府部门制定正确的经济发展政策提供有力的技术支撑和理论指导。

1 研究方法

数据挖掘(data mining)是指从数据库中识别出有效的、新颖的、潜在有用的、最终可理解的模式[3,4],能够帮助人们对数据进行更深层次的分析。空间数据挖掘是数据挖掘的分支,是从空间数据库系统中抽取隐含的人们感兴趣的空间模式和特征、空间数据与非空间数据之间关系的过程[3]。目前常用的空间数据挖掘技术有空间统计分析、聚类分析和规则发现。其中探索性空间分析是空间统计分析中最常用的方法。

探索性空间数据分析(Exploratory Space Data Anal ysis,ESDA)是对调查、观察所得到的一些初步的杂乱无章的空间数据,在尽量少的先验假定下进行处理,通过作图、制表等形式和方程拟合,计算某些特征量等手段,探索空间数据的结构和规律的一种数据分析方法[5]。ESDA是以关联测度为核心,本质上是一种“数据驱动”的分析方法,它更注重发现空间数据的分布模式,注重揭示数据的空间依赖性与空间异质性的格局特征。

2 数据来源与处理

为了更好地揭示山西省县域经济空间差异,在对其进行探索性空间数据分析时,将空间分析尺度定为山西省县域,包括11个地级市,共计119个县市,涉及的数据全部来自山西省统计局2002~2011年统计年鉴。为了统一年份属性所对应的元组,将统计年鉴上的数据进行了合并处理,将太原市市辖区、迎泽区、万柏林区、小店区、尖草坪区、晋源区、杏花岭区的数据合并为太原市,大同城区、矿区、新荣区和南郊区合并为大同市,阳泉市城区、郊区、矿区合并为阳泉市,长治市城区和郊区合并为长治市,晋城市市辖区、泽州县数据合并为晋城市,朔州市朔城区、平鲁区合并为朔州市,所以最终定为106个市县。

人均国内生产总值是衡量地区经济发展状况的一个重要指标,因此选取的主要分析变量为人均国内生产总值(人均GDP),即地区每年社会产品和服务的产出总额与当年该地区常住总人口的比重。

3 2001~2010年山西省县域经济空间差异的ESDA分析

3.1 空间权重矩阵

在进行ESDA分析时,首先要建立表达空间相互作用的空间权重矩阵。利用Anselin设计的Geo Da软件,依据各县市的地理特征,设定了各县市的空间权重矩阵。

3.2 全局空间自相关分析

全局空间自相关分析法是一种从整体上衡量区域间空间差异与关联程度的空间数据分析方法。常用的度量空间自相关的全局指标是Moran指数,Moran指数反映空间相邻区域单元属性值的相似程度[6,7]。如果xi为区域i的观测值,则(-)(-)反映了观测值的相似程度,全局Mor an指数I的计算公式为:

从表1可以看出,2001~2010年每年的 Moran's I指数均为正,且差异显著(P≤0.05)。这表明,在2001~2010这10年间山西省县域经济发展在空间分布上呈现出相似值空间集聚,即具有较高人均GDP的地区和同是较高人均GDP的地区相邻,或具有较低人均GDP的地区和同是较低人均GDP的地区相邻。

表1 2001~2010年人均GDP的Moran's I指数Table 1 Moran's I statistics for per capita GDP in Shanxi

3.3 局部空间自相关分析

全局空间自相关反映了研究区域内相似属性的平均聚集程度。但当样本数据很大的情况下,全局空间关联很可能掩盖随机化的样本数据子集。要了解观测值的高值或低值的局部空间聚集情况及一些反常的局部状况就需要使用局部空间自相关分析方法[9]。目前,最常用的局部空间自相关分析方法是Moran散点图和LISA的结合。

3.3.1 局部 Moran值分析

利用Geo Da软件,对2001~2010年10个横断面数据进行计算分析。通过统计得出2001~2010年山西省县域Moran散点图分布情况表,如表2所示。

表2 山西省县域Moran散点图分布情况表Table 2 Moran scatter plots Distribution Table in Shanxi

从表2可以看出,2001~2010这10年来多数县市位于HH和LL象限,均表现出了正的空间自相关,2001~2007年间低低类型与高高类型的县市数量相当,而2009年和2010年高高类型的县市数量减少,说明经济发展水平较高的县域集聚性有所减弱。通过局部Moran散点值分析,可以具体区分区域与其邻近区域的空间联系形式,但是并不了解区域与其邻近区域的空间相关程度。为了更进一步研究山西省县域经济局部空间自相关性,因此需要通过局域指标(LISA)来进一步探讨。

3.3.2 LISA分析

空间联系局域指标(LISA)是衡量观测单元属性和其周边单元属性相近(正相关)或差异(负相关)程度的指标。根据以上分析可知,2004年和2008年是空间相似值集聚程度最高的一年,因此选择2001、2004、2008、2010年4年的数据为代表,图1依次列出这4年LISA显著性水平图。

从图1可以看出,随着时间的推移,山西省经济发展水平显著的地区也在不断的变化。经过10年的改革和发展,山西省县域经济发展的高值集聚区逐渐向中南部发展,而低值集聚区主要分布在东北部和忻州吕梁交界处。2001年,LL类型区在空间上形成连片分布的格局。太原市附近形成了HH聚集区,而大同东北部和忻州、吕梁西部的地区形成LL聚集区,表明相邻地区人均GDP在空间上趋于集中,并非呈现随机分布。2004年,HH集聚区由太原市附近区域转到灵石县、霍州市、临汾市附近。LL聚集区由2001年的西北两片分布变成了一条自西向东的带状分布,主要分布在忻州地区和大同东北部。2008年HH区域逐渐向中南方向发展,呈连片分布格局。这说明相邻人均GDP高的地区在经济上有相互依存的关系,受周边区域的影响较大。孝义市、沁源等地区煤炭资源丰富,劳动力充足。随着省市县级公路的不断增加,煤炭市场的不断扩大,煤炭贸易发展迅速,煤基合成等煤化工产业异军突起,带动当地县域经济快速发展,并且形成县县结合,区域联动的良好局面。2010年LL区域虽有一些变化,但聚集性仍比较明显。

4 结论与讨论

通过对山西省2001~2010年县域人均GDP的全局空间自相关和局部空间自相关统计分析可以表明山西省人均GDP分布存在显著的正向空间自相关关系,即空间集聚现象。通过Moran散点图和LISA分析发现经过10年的发展,东北部人均GDP较低的县聚集程度一直比较显著,而西部低值聚集区有逐渐向东发展的趋势。而H H聚集区随着时间的推移变化较大,由先前的省会城市附近,逐渐向中南部地区转移。

图1 山西省县域人均GDP的LISA显著性水平图Fig.1 LISA cluster maps for per capita GDP in Shanxi

本文选取的时间尺度为10年,如果选择更长的时间的话,研究结果会更准确,更有说服力。在研究过程中,本文将山西省县域作为研究的基本单元,如果选择更小的乡镇作为研究单元的话,研究结果是否会有变化,有利于进一步探讨。

[1]袁纯清.在全省县域经济暨农村工作会议上的讲话[J].前进,2011(4):4-6.

[2]胡乃武,韦伟.区域经济发展差异与中国宏观经济管理[J].中国社会科学,1995(2):38-39.

[3]邸凯昌.空间数据挖掘和知识发现的理论与方法[D].武汉:武汉测绘科技大学,1999.

[4]Haining R.Spatial models and regional science:A comment on Anselin's paper and research directions[J].Jour nal of Regional Science,1986,26,793-798.

[5]David C Hoaglin,Frederick Mosteller,John W Tukey.Understanding Robust and Exploratory Data Analysis[M].Wiley Classics Library Edition Published,1983:17-21.

[6]Cliff A D,Ord J K.Spatial autocorrelation[M].London:Pion,1973:45-50.

[7]Zhang Z Q,Griffit h D A.Integrating GIS components and Spatial Statistical Analysis in DBMSS[J].Int J Geographical Infor mation Science,2000,14(6):543-566.

[8]Le Gallo J,Ertur C.Exploratory spatial data analysis of the distribution of regional per capita GDP in Europe,1980-1995[J].Regional Science,2003,82:175-201.

[9]杨卫青,浦晓天.基于ESDA的中国省域房地产发展水平研究[J].现代经济,2008(7):38-49.

猜你喜欢
县域数据挖掘山西省
山西省右玉县的生态建设及其启示
山西省秋收已完成93.44%
县域消防专项规划研究
探讨人工智能与数据挖掘发展趋势
山西省打开农产品供深通道
山西省文联扎实开展“深入生活、扎根人民”主题活动
山东县域GDP排名出炉
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
县域就诊率为何差了40%