江苏省常州市武进区农村居民点智能布局优化研究

2018-02-19 10:16吕欣阳翟开慎
现代测绘 2018年6期
关键词:武进区居民点格网

吕欣阳,翟开慎

(1.南京林业大学林学院,江苏 南京 210037;2.南京大学地理与海洋科学学院,江苏 南京210023)

0 引 言

农村居民点在我国农村用地类型中占有重要地位,是农村地区长期复杂的自然、人文因素相互作用相互影响的产物,其分布情况在一定程度上反映着当地的自然特征和社会人文情况。我国改革开放至今,城市化进程加快,农村居民点地区普遍存在着量大、布局散、空心村现象严重、城乡住宅容积率严重失衡等问题[1-3]。开展农村居民点的分组类型与布局优化的研究,能够使得乡村公共基础服务设施获得集约利用和定向维护,能充分利用农村建设用地,缓解紧张的城乡用地矛盾,缓解“空心村”现象的进一步扩张。

本文选取位于太湖平原的常州市武进区农村居民点为研究对象,采用空间分析技术、数理统计和聚类分析等研究方法,对现有农村居民点进行特征提取并分类,划分出农村居民点的区位特征和待优化农村居民点的优先程度。研究结果可为布局不合理村庄进行优化和整治提供整治建议,也可用于农村土地综合整治实地工作的理论参考。

1 研究区概况

武进区(北纬31°20′~31°48′、东经119°40′~120°12′),隶属于江苏省常州市,地处江苏省南部的长江三角洲,位于太湖平原西北,亚热带北缘,光温适宜,雨水充沛,土地肥沃,物产丰富,素有“鱼米之乡”之称。武进经济产业发达且发展实力强劲。作为典型“苏南模式”的发源地之一,武进民营经济发达,被列为全国首批双创示范基地,中国驰名商标数量稳居全省前列,综合实力长期稳居全国2 800多个县(市、区)十强。

2 数据获取与研究方法

2.1 数据获取

研究收集了武进区2015年土地利用调查数据,Open Street Map(OSM)地图矢量数据,“地理空间数据云”提供的GDEM 30 m分辨率数字高程数据以及全国1 km×1 km人口密度栅格数据。通过Python语言解析高德地图API的数据,获取武进区范围内的主要POI兴趣点数据。

表1 研究数据

2.2 数据预处理

从2015年武进区地类图斑数据中分别提取二级类中的村庄用地、公路用地和水面集(水库、河流、湖泊、坑塘)图斑[8]。村庄用地即农村居民点单元作为研究的主要对象。

图1 武进区乡镇级行政区分布

为能更好的了解农村居民点图斑的空间分布特征和其所处区位的优劣,研究采用建立渔网单元的方式进行初步分析。使用ArcGIS中创建渔网工具,对武进区行政区进行规则格网化处理,将渔网图层与武进区地类图斑进行叠加分析,获得每个格网单元的各项地类属性。使用Python语言从国内地图导航网站获取相关POI数据,选取交通设施服务、科教文化服务、医疗保健服务和购物及生活服务四类POI兴趣点数据用于研究[6]。

在ArcGIS中利用DEM数据进行地形因子的提取,分别生成武进区海拔高程图、坡度图。为研究村庄图斑所在区域内村庄面积及邻域面积的大小,将矢量格网数据按村庄面积作为输出值,生成村庄面积栅格图层。使用邻域分析计算每个格网单元其5×5邻域内村庄面积大小和人口密度。根据“中国知网”提供的武进区统计年鉴(2015-2016年)及相关统计公报等材料,将武进区各下辖镇主要经济指标录入行政区各省属性表中。

2.3 研究方法

2.3.1 GIS空间分析方法

使用矢量几何计算、矢量叠合分析和空间近邻分析,以及栅格数据空间分析中的数字地形模型分析、分区统计、焦点统计等功能。

2.3.2 智能聚类分析方法

聚类分析旨在揭露一个数据集中观测值的子集,最常用的两种聚类方法是层次聚类和划分聚类。对于层次聚类来说,最常用的算法是单联动、全联动、平均联动、质心和Ward方法。对于划分聚类来说,最常用的算法是K均值(K-means)和围绕中心点的划分(PAM)。本研究采用K均值聚类分析,算法步骤如下:

(1)随机地选择K条数据,作为初次聚类中心点;

(2)把每条数据行对应的数据分配到距它最近的中心点;

(3)重新计算K类中各点到其所在类的中心点距离的平均值;

(4)将每个数据按最近距离分配到它最近的中心点;

(5)重复步骤(3)和(4)直到所有观测值不再被分配或达到最大的预设迭代次数。

3 农村居民点地理区位特征研究

通过对2015年武进区地类图斑数据进行空间分析,获得农村居民点的用地现状。运用地形位指数,再结合交通因素,分析农村居民点分布的离散特征以及影响因素的分布特点,最后总结出武进区农村居民点的空间分布特征。取渔网单元中心点代表对应的渔网单元格区域,分别计算了单元中心点与POI兴趣点和公路的距离。将研究对象抽象为具有相同的面积范围的格网单元,比较它们之间内部地类构成及各单元格的地理空间特征。

3.1 农村居民点用地现状

2015年,武进区村庄用地面积为12 573.6 hm2,占全区土地总面积的13.80%,占全区建设用地面积的35.92%,村庄用地较2014年增长109.9 hm2。2015年武进区地类图斑包含村庄图斑数24 467个,图斑最小面积为2.5 m2,最大面积为244 162.4 m2。

3.2 地形位指数

地形位指数是一个由海拔和坡度计算出的,分别包括了地区高程、坡度特征的一个综合描述性指数,反映某一地区的地形属性,地形位指数计算公式为:

(1)

式(1)中:E为研究区域内平均高程值;s为空间任一栅格坡度值;S为区域内平均坡度值。计算各格网单元对应的地形位指数,可综合描述高程和坡度属性。高程越低且坡度越小的格网单元,地形位指数越低。地形位指数越低,越利于农村居民点的建设和发展。

3.3 相关分析

相关分析(Correlation Analysis)是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法,用来定量表述影响因子之间关系的密切程度。使用RStudio软件对格网单元属性数据进行相关分析和显著性检验。在进行相关分析和检验之前,对原始数据进行z-Score标准化处理。采用Pearson检验计算线性相关系数(图2)。

图2 研究区数据相关分析图

用于研究农村居民点邻域的宜居及发展潜力情况的因子分别为:Slope(坡度值)、Elevation(高程值)、Topography(地形位指数)、To Road(靠近公路距离)、To_Service(靠近生活购物服务距离),To_Hospital(靠近医疗保健服务距离),To_School(靠近科教文化服务距离),To_Station(靠近交通设施服务距离)、Fishnet_Pop(人口密度),Buffer_Pop(邻域人口密度),Fishnet_RA(村庄用地面积),Buffer_RA(邻域村庄用地面积)Waters(水域面积),共计13项。图中所划×号表示P值大于0.05,未划×号的相关性值表示两变量间具有统计学上的显著意义,从图中可知:

(1)研究区高程、坡度及地形位指数间有非常强的相关性,介于0.83~0.93,但三者与其余属性的相关性较为微弱,表明在太湖平原地区地势相对低平,海拔和坡度对农村居民点的分布及发展没有起到太大的影响。

(2)公共基础服务设施多建在主要公路附近。规则格网单元靠近公路的距离与靠近医疗、教育、生活购物POI的距离成较强的相关性,表明这三项主要的公共基础服务设施多分布在交通便利之处,且相互之间比较集中。

(3)农村居民点多分布在交通便利、服务设施较完善的地方。距离四类POI点的距离与单元格网人口密度及村庄面积存在一定的负相关性。

(4)农村居民点在空间分布上较为零散,人口数目在空间上分布较为均匀。

综上所述,一个分布良好、具有长期留存价值和发展潜力的农村居民点具有的特征是:所在区域有较小的地形位指数;交通便利,靠近公共服务设施点,区域内水域面积较小;农村居民点自身或其一定邻域内有较大面积村庄。

3.4 聚类分析

3.4.1 变量预处理

选择所有进行相关分析的变量,共计13项。根据相关分析的结果,为使得研究数据各属性因子都有相同的优劣趋向性(值越大表示越有利于农村居民点建设),对地形位指数、各距离值以及水域面积进行取相反数处理。聚类分析主要按照数据点间的距离来分类。如果在分析中选择的变量变化范围很大,那么该变量对结果的影响也是最大的。所以在进行分析之前需进行数据缩放处理。最常用的方法是将变量进行z-Score标准化,获得一组均值为0,标准差为1的变量。

3.4.2 聚类结果

在RStudio中使用K-means聚类,聚类数目从1遍历至20,每次聚类结果都会获得三个统计量totSS、tot.withinSS和betweenSS。在聚类数目K确定的条件下,betweenSS/totSS越大,tot.withinSS越小,类内相似度越高,聚类效果越好。经过计算,较好的聚类数目为4类。

确定聚类数目后,会生成每个数据点的最终类别。将这些数据点按照规则格网ID导入ArcGIS中,即获得聚类分析的可视化效果(图3),其中白色区域不含农村居民点。

图3 K均值聚类(4类)结果

3.5 ArcGIS分组分析

使用ArcGIS分组分析功能,按照4个分组数目生成相应的分组结果(图4),为方便比照,后期将分组结果的颜色进行了调整。分组分析也支持评定最佳分组组数,通常为F统计量较大而类数小的组数。再按照评定的最佳分组数进行分组(图5)。

图4 ArcGIS分组分析(4类)结果

图5 ArcGIS分组分析(2类)结果

组类数目地形位距公路距商店距医院距学校距车站人口密度村庄面积水域面积绿2144次小次远次远最远最远较远最小次小最大黄1849最小最近最近最近最近最近最大最大次小蓝56最大最远最远次远较远最远次小最小最小红3276

4 农村居民点分组类型与优化布局方案

4.1 农村居民点分组类型

结合图5与表2可知,黄色格网区域为交通最便利,公共服务设施最完备,村庄用地面积最大,人口居住较为集中的地方,紧靠着武进城区,属于最有发展前景的农村居民点范围;蓝色格网区域数目最少,其主要特征是地形位指数最高,处于高海拔地区,附近多有山峰,适宜发展旅游业;绿色格网区域,交通状况最不便利,距离周边公共服务点也非常远,区域内多为小面积村庄,人口分布较为稀疏,为本次农村居民点优化布局的重点关注对象。红色格网区域,介于黄色区域与绿色区域之间,发展优势与待优化劣势并存,属于可选的村庄优化对象。

4.2 农村居民点布局优化方案

在了解研究区农村居民点分组类型基础上,将之前K均值聚类与两次分组分析结果进行汇总,再选择其中绿色和红色区域,进行求交集计算,结果如表3、表4及表5。

表3 三种分类结果

表4 绿色区域分类结果交集

表5 红色区域分类结果交集

根据格网与村庄地类图斑的空间关系可知,使用K均值与分四组分析时,绿色优先待优化区域交集格网数有1 918个,对应村庄图斑个数有6 246处;红色可选优化区域交集格网数有2 979个,对应村庄图斑个数有9 518处。四分位数与均值常用于测量数据的分散程度。经统计,红绿格网区域边界处共有397处村庄地类图斑。研究采用绿色区域内村庄用地面积第一个四分位值508 m2作为阈值,并选择数据中面积小于阈值的地类图斑作为最终待优化的农村居民点对象,其中绿色区域内村庄用地具有最高优先级,红色区域内村庄用地面积普通优先级,二者临界线上的村庄用地具有较高优先级。

表6 待优化农村居民点统计表

图6 农村居民点布局优化方案

5 结 语

研究结果表明,在地形平坦、含有丰富的河网水系的太湖平原地区,海拔高度与坡度大体较为一致,其与农村居民点面积和空间分布的线性关系微弱,这时到达公路、公共基础服务点的距离以及河网密度等因素对农村居民点的分布起到很大作用,分布在交通便利、服务设施较完善地方的农村居民点,拥有更好的区位特征和更大的发展建设优势。通过对农村居民点其空间分布特征的分析和研究,武进区的农村居民点空间分布仍较为零散,区域内格网单元含村庄面积与邻域内含村庄总面积之间存在中等相关性。使用R语言和ArcGIS对其进行聚类及分组分析,得到的分类结果基本一致。从结果中可看出同级区位分布较为集中,且区位特征按农村居民点建设优势性从高到低依次对应距离城区从近到远的区域,呈现出一定程度的圆形或水波形分布。

猜你喜欢
武进区居民点格网
江苏省常州市武进区湖塘桥第二实验小学
A Wishing Tree
常州武进区为孩子们定制安全读本
江苏省常州市武进区横林初级中学
遥感数据即得即用(Ready To Use,RTU)地理格网产品规范
云南地区GPS面膨胀格网异常动态变化与M≥5.0地震关系分析
实时电离层格网数据精度评估
新型城镇化背景下对新农村集中居民点建设的思考
——基于长寿区农村集中居民点建设现状调研
基于3S的巴彦县农村居民点内农地测算研究