石光鹏 李向新 蒋叶林 朱文
摘 要:为了探究昆明市中心城区服务业的空间分布特点,从高德地图开放平台中获取昆明市中心城区的兴趣点 (point of interest,POI) 数据,通过删除重复兴趣点、删除缺失的属性点对数据进行清理;以服务业兴趣点的密度为研究对象,采用核密度分析法确定了不同服务业的聚集中心,利用平均最邻近指数确定了研究区域内14类兴趣点在空间中均存在“聚集”的空间分布特征;采用KANN-DBSCAN聚类算法对研究区域内的服务业兴趣点进行聚类,并使用街道面积归一化得到每一类兴趣点在街道上的密度。结果表明:研究区内的服务业空间分布形成“一核多中心”的空间分布特征,城市服务设施呈“Y”型放射状发展;呈贡新区的教育职能突出,吸引了服务业设施的聚集;老城市中心服务职能复杂多样,其特征主要体现在商业设施及其周边配套形成的核心聚集和专业市场形成的多个中心的聚集;不同服务设施间的聚集程度存在较大差异。最后,结合分析结果为昆明市中心城区的服务设施的发展提出3点建议,可对昆明市中心城区服务业的发展提供一定参考。
关键词:兴趣点;空间格局;KANN-DBSCAN算法;核密度分析;平均最邻近指数;昆明
中图分类号:P208 文献标志码:A
以空间点模式进行空间分析时,应用较为广泛的数据是兴趣点 (point of interest,POI) 数据。POI是在地理信息系统中表示地理对象的术语,主要是指我们日常生活中用到的地理实体,如景点、医院、银行等。每个POI点包含名称、经纬度、地址、类型等信息[1]。POI具有空间维、属性维,甚至具有时间维特征,其空间维度表明POI具有位置特征。每一个POI都代表了空间中的一个实体,POI数据相比其他数据(如手机信令数据、基站位置数据与公共交通刷卡数据)更容易获取。由于POI数据可通过多种手段快速、持续获取,使得相关研究越来越深入。当前,使用POI数据对城市空间的研究主要集中于对城市空间中某一类或几类行业的研究[2-3]、城市热点研究[4]、功能区识别与划分[5-6]、城市空间人口密度、行为识别[7-8]、城市结构变化[9]、识别城市用地类型等[10]。多数学者对POI数据的挖掘集中在城市功能区识别与划分,特别是北上广深等一线城市的研究较多,针对一般性省会城市的服务设施空间分布与发展现状研究较少。
昆明地处中国西南地区、云贵高原中部,是中国面向东南亚、南亚开放的门户城市,是大湄公河次区域经济合作圈、泛珠三角区域经济合作圈的交汇点,并于2019年跻身新一线城市行列,因此选择昆明市为研究对象具有代表性。以空间点模式对兴趣点数据进行处理时采用核密度分析[11-12]等手段是常见手段,由于兴趣点的分布随机、不规则的特点,基于密度的聚类算法更加合理。因此,本文以KANN-DBSCAN聚类算法为基础,运用空间统计与空间分析手段对POI数据进行处理与分析,探究昆明市中心城区当前的服务业发展现状。
1 研究区域
昆明市辖五华区、盘龙区、官渡区、西山区、东川区、呈贡区、晋宁区7个区。通过2019年2月20日昆明地区夜间卫星珞珈一号01星遥感图像,结合POI数据密度和路网划定研究区域。路网数据来自开放街道图 (open street map,OSM),使用屏幕数字化方式获得,如图1所示。研究区域北至茨坝街道、南至呈贡新区金马铺街道、东起昆明南火车站、西至西山公园-环湖东路一线,包括五华区、盘龙区、官渡区、西山区、呈贡区,研究区内分划42个街道、2个开发区和1个度假区。研究区域采用“CGCS2000_3_Degree_GK_CM_102E”投影坐标系,面积约509.84 km2。注:1—马金铺街道;2—大渔街道;3—雨花街道;4—乌龙街道;5—洛龙街道;6—吴家营街道;7—龙城街道;8—斗南街道;9—矣六街道;10—官渡街道;11—洛羊街道;12—六甲街道;13—小板桥街道;14—昆明经济技术开发区;15—昆明国家旅游度假区;16—前卫街道;17—永昌街道;18—关上街道;19—福海街道;20—太和街道;21—金碧街道;22—吴井街道;23—拓东街道;24—金马街道;25—大观街道;26—棕树营街道;27—西苑街道;28—马街街道;29—护国街道;30—阿拉街道;31—龙翔街道;32—鼓楼街道;33—华山街道;34—东华街道;35—丰宁街道;36—聯盟街道;37—国家高新技术产业开发区;38—青云街道;39—莲华街道;40—金辰街道;41—黑林铺街道;42—普吉街道;43—红云街道;44—龙泉街道;45—茨坝街道。
2 数据来源与研究方法
2.1 数据种类与来源
为了兴趣点分类的科学性与普遍性,将POI数据按《国民经济行业分类》GB/T 4754—2017分为14类,每一个国标分类中都包括数量不等的高德地图分类,见表1。本文研究的POI数据来源于高德地图开放平台,属性包括唯一标识符(ID)、经纬度、名称、详细地址、所属行政区划与类别等。爬取数据151 130条,经去重、分类后得到POI数据计144 232条。一条POI数据刻画了服务业设施的一维抽象,其中最基本的属性是经纬度。经纬度是POI数据中用于分析其空间特征的基础。
从表1可以看出:批发和零售业服务设施数据量最多,约占样本总数的31.2%;住宿和餐饮业服务设施数量次之,约占样本总数的17.9%。
2.2 研究方法
2.2.1 核密度分析法确定服务业兴趣点的密度中心 核密度分析用于计算空间点、线要素邻域的密度值,连续化地模拟密度分布。近年来,其已广泛应用在地理学的空间分析的研究中。该方法基于“地理学第一定律”,即距离越近的事物关联越紧密,与核心要素越近的位置获取的密度扩张值越大[13],体现了空间位置的差异性以及中心强度随距离衰减的特性,适合城市设施服务影响等连续性地理现象的密度估计。核密度公式定义为
式中:n为带宽内的点数;h为带宽;(x-xi)2+(y-yi)2为点(xi,yi)和(x,y)之间的距离。在核密度估计中,带宽是定义平滑量大小的自由参数,带宽过大或过小均会影响f(x)的结果[14]。
为了研究全部服务业设施的核密度(以下简称“混合核密度”),选取带宽h为600、800、1 000 m进行实验。经过多次实验发现:按自然间断法将结果分为5个组时,每个密度峰值间区分最明显,而且较近的密度中心有相互融合的趋势,等值线较为平滑时为最佳分类。不同带宽下混合核密度分布如图2所示。
从图2可以看出:当h=600 m时,高值分布较为离散,且各高值的分布相互融合的趋势较弱;当h=1 000 m时,研究区域中心的高值出现融合,缺失了更多的局部细节;当h=800 m时,高值融合趋势较为适合。结合文献[15]的研究,选取h=800 m作为本文全部服务业设施核密度分析的带宽,核密度值由低到高依次分为低值(0~133.53)、次低值(133.54~419.67)、中值(419.68~772.57)、次高值(772.58~1 230.39)、高值(1 230.40~2 432.17)。使用ArcGIS的三维分析工具提取出核密度结果中的高值等值线,以此表述兴趣点的空间分布聚类,如图3所示。
从图3可以看出,共提取出了20个混合核密度峰值区域。以峰值区域内对应的地标(商场、购物中心、大型小区、学校等)作为描述位置的对象。表2描述了每个峰值的空间位置。
2.2.2 平均最邻近指数法确定服务业兴趣点的聚集程度 以空间点模式分析兴趣点的聚集特征时,虽然由莫兰指数、P值、Z值可以确定兴趣点数据在空间表现出的分布模式是“离散”“随机”或“聚集”,Z值也能在一定程度上体现聚集度,但是Z值并非单纯地考虑空间上的聚集。为了定量表达每一类兴趣点设施在空间中的聚集程度,使用平均最邻近指数(average nearest index,ANN)计算其聚集程度。该指数在0到1区间时,表示研究对象的空间分布模式表现为聚集,其他情况则表现为离散。因此,对比不同类别服务设施的平均最邻近指数可以直观评估每一类服务设施在空间表现的分布模式与聚集程度。使用ArcGIS Desktop工具箱中的“平均最邻近距离工具”进行分析,结果如图4所示。
从图4可以看出:(1)研究区域内服务业设施的平均最邻近指数均大于零,都呈现出聚集的空间分布特征。(2)T13(水利、环境和公共设施管理业)的平均最邻近指数最大,为0.58。结合表1可知,该类包含公园、广场等公共设施,设施分布较广,聚集程度最低。在研究区内T13呈现较大尺度上的聚集特征并非仅仅因为公园、广场与紧急避难场所三者的聚集,而是因为在该类中的公共厕所占比最高,其作为一种附属设施依附于上述三种设施。因此,不同的公园、广场与公共厕所共同构成功能整体,由于公园、广场与紧急避难场所的位置分散,该服务业才在较大尺度下表现出聚集的特征。(3)T9(金融业)的聚集程度最高,平均最邻近指数为0.30。该类中银行与自动提款机占比最大,其他设施数量较少。由于银行与自动提款机形成一定服务范围的聚集,这种聚集一般是局部的,导致平均最邻近指数大,聚集程度高,但其服务范围反而更小。(4)相邻的服务设施的平均最邻近指数差别很小,说明它们之间的聚集程度较为相近,但是最大值是最小值的近2倍。造成这种现象的原因,一方面可能是因为区位因素的影响,另一方面可能来自不同服务业之间服务性质的差别。
2.2.3 KANN-DBSCAN算法
DBSCAN算法是一种基于密度的空间数据聚类方法。它由密度可达关系导出的最大密度相连的样本集合为最终聚类簇。该算法对参数敏感。聚类方法是:对于某一聚类中的每个对象, 在给定半径的邻域内数据对象个数必须大于某个给定值,即邻域密度必须超过某一阈值[16]。DBSCAN算法既能有效地解决数据量较大、兴趣点相互重叠遮盖的问题,又能在宏观角度上发现其分布规律,且在细节上保留数据的位置精度[17]。
3 昆明市研究区域内服务业兴趣点聚类分析 采用KANN-DBSCAN算法对研究范围内的14类服务设施进行聚类。计算不同样本中所有点的欧式距离矩阵,计算Eps(最佳聚类距离)、MinPts(最小点个数)参数对应的最大簇数。算法确定的算法参数见表3。
基于表3中确定的参数,使用python语言实现KANN-DBSCAN算法,结果见表4。表4反映了研究区内POI数据在街道上的混合分布密度和平均分布密度。
由表4可知:研究区内除街道ID为1、2的马金铺街道、大渔街道密度为0以外,其余街道均有兴趣点的分布;街道ID为29的护国街道的混合分布密度为1 921.44个/km2,是研究区内混合密度最大的街道。护国街道是昆明市老城区的中心,其发展历史悠久但因缺乏规划,导致混合分布密度很大。从兴趣点的组成来看,研究区中的不同种类的兴趣点的密度差距较大,密度较大的服务业有餐饮与住宿等生活服务业,而金融业等金融服务业的密度较小。结合《昆明市城市近期建设规划(2016—2020年)》中对中心城区的规划,分布密度低的街道大部分位于现今昆明市中心城区的战略发展区域,如南部呈贡新区的“雨花街道”“斗南街道”“吴家营街道”,东北部盘龙區的“金辰街道”“龙泉街道”与西北部五华区的“普吉街道”“国家高新技术开发区”等,这些街道得益于城市规划,街道上服务设施的组成单一,总体呈现出服务设施的低密度显著聚集,服务设施发展的专业化趋势。
4 结论和建议
本文基于昆明市中心城区的兴趣点数据,对昆明市14类服务业兴趣点数据进行空间布局状况分析,通过核密度分析方法确定了所有服务业的分布中心;使用平均最邻近指数方法确定了研究区内每一类兴趣点数据在空间中的分布模式与聚集度;利用KANN-DBSCAN算法,以街道为空间载体研究了每一个街道内每一类兴趣点的混合分布密度与平均分布密度。发现昆明市中心城区的服务业的空间分布有以下特点:(1)总体上,研究区内的服务业空间分布因受地形影响,形成了“一核多中心”的空间分布特征,总体呈“Y型”沿滇池东岸分布,西北、东北部是服务业的集中发展区域,但南部发展条件更好,是目前发展的重要区域。在这些区域内形成了不同服务业类型的中心,其中中小学、大型广场、购物中心、高校、专业市场是形成聚集中心的重要因素。(2)从聚类密度结果看,一环内区域是服务业设施分布的热点区域,服务业设施密集且种类丰富,“昆百大·新西南广场”“金鹰购物广场”“南屏步行街”等大型商圈对其周边的服务业发展起到了积极作用,致使该区域具有密度高且种类丰富的特点;此外,呈贡新区的“大学城”“学府路教育片区”中的高等学校是吸引服务业聚集的重要因素。(3)服务设施空间位置分布不均衡,存在极大的南北差异,老城区依然占据城市职能主导地位,仍然担负着昆明市中心城区的主要城市职能;新城区(呈贡区)服务业设施密度低且分布离散,较少形成一定规模的聚集。(4)多个服务业中心形成了不同种类的专门化的聚集,并且不同中心的发展水平差异较大。例如街道ID为14、22等中心均提供商品批发为主的服务,因此服务设施单一;街道ID为27、33等中心是综合商贸市场而形成聚集,服务业设施种类丰富。
针对以上情况,提出几点可行性建议:(1)适当分散“核心区域”的城市职能,将部分餐饮等服务业外移,打造以金融、科技性服务业为主导的核心区;(2)强化各个聚集中心的职能,完善与其职能配套的服务业;(3)加强“新城区”的服务业设施建设,进一步强化“高校集群”对周边服务业发展的促进作用。参考文献:
[1]王富强. 空间知识地图构建理论和方法研究[D]. 郑州: 信息工程大学, 2013.
[2] 冉钊, 周国华, 吴佳敏, 等. 基于POI数据的长沙市生活性服务业空间格局研究[J]. 世界地理研究, 2019, 28(3): 163-172.
[3] 李江苏, 梁燕, 王晓蕊. 基于POI数据的郑东新区服务业空间聚类研究[J]. 地理研究, 2018, 37(1): 147-159.
[4] 寧鹏飞, 万幼, 沈怡然, 等. 基于签到数据的城市热点功能区识别研究[J]. 测绘地理信息, 2018, 43(2): 110-114.
[5] 康雨豪, 王玥瑶, 夏竹君, 等. 利用POI数据的武汉城市功能区划分与识别[J]. 测绘地理信息, 2018, 43(1): 81-85.
[6] 黄亮东. 基于多源POI数据的天津市城市功能区识别与分析[D]. 徐州: 中国矿业大学, 2019.
[7] 陈丽娜, 吴升, 陈洁, 等. 基于手机定位数据的城市人口分布近实时预测[J]. 地球信息科学学报, 2018, 20(4): 523-531.
[8] 王勇, 解延京, 刘荣, 等. 北上广深城市人口预测及其资源配置[J]. 地理学报, 2021, 76(2): 352-366.
[9] ZHONG C, ARISONA S M, HUANG X, et al. Detecting the dynamics of urban structure through spatial network analysis[J]. International Journal of Geographical Information Science, 2014, 28(11/12): 2178-2199.
[10]HU T, YANG J, LI X, et al. Mapping urban land use by using landsat images and open social data[J]. Remote Sensing, 2016, 8(2): 151.
[11]王俊珏, 叶亚琴, 方芳. 基于核密度与融合数据的城市功能分区研究[J]. 地理与地理信息科学, 2019, 35(3): 72-77.
[12]吴先赋, 李永树, 王金明, 等. 基于POI数据的成都市区生活设施空间格局分析[J]. 测绘地理信息, 2019, 44(3): 122-126.
[13]刘康, 王坤, 李宸. 贵州省乡村旅游地空间分布阶段演进及其发展路径研究[J]. 贵州大学学报(自然科学版), 2019, 36(5): 119-124.
[14]陈蔚珊, 柳林, 梁育填. 基于POI数据的广州零售商业中心热点识别与业态集聚特征分析[J]. 地理研究, 2016, 35(4): 703-716.
[15]杨子江, 何雄, 隋心, 等. 基于POI的城市中心空间演变分析: 以昆明市主城区为例[J]. 城市发展研究, 2019, 26(2): 31-35.
[16]李新延, 李德仁. DBSCAN空间聚类算法及其在城市规划中的应用[J]. 测绘科学, 2005, 30(3): 51-53.
[17]张铁映, 李宏伟, 许栋浩, 等. 采用密度聚类算法的兴趣点数据可视化方法[J]. 测绘科学, 2016, 41(5): 157-162.
[18]ESTER M, KRIEGEL, HANS-PETER, SANDER J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise[C]//Proceedings of the Second International Conference on Knowledge Discovery & Data Mining(KDD-96), Cambridge:AAAI Press, 1996: 226-231.
[19]夏鲁宁, 荆继武. SA-DBSCAN: 一种自适应基于密度聚类算法[J]. 中国科学院研究生院学报, 2009, 26(4): 530-538.
[20]宋金玉, 郭一平, 王斌. DBSCAN聚类算法的参数配置方法研究[J]. 计算机技术与发展, 2019, 29(5): 50-54.
[21]李文杰, 闫世强, 蒋莹. 自适应确定DBSCAN算法参数的算法研究[J]. 计算机工程与应用, 2019, 55(5): 7-13, 154.
(责任编辑:周晓南)
Abstract: In order to explore the spatial distribution characteristics of service industry in Kunming downtown area, the POI of Kunming downtown area is obtained from the open platform of Gaode map, and the data is cleaned up by deleting duplicate interest points and missing attribute points. Taking the density of interest points of service industry as the research object, the kernel density analysis is used to determine the aggregation centers of different service industries, and the average nearest neighbor index is used. This paper explores the spatial distribution characteristics of 14 types of interest points in the study area, and uses the KANN-DBSCAN clustering algorithm to cluster the service industry interest points in the study area, and uses the street area normalization to get the density of each type of interest points on the street. The results show that: the spatial distribution of service industry in the study area has formed a “one core, multi center” spatial distribution characteristics, urban service facilities show a “Y” radial development; the education function of Chenggong is prominent, attracting the aggregation of service industry facilities; the service function of old city center is complex and diverse, and its main characteristics are reflected in the core aggregation and specialization of commercial facilities and its surrounding supporting facilities. The agglomeration degree of different service facilities is quite different. Finally, combined with the analysis results, this paper puts forward three suggestions for the development of service facilities in the central city of Kunming, which can provide some reference for the development of service industry in the central city of Kunming.
Key words: point of interest; spatial pattern; KANN-DBSCAN algorithm; kernel density analysis; average nearest neighbor index; Kunming