地理大数据支持下的城市功能区识别研究

2023-08-08 06:26滕俊利马绍伟张鹏李龙任浩玮曲洁
山东国土资源 2023年7期
关键词:路网功能区区域

滕俊利 马绍伟 张鹏 李龙 任浩玮 曲洁

摘要:准确识别城市功能区有助于精细化城市管理、合理化资源配置。传统的城市功能区识别方法在很大程度上依赖实地调研及统计年鉴数据,不可避免地存在较大的主观性,且受限于数据获取的繁琐性,导致识别过程耗时耗力且效率低下。地理大数据的广泛应用为城市研究提供了一种新的方法和途径,已被用于辅助城市规划建设与管理相关工作。为推广和普及地理大数据在城市功能区识别中的应用,以特大城市为研究对象,基于OSM(OpenStreetMap)路网与互联网位置信息等地理大数据,准确识别了研究区内多种类型的主要功能区,并将识别结果与城市实景予以比较和验证。实验结果表明,基于地理大数据结合区域活跃度指标的空间与时间尺度分析,可以较为准确地识别出符合特大城市规划现状的主要功能区,证明了地理大数据支持下的城市功能区识别的有效性,有助于为城市规划和建设管理等相关工作的高效开展提供参考。

关键词:地理大数据;城市功能区;城市规划;城市管理

中图分类号:TU984

文献标识码:A    doi:10.12128/j.issn.1672-6979.2023.07.009

引文格式:滕俊利,马绍伟,张鹏,等.地理大数据支持下的城市功能区识别研究[J].山东国土资源,2023,39(7):52-57.TENG Junli, MA Shaowei, ZHANG Peng, et al. Study on Urban Functional Area Identification Supported by Geographic Big Data[J].Shandong Land and Resources,2023,39(7):52-57.

0 引言

我国的城市化进程日益迅速且不断深入,在此过程中,城市内部的空间结构不断发生变化,并形成了不同的功能区(商业区、工业区和居民区等)。及时准确地识别城市功能区对城市政策制定、资源配置和建筑管理等方面具有重要的意义。传统的城市功能区识别主要包括居民行为分析、专家调查协商及指标体系分析等方法,这些方法往往在很大程度上依赖实地调查数据[1-2]。大致可分为定性方法、定量方法和GIS(Geographic Information Science)技术手段等,这些技术方法各有利弊,但普遍存在主观性较强且费时费力等缺陷[3-5]。其中,定性方法在很大程度上依赖于领域专家的主观判断,费时费力且识别精度不高,现已渐渐被其他方法取代[6-7]。而定量方法是目前功能区识别研究中最常用的方法,已经具有很多应用案例[4]。例如,范业婷等[8]综合利用多源遥感数据、土地覆被/利用数据和相关统计数据,利用生态相关模型和地理探测器等模型,定量评估县域尺度内的土地利用功能,并基于此划定土地利用功能分区,最终取得了较好的效果。王秀红[9]利用因子分析统计法,综合评价了我国西部部分地区的土地利用程度,同时,通过自上而下和自下而上相结合的区划方法,合并了评价结果,从而得到了更为准确的土地利用程度分区结果。相比而言,基于定量方法的功能区识别流程较为简便,但因其对邻接单元间的空间联系考虑不足,导致得到的功能区识别结果不够完整,亟需研发并推广使用其他高效的方法。

近年来,地理大数据支持下的城市功能区识别方法逐渐成为主流[10-13]。在当前大数据时代以及移动设备广泛使用的背景下,产生了大量Twitter签到数据、大众点评旅游评论数据以及互联网位置大数据等带有地理标记的社交媒体数据。社交媒体数据具有获取成本低、覆盖范围广以及更新迭代快等优点,已经被广泛用于开展城市功能区识别的相关研究。例如,陈世莉等[10]基于浮動车(Global Positioning System,GPS)数据、兴趣点(Point of Interest,POI)大数据和路网大数据,以广州市部分地区作为研究区,通过潜在的狄利克雷模型(Latent Dirichlet Allocation,LDA)等时空语义模型和聚类方法,实现广州市城市功能区识别,同时,参考百度地图大数据对识别结果进行了验证。周杭和樊红[11]也采用兴趣点和OSM路网等众源地理大数据,并提出了一种基于特征向量分析的城市功能区识别方法,并以西安市为例,完成了商业区、旅游区、居住区、科教区和混合区5类城市功能区的准确识别。除了上述主要基于通勤大数据的城市功能区识别研究,还有一些使用手机信令数据或与POI数据相结合的相关研究,例如,杨振山等[12]融合了数万条手机信令数据和三十余万条POI数据,精细量化了北京市的城市功能区;NIU等[13]基于基站位置数据和手机信令数据,使用核密度分析方法,探索了特大城市的城市空间结构。除此之外,还有更多手机信令大数据用于城市功能区识别的相关研究[14-17]。相比于传统调查数据和纸质资料,地理大数据具有覆盖面广、时空分辨率高,且获取成本低廉等优势,能够更及时、准确地反映了用户的出行规律,有效地识别不同类型的功能区,并为城市研究提供一种新的信息和方法,且为城市规划者和决策者等相关领域人员提供了较好的辅助信息[18]。

大数据挖掘与GIS技术的结合极大地增强了大数据本身的空间数据处理和分析能力[19],有助于提高功能区的识别质量和效率。然而,部分研究只是运用了传统的空间分析、制图或数据管理等方面的初级功能,并单独在GIS系统平台下完成功能区的识别任务,尚未充分落脚在城市功能区的相关应用,相关问题仍然值得深入研究。基于此,本研究以特大城市为例,融合OSM路网与互联网位置等地理大数据,并创新性地使用区域分割及其活跃度指标构建等方法,准确识别了特大城市内部各功能区,该研究有助于辅助相关人员识别城市空间结构,对城市的地理规划、资源配置和建筑管理等工作具有重要的实践价值和参考意义[6,20]。

1 数据来源

1.1 OSM路网大数据

OSM是一个众源的地图网站(http://www.openstreetmap.org/)。众源方式是由用户通过各种定位设施或者仅仅通过对目标区域的熟悉印象绘制地图。关于用户选定区域的方式,OSM网站提供了2种方式,一种是直接导出当前地图界面的内容,另一种是自定义手动选择区域[21]。考虑到本研究的具体情况,使用了第2种方式。此外,由于OSM是基于矩阵下载数据的方式,出于数据完整性的考虑,本研究截取了比实际需要的大的多的区域范围,即通过选定包含研究区的范围下载OSM数据并利用ArcGIS的Editor for Open Street Map转换工具进行OSM数据的转换,得到了原始OSM路网数据。

1.2 互联网位置大数据

越来越多的互联网平台支持用户使用当前的位置实时签到。尤其在手机端,用户可以基于自己的位置,实时发布文字、图片和视频等信息,从而实现自己的实时位置共享。类似于其他大数据,互联网位置大数据具有数据量大、数据精度高、信息分布广且字段内容丰富等特点,已经引起地理学、社会科学及城市规划等众多领域学者的广泛研究[22]。本次研究共采集五十余万条互联网位置大数据,其基本的属性字段包括POI ID、User ID、User_Reg_Place和Checkin_Time。考虑到搜集的数据缺少经纬度特征,因此,使用基于已有的POI数据辅助实现签到数据的经纬度位置匹配处理。

2 研究方法

2.1 技术路线

首先,借助大数据采集程序及工具,获取了路网和互联网位置等地理大数据,形成用于城市功能区识别的地理大数据数据库。进而,分别使用路网扩张和抽稀等技术,借助GIS软件,完成OSM路网大数据的处理。对于采集到的互联网位置大数据,进行去重复数据、去停用词以及去特殊符号等数据清洗过滤操作,进而,采用被广泛使用的一种无监督聚类算法K均值聚类算法(K-means clustering algorithm)实现数据的空间聚类,以此获得城市内居民出行的时空规律。最后,通过构建区域活跃度指标,借助人工解译完成城市功能区的最终识别,并将识别结果与研究区城市规划的实际情况进行比较,验证识别的效果(图1)。

2.2 基于OSM路网大数据的区域分割

区域分割是地理空间应用的重要方法,已被广泛用于城市规划、地理计算和城市交通分析等领域。相关学者往往会采用区域分割的方法,降低研究区域的冗余度,提高后续分析的效率和质量。本次研究使用的路网分割区域是区域分割的典型方法。基于路网不同的道路等级分割不同的功能区域,基于三级OSM路网数据栅格化分割研究区局部区域。第一级道路指的是国道,第二级道路指的是省道,第三级道路指的是城市主干道。基于研究区具体的城市建设规律和当地居民的出行习惯,这些道路能够较为简便地将区域分割成形状和大小不相同的子区域。因此,基于形态学图像处理技术,采用路网扩张、路网抽稀以及标记连接区域的方法实现了路网数据的处理,并通过道路连接区域的方法实现了研究区的区域分割(图2)。

2.3 基于互联网位置大数据的区域活跃度指标构建

社交媒体活跃度是指每个地块每个时间段的动态发布数量,可以侧面反映某一区域的动态人流量,而人流量随时间的动态变化可以反映不同城市功能区的典型特征。本次研究利用基于计算机视觉原理分割研究区域,在时间尺度上,基于每个分割区域的社交媒体活跃度指数,划分具有明显不同活跃度特征的地块,进而识别城市功能分区。由于采集的互联网位置大数据符合Zipf长尾分布(幂律分布),因此,采用人工分析解译的方法,在最大程度上避免了城市功能区识别结果的偏差(图3)。

3 结果与分析

3.1 城市功能区识别结果

社交媒体活跃度分析是在时间尺度上的一种识别方法,能够直观反映出人类活动的功能区间的群体差异。因此,在本研究中,将路网分割的整个研究区区域所得的地块添加名称属性,并将名称人工标注处理。考虑到路网密集的地方,需要分割的地块数量较多。因此,为了保证标注图的清晰性和实用性,基于从上到下、从左到右的顺序,逐步实现分幅标注。

继而,利用ArcGIS工具箱中的Split分割工具提取每个地块中的互联网位置大数据,并将每个地块中的数据按照工作日、非工作日与24 h的时间统计到单独的表格中,为后续分析这些大数据的时间分布规律做准备。由于数据量巨大、分割地块众多,因此,通过编程高效实现其按周的分类统计。基于路网分割区域,采集的互联网位置大数据的K-means聚类和区域活跃度的指标计算,总共识别了三百余个地块的功能区域。除此之外,某些地块的功能属性难以直观判别,故将其定义为未识别区域。最终得到整个研究区的功能区识别结果如图4所示。

3.2 识别结果实景验证

本研究基于研究区的路网数据和互联网位置大数据,通过数据采集和预处理、路网处理和聚类等一系列工作对研究区的主要功能区进行了识别。为了保证城市功能区识别结果的准确性,采用目视和抽样的方法,分别在整体和部分层面将实验得到的研究区功能分区结果图与研究区城市总体规划中的用地现状图(图4)进行对比,在一定程度上证明了地理大数据支持下的城市功能区识别方法的有效性。综合以上对比结果发现,基于地理大数据的特大城市功能区识别结果具有一定的准确度和参考价值,所得识别结果与实际情况具有较好的吻合度。但也存在一定的不足,例如,识别结果的可靠性在一定程度上受路网密集程度的影响,在路网稀疏的地方大多为未识别区域。其次,相比于被有效识别的居住区和工业区,商业区的识别效果略显不足。考虑到现实情况中,OSM数据本身就存在不完整性,而路网密度就研究区而言地区差异较大;且研究区的商住和产住等混合用地的程度较高,特别是主城区内土地利用结构复杂,一定程度上限制了其识别效果。

4 结论

(1)在路网分割地块的基础上,基于地理大数据的时空信息构建了不同地块的区域活跃度指标,并利用反映各功能区的不同区域活跃度特征,识別出研究区的居民区、工业区和商业区3个主要的功能区域。

(2)本研究将复杂的识别结果进行简单分类,有助于较为简便地理解一个城市空间功能结构,辅助城市规划者和决策者基于人类活动和路网开展不同城市功能区的研究,对城市规划和建筑管理具有较大的辅助参考价值。

(3)本研究较好地验证了在地理大数据的支持下,利用大数据挖掘分析技术开展城市功能区识别研究方法的可行性。未来考虑结合兴趣点和大众点评等更多源数据,通过丰富地理大数据的来源和种类,或者结合遥感大数据,识别混合区域内的商业区域,进而实现特大城市功能区更为细致的识别。

参考文献:

[1] 韩昊英,于翔,龙瀛.基于北京公交刷卡数据和兴趣点的功能区识别[J].城市规划,2016,40(6):52-60.

[2] 王卓然,赵庚星,刘金花.基于生态足迹模型的市域主体功能区规划研究:以山东省济南市为例[J].国土资源科技管理,2014,31(1):16-23.

[3] 裴韬,黄强,王席,等.地理大数据聚合的内涵、分类与框架[J].遥感学报,2021,25(11):2153-2162.

[4] 李新凤,李莺宇,荣玉伟,等.基于GIS的山东省主体功能区划分探析[J].山东国土资源,2013,29(7):63-66.

[5] 朱明明,赵明华.基于相对资源承载力的山东省主体功能区划分[J].水土保持通报,2012,32(4):237-241.

[6] 陈小良,樊杰,孙威,等.地域功能识别的研究现状与思考[J].地理与地理信息科学,2013,29(2):72-79.

[7] 毛美桥,许庆福,丁喜莲,等.新一轮土地整治规划分区研究:以山东省肥城市为例[J].山东国土资源,2012,28(8):61-64.

[8] 范业婷,金晓斌,甘乐,等.长三角地区土地利用功能权衡的空间特征及其影响机制[J].资源科学,2022,44(8):1589-1603.

[9] 王秀红,何书金,张镱锂,等.基于因子分析的中国西部土地利用程度分區[J].地理研究,2001(6):731-738.

[10] 陈世莉,陶海燕,李旭亮,等.基于潜在语义信息的城市功能区识别:广州市浮动车GPS时空数据挖掘[J].地理学报,2016,71(3):471-483.

[11] 周杭,樊红.基于众源地理数据的城市功能区及其热点的识别研究[J].武汉大学学报(工学版),2022,55(4):417-426.

[12] 杨振山,苏锦华,杨航,等.基于多源数据的城市功能区精细化研究:以北京为例[J].地理研究,2021,40(2):477-494.

[13] NIU X,LIANG D,SONG X,et al.Understanding Urban Spatial Structure of Shanghai Central City Based on Mobile Phone Data[J].China City Planning Review,2015(3):9.

[14] SONG Z, WANG H,QIN S,et al.Building-Level Urban Functional Area Identification Based on Multi-Attribute Aggregated Data from Cell Phones—A Method Combining Multidimensional Time Series with a SOM Neural Network[J].ISPRS International Journal of Geo-Information,2022,11(2):72.

[15] ZHANG B,ZHONG C,GAO Q,et al.Delineating urban functional zones using mobile phone data:A case study of cross-boundary integration in Shenzhen-Dongguan-Huizhou area[J].Computers,Environment and Urban Systems,2022,98:101872.

[16] LIU B,DENG Y,LI M,et al.Classification schemes and identification methods for urban functional zone:A Review of Recent Papers[J].Applied Sciences,2021,11(21):9968.

[17] ZHAI W,BAI X,SHI Y,et al.Beyond Word2vec:An approach for urban functional region extraction and identification by combining Place2vec and POIs[J].Computers,environment and urban systems,2019,74:1-12.

[18] 李燕萍,虞虎,王昊,等.面向大数据时代的城市规划研究响应与应对方略[J].城市发展研究,2017,24(10):1-10.

[19] 刘耀林,刘启亮,邓敏,等.地理大数据挖掘研究进展与挑战[J].测绘学报,2022,51(7):1544-1560.

[20] 钮心毅,林诗佳.城市规划研究中的时空大数据:技术演进、研究议题与前沿趋势[J].城市规划学刊,2022(6):50-57.

[21] 王康,朱欣焰,呙维,等.OSM/高德路网匹配融合技术在道路空间化中的应用[J].计算机应用研究,2019,36(12):3685-3689.

[22] 尹建国,曲党政,张英.浅谈“数字城市”建设与城市规划[J].山东国土资源,2011,27(5):63-64.

Study on Urban Functional Area Identification Supported by Geographic Big Data

TENG Junli1, MA Shaowei2,  ZHANG Peng3,  LI Long4, REN Haowei1, QU Jie1

(1. Shandong Shengda Geographic Information Surveying and Mapping Engineering Limited Corporation, Shandong Weihai 264200, China; 2. Shandong Institute of Land and Resources Surveying and Mapping, Shandong Ji'nan 250000, China; 3. Shandong Mingjia Surveying and Mapping Limited Corporation, Shandong Zibo 255000, China; 4. Shandong Geological and Mineral Engineering Group Limited Corporation, Shandong Ji'nan  250000, China)

Abstract: Accurate identification of urban functional areas helps refine urban management and rationalize resource allocation. Traditional methods of urban functional area identification rely heavily on field research and statistical yearbook data, which are inevitably subjective and limited by the tediousness of data acquisition, resulting in a time-consuming and inefficient identification process. The wide application of geographic big data provides a new method and approach for urban research, and has been used to assist urban planning and construction and management. In order to promote and popularize the application of geographic big data in urban functional area identification, megacities are taken as the research object and accurately identifies various types of major functional areas in the study area based on geographic big data, such as OSM (Open Street Map) road network and internet location information, and compares and verifies the identification results with the real city scenery. The experimental results show that the spatial and temporal scale analysis based on geographic big data combined with regional activity indexes can accurately identify the main functional areas in line with the current planning status of megacities, which proves the effectiveness of the identification of urban functional areas supported by geographic big data and helps to provide references for the efficient implementation of urban planning and construction management and other related work.

Key words: Geographic big data; urban functional areas; urban planning; urban management

修訂日期:2023-04-24;

编辑:王敏

基金项目:国家自然科学基金资助项目(42001414)

作者简介:滕俊利(1987—),男,山东烟台人,工程师,主要从事测绘与地理信息工作;E-mail:38259724@qq.com

通讯作者:马绍伟(1970—),男,山东济南人,工程师,主要从事测绘与地理信息生产工作;E-mail:358011305@qq.com

猜你喜欢
路网功能区区域
烧结混合机各功能区的研究与优化
打着“飞的”去上班 城市空中交通路网还有多远
衡水市不同功能区土壤营养元素的比较
省际路网联动机制的锦囊妙计
首都路网 不堪其重——2016年重大节假日高速公路免通期的北京路网运行状况
路网标志该如何指路?
分区域
水功能区纳污能力计算及污染物总量控制
基于严重区域的多PCC点暂降频次估计
区域