何青松 唐歆宇
摘要:基于POI数据和最大熵模型,以数据可获取性为原则,利用武汉市的数据进行样本训练,对我国长江流域省会及直辖市城市在建筑物尺度上进行商业用地的识别与分析,并对其商业用地的影响因素识别和空间集聚特征进行了量化分析与表达。研究结果表明:(1)最大熵模型可以精准有效地进行商业建筑物识别。从7个商业建筑物的环境影响因子综合来看,建筑物内第三产业企业数量和建筑物楼层对模型构建影响最为显著;(2)影响长江流域各省会及直辖市商业空间总体格局的因素以地理环境为主;(3)长江流域10个省会及直辖市的商业用地空间形态分为多中心多组团式、多中心圈层式、双核心多组团式、双核心圈层式、单核心多组团式5种结构。说明基于POI数据和最大熵模型的方法可以精准有效进行大尺度工业用地识别,同时也为长江流域的城市发展以及全国的国土空间规划提供依据和参考。
关键词:POI数据;最大熵模型;商业用地;长江流域
中图分类号:F293 文献标识码:A
文章编号:1001-9138-(2021)11-0018-27 收稿日期:2021-10-20
作者简介:何青松,华中科技大学公共管理学院硕士生导师,博士,副教授。
唐歆宇,华中科技大学公共管理学院硕士研究生,通讯作者。
基金项目:国家自然科学基金(ID:42001334)。
商业是第三产业中一个重要的产业部门,先进发达的商业是现代城市经济发达的象征。商业用地是指用于开展商业、旅游、娱乐活动所占用的场所。中国自改革开放以来经济迅速发展,城市化率不断提高。在此背景下我国城市商业用地面积不断扩大、商业中心逐步增多、第三产业比重显著增加,在推动城市经济持续发展、经济结构转型方面发挥了重要支撑作用。与此同时,城市商业用地布局不科学、人地矛盾加剧以及商业区发展与绿色发展的矛盾等问题日趋凸显。准确有效的城市商业用地识别是科学分析以上问题的重要前提之一。
传统的商业用地识别方法多利用商业网点数据、经济调查数据、问卷数据、土地利用数据并与实地调研相结合进行研究分析,且通常以单个城市(区域)作为研究尺度。这不仅效率低下,也不利于实现宏观区域内不同案例间的对比研究分析。近年来大数据的应用为城市商业用地空間研究带来了新的数据源。POI (Point of Interest, POI)数据,又称为兴趣点数据,具有数据量大、易获取、覆盖范围广等优点,开拓了城市土地功能区识别方法的新领域。目前较多学者基于POI数据进行单个城市(区域)功能区的识别,而以大研究范围(如流域范围)、小尺度单元(如建筑物尺度)为特点的研究还很少。同时,由于数据源、研究时间、分析单元等存在差异,给不同研究案例的比较带来困难。
除了以上问题,分类算法的有效与否也影响城市商业用地识别的结果。近年来,最大熵模型(Maximum entropy model, i.e. Maxent model)除了被应用于物种分布预测以外,也开始被学者应用于地理分布的研究领域。该模型可以利用单期单类样本和地理环境空间变量得出研究对象的空间分布概率,以此推算出研究对象的空间分布状况。该模型具有操作便捷、精准度高等特点,但国内尚未有学者将其应用到城市地类识别的相关研究中。本文将基于最大熵模型和POI数据对全国省会城市及直辖市商业空间用地进行识别。
长江流域是世界第三大流域,我国正在大力推动长江经济带的建设。在快速城镇化的今天,各大省会城市和直辖市商业用地面积不断扩大,土地利用低效的问题依然存在,不利于及时开展进一步规划。因此,明晰长江流域各大省会城市和直辖市中心城区的商业用地空间结构和分布特点,有利于各大城市完善空间结构,提升城市规划科学性,进而推动长江经济带战略施行,实现长江流域地区经济的可持续发展。
本文提出了一种利用POI数据和最大熵模型进行大研究范围、小尺度单元的土地功能区识别的新方法。为了探究这种方法的精准度和可操作性,则使用最大熵模型,对长江流域省会城市和直辖市的商业用地进行识别并进行结果验证,再提取出长江流域的省会城市和直辖市商业用地识别结果,对各个城市商业空间结构进行分析。由于本研究使用的数据、方法以及研究尺度均相同,因此有利于展开比较分析,为全国商业发展布局和单个城市(区域)商业用地布局规划提供样本参考。
1 研究数据与方法
1.1 研究区域概况
本文用于城市商业建筑物识别和商业用地集聚特征分析的研究区域为长江流域的10个省会城市和直辖市。包括西部地区的昆明、成都、贵阳、重庆,中部地区的长沙、武汉、合肥、南昌和东部地区的南京、上海。长江流域始于青藏高原唐古拉山脉,终于东海,由西至东跨越了我国西部、中部、东部三个经济区,共流经19个省级行政区域,流域面积达到了180万平方千米。2017年长江流域人口数量达到4.59亿人,约占当年中国大陆总人口数的33.02%,而2020年长江经济带GDP占中国大陆GDP的43%。目前,长江流域是我国经济总量占比最高的流域地区,同时我国提出建立长江经济带,研究长江流域的10大城市对区域经济乃至全国经济都具有带动促进作用。
1.2 研究方法
本文使用的研究方法主要有最大熵模型、核密度分析法。本研究在选取最大熵模型前使用Orange软件(https: //orangedatamining.com/)对包括逻辑回归、随机森林以及贝叶斯分类在内的多种分类模型进行实验对比,最后试验表明最大熵模型的模拟精度最高。因此,本研究利用最大熵模型进行城市商业用地识别训练,对长江流域10城的城市建筑物进行商业建筑物识别并最终得到长江流域省会城市及直辖市的商业用地图斑,最后选取核密度分析法分析各个城市商业用地的集聚特点,并对10大城市商业用地布局特点进行类型划分。本文研究思路是基于POI数据,最大熵模型,以数据可获取性为原则选取武汉市作为训练样本,对长江流域省会城市和直辖市城市用地的商业建筑物进行空间识别,并对该模型进行分析,最后利用核密度分析法分析各城商业用地集聚特征并归类。具体方法流程如图1所示。
1.2.1 最大熵模型
最大熵模型(Maximum entropy model, i.e. Maxent model)是由Jaynes提出的一种机器学习模型,该模型以JAVA作为编程语言进行程序编写。其原理是利用样本空间分布的不确切信息和其相关空间变量之间的关联,选出预测样本的最大熵,再对样本的空间分布进行预测。该模型只需收集单期单类数据,操作方便简单。本文将利用最大熵模型对长江流域的省会及直辖市进行商业用地分布预测。
由于官方尚未公布第三次全国土地调查数据,基于数据可得性的原则,笔者利用与武汉市开展项目合作的契机得到了2018年武汉市商业用地空间分布数据。因此,武汉市作为本次研究最大熵模型的训练样本。通过文献研究分析和实用性分析,根据商业用地内部基础设施分布和建筑特点来进行影响商业分布的驱动变量的选取,例如商业建筑的功能特征明显,主要以商用为主,娱乐休闲设施密度较大,则选取了建筑物内POI数量(POINUM)、POI类型数量(POITYPENUM)、建筑物内POI混合度(ENTROPY)3个变量;同时,商业建筑物的第三产业数量应当高于其他类别的建筑物,因而选择了建筑物内第三产业的企业数量(NTHIRDFIRM)作为第4个变量;再考虑到商业用地地价房价偏贵,節约集约性较强,建筑物高度应该较其他类别建筑物更高,建筑物集中但单位面积较大,故选择了建筑物楼层(FLOOR)、建筑物占地面积(AREA)两个变量;最后,商业用地多位于城市繁华地段,基础设施完备,人流量大,较多建有地下停车场,所以第7个变量选择的是建筑物与停车场的距离(TOPARK)。以上7个变量计算均在单位建筑物中进行。
之后,再依托所选的训练样本(分别包括了商业建筑物和非商业建筑物),利用Maxent软件实现对模型的训练,最终得到省会城市及直辖市商业建筑物的分布状况。
本文使用的软件版本为Maxent3.4.1 (https://biodiversityinformatics.amnh.org/open_source/maxent/)。
1.2.2 核密度分析
核密度分析法可以表征空间点要素的集聚程度,被广泛应用于城市空间特征的研究中。本文将识别出的10大城市商业用地的面矢量数据利用ArcGIS对各个城市商业用地面中心点密度来研究各个城市商业用地空间集聚特征并可视化。核密度分析的公式如下:
式中:Kj表示研究地理范围j的空间权重函数;Dij表示研究范围的其他空间单元i与研究空间单元j之间的直线距离;R表示核密度分析时的带宽,本研究带宽设置为默认带宽;n表示研究范围内空间点要素的个数。
1.3 研究数据来源与处理
数据来源方面,本文的研究区主要使用到的数据有2017年的中国长江流域省会及直辖市的城市建筑物图斑和行政区划,POI数据,武汉市商业用地数据。其中,建筑物数据来源于中国城市大数据分享平台城市数据派(http://udparty.com),数据包括每栋建筑物的矢量底图、楼层数等信息,其有效性已经在研究中被证实;POI数据通过网络爬虫工具从高德地图抓取,抓取年份为2018年。
数据处理方面,本文计算出7种POI指标,以最大熵模型为训练方法,以武汉市为训练样本,基于长江流域省会及直辖市建筑物图斑,识别长江流域省会及直辖市的商业建筑物。
2 结果与分析
2.1 商业建筑物模型验证及影响因子分析
本研究基于最大熵模型利用2018年武汉市商业用地数据对商业建筑物识别结果进行验证,如图2所示。2389块武汉市真实商业用地斑块中有1894块存在商业建筑物分布,即79.28%的真实商业地块内训练得到了建筑物的分布。从现实情况来看,大量识别为商业用地的建筑物并非位于真实商业用地斑块内,这是由数据划分单元不同造成的,前者的划分单元为建筑物、后者为宗地,真实利用状况会出现不一致的现象。如一小区的楼其性质属于商业综合体,但在供地阶段其真实用途可能作为居住用地的一部分,模型识别就未将其定性为商业用地的斑块。
根据最大熵模型的预测结果,如表1所示,可以得知用于模型预测的7个环境变量中,应用贡献率依次为:NTHIRDFIRM (34.9%)>POINUM (20.1%)>FLOOR (18.4%)>TOPARK (14.3%)>ENTROPY (9.9%)>AREA(2.3%)>POITYPENUM (0.2%)。其中,贡献率排前三的影响因子依次为建筑物内第三产业企业数量、建筑物内的POI数量和建筑物楼层,三者累计贡献率为73.4%。置换重要值则与应用贡献率有所不同,置换重要值百分比依次为:NTHIRDFIRM (30.5%)>FLOOR (29.5%)>TOPARK (17.6%)>POINUM (12.5%)>AREA(5.9%)>POITYPENUM (3.7%)>ENTROPY (0.3%)。其中,排前三的为建筑物内第三产业企业数量、建筑物楼层和距离停车场的距离,三个变量置换重要值总和为77.6%。综合来看,商业建筑物的环境影响因子中,最大熵模型对建筑物内第三产业企业数量和建筑物楼层的依赖性较强,即这两个环境影响因子对模型的构建影响程度最大。
2.2 长江流域省会城市及直辖市商业空间结构
本研究利用ArcMap首先将长江流域十个省会及直辖市识别出的商业建筑物利用“面转点”的方法将商业建筑物图斑转换为商业建筑物网点,再利用软件里的核密度分析功能对10城的商业网点进行核密度分析,核密度分布结果,如图3所示。
2.2.1 10城商业用地集聚特征研究
一个城市的商业用地空间集聚特征不仅反映了该城市的商业发展特点和规模,同时也将影响该城市经济、资源、居民生活甚至区域发展的方方面面。商业集聚中心区域,也被称为商业中心,是一个城市商业密度和强度的高值区域。商业中心的形成有利于实现商业资源的规模效应,促进城市区域商业良性竞争。
从长江流域省会及直辖市的总体商业用地空间分布特征来看,10个城市都形成了一个及以上的商业用地空间集聚区,其形成的空间位置、商业中心的数量和空间集聚程度均与该市的城市环境和各区发展程度相匹配。
从各市商业用地集聚形态和商业用地延伸方向的制约因素来看,地理环境是最主要的城市商业用地聚集形态和延伸方向的“塑造者”。10城商业用地形态均大致呈现出面状发展的态势,空间分布形态与城建区域总体匹配,但由于各城地理环境因素各有差异,因此又表现出不同的发展特点。
整体而言,商业用地空间形态无明显地理因素影响的城市有昆明(图3a)、成都(图3b),这是因为两城市区内无较大的河湖水系以及山脉分割,地形平坦开阔。
商业用地总体形态受河湖因素影响的有武汉(图3f)和上海(图3j),武汉地处汉江与长江的交汇处,被分割成汉口、武昌、汉阳三块,其商业用地也受长江、汉江的影响在总体形态上被分割了,同时武汉被称为“千湖之城”,全市商业用地空间分布形态因河湖水系的限制而更加复杂化;上海因黄浦江分为浦东和浦西两块区域,其商业用地空间也被黄浦江所分割。
城市商业用地形态发展受山水共同限制的有重庆(图3c)、长沙(图3e)、南昌(图3g)、合肥(图3h)、南京(图3i),其中又分为商业用地形态较完整(南京),形态分割(长沙、南昌、合肥)和形态破碎(重庆)三种形态。南京受长江所限,其商业用地在长江东南侧发展,又因城市东北部玄武湖和钟山限制因此商业用地向南延伸发展,但商业用地整体形态较为完整。长沙、南昌、合肥商业用地形态被分割但各有不同:长沙主要商业用地集聚在湘江东侧,少数分布在城区西北部,江西地区由于有岳麓山的阻隔不利于大规模拓展商业用地;南昌主要商业用地位于赣江东侧,西侧为梅岭所限制,与长沙较为类似;合肥地形平坦,但四周有众多湖泊,以南面巢湖最为出名,商业用地形态因此受限,同时因蜀山位于合肥城区靠西的原因,西边商业用地被分割,形态完整度受到影响。重庆被称为“山城”,城区用地地势起伏较大,山体较多,同时又有长江、嘉陵江流经城区,是山地城市的典型代表,因此造成重庆市区商业用地形态破碎,完整度较低的发展态势。
商业用地总体形态单纯受到山体影响较大的城市有贵阳(图3d)。贵阳属于喀斯特地貌地区典型的山地城市,城区内有较多丘陵、山地。商业用地面积整体较小且集中,形态较为完整,但商业用地集聚区内部东南侧仍有黔灵山将商业用地较明显地进行了分割。
2.2.2 十城商业用地空间结构研究
一个城市的商业空间结构可以较好地反映该城市的发展特点,长江流域10个省会及直辖市具有不同的商业空间结构,按结构特点主要分为以下5类:多中心多组团式结构、多中心圈层式结构、双核心多组团式结构、双核心圈层式结构、单核心多组团式结构。重庆为多中心多组团式结构,成都、南京、上海为多核心圈层式结构,武汉为双核心组团式结构,贵阳、合肥为双核心圈层式结构,昆明、长沙、南昌为单核心多组团式结构。
从核密度分析结果来看,重庆已经形成较多的商业中心,并且较均匀地分散在各个城区,围绕着多个中心形成个多组团商业空间结构。这是因为重庆受多山地形和河流影响,城区分布在长江、嘉陵江等较低河流阶梯和山体之间的平地上,各区域之间的交通连结相对不便。重庆多中心多组团的商业空间结构符合在山形水系制约情况下达到资源科学有效配置、各区域经济持续发展的现实需求。
成都、南京、上海三城经济總量大,虹吸效应强,人口众多,需要多个商业中心分摊中心城区的压力。又由于地形平坦,地势较开阔,利于发展圈层式城市结构。成都市城市圈层结构明显,人口不断增加,传统的商业区域无法承担如此庞大的人口消费需求。近年来成都不断向外围发展,设立天府新区等区域分担城市压力,南边新城区集聚程度较高,外围也出现了一些小规模的商业集聚区,形成了多中心圈层式的商业空间结构模式。南京是中国经济第二强省——江苏省的省会城市,位于长三角经济圈内,同时对安徽、江西等周边省份亦有极强的经济辐射能力,繁荣的城市经济促使南京发展多个商业中心,南京地处长江中下游平原,地势平坦和缓,利于城市不断向外扩展发展新的商业圈层,由于南边地势更加开阔,核密度分析的结果可见南边商业空间扩散程度更大。上海是长江流域唯一的超大型一线城市,是我国经济最发达的城市,也是世界知名经济、金融、商贸中心,商业需求极其旺盛,需要发展多中心的商业空间结构才能满足上海市的发展需要。上海位于长江三角洲,地势平坦,以浦西老城区为辐射源点,以黄浦江为主线不断向外发展扩散,上海(图3j)商业集聚程度最高的区域为黄浦江以西的黄浦区等区,沿着黄浦江呈东北-西南椭圆形商业空间形态分布,而浦东新区商业集聚程度仍不如浦西地区,由于浦东是改革开放后开发的新区,虽与浦西仅一江之隔,仍可以看出浦东、浦西商业发展的差距。
武汉(图3f)由于长江、汉江的原因,划为“武汉三镇”,其商业中心是双核心的发展模式。由于汉口经济最为发达,商业用地集聚程度仍然高于另一个核心武昌,同时由于水系湖泊的限制,武汉市区内的商业用地发展了较多的组团结构,最终形成了双核心多组团的商业用地布局。
贵阳、合肥虽然都为双核心圈层式结构,但双方的发展态势和方向仍有显著差别。贵阳受到地形限制城区相对其他各城较小,商业集聚区较紧凑,发展出了南北两个商业中心,不断向外围扩展。而合肥的商业用地紧凑度没有贵阳那么强,这可能是因为合肥相较于贵阳地势更加开阔平坦,商业用地集约节约程度相对较低,同时合肥两个商业中心则分别位于庐阳区和瑶海区,呈东西向,这也体现出了两个城市自身商业用地的扩展方向的差异。
昆明、长沙、南昌都呈现出“单商业核心,多商业用地组团”的商业空间结构现状特点。三个城市城区范围都较小,人口较少,经济也在不断发展中,城市规划仍未完成,因此都呈现出单个核心区域商业和密度值较高,其他地区存在密度相对较低的商业用地组团的商业空间分布格局。其中,昆明呈现南北发展的态势,长沙和南昌分别在湘江、赣江形成商业核心区后沿东西向扩展商业用地组团。
3 结论与讨论
本文基于POI数据和最大熵模型对长江流域省会城市和直辖市商业用地进行识别,再通过核密度分析法对长江流域省会城市及直辖市的商业用地集聚特点和空间结构进行分析,主要得出以下结论:
(1)最大熵模型可以精准有效地进行商业建筑物识别。本研究选取的7个商业建筑物的环境影响因子中,建筑物内第三产业企业数量和建筑物楼层对模型构建影响程度最高。
(2)从长江流域各省会及直辖市商业用地集聚形态和商业用地延伸方向的制约因素来看,地理环境是最主要的城市商业用地聚集形态和延伸方向的“塑造者”。主要分为有无明显地理因素限制(昆明、成都)、河湖限制(武汉、上海)、山水限制(重庆、长沙、南昌、合肥、南京)、山体限制(贵阳)4类。
(3)长江流域10个省会及直辖市的商业用地空间结构有以下5种形态:多中心多组团式结构(重庆)、多中心圈层式结构(成都、南京、上海)、双核心多组团式结构(武汉)、双核心圈层式结构(贵阳、合肥)、单核心多组团式结构(昆明、长沙、南昌)。
(4)长江流域各城应当充分利用长江经济带的国家战略部署,结合自身优势发展经济。各市以上海市为龙头,依托长江黄金水道及其各级支流进行有效的资源协作和整合。商业经济还尚未成熟的城市应当建立发展规划,优化商业用地空间布局,拓展新的商业网点和组团,而商业用地空间结构成熟的城市(如上海)应当更加细化自身商业网点和组团布局。
本文基于POI数据和最大熵模型,在建筑物尺度上对长江流域省会及直辖市的商业用地进行识别,并加以验证分析,结果科学、精准。与传统方法对比,本文利用大数据和机器学习模型进行大尺度的地类识别,具有时效性强、效率高、精确、操作简单等优势,同时仅需从网上爬取单期单类数据,获取途径简单。并且与以往建设用地不同,本次研究利用的是建筑物图斑使得结果精确性进一步提高。同时,本文对长江流域10个省会及直辖市的商业用地空间分析有利于推动长江流域各个城市的资源协同、经济布局科学,为长江流域城市的经济发展提供科学参考。但必须指出,本研究所选取的POI数据指标具有一定主观性,尚未形成完整科学的选取标准,日后需要进一步进行研究,同时,本研究所选的最大熵模型并未进行更多地类实验,适用性仍需继续探讨。本文对各城市的商业用地等级以及与人口、居民点等因素并未结合起来进行深入研究,这将是后续研究的重点。
参考文献:
1.YANG J ZHU J SUN Y et al. Delimitating Urban Commercial Central Districts by Combining Kernel Density Estimation and Road Intersections:A Case Study in Nanjing City,China.ISPRS International Journal of Geo-Information.2019.8(2)
2.李龙 吴大放 王芳 等.中国快速城市化区域生态系统服务价值预测及权衡研究——以佛山市为例.生态学报.2020.40 (24)
3.周春山 罗彦 尚嫣然.中国商业地理学的研究进展.地理学报.2004.06
4.李卫东 张铭龙 段金龙.基于POI数据的南京市空间格局定量研究.世界地理研究.2020.29 (02)
5.吴康敏 张虹鸥 王洋 等.广州市多类型商业中心识别与空间模式.地理科学进展.2016.35 (08)
6.LIU X JIAO P YUAN N et al. Identification of multi-attribute functional urban areas under a perspective of community detection:A case study.Physica A:Statistical Mechanics and its Applications.2016.462
7.林耿 阎小培.广州市商业功能区空间结构研究.人文地理.2003.03
8.QIAO L HUANG H TIAN Y.The Identification and Use Efficiency Evaluation of Urban Industrial Land Based on Multi-Source Data. Sustainability.2019.11(21)
9.WU Y QIAO Y YANG J.Urban Functional Area Division Based on Cell Tower Classification. IEEE Access.2019.07
10.张华 赵浩翔 王浩.基于Maxent模型的未来气候变化情景下胡杨在中国的潜在地理分布.生态学报.2020.40 (18)
11.颜明艳 李琼珍 宋洁 等.基于MAXENT模型评估北部湾潮间带中国鲎和圆尾鲎稚鲎的潜在地理分布及种群保育对策.生态学报.2019.39 (09)
12.WACHTEL I ZIDON R GARTI S et al. Predictive modeling for archaeological site locations: Comparing logistic regression and maximal entropy in north Israel and north-east China.Journal of Archaeological Science.2018.92
13.吳瑞婵 甘淑 于丽君 等.最大熵模型的巴基斯坦遗址预测分布研究.测绘科学.2021.46 (03)
14.张亦汉 刘小平 陈广亮 等.基于最大熵的CA模型及其城市扩张模拟.中国科学.地球科学.2020.50 (03)
15.周晓艳 王诗琪.基于GTWR模型的长江经济带生态系统服务价值对城镇扩张的时空响应.水土保持研究.2021.28 (04)
16.MORENO R ZAMORA R MOLINA J R et al. Predictive modeling of microhabitats for endemic birds in South Chilean temperate forests using Maximum entropy (Maxent).Ecological Informatics.2011.6 (6)
17.ELITH J H.GRAHAM C P.ANDERSON R et al.Novel methods improve prediction of species' distributions from occurrence data. Ecography (Copenhagen).2006.29 (2)
18.曹元晖 刘纪平 王勇 等.基于POI数据的城市建筑功能分类方法研究.地球信息科学学报.2020.22 (06)
19.叶强 赵垚 谭畅 等.新时期沿黄省会城市商业空间结构及其空间服务能力.自然资源学报.2021.36 (01)
20.RAO Y ZHOU J ZHOU M et al. Comparisons of three‐dimensional urban forms in different urban expansion types:58 sample cities in China. Growth and Change.2020.51 (4)
21.龍瀛 李派 侯静轩.基于街区三维形态的城市形态类型分析——以中国主要城市为例.上海城市规划.2019.03
22.陈蔚珊 柳林 梁育填.基于POI数据的广州零售商业中心热点识别与业态集聚特征分析.地理研究.2016.35 (04)
23.贺中华 梁虹 黄法苏 等.基于DEM的喀斯特流域地貌发育影响因素分析.测绘科学.2008.04
3127501908228