基于腾讯迁徙大数据的中国中心城市识别及网络腹地分析

2022-12-29 12:10曹志强邱君丽潘向向
地域研究与开发 2022年6期
关键词:腹地中心研究

储 君 , 仝 德,b , 曹志强 , 邱君丽,b , 潘向向

(北京大学 a.城市规划与设计学院; b.未来城市实验室(深圳),广东 深圳 518055)

0 引言

在经济全球化的大背景下,各生产要素在各个城市之间自由流动,城市对外联系不断加强,城市的重要性越来越取决于它们与其他城市的联系程度而不是其本身的绝对规模。换而言之,城市在区域网络中位置的重要性逐渐超过其自身的属性[1-3]。因此,城市研究的热点也随之发生转变,对城市体系与城市网络的研究越来越多[3-6]。

城市体系中的中心城市识别及其腹地范围划分是城市地理学的关键理论问题[7-10]。中心城市是指在全国城镇体系中具有核心控制作用、在全球城市网络体系中具有重要功能节点作用的特大中心城市[10]。腹地是指中心城市的服务或辐射范围[11]。在中心城市识别方面,传统研究多采取构建评价指标体系、基于属性分级的方法,如结合城市自身人口规模、经济总量、创新能力、城镇体系中心度等属性对城市进行排序进而识别中心城市[12-14],但这种方法不能有效衡量城市的外部联系。已有研究尝试突破基于属性方法的局限,试图从结构等价性入手分析核心边缘结构进而识别中心城市[15-16]。在腹地范围划分方面,传统研究多采取引力模型、断裂点分析等方法[17-18],其结果具有明显的空间邻近性特征[19]。但是,经济全球化下,资本、劳动力与知识技术等生产要素的流动性日益增加,流空间(space of flows)的重要性逐渐超过场所空间(space of places)[1],以本地服务为基础的腹地(hinterlands)也被超越本地范围的网络腹地(hinterworlds)所挑战[2,20-21]。相较于传统腹地,网络腹地分析不预设距离的作用,可充分利用联系数据特征发现密切联系的城市群组。

从数据上看,首先,当前中国城市网络研究主要从企业关联[22]、信息流[23]、交通流[24]等方面入手,挖掘城市体系结构特征。众多城市网络研究聚焦于企业关联[25-26],从世界城市网络理论出发,以高级生产者服务(advanced producer service,APS)与互锁模型等概念模型为依托[2,20],透过500强企业分析中国城市网络结构。这些研究重在剖析城市网络中的经济流,但受制于企业数据的保密性,难以完全反映价值流,更难以综合地反映城市联系格局[27]。其次,从信息流入手的城市网络研究利用海量新数据(如社交媒体数据、新闻数据),试图刻画城市网络特征[28],但是这些数据多存在先天性抽样误差(sampling bias)[29],稳健性与可靠性需要讨论。最后,虽然交通流也是挖掘城市网络结构的重要视角,但受制于数据获取的难题,早期交通流研究多以基础设施网络数据代替真实交通流数据[30];随着微博签到数据、百度迁徙数据、腾讯迁徙数据等位置大数据的出现,基于交通流的网络分析逐渐增多[31-33],但是除少数研究外[27],已有研究多使用特定时间片段的数据,难以反映以年为周期的总体情况。

本研究利用2018年腾讯迁徙大数据,采用加权随机块模型(weighted stochastic block model,WSBM)和相对关联法,对我国中心城市及其腹地范围进行识别和分析,试图探索以下两个方面内容:第一,利用年度“交通流”大数据,更为全面地反映中国城市间联系特征;第二,从网络结构性角度识别出中国城市体系的核心-边缘结构。

1 研究区概述与数据处理

1.1 研究区概述

随着经济发展,人口、货物、资本和信息在城市间流动,城市间联系日渐紧密。2018年,国家铁路旅客发送量36.6亿人次,航空旅客运输量6.6亿人次,公路营业性客运量130.1亿人次[34]。本研究以中国内地(不包含香港特别行政区、澳门特别行政区、台湾地区)为研究区域,以地级及以上城市或行政区为研究单元,分析城市(区域)间交通联系结构特征。

1.2 研究数据

采用腾讯迁徙大数据进行分析,该数据依托腾讯系列软件与应用生产,信息准确,且相对全面。通过网络爬取,获得2018年365天的全国地级及以上城市或行政区单向联系(迁入或迁出)前10位数据,包括城市或行政区(始点—终点)名称、联系时间、进出方向、交通方式、迁移人数等信息。空间上精确到地级及以上城市或行政区,时间上精确到天。原始数据共约717.5万条。

已有关于腾讯迁徙大数据的研究多针对特定时间片段(如春节假期)[29,31],难以反映年度数据全貌。参考王录仓等[25]提出的处理方法,使用2018年全年数据,经清洗、去重、汇总等处理后,共得到56 625条城市联系数据,包括323个地级及以上城市或行政区(4个直辖市,292个地级市,27个自治州、盟及地区)。处理后的腾讯迁徙数据涵盖了年度城市间交通流,可较为全面地反映城市网络结构的特征。

2 研究方法

首先,利用随机加权块模型判断核心边缘结构并识别中心城市。其次,利用相对关联法分析中心城市的网络腹地,考察超越本地联系的网络联系特征。

2.1 加权随机块模型

所谓随机块模型是指将网络中的节点(node)分入不同的子组(即“块”,block),节点之间连接(tie)的分布关系由节点所隶属的“块”来确定。加权随机块模型(weighted stochastic block model,WSBM)是随机块模型的改进算法,将应用拓展至有向加权网络的情形。加权随机块可以在不预设网络结构时研究网络结构。通过可视化的方法识别各种网络结构,包括核心-边缘结构、社群组团结构、异配结构及混合结构等。具体而言,核心-边缘结构是指某几组内部所属节点联系密集且强度高,这些组与其他组联系紧密,但其他组之间联系较弱;社群组团结构表现为组内联系强,但是组间联系较弱;异配结构表现为组间联系强而块内联系弱;混合结构是上述几种结构的混合状态[16]。

2.2 相对关联法

参考李涛等的研究[19],本研究采用相对关联法对中心城市的腹地范围进行识别。公式为:Vij=α+βVj+ε。式中:Vij是城市i与其他城市j之间无方向的联系强度;Vj是城市j的中心度;α与β为系数;ε为残差。如果残差ε为正且数值较大,意味着i与j之间的联系超过线性回归的估计值较大,j可能是i的腹地城市。残差ε标准化后大于1,即可认为j是i的腹地[19]。

3 结果分析

3.1 基于WSBM模型的中心城市识别

中国城市间联系格局有两方面特征。一方面,近距离的本地城市联系较为明显。除京津冀、长三角、珠三角三大城市群以外,成渝、武汉、西安、昆明等城市群内部联系也呈现放射状特征。另一方面,也可以观察到远距离非本地城市间联系,如京沪、京广、沪成,构成了中国城市网络的主干框架。

通过加权随机块模型考察网络结构,进而识别中心城市。以三维方式直观显示块内与块间的平均联系强度,以此识别中国城市体系的结构特征。结果表明,中国地级及以上城市或行政区分为13类(图1)。可以发现,第1~3类与其他类别相比具有显著不同的内外部联系特征。这3类城市均既具有较高的组内联系,也具有较高的组间联系,符合核心边缘结构中“核心”的描述。另外,在第1~3类城市中,第1类城市内外部联系强度则远超另外2类,基于此,将第1类城市识别为中心城市,第2和第3类城市识别为次中心城市。

图1 WSBM模型3D柱状图

(1)中心城市组(第1类)共有13座城市,包括上海市、北京市、南京市、天津市、广州市、成都市、昆明市、杭州市、武汉市、深圳市、西安市、郑州市、重庆市。这些城市之间的联系密集且强度高,但是跨越的距离较大,超越了本地邻域的范围,支撑起中国城市网络的骨干且城市与组外城市,尤其是其他次中心城市联系密切。

(2)次中心城市Ⅰ组(第2类)共有13座城市,包括南昌市、厦门市、合肥市、咸阳市、宁波市、泉州市、济南市、石家庄市、福州市、苏州市、贵阳市、长沙市、青岛市。这些城市组内联系弱于中心城市,与次中心Ⅱ组处于同一水平,但是其与组外城市的联系强于次中心城市Ⅱ组。这些城市一部分处在中心城市周边(如苏州市、宁波市、石家庄市),是中心城市面向全国的关键转换节点;另一部分则是某一区域的中心(如济南市、青岛市、厦门市)。受到周边全国性中心城市的挤压,这些城市的影响范围有限。

(3)次中心城市Ⅱ组(第3类)共有10座城市,包括三亚市、东莞市、南宁市、哈尔滨市、大连市、桂林市、沈阳市、海口市、珠海市、长春市。这些城市组内联系与次中心I组相当,但与组外城市联系较弱。具体分析其功能,一部分为东北地区区域中心城市(如哈尔滨市、大连市、沈阳市、长春市),一部分为商贸旅游等外向型城市(如桂林市、海口市、珠海市),还有一部分位于中心城市的都市圈内(如东莞市)。它们作为区域及地方的重要节点,在网络局部承担关键作用。

3.2 基于相对关联法的中心城市网络腹地划分

以13个中心城市为例,分析其网络腹地(表1)。结果发现:(1)网络腹地以本地邻域城市为主,但部分城市的腹地范围超越了本地邻域范围。如上海市的网络腹地包含了重庆市,北京市的网络腹地包括了成都市与武汉市,成都市的网络腹地包含了上海市与北京市,武汉市的网络腹地包含了北京市与广州市,重庆市和昆明市的网络腹地包含了上海市。

表1 中心城市的网络腹地范围

(2)中心城市网络腹地相互交叠。包括北京市与天津市,上海市与杭州市,广州市与深圳市,武汉市与重庆市,成都市与重庆市5对城市存在网络腹地的交叠,体现了这些城市在区域内的竞争关系。

(3)中西部中心城市腹地城市数量更多,邻域空间范围更大。中西部城市(如成都市、重庆市、武汉市)的网络腹地数量多于东部城市(如北京市,上海市,广州市,深圳市),且邻域空间范围几乎囊括本省(或邻省)。这是由于东部中心城市密度更高,在本地邻域城市腹地的竞争更大,腹地划分更细。相较而言,中西部中心城市密度更低,单个城市的腹地范围也就更大。

4 结论与讨论

4.1 结论

(1)加权随机块模型的结果显示,中国城市体系中存在1组中心城市和2组次中心城市,呈现典型的“核心-边缘”结构。中心城市和次中心城市在组内和组间联系上都显著高于其他城市(或行政区),在网络中起支配作用。

(2)中心城市网络腹地以本地邻域城市为主,但部分城市的网络腹地范围超越了本地邻域范围,网络腹地之间存在交叠,中西部中心城市腹地范围更大。不同于以往的重力模型或者引力场模型,以中心城市为例使用相对关联法分析其网络腹地,这一方法不人为预设距离影响,而是充分挖掘城市间联系所蕴含的信息。

4.2 讨论

利用新数据和新方法,通过国家中心城市识别与网络腹地分析,尽可能客观地反映全国尺度的城市网络特征。城镇体系规划以及国土空间规划编制可以采用相似的技术方法。但是,需要指出的是,腾讯迁徙数据缺少年龄、性别、收入等社会经济属性,细致微观机理分析较为困难。另外,由于是当日数据,腾讯迁徙数据可能对交通中转流数据存在过高估计。进一步的研究可以采取多源数据融合(如POI)的方法[35],更为深入客观地分析城市网络特征。最后,城市交通流网络分析可以与交通等城市基础设施投资[36-37]研究结合,提出综合性政策建议。

猜你喜欢
腹地中心研究
剪掉和中心无关的
FMS与YBT相关性的实证研究
在打造“两个中心”中彰显统战担当作为
辽代千人邑研究述论
视错觉在平面设计中的应用与研究
EMA伺服控制系统研究
港口经济与腹地经济互动发展综述
别让托养中心成“死亡中心”
基于SWOT分析法的台州港集装箱运输发展策略
厦门港集装箱集疏运系统现状分析及发展研究