刘望保, 石恩名
(华南师范大学地理科学学院, 广州 510631)
“百度迁徙”下中国城市间的人口流动空间格局
刘望保*, 石恩名
(华南师范大学地理科学学院, 广州 510631)
利用“百度迁徙”数据中2015年第1季度的369个城市之间逐日的人口迁徙数据,分析我国城市间的人口流动空间格局. 研究发现,城市之间的人口流动呈明显的分层集聚格局,形成了长三角、珠三角、京津唐、成渝四大和乌鲁木齐(昌吉)、西宁(海东)、榆林(鄂尔多斯)、昭通四小网络体系,而海西、东北、华中和西南等地区并未出现高层级集散城市和网络体系,这与其区域在国家区域发展战略中的地位在一定程度不匹配. “胡焕庸线”很好地反映了人口流动格局差异,东南壁内部各城市间的人口集散量是西北壁的12.80倍. 跨城市间的人口流动海量数据也应证了城市间的人口联系强度符合重力模型检验.
百度迁徙; 人口流动; 重力模型; 空间形态
“百度迁徙”数据反映城市间的人口流动与城市空间联系格局,可作为城市联系研究的重要数据来源. 近年来,国内外城市联系研究逐步转向基于城市间的人口流、信息流和技术流等基础上的“关系数据”的研究,尤其是随着智能终端、物联网等信息技术的快速发展,跨城市间的个体行为时空数据的采集与分析发展迅速,基于大数据驱动的城市间地理行为分析日渐成为主流[1],驱动着城市联系研究的基本转型.
自CASTELLS[2]提出流动空间后,从城市流角度来研究城市联系逐渐成为研究主流. 西方研究主要从城市之间的基础设施差异和企业组织格局来分析城市联系及其空间结构. 城市之间的基础设施差异主要以城市间交通设施网络和城市间电讯基础设施等数据为基础,以城市间的航空基础设施和航空旅客数量[3-4]、城市间互联网基础结构(如宽带)、电讯通讯容量等数据反映城市联系[5-6]. 城市之间的企业组织格局以Taylor学者为代表,用全球生产者服务企业的办公网络,即企业总部、地区总部和分支机构等在不同城市间的分布,通过企业在各城市之间的分布网络来分析城市间的经济联系[7]和城市等级体系. 近年来,西方学者开始利用跨城市间的地理行为大数据,如社交网络数据[8]和移动通信数据[9-10]来分析城市联系. 但我国反映城市联系的“关系数据”相对缺乏,要用重力模型来模拟城市联系[11-12]和采用“关系数据”(如城市间航空运输量[13-14]、城际铁路客流量[15]等)来反映城市联系. 近年来,我国学者也开始利用地理行为大数据(如新浪微博签到数据)来研究城市联系,尤其是城市间社交联系[16-20],并以此反映城市网络体系,复杂网络模型等新的研究方法逐步应用到城市联系研究中[21].
随着互联网时代的来临,网络数据逐渐成为表征居民社会活动的重要载体[22],利用用户迁移、社交网络和移动通信等地理行为来研究城市联系与网络等级体系是国内外相关研究的共同趋势. 以往研究较多的是采用社交网络和移动通信数据来分析城市间联系,本文主要从城市之间的人口流动强度来反映城市联系和网络体系:通过百度地图LBS平台获取了2015年2月7日—5月16日(共99天)的全国369个城市(包括香港和澳门,但不包括台湾地区)之间的逐日人口迁移数据(即百度迁徙大数据),利用此项数据分析城市间的人口流动强度和空间联系格局.
1.1 数据来源
百度地图LBS开放平台为数十万款APP提供免费、优质的定位服务,是国内LBS数据源最广的数据与技术服务平台. “百度迁徙”数据来源于百度地图和第三方用户的定位数据统计,实时、动态、直观地展示了区域间人口日常流动,实实在在地记录了数以亿计的人口迁徙轨迹. 本文利用“百度迁徙”平台,获取了2015年2月7日—5月16日的全国369个城市之间的逐日人口迁移数据,经统计,此期间城市之间的人流量合计达到1.21亿人次.
1.2 分析思路
由于2005年2月7日—5月16日包含了春运期间(2月7日—3月15日)和“五一”假期(5月1日—3日),为消除节假日,尤其是春节对人口流动的影响,本研究选取除春运和“五一”假期(整周)外的所有工作日为研究时间段,采取日均人流量. 分析思路如下:(1)利用各城市日均人口集散总量(即人口流入流出总量)划分城市人口集散功能的层级和类型,根据城市间人口流动强度来划分城市网络体系,分析城市之间人口流动分层集聚布局;(2)分析京津冀、长三角、珠三角和成渝四大城市群的核心城市与区域外的城市之间的人口流动强度,分析四大城市群在全国城市网络体系中的地位;(3)应用海量的城市间的人口流动强度数据,分析城市间的人口流动强度重力模型符合性检验.
2.1 城市人口集散功能层级
根据各城市日均人口集散总量,利用Arcgis 9.3软件绘制城市人口集散功能层级专题图(图1). 日均人口集散量分级采用自然分级法(Natural Breaks Jenks)来划分,分为0~6 050、6 051~26 667、26 668~61 107、61 108~170 201人等4个层级,依此层级将各城市划分为四、三、二和一级人口集散城市,其基本统计和集散层级布局分别见表1和图1.
图1 城市人口集散层级空间分布
类型(集散量)数量/个城市名单一级集散城市3北京(170201人)、上海(114997人)、天津(61107人)二级集散城市7苏州(52259人)、重庆(48549人)、廊坊(48517人)、深圳(35943人)、广州(35605人)、南京(28668人)、杭州(26667人)三级集散城市65保定、乌鲁木齐、徐州、西安、武汉、东莞、成都、沧州、石家庄、郑州、嘉兴、邯郸、昌吉、唐山、西宁、长沙、榆林、无锡、佛山、宿州、合肥、沈阳、哈尔滨、宁波、赣州、滁州、张家口、香港、温州、南通、德州、商丘、临沂、聊城、海东、阜阳、遵义、金华、长春、湖州、南宁、昆明、菏泽、澳门、泸州、昭通、珠海、鄂尔多斯、濮阳、玉林、南阳、济南、周口、上饶、青岛、安阳、信阳、厦门、常州、邢台、运城、南昌、衡水、中山、宣城四级集散城市294其他城市
注:括号内为日均人流集散量.
表1所体现的人口集散功能层级分级特征为:(1)一级和二级集散城市包括北京、上海、天津、苏州、重庆、廊坊、深圳、广州、南京和杭州,这些城市主要为京津冀、长三角、珠三角和成渝等城市群的中心城市,其人口集散量占总集散量的比重为25.10%. (2)三级集散城市主要为沿海地区和中西部的省会城市或中心城市,其中,乌鲁木齐、西安、武汉、成都、石家庄、郑州、西宁、长沙、合肥、沈阳、哈尔滨、长春、南宁、昆明、济南和南昌等为省会城市.
图1展示了人口集散层级空间布局,归纳其特征为:(1)集散能力较强的城市主要分布在沿海地区,尤其是京津冀、长三角、珠三角和成渝等城市群,中西部地区主要为省会城市. (2)各省区城市层级空间分布差异较大,西藏、宁夏、海南和甘肃等省份没有三级及其以上集散城市,除新疆外的西北地区的最主要的人口集散中心在西宁、海东地区和兰州(其日均人流集散量分别为13 028、8 948、5145人). 新疆地区人口集散中心为乌鲁木齐、昌吉和塔城,其日均人流集散量分别为23 774、13 489、5 508人,乌鲁木齐是西北地区最大的人口集散城市. 广东省人口集散城市主要为深圳、广州、东莞、佛山、中山和珠海等珠三角中心城市,而粤东、粤西和粤北地区的人口集散规模普遍偏小,均为四级集散城市. 然而,在海西、华中和东北等地区未出现二级及其以上的集散城市,而沈阳、哈尔滨、长春和厦门仅为三级集散城市.
2.2 城市人口集散分层集聚布局
借助Arcgis软件中的网络分析工具,根据城市网络层级和城市间人口网络联系强度,制作了城市网络体系专题地图(图2).
日均人流集散量排前10位的人口移动起止点(OD)为廊坊—北京(18 941人)、北京—廊坊(17 331人)、苏州—上海(13 445人)、上海—苏州(12 276人)、保定—北京(12 095人)、天津—北京(7 109人)、北京—保定(5 887人)、北京—天津(5 551人)、昌吉—乌鲁木齐(5 213人)、廊坊—天津(5 073人),合计为102 921人,占人流总量的11.16%. 总体来看,这些OD城市位置接近,流入流出量基本接近.
图2 城市人口集散分层集聚分布图
Figure 2 The distribution of urban population distribution network system
图2显示了城市人口集散功能层级和人流强度,为表达清晰,图中仅显示了城市间日均人流量大于222人的城市. 总体来看,城市间的人口流动格局存在明显的分层集聚. 集散体系的识别标准为:(1)集聚中心的识别:有明显的集聚中心,且集聚中心层级在三级及其以上;(2)边界识别:城市之间的人流量在第3层级及其以上(即大于1 043人). 归纳起来,全国形成了“四大四小”的分层集聚格局,包括京津冀、长三角、珠三角、成渝四大体系和乌鲁木齐(昌吉)、西宁(海东)、榆林(鄂尔多斯)、昭通四小体系. 城市人口集散空间格局的相关特征见表2.
与以往研究[17]相似,京津冀、长三角、珠三角和成渝四大体系在本研究中得以体现,但不同的是,本研究发现中部地区(武汉)、福建东南沿海(海西地区)、东北地区等区域并不存在较明显的城市网络体系,反而出现了乌鲁木齐(昌吉)、西宁(海东)、榆林(鄂尔多斯)、昭通等体系. 新疆的城市首位度较高、人口分布分散,乌鲁木齐成为区域最大的人口集散中心,形成了乌鲁木齐(昌吉)体系. 榆林(鄂尔多斯)体系的形成主要得益于煤炭资源的大规模开发和房地产的快速发展导致人口大规模集聚. 昭通体系主要得益于昭通与宜宾城市间密切的经济联系. 而西宁(海东)体系的形成则得益于青海湖的旅游开发.
表2 城市人口集散网络空间格局
2.3 城市之间的人口流动格局与“胡焕庸线”的关系
“胡焕庸线”反映了我国人口空间分布格局,也反映了城市间的人口流动空间格局. 图2叠加“胡焕庸线”,可以看出,层级较高的集散城市和“四大四小”的城市网络体系主要分布在“胡焕庸线”的东南壁. 以“胡焕庸线”为界,统计出东南壁内部和西北壁内部各城市间日均人流量分别为81.42万人和6.36万人,东南壁内部人流量是西北壁内部相应规模的12.80倍. 这种人口流动格局与区域自然地理环境、人口与产业活动、城镇化发展及互联网发展等要素密切相关,“胡焕庸线”两端形成了相对稳定的人口流动格局,反映了自然地理环境城市之间的人口流动格局产生深刻影响,两端的自然地理环境差异影响两端的产业与城镇化发展,加上历史因素所造成区域发展不平衡,进一步影响与制约城市之间的人口流动,区域互联网发展水平和居民移动互联网使用习惯的差异也是重要原因.
2.4 主要城市群与区域外城市之间的人口流动格局
为进一步分析各大城市群在全国城市网络体系中的地位,本文提取了京津冀、长三角、珠三角和成渝四大城市群的中心城市与区域外其他城市间的人口流动格局(图3,与图2类似,图3仅显示了城市间日均人流量大于222人的城市),归纳其特征为:(1)四大城市群均在全国城市网络体系中占据重要地位,京津冀城市群的覆盖范围是全国性的;(2)城市群核心辐射区域具空间临近指向性特征,京津冀、长三角、珠三角和成渝四大城市群分别为华北地区、华东地区、华南地区和西南地区的城市网络体系中心;(3)各城市群对外联系均表现为北京、上海、广州、深圳、重庆和成都等大城市的空间指向性.
图3 四大城市群在整个城市网络体系地位分析
2.5 城市间人口流动重力模型检验
(1)
(2)
模型(1)、(2)中,Lij为i、 j城市间的人口流量,K为常数,Pi和Pj分别表示i、j城市质量(本文用市辖区总人口和人均GDP表示),dij为i、 j城市之间的距离(本文用直线距离表示),b为距离摩擦系数,a、c分别为Pi和Pj的规模参数. 将城市之间的人口流量与相应的流入流出城市市辖区的总人口和人均GDP等指标分别纳入到模型(1)和模型(2)中进行模型检验,共得到4个检验结果(表3).
分析结果显示,4个模型均在0.000上显著,模型拟合程度更高. 按照市辖区总人口分析的模型(1)和模型(2)的摩擦系数均为1.867,结果相同;而按照人均GDP模拟的模型(1)和模型(2)的摩擦系数分别为2.036和2.063,也基本接近. b值反映了引力的距离衰减速度,b越大,则引力随距离增加衰减越快,反之则越慢. 顾朝林和庞海峰[11]认为b值大小指示引力作用范围的尺度差异,b值分别取1和2时可近似地揭示国家尺度和省区尺度的城市体系空间联系状态. 本研究通过具体的城市之间的人口流动数据,利用总人口数和人均GDP作为城市质量,模拟重力模型后发现b值在2左右比较合理,选取改良后的模型更为合理,说明城市间的吸引力也与城市规模变量存在显著的幂函数关系.
表3 城市之间的人口流动规模的重力模型检验
本文利用 “百度迁徙”数据(2015年第1季度)中除春运和“五一”假期外的工作日城市之间的日均人流量,分析城市之间的人口流动空间格局,结论如下:
(1)城市之间人口流动呈现明显分层集聚. 人口集散层级较高的城市主要分布在沿海地区,尤其是珠三角、长三角和京津唐等城市群,西部地区出现了由于城市首位度高或旅游发展而导致的较高层级集散城市,如乌鲁木齐、西宁等,而在海西、东北、华中等地区并未出现二级及以上城市. 全国形成了长三角、珠三角、京津唐、成渝等四大体系和乌鲁木齐(昌吉)、西宁(海东)、榆林(鄂尔多斯)、昭通等四小体系,在海西、东北、华中和西南等地区并未形成明显的分层集聚,珠三角、长三角、京津唐和成渝等四大城市群对外人口流动均表现为北京、上海、广州、深圳、重庆和成都等大城市的空间指向性.
(2)“胡焕庸线”既能描述人口空间分布格局,也能较好地反映城市间人口流动的空间格局. 三级及其以上的人口集散城市和四大四小的网络体系主要分布在“胡焕庸线”东南壁,东南壁内部城市之间的人口流量是西北壁相应流量的12.80倍.
(3)尽管高铁、航空等交通的快速发展使得城市间的交通联系越来越便捷,但距离衰减规律在城市间实际人口流动中仍起到重要作用. 本文利用“百度迁徙”大数据验证城市之间的人口流量符合重力模型检验,正如前文所述,改良后的重力模型更适合城市之间的人口流量的预测,城市之间的人口流量不仅与城市间的距离呈显著的幂函数关系(确定摩擦系数在2左右),还与城市规模变量(如人口规模、经济规模)呈显著的幂函数关系.
京津冀、长三角、珠三角和成渝四大城市群在全国城市网络体系中占据主导地位. 城市网络体系空间布局不均衡,华中、东北、海西和西南等地区并未出现较高层级的集散城市和网络体系,与国家对这些区域的战略定位要求在一定程度上不匹配,尤其是福建和新疆分别作为丝绸之路的核心区,加大这些区域核心城市的人口集散能力和吸引力显得尤为必要.
[1] 柯文前,俞肇元,陈伟,等. 人类时空行为数据观测体系架构及其关键问题[J]. 地理研究,2015,34(2):373-383. KE W Q,YU Z Y,CHEN W,et al. Architecture and key issues for human space-time behavior data observation[J]. Geographical Research,2015,34(2):373-383. [2] CASTELLS M. Local and global:cities in the network society[J]. Tijdechrift Voor Economische en Sociale Geor-afie,2002,93(5):548-558. [3] GOETZ A R. Air passenger transportation and growth in the US urban system 1950-1987[J]. Growth and Chan-ge,1992,23(2):218-2421.
[4] MATSUMOTO H. International urban systems and air passenger and cargo flows:some calculations[J]. Journal of Air Transport Management,2004,10(4):239-247. [5] TOWNSEND A M. Networked cities and the global structure of the Internet[J]. American Behavioral Scientist,2001,44(10):1698-1717.
[6] MALECKI E J. The economic geography of the Internet’s infrastructure[J]. Economic Geography,2002,78(4):399-424. [7] TAYLOR P J. World city network:a global urban analysis[M]. London:Routledge,2004.
[8] NAAMAN M,ZHANG A X,BRODY S,et al. On the study of diurnal urban routines on Twitter[C]∥Proceedings of the 6th International AAAI Conference on Weblogs and Social Media. Dublin,Ireland:[s.n.],2012:4-7. [9] KRINGS G,CARABRESE F,RATTI C,et al. Urban gravity:a model for inter-city telecommunication flows[J]. Journal of Statistical Mechanics:Theory and Experiment,2009(7):1-8.
[10]SILM S,AHAS R. The seasonal variability of population in estonian municipalities[J]. Environment and Planning A,2010,42(10):2527-2546. [11] 顾朝林,庞海峰. 基于重力模型的中国城市体系空间联系与层域划分[J]. 地理研究,2008,27(1):1-12.
GU C L,PANG H F. Study on spatial relations of Chinese urban system:gravity model approach[J]. Geographical Research,2008,27(1):1-12. [12] 陈彦光,刘继生. 基于引力模型的城市空间互相关和功率谱分析:引力模型的理论证明、函数推广及应用实例[J]. 地理研究,2002,21(6):742-752.
CHEN Y G,LIU J S. Derivation and generalization of the urban gravitational model using fractal idea with an application to the spatial cross-correlation between Beijing and Tianjin[J]. Geographical Research,2002,21(6):742-752.
[13] 周一星,胡智勇. 从航空运输看中国城市体系的空间网络结构[J]. 地理研究,2002,21(3):276-286.
ZHOU Y X,HU Z Y. Looking into the network structure of Chinese urban system from the perspective of air transportation[J]. Geographical Research,2002,21(3):276-286.
[14]WANG J,MO H,WANG F,et al. Exploring the network structure and nodal centrality of China’s air transport network:a complex network approach[J]. Journal of Transport Geography,2011(19):712-721.
[15] 戴特奇,金凤君,王姣娥. 空间相互作用与城市关联网络演进:以我国20世纪90年代城际铁路客流为例[J]. 地理科学进展,2005,24(2):80-89.
DAI T Q,JIN F J,WANG J E. Spatial interaction and network structure evolvement of cities in terms of China’s railway passenger flow in 1990s[J]. Progress in Geography,2005,24(2):80-89.
[16] 刘朝青. 基于流动空间的长三角城市社交联系研究[D]. 上海:上海师范大学,2013.
LIU Z Q. City social relation in Yangtze River Delta based on the space of flows[D]. Shanghai:Shanghai Normal University,2013.
[17] 甄峰,王波,陈映雪. 基于网络社会空间的中国城市网络特征——以新浪微博为例[J]. 地理学报,2012,67(8):1031-1043.
ZENG F,WANG B,CHEN Y X. China’s city network characteristics based on social network space:an empirical analysis of Sina micro-blog[J]. Acta Geographica Sinica,2012,67(8):1031-1043. [18]KANG C,ZHANG Y,MA X,et al. Inferring properties and revealing geographical impacts of intercity mobile communication network of China using a subnet data set[J]. International Journal of Geographical Information Science,2013,7(3):431-448. [19]YUAN Y,RAUBAL M,LIU Y. Correlating mobile phone usage and travel behavior:a case study of Harbin,China[J]. Computers,Environment and Urban Systems,2012,36(2):118-130. [20]LIU Y,SUI Z W,KANG C G,et al. Uncovering patterns of inter-urban trip and spatial interaction from social media check-in data[J]. PLOS One,2014,9(1):1-11. [21] 武文杰,董正斌,张文忠,等. 中国城市空间关联网络结构的时空演变[J]. 地理学报,2011,66(4):435-445.
WU W J,DONG Z B,ZHANG W Z,et al. Spatio-temporal evolution of the China’s inter-urban organization network structure:based on aviation data from 1983 to 2006[J]. Acta Geographica Sinica,2011,66(4):435-445.
[22] 施伯乐,汪卫,肖仰华. 信息网络挖掘与分析:机遇与挑战[J]. 软件产业与工程,2010(4):16-21.
SHI B L,WANG W,XIAO Y H. Information network mining and analysis:opportunities and challenges[J]. Software Industry and Engineering,2010(4):16-21. [23]HAYNES K E,FOTHERINGHAM A S. Gravity and spatial interaction models[M]. London:SAGE Publications,1984.
【中文责编:庄晓琼 英文责编:肖菁】
The Spatial Pattern of Population Flow among Cities based on “Baidu Migration”
LIU Wangbao*, SHI Enming
(School of Geographical Sciences, South China Normal University, Guangzhou 510631,China)
The spatial patterns for population flow among 369 cities in China based on “Baidu Migration” dataset collected during the period from February 7 to May 16 in 2015 are analyzed in this paper. The research results show that Chinese urban network based on population flow among cities has a clear hierarchical structure and level distinction which contains four main urban network systems,i.e. Yangtze River Delta, Pearl River Delta, Beijing Tianjin Tang and Cheng Du Chongqing, and four sub urban network systems,i.e. Urumqi (Changji), Xining (Hai-dong), Yulin (Ordos) and Zhaotong (Yibin). But Haixi area, Northeast China, Central China and Southwest China do not appear obvious urban network systems and those conditions do not match the status in national regional development strategy of those areas. “Hu Huanyong” line can reflect the spatial patterns of population flow at among cities, reflecting the profound influence of geographical environment on the population daily flow among cities. The scale of population flow among cities in southeast side of “Hu Huanyong” line is 12.80 times of that of northwest side with “Hu Huanyong line”. The Gravity model can test the population flow among cities based on mass inter-cities population flow data.
Baidu migration; population flow; the gravity model; spatial pattern
2016-04-11 《华南师范大学学报(自然科学版)》网址:http://journal.scnu.edu.cn/n
国家自然科学基金项目(41001088);国家重点基础研究发展计划(973计划)前期研究专项(2014CB460614);教育部人文社科青年项目(09YJC840016)
K901.2
A
1000-5463(2016)05-0067-07
*通讯作者:刘望保,教授,Email:wbliu@scnu.edu.cn.