李天籽 陆铭俊
[摘要] 文章基于2016年和2018年的腾讯位置大数据,采用社会网络分析法和QAP回归模型系统探究了中国人口流动网络的空间结构特征以及影响因素。研究结果表明:人口流动网络关联性增强,整体结构日趋稳健,但依然存在“东南密集,西北稀疏”的态势;经济发达、行政地位高的节点城市在人口流动网络中具有更强的吸引力和辐射力;人口流动网络的凝聚子群特征明显,人口流动仍以子群内流动为主,子群间联系较少;区域差异是人口流动的源动力,就业机会、工资收入以及迁移成本仍是影响人口流动的主要因素,随着生活水平的提高,舒适性需求对于人口流动的影响日渐凸显。
[关键词]人口流动网络;社会网络分析;腾讯位置大数据;QAP回归模型
[中图分类号] F061.5; C924.2[文献标识码] A[文章编号] 1673-0461(2022)02-0001-09
一、引言
人口流动是城市间物质流、信息流、资本流、技术流的重要载体,人口在城市间的迁移被认为是生产要素在空间上的重新配置,有助于推动社会、经济要素的重新集聚与扩散[1]。改革开放以来,中国经济迅速腾飞,城市化进程加快,劳动力迁移日趋活跃,人口流动已成为区域间相互联系的重要纽带。对于正处于城镇化、信息化、工业化、全球化加速推进期的中国来说,了解人口流动的空间特征以及基本规律有助于解决经济发展、疾病控制、交通拥堵等社会问题[2]。自2015年以来,流动人口规模进入调整期,跨区域流动人口比例快速增长,人口流出和回流的态势将长期并存。准确把握中国城际间人口流动的空间结构,深入开展城际人口流动影响因素研究,对于制定人口经济政策、合理引导人口流动具有重要的理论和现实意义。
自20 世纪90 年代以来,关于人口流动的研究逐步成为学术界热点,大量学者对人口流动的空间分布[3]、动力机制[4]、经济效应[5-6]、政策制定[7]等问题进行了深入研究。随着空间分析方法的成熟,人口流动的空间模式已成为流动人口研究的核心议题之一。张耀军和岑俏采用了热点分析以及空间回归分析等方法从省、市、县三个层面研究了中国人口空间流动格局[8]。刘涛等利用全局莫兰指数系统分析了中国流动人口空间格局的演变特征、形成机制及其城镇化效应[9]。但俊和阴劼利用地理加权回歸模型探究了中国县域流动人口的空间分布特征以及对城镇化的影响[10]。柏中强等采用Lorenz 曲线、空间分析及样带分析方法,研究了中国25省区人口分布的疏密结构、空间集聚性、纬向和经向规律[11]。邵大伟和吴殿鸣采用分形理论和ESDA 方法,揭示了山东省2000 年以来人口城镇化进程的新动向及空间特征,并剖析了全省城镇化的影响因素[12]。目前的研究主要利用地理学的空间分析方法探究人口流动的空间特征,更侧重于人口流动的规模和分布,并不能很好地展示人口流动的方向,而网络分析工具的出现恰好能够弥补传统地理学方法的不足。由人口流动起讫点、流动方式以及流动路线所构成的复杂网络为人口流动研究提供了新思路,能够更系统地认识人口流动的空间特征,进一步拓展了人口流动的研究范畴。
人口流动研究目前主要采用人口普查、抽样调查以及各级行政单元的年鉴数据,这类静态数据受到研究尺度和空间准确性限制,存在更新速度慢、空间粒度粗、获取成本高的特点,严重缺乏动态性和实时性,无法反映城市间人口流动的真实方向和格局特征。随着信息化水平的提高,科学技术手段不断被运用于人口流动领域,在如今数字化高速推进的背景下,手机等便携移动终端的兴起使得基于海量个体的时空行为追踪成为了可能。目前应用于人口流动研究的大数据可分为三类:第一类为网页数据,通过对用户打卡、签到、留言、搜索等内容挖掘分析后得到。潘碧麟等利用微博签到数据研究了成渝城市群空间结构及其城际间的人口流动特征[13]。邓楚雄等基于百度贴吧数据构建长江中游城市群人口流动矩阵并分析其中的网络联系[14]。该类数据主要依赖用户的主动性,研究样本较为受限。第二类为公共交通数据,通过对交通卡响应位置和响应频次统计后获得。刘耀林等基于公交刷卡数据分析武汉市居民的通勤特征和职住通勤模式[15]。许园园等基于地铁刷卡数据识别出上海市域的职住空间和通勤格局[16]。该类数据具有统计精确、位置清晰的特点,但也存在研究区域有限的问题。第三类为移动终端定位数据,该类数据具有尺度精细、样本量大的优点、能够反映个体属性以及跨区域流动特征。MARTIN 等利用曼哈顿下城地区一周内的WiFi探测数据,分析了城市内人群的移动轨迹以及联系性[17]。王垚等采用手机信令数据所代表的人流联系探究了江西省内的城市关联情况[18]。冯章献等基于百度迁徙大数据分析长春市春运期间人口流动空间格局以及动力机制[19]。与传统调查数据、网页数据以及公共交通数据相比,移动终端定位数据具有时空完备性高和分析预测性强等优势,在人口流动领域的研究中得到了广泛应用[20]。
本文的研究主要基于腾讯位置大数据平台所提供的人口迁徙数据,该数据包含了中国城市层面以天为单位的迁徙人次、迁徙方式、迁徙方向等出行信息,相较于以往研究中使用较多的百度迁徙数据以及高德地图位置大数据,腾讯位置大数据较少拆分完整的人口迁徙路径,能更真实地反映人口流动状态。此外,本文还考虑了人口流动的方向性,利用社会网络分析法构建人口流动网络的空间关系矩阵,重塑人口流动的路径与强度,深入剖析人口流动网络空间结构,为人口流动研究提供新的视角。
二、数据来源和研究方法
(一)数据来源
本文使用腾讯位置大数据平台(https://heat.qq.com/bigdata/qianxi.html)所提供的人口迁徙数据作为主要研究样本。腾讯位置大数据平台于2015年上线,依托腾讯公司的通信、社交、游戏、视频等服务,能够在保护个人隐私的前提下收集到各阶层和各年龄段用户的地理位置,通过对个人层面的用户行为进行分析和挖掘,实现人口迁徙时空轨迹和特征的即时动态可视化。本文使用Python编程软件爬取了中国288个地级市的人口迁徙数据,首先利用浏览器查看腾讯位置大数据完整网页中关于迁入和迁出人次的源代码,其次查询相应数据参数并获得服务器地址,然后批量设置数据日期和城市名称并构建循环语句,最后经过调试、校对、整理,批量获取相应数据。腾讯位置大数据平台提供了2016年至2018年完整的人口迁徙日度数据,本文综合考虑研究的动态性以及人口流动网络变化的显著性,对2016年和2018年的每日流动人次数据进行对照分析,将原始数据汇总处理后建立人口流动矩阵,列表示流出城市,行表示流入城市,矩阵中元素是当年由起始地到目的地的流动人次总和。A222225E-1F04-4AB6-934C-5DE3504D371A
实际上,2015年以后中国人口流动呈现出新的特征。《中国流动人口发展报告2018》指出,全国流动人口总规模自2015年以后缓慢下降,跨省流动人口比例迅速增长,中西部吸纳的流动人口数量增加,人口流动空间模式逐渐多元化,中国的人口流动步入新阶段。本文使用的时间样本能够全面反映2015年之后人口流动特征以及空间模式,突破了传统调查数据的时空限制。
(二)研究方法
1.社会网络分析法
社会网络分析方法(Social Network Analysis,SNA)是基于图论和数学方法发展起来的定量分析方法,用以刻画网络的关系、形态和类型,测度网络的各种结构性特征,该方法已被广泛用于经济学、社会学、地理学、人口学等领域。社会网络分析法认为,社会是由各种关系构成的巨大网络,各个行动者是网络中的节点,通过研究网络结构可以把握个体间的关系,从而揭示网络的整体性与层次性。人口流入流出地可被看作社会网络中的节点,通过对所有节点及其联系进行研究,便能够了解城市间人口流动格局以及网络特征,进而对流动人口的社会行为进行解释。本文主要采用社会网络分析法中的网络密度分析、中心性分析以及凝聚子群分析对中国城市间的流动人口展开研究。
(1)网络密度分析。网络密度指的是一个关系网络中各个节点间联系的紧密程度,由网络实际存在的联系除以理论上存在的联系数量得到,网络密度越大,网络关系越复杂,表明网络节点之间的联系越紧密。计算公式如下:
其中D为网络密度,k为城市节点数,d为两点间实际存在的联系数量。
(2)中心性分析。“中心性”是一个结构位置指标,是行动者在网络中权力的量化,越接近中心,影响力越大。在人口流动网络中,不同城市间的联系强度和方向存在差异,本文采用度数中心度与中间中心度对不同城市在人口流动网络中的影响力和地位进行分析。
度数中心度是指与该点直线相连的点数,是一个点与其他点产生联系的能力,计算公式为:
CAD(i)=i的度数 (2)
式中:CAD为度数中心度,度数即为与该点直线相连的点的数量。
中间中心度测量的是某个节点对资源的控制能力,研究目标节点在多大程度上位于其他两个节点之间。计算公式为:
(3)凝聚子群分析。在社会网络分析中,将存在直接、密切、互惠关系的成员所构成的子集合定义为一个凝聚子群。通过对网络中凝聚子群的数量、凝聚子群间关系,以及凝聚子群内部成员互动进行研究,能够揭示网络内部的结构状态以及整体网络的发展特征。本文使用块模型将人口流动网络中的各城市节点按照一定的标准进行划分,并运用迭代相关收敛法(CONCOR)进行分析,进而对人口流动网络的内部微观结构重点研究。
2.QAP分析方法
QAP(Quadratic Assignment Procedure,二次指派程序)作为一种针对关系数据的非参数置换检验方法,主要用于解释“关系”之间的关系,该模型以若干个1-mode N×N的网络矩阵为自变量,回归同类网络矩阵,判断回归系数并进行显著性检验。根据本文的研究思路,需要对影响城际人口流动的多种关系因素进行假设检验,由于关系矩阵中存在结构性的自相关会产生“共线性”问题,导致基于OLS的多元回归方法的变量显著性检验失效,本文使用QAP回归分析方法能够避免因观测值相关引起的统计偏误[21]。具体计算步骤如下:第一,设置因变量和自变量网络矩阵;第二,对因变量网络矩阵和自变量网络矩阵中对应的长向量元素进行常规的多元统计回归分析;第三,对因变量网络矩阵的各行各列进行随机置换,重新计算回归,保存系数估计值和判定系数并多次重复之前步骤,最终得到各统计量的标准误。
三、中国人口流动网络特征
(一)中国人口流动网络的总体特征
在人口流动网络中,城市可以被看作是网络中的节点,不同城市间的人口流动构成了城际人口流动网络的边,网络密度能够反映人口流动网络中城市之间的疏密关系,城市间的关联关系数量越多则整体网络密度越大。由于社会网络分析法中的密度分析只適用于二值矩阵,因此对人口流动矩阵进行二值化处理,高于人口迁移指数平均值的数值记为1,表示关联显著,低于平均值的数值记为0,表示关联不明显。将处理后的矩阵数据导入UCINET 6软件进行网络密度计算,并利用其自带的NetDraw软件将城际人口流动网络可视化。由于城市节点过多,图1和图2仅展示了由省会城市和直辖市构成的网络结构图。
从图1和图2中可知,人口流动空间关联与地理位置存在较大关系,同一区域的城市人口流动关联较强,地理位置较远城市的关联性相对较弱。2016年和2018年人口流动网络密度值分别为0.0553和0.0624,增幅约12.8%,说明人口流动网络结构更为稳健,关联性大幅度增强,符合人口流动的理想期望。各城市的人口流动水平也得到一定提升,但居于核心和主导地位的流出和流入地区的基本格局并未改变,北京、上海、广州始终是人口流动最多的城市。从空间分布上来看,大规模的人口流动主要集中在“胡焕庸线”的东南侧,符合我国人口分布的基本情况。东南侧的自然条件、经济条件、社会条件相对优越,近年来交通基础设施逐步完善,“胡焕庸线”两侧人口跨区域流动增多,但流向分布依然呈现明显的“东南密集,西北稀疏”的态势。
(二)中国人口流动网络的节点特征
在人口流动所形成的有向网络中,每个点的度数中心度包括了点出度和点入度,点出度指由该城市人口流出到其他城市的数量,点入度是指人口流入该城市的数量,根据点出度与点入度的差值能够判断该城市的人口流动水平。由于篇幅原因,表1仅展示了全国重要城市的度数中心度,与2016年相比,2018年各城市的出度中心度和入度中心度都有一定的提升,表明人口流动更加的活跃。城际的人口流动大体可以分为三种类型:第一类是人口净流入地区,即出入度差为负且负值相对较小,代表城市主要有北京、上海、广州、深圳、重庆、杭州等经济发达城市;第二类是人口流动相对平衡的地区,即出入度差在0附近波动,以济南、昆明、盐城、兰州、宝鸡为代表;第三类是人口净流出地区,即出入度差为正且正值相对较大,以保山、鸡西、鹤岗、庆阳、双鸭山为典型。从总体上看,大部分城市都处于人口流出的状态,人口主要向少数经济发达的城市聚集,从空间上看,人口流动呈现出“东入内出”的特征,东部沿海城市仍然是人口流入的热点地区,中西部以及东北城市是人口流出的主要地区,“孔雀东南飞”的人口流动模式呈现高度稳定性。A222225E-1F04-4AB6-934C-5DE3504D371A
通过对城际人口流动网络进行度数中心度分析发现:在点出度方面,2016年和2018年的平均值分别为5.46和6.21,点出度较小的城市主要分布在甘肃、青海、新疆、西藏、内蒙古、贵州等地区,这些地区聚集着大量少数民族,其相对独特的文化和宗教信仰可能会阻碍区域人口流动。点出度高于7的城市主要分布在四川、安徽、河南、黑龙江、吉林、湖南等省份,这些省份的外出务工人员较多,城市经济水平相对一般,人口以外流为主。点出度最高的城市主要有北京、上海、重庆、广州、深圳、成都等,都是经济水平较高、交通发达的枢纽城市,人口流动频繁,流入和流出数量都相对较大。在点入度方面,2016年和2018年的平均值为5.41和6.17,约有23%和20%的城市高于平均值,北京、上海、广州、杭州、深圳、西安、天津、重庆、成都等城市处于流入规模前列,无一例外,这些城市都为发达地区,在经济、社会保障、商业环境、就业机会等方面的优势对人才具有更大吸引力。人口流入最少的城市主要集中在西北地区和东北地区,这些城市产业相对单一,经济较为落后、缺少就业机会,对人才缺乏吸引力。本文还对整个城际人口流动网络进行了中心势计算,用以刻画网络图的整体中心性。2018年的网络点出度中心势和点入度中心势力分别为0.157和0.901,相较于2016年的0.088和0.795有着明显的增长,城际人口流动网络中人口流入和流出存在非均衡性,人口仍向经济发达城市集中。
除了度数中心度外,各城市节点还存在中间中心度,能够具体反映人口流动网络中城市所扮演的“媒介者”的角色,表征各城市对资源的控制程度。表2展示了2016年和2018年城际人口流动网络中中间中心度最大的前15位城市。根据表2的结果可知,中间中心度较高的城市都具有较高的行政地位,经济较为发达,其中北京和上海处于第一梯度,这两个城市作为中国的政治中心和经济中心,是全国重要的交通枢纽,铁路、公路、航线十分密集,能够直接到达全国多数地点,无论是经济、政治还是交通都具有非常强的把控能力。广州、深圳、西安、重庆、成都的中间中心度位于第二梯度,这些城市分别是华南、西北、西南地区的重要节点,经济、政治、交通都具有较高的地位,能够对一定区域内的人口流动网络产生较大的影响力。武汉、哈尔滨,昆明、郑州、天津、长春、沈阳、青岛、大连、杭州等城市的中间中心度位于第三梯度,对各自省内的人口流动网络具有一定的控制力。从总体来看,城市的中间中心度和城市的行政地位、交通属性、经济水平是呈正向关系的,城市的综合水平越高,所扮演的角色越重要,对人口流动网络的控制力越强。2018年与2016年相比,除了北京和上海之外,大部分城市的中间中心度有一定程度的降低,这也说明随着交通基础设施的完善,人口流动的通达性提高,关键节点城市对网络的控制能力下降。本文计算了整体网络的中间中心势,从2016年的0.3793下降至了2018年的0.3725,进一步说明交通网络密度的提高降低了节点城市的资源控制力。
(三)中国人口流动网络的凝聚子群特征
本文采用空间聚类块模型对人口流动网络进行分析,根据节点地理位置和节点间联系紧密程度将网络中的所有城市划分成不同的凝聚子群,并对子群内部和子群之间的关系进行研究。此处的凝聚子群并非城市之间相互结成联盟的意思,而是看哪些城市间存在相对较强的、直接的、紧密的、经常的或者积极的联系[22]。利用迭代相关收敛法(CONCOR)对人口流动网络进行非重叠性聚类分析,将最大重复数设定为25,最大切分深度设定为2,集中标准设定为0.2,最终得到8个凝聚子群。
根据表3的结果可以发现,凝聚子群中的大多数城市都相互接壤,在地理位置上存在直接的连通性。第1子群主要由河北的多数城市、山东的多数城市以及北京构成,第2子群包含了天津、唐山、秦皇岛、内蒙古东部的部分城市以及东北三省的所有地级市,第3子群则由山西、内蒙古中部城市以及河南北部的部分城市构成,第4子群包含了内蒙古西部的阿拉善盟、河南西部的三门峡,以及陕西、宁夏、甘肃、新疆、青海的所有城市。第1至第4子群几乎囊括了中国北方所有城市,子群也总体按照东北、华北、西北这些自然地理板块进行划分,内蒙古狭长的地理特征导致其所辖的城市與不同子群内城市的联系紧密,2018年与2016年相比,子群变动并不明显,仅第3子群减少了河南的部分城市。第5子群是以上海为中心的长三角地区,主要由江苏、浙江、安徽及江西部分城市构成,第6子群包含了重庆、温州、以及福建、四川、云南、西藏的部分城市,该子群的城市地域跨度较大,第7子群则是由湖北、湖南、河南、江西等华中地区城市构成,第8子群主要由广东和广西构成,包含了珠三角地区的所有城市。第5至第8子群包含了中国中部和南部地区的几乎所有城市,四个子群也相对较大,占比总样本量的58%,子群总体是按照自然地理分布,2018年与2016年相比,第6子群和第7子群的变动相对较大,主要体现在福建和河南的部分城市。总的来看,城际人口流动仍然是以区域内流动为主,但是已经存在一定的跨区域流动倾向,交通基础设施的逐步完善正在弱化地理距离的限制、加强城市间的联系。
从表4中可以看出,第1、第4、第8子群内部密度处于领先位置,第2、第3、第5子群内部密度处于中间梯度,第6、第7子群内部密度则比较小,2018年各凝聚子群的密度较2016年都有了较为明显的增长。凝聚子群的密度越大表明城市间人口流动越频繁,联系越密切。每个子群都包含了经济发展比较好以及经济相对落后的城市,经济发达的城市在就业、公共服务等方面更具优势,能够获得落后地区的劳动力供给,经济相对落后的城市能够凭借自身资源、环境以及政策支持吸引发达地区的人员流入以创造更大的发展机会,人口在发达地区与落后地区的频繁流动,能够带动资本、信息、技术的快速迁移,进而实现发达地区的持续繁荣与落后地区的快速发展。
为了更加简洁地分析,将表4密度矩阵中的值与整体网络密度进行对比,若子群密度高于整体网络密度,则将其修改为1,否则修改为0,最后得到中国人口流动网络的像矩阵(见表5)。从整体上来看,城市间的联系还是局限在子群的内部,大部分子群间的联系强度小于整体网络密度,子群间联系仍然比较松散。其中第1、第2、第3子群相互联系比较密切,城市多数分布在华北和东北地区,地理距离相对较近,人口流动较为频繁,同样的第7、第8子群内部的城市主要分布在华中和华南,两个子群地理邻近,联系也更为紧密。2018年的子群间联系与2016年相比有一定程度的增强,第1与第3、第3和第4、第5和第6子群都产生较为紧密的联系,经济发展以及交通基础设施完善都有助于跨区域人口流动,促进不同凝聚子群间的联系。A222225E-1F04-4AB6-934C-5DE3504D371A
四、中国人口流动网络的影响因素
地区间特定要素的差异是人口流动的根本原因。新古典理论强调经济因素在人口流动中的主导作用,但是忽视了自然环境与人工环境的影响。人口推拉理论认为推动人口迁移的主要因素包括收入差距、就业机会、对外开放、产业结构、空间距离等[23-24]。随着人们生活水平的提高,基于舒适度理论解释人口流动的研究也逐渐增多,居住环境、教育医疗资源、社会保障等也被认为是影响人口流动的重要因素[25-26]。本文选用QAP回归模型,对人口流动网络的影响因素进行具体分析。
(一)模型构建和指标选取
1.模型构建
本文设定的关系数据计量模型如下:
Y=β0+β1X1+β2X2+…+βiXi+U (4)
其中Y和Xi分别为被解释变量和解释变量,βi是估计参数,U为残差项。关系数据计量模型与属性数据计量模型在形式上是相同的,但不同点在于所有变量均为n阶方阵。本文所用的各项指标变量均为288×288的1mode关系矩阵,其中忽略对角线的元素。
2.指标选取
被解释变量。本文仍以二值化处理后的人口流动网络作为被解释变量,根据每行流动人次的平均值将各元素进行0和1赋值,高于平均值的记作1,低于平均值的记作0。
解释变量。本文选取了就业机会、收入水平、对外开放、产业结构、公共服务、居住环境和迁移成本等方面的10个指标,构建网络矩阵作为计量模型的解释变量。其中迁移成本是通过铁路距离估计值和铁路的运行速度计算得到[27],其余数据则源于相应年份的《中国城市统计年鉴》,具体的计算说明见表6。
(二)实证结果分析
根据QAP回归分析方法,选择2 000次随机置换,计算出调整后的R2分别为0.145和0.171,且通过了1%的显著性水平检验,说明这些指标能较好地解释人口流动网络的形成。表7显示了相关指标的回归结果:就业规模差距和工资收入差距对人口流动网络具有显著的正向影响,就业机会越多、工资水平越高的城市能够吸引人口流入,根据标准化系数可知,就业仍是影响人口流动最重要的因素之一;城市的开放程度以及产业结构也会对人口流动产生影响,城市开放程度和第三产业都对人口流动具有正向作用,第二产业则存在较为明显的负向作用。城市使用外商直接投资越多,对外联系越紧密,能对外部人口产生更大吸引力,第三产业越发达,表明服务业的劳动力需求越强烈,进而影响人口城际流动。第二产业中采矿业、制造业、电力、热力、燃气等行业更多依赖机械化生产,与劳动力投入产生替代效应,因此会对人口流动产生一定的抑制作用;城市间教育资源和医疗资源的差异对人口流动具有显著的正向影响,教育水平、医疗水平的差异越大,越能促进人口流动,高水平医院和高等学校有利于流动人口获得更高的生活质量,享受更多的社会福利;社会保障水平也能对人口流动产生重要影响,当流动人口具备较好的经济水平时,社会保障这类公共服务则成为了流动人口的重要参考依据,根据标准化系数可知,社会保障差异与人口流动显著正相关,城市间社会保障水平差异越大,人口流动越明显;城市间的自然环境差异也会影响人口流动,相较于2016年,2018年的样本回归系数通过了10%的显著性检验,并且标准化系数提高,说明良好的居住环境逐步成为人口流动过程中的重要参考标准;根据地理学第一定律,地理距离是影响所有要素流动的首要因素,空间距离越远,人口迁移的阻力越大,本文用普通铁路运行时间来衡量人口的迁移成本,从回归结果可知,迁移成本网络的标准化系数在1%水平上显著为负,迁移成本的增加会导致人口流动产生衰减效应,随着高铁线路的开通以及航空票价的降低,迁移成本进一步降低,地理距离影响也将逐渐减小。对比2016年和2018年回归结果,除迁徙成本、就业机会、工资收入等常规因素外,教育医疗、社会服务、居住环境等因素的重要性凸显,这在一定程度上能够反映出人们对高品质生活的追求。
五、结论与启示
本文基于腾讯位置大数据平台提供的人口迁徙数据,利用社会网络分析法研究了中国城际人口流动网络特征,并具体分析了城际人口流动的影响因素,力求深化大数据视角下对中国人口流动格局的认识。研究结果表明:第一,城际人口流动网络结构日趋稳健,但整体网络密度并不大,人口流动分布“东南密集,西北稀疏”的态势并未改变;第二,在城际流动网络中人口的流入和流出存在非均衡性,行政地位和经济水平较高的城市在人口流动网络中具有更强的影响力,人口主要从经济欠发达地区流向发达地区;第三,城际人口流动网络存在明显的群體性特点,人口流动虽然仍以区域内流动为主,但是跨区域流动倾向逐渐增强;第四,就业机会、工资收入以及迁移成本仍然是影响人口流动决定性因素,随着生活条件的改善,教育医疗、社会服务以及居住环境等因素对人口流动的影响程度也进一步提高。
从以上可以看出,区域差异是影响人口流动最重要的因素,大城市往往聚集更多资源,对人口流动有着更强的吸引力,而中小城市受制于当地的经济、社会、环境,往往成为人口流失的重灾区,这也反映出中国人口流动不平衡的问题。有鉴于此,提出以下建议:第一,充分尊重人口流动规律,降低人口流动障碍和迁徙成本,促进人口有序流动;第二,合理促进城市群人口集聚,不同城市群应采取差异化的人口政策,东部人口聚集的城市群需减小大城市人口流入压力,增强中小城市的吸引力。中西部城市群要提高中心城市人口集聚度,减少人才流失;第三,推动不同区域和不同等级城市的教育、医疗、社会保障等公共服务均等化,改善居住环境,促进区域协调发展。
基金项目:教育部人文社会科学重点研究基地重大项目《新一轮东北振兴与东北亚区域合作研究》(16JJD790013);吉林大学基本科研业务费项目(2018XXJD16)。A222225E-1F04-4AB6-934C-5DE3504D371A
作者简介:李天籽(1976—),女,辽宁鞍山人,博士,吉林大学东北亚研究院教授、博士生导师,主要研究方向为区域经济、人口流动;
陆铭俊(1992—),男,江苏南通人,博士研究生,主要研究方向为区域经济、人口流动。DOI: 10.13253/j.cnki.ddjjgl.2022.02001中国人口流动网络特征及影响因素研究
——基于腾讯位置大数据的分析李天籽,陆铭俊(吉林大学东北亚研究院,吉林长春130012)
[参考文献]
[1]DE HAAS H. Migration and development: a theoretical perspective[J]. International migration review,2010,44(1):227-264.
[2]刘望保,石恩名.基于ICT的中国城市间人口日常流动空间格局:以百度迁徙为例[J].地理学报,2016,71(10):1667-1679.
[3]劳昕,沈体雁.中国地级以上城市人口流动空间模式变化——基于2000和2010年人口普查数据的分析[J].中国人口科学,2015(1):15-28.
[4]严善平.中国省际人口流动的机制研究[J].中国人口科学,2007(1):71-77.
[5]王飞,郭颂宏,江崎光男.中国区域经济发展与劳动力流动——使用区域连接CGE模型的数量分析[J].经济学(季刊),2006(3):1067-1090.
[6]纪韶,朱志胜.中国城市群人口流动与区域经济发展平衡性研究——基于全国第六次人口普查长表数据的分析[J].经济理论与经济管理,2014(2):5-16.
[7]蔡昉.人口迁移和流动的成因、趋势与政策[J].中国人口科学,1995(6):8-16.
[8]张耀军,岑俏.中国人口空间流动格局与省际流动影响因素研究[J].人口研究,2014,38(5):54-71.
[9]刘涛,齐元静,曹广忠.中国流动人口空间格局演变机制及城镇化效应——基于2000和2010年人口普查分县数据的分析[J].地理学报,2015,70(4):567-581.
[10]但俊,阴劼.中国县内人口流动与就地城镇化[J].城市发展研究,2016,23(9):88-93.
[11]柏中强,王卷乐,杨雅萍,等.基于乡镇尺度的中国25省区人口分布特征及影响因素[J].地理学报,2015,70(8):1229-1242.
[12]邵大伟,吴殿鸣.山东省人口城镇化动态特征及其影响因素[J].经济地理,2013,33 (9):51-57.
[13]潘碧麟,王江浩,葛咏,等.基于微博签到数据的成渝城市群空间结构及其城际人口流动研究[J].地球信息科学学报,2019,21(1):68-76.
[14]邓楚雄,宋雄伟,谢炳庚,等.基于百度贴吧数据的长江中游城市群城市网络联系分析[J].地理研究,2018,37(6):1181-1192.
[15]刘耀林,陈龙,安子豪,等.基于公交刷卡数据的武汉市职住通勤特征研究[J].经济地理,2019,39(2):93-102.
[16]许园园,塔娜,李响.基于地铁刷卡数据的城市通勤与就业中心吸引范围研究[J].人文地理,2017,32(3):93-101.
[17]MARTIN W T, NICHOLAS J, AWAIS M, et al. Digital footprints: using WiFi probe and locational data to analyze human mobility trajectories in cities[J]. Computers, environment and urban systems,2018,72:4-12.
[18]王垚,钮心毅,宋小冬,等.人流联系和经济联系视角下区域城市关联比较——基于手机信令数据和企业关联数据的研究[J].人文地理,2018,33(2):84-91,146.
[19]冯章献,张瑜,魏冶,等.基于百度迁徙数据的长春市春运人口流动时空格局与动力机制[J].经济地理,2019,39(5):101-109.
[20]LAI J B, PAN J H. Chinas city network structural characteristics based on population flow during Spring Festival travel rush: empirical analysis of “tencent migration” big data[J]. Journal of urban planning and development, 2020,146(2):04020018.
[21]KRACKHARDT D. Predicting with networks: nonparametric multiple regression analysis of dyadic data [J]. Social networks,1988,10(4):359-381.
[22]沈詩杰,沈冠辰.中国省际人口流动的空间结构特征研究[J].人口学刊,2020, 42(4):103-112.
[23]LEE E S. A theory of migration[J]. Demography,1996,3(1):47-57.
[24]李拓,李斌.中国跨地区人口流动的影响因素——基于286个城市面板数据的空间计量检验[J].中国人口科学,2015(2):73-83,127.A222225E-1F04-4AB6-934C-5DE3504D371A
[25]CAO Z, ZHENG X Y, LIU Y S, et al. Exploring the changing patterns of Chinas migration and its determinants using census data of 2000 and 2010[J]. Habitat international,2018,82:72-82.
[26]张伟丽,晏晶晶,聂桂博.中国城市人口流动格局演变及影响因素分析[J].中国人口科学,2021(2):76-87.
[27]石林,傅鹏,李柳勇.高铁促进区域经济一体化效应研究[J].上海经济研究,2018(1):53-62.Research on the Characteristics and Influencing Factors
of Chinas Population Flow Network
—Based on Tencent Location Big Data Analysis
Li Tianzi, Lu Mingjun
(Northeast Asian Studies College, Jilin University, Changchun 130012, China)
Abstract: Based on Tencent location big data in 2016 and 2018, this paper uses social network analysis methods and QAP regression model system to explore the spatial structure characteristics and the influencing factors of Chinas population flow network. The research results show that: The relevance of the population flow network has increased, and the overall structure has become increasingly stable, but there is still a trend of “ being dense in the southeast and being sparse in the northwest”; Node cities with developed economy and high administrative status have stronger attractiveness and control in the population flow network; The characteristics of cohesive subgroups of the population flow network are obvious, and the population flow is still dominated by the flow within the subgroups, and there are few connections between the subgroups; Regional differences are the source of population mobility. Employment opportunities, wage income and migration costs are still the main factors affecting population mobility. With the improvement of living standards, the impact of comfort requirements on population mobility has become increasingly prominent.
Key words:population flow network; social network analysis; Tencent location big data; QAP regression model
(責任编辑:张积慧)A222225E-1F04-4AB6-934C-5DE3504D371A