王 淼 杨伯钢 谢燕峰 陶季奇 郭燕宾 陈 娟
(1. 北京市测绘设计研究院, 北京 100038; 2. 城市空间信息工程北京市重点实验室, 北京 100038)
人口空间分布是人口地理学研究的重要领域[1]。研究城市人口空间分布,发现城市人口分布差异,对城市社会经济、产业布局、建设规划及城市的健康可持续发展具有重要意义。面对城市扩张发展以及人口流动不断变化,获取人口数据显得尤为重要,传统人口普查统计数据多以“年”作为时间尺度,更新时间过长,因此,以人口普查为手段的统计方法在迅速发展的城市里作用局限性较大。
随着大数据时代的来临、信息科学技术的发展以及移动电话的普及,各大运营商架设的手机基站所采集的大规模手机信令数据在轨迹数据挖掘、城市国土规划和人口空间分布等研究领域中发挥着重要作用[2]。相对于以往城市人口主要采用普查手段,手机信令基于基站定位是一种时空轨迹大数据[3],以“日”“月”“季度”等时间作为尺度,在区域-城市-区县-街道各级尺度均有涉及,对人口昼夜活动区域进行监测更新,是人口大数据天然采集器[4]。
在此基础之上,本文以北京市为例,以乡镇街道为研究尺度,利用手机信令月粒度人口数据,分时分地区对北京市人口空间分布进行分析研究。
手机信令数据来源于北京移动、联通、电信三大电信运营商2019年9月整月数据,数据量约30亿条,包括用户的唯一标识码、时间戳、位置更新、基站编号、归属地等信息[5]。
街道数据来自北京市地理国情常态化监测(2019年)地理单元乡镇级行政区划数据成果。
北京位于华北地区,中心位置116°20′E、39°56′N,东与天津毗连,其余均与河北相邻[6],北京市总面积约1.64×104km2,北京市下辖16个市辖区,327个乡镇街道(2019年)。
首先是数据预处理,根据数据需求和条件,逐一筛选记录,剔除无法定位、信息缺失、数据不连续、难以识别等异常值,形成手机信令数据样本[7];根据基站编号、时间戳,计算每条记录对应的空间位置;根据唯一标识,提取行动轨迹和驻留点位信息;分类分街道计算得到北京市乡镇街道尺度下每天白天时段的白天服务用户、白天工作用户、白天过路用户、每天夜晚时段的夜晚服务用户、夜晚居住用户、夜晚过路用户6个不同口径的服务用户数据;利用手机信令数据与北京市区划数据相结合,分析北京市人口空间分布及均衡性[8]。
(1)白天服务用户:指每天白天时段(早上08:00:00—晚上09:00:00,城市人口活跃的时间段),在该区域出现的服务用户的基础上,排除掉路过该区域的用户,代表了该区域每天白天主要服务的人口。
(2)白天工作用户:指每天白天时段,在该区域稳定工作的用户。
(3)白天过路用户:指每天白天时段,路过该区域的用户,每次经过不超过2 h。
(4)夜晚服务用户:指每天夜晚时段(晚上09:00:00-次日上午08:00:00,城市人口休息的时间段),在该区域出现的服务用户的基础上,排除掉路过该区域的用户,代表了该区域每天夜晚主要服务的人口。
(5)夜晚居住用户:指每天夜晚时段,在该区域稳定居住的用户。
(6)夜晚过路用户:指每天夜晚时段,路过该区域的用户,每次经过不超过2 h。
北京市乡镇街道数量多,可分析其用户数量以及用户密度分布规律。利用Excel表格对用户数量以及用户密度进行正态分布密度函数[9]统计。
(1)
对数正态分布(log-normal distribution,LND)指随机变量的对数符合正态分布[10]。它和正态分布的关系是:如果X是正态分布的随机变量,则exp(X)为对数正态分布;同样,如果Y是对数正态分布,则ln(Y)为正态分布。
对于x>0,对数正态分布的概率密度函数为
(2)
其中,α为变量x的对数平均值;β为变量x的对数标准差[11]。
拟合曲线趋势由于参数α和β的结果不同而不同,拟合趋势主要有两类形状,f(x)值随着用户的增加先增加然后下降,此类形状表明人口分布相对来说更均衡,f(x)值随着用户的增加直接下降,此类形状表明人口分布相对更不均衡[12]。
3.1.1不同口径分街道人口数量分布
根据图1可知,北京市分街道六个状态用户数量分布整体呈现集中在中心城区。白天服务用户数量空间分布上主要聚集在首都功能核心区、中心城区以及新城靠近中心城区边界,呈现由首都功能核心区往外扩散态势;白天工作用户数量空间分布上主要聚集在中心城区以及新城中心乡镇街道,呈现区域重点乡镇街道中心聚集态势;白天过路用户数量空间分布上主要聚集在中心城区以及新城中心乡镇街道,呈现中心聚拢态势;夜晚服务用户数量空间分布上主要聚集在中心城区以及新城中心乡镇街道,呈现区域重点乡镇街道中心聚集态势;夜晚居住用户数量空间分布上主要聚集在中心城区以及新城中心乡镇街道,呈现区域重点乡镇街道中心聚集态势;夜晚过路用户数量空间分布上主要聚集在中心城区以及新城中心乡镇街道,呈现区域重点乡镇街道中心聚集态势。
(a)白天服务用户
(b)夜晚服务用户
(c)白天工作用户
(d)夜晚居住用户
(e)白天过路用户
(f)夜晚过路用户[审图号:京S(2017)009号]图1 北京市分乡镇街道6个不同口径的用户数量分布图
根据图2可知,北京市分街道六个状态用户密度空间分布集中在中心城区,由首都功能核心区向外辐射呈现。白天和晚上服务用户密度空间分布上主要聚集在朝阳区以及首都功能核心区的商务经济发展区,整体分布环绕在中心城区中;白天工作用户密度空间分布在朝阳区以及首都功能核心区的商务经济发展区、海淀区高新技术产业开发区,整体上呈现根据产业发展而聚集态势;白天和晚上过路用户密度空间分布上主要聚集在交通枢纽以及景区所在街道,整体上呈现根据旅游业发展而聚集态势;夜晚居住用户密度空间分布上主要聚集在中心城区以及新城中心乡镇街道,呈现区域重点乡镇街道中心聚集态势。
(a)白天服务用户密度
(b)夜晚服务用户密度
(c)白天工作用户密度
(d)夜晚居住用户密度
(e)白天过路用户密度
(f)夜晚过路用户密度[审图号:京S(2017)009号]图2 北京市分乡镇街道6个不同口径的用户密度分布图
计算北京市分区域6个不同口径的用户数量以及密度对数正态分布参数α和β结果,绘制出每个区域的对数正态分布拟合曲线,以观察每个区域的用户数量以及密度分布函数特征[13]。
3.2.1分街道人口数量均衡性分析
选取东城区、海淀区、通州区为例,分析各街道用户数量分布特征,如图3所示,白天服务用户数量f(x)值随着用户数量的增加先增加后下降,区域用户数量空间分布相对来说均衡一些。门头沟区街道用户数量f(x)值随着用户数量的增加直接下降,区域用户数量空间分布相对来说不均衡。
图3 东城、海淀、通州和门头沟区各街道白天服务用户数量结构图
3.2.2分街道人口密度均衡性分析
如图4所示,东城区和海淀区用户密度f(x)值随着用户密度的增加先增加后下降,区域用户密度空间分布相对来说均衡一些。通州区和门头沟区用户密度f(x)值随着用户密度的增加直接下降,区域用户密度空间分布相对来说不均衡。
图4 东城、海淀、通州和门头沟区各街道白天服务用户密度图
采用白天工作用户密度数据以及夜晚居住用户密度数据,计算其比值可知北京市整体职住用户比较大[14],朝阳区建外街道职住用户比最大,其次是西城区金融街街道,昌平区东小口镇最小,工作用户的比重大于规划值,存在就业功能空间外溢,居住功能空间紧张的现象,职住用户分布不匹配。
[审图号:京S(2017)009号]图5 北京市乡镇尺度职住用户比统计图
根据手机信令用户数据分析可知,北京市人口分布呈现出由首都功能核心区向中心城区和新城扩散的态势,对于手机信令可分时段统计用户,呈现出人口密度分布并不平衡,中心城区和新城个别街道如卢沟桥街道、新桥街道、沙河地区等工作居住用户远超于其他乡镇街道,人口聚集明显。
北京市人口的特点是流动性大、基数大和增长迅速,人口分布与经济发达程度高度相关[15]。随着中心城区以及新城的建设,首都功能核心区的疏解,北京市人口会根据产业变动发展而分布,促进周边乡镇街道产业发展,扩大人口分布范围,缓解因人口聚集带来一系列城市压力等问题。