基于POI和夜光数据的滇中地区人口空间化模拟研究

2022-11-18 02:36赵政权
贵州大学学报(自然科学版) 2022年5期
关键词:夜光格网人口

赵政权,罗 虹

(云南国土资源职业学院 国土空间信息学院,云南 昆明 652501)

人口问题一直是社会经济发展的热点,人口数据空间化是采用合适的方法,筛选适合的解释因子对人口统计数据搭建模型,进行离散化处理后探讨区域人口的空间分布规律,模拟人口的地理分布[1-3]。主要的方法目前都基于土地利用数据[4-8]、兴趣点数据[9]、多源遥感数据融合[10]、位置大数据[11-12]进行研究。获取高精度的人口分布信息对于人口、资源和环境的合理规划、管理及区域的可持续发展研究都具有重要的意义[13]。

夜间灯光数据作为重要的人类活动强度发展指标,因其成本低、周期短、获取方便,对于人口的研究具有无可比拟的优势。早前使用较为广泛的是美国军事气象卫星计划搭载的业务线扫描系统传感器夜光数据(defense meteorological satellite program/operation linescan system,DMSP/OLS),其拍摄的夜光产品空间分辨率为1 km,适用于大尺度范畴的州、国家及地区研究。因DMSP/OLS夜光数据分辨率较低,2012年美国开始启用新一代的国家极地轨道运行环境卫星系统预备工程搭载的可见光红外成像辐射仪夜光数据(national polar-orbiting operational environmental satellite system preparatory project/visible infrared imaging radiometer,NPP/VIIRS),共有22个波段,星下点空间分辨率为375 m,比DMSP/OLS夜光数据分辨率更高,适用于中小尺度范畴的区域研究。2018年我国也发射了全球首颗专业夜光遥感卫星——珞珈一号(LJ1-01),该卫星是武汉大学与相关科研机构研发的全球第一颗专业遥感卫星,LJ1-01卫星获得的系统几何纠正产品,空间分辨率可达130 m,可以识别更细节的灯光。兴趣点(point of interest, POI)与人类活动密切相关,如何基于兴趣点数据更好地进行人口分析也是现在的研究热点[14-15]。很多学者对于人口空间化进行了研究,胡云锋等[16]以DMSP/OLS、NPP/VIIRS夜间灯光数据及其他辅助数据为基础,对川渝地区的人口分布进行了研究,同时随机抽取500个乡镇样本对人口空间化的精度进行对比检验。高义等[17]基于DMSP/OLS夜光数据、NPP/VIIRS夜光数据及人口普查等数据,采用建筑物与裸地增强指数法对海岸带人口进行了空间化处理分析。陈晴等[18]基于LUC数据和夜光数据,以黄河三角洲高效生态经济区为研究区域,生成1 km的人口空间化网格,最后以县及乡镇人口数据进行了精度验证。赵鑫等[19]利用NPP/VIIRS灯光数据、土地利用数据及POI数据,采用主成分赋权法构建广州市人口空间化指标体系,最后对人口进行了空间化处理。目前,人口分布的研究大多在国家、省级的尺度上,且主要集中在经济发达区域[20],鲜有对西部区域的研究。本研究选用NPP/VIIRS、LJ1-01夜间灯光及POI数据,以滇中经济区为研究区域,分别生成500 m×500 m、150 m×150 m的格网,采用空间滞后模型(spatial lag model, SLM)和空间误差模型(spatial error model, SEM)对人口数据建立回归模型,并以县级人口统计数据修正预测人口数,对比模型的预测精度,最后以乡镇人口统计数据来进行精度评价。

1 研究区域概况及数据预处理

1.1 研究区域概况

滇中地区指云南中部以昆明市为核心,半径约150~200 km左右,包括曲靖市、玉溪市和楚雄彝族自治州4个州市组成的行政辖区,该区域位于全国“两横三纵”城市化战略格局中包昆通道纵轴的南端,面积约10万km2,占全省土地面积的24%,集中了云南省约4成的人口和6成的经济总量,位于长江、珠江和红河上游,属亚热带气候,日照充足,四季如春,气候宜人,干湿季分明,土壤类型以红壤为主,植被类型多样,属于滇东高原盆地,以山地和山间盆地地形为主,地势起伏和缓,集中了云南全省近一半的山间平地(坝子),滇中地区的行政区划图如图1所示。滇中地区是我国连接东南亚、南亚国家的陆路交通枢纽,是面向东南亚、南亚对外开放的重要门户,是云南融入国家“一带一路”和“长江经济带”战略的关键支撑,是云南经济跨越发展的“引擎”和重要增长极,也是全省经济转型升级的主战场,因此研究滇中人口分布具有重要的参考价值。

图1 研究区域示意图(审图号:云S(2017)046号)Fig.1 Sketch map of the study area

1.2 数据来源

本研究中的主要数据类型包括了人口统计数据、行政区划数据、POI数据及两种夜光数据。

1)2018年滇中地区县级人口统计数据来自中国县域统计年鉴2019(县市卷)及云南省统计年鉴(2019);2018年滇中地区乡镇人口统计数据来自中国县域统计年鉴2019(乡镇卷)及云南省统计年鉴(2019)。其中,全国的统计数据中缺少的部分由云南省统计年鉴补充。

2)行政区划数据来自云南省地理信息公共服务平台2017版的云南省行政区划图,下载地址:https://yunnan.tianditu.gov.cn/MapResource,通过地理配准,以底图为基础进行矢量化。

3)POI数据通过高德地图进行爬取,POI数据类型主要有餐饮服务、住宿服务、汽车服务、体育休闲服务、生活服务、购物服务、金融保险、医疗保健服务、科教文化、购物服务、公共服务设施、旅游景点等,共获取了387 145条数据。

4)NPP/VIIRS数据来自美国国家地球物理数据中心(NGDC)2018年发布的夜间灯光月度数据,下载地址:https://ngdc.noaa.gov/eog/download.html。

5)LJ1-01数据来自高分辨率对地观测系统湖北数据与应用网发布的2018年10月夜光数据,下载地址:http://www.hbeos.org.cn/。

1.3 数据预处理

NPP/VIIRS可以识别微弱灯光,该下载数据还包含了火山、极光、月光、火灾以及冰川积雪的噪声影响,需要进一步处理。研究采用2018年12个月的月度数据,分别针对12个月的数据去除负值和噪声点,取12个月灯光数据的平均值,之后进行裁剪并重投影为Albers投影,重采样至500 m,夜间灯光数据分布图如图2(a)所示。

LJ1-01在社会经济统计方面具有非常大的潜力,研究数据采集时间为2018年10月,需对夜光数据进行几何纠正,镶嵌、裁剪并重投影为Albers投影,重采样至150 m,夜间灯光数据分布图如图2(b)所示。LJ1-01数据的辐射亮度值与NPP/VIIRS数据不一致,因此需把LJ1-01的灯光值归化至0~236的范围,以便于之后的回归分析比较。

图2 NPP/VIIRS 和 LJ-01夜间灯光数据分布图Fig.2 Distribution map of NPP/VIIRS and LJ1-01 nighttime light data

2 研究方法

2.1 人口空间化流程

人口空间化流程图如图3所示,首先以行政区划图为基础分别生成500 m×500 m、150 m×150 m的格网,NPP/VIIRS和LJ1-01夜光数据分别经过预处理和归一化处理后,提取两种格网内的夜光值,同时将收集的人口数据加入空间滞后模型和空间误差模型进行回归预测,比较两种夜光数据的回归模型的精度,并加入兴趣点以提高模型的预测精度,再以区县人口统计数据对格网预测值进行修正,然后基于乡镇人口统计数据进行最后的精度评价。

图3 人口空间化流程图Fig.3 Flow-process of spatial distribution of population

2.2 空间滞后模型

人口的分布常常会受到周围环境的影响,经典的最小二乘法不能满足人口空间化的需求,考虑到因变量的空间相关性,故采用空间滞后模型和空间误差模型搭建人口回归模型。

空间滞后模型的计算公式为

y=αWy+βx+γ

(1)

式中:y是因变量,指的是格网内的人口数;x是自变量,指的是格网内两种不同夜光数据的辐射亮度值,是n×k的矩阵;W是n阶空间权重矩阵;α和β都表示的是空间回归系数,γ是独立误差项。

2.3 空间误差模型

空间误差模型的计算公式为

y=βx+ρWμ+μ

(2)

式中:y是因变量,指的是格网内的人口数;x是自变量,指的是格网内两种不同夜光数据的辐射亮度值;W是n阶空间权重矩阵;ρ和β都表示空间回归系数,μ是不相关、同方差的独立误差项。

2.4 POI融合

POI数据与人类的活动密切相关,且属性丰富,因此可以把POI数据融入夜光数据,提高夜光与人口的相关性。首先对POI进行核密度分析,大于核密度平均值的格网直接进行灰度值的对数处理,目的是缩小像元间差别,降低模型整体差异[14];小于核密度平均值的像元,需先进行归一化处理,再进行对数变换。

对于空间上任意一个点S,其核密度值计算公式为

(3)

式中:f(S)是核密度计算值;K是核函数;n表示样本点数量;R也称带宽,是距离衰减阈值。

LJ1-01经过POI处理后的辐射亮度值优化公式为

f(i,j)=K×log [G(i,j)]

(4)

(5)

式中:f(i,j)是经POI核密度计算处理后的第i行第j列珞珈一号夜光数据的亮度值;G(i,j)是珞珈一号夜光数据的原始灰度值;k是由POI计算出来的核密度值;kmean是计算出来的核密度平均值;kmin是计算出来的核密度最小值;K是经过归一化处理后的核密度值。

2.5 模拟结果精度评定

对NPP/VIIRS和LJ1-01格网化后的500 m×500 m和150 m×150 m的人口单元按区县数据进行纠正,后以乡镇行政区域为单位,分区计算人口模拟值,与统计数据比较后,计算人口预测值的相对误差。

模拟结果误差纠正的公式如下:

(6)

(7)

人口回归预测结果与乡镇数据的相对误差检验公式如下:

(8)

3 结果与分析

3.1 人口空间化模型比较

基于NPP/VIIRS夜光数据和人口统计数据建立的模型,其中空间滞后模型的R2是0.882 661,空间误差模型的R2是0.882 353;基于LJ1-01夜光数据和人口统计数据建立的模型,其中空间滞后模型的R2是0.959 567,空间误差模型的R2是0.949 470;基于LJ1-01夜光数据、兴趣点和人口统计数据优化后的模型,其中空间滞后模型的R2是0.993 504,空间误差模型的R2是0.989 537。通过比较发现,两种模型进行回归分析的精度相差不大,但无论对于哪一种类型的灯光数据,空间滞后模型的精度要略高于空间误差模型的精度,因此,后续的回归模型全部采用空间滞后模型进行计算,且整体上LJ1-01模型预测精度要优于NPP/VIIRS,而LJ1-01与POI融合后的模型精度要优于LJ1-01。

3.2 人口格网空间化结果

3种模型的人口空间化结果如图4所示。由图4可知:1)3种模型的人口空间化结果大致相同,但以LJ1-01为基础的人口空间化结果明显比NPP/VIIRS更能反应人口细节特征;LJ1-01与POI融合结果为基础的人口空间化结果比LJ1-01具有更丰富层次的人口信息。2)滇中地区人口稠密区分布仍旧集中在昆明主城区,并沿着呈贡方向有向玉溪市集中连片的趋势,其次是曲靖、楚雄行政中心所在地人口较为集中,呈现城市多核心圈层分布结构,其余地区人口都较为稀疏。3)因POI数据的加入,人口格网打破了行政界线处的突变式变化,城市中心区域与周边变化自然,更能对比人口的空间差异和人口的真实分布状态。

图4 滇中地区人口空间化结果Fig.4 Spatial distribution of population in Central Yunnan Province

3.3 模拟结果精度评定

从整体上看,基于NPP/VIIRS、LJ1-01及LJ1-01与POI融合后夜光数据修正后的人口数分别是1 540.72 万人、1 571.27 万人、1 608.53 万人,与2018年滇中地区人口统计数1 813.94 万人相比,几种数据统计结果均与实际值接近,效果较好,各类数据误差分别为15.1%、13.4%、11.3%,LJ1-01对比NPP/VIIRS结果总体精度提升了1.7%,说明珞珈一号夜光数据在人口细节刻画上比NPP/VIIRS精度更高;LJ1-01与POI融合后夜光数据对比LJ1-01总体精度也提升了2.1%,说明与POI数据融合后可以提升模型的精度。

为了验证人口空间化模型的精度,全区域共445个乡镇(街道)的行政单元人口统计数据参与计算,同时以乡镇(街道)为单元进行格网人口修正值的区域统计,以相对误差f的大小来衡量人口空间化的精度。若人口预测结果相对误差小于20%的乡镇个数占比较高,则说明精度较高;相反人口预测结果相对误差大于60%的乡镇个数占比较高,则说明精度较低。3种模型的乡镇(街道)单元验证表如表1所示。

由表1可知,从整体上看,NPP/VIIRS夜光数据人口预测结果相对误差占比最大的区间为20%~40%,LJ1-01结果在小于10%以下的区间占比较大,且比NPP/VIIRS在10%以下的区间占比有所提升,说明LJ1-01比NPP/VIIRS夜光数据更能识别一些细节,精度较高;LJ1-01与POI融合后数据相对误差占比最大的区间为0~10%,比前两种数据在同等区间占比有所提升,说明LJ1-01与POI融合后数据在人口识别方面更具优势。

基于NPP/VIIRS夜光数据人口预测结果相对误差小于20%的乡镇有175个,占比39.3%;基于LJ1-01夜光数据人口预测结果相对误差小于20%的乡镇比前者增加了40个,占比也增加了9%;基于LJ1-01与POI融合后夜光数据人口预测结果相对误差小于20%的乡镇有261个,比之前的两种数据分别增加了86个、46个,占比分别增加了19.3%、10.3%,说明LJ1-01与POI融合后数据比LJ1-01数据精度有所提升,在人口模拟方面具有更大优势。

在相对误差大于60%的区间段,LJ1-01预测结果的乡镇个数有49个,占比11%,LJ1-01与POI融合后数据预测结果的乡镇个数有20个,比LJ1-01减少了29个,占比减少了6.5%,进一步说明了POI与人口的密切相关,融入后可以明显改善模型质量。

表1 乡镇(街道)单元验证表Tab.1 Township sample validation

人口预测结果相对误差小于20%的乡镇个数占比越高,则越能准确估计人口[14]。与已有的研究对比发现,胡云锋等[16]基于DMSP/OLS夜光数据和NPP/VIIRS夜光数据能准确估计人口的乡镇占比为33%、38%;高义等[17]基于两种灯光数据得到的能准确估计人口结果为24%、26%;李爽等[6]利用DMSP/OLS灯光数据得到的乡镇占比为55%,均低于本研究的59%,再一次说明珞珈一号夜光数据的高分辨率可以识别出灯光细节特征,同时融入兴趣点数据可以提高人口模拟的精度。

4 结论

夜间灯光数据可以间接反映人类活动的范围和强度,实时可靠、高精度的人口空间分布信息对于研究和表征人类对环境、社会和经济影响有着重要的意义[16]。本研究基于NPP/VIIRS、LJ1-01两种夜光数据,采用回归模型进行人口预测,并融入POI进行人口的预测修正,最后以乡镇为单元进行模型的精度评价。

1)通过比较发现,空间滞后模型和空间误差模型两种模型进行回归分析的精度相差不大,但无论对于哪一种灯光数据,空间滞后模型的精度要稍高于空间误差模型的精度;LJ1-01模型人口预测精度要优于NPP/VIIRS,而LJ1-01与POI融合后的模型精度要优于LJ1-01。

2)以NPP/VIIRS、LJ1-01及LJ1-01与POI融合后夜光数据为基础的3种模型人口预测结果分布大致相同,人口稠密区仍旧集中分布在昆明主城区及地(州)、区县级行政中心,并呈现城市典型圈层结构,同时LJ1-01为基础的人口空间化结果明显比NPP/VIIRS更能反应人口细节特征。

3)LJ1-01与POI融合后夜光数据对比LJ1-01、NPP/VIIRS总体精度提升了2.1%、3.8%,反映出夜光数据与POI融合后可以提升模型预测的精度。

4)基于LJ1-01与POI融合后夜光数据人口预测结果相对误差小于20%,较为准确估值的区间段乡镇个数有261个,比之前的NPP/VIIRS、LJ1-01两种数据占比分别增加了19.3%、10.3%,说明LJ1-01与POI融合后数据比LJ1-01数据更具优势。在相对误差大于60%的严重高估区间段,LJ1-01与POI融合后数据比LJ1-01的结果占比减少了6.5%,进一步说明了POI数据融入后可以提升人口预测模型的精度。

文中融入POI数据后,虽然在一定程度上提高了模型预测的精度,但考虑到多源遥感数据的快速发展,目前研究仍有一些不足,下一步还将融入土地利用数据、手机定位数据等与人口指示因子密切相关的数据,丰富建模的变量,进一步提高精度。

猜你喜欢
夜光格网人口
《世界人口日》
有朝一日,夜光材料会照亮我们的城市吗?
人口转型为何在加速 精读
遥感数据即得即用(Ready To Use,RTU)地理格网产品规范
云南地区GPS面膨胀格网异常动态变化与M≥5.0地震关系分析
树脂质夜光人造石的研制
实时电离层格网数据精度评估
矢量点状数据抽稀方法的研究与实现
人口最少的国家
1723 万人,我国人口数据下滑引关注