赵 宇a,王 利a,李欣欣a,赵东霞
(辽宁师范大学 a.城市与环境学院;b.海洋经济与可持续发展研究中心;c.管理学院,辽宁 大连116029)
人口是一个综合多种社会关系的社会实体,它对社会、经济、生态和环境等方面产生了深远的影响,正确认识人口的增长与分布对提高人口素质、资源和环境的综合管理意义重大[1]。在GIS和遥感技术对人口空间化的研究中,王雅雯、王利等依据人口空间分布与土地利用的关系,绘制出辽阳市人口空间分布图[2];陈楠依据人口空间分布与自然、经济因子的定量关系,建立了人口空间分布模型,提出人口压力新指标[3];王慧鹏研究了地形起伏度与人口空间分布关联,提出人口空间分布与地形因素在小尺度范围内有较强相关性[4];白平平选取内蒙古3年的人口统计数据分析人口增长特征,结合2010年内蒙古气候、DEM等数据实现人口数据空间化,并对2015年内蒙古人口进行了模拟[5];周自翔等运用ArcGIS邻域分析提取关中—天水经济区地形起伏度,并从比例结构、空间分布和高度特征三个方面系统分析了地形起伏度的分布规律及其与人口分布的相关性[6]。虽然土地利用数据和人口统计数据能有效实现人口空间化分析,但是土地利用数据具有时效性,鉴于城镇化进程较快,土地利用数据在反映城市人口分布方面具有明显的缺陷,无法提供时效性较好的人口空间化数据。
从20世纪末期起,灯光数据开始被人们所关注。由于灯光数据具有独特的空间性,近年来基于夜间灯光数据对城镇人口化、建筑密度、GDP等方面的研究越来越多。杨眉等以DMSP/OLS夜间灯光数据在城镇提取等方面的应用为基础,系统介绍了灯光数据估算城市化水平和人口的方法和步骤[7];曹丽琴等将2000年湖北省各县市DMSP/OLS卫星的夜间灯光数据亮度值与各县市城镇人口之间建立相应的模型,模拟了2002年湖北各县区人口[8];郑辉等运用Suomi-NPP/VIIRS夜间灯光影像,结合GIS手段分析了南京市主城区灯光图像强度值与建筑密度之间的关系,并建立了相应的建筑密度估算模型,同时提出VIIRS夜间灯光强度数据具有实现建筑密度估算以及其他社会经济数据空间网格化的巨大潜力的结论[9];李峰等基于NPP/VIIRS夜间灯光数据,对河北省的GDP进行了相关分析,结果显示夜间灯光总强度与地市内各区县的GDP相关性最显著[10];Shi[11]、Elvidge[12]的研究表明VIIRS灯光数据对提取城市建成区、估算国民生产总值、电力消耗等具有优势;黄益修将NPP/VIIRS夜间灯光影像和出租车轨迹数据融合在人口空间化中,为城市人口空间分布提供了一个新的视角[13]。通过以上研究成果发现,遥感影像数据成为当前获取人口数据的重要手段,但对一些不发达地区,灯光数据作用不明显。
目前已有研究采用DMSP/OLS数据作为数据源实现了人口空间化,取得了较好的效果。高义等运用DMSP/OLS和NPP/VIIRS两种灯光数据分别建立了1km×1km和0.5km×0.5km的人口格网密度图,提出NPP/VIIRS夜间灯光数据适用于人口空间化,且其反演精度整体优于基于DMSP/OLS传统夜间灯光数据反演的人口格网模型[14];陈晴等基于土地利用数据和夜间灯光数据建立了1km栅格的人口空间格网化模型,认为灯光数据在人口密度较大的地区有更好的模拟效果[15]。
本文运用2015年12月NPP/VIIRS夜间灯光数据和土地利用数据研究大连市人口空间化分布,基于大连市2015年人口统计数据和128个典型采样点,分别采用NPP/VIIRS夜间灯光数据和土地利用数据建立回归模型,尝试对人口空间化进行分析并估算大连市各辖区人口,以期为该市人口与区域相关性研究以及相关区域人口空间化提供参考。
大连位于辽东半岛最南端,西北濒临渤海,东南面向黄海,处于120°58′—123°31E′、38°43′—40°10′N之间,是全国15个副省级城市之一、5个计划单位列市之一、全国14个沿海开放城市之一。大连市总面积约12574km2,其中建成区土地面积396km2。大连市下辖10个县区,其中主城区占地面积为:中山区52.15km2、西岗区26.88km2、沙河口区41.81km2、甘井子区463.46km2,共有35个镇20个乡116个街道办事处。截止2015年末,大连市常住人口717.84万人,其中总户籍人口593.6万人。主城区人口数为:中山区37.68万人、西岗区36.13万人、沙河口区65.61万人、甘井子区136.18万人,整体比上年末减少了7357人。大连市区人口304.9万人,增长了0.2%,非户籍流动人口100万人。
数据来源:①人口数据。乡镇街道是我国人口普查数据发布的基本单元,普查数据包含众多人口指标,能更精确客观地反映我国的人口地理国情,统计数据能够较为真实地反映区域常住人口。鉴于此,本研究采用2015年《大连市统计年鉴》中的各乡镇街道统计人口数据,汇总各区、市、县人口总数,作为建模和精度评价的参考标准。②典型样本点。本文根据2015年实地调查获取的大连市各区城镇、农村内包含各种用地类型,最终确定128个具有代表性的采样点,以0.5km×0.5km为采样范围,实际统计出此范围的人口数量,从而得到128个采样点的人口密度(人/km2)作为建模的基础数据。③夜间灯光影像。采用2015年12月空间分辨率为0.5km的NPP/VIIRS月合成夜间灯光遥感影像为基础数据,该数据从美国国家海洋中心气象局处获取(https://www.ngdc.noaa.gov/eog/viirs/download_monthly.html),该数据中心提供了2012年4月至今的VIIRS月合成夜间灯光遥感影像,月数据是由DNB波段记录的日数据根据特定算法合成,合成算法剔除了云层反光和暂时性地物,如火灾、闪电等对灯光辐射值的干扰,空间参考系统为WGS84。④土地利用数据。依据全国第二次土地利用调查数据校对到2015年的大连市土地利用数据,包括城镇用地、农村居住用地、耕地、林地、草地、水域、未利用土地、交通工矿用地等8个地类结构数据,每个数据图层包含一个地类。
数据预处理:首先,依据大连市最新行政区划分对居住用地进行提取。基于“二调”数据对大连市的中山区、西岗区、沙河口区、甘井子区、旅顺口区、金普新区、瓦房店市、普兰店区、庄河市和长海县10个区域进行居住用地的提取,并根据各区城乡规划将居住用地分为城镇居住用地和乡村居住用地,为土地利用数据建模估算人口做准备。其次,为充分发挥夜间灯光数据的空间分辨能力,运用灯光数据提取大连市区域。并将空间数据投影变换至WGS84-UTM-51N坐标系,NPP/VIIRS灯光数据点集运用克里金插值方法重新生成栅格数据影像;再将像元大小重采样至0.5km×0.5km,同时生成大连市陆地部分0.5km×0.5km的格网。然后,运用ArcGIS赋值技术将灯光辐射率值赋到每个格网当中;运用ArcGIS空间分析工具,依据大连市行政边界裁剪灯光数据,得到大连市范围内的灯光影像。第三,将提取的土地利用数据与大连市的灯光影像相结合,运用ArcGIS技术中的叠加分析方法,提取各辖区内居住用地灯光数据,并汇总各辖区居住用地灯光辐射率总值,为用灯光辐射率建模后估算人口做准备。
人口空间分布与自然环境中的高度、坡度、气温、河流、道路、城镇分布等因素息息相关,土地利用的空间格局是影响人口空间分布的主要因素。土地利用类型与人口空间分布关系密切,因此采用土地利用数据表征人口分布,是实现人口空间化的最普遍方式。将土地利用类型与人口空间分布进行相关性分析,依据“人口—居住用地”的原则,选择与人口分布相关性强的土地类型作为建模数据,按照式(1)建立回归模型:
(1)
式中,P为某模拟单元格网的实测人口总数;n为土地利用类型数;Ki为某模拟单元格网土地利用类型系数;Si为某模拟单元格网土地利用类型的面积;b为常数项。根据“人口—居住用地”的原则,建立回归模型时将b设为0。
根据128个典型采样点的实测人口数据和单个格网农村居民点面积和城镇用地面积,得到回归模型,其中S1和S2分别是城镇和农村居住用地面积。
P=35206S1+414S2
(2)
式中,R2=0.763,说明土利用面积与人口具有线性相关性。
在已有研究中,学者们多利用DSMP/OLS夜间灯光数据对人口空间化进行研究,相对于DSMP/OLS灯光数据,NPP/VIIRS的空间分辨率得到了提升。通过对夜间灯光总辐射率与人口数关系研究,表明以城市为统计单元,夜间亮度总值和统计人口数之间呈现显著的相关性[16,17]。对夜间灯光辐射率与典型采样点实测人口数按式(3)构建回归模型:
P=a×Ri+b
(3)
式中,P为某格网单元的总人口数量;a为比例系数;Ri为某格网单元内的灯光总辐射率;b为截距。根据大连市128个典型采样点的实测人口数据与相应的灯光辐射率进行回归分析,得到回归模型:
y=70.934x-873.69
(4)
式中,R2=0.754,说明灯光强度值与人口具有线性相关性。
研究区总人口为717.84万人,基于土地利用数据模拟人口数量为618.75万人,构建的回归模型R2=0.763,基于NPP/VIIRS灯光数据模拟人口总量为590.85万人,构建的回归模型R2=0.754。说明土地利用数据和灯光数据与人口分布之间均具有较强的相关性,建立的模型具有较高的可靠性,得到的回归模型可以用来预测大连市的人口数。基于上文得到的回归模型,采用两种方法预算的大连市人空间分布情况见图1。
图1 基于土地利用数据(a)和NPP/VIIRS夜间灯光数据(b)模拟的人口空间化分布
从整体上可见,图1a人口分布变化较破碎。由于土地利用数据模拟的人口按照土地利用类型分布,部分中心区域与人口密度较小区域的人口分布过渡地带狭小,没有形成过渡带。图1b的人口变化空间异质性不突出,人口从城市中心向四周辐射具有渐变效果,形成了人口过渡带。对比两种类型在0.5km×0.5km栅格单元上模拟人口变化,采用土地利用数据模拟人口区间值达45620,灯光数据模拟人口区间值达7232,说明土地利用数据模拟的人口在乡村周围分布均匀,而依据灯光数据模拟的人口在城市中心周围分布均匀。
根据本文构建的人口预测模型,分别基于大连市土地利用数据和夜间灯光数据估算得到该市各辖区的人口数量,利用得到的估算人口数与大连市街道统计人口进行比较,具体的人口情况与误差分布见表1。
表1 2015年大连市各辖区人口估算与误差
采用基于土地利用数据估算的大连市甘井子区的人口误差最小,为0.01。相对误差较小的区域还有大连市金普新区、旅顺口区、沙河口区、西岗区和中山区。大连市普兰店区和庄河市的相对误差值大于0.5,其中大连市普兰店区的相对误差较大,达到0.62,总人口数的相对误差为0.14。基于夜间灯光数据估算的大连市西岗区的相对误差最小,为0.12。此外,相对误差值较小的区域还有大连市中山区、沙河口区、甘井子区、旅顺口区和金普新区,除旅顺口区和金普新区,其他区域均为大连市的主城区。而大连市瓦房店市、普兰店区、庄河市和长海县的相对误差值大于0.5,其中大连市长海县的相对误差值最大,达到0.89,总人口数的相对误差为0.18。从整体看两个数据预测的结果是比较精确的。
大连市共10个辖区,两种数据中主城区人口预测相对误差都小于0.2。其中,大连市甘井子区是主城区中面积最大的区,乡村人口比例较大,人口分布疏散,土地利用数据对该地区的预测误差值最小。大连市西岗区的面积最小、人口最集中,夜间灯光数据对该区域预测的误差最小,而且相对误差值较低的其他区域或是大连市的主城区,或是经济发展水平较高的市区,人口分布都较集中。而大连市长海县是由几个岛屿构成,从实际出发,人口居住地的灯光强度比较低,估测的人口数相对误差较大;而大连市瓦房店市、普兰店区和庄河市的面积较大,居住用地较分散,人口密度较小,同样导致估算结果的相对误差较大。
基于NPP/VIIRS夜间灯光数据估算得到大连市人口与居住用地分布,依照“无土地无人口”的对应原则,结合土地利用数据中的典型乡村区域,利用ArcGIS10.2平台实现人口空间化,创建人口分布图,绘制出较为精确的大连市人口分布图,具体分布结果见图2。
图2 基于NPP/VIIRS夜间灯光数据模拟的人口分布
从图2可见,大连市人口密度较大区域分布在中山区、西岗区、沙河口区和甘井子区,主要是大连市的主城区;大连市旅顺口区除西南小部分区域形成人口密集区外,整体人口密度较小;大连市国家级新区----金普新区在该区域的南部人口密度较高,其他区域均匀分布;大连市北部的瓦房店市、普兰店区、庄河市和长海县的乡村较多且分散分布,因此人口密度较低。
整体来看,大连市人口主要分布在该市的南部区域,尤其是老城区人口密度很大,北部地区人口分散分布,市内河流、湖泊、周边水产养殖圈和海域内均无人口分布。该结果与大连市的实际人口分布情况相符,表明基于NPP/VIIRS夜间灯光数据可以较好地模拟城镇人口分布。而将该模拟结果与土地利用数据模拟的乡村人口分布的结果相结合,就会得到更为精确、与实际情况接近的人口分布图,而且能展示大连市人口的空间分布特点,说明NPP/VIIRS夜间灯光数据可作为模拟区域人口分布的重要技术手段。
本研究针对当前人口分布图绘制不够精确、分布状况偏离实际等问题,以大连为实例,结合大连市128个典型采样点的实测人口数据,以及全国第二次土地利用调查数据和NPP/VIIRS夜间灯光数据,分别构建土地利用数据模型和NPP/VIIRS灯光数据模型的人口空间化模型,以县(区)为验证单元,比较两种方法模拟人口分布的优缺点,确定模拟区域人口分布情况,主要得到以下结论:①土地利用数据和NPP/VIIRS夜间灯光数据两种数据与人口的整体相关性都较高,所构建模型具有较高的可靠性,得到的回归模型可用以预测大连市的人口。②通过对土地利用数据和NPP/VIIRS夜间灯光数据模拟的大连市人口空间化分布图的分析,得出土地利用数据模拟的人口分布图,按照土地利用类型分布,部分中心区域与人口密度较小区域人口分布过渡地带狭小,没有形成过渡带;根据NPP/VIIRS夜间灯光数据模拟的人口分布图,人口从城市中心向四周辐射具有渐变效果,形成了人口过渡带。③在人口空间分布模拟方面,NPP/VIIRS夜间灯光数据整体精度与土地利用数据相近,土地利用数据模拟的人口在乡村周围分布均匀,而依据灯光数据模拟的人口在城市中心周围分布均匀。④两种数据中主城区人口预测相对误差都小于0.2。其中,土地利用数据对大连市甘井子区的预测误差值最小,夜间灯光数据对西岗区预测误差最小,而长海县是由几个岛屿构成,人口居住地的灯光强度比较低,估测的人口数相对误差较大,瓦房店市、普兰店区和庄河市这三个区域的面积较大,居住用地较分散,人口密度较小,导致估算结果相对误差较大。⑤对比夜间灯光数据反演的人口格网模型和基于行政区划的人口密度,夜间灯光数据能够反映各行政单元内部的人口空间分布异质性,且与实际人口分布更接近。
综上所述,研究夜间灯光数据多数是DMSP/OLS夜间灯光数据,对NPP/VIIRS夜间灯光数据较少被采用,因此本文的人口空间化方法和参数模型仍有待修正。经过研究发现,NPP/VIIRS夜间灯光数据对人口集中、人口密度大的区域预测精度较高,可直接应用;在人口密度较小的区域可作为辅助数据优化模拟人口空间分布结果,如果直接应用则需要进行分区建模。随着多源遥感融合技术的发展,将夜间灯光数据与地形起伏等数据相结合,按照人口密度进行分区研究将会是今后研究的重要方向。