王璇璇,赵明松,谢 毅,郜 敏
(安徽理工大学 测绘学院,安徽 淮南 232001)
人口发展是现今社会可持续发展的主要问题之一,也是科学工作者研究的焦点之一。人口数据空间化是采用合适的指示因子,构建适宜的数学模型,将估算人口分布在地理格网单元中,旨在揭示人口空间分布的地域特点及规律,展现人口数据在空间位置分布上的地理信息[1]。人口数据空间化处理打破传统的地域分类,人口信息载体由传统的行政区划单元改变为规则格网单元,模拟单元格网的人口数,反映现实人口的分布情况,对精确估算人口分布、解决人口与自然环境的耦合问题具有重要意义[2-3]。基于地形坡度、土地利用等人口分布影响因子,国内外学者结合多源遥感数据,提出了空间插值、遥感特征反演等人口数据空间化的研究方法[4-8]。近年来,由于遥感技术的快速发展,人口数据空间化精度越来越高。学者将土地利用、地形地貌、夜间灯光数据等与人口统计数据结合,精确模拟出人口的真实分布情况,其中,作为指示因子的夜间灯光数据多应用于社会经济参数的空间模拟研究[9-11]。
夜光遥感始于20世纪70年代的美国军事气象卫星计划(Defense Meteorological Satellite Program, DMSP),早期的夜间灯光数据是由DMSP系列卫星上搭载的业务线扫描传感器(Operational Line Scan System, OLS)获取的,数据空间分辨率约为1 km,适用于较大尺度(省、州及国家以上)的相关研究。在2011年10月,美国新一代极轨卫星(National Polar-Orbiting Partnership, NPP)发射成功,卫星携带的新一代可见光及近红外辐射仪(Visible Infrared Imaging Radiometer Suite, VIIRS)可接收22个波段的影像数据,其中,DNB(Day/Night Band) 波段是探测夜间灯光强度的主要波段,获取的数据空间分辨率较高(约为500 m),适合于更小尺度的数据研究[12]。夜间灯光数据具有较强的客观性,能够很好地反映出夜间人类活动区域以及人口的空间分布情况,综合反映人类活动情况,灯光亮度可以表征人类活动的强弱程度,相关研究包括社会经济参数[13-14]、城市建设[15-16]以及自然灾害与资源环境等[17-18]方面。在社会经济参数方面的研究中,卓莉[19]、高义等[20]学者应用DMSP-OLS夜间灯光数据研究区域人口空间密度及分布情况,发现夜光遥感数据模拟人口密度时所需数据量少,易于实现,精度较高。李翔等[21]利用NPP-VIIRS夜间灯光数据以及土地利用数据估算上海市人口,提高了人口分布模拟精度。如何基于NPP-VIIRS夜间灯光数据,在更小的空间尺度上估算人口,提高人口数据空间化精度,值得进一步探索[22-23]。
本文以NPP-VIIRS夜间灯光数据和土地覆盖数据为基础,结合江苏省各县市常住人口统计数据,采用空间滞后模型及空间误差模型对各县市常住人口进行回归建模,评价人口分布格网化结果并绘制人口分布密度图,分析江苏省人口分布特征情况。
根据江苏省统计年鉴数据,截至2016年底,江苏省有13个下辖市,22个县级市,19个县,55个市辖区;江苏省常住总人口数为7 998.60万人,其中,城镇常住人口和乡村常住人口分别占总人口的67.70%和32.30%,明显可以看出全省城乡人口分布不均。
本研究主要使用的数据有夜间灯光数据、土地覆盖数据、人口统计数据及行政边界数据等(见表1)。其中,夜间灯光数据选用来自NPP-VIIRS的Version 1 的白天/夜间波段(Day/Night Band),其星下地面分辨率约为500 m,可以识别微弱的灯光源,对地面活动的照明分布显示得更为细致。夜间灯光数据主要有月度数据和年度数据,本研究选择2016年数据,该数据已经排除了杂散光的影响,其异常值已经去除。
表1 数据来源
注:1) 全国地理信息资源目录服务系统:http://www.webmap.cn/main.do?method=index,2) 2017江苏统计年鉴:http://tj.jiangsu.gov.cn/col/col64418/index.html,3) 清华大学地球系统科学系:http://data.ess.tsinghua.edu.cn/fromglc2015_v1.html,4) 美国国家地球物理数据中心:https://www.ngdc.noaa.gov/eog/viirs/download_dnb_composites.html。
本研究以城镇地区与居民区的夜间灯光强度累计值为自变量,常住人口数据为因变量,基于GeoDa1.21软件,利用地理位置差异构建空间权重矩阵,建立空间回归模型。根据模型评价指标选取最优空间回归模型。在最优模型基础上,估算格网单元的回归人口数,模拟江苏省区域内的人口数据空间化结果,分析人口空间分布规律(见图1)。
本研究主要数据处理步骤为:首先以江苏省行政区范围为基础裁剪全球土地覆盖数据及夜间灯光数据,基于土地覆盖数据提取出不透水层属性区域,该区域可识别出城区及非人类活动范围,有利于夜间灯光光源地区的筛选。利用提取后的土地覆盖数据作为掩膜提取江苏省夜间灯光数据,使用ArcGIS软件,统计区域内的灯光像元累计值。数据预处理时,栅格数据均需采用最邻近重采样法,将空间分辨率重采样为500 m。
图1 数据处理流程
1.4.1 空间回归模型构建
本研究选用空间滞后模型与空间误差模型进行夜间灯光强度累计值与常住人口的空间回归建模。模型公式如下:
1) 空间滞后模型(Spatial Lag Model, SLM)
Y=Xβ+ρWX+ε.
(1)
式中:Y为因变量,X为自变量,β为空间回归系数,W为空间权重矩阵,ρ为自变量的空间自回归系数,WX为自变量的空间滞后,ε为误差项。
2) 空间误差模型(Spatial Error Model, SEM)
Y=Xβ+λWε+ξ.
(2)
式中:λ为误差项的空间自回归系数,Wε为误差项的空间滞后,ξ为不相关、同方差的误差项。
1.4.2 模型优度评价指标
模型拟合程度的测度主要采用以下标准:
1)决定系数(R2)。值越接近于1,表示拟合程度越高。
2)对数似然函数值(Log Likelihood, LogL)。一般取负值,实际值越大,模型拟合程度越好。
3)赤池信息准则(Akaike Information Criterion, AIC)。衡量模型拟合数据的优良性以及权衡模型的复杂度,AIC越小,模型拟合程度越好。
4)施瓦茨准则(Schwartz Criterion, SC)。施瓦茨准则与赤池信息准则相似,也是衡量模型拟合优良性的标准之一,SC越小,模型拟合程度越好。
5)拉格朗日乘数(Lagrange Multiplier, LM)。LM越大,说明模型显著性高,拟合程度越好。
6)稳健拉格朗日乘数(Robust Lagrange Multiplier, RLM)。RLM越大,说明模型显著性高,拟合程度越好。
比较空间回归模型时,传统的模型拟合指标(R2)不再合适,通过比较上述其他准则,评判空间回归模型的优良,选出本研究区域的最优空间回归模型。
1.4.3 精度评定
本文采用人口统计数据与空间回归结果之间的相对误差进行精度分析,公式如下
(3)
式中:RE为相对误差(Relative Error, RE),POPi为人口统计数据,POP′i为人口预测数据。
图2 江苏省NPP-VIIRS夜间灯光分布注:DN值表示遥感影像像元亮度值
土地覆盖空间格局能够清晰地显示土地使用情况和人口分布区域。土地覆盖数据中含有不透水层属性的土地分类区域,该属性用来识别城区范围,既能较好地区别土地分类情况,也能筛选一些非人类活动的灯光区域。因此,本研究基于全球土地覆盖数据,提取出江苏省居民地以及城镇用地上的夜间灯光强度值(见图2),分区统计各区域的夜间灯光强度累计值,将夜间灯光强度累计值与江苏省人口统计数据做相关性分析。据相关性分析结果表明,二者的相关系数高达0.78(p<0.01),区域夜间灯光强度累计值与人口统计数据具有显著的相关性,说明夜间灯光强度与人类活动密切相关。
表2为空间回归模型的各项评价指标,结果表明SLM和SEM的回归效果优于OLS模型。通过比较LM以及RLM的显著性,发现SLM的LM和RLM值均高于SEM,表明SLM的回归效果更好。
表2 OLS、SLM、SEM模型优度比较
本文基于NPP-VIIRS夜间灯光数据对SLM空间回归结果进行空间化处理。结果表明(见图3):1) 夜间灯光数据可以有效地反映人口的实际分布,如在太湖和骆马湖等水域内灯光亮度明显低于其他区域,该范围内人口密度较低,与实际情况相符。2) 江苏省人口分布特征明显:人口主要集中分布在江苏南部地区,尤其在南京、苏州、无锡等地人口密度较高;在江苏北部地区,人口主要分布在徐州市、连云港市以及宿迁市等地;在江苏中部地区,人口分布较为均匀,且在靠近南部地区人口分布较为集中。3) 格网化后的人口分布无明显的交界线,不以行政单元为划分区域,如江苏南部的苏州、无锡等地无明显的界限;人口分布具有清晰的城市圈层结构,城市中心人口最为密集,随着与中心城区的距离渐增,人口密度呈现递减趋势,该趋势在江苏北部地区的表现更为明显。4) 经济发展较为迅速的地区人口较为密集,呈现空间集聚的特征,如南京、苏锡常等地经济发展水平较高,人口呈现连片化趋势。徐州与环太湖周边发展迅速,人口密集程度较高。
图3 江苏省人口空间分布
对SLM回归结果与江苏省统计人口数据进行精度验证。利用SLM得到的2016年江苏省常住人口数为7 974.40万人,与江苏省统计数据常住人口数7 998.60万人相比,少24.20万人,相对误差为0.30%,模型回归结果与统计数据较相似。
对县级人口统计数据与回归预测的县级人口数据进行相关性分析,结果(见图4)表明,县级人口的统计数与回归数二者具有显著的线性关系,相关系数为0.83(p<0.01)。县级人口回归数的相对误差绝对值的平均值为26.09%,总体精度较高,个别行政区相对误差较大。其中,南京市、苏州市回归精度较低,主要是样本数量少,人口密度高,人口分布主要集中在市区。
图4 县级回归结果检验
本文使用NPP-VIIRS夜间灯光数据对江苏省2016年的人口分布进行分析,结合江苏省的常住人口数据以及SLM空间回归结果进行空间化研究。主要结论如下:
1)夜间灯光数据客观性较强、分辨率较高,不局限于传统的行政单元空间尺度,能支持用更细致的格网描绘人口数据空间分布基本情况,提高分析精度。但夜光遥感数据也存在局限性,对于部分夜间活动不频繁的地区,在使用夜间灯光数据时没有考虑该地人口数据,在未来的研究中,可以考虑这一因素,提高人口空间分布的精度。
2)与普通线性回归模型相比,空间回归模型考虑了地区的空间依赖关系,分析结果更为可靠,反映的人口空间分布情况更加全面。
本研究中仍然存在不足之处,空间回归模型的影响因子选择较少,仅仅在模型构建之前考虑一些影响因素如土地利用等,未将更多的驱动因子考虑在模型研究中,以便提高模型精度。在估算人口时仅适用夜间灯光数据构建模型,未来的研究会考虑其他影响因子,如地形、坡度坡向、道路网等。