摘 要:人口空间化数据对城市建设、抢险救灾、环境管理和社会发展各个方面具有重要作用。近年来随着夜间灯光遥感技术的迅猛发展,基于夜间灯光遥感的人口空间化的研究日益增多,回归模型、多因子加权平均模型、随机森林模型等模型算法也日趋完善,方法新颖多样,结果精度较高。该文系统总结夜间灯光遥感的发展以及基于灯光数据的人口空间化的研究方法,分析现今研究内容和研究方法的热点难点问题,讨论在研究过程中存在的问题以及未来研究发展的方向,希望能够为相关研究人员提供借鉴。
关键词:夜间灯光;人口;空间化;遥感;多元数据
中图分类号:TP79 文献标志码:A 文章编号:2095-2945(2024)31-0084-04
Abstract: Population spatial data plays an important role in all aspects of urban construction, emergency rescue and disaster relief, environmental management, and social development. In recent years, with the rapid development of night light remote sensing technology, research on population spatialization based on night light remote sensing has increased day by day. Model algorithms such as regression models, multi-factor weighted average models, and random forest models have also become increasingly perfect. The methods are novel and diverse, and the results have high precision. This paper systematically summarizes the development of night light remote sensing and the research methods of population spatialization based on light data, analyzes the hot and difficult issues of current research content and research methods, discusses the problems existing in the research process and the direction of future research development, and hopes to provide reference for relevant researchers.
Keywords: night light; population; spatialization; remote sensing; multivariate data
随着全球人口的不断增长,人类对资源的需求不断增加,对环境的影响日趋严重,城市建设、土地利用也越来越频繁。掌握人口信息,对城市建设、抢险救灾、环境管理和社会发展各个方面具有重要作用,也是资源配置和空间优化的重要依据[1]。传统获取人口733a2534b39b4e825b86cbe1798edd614368124788dd13586d7172d9fa6dc921数据的方法就是依靠人口普查来获取,但此种方法获取的数据不够完整,而且不能展现出人口的空间分布[2-3]。人口数据空间化是将人口数据进行空间有效分析的重要方法手段,其原理是将人口数据按照一定的规则分布到一定尺度的格网上进行离散化处理,并进行模拟的过程[2,4],该过程可以通过空间分析、人口建模等多种方式实现。这种方法能够表征某一时间人口在地理空间的分布情况,有效挖掘人口数据与空间数据的相关性,并可以模拟再现获得其他地区的人口分布数据。
夜间灯光遥感利用遥感技术从空中获取地球表面的夜间光线强度信息,可以快速地反映人类的活动和空间分布[5]。夜间灯光遥感数据与人口活动相关性较强,因此基于夜间灯光遥感进行人口空间化研究具有理论基础和数据支撑。
基于夜间灯光遥感数据进行人口空间化研究的主要流程是建模-预测-制图-精度分析[6]。研究的数据来源主要依靠多源夜间灯光数据结合土地利用数据[7]、统计人口数据、兴趣点数据[8]、地表覆盖数据等多元数据,选用回归统计模型[9-10]、自相关分析[11-12]、异速增长模型、传递函数和随机森林[6,13-14]等模型进行分析,对区域尺度的人口进行估算,对格网尺度的人口分布进行模拟,并根据已有数据进行精度评价。
基于人口空间化研究的不断发展,全世界不同学者团队已制作出覆盖全球的大尺度人口数据集[14]。欧盟委员会联合研究中心与美国国际地球科学信息网络中心合作,采用线性回归模型,生产了全球尺度的GHS-POP人口密度数据集,现在可提供1975—2030年间每5年间隔的全球数据,空间分辨率可达100 m。数据下载地址为Https://ghsl.jrc.ec.europa.eu。南安普顿大学生产的WorldPop人口密度数据集,现在可提供2000—2020年每年的全球人口数据,空间分辨率为100 m。数据下载地址为Https://hub.worldpop.org。
1 夜间灯光遥感数据类型
夜间灯光遥感的兴起始于20世纪70年代的美国军事气象卫星计划(Defense Meteorolgical Satellite Program,DMSP),其搭载的线性扫描业务系统(Operational Linescan System,OLS)传感器能够探测到无云情况下的城市灯光以及车流、渔船等发出的微弱灯光,各位学者开始将其应用于研究反映人类活动情况。现在NGDC(美国国家地球物理数据中心)网站上可获取1992—2013年的DMSP/OLS数据。
进入新世纪以来,由于夜间灯光遥感对于人类活动在一定程度上具有较好的指示性,所以通过运用夜间灯光遥感的图像来探究人口空间分布的研究越来越得到学者的青睐,基于国防气象卫星项目的业务线扫描系统(DMSP/OLS)和Suomi国家极轨合作伙伴(Suomi National Polar-orbit Partnership, S-NPP)卫星上搭载的可见光红外成像辐射仪(Visible Infrared Imaging Radiometer Suite,VIIRS)影像的人口空间化研究不断发展。现在NOAA(美国国家海洋和大气管理局)网站上可获取2012年至今的NPP/VIIRS日、月、年数据。
2018年世界上第一颗兼具遥感和导航的低轨微纳智能科学实验卫星“珞珈一号”成功发射升空,其搭载的高灵敏度夜光相机大大提高了夜间灯光遥感的分辨率和图像质量,吸引了广大国内外学者的研究目光,基于“珞珈一号”的人口空间化研究也逐步发展起来。湖北省数据与应用中心高分辨率地球观测系统可免费提供“珞珈一号”的数据,并提供辐射亮度转换公式。
2 人口空间化研究热点
2.1 遥感数据多样化
自20世纪70年代以来,基于DMSP/OLS的夜间灯光数据的研究不断兴起,随着技术发展,广大学者利用其年度的灯光数据作为人口空间化研究的基础数据进行研究,但由于其自身传感器的分辨率较低,数据的亮度值存在像元饱和的问题,在不同的尺度和精度的要求下,数据的质量问题也越发突出。NPP/VIIRS数据具有更优的分辨率特性,较长、较连续的数据使其成为专家学者的研究重点,与DMSP/OLS数据的结合使用可以增加研究的时间跨度,成为研究人口空间化分布的重要方法。国产卫星“珞珈一号”提供的高分辨率夜间灯光影像,大大提高了数据的精度,给了广大研究人员更多的可选择性(表1)。
不同夜间灯光影像数据由于其传感器、周期以及当时气候等一系列原因具有不同的影像特征,所以在人口空间化研究中首要任务是根据灯光数据的优劣以及在研究区内的适宜程度来选取适宜研究的灯光影像。为了验证研究结果的精度,学者们多选取不同类型的夜间灯光数据综合使用,并进行对比分析。
2.2 多元数据精细化
社会、自然、经济和文化的发展变化都对人口的分布具有一定的影响,并且夜间灯光数据由于自身分辨率原因难以满足精细化研究的需求,所以基于多元数据的研究方法成为人口空间化研究的重要手段。随着近年来遥感技术飞速发展和地理空间大数据的建设,卫星遥感数据、人口普查数据、土地利用数据、土地覆盖数据、NDVI数据、经济发展数据以及海量与人类活动相关的兴趣点数据(如路网数据、交通站点数据、文化设施数据等)的分辨率、精细程度越来越高,将此类数据与夜间灯光数据综合使用可以显著提高人口空间分布研究的精度。
多元数据的使用方式多为利用单层数据作为变量,或者将不同数据进行融合,将融合结果作为一个单独变量。对不同变量的相关性进行分析,相关性较强的变量舍弃,对最终选取的变量选取不同的分析方法构建其与人口数据之间的关系模型,并根据人口数据进行校正,对结果进行精度评价,最终进行人口空间化研究。
2.3 模型算法综合化
在人口空间化的模型和算法上,回归模型、多因子加权平均模型、随机森林等模型算法在处理多源遥感数据和多元辅助数据的综合分析时,可显著提高研究的精细程度和准确性。
回归模型旨在建立人口空间化数据与夜间灯光数据的回归关系。通过已知区域的数据进行待定回归系数测定,构建线性回归、空间回归、逐步回归等计算模型,回归结果与多元人口数据结果进行比较验证模型的精度并进行结果修正。线性回归模型的计算比较简单,结果拟合性较好,但由于选择的数据比较单一,所得的结果过于集中,其精度有提高的空间。考虑到不同地理位置、地貌单元等区域内的差异带来的变换,GWR(地理加权回归)模型在线性回归的基础上增加了地理信息,增加了线性回归模型的精度和准确性。空间回归模型主要包括一阶空间回归、空间滞后模型、空间误差模型等,与线性回归模型相比结果精度更高。利用多元数据的逐步回归模型需要人为地选取自变量的种类,具有一定的主观性,并且在数据处理过程中,需要剔除某些自相关的自变量或者与明显与事实不符的自变量,以保证建立模型的可靠性与有效性。往往多元数据得到的数据精度较单一,数据要高,所以也是学者们提高研究精度经常选用的方法。
多因子加权平均模型是按照分析结果和经验将各自变量分布赋予一定的权重,根据加权计算结果将人口数据进行分配从而得到人口分布。由于各因素权重的赋值带有一定的经验性和主观性,所以采用此种方法需要具有长期的工作经验。
随机森林模型旨在建立人口数量与各变量之间的关系,通过随机选择变量生成决策树,并度量各变量的重要程度。此种方法不需要进行过多的拟合即可获得较高精度的预测值。但需要注意的是,自相关性较强的自变量需要剔除以减少自变量的相关性,多源数据的融合处理也有益于减少模型算法的运算量。随机森林模型需要全面系统的训练样本作为基础,所以只有在数据比较齐全的区域内或者具有相近特点区域范围内其预测精度和准确性才能达到比较理想的状态。此外,随机森林模型能够对选取的影响因子重要性进行排序,可以有效遴选出对地区内影响人口分布的主要因素[14]。
由于受夜间灯光数据类型和分辨率的限制,最早的人口空间化研究的主要在洲际、国家等大尺度的空间范围内。随着各种模型算法的兴起以及各类高分辨率多元数据的使用,改善了数据精度,人口空间化研究已从国家、省市延伸到区县、乡镇等更精细的尺度。此外,不同学者采用分区的方法进行模型构建,可以有效改善复杂地区精度较差的问题。
3 主要攻关方向
3.1 遥感数据
由于DMSP/OLS夜间遥感影像自身原因,在灯光强度较高的区域会出现图像饱和的现象,像元溢出效应导致夜间灯光遥感的影像数据光照范围过大,这种饱和现象会影响数据的可靠性与准确性[15]。不同学者针对该情况进行了不同程度的研究与改进,解决方法一是通过一定的技术手段改进该数据的质量,二是通过与其他夜间灯光数据进行比对结合使用选择更好的影像数据。夜间灯光影像存在大量的背景噪声和异常值,在影响数据的应用过程中需要进行图像的去噪处理[16-17]。针对此问题,前人已采用了不同的技术方法对夜间灯光数据进行了去噪处理,效果较好。此外,夜间灯光遥感数据的分辨率普遍较低,DMSP/OLS数据分辨率2 700 m,NPP/VIIRS数据分辨率为700 m,“珞珈一号”分辨率为130 m。所以未来针对夜间遥感数据的研究需要结合较高分辨率的其他多元数据以提高数据的分辨率和精度。
遥感数据的类型可选择性越来越多,在研究中可以结合高光谱数据弱化背景噪声对影像质量的影响,还可以利用重采样的方法提高原始影像的分辨率,从而改善原始数据分辨率不足、清晰度不够的问题。
3.2 多元数据
随着大数据时代的到来,越来越多的兴趣点数据逐渐在研究中获得应用,大大提高了研究的精度。但是在这些数据的使用中要注意数据来源的可靠性、数据的精度尺度等可能会对研究成果带来一定的影响。多元数据的滥用是导致数据使用效能降低、模型构建结果精度差、模型普适性低的主要原因。此外,高质量多元数据的使用会大大提高模型的精度,但是其成本往往比较高且获取较为复杂,计算强度也较大,所以难以扩展到大尺度的研究范围[18]。
在使用研究比较深入、使用比较成熟的数据时,要注意数据的精度以及适宜的研究程度。在使用较为新颖的数据时,要确保研究的尺度合适、精度准确、数据可靠。在研究中应用多元数据时要分析不同数据之间的相关性,对数据进行取舍,避免数据类型相关性过大导致快速过拟合。
4 结论
夜间灯光遥感的发展时间较短,但是发展趋势比较迅猛。由于其与人类活动的相关性较强,随着国内外更多遥感卫星的发射升空,基于夜间灯光遥感数据的研究越发重要。基于夜间灯光遥感的人口空间化研究是夜间灯光遥感的一个主要发展方向和研究热点,研究的尺度范围大、可用数据源多、分析方法多样、模型构建愈加复杂。未来研究方向主要是多元数据的融合和不同算法的使用,目标应用场景也向着更加精细化、复杂化的方向发展。针对夜间灯光遥感在人口空间化研究中存在的诸多问题,在后续的研究中需要重点关注夜间灯光遥感数据的稳定性和连续性、多元数据的相关性、模型构建的合理性、分析方法的精度等问题。
参考文献:
[1] 高义,王辉,王培涛,等.基于人口普查与多源夜间灯光数据的海岸带人口空间化分析[J].资源科学,2013,35(12):2517-2523.
[2] 肖东升,杨松.基于夜间灯光数据的人口空间分布研究综述[J].国土资源遥感,2019,31(3):10-19.
[3] 娄格,陈秋晓.基于“珞珈一号”夜光遥感数据融合的乡村人口空间化方法研究[J].建筑与文化,2021(1):74-75.
[4] 闫庆武,卞正富.基于GIS的社会统计数据空间化处理方法[J].云南地理环境研究,2007(2):92-97.
[5] 郑渊茂,何原荣,王晓荣,等.夜光遥感数据应用述评与展望[J].遥感信息,2020,35(3):1-14.
[6] 高雪梅,杨续超,陈柏儒,等.基于随机森林模型的环渤海地区人口空间化模拟[J].地球信息科学学报,2022,24(6):1150-1162.
[7] 王明明,王卷乐.基于夜间灯光与土地利用数据的山东省乡镇级人口数据空间化[J].地球信息科学学报,2019,21(5):699-709.
[8] 刘杨,李宏伟,杨斌程,等.基于遥感数据和POI数据的GDP空间化研究——以北京市为例[J].地域研究与开发,2021,40(2):27-32,39.
[9] 李翔,陈振杰,吴洁璇,等.基于夜间灯光数据和空间回归模型的城市常住人口格网化方法研究[J].地球信息科学学报,2017,19(10):1298-1305.
[10] 王珂靖,蔡红艳,杨小唤.多元统计回归及地理加权回归方法在多尺度人口空间化研究中的应用[J].地理科学进展,2016,35(12):1494-1505.
[11] 仇嘉豪,柳林,裴冬梅,等.兼顾空间自相关性和异质性的人口空间化模型[J].测绘科学,2022,47(7):216-226.
[12] 孙小芳.夜光遥感支持下的城市人口核密度空间化及自相关分析[J].地球信息科学学报,2020,22(11):2256-2266.
[13] 谭敏,刘凯,柳林,等.基于随机森林模型的珠江三角洲30 m格网人口空间化[J].地理科学进展,2017,36(10):1304-1312.
[14] 刘艺,杨歆佳,刘劲松.基于随机森林的人口密度模型优化试验研究[J].全球变化数据学报(中英文),2020,4(4):402-416.
[15] 卓莉,张晓帆,郑璟,等.基于EVI指数的DMSP/OLS夜间灯光数据去饱和方法[J].地理学报,2015,70(8):1339-1350.
[16] 王美玲,张和生.一种适用于珞珈一号夜间灯光影像的去噪方法[J].遥感信息,2021,36(2):114-119.
[17] SHI K, YU B, HUANG Y, et al. Evaluating the ability of NPP-VIIRS nighttime light data to estimate the gross domestic product and the electric power consumption of China at multiple scales: A comparison with DMSP-OLS data [J]. Remote Sensing, 2014,6(2):1705-1724.
[18] 高鹏.基于夜间灯光校正和多源地图融合的高精度人口空间制图研究[D].西安:长安大学,2022.