山西省人口空间公里格网分布模型研究

2023-12-31 02:15程紫燕
山西地震 2023年4期
关键词:行政区划格网人口

程紫燕,杨 斌,于 潼

(1.山西省地震局,山西 太原 030021;2.太原大陆裂谷动力学国家野外科学观测研究站,山西 太原 030025)

0 引言

震后人员伤亡快速评估、重点救援区域判定、救灾队伍人数确定及救灾物资需求规模估计等都离不开人口数据的支撑。精准的人口分布数据是完成上述评估的基础,随着遥感技术、GIS技术、无线通讯定位技术的发展,人口数据空间分布模型的研究也越来越深入。国内外众多学者提出一系列模型和方法,按研究的不同阶段以及所用的数据源主要分为:人口平均分配理论模型、空间插值法、人口分布影响因子分析法[1-5],基于GIS的空间化法[6-7]等。平均分配法操作最简单,将人口平均分配在行政区划单元内,但数据精度较低,与实际情况有较大差距;空间插值法是假设空间位置上越相近的点越有相似的特征值,此类方法能够有效地缩减工作量,存在因插值方法不同、采样规则不同会对数据成果有很大的影响,能否表征人口实际分布情况还需验证;人口分布影响因子分析法需要专家赋值权重,受人为主观因素影响较大[8];GIS技术为人口空间分布研究提供重要的技术手段,可以结合土地利用数据、行政区划数据、地形数据等多源数据对人口分布进行研究,近十年来成为主要的人口空间分布研究方法。

传统的基于行政区划展现人口分布疏密状态的方法,在理论方面和实际应用中都有很大的局限性。对近年来的多次破坏性地震,基于行政区划的统计人口数据方法在震后灾害快速评估中均表现不佳,需要探索精度更高、实际操作更便捷的人口分布模型。

由近年来人口空间分布模型研究结果可以看出,研究方向已从简单的格网化向受自然、经济、人文等多因素综合影响的模型发展,数据处理方式由传统统计方式向空间分析转变,研究维度由单一维度向多维度转化,人口模型成果越来越向实际靠拢。

本文以山西省为目标研究区域,通过建立人口空间公里格网数学模型,探讨形成一套简便快捷并符合应用要求的人口数据格网化方法。

1 人口分布模型建立与实现

人口空间分布数据是反映人口空间分布的重要表现,也是震后灾害快速评估、应急救援决策的重要依据。根据不同的研究目标,人口数据空间精度需求不同,目前在数据研究尺度上,人口分布研究仍以宏观维度为主,大比例尺人口分析较少,结合震后灾害评估、应急救援决策需求,综合考虑实用性及可操作性,本文以1 km×1 km为单元,研究山西省人口空间公里格网分布模型[9]。

人口的疏散和集聚是人口空间分布最直观的体现。进行人口数据空间格网分布时,应明确空间各格网上的人口权重系数,从而确定各个格网的人口。现有模型的格网人口权重多采用土地利用数据,目前土地利用数据的信息损失现象普遍存在,因基于土地利用的人口分布模型又过于依赖土地利用数据,使得土地利用数据的质量直接影响研究结果的可靠性。从模型因子的角度看,居民地与人口的关系较土地利用更直接,无论在农村还是城市,人口分布与居住建筑的关系更紧密。

以居民地为基础,分别赋予城市及农村地区各居民地块权重,按照公里格网面积与所相交居民地面积占比作为人口分配权重,完成各公里格网内人口数量计算。

在GIS软件的支持下,考虑以年鉴数据为后续更新来源,选取区县的统计人口数据为总量,按照居民地内建筑面积确定居民地权重,实现公里格网人口分布计算模型如下:

(1)

式中:Pj为第j个单元格网内人口数;Sji为第j个居民地内第i个公里格网面积权重;Si为第i个居民地面积权重;Pi为i个居民地内总人数。

(2)

式中:Di为第i个居民地块面积;D为区/县等数据计算区面积;P为区/县等数据计算区内总人口;Ri为第i个居民地块权重。

将(2)式带入(1)式后,得到式(3):

(3)

基于GIS软件,首先建立1 km×1 km的空间格网,随后在山西省居民地数据的基础上,利用Python语言按照上述公式,进行模型计算,最终形成山西省人口空间公里格网数据(以下简称人口格网数据)(见图1)。

图1 山西省人口格网数据Fig.1 Population grid data of Shanxi Province

2 数据对比分析

模型结果的准确与否需要通过对比分析得到。现有大部分人口数据检验以统计数据为基础,对于公里格网的人口数据,与统计数据的对比分析只能校验人口数据总量是否准确,不能反映格网人口在空间上的分配精度。现运用夜间灯光数据、人口普查行政区划数据、实地调研数据等,与模型结果进行对比,验证其准确性及实用性。

将模型生成的人口格网数据与夜间灯光数据进行对比发现,人口疏密程度与夜间灯光明亮程度紧密相关,全省趋势整体一致(见图2)。从图2看出,山西省人口密集区主要集中在地市级行政中心,最明亮地区表现的是太原市与晋中市两个人口密集主城区相邻叠加的效果;在太原盆地南部平遥、孝义一带有一部分灯光明亮区,人口格网数据反映出该地区虽然不是地市级中心,但人口密度较大。

图2 人口格网数据与夜间灯光数据对比图Fig.2 Comparison between grid population data and nighttime light data

将人口格网数据与普查行政区划数据叠加分析看出,按照模型生成的格网数据在空间分布上与普查行政区划数据高度吻合,在数据表达上更加清晰明确,有空间的疏密分布,还有人口数值的直观不同。对比基于行政区划的人口数据,格网数据无论在空间分布上还是数值表现上都更细致准确(见图3)。人口格网数据图中,昌宁镇行政区划的人口最密集,且集中于一定区域,该镇仍存在大面积人口稀少区;台头镇、西坡镇、管头镇等地都有高密度人口聚集地,不是行政区划人口图中一致显示的低密度区。这种表达方式能更直观精细地体现人口密集区域所处位置,为未来震后救援或者其他针对人口密集区的处置对策提供参考依据。

图3 人口格网数据与行政区划人口对比图Fig.3 Comparison between grid population data and population data by administrative divisions

将模型生成的人口格网数据与地形数据(见图4)、道路数据(见图5)叠加分析看出,建筑物稠密的城市地区、建筑物松散分布的农村地区与格网人口的疏密形成较好的空间耦合性,人口分布整体表现为依照地形、沿交通道路辐射的空间形态分布。图4、图5都反映出在山区人口明显稀少,沿道路人口密集,符合山西农村地区的生活习俗,依山傍崖,居住密集区的建筑大都在坡地和河谷地带。

图4 人口格网数据与地形数据叠加图Fig.4 Overlay of grid population data with remote sensing images and terrain data

图5 人口格网数据与道路数据叠加图Fig.5 Overlay of grid population data with road data

本研究还采用实地调查数据对模型结果进行精度检验,通过对比看出,因存在外出务工、上学等情况,实际调研人数较格网人口人数较少,格网人口与户籍人口较一致,误差率最大为7.66%,最小为0.13%,平均误差率为2.1%(见表1)。对比结果表明,模型生成的公里格网人口数据与实际数据误差较小,具有较高的精度。

表1 人口格网数据与实际调研人数对比Table 1 Comparison between grid population data and actual surveyed population

3 结论与讨论

基于居民地基础数据、人口统计数据建立的人口格网数据模型,通过与夜间灯光数据、行政区划人口、道路数据、地形数据和实际调研数据等叠加分析对比,得出如下结论:

(1) 夜间灯光的明亮度与格网人口的疏密程度高度重合。

(2) 行政区划的人口与格网人口趋势一致,格网人口表现得更精细。

(3) 与道路数据和地形数据叠加分析,格网人口的疏密与地形、交通相互对应,印证出格网人口的合理性。

(4) 与实际调研数据对比的误差较小,分析可知误差存在的原因由流动人口和静态统计数字之差造成。

综上得出,该人口分布模型与实际相符性较高,可作为应急辅助决策、灾害风险评估研究、震后灾情快速判断、救援力量科学部署的参考依据,也可为大数据挖掘应用服务防灾减灾提供借鉴。

格网人口能精细地展示出各地在人口分布的特点,显示出人口密集区和稀少区,精确表达人口在空间区域的差异,为制定合理的应急预案提供科学依据,可应用于震后救灾部署、密集人群风险预判等应急工作,同时也能避开无人区域,节约公共资源,提高应急处置效率。

该人口分布模型以人口统计数据作为总量控制,未考虑流动人口造成的实际数据差距,在后续研究中应加以改进。在实际生活中,人员流动不仅仅是城市间的交流,在大中城市以及一些典型城市,还存在工作区与生活区之间的白昼差别,甚至某些特定时段会在特定场所出现大量人员聚集。如何在破坏性地震发生后较准确判定灾情,以目前比例尺下的人口分布模型恐难以实现,需要放大比例尺,增加更多参考系数来研究城区分时段的人口分布模型。

猜你喜欢
行政区划格网人口
《世界人口日》
人口转型为何在加速 精读
实时电离层格网数据精度评估
人口最少的国家
1723 万人,我国人口数据下滑引关注
中国行政区划的前世今生
河北省行政区划
基于空间信息格网与BP神经网络的灾损快速评估系统
河北省行政区划
平均Helmert空间重力异常格网构制方法