于欣鑫, 马安青, 邢容容, 罗崇鑫, 马冰然, 张志强(中国海洋大学环境科学与工程学院,山东 青岛 266100)
青岛地区人口密度空间化模拟❋
于欣鑫, 马安青❋❋, 邢容容, 罗崇鑫, 马冰然, 张志强
(中国海洋大学环境科学与工程学院,山东 青岛 266100)
相对于传统人口统计数据,高精度的人口密度空间化分布数据更能反应人口的实际分布情况。由于城市主体位于丘陵地貌上,青岛地区相对其他沿海城市有着特殊的人口分布规律。本文以青岛地区为例,对人口密度进行空间化分布模拟。以GIS为平台,在提取土地利用类型、DEM高程、道路分布等常见影响因子之外,引入DMSP夜间灯光影像数据,利用SPSS软件进行多元回归分析,建立并优化模型,进而比较这些因子对人口分布的影响度以及在青岛地区的拟合效果,最后模拟生成1km网格内的2010年人口密度分布图。经过对比验证,所得结果与现实吻合度较高,基本符合实际人口分布情况,能够清晰地反映青岛地区人口分布规律,可以为研究人口分布规律及人口管理等提供一定的数据支持。
人口密度; 空间化模拟; 人口分布规律和管理
人口问题是影响社会与经济发展的关键因素,获取人口数据并掌握其分布规律有着重要的现实意义。传统的人口统计数据多源于人口普查,在实际应用中存在着数据的空间分辨率(县级)和时间分辨率低的问题[1],无法精确地显示人口分布规律。人口数据空间化是指通过人口统计数据,通过适宜的参数和模型方法,反演出在一定时间和一定地理空间中的人口分布状态[2],可以较好的解决分辨率低的问题,更接近人口的实际分布。人口数据空间化的研究方法主要有面积权重法、数学插值法、密度表面模拟法、遥感数据与GIS支持的估算法等[3-6]。而随着技术和理论的成熟,遥感数据和GIS支持的估算法已被广泛应用,成为人口数据空间化的重要手段之一。
人口的空间分布是区域内地形、水系、土地利用、交通廊道等多种因素共同作用的结果[7]。近十余年中,随着相关技术的发展,许多学者利用这些影响因素进行人口的空间分布研究,取得了大量成果[8-11]。林飞娜等[12]通过建立模型,模拟了长春市的空间人口分布情况;廖顺宝等[13]利用土地数据,进行了四川省的人口分布空间化实验;封志明等[14]分析了中国地形起伏度与人口分布的相关性,得到两者的对数曲线拟合度高达0.91;范科红等[15]通过研究得出道路基础设施与人口分布有着密切的联系。此外,卓莉等[16]通过夜间灯光数据与适应居住区面积的分析统计,得到了1998年1km网格内的中国人口密度图,人口分布情况与实际基本一致。
青岛是胶东半岛的经济中心城市,地势特征明显,人口分布规律特殊。本文以青岛地区为研究对象, 提取土地利用、地形、道路等常见因子,并引入DMSP夜间灯光数据,结合青岛地区的人口统计资料,通过对各因子的回归分析建立模型,模拟了青岛地区的人口分布情况,并通过研究因子对人口分布的影响度和拟合效果,比较他们在青岛地区的适应性,所得结果可以为人口与资源、环境的综合管理提供借鉴。
1.1 青岛地区概况
青岛地区位于山东省半岛南端,东南濒临黄海,环绕胶州湾,周边毗邻烟台市、日照市、潍坊市,全区位于35°35′N~37°09′N、119°30′E~121°00′E之间,属于温带季风气候带,地势东高西低,南北两侧隆起,中间低陷,境内有胶莱平原和盆地,其中平原约占总面积的37.7%,丘陵占25.1%,区域内最高点位于市辖崂山区崂山山脉,峰顶海拔1132.7m。青岛地区包括市辖7个区和青岛市代管的5个县级市,包括即墨市、平度市、胶南市、胶州市和莱西市(2012年青岛变更行政规划, 将黄岛区和县级胶南市合并为新的黄岛区,将市北区和四方区合并为新的市北区)。2010年,全区总面积为11282km2,户籍总人口为753.64万人,区内公路通车里程达16181.5km。
青岛市是副省级城市,胶东半岛的经济中心城市,经济发展水平较高,聚集的大量人口给城市带来了极大的影响。且青岛地区的城市主体基本位于丘陵地貌上,相对中国东部多数城市而言,人口分布有着特殊的规律。因此,对青岛地区的人口进行空间化研究、总结人口分布规律,在东部沿海区域的人口分布研究中有着特殊的意义,同时也对青岛的城市规划与管理以及生态环境的机制研究有着很好的现实作用。
1.2 数据源
2010年人口统计数据来源于青岛市统计信息年鉴中的分市、区人口数(截止2010年底);2010年青岛地区土地利用图、道路数据以及1∶400万青岛地区县级行政边界图;青岛地区DEM高程图,分辨率为90m。来源于中国科学院数据应用环境;2010年DMSP/OLS夜间灯光数据(F18卫星),灰度值范围0~63,地面分辨率0.00833Degrees。来源于美国国家地球物理数据中心。
2.1 数据预处理
2.1.1 投影转换 为统一格式便于图像的数据处理,将空间数据的投影统一转换为WGS1984。
2.1.2 重采样 将相关栅格数据进行1km重采样操作,统一像元大小。
2.1.3 青岛地区数据提取
(1)基于GIS平台,以土地利用类型字段为基础,将土地利用图转化为1km网格的栅格数据。然后以县级行政边界图为掩膜,提取青岛地区各县区的土地利用数据,计算出各县区的人口密度及主要土地利用类型在总面积中所占的比例(见表1)。
表1 2010年青岛各县区土地利用数据Table1 Land use data of Qingdao in 2010
Note:①Land area;②Population density;③Proportion of arable land;④Proportion of forest land;⑤Proportion of residential area
(2)通过DEM高程图获取青岛地区的高程值,通过分区统计工具,计算得到青岛各县区的DEM平均值,如表2。
(3)基于DEM高程图,利用GIS中的表面分析工具,提取出坡度分布图。并通过分区统计计算青岛各县区的平均坡度。
(4)利用县级行政边界图提取青岛各县区DMSP夜间灯光数据,获得灯光总强度和灯光灰度平均值。
(5)利用县级行政边界图提取各县区道路数据,并计算出道路密度。
2.2 单因子回归分析
2.2.1 人口与土地利用的关系 中国人口尤其是农村人口的分布,与土地有着密切的联系[17]。土地利用类型主要分为6类:耕地、林地、草地、水域、未利用土地以及城乡、工矿、居民用地(以下简称居住区)[18]。提取出的土地数据显示,青岛市辖区的土地利用以居住区和林地为主,而其他县市利用情况基本相同,主要为耕地和居住区。
表2 青岛各县区地理数据Table 2 Geographic data of Qingdao in 2010
Note:①Mean DEM;②Mean slope;③Average light;④Density of roads
将各县区土地利用的数据分别与人口密度做回归分析,耕地、居住区和林地3种利用类型与人口相关系数均达到0.80以上(见图1),可以看出这3种是对人口分布影响最大的土地利用类型。而水域、草地和未利用土地与人口密度的相关系数均小于0.2,相关性不显著,在此不予分析。
2.2.2 人口与高程、坡度的关系 地形地貌是人口分布的主要影响因素之一,世界人口稠密地区多分布在平原。青岛地区地势东高西低,南北两侧隆起,中间低陷,地形特征明显。以平均高程和平均坡度为自变量分别做回归分析(见图2),得到与人口密度的相关系数为0.74、0.87,即高程与坡度与人口分布间都有着较高的相关性。
封志明等[14]研究表明,人口分布与地形起伏度成负相关,全国85%的人口居住在相对高差小于500m的地区。而相关性分析显示,在一定高程范围内,青岛的人口密度与高程、坡度却均成正相关。若去除市辖区这个样本,其他五县市人口密度与高程便呈负相关性。这正是因为青岛独特的地势特征:城市主体位于丘陵地貌。而且人口最为密集的市辖区域内,坐落着最高海拔1132.7m的崂山山脉,致使平均高程变大,令回归分析结果不同于全国整体趋势,且人口分布的高程与坡度范围均不同于其他地区。
图1 人口与土地利用的关
图2 单因子与人口的关系
2.2.3 人口与道路网的关系 人口分布同时受着不同等级道路的影响[13]。青岛道路交通分布图中将道路分为国道、高速和省道三级,通过GIS提取各级道路的长度:国道241.9km、高速746.4km、省道3085.2km。为简化数据,本文将三级公路求和,统一计算道路密度,并与人口密度进行回归分析(见图2),得到相关系数为0.96。
2.2.4 人口与DMSP夜间灯光数据的关系 夜间灯光是个综合因子,含盖了交通和居民地等与人口分布密切相关的信息,源自DMSP/OLS传感器的探测。这种传感器的量级4倍于普通传感器,可以在夜间探测到城市灯光甚至小规模居民地、车流等发出的低强度灯光,并使其明显区别于黑暗的乡村背景。夜间灯光数据凭借其特殊性,已成为模拟人口密度分布中的重要方法之一。
本文在土地利用类型等常用分析因子的基础上添加了夜间灯光数据,利用其特殊性提高人口模拟的精度。将提取的灯光总强度和灰度平均值分别与人口密度值进行回归分析,得到相关系数为0.88和0.92(见图2)。此处选取相关性较高的灯光灰度平均值进行后续分析。
2.3 多因子回归分析
从单因子回归分析中对比相关系数可以确定,土地利用类型(L)、高程(E)、坡度(S)、道路(R)、DMSP(D)数据与人口的密度分布都有着很高的相关性,即它们是影响人口分布的重要因子。以这些影响因子为自变量,以人口密度为因变量,导入SPSS软件中进行多元回归分析。根据不同的因子个数和组合方式,可以得到不同相关性的回归方程。[20]
表3 回归方程Table 3 Regression equations
2.4 人口数据空间化
在ArcGIS中添加回归方程中涉及的因子图层,在栅格计算器工具中代入回归方程4进行计算,得出各县市的像元所对应的模拟人口密度值,并生成新图层,以此步骤来进行人口空间化的分布模拟。
最终得到的图层即为2010年青岛市1km网格内人口密度空间分布图(见图3)。
将统计的人口密度与模拟结果相比较,各区县单独的模拟情况吻合度均能达到84%以上,最高可达99%。而将各区的实际与模拟数据进行回归分析(见图4),相关系数为99.39%,即整体吻合度非常好。
表4中对人口密度模拟结果进行了对比分析,可以看出,青岛平均人口密度为832人/km2,平均人口密度最小值分布在胶南市,为408人/km2;最大值分布在市辖区,为2331人/km2。而由得到的人口密度分布图中可以直观发现,青岛地区人口多分布于市辖区以及各县市的中心边界地区和部分边界地带。其中,青岛市辖区内人口分布最为密集,人口密度明显大于其他县市。而即墨等五县市情况基本相同,人口多分布在县市中心或与市辖区边界的接壤处,人口稀少处多位于边界处。
图3 青岛地区2010年1km网格人口密度分布图(单位:人/km2)
人口密度①/人·km2即墨Jimo平度Pingdu胶南Jiaonan胶州Jiaozhou莱西Laixi市辖Shixia青岛Qingdao实际②6164354736194652333823模拟③5875124086085442331832吻合度④0.95290.84960.86260.98220.85480.99910.9892
Note:①Population density; ②Actual value; ③Simulated value; ④Correlation
图4 青岛地区模拟人口密度与实际人口密度的关系
与现实情况对比,这种结果基本贴合实际情况,即成果可以反映出实际的人口分布规律。所得的人口密度空间分布图清晰地反映了青岛地区的人口分布状况,体现了人口分布在空间上的差异性,在使用中将可以有很强的直观表达性和实际应用性。
本文以具有明显特征的青岛地区为例,选取了多种影响因子,对人口密度空间化进行了模拟。模拟过程中以栅格图像像元为基本单位,相对于传统意义上以行政区域为单位的人口密度分布情况,得到的成果更有代表性。成果可以为青岛地区的人口与资源环境的科学管理规划提供研究借鉴和有效的数据支持。而且因为青岛地区地势以及人口分布的特殊性,也可以为其他地区的人口密度空间化研究提供一定的参考。
通过在青岛地区的分析和模拟情况,可以确定在选取的常规因子中,耕地和林地极大的影响着人口的分布范围;居住区以及夜间灯光数据能够直接反应人口的分布情况,可以直接用于人口的分布模拟;道路的密集程度也与人口分布互相影响,成正比例相关。并综合目前不同地区的研究成果来看,可以认为这些规律能适用于大多数情况下的人口分布研究。但在青岛地区,受独特的地形特征影响,在县市尺度上的高程、坡度与人口分布成正相关,这异于其他城市,成为了青岛地区人口模拟的特殊情况。
针对市辖区内的7个区,此次研究将其作为市辖区这一个整体纳入行政区划。若将它们与其他县级市并行分析,人口密度与高程、坡度的相关性也将与全多多数地区相同,趋势呈现负相关。但因为区域内人口密集分布、崂山区内的高差等原因,与其他县级市的情况差异较大,会影响青岛地区的整体分析和模拟,因而没有进行细化研究。
相较常用的人口空间化分析方法,本文又添加了夜间灯光数据(DMSP)。该数据能够探测城市灯光以及居民地等发出的灯光,与人口分布有着密切的关系,并凭借其相对于土地等其他数据的特殊性,成为近年模拟人口密度分布中的重要利用数据之一。将它与其他因子一并纳入分析过程,提高了模拟结果的准确性。
在栅格计算过程中,出现了部分人口密度值为负数的情况,采用了变负值为零的处理方法[21],一定程度上影响了栅格化的精度,然而并没有影响模拟结果与实际情况的拟合度。造成出现负值的原因,如居住区面积统计受到矿区等多因素影响、道路统计的精度以及栅格像元大小,以及因为研究尺度较小,区域样本的数量受到限制等,可以随着技术和数据精度的提高而改善。
人口数据空间化是人口信息与其他资源环境、社会经济等信息进行空间集成的基础,现实中的人口分布受着多种因素的影响,随着对资源环境和社会中各种影响因子的加深研究,可以获得更高精度和实用性的人口空间分布化成果,为研究人口分布规律、相关政策的制定提供更为有效的数据支持。
[1] 江东, 杨小唤, 王乃斌, 等. 基于RS、GIS的人口空间分布研究[J]. 地球科学进展, 2002, 17(5): 734-738.
[2] 叶宇, 刘高焕, 冯险峰. 人口数据空间化表达与应用[J]. 地球信息科学, 2006, 8(2): 59-65.
[3] 廖一兰, 王劲峰, 孟斌, 等. 人口统计数据空间化的一种方法[J]. 地理学报, 2007, 62(10): 1110-1119.
[4] 黄耀欢, 杨小唤, 刘业森, 等. 人口区划及其在人口空间化中的GIS分析应用——以山东省为例[J]. 地球信息科学, 2007, 9(2): 49-54.
[5] 李明杰, 钱乐祥, 陈健飞, 等. 聊城市人口密度空间化方法探讨与运用[J]. 广州大学学报: 自然科学版, 2008, 7(2): 71-74.
[6] 李恒凯, 刘小生, 陈优良. 地理信息系统支持下的人口时空分布模型[J]. 河南科技大学学报: 自然科学版, 2011, 32(6): 95-99.
[7] 曹晓晗. 辽宁省人口密度分布模拟研究[J]. 测绘与空间地理信息, 2010, 33(2): 144-148.
[8] 王春菊, 汤小华. 基于GIS的福建省人口统计数据空间化[J]. 地理与地理信息科学, 2004, 20(4): 71-74.
[9] 王雪梅, 李新, 马明国. 基于遥感和GIS的人口数据空间化研究进展及案例分析[J]. 地理与遥感技术与应用, 2004, 19(5): 320-327.
[10] 刘木生, 林联盛, 张其海, 等. 基于RS和GIS的江西省人口统计数据空间化[J]. 江西科学, 2008, 26(6): 928-931.
[11] 杨眉, 王世新, 周艺等. 基于DMSP/OLS影像的城市化水平遥感估算方法[J]. 遥感应用, 2011(4): 100-106.
[12] 林飞娜, 赵文吉, 张萍. 基于GIS的城市人口空间分布模型与应用——以长春市区为例[J]. 测绘科学, 2008, 33(4): 163-165.
[13] 廖顺宝, 李泽辉. 四川省人口分布与土地利用的关系及人口数据空间化实验[J]. 长江流域资源与环境, 2004, 13(6): 557-561.
[14] 封志明, 唐焰, 杨艳昭. 中国地形起伏度及其与人口分布的相关性[J]. 地理学报, 2007, 62(10): 1073-1082.
[15] 范科红, 李阳兵, 冯永丽. 基于GIS的重庆市道路密度的空间分异[J]. 地理科学, 2011, 31(3): 365-371.
[16] 卓莉, 陈晋, 史培军, 等. 基于夜间灯光数据的中国人口密度模拟[J]. 地理学报, 2005, 60(2): 266-276.
[17] 林丽洁, 林广发, 颜小霞, 等. 人口统计数据空间化模型综述[J]. 亚热带资源与环境学报, 2010, 5(4): 10-15.
[18] 田永中, 陈述彭, 岳天翔, 等. 基于土地利用的中国人口密度模拟[J]. 地理学报, 2004, 59(2): 283-292.
[19] 魏伟, 石培基, 脱敏雍, 等. 基于GIS的甘肃省道路网密度分布特征及空间依赖度分析[J]. 地理科学, 2012, 32(11): 1297-1303.
[20] 桂平, 曾永年, 邹滨, 等. 基于GIS的区域人口密度空间分布模拟——以张家界市永定区为例[J]. 测绘科学, 2009, 34(2): 237-240.
[21] 廖顺宝, 李泽辉. 基于人口分布与土地利用关系的人口数据空间化研究——以西藏自治区为例[J]. 自然资源学报, 2003, 18(6): 659-665.
责任编辑 庞 旻
Simulation of Population Spatial Distribution in Qingdao Region
YU Xin-Xin, MA An-Qing, XING Rong-Rong, LUO Chong-Xin, MA Bing-Ran, Zhang Zhi-Qiang
(College of Environmental Science and Engineering, Ocean University of China, Qingdao 266100,China)
The aggregation of a large number of people has a prominent influence on the cities.Compared with the traditional population density at administrative regions, spatial distribution of population data can reflect the actual distribution of the population better.Different with other coastal cities, the main part of Qingdao region locates on a hilly landscape and its population distribution has a special pattern.Taking Qingdao region as the sample, based on GIS, the land use types, DEM elevation, road distribution and DMSP data are extracted and analyzed by SPSS. These factors are compared on the correlation and applicability in Qingdao region. The population density of Qingdao region at 1 km grid in 2010 is simulated through the optimistic model. The result is consistent with a higher degree of reality. It reflects the spatial differences and regular pattern of population distribution of Qingdao clearly. And it also can provide an effective support for the study of population distribution and management.
population density; spatial distribution; Qingdao region; population distribution and management
山东江苏海岛海岸带卫星遥感调查与研究项目(908-01-WY02);2012中国海洋大学本科生研究发展计划项目(1212011014);基于SOM神经网络大辽河流域水环境质量评价可视化系统研究项目(MESE-2012-02)资助
2014-07-07;
2014-11-26
于欣鑫(1989-),女,硕士生,研究方向为GIS与RS在环境科学中的应用。E-mail: yxx_cc@sina.com
❋❋ 通讯作者: E-mail:maanqing538@yahoo.com.cn
Q494
A
1672-5174(2015)08-097-06
10.16441/j.cnki.hdxb.20140216