基于GIS的中国沿海区域人口分布研究

2014-01-09 06:04李春娥张丽君
科技视界 2014年27期
关键词:散点人口普查经济区

李春娥 张丽君

(新疆信息工程学校〈新疆气象培训中心〉,新疆 乌鲁木齐 830013)

1 研究理论基础

人口分布指人口在某一特定时间、空间的集散状态、。它是人口地理学研究的核心问题,同生产分布及经济社会发展息息相关。人口分布不单指人口数量的分布,还包括其他人口现象在地理空间的聚集与扩散状态,如人口质量、人口结构、人口自然增长与机械变动、人口居住地类型等空间的组合特征和空间联系[1]。

人口密度是指特地定范围内单位土地面积上的常住人口数,它是表现人口分布的主要形式和衡量人口分布地区差异的主要指标。通过人口密度指标便于比较区域间的人口分布的稠密情况,显示区域间人口分布的差异性[1]。

人口区划是在一个国家或较大的区域范围内,根据人口分布的基本特点及其影响因素的区内类似性与区间差异性而划分的人口区域。区划的具体指标包括自然地理特征指标(例如地形、气候、水文、土地资源和矿产资源特征等)和社会经济条件指标(例如生产力水平、产业结构、文化特点等)[2-4]。

基于遥感和GIS技术研究人口的文献[5-17],主要是通过自然(遥感影像信息、地形、海拔、坡度、坡向、水文、气候、土壤、交通、居民点、土地利用类型等)、经济(GDP、第一、二、三产业产值等)等因子与人口数据进行相关性分析,得出与人口分布较为密切的关键因子,并建立人口模型和生成人口密度空间分布图,采用的方法主要有格点生成法、复合面积内插法、分区建模法和多因子加权建模法等。

2 研究区域概况

根据国务院发展研究中心的报告指出,中国的东、中、西区域划分方法已经不合时宜,为此,报告提出“十一五”期间中国划分为东部、中部、西部、东北四大板块,再将四个板块划分为八大综合经济区的具体构想[11-20]。本文的研究范围是在报告提出的八大综合经济区所包括的北部沿海综合经济区(包括北京、天津两市、河北、山东两省)、东部沿海综合经济区(包括上海市、江苏、浙江两省)和南部沿海经济区(包括福建、广东、海南三省),因数据获取等问题,暂时不考虑我国的港澳台地区。

该区域从北往南属暖温带湿润半湿润地区、亚热带湿润地区和热带湿润地区,年降水量均在400mm以上,北部和东部沿海区域一年四季分明,南部沿海区域长夏无冬。水量丰富,汛期长,地貌以平原和丘陵为主,交通网络稠密,水陆运输条件好,农业发展基础好,工业状况北部偏重工业,东部和南部偏轻工业。经济基础较我国中西部有明显的优势[21]。

3 研究材料

3.1 自然数据

3.1.1 沿海区域省级、县级行政区域数据

来自中国2003年行政区域图,数据格式为Coverage,比例尺为1:100万。

3.1.2 沿海区域河流水系数据

来自国家测绘科学数据共享网的1:400万三级以上河流、1:400万四级河流和1:400万五级河流,时间为1997年,数据格式为EOO。

3.1.3 沿海区域DEM数据和土地利用类型数据

来自中国科学院地理科学研究所,时间为2000年,数据格式分别为GRID和Coverage格式。

3.1.4 沿海区域气候数据

来自中国气象科学数据共享服务网,时间范围为1951-2005年,数据格式为Shape格式。

3.1.5 沿海区域地形地貌数据

对李炳元先生主编的1:100万形态地貌图进行数字化形成1:400万地貌图,时间为1996,数据格式为Coverage格式。

3.2 经济数据

3.2.1 沿海区域第五次人口普查数据

来自中国科学院资源环境科学数据中心,时间为2000年,数据格式为EXCEL。

3.2.2 沿海区域2000年GDP数据

来自中国科学院资源环境科学数据中心和国家统计局综合司编制的《中国区域经济统计年鉴2001》,时间为2000年,数据格式为EXCEL。

3.2.3 沿海区域2000年非农业户口人口比重数据和第一、二、三产业人口占行业人口比重数据

来自中国科学院资源环境科学数据中心,时间为2000年,数据格式为EXCEL。

3.2.4 沿海区域公路数据和铁路数据

来自国家测绘科学数据共享网的1:400万基础地理信息数据,时间为1997年,数据格式为EOO格式。

4 研究方法

4.1 基础数据处理

4.1.1 河流数据

在Arc info软件中,通过“Import”命令把E00格式转换为coverage格式;通过“Project”功能设置投影参数(同行政区域数据),通过“Merge”合并三级、四级和五级河流数据;通过“Intersect”叠加合并后的河流和县级行政区域数据,通过“Length”计算各县的河流长度。

4.1.2 DEM数据

在Arc GIS软件中,通过“Mosaic to new raster”功能把DEM数据转换成分辨率为250米的GRID数据,通过“Zonal statistics as table”计算出各县的DEM平均值。

4.1.3 土地利用类型数据

在Arc GIS软件中,通过Feature to raster”转换成分辨率为250米的GRID数据;通过“Tabulate area”功能,计算出各县级的各土地利用类型的面积,并按照人口分布的影响因素和土地利用类型分类的标准,将相关的类型合并计算[例如非适宜区包括水域(代码为41-46)和未利用类型(代码为61-67),适宜区包括居住区(代码为51-53)和非居住区,非居住区包括耕地(代码为11-12)、林地(代码为21-24)和草地(代码为 31-33)]。

4.1.4 气候数据

在Arc GIS软件中,采用克里金法(Kriging)插值方法对气象站点数据的插值,形成分辨率为250m的GRID数据;通过“Zonal statistics as table”功能,计算各县的气候数据均值。

4.1.5 地形地貌数据

在Arc GIS软件中,通过“Import cover”命令把EOO格式的数据转换成coverage格式;通过“Dissolve”功能,按照地貌类型的代码融合地貌类型数据的属性表;通过“Feature to raster”功能转换成分辨率为250米的GRID数据,通过“Tabulate area”功能,计算出各县的各地貌类型的面积,并根据平原、丘陵和山地三大地貌类型标准重新合并计算面积(平原 类 型 [合 并 代 码 :2-21,23,26-34,36-40,43-44,67-85,88,90-96,98-107,109], 山 地 类 型 [合 并 代 码 :24,25,35,41,45,46,51-53,86,89,97,110],丘陵类型[合并代码:22,42,55,87,108],其他[合并代码:其余代码])。

4.1.6 公路和铁路数据

在Arc info软件下,通过“Import”命令把E00格式的数据转换为Coverage格式;通过“Intersect”叠加公路数据(和铁路数据)和县级行政区域数据,通过“length”计算属性表中各县的公路和铁路长度。

4.1.7 经济数据

校正第五次人口普查数据、GDP、非农业户口人口比重数据和第一、二、三产业人口占行业人口比重数据的统计口径,以保证经济数据的统计范围和县级行政数据中的空间范围保持一致。

4.2 后期处理分析

随机选取85%的县级区域数据做分析,剩余的15%的数据作为最后的模型验证数据。

首先,在SPSS软件中得出三个区域内各数据的散点矩阵图,重点分析人口普查数据和其他数据间的散点图趋势。然后,剔除与人口普查数据相关性较差或无关的数据,把与人口普查数据相关性较好的数据重新建立散点矩阵图和相关性矩阵,选取与人口普查人口数据相关性大于等于0.6,且无明显自相关性的指标作为关键指标[22-33]。

最后,建立人口指标与各关键指标间的模型,再对各模型进行权重相加[34],得出最终的人口模型,权重系数由各关键指标与人口普查数据的绝对系数R2确定,用剩余的15%的数据检验各区域模型的精确度并分析其原因。

5 研究结果

5.1 各区域指标间的散点图矩阵

5.1.1 北部沿海综合经济区(如图1(a-e))

图1 (a-e)北部沿海综合经济区原始数据散点矩阵图Fig1 (a-e)Initial data dot matrix in the north coast synthetical economic zone

存在线性或非线性关系的指标:GDP、road(公路)、rail(铁路)、river(河流)、耕地面积、居民区面积和平原面积。

不存在关系的指标:第一、二、三产业人口比重、非农业人口比重、DEM、水域面积、aat(年均温)、jw(大于 0℃年积温)、aap(年降水)、aah(相对湿度)、aas(日照时数)、林地面积、草地面积、未利用面积、非适宜区面积、适宜区面积、丘陵面积和山地面积。

5.1.2 东部沿海综合经济区(如图2[a-e]q)

存在线性或非线性关系的指标:GDP、耕地面积、居民区面积和平原面积。

不存在关系的指标:第一、二、三产业人口比重、非农业人口比重、road(公路)、rail(铁路)、river(河流)、DEM、水域面积、aat(年均温)、jw(大于 0℃年积温)、aap(年降水)、aah(相对湿度)、aas(日照时数)、林地面积、草地面积、未利用面积、非适宜区面积、适宜区面积、丘陵面积和山地面积。

图2 (a-e)东部沿海综合经济区原始数据散点矩阵图Fig2 (a-e)Initial data dot matrix in the eastern coast synthetical economic zone

5.1.3 南部沿海综合经济区(如图3[a-e])

存在线性或非线性关系的指标:GDP、第一产业人口比重、DEM、水域面积、耕地面积、居民区面积和平原面积。

不存在关系的指标:第二、三产业人口比重、非农业人口比重、road(公路)、rail(铁路)、river(河流)、aat(年均温)、jw(大于 0℃年积温)、aap(年降水)、aah(相对湿度)、aas(日照时数)、林地面积、草地面积、未利用面积、非适宜区面积、适宜区面积、丘陵面积和山地面积。

5.2 提取各区域内关键性指标,并建立人口模型

5.2.1 北部沿海综合经济区

选定本区域R2大于0.36的 GDP、rail、river和平原面积四个指标,并做散点矩阵图和相关性矩阵分析,查看指标间的自相关性,可以确定三个指标间没有明显的自相关性。散点矩阵图如图4所示。

根据三个指标与人口普查数据间的R2值确定三指标的权重系数分别是:GDP 为 0.36,rail为 0.24,river为 0.15,平原面积为 0.25。

(x1为 GDP,x2为 rail,x3为 river,x4为平原面积)

图3 (a-e)南部沿海综合经济区原始数据散点矩阵图Fig3 (a-e)Initial data dot matrix in the south coast synthetical e conomic zone

5.2.2 东部沿海综合经济区

选定本区域R2大于0.36的GDP、耕地面积、居民区面积和平原面积四个指标,并做散点矩阵图和相关性矩阵分析,查看指标间的自相关性,可以发现平原面积和耕地面积间的R值为0.961,剔除平原面积指标。散点矩阵图如图5所示。

根据三个指标与人口普查数据间的R2值确定三指标的权重系数分别是:GDP为0.34,耕地面积为0.30,居民区面积为0.36。

(x1为 GDP,x2为耕地面积,x3为居民区面积)

5.2.3 南部沿海综合经济区

选定本区域R2大于0.36的GDP、水域面积和居民区面积三个指标,并做散点矩阵图和相关性矩阵分析,查看指标间的自相关性,三个指标间没有明显的自相关性。散点矩阵图如图6所示。

根据三个指标与人口普查数据间的R2值确定三指标的权重系数分别是:GDP为0.41,水域面积为0.20,居民区面积为0.39。

(x1为 GDP,x2为水域面积,x3为居民区面积)

图4 北部沿海综合经济区散点矩阵图Fig4 Dotmatrixinthenorthcoastsyntheticaleconomiczone

图5 东部沿海综合经济区散点矩阵图Fig5 Dotmatrixintheeasterncoastsyntheticaleconomiczone

图6 南部沿海综合经济区散点矩阵图Fig6 Dotmatrixinthesouthcoastsyntheticaleconomiczone

6 结果及存在的不足

6.1 结果讨论

6.1.1 北部沿海综合经济区

T检验结果:sig值为0.334>0.05,F值为0.949。说明此区域模型人口数据的均值与人口普查数据的均值差异不显著。模型人口数据与人口普查数据作相关性分析(图7所示)可以看出,R2值为0.6679。

北部沿海综合经济区人口模型有四个关键指标:GDP,rail(铁路长度),river(河流长度)和平原面积,并且GDP的线性相关性R高达0.9358,其次为平原面积、rail和river长度。该区整体气候适宜,地势较为平坦,比较适合人类居住,经济发展水平整体较高,交通便利,河流较多,人口分布整体上较为稠密,特别是沿海城市人口分布较为密集。

6.1.2 东部沿海综合经济区

T检验结果:sig值为0.290>0.05,F值为1.147。说明此区域模型人口数据的均值与人口普查数据的均值差异不显著。模型人口数据与人口普查数据作相关性分析(图8所示),可以看出,R2值为0.6668。

东部沿海综合经济区人口模型有三个关键指标:GDP,耕地面积和居民区面积,并且居民区面积指标的影响程度最高,其次分别为GDP和耕地面积。该地区为我国经济发达地区,整体生产力发展水平较高,交通十分便利,区内经济发展差异相对较小,地势较为平坦,上海、南京、杭州和宁波等大型城市的人口分布十分密集,居民区面积和耕地面积的大小很大程度上决定着该地区人口的容纳程度。

6.1.3 南部沿海综合经济区

T检验结果:sig值为0.281>0.05,F值为1.181。说明此区域模型人口数据的均值与人口普查数据的均值差异不显著。模型人口数据与人口普查数据作相关性分析(图9所示)可以看出,R2值为0.6915。

南部沿海综合经济区人口模型有三个关键指标:GDP,水域面积和居住区面积,并且GDP和居住区面积对人口分布的影响程度较高,水域面积的影响较低。该地区气候整体较为湿热,交通便利,广东、福建地区的经济发达,内陆河流水系分布较为密集,是人口高密集地区,海南地区经济发展较落后,气候炎热,人口分布相对稀少。

图7 北部沿海综合经济区相关性Fig7 Correlationinthesouthcoastsyntheticaleconomiczone

图8 东部沿海综合经济区相关性Fig8 Correlationintheeasterncoastsyntheticaleconomiczone

图9 南部沿海综合经济区相关性Fig9 Correlationinthesouthcoastsyntheticaleconomiczone

6.2 存在的不足

6.2.1 数据方面的问题

影响人口分布的因素包括自然、社会经济、历史、文化背景等方面。本文由于部分数据不易定量、获取难等问题没有考虑。

空间数据的处理算法不可避免的存在不同程度的误差,这些误差同样会影响研究结果。

6.2.2 区划标准的精确性

社会经济数据一般是以行政区域为统计单元,而其他自然数据在行政区域边界是自然连续过度,要把两种不同口径下统计的数据统一到行政区域单元内,势必会影响行政区域边界地区数据过渡的不连续,从而影响到将来人口分布在行政边界上过渡的连续性。

6.2.3 人口模型指标权重的确定

本文人口模型中各指标的权重是通过客观赋权法确定的,这种方法具有较强的数学理论依据,较主观赋权法可以避免评价结果的主观随意性,但是这种方法在一定程度上不能体现决策者的意愿,可能与决策者考虑的结论有较大的差异。

[1]祝卓.人口地理学[M].北京:中国人民大学出版社,1991.Zhu Zhuo.Population geography[M].Beijing Renmin University of China press,1991.

[2]胡焕庸.中国人口的分布、区划和展望[J].地理学报,1990,45(2):139-145.Hu Huanyong.Distribution,regionalization and prospect of Chinese population[J].Acta Geographica Sinica,1990,45(2):139-145.

[3]江东,杨小唤,王乃斌等.基于RS-GIS的人口空间分布研究[J].地球科学进展,2002,17(5):734-738.Jiang Dong,Yang Xiaohuan,Wang Naibing,et al.Study on the population spatial distribution based on remote sensing and GIS[J].Advance in earth sciences,2002,17(5):734-738.

[4]陈楠.基于GIS的人口时空分布特征研究[D].济南:山东科技大学,2005.Chen Nan.Study on population spatial distribution characteristics based on GIS[D].Jinan:Shan Dong university of science and technology,2005.

[5]刘德钦,刘宇,薛新玉.中国人口分布及空间相关分析[J].测绘信息,2004,29(7),76-79.Liu Dexin,Liu Yu,Xue Xinyu.Population distribution and spatial correlation analysis of China[J].Surveying and Mapping Information,2004,29(7),76-79.

[6]廖顺宝,孙九林.基于 GIS的青藏高原人口统计数据空间化[J].地理学报,2003,58(1):25-33.Liao Shunbao,Sun Jiulin.Population census data spatialization in Qinghai Tibet Plateau based on GIS[J].Acta Geographica Sinica,2003,58(1):25-33.

[7]Suton,P.,.Modeling population density with night-time satellite imagery and GIS[J].Computers,Environment,and Urban Systems,1997,21(34):22 7-244

[8]Yew Y.,Richard M.,Fredrick W.Remodeling census population with spatial information from Landsat TM images[J].Comput.,Environment And Urban Systems,1997,21(34):245-258

[9]杨小唤,王乃斌,江东,等.基于空间分析方法的人口空间分布区划[J].地理学报,2002,57(增刊):76-81.Yang Xiaohuan,Wang Naibing,Jiang Dong,et al.The population spatial distribution based on spatial analysis method[J].Acta Geographica Sinica,2002,57(supplement):76-81.

[10]Qiu F.,Woller K.L.,Briggs R.Modeling urban population growth from remotely sensed imagery and TIGER GISroad data[J].Photogrammetric Engineering And Remote Sensing,2003,69(9):1031-1042

[11]Liu J.J.,Li CL,Population information extraction in Chaohu watershed based on RSand GIS[J].Chinese Science Bulletin,2003,48(2):181-183

[12]Francesca P.,Christopher S.,Gregory Y.Modeling the distribution of human population with night-time Satellite imagery and gridded population of the world[J].Proceedings of Pecora1 5/Land Satellite Information,2002.

[13]刘纪远,岳天祥,王英安,等.中国人口密度数字模拟[J].地理学报.2003,58(1):17-24.Liu Jiyuan,Yue Tianxiang,Wang Ying’an,et al.Digital simulation of population density of China[J].Acta Geographica Sinica,2003,58(1):17-24.

[14]Yue T.X.,Wang Y.A.,Chen S.P.,etc al.,Numerical simulation of population distribution in Chin[J]a.Population and Environment,2003,25(2):141-163

[15]张耀军,任正委.基于地理加权回归的山区人口分布影响因素实证研究-以贵州省毕节地区为例[J].人口研究,2012,36(4):53-63..Zhang Yaojun,Ren Zhengwei.Empirical study on the influence factors of mountainous area population distribution based on geographically weighted regression in the Bijie of Guizhou Province as an example[J].Population Research,2012,36(4):53-63..

[16]李静,罗灵军,钱文进等.基于GIS的重庆市人口空间分布研究[J].地理空间信 息 .2013,11(2):42-47.Li Jing,Luo Llingjun,Qian Wenjin,et al.Study on the population spatial distribution in Chongqing based on GIS[J].Geospatial Information,2013,11(2):42-47.

[17]封志明,唐焰,杨艳昭,等.中国地形起伏度及其与人口分布的相关性[J].地理学 报,2007,62(10):1073-1082.Feng Zhiming,Tang Yan,Yang Yanzhao,et al.Relief and its correlation with population distribution in China[J].Acta Geographica Sinica,2007,62(10):1073-1082.

[18]高梅.中国区域新划分.地理教育,2006(4).Gao Mei.The new Regional Division in China[J].Geographical Education,2006(4).

[19]徐晓明.论我国两种经济区的划分-经济类型区的五分法和综合经济区的“5+4”区划方案 [J].开发研究.2007.Xu Xiaoming.The division of two economic zones in China-five points method of economic zones and “5+4” of comprehensive economic zone[J].Research On Development,2007.

[20]黄跃进,唐锦春,孙柄楠.基于GIS的综合经济区划分方法研究[J].浙江大学学 报 (人 文 社 会 科 学 版 ).2000,30(1):151-156.Huang Yuejin,Tang Jinchun,Sun Bingnan.Study on the division method on comprehensive economic region based of GIS[J].Journal of Zhejiang University(Humanities and Social Sciences),2000,30(1):151-156.

[21]胡崇庆,胡焕庸.人口地理选集[M].北京:中国财政经济出版社,1990.Hu Congqing,Hu Huanyong.Population geography Anthology[M].Beijing:China Financial&Economic Publishing House,1990.

[22]王春虎.GIS支持下的青海省县级人口空间分布影响因素的定量分析[D].兰州:兰州大学,2003.Wang Chunhu.Quantitative analysis of the county-level population spatial distribution influencing factors in Qinghai Province based on GIS[D].Lanzhou:Lanzhou University,2003.

[23]韩惠,刘勇,刘瑞雯.中国人口分布的空间格局及其成因探讨[J].兰州大学学报(社会科学版),2000,28(4):16-21.Han Hui,Liu Yong,Liu Ruiwen.Discussion on the population spatial patterns and its causes in China[J].Journal of Lanzhou University(social sciences),2003.

[24]Anselin L.GIS,spatial econometrics and social science research[J].Journal of Geographical Systems,2000,2(1):11-15

[25]Yu,S.X.Analysis of Population Distribution Pattern Based on GISTechnique[J].Acta Scientiarum Naturalium Universitatis Sunyatseni,2003,42(1):75-78

[26]Langford M.Rapid facilitation of dasymetric-based population interpolation by means of raster pixel maps[J].Computers,Environment and Urban Systems,2007,31:19-32.

[27]王春菊,汤小华.基于GIS的福建省人口统计数据空间化[J].地理与地理信息科 学,2004,20(4):71-74.Wang Chunju,Tang Xiaohua.The spatialization of the population census data in Fujian Province based on GIS[J].Geography and Geo-Information,2004,20(4):71-74.

[28]David M.An assessment of surface and zonal models of population[J].International Journal of Geographical Information Systems,1996,10(8):973-989.689-692.

[29]Chen K..An approach to linking remotely sensed data and area census data.International[J].Journal of Remote,2002,23(1):37-48

[30]Harvey J.T.Population Estimation Models Based on Individual TM Pixels[J].Photogammetric Engineering&Remote Sensing.2002,68(11):1181-1192.

[31]叶宇,刘高焕,冯险峰.人口数据空间化表达与应用[J].地理信息科学,2006,8(2):59-65.Ye Yu,Liu Gaohuan,Feng Xianfeng.Expression and application of the population spatial distribution[J].Geo-Information Science,2006,8(2):59-65.

[32]黄河清,王有亮,胡宝清.基于神经网络和GIS的广西都安县人口数据空间化研究[J].测绘与空间地理信息.2009,32(6):46-49.Huang Heqing,Wang Youliang,Hu Baoqing.The research of the population spatialization in Du’an county Guangxi Province based on neural network and GIS[J].Surveying and Mapping and geomatics Spatial Information Technology,2009,32(6):46-49.

[33]宋洁华,李建松,谢跟踪.基于GIS的海南省人口空间分布模式统计分析[J].测绘科学.2008,33(6):144-145.Song Jiehua,Li Jiansong,Xie Genzong.The statistics and analysis of the population space distributions pattern in Hainan Province based on GIS[J],Science of Surveying and Mapping,2008,33(6):144-145.

[34]董春,刘纪平,赵荣,等.地理因子与空间人口分布的相关性研究[J].遥感信息,2002,4:61-64.Dong Chun,Liu Jiping,Zhao Rong,et al.The correlation research of geographical factors between population spatial distribution[J].Remote Sensing Information,2002,4:61-64.

猜你喜欢
散点人口普查经济区
项目化学习:让知识学习从“散点”走向“聚合”
人口普查学问多
冲击波散点和定点治疗肱二头肌长头肌腱炎的临床观察
人口普查由谁首创
甘肃省主要经济区联动发展战略探讨
图解北部湾经济区同城化
从观察方法与表现方法看中国画的美感
为什么要建设一带一路经济区
历次人口普查中低年龄组人口漏报研究