江娜
(山东省国土测绘院,山东 济南 250102)
地理国情从空间角度反映一个国家自然、经济、人文的信息[1],涉及国土疆域、地理区划、地形地貌特征、道路交通网络、江河湖海分布、土地利用、城镇布局、生产力空间布局等自然和人文地理信息在宏观层面的综合表达[2- 3]。地理国情监测是综合利用包括遥感技术在内的现代测绘技术,对我国地理国情要素进行动态和定量化、空间化的监测[4]。地理国情普查统计分析是地理国情普查的重要组成部分,将国情普查数据与经济社会信息相融合,是反映经济、社会、资源、环境的空间分布规律的必要手段和阶段,对于推广普查成果应用、推动地理国情普查与监测具有至关重要的作用[5]。
地理国情统计分析工作是地理国情数据向地理国情信息、地理国情知识乃至决策智慧转化与提升的重要技术手段。鉴于地理国情统计分析的重要性,自开展地理国情普查与监测工作以来,业界对于地理国情统计分析与评价指标体系[6]、基本统计[7- 9]、综合统计[10- 13]等相关内容进行了多层次探讨与研究。前述统计分析研究或者仅涉及一两个方面,或者从局部区域展开,对于省级区域的全面综合统计实践尚未有涉及。该研究从山东省级尺度、地理空间的角度,基于地理国情普查成果并深度融合社会经济和人文数据,通过纵向分析、横向分析、类比分析等方法,对自然、人文等地理国情要素进行空间化、综合性统计分析评价,为政府部门、专业应用以及社会公众提供准确可靠的地理国情信息,可为山东省经济社会发展和生态文明建设提供有力支撑。
该文的主要研究内容分为3个层次,首先以地理国情数据为基础,结合基本统计成果、基础测绘成果、经济人口等专题数据,建立对自然资源分布与利用、生态环境现状、基本公共服务均等化、经济发展状况、开发强度状况等方面的指标体系,形成山东省综合统计指标成果;其次以综合统计指标成果为基础,结合综合统计模型、一致性哈希高容错性算法和知识驱动的专题制图技术开发山东省综合统计分析系统,实现地理国情统计分析计算、专题制图和成果展示的系统化流程处理;以综合统计分析成果为依据,结合山东省的地理国情信息空间分布、空间结构、空间关系、地域差异等特征,针对山东重要的经济示范区进行分析评价,客观反映研究区国土空间格局、生态协调程度、区域经济发展状况和社会事业发展水平。
山东省综合统计分析技术流程基于地理国情信息数据,建立反映山东省地理国情现状及趋势的综合统计指标体系,开发山东省地理国情综合统计分析系统,基于规则网格、行政区划、自然地理区域、社会经济区域的统计分析单元进行综合统计,并形成地理国情普查统计分析成果。具体流程如图1所示:
图1 山东省地理国情信息综合统计分析技术流程
山东省综合统计分析涉及地理国情普查数据、社会经济统计数据以及基本统计成果。其中普查数据包括DEM、地表覆盖、地理国情要素、地理单元数据等;社会经济统计数据包括人口、经济以及部门专题等数据;基本统计成果包括地形地貌,植被覆盖、水域、地表覆盖、交通、居民地和地表单元等(图2)。
图2 山东省地理国情综合统计分析数据源
地理国情统计指标需围绕“科学性与可操作性相结合,层次分明、面向服务,普查数据为主、兼顾专题数据”的原则开展,结合国家指导意见,形成资源分布与利用、生态环境现状、基本公共服务均等化、区域经济发展状况、城镇开发强度等5个方面、50多个地理国情指标。
图3 指标体系构建示例- 区域经济潜能
区域经济发展状况,从经济密度、人均GDP增长率、单位面积各类型产业产值、拥有汽车站、火车站等资源数量等多个方面进行测度(图3)。基本公共服务作为一种公共产品向全社会民众提供,是经济社会发展到一定程度的必然要求[14]。该文从基础教育、基本医疗、养老服务和交通在内的四种公共服务入手反映区域内教育、医疗、社会福利以及交通网络等公共服务设施的空间覆盖程度、资源配置合理性程度。城镇开发强度涉及多个层面的问题,该研究从地理国情视角,设计了工矿企业空间密集度、人均建设用地面积、常住人口城镇化率等多个指标。生态环境与社会经济关系复杂,表征的指标很多,依据《生态环境状况评价技术规范》[15]选取人为干扰度、水网密度指标、植被覆盖度、生物丰度、景观破碎度等指标。资源分布与利用方面,从地理国情普查数据中提炼耕地面积占比、园地面积占比、林地面积占比、坡耕地面积占比等多个指标,侧重反映自然资源分布情况、开发利用程度及开发利用潜力。山东省综合统计指标模型设计详见表1。
表1 统计分析指标模型设计
综合统计指标通过对数据重新分类、空间叠置分析、网络分析、缓冲分析等方法计算得到。基于指标计算结果,通过资源配置模型、空间关系建模等相关模型和方法,采用标准处理法、极值处理法、归一化处理法等方法进行指标归一化处理后,自下而上逐级加权计算构建5个方面的指数从而进行分析评价。
地理国情普查综合统计分析属于计算密集型、知识密集型、多学科交叉的复合型工作,研究过程中存在较多难点。该研究从统计分析过程中的技术瓶颈入手进行了相关的关键技术研究。
山东省综合统计分析需结合选取主题,从不同地理空间视角对其分布、关联、规律进行揭示。该研究从规则地理格网单元、行政区划与管理单元和自然地理单元等空间单元开展统计分析,从不同尺度表达统计分析主题。综合统计分析涉及5个主题多个指标,从地理国情角度,对表征指数进行多级细化,形成三级指标、二级指标、一级指标的模型树。在模型树中,自动判断指标级别,动态提取相关参数,基于多级指数进行计算,实现了指标模型自由组合及统计范围自由选择的地理国情信息的统计分析计算。
综合统计分析的地理大数据包括基本统计数据、地理国情普查数据、经济普查数据、专题调查数据等,数据类型复杂,以非结构化或者半结构化数据为主;参与综合统计分析指标运算的数据量为TB级别,各子计算任务运行进程差异大,需要采用更灵活、高效的计算框架进行地理统计分析,缩短计算时间。山东省综合统计分析基于一致性哈希高容错性算法[16- 17]实现地理大数据分布式高效运算,大大提升计算性能,解决运算效率低、耗时长的问题。
为实现更优的综合统计分析成果的可视化表达,山东省研究实现了基于知识驱动的快速精细化制图模式。以统计知识库为基础,明确制图表达,基于地理国情信息综合统计分析成果,结合与统计专题地图制作相关的数据进行梳理和分类,将其转换为计算机可以正确识别的知识,结合统计分析技术形成流程化的制图模式,配合制图规则、制图模板、制图系统实现统计分析专题图更加精细化、高效率的生产。
综合统计分析成果按统计单元面积划为不同空间尺度,按指标细化为不同表征粒度,基于归一化数据分析方法,消除指标之间的量纲影响和数据相对于趋势值的偏差,建立统计分析主题指标分级评估体系,从不同角度和整体上分别对山东省的自然资源空间分布、生态环境现状、基本公共服务、经济发展状况和开发强度进行评估,更加简便准确的展现区域统计分析的成果。
该研究建成了山东省综合统计分析系统(图4)、专题制图系统(图5)、统计分析成果展示系统(图6),实现了山东省综合统计分析指标选取、计算、展示、制图模块化、一体化、流程化。
图4 综合统计分析系统
图5 专题图制图系统
图6 统计分析成果展示系统
形成包括自然资源分布与利用、生态环境现状、基本公共服务均等化、经济发展状况、开发强度等5个方面50余个指标(表1),在此基础上对全省以及主要经济社会单元各指标、指数进行计算,对不同主题的地理空间状况与分布进行了揭示(如生态环境状况指标,见表2)。
表2 生态环境状况指标统计
对全省及山东半岛蓝色经济区、黄河三角洲高效生态经济区、山东省会城市群经济圈、山东省西部经济隆起带等“两区一圈一带”经济社会单元各有侧重的进行综合统计分析并形成专题报告与分级评价专题图(图7、图8),为政府部门管理决策提供客观、翔实的依据。
图7 山东省自然资源构成专题图
通过该研究成果的应用,地理国情数据得到深入挖掘,数据表现形式极大丰富,形成的成果权威、客观、准确、直观,并直接服务于山东省审计厅、山东省发展与改革委员会、山东省国土资源厅、山东大学、山东省遥感技术应用中心等政府及科研机构,为各部门、科研机构相关处室业务整合与统筹规划,宏观数据对比分析,量化决策向大数据决策转变等提供了有力的技术支撑和可靠依据。
地理国情普查属于开创性工作,综合统计分析也没有成熟的经验可以借鉴。该文在实践基础上探讨了面向省级区域的综合统计分析完整技术流程与软件实现。建立了目标驱动的多尺度、多主题统计分析数据指标模型体系,解决了地理省情成果快速处理及转化问题;基于一致性哈希高容错性算法设计了计算任务调度框架,解决了山东省地理国情综合统计分析数据量大、指标多、统计单元广、运算速度慢的问题,达到统计分析指标快速高效率的运算,指标模型高灵活度、高容错性配置的效果;利用知识本体、知识库结构等理论结合二次开发技术,首次提出了基于知识驱动的精细化制图的方法,解决了山东省地理国情信息及综合统计分析成果的专题图制
图中的不规范、效率低、一致性问题修改困难等问题,达到了快速制作精细的统计分析专题图的效果。在后续的应用和实践过程中,地理国情统计分析工作还会不断深化和完善,最大程度体现地理国情普查、监测工作的价值和意义。
:
[1] 宁津生,王正涛.2012- 2013年测绘学科发展综合报告[J].测绘科学,2014,39(2):3- 10.
[2] 陈俊勇.地理国情监测的学习札记[J].测绘学报,2012,41(5):633- 635.
[3] 李德仁,眭海刚,单杰.论地理国情监测的技术支撑[J].武汉大学学报(信息科学版),2012,32(5):505- 512.
[4] 国务院第一次全国地理国情普查领导小组办公室.地理国情普查内容与指标[EB/OL].http://hainan.sbsm.gov.cn/accessory/Oct24,2013115311AM.pdf,2017- 11- 03.
[5] 袁卫平,董春,康风光,等.地理国情基本统计算法模型管理策略研究[J].遥感信息,2014,29(4):62- 66.
[6] 刘耀林,王程程,焦利民,等.地理国情多层次统计分析与评价指标体系设计[J].地理信息世界,2015,22(5):1- 7.
[7] 凌子燕,黄妤.地理国情普查基本统计实践与经验探讨[J].测绘与空间地理信息,2015,38(12):189- 191.
[8] 左娟,李勇军,林观芷.地理国情普查基本统计的实践与探讨[J].测绘标准化,2017,33(1):9- 10.
[9] 董春,袁卫平,亢晓琛,等.地理国情大数据基本统计的多进程并行计算[J].测绘科学,2014,39(5):13- 17.
[10] 刘国,张晶.人文地理国情综合统计分析指标体系初探[J].测绘与空间地理信息,2015,38(8):122- 125.
[11] 马世发,邹威,欧阳雪敏.三生协调的地理国情综合统计分析框架设计[J].测绘科学,2017,42(10):80- 87.
[12] 杜俊秀,张继贤,董春,等.中小学布局水平指标体系的空间均衡性分析[J].测绘科学,2015,40(7):64- 97.
[13] 张立芳,王亮,张玉,等.地理国情普查数据支持下的作物生长适宜性评价——以迁西县板栗为例[J].遥感信息,2015,30(3):52- 59.
[14] 王晓玲.我国省区基本公共服务水平及其区域差异分析[J].中南财经政法大学学报,2013(3):23- 29.
[15] HJ 192- 2015,生态环境状况评价技术规范[S].北京:中华人民共和国环境保护部,2015- 03- 13.
[16] 黄秋兰,程耀东,陈刚.分布式存储系统的哈希算法研究[J].计算机工程与应用,2014,50(1):1- 4.
[17] 程光,龚俭,丁伟,等.面向IP流测量的哈希算法研究[J].软件学报,2005,16(5):652- 658.