政区地图与数据立方体结合的联机可视化方法

2019-10-12 08:14曹巧云何望君张福浩刘纪平
测绘通报 2019年9期
关键词:立方体政务乡镇

曹巧云,何望君,张福浩,刘 涛,刘纪平,4

(1. 兰州交通大学测绘与地理信息学院,甘肃 兰州 730070; 2. 中国测绘科学研究院,北京 100830; 3. 地理国情监测技术应用国家地方联合工程研究中心,甘肃 兰州 730070; 4. 武汉大学资源与环境科学学院,湖北 武汉 430079; 5. 甘肃省地理国情监测工程实验室,甘肃 兰州 730070)

随着关系数据库的发展迅速,全球数据量增长快,数据被不断地生产出来,与此同时,人们对信息的要求越来越高[1];从海量数据中获取隐藏的、有用的信息,导致数据管理人员对数据的查询要求日趋繁琐。数据立方体(DataCube)又称多维数据集,是OLAP(on line transaction processing)系统的核心,为用户数据构建了多维视图,针对数据的查看和分析,用户可以利用数据立方体技术从多个视角出发[2]。众多的OLAP产品具有基于多维数组构建立方体模型的优势,易于管理和查询海量数据。

文献[3]总结了每一维度就是数据观测的每一个视角,政府部门从不同行政级别查看随时间推移的GDP的变化,这是从政区角度来查看GDP,因此政区是一个维;许多领域中提出了包含诸如数据仓库、数据挖掘、数据集成、OLAP等许多技术的商业智能(BI)的体系结构,它用于建立决策支持,优先考虑有效查询大量历史,清洁和整合数据[4];文献[5—7]将文本概念加入立方体;文献[7]针对数据和文本分别建立维度,利用倒排方法检索对应的数据;文献[8]提出基于流数据的概要立方体,实现任意组合的维度映射成唯一的数值,此方法提高索引的效率,但都对政务地图数据的OLAP研究较少。目前许多统计数据是围绕国家或政区开展,战略分析需要空间视角,针对以上问题,结合数据立方体联机可视化方法,从空间维探索政务统计与政务电子地图的可视化方法。本方法推进政务电子地图的管理和查询的效率,同时在更多的角度上实现了对信息的理解和把握,提高了工作效率。

1 政务OLAP发展现状

自20世纪60年代末关系型数据库之父E.F.Codd提出关系型数据模型以来,关系型数据库与OLAP得到了快速的发展[9]。加拿大拉瓦尔大学地理信息中心提供Spatial OLAP(SOLAP)作为支持快速简便的时空分析,探索多维数据的工具,并提供一套可视化技术,如地图、表格和图表[10]。巴西联邦伯南布哥大学信息中心提出了GOLAPA(地理在线分析处理架构),为用户提供了查询分析和地理数据以供决策支持所涉及的复杂性的抽象[11-12]。在将BI与GIS相结合的其他工具中,笔者引用Voss[13]提出的Cube View和Polaris,以便于观察大量数据中的空间模式和时间趋势。此外,文献[14]开发了一个强大、易于访问及用户友好的Geo-BI地方治理基础设施服务的解决方案。此外,有学者提出了一个可扩展的GISOLAP集成解决方案,它基于一个名为GeoCube的正式多维模型,支持地理维度和度量[15]。更重要的是,Pitts大学提出了OLAP-GIS工具[16]的开发,用于社区健康评估分析中的数值空间问题解决。文献[17]提出支持地理维度和度量的GIS-OLAP集成解决方案,并提供交互式数据透视表和图表显示,有效地支持决策服务,GIS-OLAP技术核心是“维”这个概念[18],建立多维数据模型是进行GIS-OLAP分析的重要基础。数据立方体作为GIS-OLAP系统的核心技术,用于数据分析和索引的技术架构,能够对元数据进行任意多关键字实时索引,并且加快了数据的查询和检索。如何将OLAP技术应用到电子政务地图,构建政务决策支持系统,利用电子政务综合数据库中存储的大量数据建立正确的决策体系和决策支持模型,为各级政府的决策提供科学的依据,从而提高政府办公效率、促进经济发展,目前已成为我国政府越来越紧迫的一项工作。

2 政区地图和数据立方体融合技术

政务地图和数据立方体融合技术包括维度规范化表达、数据立方体构建和多维查询3大技术,如图1所示。首先,对空间(政区)进行规范化表达,实现空间(政区)维度的规范化;然后,对政区统计的指标数据进行数据立方体的构建,并对指标数据进行规范化管理;最后,结合OLAP技术,对多维政区和政区统计数据立方体进行联机处理,实现政区地图交互下的多维查询可视化。

2.1 空间(政区)维度规范化表达

政区包括省、市、县(区)、乡镇(街道)4个维度,利用属性编辑技术对对省、市、县(区)、乡镇(街道)地图进行统一编码,实现政区地图的规范化维度表达。第一,利用地图数据处理软件,统一省、市、县(区)、乡镇(街道)地图数据的投影坐标,使地图数据都在同一空间坐标下显示;第二,利用数据编辑工具实现省、市、县(区)、乡镇(街道)的统一编码,如湖南省为43,实现对政区地图的编码管理;第三,利用数据立方体维度表达技术,对省、市、县(区)、乡镇(街道)进行统一编码管理,建立统一的时间、多级政区维度,形成省、市、县(区)、乡镇(街道)4个维度,从而建立政区维度表。统一编码的目的是实现政区的统一化管理,从地图数据源中尽可能高效地管理所需要的地图数据。

2.2 政区统计数据立方体构建技术

运用数据立方体技术,对政区和指标数据进行数据立方体的构建,形成政区统计数据立方体。①描述维度表,针对4个维度的政区数据,利用数据立方体维度构建方法,增加省、市、县(区)、乡镇(街道)的编码、名称、描述等相关属性,统一标准管理。②指标表的构建,根据现有省、市、县(区)、乡镇(街道)的指标数据,构建人口表、GDP表、企业表等,通过统一的编码实现与政区维度表的关联。③数据转换,将标准化处理后的政务维度数据和指标数据添加到数据仓库之前,需对这些数据进行必要的转换,转换完毕的数据方可存放到相应的数据仓库中。数据转换方法有简单变换(包括编码字段的解码、日期/时间格式转换、数据类型的转换)、集成(就是把来自于不用数据中得到的业务数据结合在一起,并将它们集成为一个紧密结合的数据模型)、聚集和概括(就是按照某些属性汇总这些数据)。④添加到数据仓库,数据转换完成之后,将这些规范的数据添加到数据仓库中。数据仓库所需要加载的数据量很大,需采用标准的加载工具和共同的方法对加载的数据进行处理。提高数据加载的效率,从而也能够将加载工具的定制最小化。

2.3 政区地图交互下的多维查询技术

为了实现政区地图的联动查询,采用数据立方体的多维分析技术,操作步骤包括钻取、上卷、切片、切块和旋转。①钻取:在空间(政区)维的不同层次间的变化,从顶层降到底层,拆分总数据到元数据。本文时间维上钻查询操作的结果就是日、周、月、季度、年,地区维上钻查询操作的结果就是乡、县、省、国。②上卷:从乡镇(街道)数据向省数据的聚合。③切片:选择政区维中特定的指标值进行查询或分析。④切块:选择空间(政区)维中特定区间的指标表数据进行查询分析。⑤旋转:政区维位置的互换,是行列的转换。变换政区数据立方体维的角度,从不同的方向研究指标数据在维上的分布。

点击政区实现地图下钻,并且通过多维查询语言,获取当前点击政区数据集,实现数据立方体的自动下钻。通过钻取、上卷、切片、切块及旋转查询操作,实现统计地图和数据立方体双向联动,快速获取数据并展示数据。

3 应用案例

3.1 试验区域与数据

本次试验选用全国作为研究区。试验数据包括国家统计局统计年鉴获取的2018年全国各省、市、县的GDP数据,国家统计官方网站获取的省、市、县、乡镇2010年全国第六次人口普查数据,以及国家公共基础地理信息平台“天地图”地图数据和行政区划数据。

3.2 试验结果

实现全国、省级、市级、乡镇级的信息的可视化,利用网络浏览器对地图上的每个区域进行不同的颜色显示,可以方便直观地查看出相应的数据构成,并将相应地区的信息实时地显示在右侧的数据表中,方便具体地分析和处理,如图2—图3所示。

试验结果分析发现:在地理信息应用政务电子地图的平台中,通过客户端统计地图的四色图将不同区域的数据进行了统一表格化表达,实现了精细化、可配置的地理统计表达。方便使用者快速直观地找到所需要的必要的数据信息。方便快捷地将政务地图与数据立方体进行集成整合,满足平台查询与分析的功能,提供灵活丰富的功能接口和智能化的界面操作,赋予了专题图更加便捷的管理分析功能,通过少量开发工作即可实现电子政务地图统计与数据立方体的集成和使用。

4 结 语

在众多政务服务过程中,存在大量的政区统计信息,存在如空间、时间、行业、主题等多类型、多层次的维度统计方式,笔者建议在信息资源整合时建立统一的空间维度和时间维度,不仅强化维度描述的一致性,而且支持不同维度不同层面的灵活细分和汇总分析,满足不同分析的需求。将传统的政区地图与空间数据立方体进行融合,在线统计并联动显示各级政区不同指标数量和分布,实现国家、省、市、县、乡镇多级数据立方体下钻和上卷操作,便于决策者快速浏览和分析区域发展现状和分布格局,有利于开展综合性政务数据空间对比和关联分析。

猜你喜欢
立方体政务乡镇
乡镇改革怎样防止“改来改去”?
“老乡镇”快退休,“新乡镇”还稚嫩 乡镇干部亟须“平稳换代”
乡镇扶贫印象
内克尔立方体里的瓢虫
靖边政务中心:“进一扇门,办所有事”
政务云上看政情
图形前线
让乡镇纪委书记敢亮剑
二维码让政务公开更直接
立方体星交会对接和空间飞行演示