魏金明,赵向阳,张涛
(济南市勘察测绘研究院,山东 济南 250101)
随着移动互联网、物联网、智慧城市、大数据等现代信息技术的发展,测绘地理信息数据的生成和获取日益简单,数据量激增,人类正逐步进入大数据时代。一个新的转变正在进行,大数据将成为企业、社会和国家层面重要的战略资源;数据成为有价值的公司资产、重要的经济投入和新型商业模式的基石[1]。测绘地理信息数据是大数据的重要组成部分,人类活动中80%以上的信息与地理空间位置有关系;大数据热力图常依托于地理位置信息进行展示。随着国家自然资源部的成立和省、市级自然资源行政管理部门的设立,测绘地理信息数据有了更加广泛的外延。
测绘地理信息数据包括时空传感器数据、影像数据、模拟数据和统计数据等,具有数据范围广、数据源多、数据类型复杂多样的特性[2]。如何对多源、类型复杂、数据量巨大的数据进行有效的组织和管理,使其能快速显示浏览,成为许多专家的研究方向。如余前佳等研究了自然资源部国家级云数据中心运维管理情况[3];畅玉洁研究了大数据时代下的数据可视化方法[4];占军等研究了如何用oracle数据仓库展示水利普查数据[5];梅树红研究了大数据时代测绘地理信息档案资源的建设与应用[6]等。专家们的研究多使用一种平台对数据进行管理与显示,未能统筹考虑数据的多软件平台显示策略。
针对数据类型复杂多样的特性,研究各类别数据最优的显示软件;针对数据范围广数据量大时数据浏览慢、显示重叠的现象,分尺度对数据进行综合取舍,形成多尺度分层地图。本文以济南市勘测院现有的勘测数据为研究对象,创建数据显示库表,将各类数据的数据格式、最优显示软件、最佳显示尺度、显示符号等信息写入数据库;根据数据库记录的信息,生成分类别多尺度地图图层和显示配置文件;研发勘测资源一张图平台,以显示配置文件驱动地图图层分尺度显示,列出几类主要数据显示序列,达到二维、三维、多媒体数据的快速、关联性浏览。
数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,有效存储数据,满足用户信息要求和处理要求[7]。数据库设计包括概念设计、逻辑设计、物理设计等多个阶段。本文主要介绍数据库的选择和库表结构的设计。
当前常用的商用数据库包括SQLServer、Oracle、DB2等,其对比情况如表1所示。
常用商用数据库对比表 表1
鉴于测绘地理信息大数据类型复杂、数据量巨大,关系型数据库难以有效支持,因此选用的商用关系型数据库仅存放主要的基本数据。从表1的对比中发现,Oracle数据库虽然价格贵,管理复杂;但其性能稳定,安全级别高,开发易;同时考虑对空间数据的支持,选用Oracle数据库存储基本数据。
库表结构设计主要包括显示库表和基本数据库表的设计。显示库表结构如表2所示。
显示库表记录各类数据的显示信息,用于生成显示图层和显示配置文件。其中,“最佳显示尺度”属性值的填写规则为:“最小尺度-最大尺度”,仅有最小尺度填写“最小尺度-”,仅有最大尺度填写“-最大尺度”。
基本数据库表在保留原数据表结构的基础上,增加“显示尺度”“生存周期”两个属性字段,用于记录数据的尺度特性和时间特性。“显示尺度”“生存周期”属性值的填写规则如“最佳显示尺度”。
显示库表结构 表2
合理组织原始数据,通过数据处理流程,生成可快速浏览的分类别多尺度地图。数据处理流程如图1所示。
图1数据处理流程图
保留原始数据,作为最初版本进行备份。对原始数据进行数据分类、数据综合取舍、数据关联、数据显示设置等处理后重新存储。数据分类是将数据划分为不同的类别,一个类别对应一个显示图层,一个原始数据可能生成不同的类别。数据综合取舍是对某类数据,通过层次细节简化LOD(Level of Detail)思想[8],利用合并、取舍等缩编方法,在不同尺度下显示不同的要素,用来实现图层的多尺度显示。数据关联是将空间数据与非空间数据进行关联,包括图属关联、图档关联等,通过添加外键的方式实现空间图形与属性、文档、影音等数据的关联。数据显示设置是通过学习、调研、测试等方法,列出某类数据的最优显示软件、最佳显示尺度、显示符号库等信息,并将其写入数据显示库表,用于生成显示图层和显示配置文件。数据处理是开放的过程,既可增加数据类别,也包括对现有类别的再处理。
将处理后数据分为主要数据和一般数据,主要数据作为基本数据存放于Oracle数据库内,一般数据按原有存储方式存放。为数据显示需要,将数据分为空间数据与非空间数据,空间数据是数据显示的主序列,非空间数据作为关联信息与空间图形相挂接。为将不同类别的多源数据在同一幅地图内显示,空间数据存储前需进行坐标转换处理,统一为CGCS2000国家大地坐标系。
存储后的数据通过符号化、图层化等处理,生成显示图层。同一类数据,用不同软件显示时需要不同的符号库,可生成不同的图层文件。本文以ArcGIS软件的符号库和图层文件为例进行介绍。
ArcGIS符号库内包含点状符号、线状符号、面状符号。点状符号包括简单符号、字符符号、箭头符号、图片符号、三维符号、三维简单符号、三维字符符号;线状符号包括实线、虚线、制图线、点符号线、图片组合线、三维实线、三维填充线;面状符号包括单色填充、渐变色填充、制图线填充、点状符号填充、图片填充、三维图形填充。ArcGIS软件提供了样式管理器(StyleManager)创建符号库,为显示需要,创建了基础地理信息符号库、土地利用类别符号库、管线符号库、人防符号库、国情普查符号库等多项专用自定义符号库。
ArcGIS图层文件的数据格式为LYR,存储了数据显示的相关属性,包括名称、数据、符号化、标注、显示比例尺范围、表格关联等。利用数据显示库表内记录的显示信息,可通过显示软件调用显示符号库自动生成显示图层。同一类数据可生成多尺度的多条显示图层。
对显示图层进行尺度组合、信息标注、显示驱动等处理,生成多尺度专题地图和显示驱动配置文件,进而建立分类别多尺度地图序列。尺度组合是将显示图层按显示尺度进行组合,形成全尺度显示图层;信息标注是将重要注记标注在专题地图上;显示驱动是生成某系列专题地图的显示驱动配置文件,用于显示时调用不同的显示软件和显示图层。
一幅专题地图由多个全尺度显示图层组成,在图层组合过程中,通过软件自带的符号、注记压盖处理工具可自动消除地图显示时的压盖现象,但为了地图显示简洁、美观,仍需对其进行人工处理,进而优化显示图层。
研发勘测资源一张图平台,编写数据显示程序,以显示配置文件为驱动,调用不同的显示软件、显示图层,分系列显示各类数据。
数据显示配置文件以xml格式存放,记录了显示软件、显示尺度、显示地图、显示范围等显示信息。数据显示时,根据配置文件,调用显示软件和显示地图,显示范围和显示尺度变化时,与显示配置文件对比,触动变化条件后,重新选择显示软件和显示地图。具体的数据显示驱动算法如图2所示。
图2数据显示驱动算法
一张图平台内提供了多项数据显示系列,本文以影像图系列、电子地图系列、国情覆盖系列、经济普查系列为例介绍其显示策略。
勘测资源一张图平台内展示的是济南全市域数据,所有数据的最小尺度比例尺都设定为 1∶1 000 000~1∶600 000。影像图系列分为16个尺度,最大尺度比例尺设定为大于 1∶2 000并显示实景三维模型,其他尺度显示正射影像图。电子地图系列分为12个尺度,最大尺度比例尺设定为大于 1∶1 000并显示真三维模型,其他尺度显示线划电子地图。国情覆盖系列分为8个尺度,最大尺度比例尺设定为大于 1∶2 000并显示最细化的国情覆盖数据,其他尺度显示综合取舍后的国情覆盖数据。经济普查系列以行政区划级别分为“市-区-乡镇-村”4个尺度,最大尺度比例尺设定为大于 1∶5 000,各尺度显示该行政区划级别下的经济普查统计信息,以分区统计图表的方式展示。
对于仅需要查看浏览的普通用户,平台发布了OGC标准下的WMTS(Web Map Tile Service)地图服务,搭建了浏览网站,实现了数据的网络化快速显示。采用浏览网站的方式显示数据,仅需要输入网站网址,无须对显示软件进行要求。网站左侧提供了地图列表并可控制其是否显示,地图浏览视窗占据大幅界面并提供了放大、缩小、平移、量测、标注等基本工具。
对于专业用户,可用显示软件浏览分类别多尺度地图,还可查看数据的关联信息。数据的关联信息既包括属性信息,也包括相关的文档、语音、视频等多媒体信息。数据的关联关系可通过“宗地类不动产登记数据整合方法初探”文章内提到的图属关联、图文一体化等方法在数据处理过程中实现[9]。另外,专业用户可根据需要查询、统计相关信息,同时可组织、管理时空一体化数据与多尺度显示图层。
针对数据范围广、数据源多、类型复杂的济南市勘测数据,在保留原始数据版本的基础上,通过数据分类、数据综合取舍、数据关联、数据显示设置等方法生成显示图层并将最优显示软件、最佳显示尺度、显示符号等信息写入显示库表;通过尺度组合、信息标注、显示驱动等方法生成分类别多尺度地图和显示配置文件;通过图属关联、图文一体化等方法实现数据与关联属性、关联文档、语音、视频等信息的链接。研发勘测资源一张图平台,解决了尺度改变时显示软件切换和范围改变时接边处多源数据调用问题,针对专业用户和普通用户提供了平台驱动显示和网页地图服务显示两种显示方式,实现了数据的快速显示,进而达到二维、三维、多媒体数据的快速、关联性查看的目的。与传统显示方法相比,可自动选择最优显示软件,规范了各类数据显示序列,能更好地展示和利用数据。
平台在使用过程中,可很好地将当前收集到的勘测数据及关联信息进行显示。平台开发过程中预留了扩展接口,可新增数据显示类型。下一步,将重点研究大数据热点图显示模式,将其与专业数据对比进而实现辅助决策的目的。