综合地理信息大数据公共服务平台的设计

2022-11-16 02:16陈平星
电子技术与软件工程 2022年16期
关键词:空间数据数据库空间

陈平星

(新疆兵团勘测设计院(集团)有限责任公司 新疆维吾尔自治区乌鲁木齐市 830002)

1 引言

信息化是现代化建设的重要标志,伴随着人类科技的迅速发展,各行各业都已进入了信息化发展的快车道,信息化建设也成为了当代社会基础设施建设的重要组成部分。

信息化建设需要大数据的支撑,其中数据的时空化是大数据建设的一项基础性工作。地理空间数据和其他数据库相比,具有空间定位服务的基础性功能。为了让地理空间数据能够服务于更多的部门和用户,就需要搭建地理空间信息与专题数据相结合的综合地理信息数据库公共服务平台。

本文主要阐述了面向用户的综合地理信息数据库公共服务平台的建设,利用关联技术实现了各类数据的空间、时间、属性相关联的综合数据库,建设具有地理空间信息数据与行业专题数据相关联的数据库共享交换服务公共服务平台,最终实现信息共享与交换的目标。

2 数据库设计与建设

2.1 总体思路

2.1.1 数据组织

综合地理信息数据库是一个以空间地理数据库为基础,结合了多种专题信息数据的数据库。把数据通过坐标或地址信息落在地理空间上,所以数据库的基础是空间地理数据,除了传统的空间数据外,还有泛空间数据。如位于某一行政区划的人口调查数据。由于地理实体具有三个基本特征,即空间特征、时间特征、属性特征,所以时空信息数据库可以按照空间、时间、行业专题三个维度进行组织管理。空间维度从大到小,包括行政区划[1]、功能区、网格以及具体某一个空间坐标;专题维度根据具体行业的不同或面向的不同用户来进行划分,如自然资源专题数据库、水利专题数据库、交通专题数据库、人口专题库、法人库等等。行业专题数据往往需要通过与空间信息进行关联才能形成空间数据,有些行业专题数据是基于宏观的空间地理信息,如基于行政区划的人口调查数据,而有一些专题则是基于微观的空间数据,如基于坐标点位的监测站点;时间维度则是用来描述专题数据的过去、现在与未来,时间精度可以从年度、季度、月份,一直到日、小时、分钟。通过对数据的“三域”标识来实现数据的组织,其中矢量数据应逐要素单元增加“三域”标识,影像数据应针对不同类型、不同分辨率、不同数据源增加“三域”标识,而三维数据需要进行单体化后,对每一单体模型增加“三域”标识[2]。如图1 所示。

图1:时空信息数据库的三个维度(空间、时间、属性专题)

2.1.2 空间与属性关联

地理实体的空间信息与属性信息如何实现关联,是时空数据库第一个要思考解决的问题,特别是要解决如何将在同一空间尺度下的各类行业专题属性信息进行融合,如基于房屋建筑的人口信息、基于房屋建筑的企业法人信息,基于房屋建筑的房屋所有权信息,在同一个空间的基础上,整合这三种数据。地理实体数据的空间与属性关联,可以通过借助对实体数据进行统一赋予地理实体编码的方式,从而实现空间信息与属性的关联。例如,通过对房屋建筑赋予统一实体码,实现基于房屋建筑的人口信息专题、基于房屋建筑的企业法人信息专题、基于房屋建筑的产权管理信息专题[3],三种专题信息中的房屋实体编码的统一,从而把三个专题信息实现了有机的关联,为时空数据库的构建打下了基础。空间和属性关联如图2。

图2:空间和属性关联设计

2.1.3 现状与历史关联

在空间数据库的层面上,研究如何注入时间描述信息,体现出地理实体的空间和属性随着时间的变化而变化的状况,是构建时空信息数据库的关键因素。解决这个问题,可以采用对专题数据增加时间描述的方法,利用时间顺序来组织地理空间数据,从而达到现状数据与历史数据相关联的目标。数据时间描述信息的增加需要从三个层级上同步展开,分别是数据库层级、图层层级和实体对象层级[3]。增加相应的时间描述信息,其中数据采集更新一般是通过数据库对应的元数据来描述,而描述专题信息内容的时间因素,则需要结合专题数据的自身特点,如社区的成立时间、水库的蓄水时间、公路的通车时间、房屋建筑的竣工时间等等,增加相应的时间序列属性字段来进行描述数据、组织数据,让每个地理实体都能够从产生到消亡的全生命周期都可以充分展现出来。

2.1.4 二维与三维关联

时空数据,除了传统的二维数据外,还有通过倾斜摄影等手段获取的三维实景数据(传统模式的三维建模当前已较少使用),三维模型主要包括房屋及设施、道路桥梁、水利设施、植被等等。

这里以桥梁为例子阐述如何实现二维与三维数据的关联。桥梁所涉及的二维图形数据包括桥梁建筑物面(轮廓)数据、桥梁点数据,桥梁建筑所涉及到的三维数据首先要进行单体化处理,然后将三维模型单体化数据与二维桥梁建筑物数据可以采用赋予的相同的实体编码来进行关联,从而使三维建筑物模型单体数据与二维建筑物数据实现了关联,接下来还可以对二、三维数据的属性添加赋予地址空间数据,最终使得两者也同时关联上了地名地址信息。具体如图3。

图3:二维和三维关联设计

2.2 数据库的建设

2.2.1 地理实体数据库

目前主流的地理信息数据通常都包含数字线划图(DLG)、数字高程模型(DEM)、数字正射影像图(DOM)和三维模型数据等基础地理数据[4]。这些数据采集是采用摄影测量、外业测绘等成熟的技术手段来实施。依据国家有关技术标准和规范,对采集到的原始数据进行生产加工,生产出数字线划图、数字高程模型、数字正射影像和三维场景模型等数据。

地理实体数据通常是以各级国家基本比例尺数字线划图(DLG)数据为基本数据来源,通过GIS 软件获取各级行政区划、交通道路设施、河流水系、境界、居民点及设施、植被与土质、地名地址等矢量数据,通过一系列的拼接、拓扑等图形处理和面向应用需求的数据重组和属性赋值,从而实现地理空间数据的实体化。

2.2.2 专题数据库

专题数据库包括自然资源专题数据库、水利专题数据库、交通专题数据库、人口专题库、法人库等等专题数据库。

(1)自然资源专题数据库。根据数据资源情况,建立相应的自然资源,包括三调数据、土地权属、耕地后备资源、矿产、林地、草原、湿地、森林、生态保护红线、自然保护区、土地开发利用等详细的专题数据库。

(2)水利专题数据库。该数据库用于存储水利数据,包括河流水系、水库、渠道、水利设施(泵站、渠首、人饮井、灌溉井、分水计量点、水闸)等各类水利基础数据和水旱灾害等应用型数据库。

(3)交通专题数据库。该数据库用于存储交通数据,包括公路、铁路、机场、火(汽)车站、加油(气)站、桥梁、收费站、检查站、服务区、养护站等各类交通基础数据和交通规划数据库。

(4)地名地址数据库。大量的专题业务信息都与地理空间位置相关,为了使专题数据空间化,产生空间位置的关联,将地名地址包括各级行政区划名、街路巷名、兴趣点名、门牌号等进行地名标准化处理,与空间位置建立起对应关系,从而使地名地址数据带有空间位置坐标,实现空间定位要求[5]。

为了使专题数据库与地理实体数据库有效融合,需要对地理信息实体数据赋予时间、空间和属性三个维度的标识,时间标识注记了该数据的时间特性,空间标识注记了地理空间特性,属性标识注记了隶属的领域、行业、主题等具体内容[6],从而使数据成为真正的时空大数据。

3 数据库共享平台功能设计与实现

数据共享服务平台是基于“云”架构的服务平台型地理信息系统,通过集合了各种类型的地理信息数据资源、服务资源、地图资源等,通过网络在线的方式满足各种用户(政府部门、企事业单位等)对地理信息资源和空间定位(包括空间坐标或地址)以及对大数据分析的需求。该平台能够提供多种面向用户的二次开发接口,可以基于共享平台提供的地图接口、数据接口、空间分析接口等进行开发各类地理信息应用。

3.1 地理空间信息服务功能

(1)地图服务功能:提供了图层控制管理、地图导航浏览、空间位置查询、图层内属性检索、空间(距离、面积、方位角等)量算、地图风格切换、地图符号自定义扩展、专题图制作、图式图例导出等功能。

(2)数据服务功能:包括提供数据的提取和加工处理功能,使用者可以使用该服务功能对地理空间数据进行位置的修改维护、属性信息的编辑、增加或删除[8]实体地物等操作,实现数据更新。

(3)空间分析服务功能:提供了矢量或栅格的空间分析,解决实际问题,例如邻近分析分析、缓冲叠加分析、插值分析、数据统计分析等功能。

(4)网络分析服务功能:提供了多方案的出行路径分析、运输管道分析、服务设施的服务范围的获取分析等功能。

(5)面向三维的服务功能:提供三维地图模型服务以及基于GPU 运算的三维模型数据分析服务。根据实景三维数据,建立三维、动态、可视化的虚拟环境,直观展现三维场景,并提供多种三维空间浏览与操作工具。

(6)多样化查询检索功能:支持SQL 属性查询、空间查询、关联属性查询,也支持多种组合式的查询方式。

3.2 多源服务聚合功能

系统平台的地理信息服务需要能够整合多源的地理信息服务,采用该服务平台的聚合功能,可以有效聚合多源地理信息服务。多源服务聚合能力可以满足在日常业务使用中根据新的需求聚合集成已有的地理信息服务,快捷搭建起新的业务应用系统。

该功能要严格遵照服务规范,对来源不同的地理信息进行标准化整合,主要包括地理信息数据的解析、集成基于标准空间数据,重用和重组地理信息服务提供者的GIS 功能,最终产生地理信息服务[8]。

3.3 共享交换服务功能

利用SOA 架构进行设计和开发,融合GEO‐ESB 服务模式,能够实现空间地理信息的获取、传递、运维、处理与业务应用等服务。构建起完整的空间数据标准和数据共享交换和服务的机制,从而实现了在一定范围内地理空间数据的共享,满足了基础地理信息和其他行业各专题数据在不同用户(部门单位)的广泛应用。

共享交换服务系统遵循OGC 标准要求,支持多种不同类型地理信息服务的聚合以及再发布,基于平台提供个性化应用的二次开发接口和可扩展空间支持面向应用的二次开发。对新发布的服务支持登录注册、查询检索、实时监控、权限管理以及元数据的更新维护。提供一致的、便捷的地理空间信息服务,同时也有助于支撑政府各部门信息服务体系的建立。

3.4 数据管理功能

数据管理系统是管理人员全面掌握和管理数据资源的工具,提供对数据资源的管理与发布等功能。系统数据管理功能包括元数据管理、数据推送管理、数据调用管理、运行监测与评价等功能。

3.4.1 元数据管理

元数据是描述数据及其环境的数据。元数据管理包含元数据获取、发布、访问、变更与版本管理、数据检索等管理。

(1)元数据获取:获取各数据库的元数据,并进行统一的存储管理。

(2)元数据发布:是针对新版的元数据发布,实现元数据的提交、审核、发布等流程管理。

(3)元数据访问:实现元数据访问权限的授予,以及元数据搜索、分析、交换功能。

(4)元数据变更与版本管理:当元数据结构发生变化时,需要对元数据进行变更,面对元数据的调整(包括修改、审核、发布功能)实现元数据的更新和维护。版本管理就是记录元数据的每一次变更,便于追踪及回溯,能够实现元数据版本变更查询,检索出每一次变更的时间、内容及原因等。

(5)元数据检索:对元数据实现全文检索,实现精确的匹配,对检索到的元数据可以显示各类具体属性信息。

3.4.2 数据推送管理

数据推送管理是一个集合了提供信息推送能力外,还要提供信息管理手段,实现信息发布,还具有用户使用数据行为的分析能力。

3.4.3 数据调用管理

该系统功能通过接收调用请求,对已通过数据调用的请求,利用数据交换平台的调用服务,实现数据的调用(包括在线调用、下载服务等)。其包含数据调用设置、数据调用授权、数调用统计三部分。例如:接收到发送某条公路交通流量监测数据的下载请求,就需要设置调用的基本参数和授权信息,然后调用数据交换平台的调用数据服务,最终完成数据的下载。

3.4.4 运行监测与评价

该功能提供数据来源、类型、利用、检索、调用、交换等多种类的统计分析报表,为本平台的决策管理提供管理依据。

3.5 运维管理功能

管理维护人员全面掌握、管理、监控各部门用户对共享交换平台使用情况的工具,负责统一管理与运行维护有关的内容,对平台的业务进行审批处理,对平台的服务、安全运行等各环节进行实时监控,对系统运行的关键信息进行记录[9],为运维管理人员掌握各用户使用该平台资源情况提供数据支撑。

4 主要功能的实现技术

4.1 系统平台GIS服务与接口技术

GIS 服务都是在ArcGIS、SuperMap 等主流GIS 平台软件上已有的功能,这里可以利用ArcObjectSupermapObjects等ActiveX 组件进行二次开发调取功能模块,并进行封装成为本平台上的服务工具。

借助功能大型GIS 软件提供的Web 开发包和Web 服务,快速搭建应用系统。通过GIS 服务接口发布成多种规范的服务类型,包括REST、SOAP、WMS、WMF、WCS 等服务类型,实现与其他系统的对接。

4.2 多源服务聚合技术

多源服务聚合实现技术:一是要对地理信息服务进行描述,这需要采用既可以描述服务基本信息(包括地址信息和类型信息),又可以描述信息本身含义的基于语义技术的描述方式,使得系统软件能够准确识别这些信息,提升服务发现效率和服务匹配准确度;二是基于关键字框架的网络服务服务发现的信息检索技术,对关键字进行统计,以便在信息提取时进行匹配;三是基于语义的网络服务匹配技术,是在进行服务需求描述和匹配判断时能够精确和高效地找到功能符合要求的服务。四是利用服务聚合算法、服务聚合流程管理、服务聚合监控和异常处理机制,通过服务质量参数评价,对服务聚合流程进行调整与完善,改进聚合算法,提高聚合服务与质量。五是面向用户提供数据浏览、信息检索、空间分析等功能向用户提供调用地理信息聚合的API,利用这些接口,用户就能够接入聚合后的信息服务。

4.3 共享交换实现技术

数据共享交换实现的技术:一是采用B/S 模式,集中管理灵活搭建就可以完成数据共享交换配置;二是采用SOA框架在服务器上部署数据交换应用,方便扩展节点;三是采用WS‐Security 安全标准,数据传输应用安全性较好的SSL协议;四是传输数据使用可靠的消息中间件,确保数据不丢失,也不出现数据重发的情况。当数据传输过程中因意外原因而中断时,在系统恢复后,数据会实现断点自动续传;四是通过日志系统,对共享交换的服务进行记录,包括用户信息、交换方式、交换运行情况等。五是对于因行业部门用户自身的要求,不属于一个网络中或对性能有特殊要求的用户,系统通过前置交换服务实现客户端数据库与服务器端数据库的同步,各应用用户(行业部门)使用各自的前置端实现与平台的数据共享与交换,可以随时查询执行数据交换任务的线管信息,同时能够查询到任务的前置服务的注册信息和任务执行的详细情况。对于本地与远程数据可以发布为IServer服务、REST 服务、OGC 服务等不同类型,实现数据分享。

通过采用集群架构能够有效提高系统的负载能力,提升体系中各应用系统的访问效率与系统承载力;采用冗余集群技术,进一步提升系统的容错能力,避免单点失效,提高服务的可用性;支持分布式,跨地域部署,支持不同层次的权限控制,有助于空间数据信息共享[10]。

5 结束语

在当今信息化发展过程中,为了避免数据资源的闲置和浪费,一定要让数据更加广泛地应用起来,才能保持数据的鲜活。按照相关要求,可以把不同时间、不同行业的数据加入空间信息,经过整合加工形成满足各行各业需求的综合时空大数据,再通过地理信息大数据公共服务平台的建设和应用,从而使得数据之间互相关联起来,形成互动,从而带动并实现数据在行业之间的信息共享与交换,使数据不停地更新,变成鲜活、实时的数据,真正形成跨时间、跨地理空间、跨行业,适应信息化发展潮流的综合大数据。

猜你喜欢
空间数据数据库空间
空间是什么?
创享空间
元数据驱动的多中心空间数据同步方法研究
基于文件系统的分布式海量空间数据高效存储与组织研究
客户端空间数据缓存策略
多源空间数据同名实体几何匹配方法研究
QQ空间那点事
空间