贾继鹏,厉芳婷,侯爱羚
(1.地理国情监测国家测绘地理信息局重点实验室,湖北 武汉 430079;2.湖北省测绘工程院,湖北 武汉 430074)
近年来基础地理信息数据日益丰富,随着计算机和测绘地理信息技术的创新发展,多源地理信息数据的获取手段也更加广泛深入,成果数据呈现多样性的特点。2018 年机构改革后,自然资源部被赋予两个“统一行使”的职责,即“统一行使全民所有自然资源资产所有者职责,统一行使国土空间用途管制和生态保护修复职责,着力解决自然资源所有者不到位、空间规划重叠等问题,实现山水林田湖草整体保护、系统修复、综合治理”。地理信息数据将发挥重要的数据支撑保障作用,为山水林田湖草的统一监管维护提供可贵的数据资源。
为了使这些数据资源更好地服务于自然资源主责主业,多源地理信息数据的融合显得尤为必要。许多学者对多源数据融合进行了探讨,如孙群[1]研究了多源矢量空间数据融合处理技术的进展;王霞[2]等探讨了基础地理信息与地理国情监测的融合生产;崔铁军[3]等探讨了多源地理空间矢量数据集成以及融合方法;巨正平[4]等开展了多源地理空间数据的集成与融合研究;安晓亚[5]研究了基础地理信息数据融合的相关理论和技术。然而,上述研究多集中于数据融合技术,而对多源数据一体化融合的方式研究相对较少。本文采用多源数据提取、多源数据融合入库等技术手段进行多源数据融合,解决了数据规格不一致,难以形成“一张图”的问题;同时研究形成了图属、图库一体化的生产平台以及数据库动态更新方案,保障了数据的精准性,精简了数据生产流程,极大地提高了数据融合效率,为基础地理信息数据的高效生产利用提供了新思路和新方法。
1.1.1 提取方法
多源数据提取是对用于基础地理信息数据融合的多源数据进行叠加、转换、提取的过程,主要包括统一坐标系、数据库模板创建、多源数据结构转换、融合数据提取以及基于数字正射影像的变化信息提取等5 个部分。具体流程如图 1 所示。
图1 多源数据提取流程图
1.1.2 主要要素提取
地理国情是从地理的角度分析、研究和描述国情,即以地球表层自然、生物和人文现象的空间变化及其之间的相互关系、特征等为基本内容,对构成国家物质基础的各种条件因素做宏观性、整体性、综合性的调查、分析和描述。地理国情监测采集对象为全区范围内的自然和人文地理要素,自然地理要素包括植被覆盖、水域、荒漠与裸露地等;人文地理要素包括与人类活动密切相关的交通网络、居民地与设施、地理单元等[6]。各种比例尺DLG 数据包括交通、管线、地名地址、地貌等,共计9 类37 个数据层的正射影像、专题资料以及相关生产元数据等[7]。数字高程模型是由一组有序数值阵列形式表示地面高程的一种实体地面模型。融合数据包括水系、居民地与设施、交通、管线、境界与政区、地貌、植被与土质、地名等8 个要素集。各要素图层结合地理国情、各种比例尺DLG、LiDAR 点云、数字高程模型等数据进行融合提取,同时参照数字正射影像进行变化提取,原则上以现势性较强的地理国情数据成果为主要数据源。融合提取涉及的数据图层如表1 所示。
表1 数据融合图层关系对照表
由于提取的多源地理信息数据之间存在空间关联差异,因此需对其进行必要的编辑处理。本文基于数字正射影像,对提取的各类基础地理信息数据进行矢量要素编辑和属性录入,主要包括外业调绘数据和提取的多源数据编辑处理。
矢量要素编辑的基本方法包括新构实体、线要素修剪、面要素拆合、悬挂点和伪节点修复等拓扑关系重组。属性录入采用批量和人机交互录入的方式,其中批量属性录入采用数据提取时统一数据结构转换后的现势性较强的地理信息数据属性项直接赋值的方式获取,适用于已通过多源数据结构转换后的同类属性信息,如名称、国标分类码、车道数、宽度等;其他需结合参考资料进行人工判定的属性信息采用人机交互录入的方式,如类型、层数、比高值、角度等。
多源数据融合入库是根据新数据库的数据标准,将提取编辑后的多源数据统一入库存储至新地理信息数据库的过程。本文提出的多源数据提取已实现融合数据初始数据库的创建,数据融合入库是对这些初始数据库进行统一整合。数据融合入库主要包括数据融合、数据入库、数据接边、数据检查等步骤。
对新增的要素数据需进行融合处理,避免出现多余同类要素。融合处理包括矢量面、矢量线数据及其相关属性信息的融合。矢量点数据为新增和删除处理。对于按图幅生产的数据,各图幅在数据制作完成后,各类要素需进行图形和属性的接边处理,以保证融合入库数据的连通性。
在数据融合入库前后均需进行一定的数据检查工作,融合入库前的检查主要是为了满足融合入库多源数据的基本要求;融合入库后的检查是最终数据检查,为了确保各方面标准的一致性以及数据的完整精确性,主要包括数据完整性检查、逻辑一致性检查、位置和属性精度检查、图面检查、拓扑关系检查等。
地理信息数据处理软件主要包括ArcGIS、Geoway、iData、Mapmatrix、PCI、Terrasolid、ENVI、AutoCAD、iDataMobile 等,各软件数据规格差异较大。本文设计了集测绘数据采编成图、数据入库、产品制作、数据更新和质量检查于一体的生产平台,通过多源数据集成技术手段,接收和处理GPS、全站仪、电子平板等多种野外采集数据以及VirtuoZo、JX4、Mapmatrix、Inpho、Pat-B 等其他航测遥感软件生产的数据,支持对CAD 系统数据的直接编辑和转换分发;实现了与现有GIS 之间的无缝数据交换和入库更新一体化,且真正实现了图库一体化和图属一体化,大大提高了项目的生产效率。
基于一体化生产平台,采用骨架线符号化技术,在准确表达地物符号的同时,不产生任何冗余辅助实体,可在数据绘制过程中进行很好的控制,直接生产通用的空间数据库gdb 或mdb 格式数据;并在数据库的基础上呈现图形的完美符号化,使数据处理更加直观便捷,大大降低了误操作带来的数据错误风险[8]。整个过程采用同一套数据,彻底结束了库体数据和制图数据分离的局面,只维护一套数据,既满足入库标准,又符合出图的需求,真正实现图库一体化的目标。
为了提高整体数据管理质量、保证数据库的现势性、提升数据更新效率,本文采用基于ArcSDE 和Oracle 的动态更新模块,提供基于要素的动态更新、整体覆盖替换式更新、比对式更新3 种更新模式,可根据实际需求灵活选择。
动态更新模块是基于Web 的一体化空间数据管理与更新,通过直接访问和更新云端数据库的方式,最大限度地简化数据更新流程和操作,实现了轻量化的数据更新模式,确保数据在整个生产和入库更新过程中始终以数据库的格式进行存储,避免了数据在不同平台、不同格式间流转带来的数据和精度损失。同时,基于自动化冲突检测技术,实现了多人同步在线作业,且各节点操作结果可同步更新。在动态更新模块的基础上,形成了从数据生产到数据入库、再到数据更新的完整数据流转闭环,最大程度地保证了所管理数据库的现势性和准确性,为测绘相关业务发布和应用提供了数据保障[8]。
本文从目前多源地理信息数据规格多样的应用实际出发,通过研究多源数据的提取以及融合更新方法,提出了快速高效的数据融合解决方案,从而保证了数据的现势性,为新型基础测绘事业的发展探索了新思路,充分发挥了基础地理信息数据在国民经济和社会发展等方面的服务价值[9]。同时,对多源数据融合更新方法的研究,也为大数据时代多源数据的融合更新应用提供了借鉴。