白亭颖
(天津海事测绘中心,天津 300222 )
陆海地理信息数据融合关键技术研究
白亭颖
(天津海事测绘中心,天津 300222 )
21世纪世界进入海洋世纪,海洋与陆地之间的联系更加密切,实现陆海一体化成为必然。陆海地理信息数据产生差异的根本原因是测绘部门职能的设置及部门间信息沟通的缺乏。本文总结了国内外陆海测绘部门的主要职能及其数据采集和处理的基准、投影,确定了陆海数据不统一的具体表现;针对这些表现,归纳了陆海地理信息融合实现的关键技术:语义特征融合和空间特征融合。
地理信息数据;陆海一体化;数据融合;地图合并;统一地理编码
海洋是人类赖以生存的基地。21世纪,世界各国越来越重视海洋,并纷纷开发海洋。海洋和陆地之间存在着广泛的联系,只有加强陆地与海洋间的联动开发,实现陆海一体化发展,才能更加合理、高效地利用资源。
陆海一体化是指根据海洋和陆地之间的内在联系,运用系统论和协同论的思想,统一规划和综合管理陆地和海洋,使其成为一个统一的陆海系统,从而实现陆海资源的更有效配置[1]。陆海一体化的关键是陆海多源地理信息数据的融合, 其主要过程是通过对已有的陆海数据资料进行筛选,得到数据源,确定陆海数据融合方案,最终得到满足应用需求的产品。陆海地理信息数据融合的一般处理过程主要包括数据基准的统一、语义融合、空间特征融合3个过程[1]。
由于制图方式和用途不同,对陆海数据进行测量时会采用不同的基准,测量基准分为水平基准和垂直基准,见表1。实施陆海数据融合时,若二者基准不统一,就无法进行数据处理。因此,陆海数据融合的基础是空间基准的统一。
表1 我国陆海水平和垂直基准[2]
1.平面基准转换
平面基准转换包括坐标系统和地图投影的转换。进行坐标系统转换时,若测量范围较大或二者测量条件相差较大,可采用七参数转换模型,以保证精度。比较常见且成熟的七参数转换模型主要有布尔莎模型、莫洛金斯基模型和武测模型等。若对精度要求不高,为简化计算可采用三参数转换模型[3]。实现地图投影转换主要有3种方法:解析变换方法、数值变换方法和数值-解析变换方法。解析变换方法是在已知原投影和新投影解析式的条件下,建立二者之间的函数关系式;数值变换法和数值-解析变换方法则分别是在不知原投影的解析式和不知原投影方程的情况下,采用多项式数值逼近法,建立二者之间的函数关系式。
2.垂直基准转换
垂直基准转换即实现陆海数据的高程基准和深度基准的统一。海图以理论最低潮面作为深度基准面,不仅没有确定的起算面,且随着时间会不断变化,而陆地的高程基准以平均海面为基准,是稳定不变的,因此在进行陆海数据融合时,应以陆地的高程基准为准,统一采用1985国家高程基准[4]。在海图中,陆地高程以规定的国家高程基准起算,灯塔、灯桩等高程以平均大潮高潮面起算,深度以规定的深度基准面起算,将高程统一到1985国家高程基准,转换方法如图1所示,公式如下
-L=h′+ 4h
式中,L为深度基准面值;h′为旧起算面的高程值或深度值;h为不同高程/深度基准面的改正数。
图1 高程/深度基准面的关系
陆海数据语义融合是指通过对陆海实体采用统一的分类分级体系,使二者的地理要素编码得到统一,从而实现陆海数据语义信息的统一。
1.要素的分类分级方法
要素编码是指要素中属性数据的编码,是在对信息进行分类分级的基础上,将信息转换成为数据。分类体系是地学编码的基础,分类是把研究对象按其性质划分为若干个组,分级则是对同一类对象再按某一方面量上的差别进行分级。分类和分级共同描述了地物之间的分类关系、隶属关系和等级关系[5]。要素的分类分级主要有两种方法[5-6]:线分类分级法,是对分类对象进行层级划分,即根据分类对象的特定属性或特征,将其逐次地分成若干特定层级类目,然后按照一定的层次,线性地将其排列成一个逐级展开的分类体系;面分类分级法,是把分类对象依据其本身的属性或特性,分成相互独立的若干面,每一个面都包含一组类目,不同面的类目可以相互组合成为一个复合类目。
2.要素的编码
(1) 编码的类型[6]
编码按其作用与性质分为两种:分类码和标识码。分类码用于表示不同类别的数据,是根据地理信息分类体系设计出的各专业信息的分类代码,同一类别的信息从属于唯一的分类码。在分类码的基础上,用标识码对某一类数据中的某个实体进行个体查询检索。编码方法可分为符号编码法和符号含义编码法。其中属于符号编码法的编码有数字型、字母型、数字和字母混合型3类编码;而隶属于符号含义编码法的编码包括顺序码、层次码、复合码、矩阵码等。
(2) 陆海编码融合方法
对陆海数据的编码融合是在对象已分类分级的基础上进行的,一般在编码过程中会用到多种结构的码,如顺序码、层次码、复合码等。其中层次码一般是在线分类体系的基础上,将代码按位分段,按从左到右的次序,各段子码依次表示编码对象的大、中、小类别,组成一个有层次及隶属关系的代码。层次码有严格的隶属关系,能直观表示对象的类别,因此在我国被广泛使用。数字地形图要素属性编码采用的是一种变长编码的形式,在保证要素属性描述完整的前提下,占用最小的存储空间。然而,数据编码的复杂性会给要素属性编码的采集和输入增加很大的工作量,降低工作效率,因此,变长编码形式很难适应GIS的发展需要。海图要素属性编码采用的是定长编码结合要素属性表的方法,这种编码方式可以直观地表示出要素的属性,而且能充分利用关系数据库成熟的处理技术来实现对要素属性数据的有效管理,因此进行陆海编码融合时,应选择一种既是层次码又是定长的编码结构。最典型的属性编码模型是多维指标结构模型和树型结构模型[7]。
如图2所示,多维指标结构模型中,用一位代码表示一种属性。树型结构模型中,则用一位或若干位代码表示每一层次的不同属性,从而使得对象的属性值由其所有上级代码加本级代码组成。两种模型相比,多维指标结构模型因其属性特征易于辨识,便于在其基础上生成多种专题图;而树型结构模型层次分明,有利于地图图斑类别的确定。
陆海地理信息数据空间特征融合是在完成同名实体匹配的基础上,实现相关地图实体几何位置的融合,从而实现同一地区地形图和海图数据库的融合,分为两个主要步骤:同名实体匹配和几何图形合并。
图2 地理属性编码模型
1.同名实体匹配
同名实体匹配[8]是指通过一些空间实体相似度的指标,将陆海数据库中表达现实同一地物的实体识别出来,为后面的几何图形融合奠定基础,是陆海数据融合的关键。同名实体匹配算法按匹配方式分为几何匹配、拓扑匹配和语义匹配3类[1]。
1) 几何匹配是指通过计算几何相似度来进行同名实体的匹配。最简单的几何匹配是直接将实体之间的欧氏距离、实体长度和方向等作为匹配依据。在此基础之上,出现了很多改进方法,如邵世维提出缓冲区叠加法和空间查询法,是对源数据中的实体做缓冲区,然后进行叠加分析,判断落入缓冲区中的实体[9];Ashok介绍了用图论的方法计算图形的多种相似度,并提出与环境有关和与环境无关的相似度概念,将二者集成得到一个相似得分,以此判断实体之间的相似性[10];唐文静提出先计算不同源数据各自的多种指标的匹配相似度,如面实体的方向和形状相似度等,然后根据不同实体的特性给每个指标赋予权重,计算总相似度得到匹配实体。几何匹配方法得到的匹配结果比较理想,但是关于实体的几何位置,除点实体外都比较难以得到一个精确的值,并且地形图和海图中的数据精度也各不相同,因此存在一定的误差。
2) 拓扑匹配是通过计算候选同名实体的拓扑关系度量进行匹配。Volz提出基于道路实体的拓扑分割,用增加种子节点的方法进行匹配[11];童小华提出计算面实体之间的重叠面积作为拓扑相似度的匹配方法,其中重叠面积的计算比较困难[12],同时他还提出基于模糊拓扑关系分类的面实体匹配方法,这种方法主要适用于大比例尺地图数据库中的规则面实体,对于其他类型的面实体或不同比例尺之间的面实体的匹配并不一定适用[13]。拓扑匹配可以用于几何匹配之前,以缩小同名实体的搜索范围;也可以用于几何匹配之后,以检验几何匹配的效果;但是同一地物实体在两幅图中拓扑关系的微小差异都会导致匹配的失败。
3) 语义匹配是通过比较候选同名实体的语义信息(即属性信息)进行匹配。如陆海数据中两个大桥名称都为“海河大桥”,则二者为同名实体。语义匹配操作简单且匹配精度高,但是它在很大程度上取决于数据源的模型及属性值等。
在实践中进行同名实体匹配时,通常会按照匹配条件的强弱顺序,先进行几何匹配;强条件匹配不成功再用相对较弱的条件,如拓扑匹配;最后用语义信息来进行地图的匹配[14]。
2.几何图形合并
陆海数据由于数据采集手段、应用方向、比例尺及制图综合程度等的不同,二者的同名实体在形状和位置上存在一定的差异。因此,实现陆海数据同名实体匹配后,要进行同名实体的几何图形合并。按照形状特征将实体分为点、线和面3种类型进行合并。
点实体图形合并最简单的方法是将同名点实体坐标值的平均值作为图形合并后点的坐标值。除此之外,比较典型的点实体合并方法有基于同名点构建三角网剖分的方法,根据同名点在整个区域建立拓扑同构的三角网,然后在各三角形子区域内根据3个相对应的顶点建立坐标转换关系,并将落入该三角形区域内的其他点以同样的方式进行坐标转换[15]。
线实体几何图形合并比较典型的是由Filin和Doytsher提出的基于同名线实体坐标投影及平面剖分的方法,利用线实体之间的坐标投影和区域剖分确定相应的变换关系,从而实现图形合并[1]。目前比较常用的线实体合并方法有两种:特征点融合方法和数学形态法。特征点融合方法是对每条同名线实体进行简化,只保留其特征点,融合产生的新的线实体即为所求,如图3所示。
图3 特征点融合方法
数学形态学法是在进行实体匹配后,对匹配上的两种数据分别做一定宽度的缓冲区,提取中间重合部分的中轴线,即先把矢量数据转换为栅格数据结构,最后对中轴线矢量化,得到图形合并结果,如图4所示。
图4 数学形态法
面实体最简单的合并算法是将其转化为线要素,然后按照线实体的合并方法进行合并。除此之外,郝燕玲提出了基于多因素评价的合并变换算法,首先确定影响实体位置的因素,然后通过熵法确定各因素的权重,最后采用加权位置法实现同名实体的几何位置的合并。该算法适用于所有类型实体,结果较客观准确,并能反映两幅图之间精度差异[16]。
一直以来,我国陆海数据的采集和维护由多个不同部门分管,数据多次重复采集,数据格式、分类分级和编码方案上都不统一,造成陆海数据融合困难。本文对陆海地理信息数据融合的关键技术进行了总结,指出了其中存在的问题。在我国,陆海数据融合最大的障碍是陆海测绘管理上的不统一,技术方法可以解决一部分问题,但要想从真正意义上实现陆海一体化,就必须同时对技术和管理作出改进,从而为陆海一体化的建设作出有益的贡献。
[1] 卢宁, 韩立民.海陆一体化的基本内涵及其实践意义[J].太平洋学报, 2008(3): 82-87.
[2] 翟国君, 黄谟涛, 暴景阳.海洋测绘基准的需求及现状[J].海洋测绘, 2003(4): 54-58.
[3] 姜楠.坐标转换算法研究与软件实现[D].淮南:安徽理工大学, 2013.
[4] 郭黎.多源地理空间矢量数据融合理论与方法研究[D].郑州:信息工程大学, 2008.
[5] 郭黎.空间矢量数据融合问题的研究[D].郑州:信息工程大学, 2003.
[6] 朱蕊.多源空间矢量数据一致性处理技术研究[D].郑州:信息工程大学, 2012.
[7] 唐文静.海陆地理空间矢量数据融合技术研究[D].哈尔滨:哈尔滨工程大学, 2009.
[8] 李德仁, 龚健雅, 张桥平.论地图数据库合并技术[J].测绘科学, 2004,29(1): 1-4.
[9] 邵世维.基于几何特征的多尺度矢量面状实体匹配方法研究与应用[D].武汉:武汉大学, 2011.
[10] SAMAL A, SETH S, CUETO L K.A Feature-based Approach to Conflation of Geospatial Sources[J].International Journal of Geographical Information Science, 2004, 18(5): 459-489.
[11] VOLZ S.An Iterative Approach for Matching Multiple Representations of Street Data [C]∥Proceedings of the ISPRS Workshop.Hanover: [s.n.], 2006: 22-24.
[12] 童小华, 邓愫愫, 史文中.基于概率的地图实体匹配方法[J].测绘学报, 2007,36(2): 210-217.
[13] 张桥平, 李德仁, 龚健雅.城市地图数据库面实体匹配技术[J].遥感学报, 2004,8(2): 107-112.
[14] 丁虹.空间相似性理论与计算模型的研究[D].武汉:武汉大学, 2004.
[15] SAALFELD A.Conflation Automated Map Compilation[J].International Journal of Geographical Information System, 1988, 2(3): 217-228.
[16] 唐文静, 王增锋.基于多评价因素的地图要素几何位置调整方法[J].计算机工程与应用, 2013, 49(3): 178-181.
Study of Key Techniques for Sea-land Geographic Information Data Fusion
BAI Tingying
白亭颖.陆海地理信息数据融合关键技术研究[J].测绘通报,2015(7):99-102.
10.13474/j.cnki.11-2246.2015.0222
2015-03-17
白亭颖(1972—),女,硕士,高级工程师,研究方向为陆海融合、电子海图服务等。E-mail:tjbty@sina.com
P208
:B
:0494-0911(2015)07-0099-04