张新长,陈家鸿,郭泰圣
(中山大学地理科学与规划学院,广东 广州 510275)
基于可逆映射的地形图数据异构融合研究与实现
张新长,陈家鸿,郭泰圣
(中山大学地理科学与规划学院,广东 广州 510275)
摘要:随着数字城市的快速发展,基础地理数据在测绘、国土、规划、交通等国民经济重要部门及国防建设领域发挥着越来越重要的作用。但是当前大多数城市的基础地理数据存在CAD和GIS的多种数据格式并存的现状,无法高效地进行数据共享。针对上述问题,为充分利用已有的数据资源并提高地形图数据的共享性,本文提出了一种基于可逆映射的地形图数据异构融合的技术方案,在此基础上,编程实现了CAD数据与GIS数据的可逆转换与融合。
关键词:异构融合;可逆映射;数据检查;数据转换
基础地理数据是国家基础设施建设和地球科学研究的支撑性成果,是国民经济、国防建设中不可缺少的重要资源,是“数字城市”“智慧城市”建设的基础,对社会可持续发展起着重要作用[1]。
地形图数据作为基础地理数据的重要组成部分,按照一定的分类,利用不同的图式符号反映地球表面的空间地物,是国家建设、社会发展的基础性资料[2]。但是,当前我国大多数城市的地形图数据存在CAD和GIS的多种数据格式并存的现状,地形图数据呈现出多源异构性,这使得现有地形图数据无法高效地进行数据共享,数据孤岛[3]的弊端已经愈演愈烈。因此,如何高效地对多源异构地形图数据进行融合,提高地形图数据的共享性就成为当前亟待解决的一个重要问题。
一、异构融合的原理
1. 异构融合的定义
异构融合作为一种数据综合处理技术,实际上是许多传统学科和新技术的集成和应用,若从广义的数据融合定义出发,包括通信、模式识别、决策论、不确定性理论、信号处理、估计理论、最优化技术、计算机科学、人工智能和神经网络等。异构融合的目的是提高数据质量、补充数据信息,并最终实现多源异构数据的共享。将其拓展到地形图数据领域,郭黎给出了如下定义:地形图数据融合是指将不同来源的地形图数据,采用不同的方法,重新组合专题属性数据,统一地物的分类分级和属性,进一步完善地物的信息,提高地形图数据的质量和可共享性[3]。
2. 异构融合的基本框架
地形图数据异构融合一般包括4个基本内容:规则建立、数据编码、数据转换和接边融合。异构融合的基本框架如图1所示,可以采用八元组(M,R,I,C,E,X,B,D)表示。
图1 异构融合基本框架
1)M表示原始数据的集合。
2)R表示融合规则。
3)I表示融合规则的嵌入。
4)C表示待融合数据的检查,包括编码检查、属性检查、拓扑检查。
5)E表示待融合数据的编辑,包括属性编辑、符合编辑、拓扑编辑。
6)X表示含有融合规则的数据。
7)B表示融合过程,包括数据转换、接边融合。
8)D表示融合后的数据,其中Dr为融合结果数据,Dm为待融合数据。
二、基于可逆映射的地形图数据异构融合
1. 技术路线
本文的异构地形图数据是指竣工测量CAD地形图数据、未入库GIS地形图数据或已入库的GIS地形图数据。本文主要针对同级比例尺的异构融合研究,融合数据预处理操作是指在融合前依据数据标准,对数据进行坐标系、数据结构及拓扑关系的检查与修正处理[4],以产生符合融合标准的数据。异构融合方法是对要素进行编码赋值、数据编辑、数据转换,再利用要素的几何距离与属性相似度进行对象匹配,之后进行接边融合。其技术路线如图2所示。
图2 技术路线
2. 可逆映射的建立
数据可逆映射关系是指两个数据模型的数据元素之间的可逆对应关系。首先根据地形图数据的实际情况,可以按数据的不同层次将数据抽象为3种层次:数据集、数据层和数据对象。
假设原始数据为Ds,按照数据融合标准的目的数据为Dt,数据映射关系为F,则三者之间的关系为
F(Ds)=Dt
(1)
根据数据的层次关系,F由数据集间的映射关系GC、数据层间的映射关系GL和数据对象间的映射关系GO复合而成,即
F=GC·GL·GO
(2)
数据对象间的映射关系本质上就是数据对象的属性结构或数据模式间的映射关系,它是数据映射中最为核心和复杂的部分。GC、GL、GO的定义分别如下[5]:
1) 数据集合间映射关系GC。假设原始数据集合为(S1,S2,S3,…),融合后的数据集合为(T1,T2,T3,…),则
GC(S1,S2,S3,…)=(T1,T2,T3,…)
(3)
2) 数据层之间的映射关系。数据层之间的映射关系是对数据集进行解构之后数据层之间的映射关系,即图层间的映射关系GL。假设原始数据层为
(S1(x1,x2,x3,…),S2(x1,x2,x3,…),
S3(x1,x2,x3,…),…)
(4)
融合后的数据模式为
(D1(y1,y2,y3,…),D2(y1,y2,y3,…),
D3(y1,y2,y3,…),…)
(5)
则
GL(S1(x1,x2,x3,…),S2(x1,x2,x3,…),
S3(x1,x2,x3,…),…)=(D1(y1,y2,y3,…),
D2(y1,y2,y3,…),D3(y1,y2,y3,…),…)
(6)
3) 数据对象间映射关系。数据对象映射关系本质上即数据模式间的映射关系。假设原数据模式为
(f1,f2,f3,…)
(7)
目标数据模式为
(8)
由原数据到目标数据间的映射关系为GO,则两者之间的关系为
(9)
基于上述抽象映射关系,DWG格式的CAD数据和SHP格式的GIS数据在图层级别[6]可以构建如图3所示的可逆映射关系。
图3 图层级别可逆映射
3. 数据转换
由于地形图数据由几何图形数据和属性数据两部分组成,因此在进行数据转换时,需要对几何图形数据和属性数据分别进行转换[7]。
(1) 图形转换
地形图数据中的点要素是由坐标信息构成的,在进行点转换时对于BlockReference、DBPoint等点类型的实体,可以直接读取坐标信息,基于X、Y坐标信息进行构点[8]。
线转换涉及的图形类型较多,其基本原理是读取图形的各个节点信息,然后以点构线。对于简单类型(如Line),通过读取起点和终点坐标即可直接构线;对于复杂类型(如Arc),需要通过读取起点和终点坐标、Arc的起始角度及总角度、弧长等信息构造弧上的点,然后进行构线[9]。
面转换主要涉及Polyline、Polyline2d、Circle3种类型的实体,其基本原理是通过读取图形的节点等相关信息,进行构面[10]。
(2) 属性转换
在DWG格式转SHP格式过程中,图形的属性信息存储在其扩展字典下自定义字典的扩展属性中,因此在进行数据转换时,先读取存储在实体中的属性信息,然后与GIS中Feature的属性字段进行匹配,最后将属性值写入到GIS中Feature对象的对应属性中[10]。
在SHP转DWG格式过程中,先通过程序读取存储在GIS中Feature的属性字段,然后与CAD图层中扩展属性进行匹配,最后将属性值写入到AutoCAD图层中对应的扩展属性中。
4. 接边融合
接边融合关键技术包括确定接边对象和接边融合。目前常用的接边方法是通过搜索邻近要素及比较属性来确定接边对象[12-13]。在实际操作中,通常会根据要素类型分别进行接边融合操作。
(1) 线要素接边
线要素常用的接边方法有平均法、强制法、优化法。其中,平均法是取图形两边待接点的坐标均值作为接边后点的坐标。强制法是把一条待接边的待接点强制附和到另一条待接边的待接点上,因其精度不高,很难确认哪条边是比较准确的,故不常用。优化法是将接边产生的拐点消除,达到接边后的图边两端线段,既要共点又要共线[14]。
线要素接边首先搜索融合范围边界处需要接边的对象,具体搜索过程如下:
1) 通过属性匹配,筛选出与待融合线要素属性相似度最高的线要素集合A;
2) 给定一个阈值d,以d为半径,以原要素与接边线的交点为圆心生成缓冲区;
3) 通过空间查询得到A中与缓冲区相交的线要素,即接边对象。
接边对象确定之后即要对数据进行接边融合操作,线要素的接边融合可以通过比较融合数据与原数据的精度来确定,接边到精度较高的数据上。若数据间的精度相差不大,则可选用平均接边法进行接边。
(2) 面要素接边
面要素接边首先搜索融合范围边界处需要接边的对象,具体搜索过程如下:
1) 通过属性匹配,筛选出与待融合面要素A属性相似度最高的面要素集合M;
2) 给定一个阈值d,以d为半径,对接边边界线两侧进行缓冲,生成一个缓冲区;
3) 通过空间查询得到M中与缓冲区相交的面要素,即为接边对象[15](如图4所示)。
图4 搜索参与接边的面要素
面要素接边采用精度平移的方式,精度低的数据平移至精度高的数据,精度接近的数据则让两个对象分别平移坐标偏移量的一半[16]。以居民地面对象为例:假设居民地面是具有4个节点的规则矩形,在待融合数据中居民地面是两个独立对象;比较邻近的节点的坐标,计算出坐标偏移量;同比例尺下对象精度相近,因此把节点分别平移坐标偏移量的一半;最后利用4个新节点重新构面,即可得到融合之后的居民地面对象。
(3) 属性融合
在要素完成几何接边后,需要进一步对要素的属性信息进行融合。在接边融合操作中对象的属性信息融合通常有3种方式:
1) 以融合要素的属性信息作为融合后对象的属性信息;
2) 以待融合要素的属性信息作为融合后对象的属性信息;
3) 综合考虑融合要素和待融合要素,通过某种融合规则,如属性叠加的方式来得到融合对象的属性信息[16]。
三、试验分析
1. 试验数据概况
本文选取了1∶1000地形图数据,数据为DWG格式(如图5(a)所示)和SHP格式(如图5(b)所示)。
图5 原始的试验地形图数据
2. 试验结果
首先将DWG格式的CAD数据转换为SHP格式的GIS数据,如图6所示。
图6 DWG格式转换为SHP格式
完成格式转换后,数据的格式已经统一,且都具备编码信息,即可进行接边融合操作,将二者融合为一张图,如图7所示。
图7 接边融合
3. 精度评价
在异构融合的过程中,考虑到保证数据的精度,专门设计了编码检查和拓扑检查的功能。编码检查可以检查出是否有编码缺失、编码类别错误的情况;拓扑检查可以检查线相交、线重叠、线自相交、面重叠的拓扑错误。通过对多组不同数据量的数据进行试验,结果表明融合精度较高(见表1)。
表1 精度评价 (%)
四、结束语
本文根据目前国土信息化的发展趋势,提出了基于可逆映射的地形图数据异构融合技术方案,选题来自实际生产部门的现实需要,通过与生产人员的详细交流获得非常重要的经验,并得出研究的总体框架。本研究围绕地形图数据的特点、地形图数据异构融合的建设需要、多源异构地形图数据的融合方法等方面展开研究,主要研究内容如下:
1) 根据地形图数据生成应用的总体需求,参考目前在多源异构数据融合中使用最为广泛的数据融合技术,设计了基于可逆映射的地形图数据融合技术方案。
2) 基于上述技术方案,构架了DWG格式数据、异构GIS格式数据间的数据映射模式,为实际的异构地形图数据融合提供了方法。
本研究构建基于可逆映射的数据融合机制,从国土生产部门的主要情况和研究的工作量角度考虑,仅构建DWG格式与SHP格式数据间的可逆映射关系;而国土生产部门可能还存在其他类型的数据。因此,总结国内外更好的科研成果,考虑更多类型的异构数据模型将是本文下一步的研究内容。
参考文献:
[1]焦煦,朱文英,黄瑞峰.基础地理数据在智慧城市建设中的分析与应用[J].信息技术2012(2):55-61.
[2]杨伯刚.城市基础地形图数据建库技术方法研究[J].测绘通报,2005(9):44-46.
[3]崔翰川.面向共享的矢量地理数据安全关键技术研究[D].南京:南京大学,2013:3-10.
[4]郭黎.空间矢量数据融合问题的研究[D].郑州:信息工程大学,2003.
[5]齐立新, 基于映射关系的城乡规划数据集成与同步[D].广州:中山大学,2014.
[6]郭黎,崔铁军.空间数据融合方法的探讨[C]∥中国地理信息系统协会论文集2002年会论文集.[S.l.]:[s.n.],2002.
[7]陈年松.基于FME的CAD与GIS数据共享研究[D].南京:南京师范大学,2008.
[8]谢祖明.基于CAD数据生产ArcGIS制图数据的研究与应用[J].测绘与空间地理信息,2012,35(8): 121-126.
[9]刘志辉,肖海威,梁子震.浅析城市信息化地形图的入库数据质量检查[J].城市勘探,2012(5): 53-56.
[10]袁源林,张新长.CAD地形图数据规整入库的研究与应用[J].测绘通报,2013(5):44-48.
[11]陈家鸿,张新长,郭泰圣. AutoCAD与ArcGIS数据转换研究与应用[J].地理信息世界,2014(5):46-50.
[12]戴相喜,周卫,高磊.DLG数据任意范围接边算法及实现[J].测绘通报,2008(7):32-35.
[13]曹键,李国忠,徐效波,等.基于ArcGIS Engine的多图幅数字地形图接边算法研究[J].测绘与空间地理信息,2010,10(3):76-78.
[14]孙丽娜,李吉之,陈静.基于AO的同比例尺地形图无缝接边技术及其实现方法[J].测绘工程, 2007(6):49-53.
[15]熊湘琛.城市基础矢量地形数据建库与增量更新研究[D].广州:中山大学, 2009.
[16]张新长,郭泰圣,唐铁.一种自适应的矢量数据增量更新方法研究[J].测绘学报,2012,41(4):613-619.
Heterogeneous Integration Research and Implement for Topographic Map Data Based on Reversible Mapping
ZHANG Xinchang,CHEN Jiahong,GUO Taisheng
收稿日期:2015-06-02
基金项目:村镇建设用地再开发技术应用集成与示范研究(2013BAJ13B06);国家自然科学重点项目基金(41431178);高等学校博士点专项基金(20120171110030)。
作者简介:张新长(1957—),男,教授,博士生导师,主要研究方向为数字城市与智慧城市理论方法与技术应用。E-mail:eeszxc@mail.sysu.edu.cn
中图分类号:P208
文献标识码:B
文章编号:0494-0911(2016)06-0026-04
引文格式: 张新长,陈家鸿,郭泰圣. 基于可逆映射的地形图数据异构融合研究与实现[J].测绘通报,2016(6):26-29.DOI:10.13474/j.cnki.11-2246.2016.0183.