廖珊珊
摘 要:为加强天地图广西矢量数据融合的质量控制,本文借助FME矢量数据处理方面高效便捷的空间拓扑运算分析能力,按照数字测绘成果质量检查与验收的严格要求,总结出一套天地图广西数据质量控制的方法,着重讨论从空间位置、几何形状、拓扑关系及属性要素等方面分析矢量要素的精度指标与逻辑一致性。
关键词:FME 天地图 数据融合 质量控制 矢量
中图分类号:P208 文献标识码:A 文章编号:1672-3791(2018)05(a)-0017-04
天地图是由国家、省、市三级节点构成的国家地理信息公共服务平台。随着天地图应用的日益广泛与深入,采用“超链接”和“服务聚合”的方式已无法满足跨省(市)域、跨层级(国家、省、市)的地理实体与地名地址查询、专题信息挂接、综合统计分析等应用需求。为此,国家测绘地理信息局于2013年启动国家、省、市节点同构试点,旨在通过节点间的基础设施与服务平台软件同构与数据融合,实现更深层次的分布式信息资源集成与协同服务,并为未来基于云架构的分布式服务资源动态调度奠定基础[1]。依据国家统一的数据模型和数据标准,采用最新“天地图广西”节点数据、国家主节点数据、数字城市数据、基础地理信息数据、第一次全国地理国情普查数据以及数据说明资料作为数据源,进行“天地图广西”数据融合生产,并根据相关测绘成果保密要求解密,形成符合国家天地图技术标准的天地图框架数据集[2]。
开展天地图广西数据融合的意义,一是各级政府部门和社会公众对权威、可靠的地理空间信息服务的需求与日俱增,传统的GIS系统开发和资源投入方式已不能适应当今信息时代的飞速发展。二是充分融合多源数据,数据融合是节点同构的一项重要基础性工作,通过整合各级节点的数据资源以达到资源合理配置、丰富数据内容、增强现势性及实用性的目的,实现国家、省、市数据资源优势互补,改进测绘地理信息成果的服务方式,进一步提高测绘地理信息公共服务能力和水平。三是省级节点数据融合在广西尚属先例,可为市级节点数据融合提供示范性作用及指导性参考。
1 天地图数据融合内容和质量控制原则
1.1 数据质量控制的内容
天地图广西数据融合内容包括矢量数据、影像数据和地名地址数据。由于篇幅关系,本文着重讨论矢量融合数据的质量控制。控制矢量数据融合的质量,着重检测多比例尺下矢量要素空间参考系、空间位置和属性精度的融合是否达到数据标准。
1.2 数据融合质量控制原则
1.2.1 空间参考系
统一坐标系统、高程基准、地图投影各参数,经过坐标系统转换的数据源在平面位置上仍存在较大误差时,依据精度较高的数据源对精度较低数据源进行几何纠正。
1.2.2 精度指标
(1)位置精度要求。
不同来源的数据平面位置精度不一致时,原则上以精度高的数据为准。
(2)时间精度要求。
不同来源的数据现势性不一致时,以现势性高的数据为准。
(3)属性精度要求。
属性精度保留原始数据属性信息,不同数据源中同名地物要素的相同属性项取值不一致时,依据现势性、准确性等进行一致性处理,分类要素与取值范围符合要求。
1.2.3 逻辑一致性要求
检查概念一致性、格式一致性、拓扑一致性,各类信息逻辑一致。地理实体数据成果几何精度整合过程中与源数据精度一致,不同来源的数据几何表达精细度不一致时,以精细度高的数据为准,同时成果数据要素空间关系正确[3]。
1.2.4 表征质量检查
几何表达与地理表达合理。
1.2.5 数据完整性要求
融合处理时利用不同数据源的信息进行要素增补,融合后的成果数据尽可能完整保留数据源中的相关信息,检查多余或遗漏的矢量要素及其属性要素。
2 天地图广西矢量数据融合质量控制
2.1 技术流程
天地图广西矢量数据融合质量控制,是基于FME转换器,在Workbench中通过可视化建模方式,将两种不同类型的数据建立映射关系,实现多源矢量数据中线面要素在不同比例尺上的一致性檢测,以及验证空间及属性数据在质量控制范围内的正确性,其技术流程如图1所示。
2.2 数学基础检查
天地图省级节点矢量数据的多源节点同构,会出现多种不同坐标系统的数据融合情况,数学基础正确性检查是基本要求。将其他坐标系转为2000国家大地坐标系,编写基于WKT(Well-Known Text)的定义与转换坐标系统的主要代码,用于表示矢量几何对象、空间参照系统及空间参照系统之间的转换。本文使用OGC制定的地理空间数据标准格式进行编写:
主要代码如下:
GEOGCS["GCS_China_Geodetic_Coordinate_System_2000",
DATUM["D_China_2000",
SPHEROID[""CGCS2000",6378137.0,298. 257222101]]]
PEIMEM["Greenwich",0.0]
UNIT["Degree",0.0174532925199433]],
AUTHORITY["EPSG",4490]](EPSG空间参照系统ID与OGC标准中空间参照系统的SRID一致,故此处写入主代码)
在FME Workbench中调用CoordinateSystemFetcher转换器,实现坐标系统的检查。
2.3 精度指标与逻辑一致性检查
同一地物不同尺度地物呈现不一样的表现形式。例如,同一条河流,在较大比例尺中呈面状表示,在较小比例尺中呈单线表示;同一片街区,在较大比例尺中呈面状表示,在较小比例尺中呈线状或点状表示。因此,要描述同一空间位置不同尺度不同形态要素的逻辑关系,进而加入时间维度分析二者间的一致性,得出现势性最强、位置精度最高的地物要素,必须同时从空间位置、几何形状、属性要素、拓扑关系4个方面制定变化标准的判定规则。
首先定義与判定规则匹配的4个相似度参数(Space、Geometry、Topology、Semantic),分别为空间相似度、几何相似度、拓扑相似度和语义相似度,配置这4个参数的权重来计算匹配要素间的要素相似度(Object),通过设定要素相似度阈值来界定目标匹配的情况,从而根据匹配类型及一致性检测评价规则判定一致性检查结果。
本节提取天地图广西矢量融合水系线面层(HYDLN、HYDPL),参照不同的水系源数据,从空间位置、几何形状、属性要素、拓扑关系4个方面对源数据与目标数据进行一致性匹配分析检查。将不同尺度水系数据的线与线、面与面、线与面进行对比发现,水系线与面在不同尺度上进行一致性匹配的情况最为复杂,本节将重点讨论该情况。首先建立水系目标数据线要素的缓冲区A,接着与源数据水系面要素集B对比匹配,一是空间叠加面积重叠度检查水系融合要素空间位置精度是否超限;二是空间分析拓扑距离检查水系融合后拓扑关系是否改变;三是提取源数据水系面中轴线与目标水系数据比对检查几何形状是否变形;四是构建标准属性结构表匹配相关属性要素信息检查属性要素检查是否准确,从而分别计算出空间相似度、拓扑相似度、几何相似度以及语义相似度,进而建立线面要素间匹配目标集,根据匹配类型分析要素变化情况,从而检测要素的精度指标及一致性。以下将不同尺度的源数据与目标数据的矢量线面要素进行一致性检查。
2.3.1 空间位置检查
对天地图广西矢量数据进行空间位置分析,可利用FME Workbench建立线要素集缓冲区及计算面要素集面积值的转换器分别为Buffer和AreaCalculator,而后计算面积重叠度用转换器AreaOnAreaOverlayer、Tester和AreaCalculator来实现。计算缓冲区面积值转换器如图2所示。
转换器经过函数计算导出检查结果有可标志性,如图3所示,高亮显示的较小比例水系线经计算面积重叠度小于阈值,则认为在空间位置上发生了变化,而右上角的水系线面积重叠度大于阈值,尽管形状与较大尺度水系面未完全吻合,仍认为在空间位置上未发生变化。
2.3.2 几何形状检查
线与面要素进行目标匹配时,主要考虑长度特征,获取线与面要素匹配集中面要素的中轴线长度之和,计算匹配集中线要素长度与面要素中轴线长度之和的差异。线与面要素匹配情况一般发生在线要素为较小比例尺地形图中的要素且面要素为较大比例尺地形图中的要素。
在不同的匹配模式下,对不同的长度参数变量值之间的比较会导致不同的一致性检测结果,几何相似度的计算是在线面要素匹配集中,线要素与面要素中轴线长度之差与二者中较大长度值的比值,该值与1差值的绝对值即为几何相似度。在几何形状分析过程中,用到了转换器CenterLineReplacer、LengthCalculator、FeatureMerger、GeometryRemover。
2.3.3 拓扑关系检查
线与面要素的拓扑关系是在待匹配候选集中的线要素构建缓冲区之后,线要素缓冲区与待匹配候选集中面要素之间的拓扑距离。拓扑相似度的计算需要TD(A,B)和经验参数,比对空间分析结果,对拓扑距离进行赋值,从而计算拓扑相似度,用来表征线与面要素之间的拓扑关系变化。经过空间叠加分析后,结合待匹配的线面拓扑关系,建立线面要素间目标匹配候选集以备映射匹配。
拓扑关系包括单层线要素之间、单层面要素之间、多层线要素间、多层面要素间以及多层线面要素间的关系,在目标匹配候选集里,计算拓扑相似度,输出检查结果如图4所示,可检查出水系面要素之间拓扑错误。
2.3.4 属性要素检查
根据天地图省级节点数据属性要求,定义线和面要素的相关属性字段,建立标准属性结构表。
源数据中不同尺度的线面要素的属性字段及要素编码有相似的部分,因而必须对语义相似度进行分析。利用Levenshtein距离算法,计算两个字符串间的差异程度的字符串度量。Levenshtein距离就是从一个字符串修改到另一个字符串时,其中编辑单个字符(比如修改、插入、删除)所需要的最少次数。
通过匹配语义相似度,可以检查出属性精度的分类正确性及属性正确性,检查出要素分类代码与属性值错漏的个数,必填项和特殊项均写入代码检查出来。
2.3.5 要素相似度
要素相似度由空间相似度、几何相似度、拓扑相似度和语义相似度这4个参数加权平均得出的,对于不同的权重分配,会得到不同的要素相似度值,从而获取不同的最佳目标匹配要素。文中不同尺度的源数据经过数据分析后设定不同的数据参数,且依据天地图广西数据融合项目要求,比对不同尺度的矢量数据实际差异情况经测试和验证,得到与实际图形情况相符效果最好的一组权重分配取值。
2.4 表征质量检查
表征质量检查的是,几何形态反映的准确度及对要素地理形态反映的准确度,也要考虑到符号及注记使用的正确性,该项检查人工干预比较大,此处不赘述。
2.5 数据完整性
数据完整性可以使用转换器将源数据与目标数据写入Workbench加进工作流对比分析,可检查出含有多余或缺少应包含的要素。
3 结语
综上所述,笔者生产实践后,运用FME能在数据再加工及处理的过程中,高效地控制天地图省级节点矢量融合数据的质量。在天地图各级节点融合项目的开展中,将上述转换器封装成一个检查平台,将检查平台与数据处理工作有效地结合,能使检查结果具有实效性和可标记性,在满足成果精度要求的基础上,节约了检查工作的时间成本和人工成本,提高了数据质量和工作效率,为天地图融合项目的顺利实施提供了质量保证。
参考文献
[1] 国家测绘地理信息局.天地图分布式数据中心建设与数据融合示范[Z].
[2] 国家信息局测绘标准化研究所.GB/T 18316-2008,数字测绘成果质量检查与验收[M].中国标准出版社,2008.
[3] 熊登亮,贵仁义,赵俊三.基于FME的空间数据处理实现[J].四川测绘,2015(6):19-21.
[4] 邱新忠,朱俊.天地图省市数据融合若干关键技术研究及应用[J].测绘与空间地理信息,2018(1):55-57.