空间数据质量控制初探

2014-08-15 00:47韩祚鹏范占永李勇华黔南州水利水电勘测设计研究院
河南水利与南水北调 2014年18期
关键词:空间数据不确定性偏差

□ 韩祚鹏 □范占永 □李勇华(黔南州水利水电勘测设计研究院)

1 概述

伴随着物理技术水平的不断提高,信息共享的速度也逐渐加快,与此同时,空间数据的应用范围也逐渐加大,尤其表现在空间数据的分析。因此,这也就更加强调了紧抓数据质量的关键性,使得空间数据的质量能够得到一定的保证,这在一定程度上也为GIS的良好生存提供了基础,为GIS技术的设计以及开发也指明了方向。

2 空间数据质量的不确定性研究

2.1 空间数据不确定性概述

数据不确定性的概念,大概在20世纪70年代就被提出来了,但是因为各种因素的限制,尤其是人们表达能力的欠缺,对于空间数据的不确定性一直都没有一个清晰明确的定义。近年来,随着测量技术的不断提高以及空间数据逐渐趋向多样化,使得人们对测量数据的误差有了一定的认识,认识的范围也逐渐扩大,主要包括大地的测量技术、测绘技术以及制图技术、地理信息系统的技术、遥感技术以及GPS等等技术的应用。就目前人们对于数据的了解程度来看,对于数据不确定的分析以及了解逐渐趋向于对于数据真实性肯定程度的评估,其主要表现为随机性和模糊性的特点,也就是说既包括人们对数据测量的偏差,还包括人们无法测量的偏差,此外,还有相关资料将空间的不确定性总结为四个要素:即误差、模糊、歧义以及不一致。从表达方式来看,包括方位数据的不确定性、属性数据的不确定性、逻辑的协调性、数据的周全性等。

2.2 空间数据不确定性来源

空间数据的不确定性由多种因素引起,主要包括人们认知程度的繁琐性、对于新技术认知的盲目性、错误操作等等。

2.2.1 随机不确定性来源

2.2.1.1 空间数据采集过程中产生的不确定性(源误差)

源误差以及数据获取与具体使用的方式有着很大的联系,主要包含地面测量的原始数据的偏差、地图数字化数据的偏差以及航测感应信息的偏差等等。

2.2.1.2 空间数据处理及操作过程中产生的不确定性

在空间数据的偏差处理的时候,比较容易产生的误差包含计算机的字符长度导致的偏差,以及进行空间数据处理导致的偏差。

2.2.1.3 空间数据使用过程中产生的不确定性

使用偏差,顾名思义,指的就是用户在进行空间数据使用阶段遇到的偏差,具体体现在数据的直接使用者对于资料的不正确理解而导致的偏差。因为数据的说明较简单,使得使用者无法正确利用信息而导致的偏差。

2.2.1.4 不同操作平台及软件选择引起的不确定性

从空间数据的角度出发,如果是相同的问题而采用不相同的GIS软件作为基础,其数据计算的结果以及处理都会产生不同。

2.2.2 模糊不确定性来源

2.2.2.1 人为判断过程中引起的模糊不确定性

在空间数据的获取阶段,通过人为的控制而获得空间数据,大致包括对于边界的目标点的分析会存在不确定性。

2.2.2.2 人的认识具有的模糊不确定性

基于目前产生的新技术或者是新产业,人们大多数还是处于基本了解的阶段,例如:在进行GPS的测量的时候,人们对于电离层也是缺乏一定的认识,对于其实际知识的了解还是不够清晰。所以,在进行数据的总结与处理时,只能够做出一些假设,这也在一定程度上增加了数据的模糊性。

2.2.2.3 由模糊概念产生的模糊不确定性

在处理现实的数据时,对于模糊信息是无法避免的,如果无法进行合理处理,在进行数据转换的时候,还是难免会存在模糊信息的现象。

2.2.2.4 由空间关系描述的模糊性产生的模糊不确定性

在进行地理事物的描述的时候,通常存在的问题就是表述术语的不准确性,比如:村子的周围,这部分区域建议生产畜牧业等等,这一系列的表述都将影响着数据的准确性。

3 空间数据质量元素的分类

国家有关机构对空间质量因素进行了一系列的总结与分析,而且还颁布了相关的条例以及相关规范标准等等,空间数据的质量元素可以分为两大类,即定量因素和非定量因素,而每一种质量因素又被分为不同级别。

4 空间数据质量控制

4.1 质量控制的主要内容

4.1.1 前期资料的质量控制内容

对于原始信息的质量管理、数据源的质量管理是相当关键的,其在一定程度上影响着产品的整体质量。下面通过DRG为实例,展示其管理的主要内容:首先应该保证的就是图纸的整洁与光滑,不能发生变形,当图纸进行分块扫描时,其拼接的地方不可以进行错位处理:在进行分辨率的扫描时应该注意的是,一定要确保图像的清晰,并要做到按照操作的要求进行作业。

4.1.2 作业过程中矢量数据的检查内容

4.1.2.1 位置的精确性

位置的精确性也就是坐标的精确性,在正常的坐标系统下,利用坐标的形式进行不同种要素的表达,主要包含了位置描述的数学基础、控制点的精确程度等等。

4.1.2.2 属性的精度

实际上指的就是属性数值的精确性,主要包含的范围有:属性具体类别的整理,相关代码、属性的数值以及名称标示的准确性等等。

4.1.2.3 逻辑的统一性

具体指的就是数据表述的一致以及阐述空间的数据集合之间特定逻辑关系的准确程度,对于逻辑统一性检验大致包含:属性的统一性、分层的统一性、格式的统一性。

4.1.3 空间数据入库的检查内容

检查内容包括入库处理的资料是否齐全,空间资料的对照坐标是否准确,有没有满足整个数据库的各项要求。数据的格式是否符合相关的要求,各个差别软件之间的数据形式在转换的时候是否匹配。

4.2 质量控制检查的方法

4.2.1 图形数据的测试方式

通常情况下,使用的方式有3种,第一种是软件的自行测试,第二种是人工与机器相互测试的方式,第三种是进行图形绘制的测试方式。

4.2.1 属性数据的检查与方法

实际上属性数据是图形数据搜集融入到相关的数据库当中的,完成之后,再进行对应的操作以及处理,使得图形与数据两者能够相互连接,这整个过程实施都是在GIS的基础之上进行的。

4.2.3 空间数据之间关系正确性的检查与方法

为了能够不断提高操作系统的分析能力以及应用的准确性,需要对空间数据之间联系的精密程度进行专业的质量测试以及管理,具体包含了复杂图像的闭合状况、拓扑联系的准确性等。

[1]刘骞.浅谈空间数据质量管理[J].科技资讯,2013(19):20-21.

[2]杨毛毛,周晓光,姜琦.基于增量信息的空间数据质量检查——以线目标为例[J].地理信息世界,2012(3).

[3]简灿良,赵彬彬.地理空间数据不一致性探测处理方法研究[J].计算机工程与应用,2013,49(10):150-155.

猜你喜欢
空间数据不确定性偏差
法律的两种不确定性
如何走出文章立意偏差的误区
两矩形上的全偏差
英镑或继续面临不确定性风险
具有不可测动态不确定性非线性系统的控制
元数据驱动的多中心空间数据同步方法研究
关于均数与偏差
基于文件系统的分布式海量空间数据高效存储与组织研究
客户端空间数据缓存策略
多源空间数据同名实体几何匹配方法研究