姜惠玲
(商丘职业技术学院,河南 商丘 476000)
数据同化也称数据的组合和优化,是一种元素对其他元素进行改变、吸收和合并而成的过程,也是两种元素之间消除差异,消除矛盾的过程。从数据更新的角度来说,地理空间数据同化指的是,在一系列提前定义好的知识、规则、规范和标准的指导下,同一地区不同时间内、不同尺度、不同来源的空间数据对它们在尺度特征、时间特征、属性特征和空间特征上的不一致性和差异性进行解决,从而实现空间数据在物理上与逻辑上的有机统一和集中。
(1)多比例尺数据的协同更新问题。人们对地球表层各种人文与自然现象的空间形态结构作了不同尺度的抽象表达,构成了比例尺度不同的系列地形图,对多种比例尺数字地图数据库进行了建立。但建立和维护这些多尺度地图数据库耗资巨大,费时费力,给多比例尺数据的协同更新造成了很多困难,同时也存在同一实体的多重表达间一致性的问题。所以,目前人们面临的又一大难题就是如何自动综合最新的较大比例尺数字地图,以更新较小比例尺的数字地图或派生出较小比例尺的数字地图。
(2)更新客户数据库的方法和模式问题。因为很多用户已把基础地理数据和其专业数据整合为一体或在原有的基础地理数据上已经添加了很多专题属性,在数据规格(specifications)上,用户数据库和基础地理新版数据间存在差异,造成了数据融合、信息转换、数据库模式不一致、语义冲突等问题。
(3)更新主数据库的方法问题。生产和提供基础地理信息者按照间接获得或直接测定的变化信息,更新处理自己的基础地理信息数据库,也称主数据库,包含保存历史数据、生成新的数据库版本、删除已不存在的目标、添加新增目标等。其中存在版本制作、存储历史数据的方法、并发控制机制、将小比例尺数据使用最新大比例尺数据更新的综合方法、要素间空间关系的一致性与协调性处理、更新主数据库的增量模式等很多问题。
(4)基础地理要素变化的及时发现与自动提取问题。针对地表变化的幅度和频率,使用最新的航空航天影像和其它现势资料进行分析,使更新对象与范围被确定,把变化信息提取出来,这是更新基础地理数据库的必由之路。这涉及到不同来源数据的集成和融合、将地物变化信息从高分辨率影像提取出来、现有基础地理数据和不同类型的遥感影像精确配准等大量的关键技术问题。需要对相关的算法、数据处理模型进行不断的改进或设计,发展更新数据的工具,提高提取信息和发现变化的可靠性和自动化程度,以提高数据更新的生产效率和缩短其周期。
(5)数据模型演化与动态建模问题。采用交互式的方式操作和处理现有的数据体,使原有的拓扑、元数据、属性数据以及部分几何等空间关系得到改变,甚至使数据的精度得到提高,使数据的类型被丰富,这是更新基础地理数据库的一个基本特点。在这样持续的“数据再造工程”中,基础地理数据库的数据模型也将随之进行演化,以对基础地理要素的元信息变化、精度变化、时空变化等进行表达。所以,要对其数据模型随数据版本增加与数据更新操作而不断演化的基本问题进行研究,就得对基础地理数据库的时空数据模型进行建立,实现更新基础地理数据库的动态建模。
(1)智能控制---面向更新的数据同化处理。对知识、空间数据库与各种规则、地理事件及其相应的同化操作进行智能的、系统的连接和处理。本文提出了以数据同化为基础的空间数据更新机制,其处在“地理事件-条件-操作GECA”规则的驱动下。规则库与终止性分析、完备性与一致性检测、更新数据同化的操作、事务调度、条件检测、事件监测这七个方面是运行机制的整个过程。
(2)处理空间关系在同化过程中的一致性。高效的检测,识别及表达空间关系。处理一致性的关键与前提是如何把具有逻辑矛盾(如河流“爬坡”等现象)和不一致的实体间的空间关系用较高的效率识别和检测出来,从而在此基础上将数据空间关系的矛盾消除,处理空间关系的一致性。
(3)地理空间数据属性信息的同化。属性信息同化也包含重新估值及修改、冗余的处理、属性信息的补充;属性信息之间的错误(粗差)探测和处理、相互比较和分析;编码体系的转化和统一、不同空间数据的属性信息分级和分类这三个递进层次的处理。
(4)地理空间数据的几何信息同化。地理空间数据的几何信息同化主要也包含三个递进层次的处理:按照几何位置间的比较以及空间实体变化类型分析的结果,实施对应的同化操作;对多源地理空间数据之间进行粗差探测、评价、分析和相互比较。采用常见的如粗差探测于分类算法等相关的数学方法在现势性评价结果和空间数据质量的基础上,把数据源的错误和粗差找出来;实现地理空间数据不同数学基础和空间基准的转化与统一。
(5)提取基于相似性度量模型的实体变化信息。地理空间数据同化的另一关键技术就是多源地理空间数据同名实体之间的匹配能够通过相似性度量模型来实现,同时还能够对差异性进行推断,再把空间实体的变化信息由差异性自动提取出来。有效的描述几何形状和提取其特征,其次按照一定的如基于距离的方法等相似性度量方法来对空间数据之间的相似性程度进行度量,这是建立几何相似性度量模型的关键。
(6)获取、表达和管理各种规则和知识。在面向地理空间数据数据同化更新的过程中,至关重要的就是对参与同化的各种数据源质量进行分析,评价,取舍和应用。不但需要有相关的规则和标准来控制,而且要有领域专家的知识来指导,同时还要有合理的数学方法来解决,才能使这个过程更加自动化和智能化。规则和知识的获取能够通过各种标准和规范、专家经验的总结来进行。规则与知识的结构化描述和表示就是为了便于计算机的应用与存储。能够通过规则库来实现规则与知识的调用和管理。规则与知识主要分作如下几类:空间数据同化操作的实施规则;空间要素变化类型的知识推理的规则;现势性与数据源质量评价的规则;数据源之间关联和匹配的规则。
“地理空间数据同化”是地理空间数据库相关技术的发展、持续,数据源种类的不断增加和高效的更新需求的产物。本文主要把同化和更新有机的结合了起来,这是地理空间数据整合这一概念面向数据更新所提出的研究方向和目的,是为了更好的给地理空间数据库的更新服务。虽然前人在一些关键技术方面做了大量的研究工作,但依然有很多充满挑战性的工作需要我们去研究。