符季颖, 霍 亮,2, 沈 涛,2, 徐 鲲, 栾磊洋
(1.北京建筑大学 测绘与城市空间信息学院,北京 100044;2.北京建筑大学 北京未来城市设计高精尖创新中心,北京 100044)
数据集成是指把不同来源、格式、特点、性质的地理信息数据进行逻辑或物理上的有机集中,在这个过程中充分考虑到数据的属性、时间和空间特征、数据自身及其表达的地理特征和过程的准确性[1]。灾害应急测绘数据具有海量、多源、异构等特点[2]。如何快速集成应急测绘数据、加快自然灾害应急决策响应速度,是当前应急测绘保障研究的热点问题。目前,针对应急测绘数据的集成管理主要包括数据仓库[3]、统一数据交换[4]、本体描述[5]3种方式。
数据仓库是较为传统的数据集成管理方式,主要采用关系数据库方式存储,并以编目的形式进行集成管理,存储的数据较为单一,且只面向特定的部门使用。此外,数据仓库采用“元数据关键字”的方式进行数据检索,这种检索速度会受到硬件条件、检索数量等的限制,使数据的集成效率难以得到保障。尽管现在ArcSDE、Oracle Spatial等空间引擎时空索引与传统E-R关系索引组合使用,提升了数据存储、分析及检索能力,但其在海量多元异构的应急测绘数据存储与检索上,还是存在着一定不足。
统一数据交换是指在分布式、异构式环境的背景下,从共享角度出发,利用面向对象对数据交换格式进行统一描述,并提供统一的数据表达与查询接口,如数据字典。特点是使数据与业务分离,采用松耦合方式集成数据。该种方式提供统一的元数据表达,但其语义描述和数据映射关系较为简单,难以根据灾害事件响应需求满足应急测绘数据的自动检索发现。
基于本体描述表达的数据集成方式,是采用本体描述语言(Ontology Web Language,OWL)并利用资源描述框架(Resource Description Framework,RDF)对数据的概念、关系进行定义,从而实现数据的统一描述与表达。该方式可以增强数据间的语义互操作性,属于一种知识表达的方式,能很好地实现数据的自动筛选发现。
在自然灾害应急事件快速响应背景下,本文采用本体描述的数据集成方法集成灾害事件应急测绘数据。首先,分析灾害事件和应急测绘数据类型、特征,使用本体描述方法分别对灾害事件及应急测绘数据进行统一描述与关系表达,建立灾害事件与应急测绘数据语义关联性。然后,从灾害事件语义约束、应急测绘数据语义约束、时效性语义约束3个层级约束出发搭建多级语义约束框架,最后,以用户需求为导向实现灾害事件应急测绘数据的快速集成,实现应急测绘数据的自动检索发现。
自然灾害发生地的地理环境、人口分布、应急资源分布等空间信息,静态文本难以快速融合这些空间信息,不能为应急决策提供直观的依据[6]。本体作为实现语义筛选发现的一种重要方法,为灾害事件与应急测绘数据间的语义关系表达与数据自动检索集成提供了一种有效可行的办法。为此,本文构建了灾害事件与应急测绘数据的语义关联性,从灾害事件类型的角度出发,描述灾害事件、应急测绘数据与事件数据时效性的语义映射关系。该语义映射关系可以快速准确地查找应急减灾所需的数据集,快速提升应急测绘数据集成效率。
1.1.1 灾害事件语义描述
为了降低事件本体模型的复杂性,本文主要研究灾害事件向应急测绘数据的筛选,而降低对灾害事件管理中减缓、准备、响应和恢复4个阶段发展演化的复杂性研究,更多是强调灾害事件发生时应急测绘数据的快速集成响应。本文通过描述灾害事件领域中概念、属性和关系之间的关系,建立灾害事件本体模型,实现灾害事件统一语义描述,形成灾害事件语义层次的形式化表达。
灾害事件本体模型采用四元组的形式进行表达,事件本体的四元组表达为:
Oe=〈Ei,Et|Re,Rd〉
(1)
1)灾害事件基础信息(Event information, Ei):描述灾害事件的基本特征,包括事件位置、事件等级、事件内容、事件ID等,是对灾害事件的一个总体概述,更好、更充分地反映所响应灾害事件的具体信息。
2)事件类型(Event type, Et):属于灾害事件的具体事件类型。为了保证灾害事件概念分类的语义一致性与分类的标准性,概念分类需要依照国家具体的灾害事件信息分类标准来实施。事件类型是事件本体的核心要素,反映了具体事件发生的灾害类型与所需的相应应急测绘数据信息,体现了灾害事件本体与应急测绘数据本体之间的相互关联关系。
3)灾害事件关系(Relationship event, Re):在灾害事件语义描述中,属于灾害事件的父子、同类事件的一种关联关系,存在着一对一、一对多和多对多的关系,描述与灾害事件之间的包含与被包含关系,是灾害事件向其关联事件应急测绘数据筛选发现的具体体现。
4)应急测绘数据(Relationship data, Rd):在灾害事件语义描述中,指灾害事件与应急测绘数据的关联关系。本文通过语义约束的多级映射关系,描述它们之间的关联关系。事件与数据的约束分为事件类型约束、数据属性特征约束和时效性约束。
1.1.2 应急测绘数据语义描述
在响应自然灾害事件进行应急测绘数据集成中,应急测绘数据本体模型是关键。它在应急测绘数据之间建立关联关系,并与灾害事件建立语义映射关系,从而为基于灾害事件的数据快速检索集成提供理论依据,是灾害事件与应急测绘数据统一形式化表达的重要组成部分。应急测绘数据本体模型采用五元组的形式进行表达:
Od=〈Dt,Df,Dp|Re,Rd〉
(2)
1)应急测绘数据类型(Date type, Dt):为快速准确定位至目标数据群体中,设计数据类型表达元素。每个数据通过一个或多个类型标注,为计算机提供快速筛选相应目标数据集的途径。数据类型内容可通过获取途径(如卫星、航空摄影)和基础地理数据(如道路、河流)等方式定义。
2)应急测绘数据特征(Date feature, Df):从应急测绘数据的空间、属性、时间3个方面进行统一描述管理,特征内容包括坐标系统、数据格式、数据来源、获取时间等。
3)时效性(Date phase, Dp):针对时效性语义约束条件,设计时效性元素表达。其属于应急测绘数据特征要素的组成部分,包括实时传输的灾害发生实时数据、灾前建库的历史数据和跨部门调入的其他数据,体现了灾害事件应急响应的数据时效性。
4)灾害事件关系(Relationship event, Re):在应急测绘数据语义描述中,描述应急测绘数据与灾害事件的关联关系,是对应急测绘数据特征满足灾害事件程度的形式化表达。根据应急测绘数据与灾害事件的关系距离,为灾害事件的应急测绘数据定位并逐步自动检索提供筛选依据。
5)应急测绘数据(Relationship date, Rd):在应急测绘数据语义描述中,属于对应急测绘数据之间空间结构特性的关联描述,可以实现同源异构、异构同源等应急测绘数据特性的检索筛选,为不同结构的数据集成提供检索判断依据,是应急测绘数据本体模型表达的重要组成元素。
目前,常见的语义关联构建方法主要有顾捷晔等[7]研究的语义聚类方法、苏依拉等[8]研究的图论模型方法、朱庆等[9]研究的本体模型方法,本文采用目前较为成熟的本体模型方法,构建灾害事件与应急测绘数据的语义关联关系。本体模型可以很好地存储、处理以及表示各种具有语义信息的灾害应急知识资源。目前,本体模型语义关联构建方法主要有骨架法、Tove法、七步法、数据挖掘和领域专家相结合的半自动构建方法、KACTUS法等[10],综合这几种方法,本文设计“五步法”,构建灾害事件和应急测绘数据本体模型,如图1所示。
图1 灾害事件与应急测绘数据本体构建“五步法”
具体描述为:参照国家相关应急信息分类标准,分析灾害事件与应急测绘数据相关分类、属性特征等,为构建本体建立数据统一参考;分析灾害事件与应急测绘数据分类标准和语义关系,建立事件与数据语义的统一描述,满足该领域的形式化表达;由于灾害应急领域中通常有许多概念,每个手动编辑效率不高,因此,通过使用统一描述语言UML设计相应的概念模型形成UML文件,并传输UML文件至OWL中,将它们在数据库中的传输记录映射至OWL建立本体;对于一些特别概念、类型可以直接采用本体描述语OWL构建本体;创建本体实例,并存入实例库中。
在灾害事件本体与应急测绘数据本体建立后,需要利用映射的方式将灾害事件本体与应急测绘数据本体联系起来[11-12]。本文采用相似度的映射方式,在针对各层约束的特征信息提取后,采用概念相似度,建立灾害事件本体与应急测绘数据本体之间关系的度量,实现灾害事件语义与应急测绘数据语义的匹配。
为建立灾害事件与应急测绘数据间的关联性,从灾害事件语义约束、应急测绘数据语义约束和时效性语义约束3个层级约束出发,设计灾害事件与应急测绘数据的多级语义约束关系,响应灾害事件发生时需要的应急测绘数据自动集成,如图2所示。
图2 灾害事件与应急测绘数据多级语义约束
2.1.1 灾害事件语义约束
灾害发生时,根据灾害事件中的灾害位置、灾害范围等灾害事件语义对应急测绘数据空间特征进行约束,定义灾害事件对应急测绘数据的相关需求。该层直观表达灾害事件发生时,以用户需求为驱动的灾害类型等灾害语义信息对具体数据的需求。
2.1.2 应急测绘数据语义约束
该层是针对应急测绘数据的时间分辨率、获取时间等时间特征和数据类型、数据格式、坐标系统等属性特征形成的约束层,可以从全局数据关系出发完成对满足灾害事件应急测绘数据集成的大部分筛选,属于多级映射关系的核心约束层。当用户以某类灾害事件为需求集成相应的应急测绘数据集时,通过灾害事件与应急测绘数据间的语义关联,可完成由灾害事件到应急测绘数据的语义映射,并根据具体的数据语义约束,实现应急测绘数据的筛选。
2.1.3 时效性语义约束
针对应急响应过程中应急测绘数据具有时效性的需要,本文根据不同的应急测绘数据来源方式,建立具有不同时效状态信息的时效性约束层。根据灾害事件应急响应具体需求,通过该层约束条件,对实时传输、灾前建库和跨部门调入3种不同应急测绘数据时效性的约束关系,采用一种或多种语义约束集成应急测绘数据。
本文设计多级语义约束框架,并基于该框架实现应急测绘数据的筛选集成,如图3所示。
图3 多级语义约束框架
首先,根据国家应急相关规范及OWL语法规范,采用“五步法”实现应急测绘数据元数据信息语义映射。然后,设计灾害事件与应急测绘数据本体模型,建立灾害事件语义描述和应急测绘数据语义描述的统一表达。最后,针对灾害事件应急测绘数据集成特点,设计灾害事件语义约束、应急测绘数据语义约束和时效性语义约束的多级语义约束映射表达,通过提取多级语义约束信息,集成灾害事件应急测绘数据,并将结果显示于用户界面。多级语义约束数据集成框架实现对灾害事件应急测绘数据的快速检索、发现、筛选与集成,为应急处置提供快速有效的数据支撑。
依据《国家应急平台体系信息资源分类与编码规范》建立概念层次分类体系,包括地面沉降事件、山体崩塌事件等[13]。然后参照《突发公共事件应对法》《国家自然灾害救助应急预案》和张春菊的属性分类标准[14-15],设计属性概念分类体系,包括人员受伤、经济损失等共有属性及沉降点、曲率等特有属性。采用“五步法”构建地质灾害事件本体模型,如图4所示。
图4 地质灾害事件本体
在实践中,3个层级的约束条件如下。
1)灾害事件语义约束:包括地面沉降事件、地面塌陷事件等事件类型;一般(Ⅳ级)、较大(Ⅲ级)等事件等级;灾害发生原因、人员受伤情况等事件属性;发生地质灾害事件的具体灾害位置等(表1)。
表1 灾害事件语义约束
2)应急测绘数据语义约束:该层约束条件包括地形数据、矢量数据等数据类型;Terrain、Shape等数据格式;CGCS2000、WGS84等坐标系统等应急测绘数据语义约束(表2)。
表2 应急测绘数据语义约束
3)时效性语义约束:时效性是数据属性的进一步约束,从数据传输方式方面定量表达数据需求满足程度,包括实时传输的灾害发生实时数据、灾前建库的历史数据和跨部门调入的其他数据,3个时效特征可以单个或同时约束应急测绘数据,实现时效性语义约束下的地质灾害事件应急测绘数据集成(表3)。
表3 时效性语义约束
通过本文方法与数据仓库检索集成的传统方法,实现地质灾害应急测绘数据筛选集成,如表4和图5所示。
表4 地质灾害应急测绘数据集成统计信息
图5 地质灾害应急测绘元数据集成结果
本文探讨了灾害事件与应急测绘数据语义互操作的可能性,并有效地提高了应急测绘数据的集成效率。
1)本文方法通过构建灾害事件与应急测绘数据语义关联性,提出以用户需求为驱动,顾及灾害事件语义约束、应急测绘数据语义约束、时效性语义约束3个层级约束条件的数据自动筛选发现,实现自然灾害应急响应背景下的应急测绘数据快速集成。实践表明,较传统数据集成方法,本文方法所集成的数据能有效减少数据冗余、提高数据集成效率。
2)本文方法可以有效地改善传统信息检索的局限性,快速准确地筛选集成应急测绘数据,为灾情决策、应急救援、灾情评估等自然灾害应急事件快速响应提供支撑,有较好的普适性。
3)在多级语义约束应急测绘数据集成研究中,还要考虑本体模型评价、时效性评估等问题,需要进一步研究。