地质灾害领域本体的研究与应用

2011-12-28 07:25妮,刘
地理与地理信息科学 2011年6期
关键词:空间数据本体滑坡

王 艳 妮,刘 刚

地质灾害领域本体的研究与应用

王 艳 妮1,刘 刚2

(1.江苏省有色金属华东地质勘查局地质信息中心,江苏 南京 210007;2.中国地质大学(武汉)计算机学院,湖北 武汉 430074)

引入了由斯坦福大学医学院开发的七步法,并采用OWL DL语言描述本体,利用目前成熟的且流行的本体可视化构建工具Protégé完成地质灾害信息领域本体库的构建。基于行业标准、地质灾害信息处理标准、专家知识等相关标准,建立地质灾害领域本体。用OWL形式化描述基于多层结构的地质灾害空间数据本体应用模型来实现三层地质灾害本体。以具有优势的三峡库区丰富地质灾害资料为依托,以地质灾害多源异构空间信息集成与共享为主线,引入本体理论和GeoSciML,研究建立基于顶级、领域及应用多层本体的地质灾害空间数据语义集成和共享模型,实现地质灾害信息系统数据集成和应用集成,目标是解决横向各部门间的有效沟通和信息共享,以及单体灾害和群体灾害发生时的应急指挥和决策支持等问题。

领域本体;语义信息集成;地质灾害领域本体;地质灾害信息系统

0 引言

三峡库区是地质灾害的多发区域,滑坡、崩塌和泥石流是三峡库区的主要外动力地质现象,也是地质灾害的主要类型。三峡工程的修建将对库区整个生态环境系统产生深刻的影响,促使地质灾害体的稳定性发生相应的变化,并且在部分地区出现新的滑坡体。目前库区的地质灾害所带来的危害严重,可是来源于库区的大量环境和地质灾害数据却没有得到充分的共享。许多地质灾害数据库的建设主要处于单机、封闭的系统形式,导致数据信息的管理、更新和使用落后于社会对信息的需求,花费巨资建立的数据库资源难于实现数据共享,从而变为数量众多的“信息孤岛”[1]。

实现信息共享一般有4种技术方法:数据转换方法、数据集成、基于元数据和网络技术的GIS互操作技术、语义共享集成技术[2]。前3种方法实现了语法层次的集成,第4种方法实现语义层次的集成,是实现数据共享和互操作的高级发展阶段。语义方法的主要特点是扩展性好、适应动态信息源、支持语义级信息共享。地质灾害空间数据的异构性、分布性、增长性和变化性决定了传统结构化方法不适应迅猛发展的应用环境,所以语义方法成为当前网络环境下多源异构数据集成研究的重点。本体(ontology)是实现语义共享的良好途径。本体既准确地描述了概念含义,又描述了概念之间的内在关联,能通过逻辑推理获取概念之间蕴涵的关系,能够有效地表达特定领域内的通用知识,非常适合作为面向语义的数据集成中的通用语义模型。通过本体的语义集成可以克服以往数据格式转换和直接读取共享模式的缺陷。

1 地质灾害领域本体

1.1 多层本体应用模型

依照领域依赖程度,本体可以细分为顶级(top level)、领域(domain)、任务(task)和应用(application)ontologies 4类[3,4]。1)顶级ontologies描述的是最普通的概念及概念间的关系,如空间、时间、事件、行为等,与具体的应用无关,其他种类的ontologies都是该类ontologies的特例;2)领域ontologies描述的是特定领域(地质灾害等)中的概念及概念间的关系;3)任务ontologies描述的是特定任务或行为中的概念及概念间的关系;4)应用ontologies描述的是依赖于特定领域和任务的概念及概念间的关系。领域本体在多层本体结构中起到了承上启下的关键作用。

本文设计了基于多层结构的地质灾害空间数据本体的应用模型(图1)。在该模型中,对地质灾害信息系统引入本体以及对本体的相关操作,以实现地质灾害空间数据的语义查询和检索。该模型分为地质灾害信息系统应用层、本体层和数据层[5]。

图1 基于多层结构的地质灾害空间数据本体应用模型Fig.1 Multi-level ontology application model for geological hazard spatial data

1.2 地质灾害领域本体

领域本体是指在一个特定的领域中可以重用,提供该特定领域的概念定义和概念之间的关系,提供该领域中发生的活动以及该领域的主要理论等,如医学概念本体、生物学知识库、地理本体、企业本体等[6,3]。与研究其他地学本体一样,对地质灾害概念的表达,也需要从语义学和逻辑学的角度入手,通过引入本体和描述逻辑构建一套能清晰描述地质灾害信息的形式化系统,并形成反映该地质灾害信息系统不同地质灾害类型间的相互关系和作用的若干规则。地质灾害领域本体是基于本体的地质灾害信息框架中的一个层次,在其中可定义诸如地震、崩塌、滑坡、泥石流等灾害地质学学科的本体概念。另一方面,要关注实际的地质灾害数据集,地质灾害领域本体中的许多概念可能在应用本体具有不同的名称,并存在名称相似而实质不同或名称相同而意义不同的情况。因此,同一地质灾害数据集有时会具有不同的表达方式,不同的地质灾害领域实体可能具有一定语义对应关系,而本体则为地质灾害信息语义共享搭建了一个沟通桥梁。因此,将本体引入地质灾害领域,研究地质灾害领域的概念及其之间的关系,以便实现地质灾害领域信息的集成和共享。

2 领域本体的基本构建方法

2.1 地质灾害数据分类与概念体系分析

地质灾害的形成机理和时空演化过程复杂,地质灾害数据具有显著的多源、多类、多量、多维、多时态和多主题特征[7,8]。目前还没有一个公认的灾害分类方案,这主要是因为灾害成因的复杂性、发生过程的连锁性以及区域表现上的群发性,使得在分类中很难找到一个统一的标准。具体到地质灾害(尤其是三峡库区的地质灾害),在分类方面也比较混乱,甚至有时会把与地质作用无关的一些灾害也划入地质灾害的范畴。笔者认为地质灾害的成因分类是主要且是常用的分类方案,对地质灾害的分类将遵循以下原则[9,10]:1)分类的系统和层次要明确。任何一种地质灾害所衍生的灾害链与灾害本身是从属关系而非并列关系,如基岩和基岩风化壳岸线的崩塌、垮落属于海岸后退一类的地质灾害,而不单独作为一种灾害类型列出;2)任何一种地质灾害都应按其主要成因类型划归相应的类中,一种地质灾害在分类表中只能占一个位置;3)地质灾害的动力标志是地质作用,非直接地质作用的灾害不应列入地质灾害的分类中。

本文以滑坡为例,说明地质灾害信息的语义表达。根据滑坡的物质成分、空间形态、地域性、形态发展变化及其对人类的影响等,在保持其概念语义完整性的要求下,归纳出滑坡的本体属性为:物质性、空间性、时间性、影响性。其中“空间性”主要是指滑坡要素的区域性和空间分布,一般指各类滑坡的分布区域;“时间性”表示滑坡灾害要素的形成及发展变化,如某滑坡灾害是由原来的哪类要素转变而来的、现在的状态以及将来的转变趋势;“影响性”体现了滑坡灾害要素对人类生产和生活的作用,即破坏性和“建设性”,在此主要指滑坡灾害的危害性。本文以《灾害地质学》中的地质灾害为概念域,分析其概念语义,地质灾害类型和组成地质灾害的要素的语义描述见表1。

通过对地质灾害概念语义的形式化分析,可以确定本体内的概念及概念间的语义关系,这为地质灾害领域本体的建立提供了“清晰定义术语和具有一致性”的前提。

2.2 地质灾害信息层次结构

根据上述信息分类的原则和地质灾害信息的分类方法,并参照《中华人民共和国地质矿产行业标准(DZ0238-2004)地质灾害分类分级(试行)》和《中华人民共和国国土资源行业标准(DZ-2000)地质灾害分类分级》以及文献[11]中地质灾害类型的概念和本质含义对地质灾害进行科学分类。对建立的地质灾害领域共享词汇库信息进行分类,把地质灾害按照灾类、灾种、子灾害三级层次进行划分或归类。

2.3 地质灾害领域本体的构建技术路线

斯坦福大学医学院开发的七步法,是目前用于领域本体的构建基本方法之一,具体开发过程包括:1)确定知识本体的专业领域和范畴;2)考查复用现有知识本体的可能性;3)列出知识本体中的重要术语;4)定义类和类的等级体系;5)定义类的属性;6)定义属性的分面;7)创建实例。

表1 地质灾害概念语义Table 1 Semantic conception of geological hazard

按照“七步法”的思想,地质灾害领域本体的技术实现路线包括:1)依据有关行业专业标准、地质灾害信息处理标准和专家知识建立地质灾害领域本体框架结构。2)基于多层本体结构,设计地质灾害空间数据本体应用模型,建立地质灾害空间数据本体,基于OWL实现对空间数据本体形式化表达;本体构建、管理和查询访问的过程采用 Protégé3.4.4工具进行本体的创建与管理维护。3)基于本体查询模式和基于描述逻辑的本体推理,建立本体语义的查询框架,设计地质灾害空间信息共享传播模型;提供全局的本体驱动接口模式,实现各部应用系统或模块对空间数据的语义查询和检索。

3 地质灾害信息领域本体形式化表达与分析

地质灾害信息的形式化描述就是选用合适的本体描述语言对建立的领域本体进行形式化描述,最重要的是对地质灾害信息领域的概念、子概念、属性及其各自具有的特性进行准确的定义,以提供比自然语言更严格的本体模型,增强机器的可读性,便于本体模型自动进行逻辑推理及检验。

本文采用OWL DL语言描述本体。利用目前成熟且流行的本体可视化构建工具——斯坦福大学的Stanford Medical Informatics开发的一个开放源码的本体编辑器Protégé,完成地质灾害信息领域本体库的构建,以便实现地质灾害信息本体的共享和重用。Protégé可以将其所构建的本体利用多种形式的文本格式表示,在Protégé中将本体以owl格式保存,即保存为Geologicaldisasters.owl文件。

经过多个版本的实验,发现Protégé4.0版本不很稳定,而Protégé3.4是3系列中最成熟的版本,因此,本文选用 Protégé3.4.4作为地质灾害信息本体库的构建工具。本体结构以树形的层次目录结构显示,用户可以通过选择相应的节点来增加或编辑类、子类、属性、实例等,使用户在概念层次上设计领域模型,所以构建本体建模者不需要深究具体的本体表示语言的语法。

针对地质灾害成因复杂、信息包容量大、灾害种类复杂的特点,并考虑了领域知识处理的方便性、可共享性、扩展性,将上述地质灾害领域信息概念抽取为地质灾害、基础地理、基础地质、水文气象、社会经济等几大类基本信息,用Protégé3.4.4构建了一个体系完整、应用于地质灾害预测与防治领域的地质灾害本体信息库。图2是Protégé3.4.4对 Geologicaldisasters本体的类进行操作的界面,在此界面中,主要针对地质灾害领域本体中的类进行编辑,如增加类、修改类和删除类等操作。类的树状结构图位于左侧,清晰地表达了本体中类的层次结构。

对Geologicaldisasters本体的属性关系进行操作界面中,主要对本体中类的属性(包括对象属性和数据属性的描述)进行各种编辑:增加属性、修改属性和删除属性等。

图2 Protégé3.4.4对 Geologicaldisasters本体的类进行操作的界面Fig.2 Interface of the class operating of geological disasters ontology in Protégé3.4.4

图3为部分地质灾害信息的OWL Viz类层次关系,其中斜坡灾害是地质灾害的一个子类,崩塌、滑坡、泥石流又是斜坡地质灾害的3个子类,岩体滑坡和土体滑坡为滑坡灾害的2个子类。地质灾害领域本体中类的实例的部分代码如下:

图3 部分地质灾害信息的OWL Viz类层次关系Fig.3 OWL Viz class hierarchy of part of the geological disaster information

4 结论

针对地质灾害信息语义共享问题,本文研究了基于本体的语义信息共享模型和形式化表达方法。以具有优势的三峡库区丰富地质灾害资料为依托,以地质灾害多源异构空间信息集成与共享为主线,研究建立基于顶级、领域及应用多层本体的地质灾害空间数据语义集成和共享模型。实现地质灾害信息系统数据集成和应用集成,目标是解决横向各部门之间的有效沟通和信息共享,以及单体灾害和群体灾害发生时的应急指挥和决策支持等问题。

提出了基于顶级、领域及应用多层本体的地质灾害异构空间信息集成模型及其形式化表达方法,这有别于传统的基于数据字典、元数据等集成方法,能够实现地质灾害空间数据的语义集成,为系统各级应用提供更加完善的信息基础设施。提出了基于组件的本体驱动接口设计,该接口基于本体语义的查询框架和地质灾害空间信息共享传播模型,实现各部应用模块对空间数据的语义查询和检索,是实现语义集成和共享的技术途径。

在构建地质灾害领域共享语汇库的过程中,如何有效组织地质灾害领域的知识片断(概念、属性、关系)是整个过程主要关心的问题,这将关系到能否简洁且准确地构建地质灾害领域本体。通过对地质灾害领域知识的分析和表达,在得到的地质灾害领域术语集合中,可能存在如下情况:有些相同的概念和术语在含义上存在重叠,或者不同的概念和术语在含义上也可能存在重叠、包含甚至交叉等关系,或者某个术语的属性无法确定。因此,需要在今后概念分类体系建立的步骤中,逐步的筛选这些术语,并随着地质灾害领域本体建立的推进,对原有的术语进行完善(修改、添加和删除)。

感谢中国地质大学(武汉)吴冲龙教授、刘刚教授的悉心指导以及在理论和方法上提供的帮助!

[1]陈宇达,汪新庆,刘艳梅.地质灾害数据共享模式研究[J].国土资源信息化,2007(2):11-14.

[2]曹彦波.基于本体的资源环境空间信息集成与共享技术研究[D].云南师范大学,2006.

[3]GUARINO N.Semantic matching:Formal ontological distinctions for information organization,extraction,and integration[A].PAZIENZA M T.Information Extraction:A Multidisciplinary Approach to an Emerging Information Technology[C].Springer Verlag,1997.139-170.

[4]GUARINO N,WELTY C.A formal ontology of properties[A].DIEG R,CORBY O.The Proceedings of the 12th International Conference on Knowledge Engineering and Knowledge Management(EKAW′2000)[C].Springer Verlag,2000.97-112.

[5]金均强.基于本体的空间数据建模[D].武汉大学,2005.

[6]金芝.知识工程中的本体论研究[A].陆汝钤.世纪之交的知识工程与知识科学[C].北京:清华大学出版社,2001.423-446.

[7]吴冲龙,谭照华,李伟忠,等.三峡库区地质灾害勘察点源信息系统的研发[J].水文地质工程地质,2006(2):123-128.

[8]吴冲龙.地质矿产点源信息系统的开发与应用[J].地球科学,1998a,23(2):193-198.

[9]王红霞,辛永忠.中国近海地区地质灾害分类[J].中国地质灾害与防治学,1997,8(2):67-71.

[10]李绍全.海岸带地质灾害的属性及分类[J].海洋地质动态,1996(6):1-3.

[11]胡海涛.地质灾害类型、分布及防治意义[J].水文地质工程地质,1993(2):1-7.

Research and Application of Geological Hazard Domain Ontology

WANG Yan-ni1,LIU Gang2
(1.GeologicalInformationTechnologyCentre,EastChinaMineralExplorationandDevelopmentBureau,Nanjing210007;2.FacultyofComputerScienceandTechnology,ChinaUniversityofGeosciences(Wuhan),Wuhan430074,China)

Seven-step method developed by Department of Medicine in Stanford University is introduced to establish geo-hazard domain ontology,and OWL DL is applied to describe the domain ontology in this paper.Protégéis developed by Stanford University,which is a mature and popular visual ontology building tools,is used in the establishment,management and inquiry access of the geological hazard information ontology.On the basis of related standards such as industry professional standard,geological hazard information processing standard and expert knowledge,geo-hazard domain ontology can be set up.According to the multi-level structure,geological hazard spatial data ontology application model is designed to implement the three level of geological hazard ontology with formalized representation by using OWL.Based on the abundant geological hazard data of Three Gorges Area in China,taking the multi-source heterogeneous geological hazard spatial information integration and sharing for the main line,the introduction of the ontology theory and GeoSciML for the new technical means,geological hazard ontology is applied to realize data and application integration and resolve the problem of decision making when single hazard or group hazards occur.Ontology is used to carry out semantic sharing model to improve interoperability capacity of geological hazard information system.

domain ontology;semantic data integration;geological hazard domain ontology;geological hazard information system

P208

A

1672-0504(2011)06-0036-05

2011-07- 08;

2011-09-08

教育部科技研究重点项目(109107);中国地质大学(武汉)中央高校基本科研业务费专项资金(CUG090109)

王艳妮(1984-),女,从事领域本体研究、数字矿山及三维地质建模方面的工作。E-mail:yanniemail@163.com

猜你喜欢
空间数据本体滑坡
滑坡推力隐式解与显式解对比分析——以河北某膨胀土滑坡为例
眼睛是“本体”
滑坡稳定性分析及处治方案
基于本体的机械产品工艺知识表示
浅谈公路滑坡治理
元数据驱动的多中心空间数据同步方法研究
“监管滑坡”比“渣土山”滑坡更可怕
基于文件系统的分布式海量空间数据高效存储与组织研究
专题
Care about the virtue moral education