基于NeOn Toolkit的本体重用方法实例研究*

2013-11-08 03:11纪姗姗
图书与情报 2013年1期
关键词:本体实例语义

毕 琳 张 莹 纪姗姗

(1.中科院国家科学图书馆 北京 100190)(2.长春理工大学 吉林长春 130022)(3.中国科学院大学 北京 100049)(4.中科院长春光学精密机械与物理研究所 吉林长春 130033)

网络技术的应用为人们提供了极其方便的信息服务,改变了人们获取信息的途径和方式,也改变了很多人的生活方式。但是随着信息数量的增长,网络信息的有效组织和语义理解已成为亟待解决的问题。本体技术是解决上述问题的有效途径,本体可将所有信息的元数据进行统一的表示,实现网络信息的语义化表达。但是本体的建模与开发本身是一项系统性较强、投入量较大的工程。通过重用已有的本体,能够减少系统的开销,避免重复建设。重用的思想和理论,在软件开发领域已经比较成熟,但是对于本体这种特殊知识表示形式的重用,还属于比较前沿和新兴的研究内容。

本文通过使用NeOn Toolkit工具,以从网络获取到的本体实例为分析对象,实现自动化的本体重用,并利用SPARQL对重用后的本体实现语义推理,最后分析目前针对大规模本体重用存在的问题。

1 NeOn Toolkit介绍

2006年,由14个欧盟机构参与、受欧盟第六框架计划资助的NeOn(Networked Ontologies)项目开始研究如何有效利用本体实现分布式大规模语义应用,并发展了本体工具和相应方法。NeOn Toolkit是NeOn项目开发的基于Java的开源本体编辑工具,NeOn Toolkit平台及其丰富的插件可以帮助本体开发人员和本领域专家完成各种各样的本体工程活动,包括注释和文档、人机交互、模块化和定制、本体调试、本体动力学、本体评估、本体匹配、本体论规范、推理及重用等。目前最新版本是2011年12月推出的 NeOn Toolkit-2.5.2。

在NeOn Toolkit中,对OWL语言描述的本体,从概念(Classes),对象属性(Object Properties),数据属性(Bata Properties), 注 释 (Annotation Properties), 数 据 类 型(atatypes)五个方面加以描述(见图 1)。

图1 NeOn Toolkit平台对本体的描述

本文主要以Location和Building本体为例,结合本体管理的实际需求,利用NeOn Toolkit平台丰富的功能,实现本体重用与本体推理。利用NeOn Toolkit实现地理位置本体的管理,比利用关系数据库存储地理信息有着明显的优势:NeOn Toolkit支持简单的逻辑推理,还支持复杂的知识表达,因此,它更接近人类的知识表达;而数据库数据实例和列名定义是相互独立的,数据结构建模较为单一,无法全面表示实例之间复杂的隐性关系。

2 本体重用简介

在人工智能界,最早给出Ontology定义的是Neches等人,他认为“本体定义了组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则”。但其中最著名并被引用得最为广泛的定义是由T.Gruber提出的“本体是概念化的明确的规范说明”。本体的作用就是对客观世界进行抽象的描述,并实现概念层次的统一性。本体和本体工程吸引了来自不同领域的学者和研究人员,已经逐步成为信息领域的一个研究热点。

从零开始构建本体是一项需要大量投入的工程,随着信息技术的发展,本体在自然语言理解、知识表示与获取、数据集成和信息检索等多个方向上得到了广泛的应用,越来越多的人研究本体,网络当中的本体数量与日俱增,本体重用就是根据不同实际需求,利用这些已有的本体,构成新的本体的过程。通过以后本体的重用,能够减少系统的开销避免重复建设。本体重用的思想和理论是近年发展起来的,属于比较前沿和新兴的研究内容。国内外在该领域的研究集中在:本体模块化、本体上下文、本体演化、本体缓存与语义缓存等方面。本文则主要是利用NeOn Toolkit平台,实现本体重用的实践过程。

3 利用NeOn Toolkit实现本体重用

本文实现本体重用的过程,选择了ASTRA项目当中产出的Location和Building两个本体作为源本体。由Ioannis Zaharakis担任项目经理的ASTRA项目旨在通过建立泛在认知系统框架,用以支持对人类社会关系的建模。该框架包括指导并支持社会交流的泛在认知系统设计和评价的理论,以及支持该系统应用的工具和服务。其中Location和Building两个本体在系统中用以定位人类社会活动的位置。本文通过对这两个已有本体的重用,阐述利用NeOn Toolkit平台本体重用的过程,并对重用后产生的目标本体,进行逻辑推理及查询。本文采用的方法适用于各种OWL格式所描述的本体数据。

3.1 实验环境配置

首先,在计算机当中配置Java运行环境。

然后,分析用于重用的本体资源。在本文中选用的位置本体Location.owl将地理位置信息概况为以下几个关键 概 念 :Continent、Federation、Country、Province、City、Quarter、 Building 、Room、Place,并且辅以属性、关系、实例等相关信息的描述(对于Location.owl的关键概念之间上位superlocation_of、下位sublocation_of以及继承isa关系描述见图2)。

图2 Location.owl关键概念之间的关系

对于Location.owl中的building概念,可以为其添加更为丰富的语义关系,所以选用Buliding.owl本体,将Location.owl和Buliding.owl整合为一个新的目标本体(对于Buliding.owl的关键概念之间的关系描述见图3)。

图3 Buliding.owl关键概念之间关系

3.2 本体重用过程

调用 NeOn Toolkit,将 Location.owl和 Buliding.owl作为源本体输入本体整合程序(整合操作见图4,整合后产出的目标本体层次结构及上下位关系见图5)。目标本体对原来Location本体中的building信息进行了扩展,所以对地理位置信息的描述更加精确,在包含了Buliding.owl中信息之外,同时对上位、下位及继承关系都做了重新调整。

图4 Location.owl和Buliding.owl整合操作

图5 目标本体层次结构图

对于目标本体,为了测试其是否保证了推理逻辑合理性,可以使用NeOn Toolkit的推理测试功能。NeOn Toolkit平台支持标准本体查询语言SPARQL(Simple Protocol and RDF Query Language), 允 许 用 户 通 过SPARQL语法查询本体。SPARQL是为RDF开发的一种查询语言和数据获取协议,它是为W3C所开发的RDF数据模型所定义,但是可以用于任何可以用RDF来表示的信息资源。

根据目标本体关键概念、属性及实例关系,设计以下的推理测试用例:

(1)为目标本体中的关键概念Person添加实例A和B(添加方法见图 6)。

图6 对目标本体添加实例

(2)A和B的办公地址实例分别为 (添加方法同图6):A (Room:301;Building:Star;);B (Building:Star;City:Beijing)。其中,Room 与 Building存在sublocation_of关系,Building和City存在sublocation_of关系。

采用SPARQL对目标进行查询,代码如下:

输出推理查询的结果如下:

从以上结果中可以得出:在City概念实例Beijing的人有A和B。

由于A的声明中并无城市描述,推理机通过对目标本体的推理,实现了关于A所在城市的推测。重用后的本体符合简单推理规则,由于篇幅有限,对于目标本体的推理测试仅举一例。然而对于对大规模本体重用来说,由于关键概念之间的关系错综复杂,这就为对目标本体推理规则的设计带来了困难。现在在本体重用这一领域,还没有完整的关于推理测试的形式化的表示和操作方法。可见,对于大规模本体重用,推理规则的设计仍有待进一步研究。

4 结语

随着网络信息的急剧增长,对网络信息的有效管理成为人工智能及网络信息技术等领域的研究热点。本体作为客观世界概念化的明确的规范说明,是解决信息组织及语义表达问题的有效途径,但从零开始构建本体的工程量非常巨大,所以对已有本体的重用是提高本体利用效率的有效方法。本文以ASTRA项目当中产出的Location.owl和Building.owl两个本体作为源本体,通过使用NeOn Toolkit平台,实现自动化的本体重用,并利用SPARQL对重用后的本体实现语义推理,实验结果证明利用本文方法实现本体重用方法有效。但是,对大规模的本体重用的研究还不十分成熟,尤其是对于重用后的本体推理问题的研究,缺乏深入的探讨,以及完备的测试方法。

[1]Welcome to the NeOn Project [EB/OL].[2010-02-24].http://www.neon-project.org/nw/Welcome_to_the_NeOn_Project.

[2]Gruber T R.A Translation Approach to Portable OntologySpecifications [J].Knowledge Acquisition,1993, (5):199-220.

[3]毛郁欣.面向大规模本体重用的子本体模型研究[D].杭州:浙江大学,2008.

[4]ASTRA Platform and End User tools code now available[EB/OL].[2009-12-14]http://www.astra-project.net

[5]SparQL[EB/OL].[2012-05-28].http://baike.baidu.com/view/661304.htm.

猜你喜欢
本体实例语义
继齐韵往昔,以今声开来——思考自五音戏主奏乐器的演变、本体及延伸
眼睛是“本体”
一种新型水平移动式折叠手术床
汉语依凭介词的语义范畴
完形填空Ⅱ
完形填空Ⅰ
Care about the virtue moral education