基于本体的数字图书馆知识组织研究

2014-07-01 23:28王任栋
长春师范大学学报 2014年12期
关键词:本体定义概念

王任栋,宋 涛

(长春师范大学图书馆,吉林长春 130032)

基于本体的数字图书馆知识组织研究

王任栋,宋 涛

(长春师范大学图书馆,吉林长春 130032)

20世纪80年代末以来,在人工智能和知识工程等新兴领域里,本体逐渐被广泛应用,也引起了图书情报界的极大关注。数字图书馆知识组织构建模式研究在基于本体的前提下为知识组织在语义层面上拓展了一个崭新的领域,为实现信息服务的语义化和智能化奠定了基础。本文介绍并阐述了本体的形式化模型以及本体的具体功能、概念、特点,同时分析了本体作为一种能在知识层次和语义上描述概念体系的相关工具在进行数字图书馆知识组织中的不足,并提出了基于本体的知识组织模式及流程。

本体;数字图书馆;知识组织;构建模式

网络的发展为信息的利用生产和组织方式带来了重大革新,信息在网络资源极速增长的环境下变得混乱无序,出现了“信息激增”和“信息过载”现象。知识在如此庞大的信息环境中处于混乱无序的状态,这种状态严重影响用户对知识的利用。本着为用户提供最好服务的宗旨,数字图书馆应该对埋藏在海量信息中的知识进行组织。本文立足于现代信息增长现状,按照有效组织知识的原则,对数字图书馆基于本体的知识组织进行探讨。

1 数字图书馆知识组织的现存问题及基本现状

1.1 传统的主题法和分类法在数字图书馆知识组织中存在的不足

传统分类法和主题法为图书馆学知识组织做出了不可磨灭的贡献,但是在信息激增的网络环境中,分类法、主题法由于其结构固定,无法适应信息的多维行、动态性变化,难以适应信息增长的更新速度,尤其是对超媒体和超链接等多样的网络信息难以进行精确的组织与分类。

1.2 元数据在数字图书馆知识组织中体现出的不足

元数据是基于Web环境产生的,主要适用于HTML、XML等超文本文档,导致元数据在描述其它领域知识时有一定局限性。元数据不能完全解决信息系统中存在的语义结构差异问题,包括资源采用不同元数据方案所造成的微观结构的异构问题及资源对象之间存在的各种关系。其方案停留于信息集成,不能满足数字图书馆服务集成的需要。

2 基于本体的数字图书馆知识组织构建流程

Ontology称为本体论、实体论或存在论,是对自然存在及其本质的研究,属于行而上学论的分支。人工智能和信息科学等学科将Ontology的概念从哲学领域借用过来,一般翻译成“本体”。人工智能和信息科学领域里的不同专家学者对本体有不同的定义[1],被广泛认同的是美国斯坦福大学知识系统实验室的Gruber在1993年曾提出的“An ontology is a specifization of a conceptualization”(概念模型的明确的规范说明)[2]。

由于本体要为多个领域或单一领域间的关系提供语义路线图,因此只需要对一个领域进行构建。有必要把数字图书馆中的知识分为N个学科领域。当要引入某个学科M时,首先遍历整个数字图书馆中是否有与学科领域M完全符合的领域I(I=1,2,…,N),通过领域的知识本体的范围和目标来判断是否有可用的,如果有,此本体就可以重复使用;如果没有,可多次使用的本体则需要进行领域知识本体的设计。完成新的领域知识本体设计后对本体进行评价,如果符合标准,那么就实现这个领域知识本体;如果不符合标准,那么就回到本体的设计阶段重新开始设计,直到符合评价标准为止。当每个领域知识本体构建好以后,将它们汇集到一起,集成到数字图书馆中,如图1所示。

图1 基于本体的数字图书馆知识组织构建简图

2.1 领域知识本体的需求分析

需求分析是本体开发的开始,是从实际应用的特点、目标和规划出发而对本体系统进行的一种规范化描述。领域知识本体的需求分析应该注意需求分析的过程性、动态性、文档化。

2.2 领域知识本体的规划

2.2.1 领域知识的收集及其获取途径

此阶段的进行前提是在数字图书馆中不存在某一领域知识的可复用本体或可复用本体不符合该领域知识组织要求。一般有两个方法:其一,执行者作为该领域的资深从事者;其二,利用知识获取工具从数据库中提取。两者可以结合使用,先利用知识获取工具获取,再向资深从业者进行咨询。

2.2.2 列出重要术语和概念

在收集和获取领域知识后,列出所有的术语和概念,暂不考虑术语之间的关系,利用自然语言学的方法或者统计的方法来罗列领域内的术语和概念。

2.2.3 概念化

将每一个领域知识概念化,通常利用基于关联规则的方法、词典的方法、基于概念聚类的方法或基于模板的方法来确定概念之间的关系。

2.2.4 定义类与类等级体系

有常规方法用于定义类及其等级体系,分别是自顶向下法、自底向上法、综合自顶向下法和自底向上法。

2.2.5 定义类属性

定义类属性也称为槽。定义好一些类以后,则要开始描述这些类之间的内在结构。在定义类的时候用到一些术语,其它没有用到的术语可能就是这些类的属性。属性分为外在属性和内在属性两大类,外在属性是对类外在特征定义的概括与描述,内在属性则是对类自身内在特征的描述。为了能够全面揭示知识,需要将知识概念的内在属性和外在属性都予以定义并且赋予一定的值。

2.2.6 创建实例

在以上过程都完成之后,则需要定义等级体系中某类的下属实例。首先应该选择某一个类,其次创建该类的一个或多个具体实例,最后为该类添加赋值属性。

2.3 本体的评价

无论是对复用本还是新建立的本体,都应该有本体的评价。虽然目前没有统一的明确规范的本体评价标准,但是可以从本体的特征及功能来评价。具体可以从本体的完整性、清晰性、一致性、可拓展性、兼容性以及文本的完备性、准确性、可操作性等方面进行评价。

2.4 本体的实现

本体的实现就是利用相应的计算机语言将构建的领域知识本体从自然语言转换成机器可以理解的逻辑表达式。

2.5 本体的集成与管理维护

当各个学科领域知识本体构建好以后,把这些领域本体聚集在一起,构成数字图书馆关于各学科的本体知识库。阮冈纳赞曾说图书馆是一个生命着的有机体,同样,数字图书馆也是生命着的有机体。数字图书馆本体知识库需要时刻管理及维护,以适应各学科知识的增长情况。

[1]Gruber TR.A translation approach to portable ontology specifications[R].Stand for University,Tecrep:logic-92-1,1993.

[2]董慧,姜赢,等.基于数字图书馆的本体演化和知识管理研究(Ⅲ)——动态知识描述[J].情报学报,2009(5):643-650.

[3]徐晓梅,牛振东.数字图书馆的知识组织研究[J].现代图书情报技术,2007(10):1-6.

[4]毕强,鲍玉来.数字图书馆知识组织体系构建的发展路径——概念格与本体的互补融合[J].华中师范大学学报:人文社会科学版,2011(5):130-136.

[5]覃华兵.知识组织工具——本体研究[D].武汉:武汉大学,2005.

[6]蒋永福,李景正.论知识组织方法[J].中国图书馆学报,2001(1):3-7.

[7]田欣.基于知识本体的图书馆语义检索系统模型研究[J].情报杂志,2006(6):78-81.

[8]宋剑祥.从国外分类法看《中图法》对网络信息资源的组织[J].图书与情报,2004(2):58-61.

[9]张玉峰.智能信息系统[M].武汉:武汉大学出版社,2008:55-58,396-401.

On the Digital Library Knowledge Organization Based on Ontology

WANG Ren-dong, SONG Tao

(Library of Changchun Normal University, Changchun Jilin 130032, China)

Since the 1990s, ontology is widely used in artificial intelligence, knowledge engineering and other fields, and has aroused great concern in library and Information field. Digtial Library knowkedge organization in ontology-based model shows a new space to the konwledge organization which based on semantic, and lay a foundation for the semantization and intellectualization of information services. This article introduces the formalized model, concepts, functions and character of ontology, analyzes the shortage of ontology in digital library knowledge organization, and put forward the ontology-based knowledge organizating model and procedure.

ontology; digital library; knowledge organization; the mode of construction

2014-10-09

王任栋(1979- ),男,吉林长春人,长春师范大学图书馆网络技术部馆员,从事图书馆数字化、网络化研究。

G250

A

2095-7602(2014)06-0180-03

猜你喜欢
本体定义概念
Birdie Cup Coffee丰盛里概念店
眼睛是“本体”
幾樣概念店
学习集合概念『四步走』
聚焦集合的概念及应用
基于本体的机械产品工艺知识表示
成功的定义
修辞学的重大定义
专题
Care about the virtue moral education