邹军华
摘要 在知识工程方法建立本体的基础上,阐述建立课程本体的详细步骤,并以OWL为本体构建语言,给出“数据库原理”课程的部分课程本体实例。
关键词 课程本体;OWL;数据库原理
中图分类号:TP391 文献标识码:A 文章编号:1671-489X(2009)06-0026-02
Creation and Description of Course Ontology//Zou Junhua
Abstract Based on the ontology creation methodology of knowledge engineering, this article describes the steps of course ontology creation, and gives a case of creating course ontology.
Key words course ontology;OWL;database principle
Authors address Faculty of education, Hubei University, Wuhan 430062
本体已经成为人工智能和知识工程中一种重要的工具,在知识的获取、表示、分析和应用等方面具有重要的意义。本体研究促进知识工程中对本质知识的获取[1-2]。本体是语义的基础,可以为语义Web成功增值[3]。作为一种知识表示方法,本体与谓词逻辑、框架等其他方法的区别在于它们属于不同层次的知识表示方法。本体表达了概念的结构、概念之间的关系等领域实体的固有特征。本体表述的语义更明确、一致和规范,因此也更有利于知识的表达、交流和共享。
1 本体构建的方法
知识工程方法通过7个步骤完成本体的开发:确定本体的领域范围和使用目的、重用已有的本体、穷举该本体中的重要的词汇、定义类和类的层次结构、定义类的属性、定义类属性的值域、创建实例。在该方法中,步骤4~6通常需要同时进行,相辅相成。如何将已有的词汇区分是否是类或者类的属性是一项复杂的工作。本文在这个方法的基础上,针对课程的特点,提出课程本体的开发方法。
1.1 重用已有的本体和专业叙词表在开发新的本体前,从目前在进行或者已完成的相关工作中学习,并且从已有的资源中进行提取和扩充。在已有本体的基础上进行改进比创建新的本体要容易得多,因此,重用已有的本体非常重要。目前在网络上已经有不少成熟的本体资源可以使用,如Ontolingua本体库、DAML本体库、WordNet;同时还有很多公开的商业性质的本体资源,如UNSPSC、RosettaNet、DMOZ等。
除了应用已有的本体资源,还可以利用专业叙词表、术语词典等。专业叙词表和术语词典,不但包含该领域中相对完整的术语,而且都经过领域专家多年的有序组织,不仅可以为领域Ontology中概念的创建提供指导,而且叙词表中的限义词、含义注释、等级关系、词间关系,也为领域Ontology概念中的属性、实例以及关系的创建提供了线索及指导。专业叙词表和术语词典是构建课程本体的必备基础。
1.2 从课程中提取重要的概念和术语该步骤主要列出课程中最基本、最有代表性的术语,那些需要被学生了解和学习的概念以及需要注释和解释的词汇。需要指出的是,在这个步骤中只需要穷举出所有可能重要术语,不必考虑概念是否重叠,也不必考虑概念之间的关系和属性。
1.3 定义课程本体之间的通用关系从语义上讲,概念间主要有4种基本关系:attribute of(高度是桌子的属性)、instance of(实例与概念之间的关系)、kind of(家用计算机是计算机的一种)和part of(CPU是计算机的组成部分)。根据这4种基本关系,本文给出本体之间的通用关系(如表1所示)。
1.4 挖掘课程本体中的特殊关系结合特定的课程,分析和挖掘出特殊的关系和属性。如“数据库原理”中的数据库设计部分,数据库设计的6个步骤:需求分析、概念设计、逻辑结构设计、数据库物理设计、数据库实施和数据库运行维护。这些概念之间的关系就可以用一个新的关系——前驱(后继)关系——来描述。
1.5 分析、改进和评价改进是构建课程本体过程的一个组成部分,在构建的过程中不断改进原有的结构,在不断改进的过程中构建起整体的结构。改进的方法包括合并、编辑及自然语言处理的一些方法。在改进的过程中要注意系统整体的一致性。对本体进行分析和评价,确定本体结构是否能准确反应出课程本体的本质和联系。分析、评价与改进共同构成本体的维护过程。
2 用OWL描述课程本体
2.1 OWL本体描述语言面向网络的本体语言OWL(Web Ontology Language),是W3C组织推荐的国际通用的标准本体描述语言。它建立在XML/RDF(Resource Description Frame)等已有标准基础上,通过添加大量的基于描述逻辑的语义原语来描述和构建各种本体。所以基于OWL建立的本体有很丰富的语义表达能力并具有完善的推理机制,比之用其他本体描述语言(如XML、RDFS)建立的本体能更清晰完整地表达领域内的概念和概念之间的联系。OWL有3个表达能力递增的子语言:OWL Lite,OWL DL和OWL Full。OWL Lite是表达能力最弱的子语言,提供类分层的能力和简单的约束功能。OWL DL在可判定性的前提下,提供尽可能大的表达能力,但在某些表达方面仍有一些限制。OWL Full包含OWL的全部语言构造成分并取消OWL DL中的限制[4]。
2.2 用OWL描述“数据库原理”课程本体“数据库原理”是计算机、信息管理与信息系统、工业工程以及电子商务等专业的必修课程,所以本文选取这门课程作为范例。由于篇幅所限,本文仅以这门课程中的数据模型为例来说明如何用OWL来描述课程本体[5],以便学生更好地理解各个概念以及概念之间的关系。
1)定义数据模型类。
<owl:Classrdf:ID= “数据模型”>
<owl:ObjectPropertyrdf:ID= “数据结构”>
</owl:ObjectProperty >
<owl:ObjectPropertyrdf:ID= “数据操作”>
</owl:ObjectProperty>
<owl:ObjectPropertyrdf:ID= “完整性约束”>
</owl:ObjectProperty>
</owl:Class>
上述定义表示的语义是数据模型有3个属性:数据结构、数据操作和完整性约束。
2)定义关系模型类。
<owl:Classrdf:ID= “关系模型”>
<rdfs:SubClassOfrdf:ID= “数据模型”>
<owl:ObjectPropertyrdf:ID= “关系数据结构”>
</owl:ObjectProperty >
<owl:ObjectPropertyrdf:ID= “关系操作”>
</owl:ObjectProperty >
<owl:ObjectPropertyrdf:ID= “关系完整性约束”>
</owl:ObjectProperty>
</owl:Class>
上述定义表示的语义是关系模型,是数据模型的子类,它是数据模型之一,与数据模型之间的关系是继承关系,反映的是概念之间的层次关系,并且关系模型由关系数据结构、关系操作和关系完整性约束3个要素组成。
3 结束语
目前关于本体的研究愈来愈受到重视,研究的重点多集中于领域本体的建设上面。用本体来描述课程的概念以及概念之间的关系,将会促进学生的理解,也会方便教师的教学,具有很好的理论和实践价值。但是,在课程本体的创建过程中,还有很多问题有待探讨和解决,比如动态知识的描述以及课程本体的自动创建等。本文在知识工程方法建立本体的基础上,阐述建立课程本体的可行步骤,并且给出数据模型的课程本体实例。
参考文献
[1]李善平,等.本体论研究综述[J].计算机研究与发展,2004(7):41-44
[2]杜小勇,李曼,王珊.本体学习研究综述[J].软件学报,2006(9):1 837-1 847
[3]何琳.领域本体的关系抽取研究[J].现代图书情报技术,2008(4):35-38
[4]OWL Web Ontology Language[EB/OL].http://www.w3c.org/TR/owl-features/
[5]王珊,陈红.数据库系统原理教程[M].北京:清华大学出版社,1998:9-30