基于元数据标准的语义化教育资源本体库构建与实现

2015-02-21 06:48冯瑶冯锡炜
电子设计工程 2015年18期
关键词:数据项资源库本体

冯瑶,冯锡炜

(辽宁石油化工大学 计算机与通信工程学院,辽宁 抚顺 113001)

基于元数据标准的语义化教育资源本体库构建与实现

冯瑶,冯锡炜

(辽宁石油化工大学 计算机与通信工程学院,辽宁 抚顺 113001)

为解决当前教育资源库在通用性和共享性的不足,结合CELTS元数据标准,利用本体技术设计了一个语义化的教育资源本体库。参照元数据标准构建教育资源本体,对学科领域知识进行语义分析和关联构建学科知识本体,对教育资源实例做语义标注,并通过推理机Jena实现了本体推理和查询。为教育资源库的语义搜索及智能服务奠定基础。

元数据标准;本体;教育资源;Jena

近年来E-Learning正被广泛关注,专业教育资源库建设对E-Learning有着非常重要的作用和意义。但当前Web上的各种教育资源良莠不齐,缺乏标准,不能很好的重用和共享;同时资源的知识组织缺乏语义关联,无法进行智能服务。

教育资源元数据能够对资源进行形式上以及内容上的描述,为教育资源标注提供了统一的标准。国外对其标准的研究开始于 20世纪 90年代,其中影响较大的有:IEEE LOM、ADL SCORM、Dublin DC。我国在2000年11月成立了全国信息技术标准化技术委员会教育分技术委员会(CELTSC, Chinese E-Learing Technology Standardization Committee),制定了符合我国国情的教育资源元数据标准 《CELTS-31学习对象元数据规范》[1]和《CELTS-41教育资源建设技术规范》[2]。本体作为语义Web的重要组成部分,是共享概念模型的明确的形式化规范说明[3]。本体不仅可以提供教育资源的组织框架,还可以反应教育资源相关领域的概念关系。

文中参考多个现有教育资源库及国家专业目录标准确定学科知识层次划分,以CELTS-31和CELTS-41两个教育资源元数据标准为蓝本,将元数据进行知识关联,利用本体技术,以“Java课程设计”为例,给出了一个语义化教育资源库本体库模型,并实现了推理和查询。

1 本体构建

文中参考CELTS元数据标准构建教育资源本体和学科知识本体。教育资源本体提供了描述资源的组织框架,通过这个框架来对资源进行标注。学科知识本体将学科知识中所有的概念划分,形成分类层次结构,并通过概念间的语义关联实现对资源的查询和检索。

1.1 CELTS标准

CELTS-31的核心也就是定义一组学习对象的基本数据元素,包括九大类别50多个元数据项,并根据元素的通用性确定了必须数据元素和可选数据元素[4]。九大类别包括:通用,生存期,元元数据,技术,教育,权利,关系,评注,分类[1]。每个类别下都有很多子元数据项,例如在“通用”下有“标识符”、“标题”、“聚合度”等描述项,用于集合了对学习对象进行整体描述的通用信息。同时,对于每一个描述项,都有数据大小、次序、取值范围、数据类型等约束。通过这些描述,可以对一个学习对象各方面信息进行全方位的展现。CELTS-41对教育资源重新明确划分为9类:案例,试卷,课件,媒体素材,文献资料,题库,常见问题解答,资源目录索引,网络课程[2]。本文参考CELTS-41的教育资源分类,再结合CELTS-31的通用数据模型,构建教育资源本体。

1.2 教育资源本体

通过对元数据项及其与教育资源间的关系进行分析和抽象,找出语义关联性,定义类及类的属性,建立教育资源本体。教育资源本体参考 CELTS-41确定类和层级,参考CELT-31确定类的属性关系。首先确定本体的类和层级,采用CELTS-41的标准对教育资源进行分类,包括案例、试卷等九大类作为本体的核心类,核心类下设子类。本文使用Protege4.3构建本体,用OWLViz插件以图的形式展示本体类的层级关系。如图1所示。

图1 教育资源本体核心类及部分子类Fig.1 Education resource ontology core classes and some subclasses

本体的类及层次确定以后,要确定本体类之间的属性关系。本体的属性分为数据属性 (DataProperty)和对象属性(ObjectProperty)两部分。数据属性(DataProperty)的主要内容是:名称(Name)、值域(Range)和定义域(Domain)。数据属性的值域为数据类型,例如 char型,float型等。对象属性(ObjectProperty)主要特征为:相同属性(Same_As)、互逆属性(Inverse)、相等属性(Equivalent_Property)、定义域(Domain)、值域(Range)和不同属性(Different_Froin),对象属性表示本体概念间的逻辑关系。

对CELTS-31的每一个子元数据项进行分析,若标准中规定元数据项的值为文字值(数字,字符型,日期等)时,该数据项作为数据属性。比如子元数据项 “标题”(title)、“标识符”(identify)、“日期”(date)、“语言”(language)、“位置”(location)、“最低版本”(minimumVersion),“最高版本”(maximumVersion)等作为数据属性;若元数据项连接两个资源实体时,定义为对象属性。比如“关系”元数据项下的“类型”子数据项描述了学习对象之间的关系,例如 “部分关系”(haspart)、“版本关系”(isversionof)、“参考关系”(isreferenceby)等,将它们作为对象属性。资源与知识点之间的关系hasConcept也定义为对象属性。

1.3 学科知识本体

学科知识本体分为学科层次领域本体和课程知识点本体。学科层次领域本体对学科层次进行划分。以计算机学科领域为例,本文参考国家《学位授予和人才培养学科目录》、《学科分类与代码国家标准表》,结合所在学校本科生培养计划以及本科生、研究生课程,确定了计算机学科领域的层次划分,将计算机学科分为计算机基础、人工智能、计算机系统结构、计算机软件、计算机应用5个大方向类。每个大方向类下面还有小方向类,其中计算机软件类下设操作系统、程序设计语言、数据库3个小方向子类,程序设计语言子类又下设一些课程子类。

课程知识点本体将课程划分为具体知识点集并对其进行语义关联,通过知识点间的语义关联可以实现对资源的推理和查询。本文以程序设计语言类下的课程 《JAVA程序设计》为例,构造课程知识点本体,参考国内多本JAVA程序设计教材以及网络课程,将知识对象划分为顶层核心知识点集、第一级子知识点集,二级子知识点集,并归纳出九个顶层知识点类,分别是程序基础、面向对象、异常处理、集合与泛型、多线程、I/O流、图形界面、网络编程、数据库编程。一、二级子知识点类100多个,基本覆盖整个《JAVA程序设计》课程的全部知识内容,如图2所示。

图2 《Java程序设计》课程知识点本体(部分)Fig.2 Part of the“Javaprogramming”course knowledge ontology

根据课程特点,对知识点间关系进行分析抽象,确定本体类的属性关系。将《JAVA程序设计》课程知识点本体的数据属性定义为知识点的描述 (discription)、 学科层次(subjectLevel)、重要程度 (significanceLevel)、难度级别(difficultLevel)等。同时定义了该课程本体的类之间的同位关系(hasParaconcept)、父子关系(hasSubconcept)、依赖关系(hasPreconcept)3种最基本的关系以及知识点与资源之间的关系(hasResource)作为对象属性。类和属性建立之后,用实例对本体进行填充。知识点实例如图3所示。

图3 《Java程序设计》课程知识点本体实例Fig.3 “Java programming”course knowledge ontology instances

1.4 语义标注

本体构建后,需要将教育资源本体同课程知识点本体间建立关联关系,将资源实例同知识点关联起来。在课程知识点本体中使用对象属性 hasResource实现从知识点到教育资源的关联,在资源本体中使用对象属性 hasConcept实现从教育资源到知识点的关联,用本体对资源进行语义标注,形成资源实例库。如图4所示。

图4 教育资源语义标注Fig.4 Education resource semantic annotation

2 本体查询和推理

Jena[5]是HP实验室开发的语义Web应用程序开发包,用于支持语义网应用程序开发。它可以解析RDF、RDFS、OWL等基于XML语法的文件进行解析,且提供了相应的API函数,能够操纵与检索本体模型,同时也提供基于规则的推理机。SPARQL[6]的查询规范已经成为W3C的推荐标准,其相对于本体的作用类似于 SQL对于关系数据库的重要性,是对RDF、OWL本体进行查询的首选语言[7-9]。但SPARQL无法进行语义推理,如果想得到更为全面准确的检索,可通过制定推理规则并建立推理模型。

本体推理和查询过程如下:

1)装载模型:

2)自定义推理规则:

3 语义查询结果分析

为验证该方法的可行性,本系统搜集了100个Java程序设计的不同类型的资源,包括文档、视频、音频等,用protégé4.3按照1.4节介绍的方法对资源作语义标注。以Java语言为基础,用Jena API(V2.6.2)作为本体推理和查询开发包,考查资源的查全率和查准率。

查全率=(查出的相关资源数量/查询系统中相关资源总量)×100﹪

查准率=(查出的相关资源数量/查出的资源总量)×100

以查询“面向对象”的资源为例,资源库中与“面向对象”相关的资源35个。为便于比较,我们将传统的关键字查询与语义查询作对比,查询结果如表1所示。

表1 实验结果比较Tab.1 The experimental results to compare

对实验结果进行分析,查全率方面,由于视频等媒体资源较多,所以采用普通的关键字查询查全率不高,而语义查询通过领域本体对资源做了语义标注,能够查询到不同类型的资源,查全率较高。查准率方面,关键字查询时只匹配关键字词汇,相关的资源因为没有匹配关键词汇未被查询出来,查准率不高。而语义查询能够查询到与查询词同义概念,上下位概念的所有资源,查准率较高。

4 结束语

本文提出了基于元数据标准的高校教育资源库语义模型系统,建立了教育资源本体和学科知识本体构成的教育资源本体库,对教育资源进行语义标注形成资源库,并对资源库提供语义查询服务。但是文中的语义查询依赖于本体、资源语义标注以及推理规则的构建,而且本文的资源库规模较小,因此针对较大规模资源库的本体构建,并且在此基础上进行语义搜索等个性化服务是下一步要研究的目标。

[1]信息技术标准化技术委员会教育分技术委员会.CELTS-31学习对象元数据标准[EB/OL].[2012-08-13].http://www.celtsc.edu.cn/content/jxzyl/40288b88391ed5fd01391eddc93d0014.html.

[2]信息技术标准化技术委员会教育分技术委员会.CELT-41教育资源建设技术规范[EB/OL].[2012-08-13].http://www.celtsc.edu.cn/content/jxzyl/40288b88391ed5fd01391edbb05d000e.html.

[3]Knowledge System Laboratory,Stanford University.What is an ontology[EB/OL].[2011-05-10].http://www-ksl.stanford.edu/kst/what-is-an-ontology.html.

[4]张静鹏.基于语义web服务的个性化网络学习资源服务系统构建研究[D].吉林:东北师范大学,2010.

[5]HP LABS.Jena-A Semantic Web Framework for Java[EB/OL].[2011-09-25.]http://jena.sourceforge.net/index.html.

[6]Eric P,Andy S.World Wide Web Consortium.SPARQL query language[EB/OL].[2011-05-12].http://www.w3.org/TR/rdfsparql-query/.

[7]纪兆辉.本体的查询与推理研究[J].微电子学与计算机, 2011,10(28):52-55.JI Zhao-hui.Research on ontology querying and inference[J].Microelectronics&Computer,2011,10(28):52-55.

[8]臧强,程立.基于ASP技术和SQL数据库的成绩查询系统的设计与实现[J].电子设计工程,2014(3):45-47,51 ZANG Qiang,CHENG Li.Designandimplementationof achievement inquires system based on ASP technology and SQL database[J].Electronic Design Engineering,2014(3): 45-47,51.

[9]吕琼帅,张国平.基于NoSQL的全文检索系统研究[J].电子设计工程,2014(22):49-51,55.LV Qiong-shuai,ZHANG Guo-ping.The research of full-text retrieval system based on NoSQL [J].Electronic Design Engineering,2014(22):49-51,55.

Construction and implementation of semantised education resources ontology libraries based on metadata standard

FENG Yao,FENG Xi-wei
(Computer and Communication Engineering College,Liaoning Shihua University,Fushun 113001,China)

In order to solve the absence of generality and sharing of the current education resources,Combining with the CELTS metadata standards,Semantised College Education Resources Ontology Libraries is designed in this paper using ontology technology.Construct education resources ontology by reference to metadata standard and Subject knowledge ontology by reference to Knowledge and semantic analysis in the subject area,and do semantic annotation of education resource instances.Then the ontology inference and query is realized by combining the ontology reasoning machine Jena.This will lay the foundation for education resources semantic search and intelligent services.

metadata standards;ontology;education resources;Jena

TN711

:A

:1674-6236(2015)18-0012-04

2014-12-08稿件编号:201412071

辽宁省普通高等学校本科教育教学改革研究项目(UPRP20140914);辽宁省教育科学“十二五”规划立项课题(JG13DB077)

冯 瑶(1982—),女,辽宁抚顺人,硕士。研究方向:语义网,知识工程。

猜你喜欢
数据项资源库本体
健身气功开放课程资源库建设研究
眼睛是“本体”
一种多功能抽签选择器软件系统设计与实现
非完整数据库Skyline-join查询*
贵州●石斛种质资源库
基于Python的Asterix Cat 021数据格式解析分析与实现
基于共享资源库的混合式教学考核模式研究
基于本体的机械产品工艺知识表示
高中历史信息化教育资源库应用探索
专题