陶宇炜 谢爱娟 封红旗
摘 要:文章依据语义Web的理论与技术,结合教育资源建设技术规范(CELTS-41),构建了基于语义Web的高校网络教育资源组织架构,以实现网络教育资源语义互操作、资源协作支持与深层语义的知识发现。
关键词:语义环境;网络教育;组织模式
中图分类号:G640 文献标识码:A 文章编号:1002-4107(2016)07-0053-03 我国的网络教育在促进高等教育信息化建设中发挥了重要作用。国内高校投入资金、技术和人员,从基础设施建设,到教育信息技术平台、网络教育管理信息系统建设,为师生提供课件发布、在线答疑、布置和提交作业等网络教育资源服务。然而,从对本科类和高职类国家精品课程的网络资源使用调查情况看,许多精品课程资源制作质量较低,使用烦琐,互动效果不佳,以致网络教育资源实际利用率较低,有的甚至处于闲置状态。
为此,借鉴语义Web理论和技术,对分布、异构的网络教育资源进行语义标注和资源本体的构建,在网络教育资源之间建立语义关联,实现资源交互和推送服务,有效解决网络教育资源瓶颈问题。
一、语义Web的内涵及特点
语义Web是对现有互联网的扩展和延伸,将网络资源以层次化结构加以定义和描述,解决分布、异构网络资源之间互操作问题。语义Web包括基础设施层、元数据层、本体层、代理层。基础设施层包括组成语义Web的资源的存储、访问方式和语法表达。基础设施层的Unicode使用国际通用的字符集处理网络资源的统一编码。URI(统一资源标识符)用于标识网络资源名称及其属性。元数据层提供网络资源类型、属性及其关系的规范性描述。元数据层的XML+NS(命名空间)+XML Schema以结构化语法描述网络资源数据内容和结构信息。RDF和RDF Schema提供描述网络资源及资源之间相互关系的语义模型。本体层在元数据层基础上定义网络资源概念及概念之间的逻辑关系。本体层的Ontology(本体)描述网络资源及资源之间的语义关系,在人机之间形成同一概念语义上的一致。代理层表达语义Web的安全和信任机制。代理层的Logic提供基于本体层的公理和推理规则,进行基于语义的搜索和服务。Proof为执行Logic的推理规则提供认证机制。Trust采用加密和安全机制,确保网络资源的可信任度和资源交互的安全性。
XML(可扩展标记语言)、RDF(资源描述框架)、Ontology作为资源表示方法已经被广泛应用[1],它们定义了计算机可理解的类及属性等,并用唯一的资源标识符进行资源标注,为在更高层次进行异构系统交互、资源互联和共享、提升网络资源发现、传递质量提供了新的途径[2]。基于XML和RDF/RDF Schema,语义Web提供本体和逻辑推理规则,实现网络资源的语义标注和推理,将网络资源有效地分类、继承、协作和组织,能够实现网络资源共享和应用集成。
二、网络教育资源的语义描述
网络教育资源具有分散、松散耦合、表现形式多样、动态性强的特点。实现网络教育资源的交互和共享,必须建立网络教育资源统一标准(规范),对网络教育资源进行语义描述。目前,网络教育资源语义描述通常采用资源元数据和资源本体。
(一)元数据
元数据提供网络教育资源数据的规范化描述。元数据定义网络教育资源的所有数据元素。元素是资源的内容、格式及属性的描述符,如都柏林核心元数据集描述网络教育资源的标题、创建者、关键词等属性。
XML和RDF是网络教育资源元数据描述采用的方式[3]。可扩展标记语言XML定义网络教育资源的结构。XML支持NameSpace(命名空间),网络教育资源可以定义为特定的URI,较好地支持分布资源描述和多重语义集成。
资源描述框架RDF提供描述网络教育资源的概念和概念间关系的模型。RDF三元组(主体、属性和客体)对应于资源名称、资源属性和属性值。在RDF基础上制订的RDF Schema规范化表示资源的抽象层次和概念结构,支持构建资源本体。
(二)本体
本体是对应用领域中的共享概念模型的明确的形式化规范性说明[4]。本体通过定义共享的、通用的应用领域的概念以及概念之间的关系,描述应用领域概念的语义,为实现人和计算机之间的双向和多向交流提供通用的规范,解决可扩展标记语言XML和资源描述框架RDF对网络教育资源概念描述上产生的歧义。
本体是解决网络教育资源共享、系统互联的关键。通过本体提供语义Web标注网络教育资源的元数据,使网络教育资源表达一定的语义信息,支持搜索引擎、智能代理等应用程序;应用程序通过对本体的解析、本体自身的推理能力理解网络教育资源语义信息,提供基于语义信息理解的智能服务。本体描述语言OWL通过定义良好的语法和语义,支持有效推理表达能力,较好实现网络教育资源的语义表达和语义推理[5]。
三、网络教育资源的元数据标准
从20世纪90年代中期开始,国际标准化组织相继发布的教育资源元数据标准主要有DC(Dublin Core,都柏林核心)元数据标准、LOM(Learning Object Metadata,学习对象元数据)规范、Learning Resource Metadata(学习资源元数据)标准,为网络教育资源的交互提供了技术支持。
我国借鉴国际标准化组织发布的教育资源元数据标准,结合我国教育信息化发展状况,建立了教育信息化技术标准体系(CELTS)。《教育资源建设技术规范》(CELTS-41)以LOM规范为核心,定义了教育资源元数据的具体结构,包括必须数据元素(LOM核心集),通用可选数据元素,与某类资源属性相关的分类扩展数据元素[6]。对我国的网络教育资源建设、管理和应用具有重要的指导作用。
四、高校网络教育资源的组织框架
按照教育资源元数据标准,结合语义Web层次架构,通过对网络教育资源元数据进行语义描述和网络教育资源本体构建,建立网络教育资源概念与概念之间的关联关系,形成网络教育资源知识库,利用SiLRi推理引擎等工具提供的智能服务,如智能检索、分类查询、智能代理等,最终实现对分布、异构的网络教育资源的交互、共享和重用。基于语义Web的网络教育资源组织架构如图1所示。
(一)网络教育资源的语义标注
教育资源库中存储的网络教育资源包括课件类资源(如PPT、Flash文件)、文档类资源(如Word、Excel、PDF 文件)、媒体类资源(如图片、音频、视频文件)等。网络教育资源组织架构首先对资源进行必要的格式化预处理(关键词提取),按照《教育资源建设技术规范》(CELTS-41),将网络教育资源的标题(Title)、作者(author)、关键词(Keywords)、资源类型(Type)、资源描述(Description)、资源大小(Size)、发布日期(Date)等作为必须数据元素,定义网络教育资源元数据实例结构,形成资源元数据库。
其次,利用本体在网络教育资源元数据之间形成的自动映射机制,建立网络教育资源对象、属性及资源对象之间的复杂语义关联关系,构建网络教育资源知识结构的本体概念模型。通过对网络教育资源进行基于语义的抽象、描述和标注,将不同类型、领域知识的网络教育资源组织成知识网络。
最后,将经过预处理的网络教育资源获得的语义信息存入资源知识库,利用搜索引擎开展语义内容重构,形成学科领域知识网络,实现知识资源语义层面组织。
(二)网络教育资源的本体管理
网络教育资源本体管理包括网络教育资源本体的构建、一致性检验、本体解析、本体存储等。
网络教育资源库的资源进行语义标注后,自动生成相应的标注xml文档,存储在资源本体库。从资源本体库可以获取资源语义信息和概念之间的关系。经过语义标注的资源语义信息作为资源本体中各类资源的实例,这样就在资源元数据和资源本体中的实例间建立起映射关系。
对几种代表性的本体构建方法,如TOVE(Toronto Virtual Enterprise)企业建模法、骨架法(Skeletal法)、METHONTOLOGY法、KACTUS工程法、SENSUS法、IDEF-5法、知识工程法(七步法)按软件开发周期各流程进行分析比较发现,知识工程法(七步法)成熟度较高[7]。所以网络教育资源本体的构建采用知识工程法(七步法),将资源元数据和本体构建过程建立对应的映射关系[8]。
知识工程法(七步法)构建本体的步骤为:(1)以CELTS-41《教育资源建设技术规范》为网络教育资源元数据方案确定本体领域和范围;(2)考虑复用已有的资源本体库,与现有资源本体库建立映射关系;(3)从资源元数据中提取资源数据元素和分类信息,列出资源本体中的重要概念;(4)根据资源元数据的分类,定义相应的类和类的层次体系,如文本类、媒体类等;(5)定义类的属性(对象属性、数据属性和注释属性);(6)对资源数据元素属性进行约束,如类型、值域范围等;(7)构建资源本体中类的实例和属性关系。
按照知识工程法(七步法),采用本体编辑系统Protégé4.3进行本体概念类、关系、属性和实例构建教育资源本体,使用支持本体描述语言OWL的本体编辑系统Protégé4.3集成的HermiT推理机对资源本体进行一致性检验,没有出现本体语义冲突等情况,经过推理得到资源本体概念类的实例。
本体信息通过本体解析以OWL(Web本体语言)文件存储在网络教育资源本体库,本体解析工具Jean提供了操作RDF/RDFS和OWL的API(应用程序编程接口),以及基于规则的推理引擎编程环境[9]。本体解析通过读取网络教育资源本体,使计算机理解资源本体结构,资源本体概念和概念之间的关系,以及资源本体概念的属性和属性的取值范围。
本体的存储方式有基于OWL文件的存储、基于XML数据库的存储和基于RDF数据库的存储三种。本体编辑系统Protégé4.3生成OWL文件存储本体信息,并支持RDF数据库存储。本体解析工具Jean提供数据库存储本体的接口,导入OWL本体,存储到数据库中,并通过数据库访问本体数据。
(三)网络教育资源的推送服务
网络教育资源推送服务是将存储在资源知识库中的知识及知识间的关系以语义图的方式呈现给资源使用者,包括语义分析、语义匹配、推理引擎、服务接口等模块。
资源使用者输入资源查询信息后,资源服务接口提供目录检索和智能推送两种方式。目录检索是资源使用者通过资源目录(或知识地图)的方式来获得相应的资源;智能推送是结合资源使用者使用行为日志(语义词搜索、页面浏览等),依据网络教育资源本体,使用协同过滤推荐算法[10],为资源使用者主动推送相关网络教育资源的方式。
语义分析将资源使用者输入或从资源目录提取的关键词按照资源本体术语表进行标准化处理后,采用前驱、后继、相关、平行等方式进行语义扩展,实现知识资源的推送,提供资源使用者更丰富、高度相关的资源内容。
语义匹配采用基于本体的匹配器进行匹配操作[11]。网络教育资源本体将资源内容列表和使用需求分开描述,为资源内容列表和使用需求定义一定的匹配规则,确保匹配结果的完整和准确。资源提供者根据查询请求,将网络教育资源提交给匹配器,匹配器接收资源使用者提交的请求后,利用匹配规则识别与使用需求相符的资源描述,查找相关的资源,并进行排序,返回资源使用者。
推理引擎采用SiLRi[12],SiLRi是基于Java语言开发的采用RDF元数据推理的轻线程推理数据库,允许在资源检索式中合并事实查询和资源本体概念,是较为理想的推理机制。
五、总结
通过引入语义Web理论和技术,依据《教育资源建设技术规范》(CELTS-41),利用元数据和本体进行网络教育资源语义标注。采用知识工程法(七步法)构建网络教育资源本体,将分布存储、松散耦合、形式多样的网络教育资源相互关联,结合资源本体解析、资源语义分析、资源语义匹配和推理,实现符合使用需求的资源推送。对于解决网络教育资源多种异构、多重语义等引发的资源匮乏和有效利用问题,具有重要的实际意义。
参考文献:
[1]Tim Finin,Anupam Joshi,Li Ding.Position paper
for the Workshop on Information Integration,
26-27 October 2006, Philadelphia PA.
[2]Gruber C T R.A translation approach to portable
ontologies,Knowledge Acquisition,1993,(2).
[3]曹乐静.基于本体的e-Learning个性化学习和资源共
享研究[D].上海:东华大学.2005.
[4]Studer R,Benjamins V R,Fensel D.Knowledge engi-
neering,principles and methods[J].Data and
Knowledge Engineering,1998,(1-2).
[5]甘健侯,姜跃,夏幼明.本体方法及其应用[M].北京:科
学出版社,2011:27.
[6]史元春.GB/T21365-2008,信息技术学习、教育和培训学
习对象元数据[S].北京:教育部教育信息化技术标准委
员会,2002.
[7]陆建江,张亚非,苗壮等.语义网原理与技术[M].北京:
科学出版社,2007:106-115.
[8]郭广军,王剑波,游新娥等.基于本体和语义网的网络教
育资源检索研究[J].华中师范大学学报:自然科学版,
2011,(4).
[9]Jena-A Semantic Web Framework for Java [EB/OL].
http://jena.sourceforge.net/.
[10]马宏伟,张光卫,李鹏.协同过滤推荐算法综述[J].小
型微型计算机系统,2009,(7).
[11]Tangmunarunkit H,Decker S,Kesselman C.Ontology
-based resource matching in the grid-the grid
meets the semantic web/Fensel D, Sycara K,Myl-
opoulos J.Proceedings of the second internat-
ional semantic web conference in 2003.Berlin
Springer,2003:706-721.
[12]S.Secker,D.Brickley,J.Saarela,and J.Angele,A
Query and Inference Service for RDF.In Procee-
ding of the W3C Query Language Workshop(QL-98),
1998,http://www.w3.org/TandS/QL/QL98.