李 韧
(重庆交通大学信息科学与工程学院,重庆 400074)
近年来,万维网已成为人们日常工作、生活娱乐和获取信息不可或缺的重要途径之一。然而,传统Web信息以面向人类的沟通和理解而发布,导致该信息仍然很难被计算机所理解,传统的搜索引擎均以基于文本关键字的方式对Web信息进行搜集和检索,无法理解Web信息之间的语义关系,不能实现语义知识共享。为解决上述问题,万维网之父Tim Berners-Lee在传统Web标准基础和哲学领域本体相关理论[1]的基础之上,在2001年首次提出了语义Web作为实现下一代万维网的远景。近年来,世界万维网联盟W3C已相继提出了多个语义Web技术标准,并推荐其为未来Web技术发展重要方向[2]。为适应这一发展趋势,我国高校计算机相关专业已陆续开设语义Web技术选修课程,着力培养具备最新语义Web开发知识和技能的专业性人才。
W3C规定采用UNICODE格式对语义Web所发布的内容进行编码,并使用通用资源标识符URI对所有资源进行唯一性标记。在此基础之上,W3C规定所有语义Web的结构化网络文档基于可扩展标记语言XML格式。为了定义网络资源之间的关系,实现机器可理解,应用之间互操作,以及提供软件Agent自动处理能力,W3C于2004年提出了资源描述框架RDF,并将其推荐为语义 Web的基本元数据模型[3]。在 RDF之上,W3C提出了RDF-S,定义了资源的类以及类和属性的层次划分等,初步具备了简单语义推理和规则推理特征。为提供更强大的描述能力和可判定的推理能力,W3C于2007年提出了Web本体描述语言OWL,并将其指定为语义Web的核心技术,提供可以用于各种应用领域建模的本体描述和推理能力。另外,SPARQL是W3C推荐的RDF数据查询标准语言,SWRL是用于对OWL表达能力进行规则扩展的标准规则描述语言[4]。除此以外,在语义Web体系结构中还包含了证明层、信任层和数字签名等面向用户和接口终端应用,属于实际应用开发范畴。在语义Web技术应用工具方面,当前业界主要使用美国斯坦福大学推出的开源Protégé工具进行语义Web本体建模。该工具可以通过导入如Pellet和Jena等得多种插件实现RDF、OWL等不同语义层级的本体查询和推理任务。
语义Web技术课程主要面向计算机相关专业高年级本科生或研究生,包括了32学时的理论课程和16学时的实验课程,该课程体系结构设置情况如图1所示。理论课程以传统Web开发技术为基础,首先讲授 HTML、命名空间、UNICODE和XML等Web开发基本知识,并通过引入语义Web原理使学生明确传统Web存在的不足并熟悉下一代万维网的理念。然后,通过讲授语义Web语言与标准,包括 RDF、RDFS、OWL、SPARQL 和 SWRL等,使学生初步了解关于语义Web的体系结构和关键理论。其次,通过阐述描述逻辑基本原理与特点、描述逻辑系统结构、描述逻辑语言、TBox与ABox以及Tableau推理算法等使学生熟悉OWL本体的可满足性、一致性验证等推理任务和实现机理。随后,重点讲授各类本体建模、查询与推理工具的使用方法,并通过语义Web实际应用案例,使学生进一步掌握前述讲授的语义Web语言和标准。最后,通过讲授本体匹配和学习技术,使学生了解语义Web技术发展进阶知识。
在上述理论知识点的基础之上,实验课程主要训练学生的本体建模、查询与推理的应用能力。通过结合各类实际应用案例,以培养学生熟练独立使用各类应用工具进行语义Web应用开发能力为目的,主要开展术语本体概念及关系层次结构设计、传递和逆关系定义、实例断言声明等面向不同表达能力的语义Web本体建模,并通过使用现有描述逻辑推理机、SPARQL查询引擎和SWRL推理引擎对实验课程中建立的本体进行可满足性推理、包含关系推理、一致性验证等推理实训,使学生进一步加深对语义Web相关知识点的掌握和理解,同时充分调动学生学习积极性,以达到提高教学质量的目的。
图1 语义Web课程体系
由于该课程讲授到多种语义Web新标准和新语言,同时涉及到描述逻辑等多种理论性较强的知识点,教学和学习过程较为抽象,因此实验课程应以案例为驱动,并充分借助Protégé本体建模工具、Jena查询引擎及其编程API、Pellet推理机等语义Web应用工具,使学生逐步熟悉关于语义Web的知识体系及提升学生动手研发能力。
在教学案例的选择方面,可根据学生对特定领域的熟悉程度,指导学生进行如社交网络和大学教学管理等领域本体的建模,抽象出某特定领域的领域概念及其概念之间的层级关系,分析各类概念之间存在的交互关系,并对关系的层级、传递性、互斥性的限制进行总结,进而建立相应的本体术语集。在此基础之上,指导学生对某特定领域的个体实例进行归纳,分析实例所对应的概念。最后,通过调用相应的查询引擎或者推理机完成所建立本体知识库的查询和推理。
在语义Web工具应用方面,首先重点培养学生使用Protégé建模工具,熟悉该工具各个功能模块的使用方法,以及各类插件的安装部署和使用限制。然后,重点培养学生使用Pellet推理机对所构建本体的一致性、可满足性或者分类关系进行Tableau推理的方法,并在使用过程中提倡学生首先进行人工的推理,并与推理机计算结果进行比较,进而加深对推理理论的理解。其次,指导学生构建不同类型的 SPARQL查询语句,分析在Protégé的Jena插件中的使用及其查询过程。最后,指导学生使用 Protégé的SWRLTab插件,并对SWRL规则进行实践,加深对SWRL规则推理的理解和认识。
语义Web技术课程以传统Web开发相关知识为基础,重点讲授语义Web本体的建模、查询与推理理论和方法,并以案例驱动的方式组织实验教学,突出 Protégé、Pellet和 Jena 等应用工具的实践,进而提升教学质量,使学生具备下一代万维网的相关知识和一定的软件研发能力。
[1] 俞宣孟.本体论研究[M].上海:上海人民出版社,2012.
[2] 高志强,潘越,马力,等.语义Web原理及应用[M].北京:机械工业出版社,2014.
[3] 黄智生,钟宁.海量语义数据处理——平台、技术与应用[M].北京:高等教育出版社,2012.
[4] W3C.Semantic Web[EB/OL].[2015 - 03 - 12].http://www.w3.org/standards/semanticweb/.