本体在高校信息资源集成中的应用

2016-01-12 10:06刘萍,周建林
通化师范学院学报 2015年10期
关键词:本体云计算

本体在高校信息资源集成中的应用

刘萍,周建林

(江阴职业技术学院 计算机科学系,江苏 江阴 214400)

摘要:结合混合本体和云计算技术提出高校信息资源集成框架,介绍了框架的层次、全局本体构建、基于关系数据库的实体-关系模型抽取局部本体的规则和本体映射算法,最后设计原型系统验证框架可解决高校信息资源集成中的语义异构问题.

关键词:本体;信息资源集成框架;云计算

DOI:10.13877/j.cnki.cn22-1284.2015.10.017

收稿日期:2015-05-04

基金项目:江苏省自然科学

作者简介:刘萍,女,江苏江阴人,讲师.

中图分类号:TP391文献标志码:A

0引言

随着数字化校园的构建,高校在不同时期开发了各种信息系统:如招生系统、教务系统、科研系统、学生管理系统等,工作人员大多要运行多套系统,系统无法实现信息共享.因本体是共享概念模型的明确的、形式化的规范说明[1].本体的目标[2]是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义.可见本体可作为信息资源集成的通用语义模型.为了实现信息共享,消除信息系统之间的语义异构,本文提出了基于本体的高校信息资源集成框架,以期对高校各类信息资源进行集成,提高高校管理效率.

1基于本体的高校信息资源集成框架

高校各个时期建设的信息管理系统数据库是独立设计的,参加集成的各异构数据库之间可能会产生语义异构.采用混合本体方法[3]能够解决该问题,该方法由局部本体描述每个信息源,在局部本体之上使用包含领域中的基本术语的全局本体,作为统一的信息视图.云计算[4]的设计理念是计算机仅作为数据与信息的访问,而非存储与处理终端.人们仅需连接网络和浏览器就可以完成所需的数据分析与处理工作.

本文结合混合本体和云计算技术构建了高校信息资源集成框架,如图1所示.整体设计思路:采用全局本体描述领域信息资源,通过构建基于关系数据库的局部本体来描述各个数据库,并同时形成信息源与局部本体之间的映射,然后建立全局本体与局部本体之间的映射关系,该两级映射可以很好地解决信息资源集成中的语义异构问题.本框架通过Web Services封装对信息源的访问功能,采用云计算后,框架具有高可扩展性,高安全性,若需扩展某功能,只要按需定制云服务.

图1 基于本体的高校信息资源集成框架

1.1框架层次

高校信息资源集成框架分为以下三个层次.

①资源层.该层包括待集成的各类信息系统,比如高校招生系统、教务系统、科研系统、学生管理系统等.

②云端管理层.该层包括管理中间件、SOA构建层和云计算服务器集群,管理中间件负责对云计算的资源进行管理;SOA构建层将对某信息系统数据库的访问功能封装成云服务(Web Services),把基于局部本体的服务描述信息注册到云计算服务器上的服务注册中心.

查询处理器首先对查询条件进行语义处理,使用全局本体中的术语来描述用户请求,再根据全局本体与局部本体映射,把查询转换为基于局部本体中的术语,然后查找并访问云计算服务器集群中使用对应局部本体术语描述的若干云服务,获取查询结果,由查询处理器将结果进行合并、转换等处理后返回用户.

③用户接口层.该层为用户提供统一访问界面,用户通过PC浏览器或移动终端设备输入查询请求,然后得到返回结果.

1.2全局本体构建

全局本体是信息资源集成的语义化全局视图.全局本体构建[5]需要领域专家参与,查找和确定领域术语,用术语来定义全局本体,确立本体中的关系及相关函数和公理,最终用本体语言来描述本体,完成本体编码.OWL DL具有描述各种本体的充分表达能力,又具有推理能力,本文选用它作为本体描述语言.另外,如果局部信息源中具有代表性的信息经专家判定和计算后可归纳到全局本体的概念集中.

1.3局部本体构建

本文研究的高校信息资源都存储在关系数据库中,下面给出了基于关系数据库的实体-关系模型抽取局部本体的规则.在设计关系数据库的过程中,首先要完成概念设计,在概念设计阶段采用实体-关系模型,又称E-R模型,一般用E-R图表示实体,以及实体之间的关系.实体间存在三种关系:一对一、一对多和多对多关系.

针对一对一关系,数据库逻辑设计会设计成一张带有主键字段的表,该关系映射到本体中的类,表名也为类名,用owl:class表示,表的字段映射为局部本体中类的属性,字段名也为属性名,用owl:datatypeProperty表示,在本体中属性是具有定义域和值域的,因此,设置rdfs:range表示该属性的数据类型,rdfs:domain表示该属性所属类.

针对一对多关系,数据库逻辑设计会设计成带外键字段的表,该关系映射到本体除了外键字段定义为类的owl:objectProperty,设置rdfs:range为所参照的表转换的类,rdfs:domain表示该字段所属的表转换的类,其他同一对一关系.

针对多对多关系,数据库逻辑设计时,多对多的关系会映射成一张新表,这张表包括两个多对多关联实体表的所有主键字段,这些字段成为了该表的外键,因此,多对多关系映射可以分解为若干个一对多关系,该关系的本体构建同一对多关系.

在构建局部本体的同时,形成局部本体和局部信息源的映射关系,存储到本体库中.

1.4本体映射算法

本体映射算法解决了目前数据库表和属性中存在的同名异义和异名同义的问题.Jena2是提供丰富的API的Java框架,可定义推理规则并完成推理,因此,采用它管理OWL本体库,实现本体的查询与推理.

全局本体与局部本体映射算法的思路是若全局本体与局部本体的概念所拥有的属性和取值范围基本相似[6],则认为这两概念等价,算法如下:

输入:全局本体文件global_ontology.owl,多个局部本体文件local_ontology1.owl, local_ontology2.owl,…… , local_ontologyn.owl.

输出:ontology_mapping.owl.

对每个局部本体文件local_ontologyn.owl中的概念通过Jena2解析和推理在全局本体global_ontology.owl中找到相似的,若能完全匹配,则建立映射关系,用owl:equivalentClass表示等价关系.若不能找到完全匹配的,则分别遍历局部本体和全局本体中的概念所拥有的属性和取值范围是否基本相似,若相似则认为这两个概念等价.下面是局部本体中概念和全局本体中概念的匹配算法描述:

LocalAndGlobalConceptMapping(String localconcept,String globalconcept)

{

// localconcept是局部本体的概念,globalconcept是全部本体的概念

if(localconcept==globalconcept) localconcept和globalconcept等价;

else

{

获取localconcept的属性,并存储在局部本体属性数组中,假设数组名为local;

获取globalconcept的属性,并存储在全局本体属性数组中,假设数组名为global

;int m=0;//累计属性匹配值

for(i=0;i

{

local[i]

for(j=0;j

{

global[j]

判断属性(local[i],global[j])是否等价,通过Jena2解析与推理,分别到全局本体与局部本体中去找到等价的属性,若找到,则属性匹配值m+=1.

}

}

通过Jena2解析与推理判定两概念拥有的取值范围是否相似,若某概念取值范围包含另一概念,则认为取值范围相似.

if((m==最小值(local.length,global.length))&& 两概念拥有的取值范围相似)

两概念等价.

}

若局部本体的概念在全局本体中找不到等价的概念,则经过领域专家鉴定后,可加入全局本体中.

}

}

2原型系统

为验证框架,采用JavaEE平台的SSH框架(Struts、Spring、Hibernate),以及Web Services技术进行原型系统开发.开发环境采用MyEclipse2014,应用服务器采用Tomcat7.0,采用Jena2实现对本体的检索与语义推理.

假设学院要开展评优、评奖活动,用户通过浏览器访问原型系统,可按系部、班级、学号或姓名等查询学生评优、评奖相关信息,如图2所示,查询出来的结果集里包含学生的基本信息、学生课程成绩信息、学生考证情况、学生奖惩情况,以及学生的积点情况,这些信息分别来源于高校招生系统、教务系统、学生管理系统等,在本系统中,我们把信息都封装成服务,放在云端,并且利用本体描述了信息,使得各个系统中分别用“学生”“新生”“毕业生”等描述的学生概念能统一用“学生”术语表示,使得该原型系统有较好的查全率和查准率,实验结果表明本文提出的框架能够解决语义异构问题.

图2 原型系统运行界面

3总结

通过本体对信息资源进行统一描述,屏蔽了各类数据库系统之间的语义异构.采用云计算技术实现跨环境、跨平台与跨系统.对提出的信息资源集成框架中的若干关键技术进行研究,实验表明该框架可以解决语义异构问题,并具有高可扩展性,只需定制使用本体术语描述的云服务即可完成扩展.本文的不足之处是仅对关系数据库这类结构化信息研究本体构建,下一步将研究对非结构化信息进行本体自动构建,未来还将对云计算环境下的高校云端管理、用户身份认证、权限监管与分配等进行深入研究.

参考文献:

[1]Studer R,Benjamins V R,Fensel D.Knowledge Engineering,Principles and Methods[J].Data and Knowledge Engineering,1998,25(122):161-197.

[2]邓志鸿,唐世渭,张铭,等.Ontology研究综述[J].北京大学学报,2002(5):730-737.

[3]WACHE H. OGELE V, VISSER T, et al. Ontology-based integration of information-a survey of existing approaches. USA:IJCAI-01Workshop:Ontologies and Information Sharing [C],2001:108-117.

[4]李亚红,王东霞.语义信息集成中概念匹配的研究[J].计算机应用与软件,2013,30(5):180-183.

[5]刘萍,李绪蓉.基于本体的信息集成框架研究[J].计算机技术与发展,2007,17(12):34-36

[6]孙世强.云计算环境下政府信息资源集成模式研究[D].哈尔滨:黑龙江大学,2012.

(责任编辑:王前)

猜你喜欢
本体云计算
眼睛是“本体”
一种基于社会选择的本体聚类与合并机制
基于本体的机械产品工艺知识表示
志愿服务与“互联网+”结合模式探究
云计算与虚拟化
基于云计算的移动学习平台的设计
实验云:理论教学与实验教学深度融合的助推器
云计算中的存储虚拟化技术应用
立足音乐本体 开启音乐思维
专题