王会芹,郭瑞强
(河北师范大学数学与信息科学学院,河北石家庄 050016)
基于本体的云服务发现技术研究
王会芹,郭瑞强
(河北师范大学数学与信息科学学院,河北石家庄 050016)
云计算是目前国内外公认的热点研究领域。在云环境下,随着云服务数量的增加,查询满足用户需求的云服务成为急需解决的问题之一。然而,到目前为止,还没有一种统一而高效的云服务发现机制,用以帮助用户在众多已有的云服务中发现满足自身需求的服务。本文针对云服务发现问题,构建了一种云本体,利用本体的概念匹配技术,查找与云服务消费者需求相匹配的云服务。
云计算;云服务;本体;服务发现
云计算是基于Internet和计算机技术而发展的,易于动态扩展,并以虚拟资源的形式,借助Internet向用户提供服务[1]。在云环境下,由企业或团体提供的服务称为云服务,提供云服务的一方称为云服务提供者,使用云服务的一方称为云服务消费者。随着Internet等各种技术的快速发展,各种云服务资源也在不断的增加,云服务消费者如何在众多的云服务中找到最合适的服务成为研究的热点之一。尽管云服务消费者可以利用某些已经存在的搜索引擎来帮助发现云服务,但是在搜索结果中经常会包含很多与消费者需求并不相关网页的URL,而浏览所有的网页是一件非常耗时的工作[2]。而另一方面,一些真正相关的网页却可能被遗漏掉。所以,云服务的消费者通常都是手动的搜索所需服务。在文献[3]和文献[4]中论述实现了一种基于本体的云服务发现机制,但是都没有对等价和包含的概念做出匹配和推理。因此笔者提出了一种基于本体,并对其进行相应匹配和推理的云服务发现平台,帮助云服务消费者发现更合适的服务。
目前,国内外一些研究机构和学术团体纷纷推出自己云计算平台和相关的研究成果。云计算的提供者通过网络发布各种服务,然而,对于各种云服务还没有一种标准、开放的协议和服务发现机制,用以帮助云服务消费者在众多已有的云服务中发现满足需要的服务。由于只有少数的大公司可以负担得起云计算基础设施的费用,云服务的消费者通常通过手工的方式来搜索自己需要的云服务。但是随着硬件和软件的发展,越来越多的中小公司也会在云计算社区的特殊领域引入他们的云。所以,手动搜索不是最合适的服务发现方法,需要建立一种新的搜索机制来帮助云服务消费者来发现满足需求的服务[5]。
在文献[2]中,作者展示了一种云服务发现平台,该平台采用了基于Agent的云服务发现方法,核心是利用了一种称作云服务推理Agent的组件,实现云服务之间关系的推理,以及查询结果的排序。在该文中,参考了云本体,利用相似推理的方法对云服务进行了相似的比较。但是在这种方法中,比较容易遗漏与用户需求相关的服务,即发现的准确率不高。
在文献[3]中,提出了一种参考云本体来推理云服务之间关系的云服务搜索机制。为了决定本体中两个概念之间的相似度,它提出了三种推理方法:相似推理、等价推理和数字推理。在文献[4]中,提出了多标准云服务搜索引擎,它支持各个类型的云服务及其各种接口模式,在比较云服务相似性时参照云本体。通过使用三种相似推理方法决定云服务之间的相似度,即:1)概念相似推理;2)对象属性相似推理;3)数据类型属性相似推理。使用上述两个文献中的方法,可以比较精确的发现适合用户需求的服务,但是上述两种方法也遗漏一些与用户需求相关的服务。例如:用户提交的服务请求中要求操作系统为Win2000,而服务的提供者在注册服务时对于服务的描述为Windows2000,即用户提交的查询请求和服务提供者注册的服务描述信息出现相同含义但描述不同的情况,还有包含关系的一些问题。利用文献[3]和文献[4]的方法无法发现与上述问题相关的服务。笔者将在下面,提出一种基于本体的语义推理方法来更精确的匹配相关服务。
1.2.1 本体
本体来源于哲学上的一个概念,也被称为本体论,哲学家用它来描述事物的本质。后来,人工智能等学科借用了这个概念,在开发知识系统时用于领域知识的获取。目前,比较公认的是在1998年由Studer等经过深入研究后,给出的定义:“本体是共享概念模型的明确形式化规范说明”[6]。在人工智能领域里Neches等人给出本体的定义为:“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”[7]。在本文中,使用本体来表示云服务描述及其特征或属性之间的联系,并利用这些本体进行推理和匹配来发现相关的服务。
1.2.2 Racer推理机
从已给定的知识中获取隐含在其中有用的知识是推理的一个重要的任务。在本体中的推理从根本上说就是把隐含定义和声明中的知识通过一种处理机制提取出来。本体推理机是建立在本体之上的本体概念推理工具,通过对本体中两个概念的推理和相似度计算,可以得到本体库中任意两个概念的匹配度。在本文的云服务发现过程中,一个重要的环节就是本体中概念之间的匹配与推理。
Racer推理机是由德国汉堡大学开发的基于描述逻辑的推理机之一。它是一种专用的本体推理机,可以对基于RDFS/OIL+DAML和OWL知识库进行处理,且效率较高,使用方便。具有较强的一致性检查功能,能够良好地支持大本体文件提供,具有图形用户界面和详细的开发文档。笔者采用Racer推理机进行本体概念的推理,以更精准地发现满足用户需求的云服务描述。
云服务的提供者向注册中心注册服务,并提供云服务的描述信息S(Storage Devices,Capacity,CPU,Frequency……),S为一个向量,其中的分量是云服务提供者能提供服务的描述及其属性。云服务的消费者通过Web接口提交服务查询请求,当发现平台收到该请求时,将查询请求信息转换成一种合适格式,如向量格式R(HDD,80,IntelCPU,2,……),发送到推理及匹配模块,推理匹配模块收到请求后,与存储在注册中心的云服务描述信息向量S进行比较。在比较过程中参考云本体,对用户的请求R和注册中心的向量S中两个相对应的分量进行推理和匹配。经过比较、推理和匹配,如果向量S中每一个分量都满足用户请求R中相对应的分量,则将这一条服务信息送到排序模块,排序模块按照服务的效用进行排序,将结果通过Web接口返回给用户参考。整体框架如图1所示。
图1 云服务发现平台框架图
Protégé-OWL API是专门针对OWL和RDF(S)本体语言的开源Java类库,提供了主要类和方法的使用,它主要用于加载和保存OWL文件,查询和操作OWL数据模型,以及执行基于描述逻辑的推理。因此利用它提供的类和方法,连接基于描述逻辑推理的Racer推理机,进行概念的匹配和推理。
如图1所示,当云服务发现平台通过Web接口收到用户的请求R时,和存储在注册中心的向量S作比较。当比较的结果满足用户的请求时,将向量S送到排序模块进行排序。排序模块按照如下方式从大到小进行排序:
其中,ωi∈[0,1](i=1,2,…,n)为一个影响度,且ω1+ω2+……+ωn=1,Ri(i=1,2,……,n)为用户请求向量R的分量,对应于云本体中的概念。Si(i=1,2,……,n)为云服务提供者向注册中心提供的服务向量S的分量,对应于云本体中的概念。
对于式(1)中的Sim(Ri,Si)=Simconp(Ri,Si)+Simprop(Ri,Si),(i=1,2,……n),其中Simconp(Ri,Si)为概念的匹配,根据构建的云本体,有以下几种情况:
(1)概念为相等。如:用户请求R中的某个概念R i为Win2000,向量S中相对应的概念Si也是Win2000,此时认为两个概念相等,Simconp(Ri,Si)=1。
图2 云本体
(2)概念为等价。如:用户请求R中的某个概念Ri为Win2000,向量S中相对应的概念是Windows2000,在现实生活中,认为两个概念的含义是相同的,但是计算机不能自动的识别出两个概念含义是相同的。故利用Protégé-OWL API中提供的getEquivalentClasses()方法,参照图2所示的云本体,可以得到两个概念为等价类,Simconp(Ri,Si)=1。
(3)概念为包含。如:用户请求R中的某个概念Ri为Win2000,向量S中相对应的概念Si是Windows,根据图2所示的云本体,认为概念为包含关系。如果概念Si为Microsoft Windows也就是与Windows是等价类,如图2所示。利用Racer推理机推得Windows的子类也是Microsoft Windows的子类,也就是说Win2000也是Microsoft Windows的子类,即满足包含关系。若满足包含关系,则Simconp(Ri,Si)=1。
(4)概念为相似。如:用户请求R中的某个概念Ri为Win2000,向量S中相对应的概念Si是Unix。这种情况下,参照图2所示的云本体进行概念的匹配,即计算概念之间的相似程度是否满足用户提供的阈值。基于本文实验的目的,采用了文献[2]中的匹配方法:
由此可知,Win2000和Unix的相似度为0.417,如果用户提供的阈值小于0.417,则判定两个概念为相似且Simconp(Ri,Si)=0.417。
对于式(1)中的Sim(Ri,Si)=Simconp(Ri,Si)+Simprop(Ri,Si)(i=1,2,……,n),其中Simprop(Ri,Si)为属性的匹配。本文基于实验的目的,概念的属性仅涉及到了数字形式的属性,故在本文中只列出了属性为数字属性的匹配,采用了文献[3]中的数字属性匹配公式进行匹配:
其中μ(Ri)与μ(Si)表示概念Ri和Si的数字属性的值,c表示拥有该属性的概念,Cmax和Cmin表示上述数字该属性的取值范围。
例如:假设硬盘的容量最大为500G,最小为100G,那么计算200G和300G硬盘的相似度为:
由此可知,200G的硬盘和300G的硬盘在上述的假设中,相似度为0.75。若计算的相似度大于等于用户提供的阈值时,匹配成功。
若注册中心的向量S中的概念满足用户请求R中相对应的概念(即满足上述四种情况之一)。且用公式(3)得到的属性匹配度大于用户给定的阈值,则进行下一个对应概念的比较,直到向量S中的所有概念和属性比较完成。若向量S中的所有概念和属性都满足用户的需求,则将向量S中的信息送到排序模块。排序模块按照公式(1)进行排序,最后通过Web接口返回给用户,由用户最终来选择最佳的服务。若S中的某个概念和属性不满足上述的情况,则中止比较,继续下一个用户请求R和向量S的比较。
本文通过对基于本体的云服务发现技术的研究,利用匹配技术将一些被遗漏的相关的云服务推理出来,使一些与用户需求更相关的服务通过Web接口返回给用户。下一步的工作,就是要完善匹配推理技术,以及服务组合的实现。
[1]Ken Birman,Gregory Chockler,Robbert van Renesse,“TOWARD A CLOUD COMPUTING RESEARCH AGENDA”.
[2]Taekgyeong Han,Kwang Mong Sim,“An Ontology-enhanced Cloud Service Discovery System”Proceedings of the International MultiConference of Engineers and Computing Scientists 2010 Vol I,IMECS 2010,March 17-19,2010,Hong Kong.
[3]Jaeyong Kang,Kwang Mong Sim,“Cloudle:An Agent-based Cloud Search Engine that Consult a Cloud Ontology”,Annual International Conference on Cloud Computing and Virtualization(CCV 2010).
[4]Jaeyong Kang,Kwang Mong Sim,“Cloudle:A Multi-criteria Cloud Service Search Engine”,2010 IEEE Asia-Pacific Services Computing Conference.
[5]PHILLIP C-Y SHEU,SHU WANG,QI WANG,KE HAO,RAY PAUL.Semantic Computing,Cloud Computing,and Semantic Search Engine[C].2009 IEEE International Conference on Semantic Computing.
[6]陆建江,张亚非,苗壮,周波.语义网原理与技术[M].北京:科学出版社,2007.
[7]宋炜,张铭.语义网简明教程[M].北京:高等教育出版社,2004.
Research of cloud service discovery technology based on ontology
WANG Hui-qin,GUO Rui-qiang
(DepartmentofMathematicandInformationScience,HebeiNormalUniversity,Shijiazhuang,Hebei050016,China)
Cloud computing is recognized as one of the hottest research at home and abroad.With the increasing unmber of cloud services,one of the issues needed to be resolved is to find a cloud service that meet user demand.However,there is not an outstanding cloud service discovery mechanism,until now,to help user to find the appropriate solution among numerous existing cloud services.In this paper,a Cloud Ontology to discovery any cloud service is constructed that meet the requirements of cloud service consumer by ontology concept matching.
Cloud computing;Cloud service;Ontology;Service discovery
TP393
:A
1001-9383(2011)03-0033-05
2011-06-30
王会芹(1982-),女,河北邢台人,硕士研究生,主要研究方向:云服务的发现.