毛淑贤 朱桂凤
摘 要:语义网格使互联网上日益膨胀的信息资源实现共享,通过协同工作和共享能力,为用户提供功能强大的一站式服务。为了更加清楚地认识语义网格作为一种新的资源管理技术的应用归纳整理了语义网格的相关研究内容。通过分析目前在语义网格已取得的研究成果,介绍语义网格的基本概念,梳理语义网格的核心技术,分析语义网格的框架及其研究内容,初步分析得出语义网格技术的发展趋势。
关键词:网格计算;语义网格;Web服务;资源管理
中图分类号:TP393
0 引 言
资源的有效管理是计算机和网络有效工作的基础。建立适用于互联网环境的语义数据模型,实现有效信息、知识的服务共享和管理的一条重要途径,语义网格是面向语义的智能互联应用环境,它需要建立一套新的理论和方法实现对地理分布不同的各种网络资源进行规范和灵活的组织,实现网络资源的有效共享和智能利用。
语义网格是在Web技术和网格计算技术发展的基础上发展而来的,具备智能性、协作性和可靠性等特点,使其逐步成为网格研究的一个新兴热点。国外已经开展了多项关于语义网格的项目研究工作,已建立了100余个试验项目,如myGrid,WSMO,GEODISE,DartGrid等。近年来,我国也非常重视这方面的研究工作,国内的中国科院计算所、清华大学、国防科技大学等研究单位也对语义网格和网格计算开展了大量研究工作,相关课题进行开展并取得一定的研究成果。语义网格的诸多优势使其具备广阔的发展前景,相关研究成果必将推动网格、互联网等技术的迅速发展。
1 语义网格的基本概念
2001年,David De Roure等人首次使用了语义网格(Semantic Grid)概念,将未来e[CD*2]Science的基础研究称为语义网格。语义网格被描述为一个支持全球范围内,灵活协作与计算的高度自动化开放系统。语义网格概念的提出结合了语义 Web、 网格和 Web服务的优点并弥补了彼此的不足。全球网格论坛成立了语义网格研究组来提供对语义网格的支持,研究把语义网技术应用到网格问题中,把语义网格定义为当前网格的延伸,因为信息和服务有了清晰明了的含义,人与计算机能够更好地合作[3]。在该定义里,着重描述信息和服务的概念,也基本上规划了语义网格的发展方向,是以信息和服务为主体,人和计算机更好的合作,不仅作为途径,也是语义网格发展的中间产物。计算机只有具有更高的灵活性和协作性,才能更快地实现与人的无缝合作,达到信息服务目的。由于语义网格是一个基于网格技术和语义网发展起来的,针对的描述对象领域范围很大,包括对象、服务、过程、资源、能力等。
从根本上看,语义网格实现了网格和语义网融合的优势。当前网格缺乏机器可读可理解的数据语义,缺乏人和机器的合作支撑,机器难以处理异构资源,难以联合、再利用信息,难以灵活协作、高度易用和无缝自动化,难以根据用户的需求自动地生产知识。而语义网虽然实现了计算机可理解的数据语义问题,但难以实现互联网上各种资源(包括硬件和软件资源)的共享,难以满足日益增长的计算需求。
图1表明了Web、网格、语义网和语义网格的关系[4],横轴用数据和计算能力表示网格的发展方向,纵轴用互操作性能表示语义网的发展方向。可以认为,Web是网格的基础,Web加上数据和计算能力,则可逐步发展为网格;另一方面,Web(或网格)加上语义能力(丰富的互操作性)即可实现语义Web。语义网格则是Web结合计算和语义能力的最终产物。所以,它具备语义Web和网格的优点,实现二者的结合应用。
2 语义网格的核心技术
语义网格的关键之处是把作为一个分布式数据存储的Web的当前结构,转化成可以被基于计算机实体理解的信息存储结构。这里从互联网的自然特性、人类社会对互联网应用的需求、信息科学和互联网本身的进化需求所产生的科学问题出发,介绍新一代互联网应用平台的关键理论和技术[3,5[CD*2]8]。
(1) 元数据。
元数据是用于描述数据的数据,包含语义和它所涉及数据的解释,是对语义网格上信息的┮恢知描述方式。这种描述方式使得信息变成计算机可以理解的信息。为了把数据转换为信息,元数据必须加入到上下文环境中。元数据和本体对语义web的发展是关键的。语义网格使用元数据来描述网格中的信息。将信息转化为一些更有意义的东西,而不只是一个数据集合,这意味着需要正确理解数据的内容、格式和重要性。语义Web就遵循这种模型,即提供其他一些元数据来帮助描述在Web页面上显示的信息,这样浏览器、应用程序和用户就能够更好地决定如何处理数据。
(2) 本体和本体库。
本体是一个概念性的描述,共享概念模型的形式化规范说明,目标是获取、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。本体也是一个概念性的规范,该规范的本质是在知识和Web工程的上下文空间中通过语义含义提供一个清晰的表达。与模式语言形成对比,例如XML模式,本体试图用原始的知识表述捕获研究领域的语义,使得计算机能完全或部分理解一个领域中的概念之间的关系。本体为域提供┮桓霆通用词汇,并定义属于的含义和它们之间的关系。本体指的是对一些感兴趣领域的┮桓霆共享理解,经常被构思为一个类(概念)、关系、功能、原理和实例的集合。在本体中的概念通常用分类法组织。
本体库的概念对于取得表达能力是很必要的,在用知识进行建模和推理的过程中需要这种能力。总的来说,一个本体库决定了术语的外延和它们之间的关系。本体库的好处是改进了在系统之间的通信,这些系统可以是机器、用户或者组织。它们的目标就是建立一个一致的,可能是规范的模型。本体库的另外一个好处是可互操作性,一个本体库可以作为一种国际语,它可以推动内容的重用,确保给出一个清晰的规范来表达内容或者服务是关于什么的,增加内容和服务被成功集成的机会。可以说,本体库提供了内容的通信、集成和共享的基础。但是它们还可以提供更多的便利,它可以通过去除模糊性和指出相关术语,或者通过建立从页面得到的信息与其他信息建立联系,来改进搜索准确性。还有,互联网推理系统开始出现,它可以通过从现有的信息中抽取和产生注释来开发本体库。
(3) Web 服务。
开放性网格服务架构(Open Grid Services Architecture,OGSA)以网格服务为中心的架构,非常有利于构建语义网格环境。在OGSA网格体系结构中,由于网格环境中所有的组件都是虚拟的,因此通过提供一组相对统一的核心接口,所有的网格服务都基于这些接口实现,就可以很容易构造出具有层次结构的、更高级别的服务。
(4) 语义Web服务。
现有的Web服务围绕着UDDI,WSDL和SOAP,提供了有限的机制来实现服务的发现、配置、组合和自动协商,这对服务的调用来说抽象层次较低。语义服务的目标是通过提升服务的描述,来指明服务的能力和任务完成的特性,使得在同一语义空间下的服务更容易整合。
(5) 管理资源。
规范组织是管理资源的有效方法,但互联网应用要求自组织性。因此,如何谐调规范性和自组织性是互联网时代资源组织的关键问题。通过定义一套语义空间的范式来规范重构各种网络资源并与对等网络技术相结合,使动态网络环境下的无序资源规范化,使资源操作准确、方便,以实现有效的资源共享。
(6) 语义互联。
如何实现分布在全球的各种网络资源在语义层上互联,消除资源语义孤岛。通过简洁的方式从资源空间映射到语义空间,实现异构资源在语义层的互联,通过与资源空间模型相结合,形成单一语义映像,使得各种资源在简洁的语义空间中得到统一和互联。
3 语义网格的框架
现在,随着Internet的发展,Web网页的快速膨胀,面对越来越多的信息,人们无法通过互联网来获得最有效的资源或者无法获得资源,或者被过多的引用占用。作为解决这一问题的语义网格,它被描述为┮恢知开放的、面向服务的体系结构。从面向服务的观点来看,语义网格可划分为4个服务层次:基本服务、数据服务、信息服务和知识服务。其中,基础服务主要涉及到分布式资源的共享,包括对资源的分配、配置和重组等;数据服务主要针对共享资源计算和分析,这个层次提供的服务与数据存储、元数据管理、数据复制和数据传输有关;信息服务允许同意访问各种各样的信息源,并且提供运行在分布式计算资源上的通用服务;知识服务集中在知识表述和抽取上,支持用户能随时表述和存储它生成的有用的知识,并能方便地从分布在互联网上的知识仓库中获取摘要的知识,来解决遇到的问题。随着因特网用户的增多,互联网上的知识资源能够迅速积累并发展为整个互联网团体可以通用的知识财产。在语义网格中,知识层的目标就是作为一个支持科学知识的管理和应用程序的基础设施,达到特定的目的和目标。总的来说,每个层次都是想要提供适应不同应用的服务。
更深层次的划分,语义网格框架的表示如图3所示。随着网格的发展和语义网格概念的提出,语义网技术不仅在知识层起作用,而且渗透到整个语义网格架构中。语义网格以OGSA和WSRF(Web Services Resource Framework,Web 服务资源框架)为基础,采用面向服务的结构,提供基本网格服务,语义网格服务,包括以此为基础的知识网格,提供高级网格应用的接口。语义网格服务可提供知识服务,基于知识的信息服务,基于知识的数据计算服务。语义网格提供了更高级的知识共享和管理平台,使数据挖掘、文本挖掘等变得更为容易。语义网格在网格中间件和知识网格,高级网格应用间实现了机器的语义理解,为整个网格系统的语义互联提供了强有力的支撑。语义网格不仅能提供数据计算服务和信息服务,而且引入知识层处理,提供知识的获取、使用、检索、发布等知识服务,体现了下一代网格的特点。
4 语义网格的研究内容
语义网格的研究重点是用语义和知识工程的方法来解决目前网格平台建设和应用中存在的各种问题。其研究内容可以概括为以下几个方面:
(1) 知识模型。
知识模型将描述系统的知识和推理需求,包括领域知识、推理知识和任务知识。研究元数据,目前的元数据设施已经以RDF的形式存在,┙一步工作研究支持本体设计和运用的方法和工具,注释工具和方法;研究本体语言的逻辑框架;研究语义网格环境下表示本体的恰当的建模原语集,以及基于本体的推理机制;研究语义网格本体语言及其语义框架。
(2) 通信模型。
通信模型主要描述系统之间或系统与用户之间的需求和接口。
(3) 知识获取。
研究适合海量、异构、不完全、半结构化数据挖掘的有效方法和算法;研究基于语义网格本体的知识发现理论和算法,在核心本体的支持下有效地把信息转化为知识,识别与理解网格信息;研究网格信息自动分类、摘要和领域本体自动、半自动生成等技术。
(4) 知识组织。
研究内容的可视化技术和方法,如何通过概念语义空间进行知识组织,以期获得快速检索和高的查准率。
(5) 服务管理。
面向用户服务的模式和协议,研究网格服务的发布、发现和服务路由机制和算法,尤其是满足服务质量要求的网格服务的发布、发现和服务路由机制和算法。
5 语义网格的未来
语义网格不仅要融合语义网、Web服务和网格┤者的技术,而且自身还要进一步发展,所以,现在还处于不断发展中,有很多地方需要改善和完善。主要有分布式资源内容收集,各种媒体内容及格式的引用和转化;对资源的计算、分享方式的智能化方法以及提高数据交换速度扩展;计算机通用服务安全信任流程、方法和技术的问题;使用内容的数字产权管理问题;语义多元化的体系结构与网格技术的融合;设计与设置问题,所有用户都应易于使用从设计、发展、配置、运作、维持到重复利用整个生命周期的网格基础架构和应用。
6 结 语
语义网格致力于建立一种基于网格、语义网和Web服务多种技术的环境,它融合三者的优点,避免┤者各自独立发展的限制。把信息共享和服务作为发展方向使其成为网格研究的热点,它的研究必将进一步推动网格、互联网的发展以及其他领域,如生命科学和智能交通系统,城市交通指挥系统等的应用[12]。语义网格体现了多种技术融合的趋势,表明了下一代网格的发展方向应该是为所有人服务的一种网格。从目前的现状来看,语义网格已成为网格研究的一个热点,它使全球的网络资源在语义上进行连通,更好的为经济、科技、能源、社会保障等众多领域服务。
参 考 文 献
[1]诸葛海.语义网格的基础理论、模型与方法研究进展[J].中国基础科学,2007(6):27[CD*2]29.[LL]
[2]http://www.semanticgird.org/v1.9/semagid.pdf.2004.
[3]http://www.semanticgrid.org,20080405.
[4]李明生.语义网格:语义网技术和网格的结合[J].情报技术,2005(10):46[CD*2]48.
[5]Zhuge H,Shi X.Toward the Eco[CD*2]grid:A Harmoniously 〦volved Interconnection Environment[J].Communications of the ACM,2004,47(9):79[CD*2]83.
[6]Zhuge H.Semantic Grid:Scientific Issues,Infrastructure and Methodology[J].Communications of the ACM,2005,48 (4):117[CD*2]119.
[7]Zhuge H.The Future Interconnection Environment[J].IEEE Computer,2005,38 (4):27[CD*2]33.
[8]Zhuge H.Autonomous Semantic Link Net Working Model for the Knowledge Grid[J].Concurrency and Computation:Practice and Experience,2007,7 (19):1 065[CD*2]1 085.
[9]黄运涛,丁颖.语义网格核心技术及其应用研究[J].福建电脑,2007(12):27[CD*2]28.
[10]http://www.globus.org/research/papers/ogsa.pdf,20020622.
[11]http://www.Semanticgrid.org/documents/semgrid2004/semgrid2004.html,20080905.
[12]吴朝晖,陈华钧.语义网格:模型、方法与应用[M].杭州:浙江大学出版社,2008.
作者简介 毛淑贤 女,1968年出生,广东人,工程师。研究方向为计算机硬件和软件设计。