蒋漪涟
因为更多的计算机技术渗透到因特网,在90年代末网格继Internet和WEB之后成为研究热点。
网格是构筑在因特网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。网格是从电力网的概念借鉴过来的,其最终目的是希望用户在使用网格时,就像使用电力一样方便地使用分布在网络上强大而丰富的各种资源,如计算资源、存储资源、数据资源、信息资源、软件资源、通信资源、知识资源和专家资源等。网格具有高性能、一体化、资源共享、协同工作、知识生产等特点,是目前关系科研、经济、社会、国防的重要国家基础设施,在国内外己引起了广泛的关注。随着网格体系和技术标准的日趋成熟和完善,网格将会在更广泛的领域得到推广和应用[1]。
在美国,网格研究人员着重于计算网格和数据网格,即TeraGrid[2]和 GIG(全球信息网格)[3]。在欧洲着重于网格应用,其网格工程包括数据网格,e-learning和e-culture[4]。而其他国家,如日本、新加坡、印度构建网格程序。
中国也很重视网格研究,目前有一些重点项目得到国家的支持,如863工程支持的国家网格,教育部支持的中国网格工程,上海市政支持的上海网格等等[5]。
网格通过高速的共享网络连接地理上广泛分布的异构资源 (包括超级计算系统、存储器、数据库、软件、科学仪器和分布式文件系统等 )。在同一时间用它们来协同解决那些通常需要许多 CPU 或存储器来处理、访问的单个问题。在形成网格状的高性能计算网中,各个资源就是网格的节点[6]。
其特点是可以根据用户对资源的需求,动态地组织网络上的资源,实现网格的资源共享。这 种资源的共享不仅仅是文件的交换共享,还可以是直接对计算机硬件资源、软件资源、网络和数据等资源直接访问,并且这种共享是动态的、高度可控的,资源的提供者和消费者、共享内容、共享发生的条件都是被严格定义的。所有遵守这些共享规则的教育科研机构可以构成一个虚拟组织,虚拟组织内部的资源共享。
网格体系结构是关于如何建造网格的技术,包括对网格基本组成部分和各部分功能的定义和描述,对网格各部分相互关系与集成方法的规定,以及对网格有效运行机制的刻画。显然,网格体系结构是网格最核心的技术,只有建立合理的网格体系结构,才能够设计和建造好网格,才能使网格有效地发挥作用。
到目前为止,比较重要且有影响的网格体系结构是:五层沙漏结构。该结构是基于美国国家实验室的网格研发项目Globus 提出来的,是一种以协议为中心的“协议结构”[7]。该结构强调协议在网格的资源共享和互操作中的地位,通过协议实现一种机制,使得虚拟组织的用户与资源之间可以进行资源使用的协商,建立共享关系,并且可以进一步管理和开发新的共享关系。这一标准化的开放结构对网格的扩展性、互操作性、一致性以及代码共享都很有好处。图1所示为五层沙漏结构的形状图。
图1 五层沙漏结构形状图
这五层结构由下至上分别是构造层、连接层、资源层、汇聚层和应用层,各层涵义如下:
(1)构造层(Fabric)是物理或逻辑实体,实现控制局部的资源,并向上提供共享访问资源,如高性能计算资源、大型数据库存储资源、高速网络资源、传感器和远程设备等。本层提供的功能性为更上层使用提供了基础,所提供的功能性越丰富,更上层就越能构造更复杂的应用。
(2)连接层(Connectivity)定义网格中网络事务的核心通信协议和安全协议,其中通信协议包括传输、路由、命名等;安全协议提供通信服务上的安全加密机制,用于识别用户和资源,安全协议为建立用户和资源之间的信任关系提供了技术支持。 构造层提交的各种资源间的数据交换都在这一层的控制下实现,各资源间的认证、安全控制也在这里实现。
(3)资源层(Resource)定义了在一个单独的资源上提供共享操作的协议,该协议实现调用构造层的功能以访问和控制本地资源。它包含信息协议和管理协议两个协议族。在资源层只关心单个的资源,不关心全局的状态和跨域的行为。
(4)汇聚层(Collective)完成将资源层提交的受控资源汇聚在一起,供虚拟组织的应用程序共享、调用。汇聚层不关心单个资源的管理,关心的是全局的状态和跨域的交互行为。因此,该层提供的协议服务是很广泛的,开发者可以根据自己的需要,在使用下层提供的服务基础上进行再开发。汇聚层也提出了一些通用的协议和服务,如目录服务、协同分配调度、经纪人服务、数据复制服务、软件发现服务、团体授权服务、团体记账和支付服务等。
(5)应用层(Application)是用户利用下层提供的 API或 SDK 来实现某些特定功能。
现代远程教育的核心和精髓是教育资源的共享,而目前远程教育只是把自己所拥有的资源向社会开放,共享的范围和程度还远远不够,充其量只达到部分和单向的资源共享。同时,现有网络为学习资源的共享、学习活动的合作所提供的技术条件处在较低水平,缺乏在课程知识和教学管理水平层次上的交换,造成现代远程教育运作模式的僵化。资源的重复建设,资源检索技术的智能化水平不高,资源的获取和应用及更新速度较慢,动态适应性较差等,也影响资源的有效共享。
网格技术的最大特点是信息资源共享。通过建立远程教育信息网格,可以充分利用现有的远程教育资源,最大限度地减少各远程教育系统建
设时的重复投资,快速应对新系统建设的需求,整合和管理分散在各学校的信息化资源,实现网络虚拟环境下的资源共享和协同工作,建设一个统一、灵活、有弹性的远程教育基础设施。
远程开放教育资源共享系统的网格体系结构如图 2所示,此系统从下而上分别是网格资源域、网格中间件和应用层。
图2 远程开放教育资源共享的网格体系结构
(1)网格资源域。包括地理上分布的可以通
过 Internet访问到的所有分布式异构资源,包括运行不同操作系统的计算机、工作站、存储设备、各种数据库、仪器设备和应用系统等,构成整个网格系统的硬件基础。
(2)网格中间件。真正实现物理上连接、逻辑上孤立的网格资源的有效共享,屏蔽下层结构的分布性和异构性,向上层提供统一、透明的使用接口。网格中间层从下到上由资源网格、信息资源网格、服务网格组成。
资源网格。它是远程开放教育资源共享系统基础组成部分,负责本节点域的创建和属性的收集,动态监测、调度本地资源,及时地将本地网格资源的信息传送给上层的信息服务模块。此外,负责接收从网格请求代理提交的任务并负责运行相应的资源,为远程开放教育资源应用提供基本框架。相当于网格的构造层和连接层。
信息资源网格。它基于资源网格创建,是远程开放教育资源共享系统的重要组成部分。为了能为整个开展远程教育的学校提供有用的信息服务,就需要对资源网格提供的数据信息加以分析整理,并且通过信息网格,将学校所需的信息提供给服务网格。
服务网格。它是远程开放教育资源共享系统的核心组成部分,对全局资源进行统一的管理和分配,服务网格提供资源共享系统所支持的各种服务,同时对各应用系统提供服务支持,这种服务支持包括信息服务、计算服务和信息处理服务等。服务网格可以提供通用性的服务接口,也可以根据虚拟组织或应用领域的需要提供特定服务接口。
开发规范与管理控制平台。整个系统的中央控制单元,通过该平台的集中统一控制,使得服务网格、信息资源网格、资源网格的各个子系统符
合统一的规范,利于实现各子系统间的互通、互连和互操作,进而在管理控制平台的统一控制、协调下发挥出系统的最大效用。
(3)应用层。通过调用网格中间件,共享网格上的资源来完成任务。应该根据不同学校的具体要求,建立相应的应用系统来满足各个学校的不同要求。
远程开放教育资源共享系统采用图 3所示的网络拓扑图。学校内部通过局域网实现资源的互连、互通,其资源信息通过其所在的局域网内的服务器统一管理。学校中各个部门、教师、学生通过接入广域网而集合海量网格计算所需的网格资源。通常这些人员在地域上广泛分布,难以集中管理,因此采用分布式的资源管理方法较为实际,即对于分布于不同局域网中的网格资源,各服务器通过分布式数据库建立自己的资源信息库,服务器之间通过分布式数据库交互信为资源分配、作业调度服务;对于一个具体的任务可以通过各个局域网服务器,获得各自的局域网资源信息,从而形成学校动态的资源联盟。
图3 远程开放教育资源共享系统的网络拓扑图
在这个网格系统中,不存在全局控制的调度系统,每个学校的部门、教师、学生的地位都是平等的。这样的网格具有很强的可扩展性和容错能力,系统内任何一个节点发生故障,都不会对整个系统造成太大的影响。
系统应用的基本流程:①用户通过应用系统从网格节点登录,在用户通过登录中间件的身份认证后,用户向系统提交任务;②服务网格对任务进行分割,通过信息资源网格查找可利用资源及节点,并进行协商,然后下达任务到指定资源;③任务被分配给资源网格上的不同节点来共同完成,然后将任务结果连同任务完成报告返回,再由服务网格将结果合并后通过用户应用系统提交回用户。
为了说明远程开放教育资源共享系统的特点,现举一个具体的例子。在开展远程教育的学校中,学校 A想分析整个远程开放教育的发展现状和未来的趋势,需要用到各个学校的相关数据,同时需要进行大量的数据处理和数据挖掘。但是学校 A并没有处理大量数据和数据挖掘的能力,而学校B有一高性能计算机群,学校C有一套数据挖掘软件。只要学校 A,B,C都在网格系统中,可以很容易通过网格技术将各个学校的数据资源,学校 B的高性能计算机群和学校 C的数据挖掘系统组织成一个虚拟联盟,完成学校 A的应用请求,而不需要购买任何新的软、硬件系统。一旦任务结束,虚拟联盟自动解散。
不难看出网格技术的虚拟成员不是单个的实际的某个部门,而是一个个具体的计算机、存储器之类的资源节点。通过远程开放教育资源共享系统之后,可以最大限度地整合整个开放教育现有资源,实现资源重用。
网格技术是新一代互联网技术。将网格技术应用于远程开放教育资源共享,可以增强学校间资源的互操作性,即可以与远程的资源进行协同工作,打破现有的壁垒。本文提出的远程开放教育资源共享的网格体系结构和资源管理模式,对实现远程开放教育资源重用具有重要指导作用。
[1]Foster I,Kesselman C,Tuecke S.The anatomy of the grid:Enableing scalable virtual organizations. International J.Supercomputer Applications,2001.
[2]http://www.teragrid.org.
[3]http://disain.disa.mil/ncow.html.
[4]http://www.e-learningcentre.co.uk.
[5]http://www.chinagrid.net.
[6]高宏卿,王晓东,张际平.基于网格的远程教学研究[J].电化教育研究,2005,(5)53-56.
[7]顾容,王永固,张莉.远程教育网格的设计与应用研究[J].浙江工业大学学报(自然科学版),2005,(33)53-56.