基于云计算构建高校信息资源共享平台的设计方案

2013-08-10 07:56姜晓旭
中国医学教育技术 2013年1期
关键词:资源共享虚拟化服务器

姜晓旭,罗 辉

第四军医大学教育技术中心,西安 710032

随着信息技术在高校信息资源建设中的普及与应用,高校信息资源建设成果显著。在数量激增的基础上,信息资源建设正朝向内容多元化、形式多样化、结构复杂化方向发展。面对纷繁复杂的海量信息资源,有效提高服务质量,发挥资源最大效能,是对资源深层开发和利用的更高要求。云计算作为一种新兴的共享基础架构方法,在高校信息资源建设与应用方面大有可为。

1 高校信息资源建设现状

1.1 基础设施利用率低,造成资源浪费

高校为支撑信息资源建设的数据中心配备了大量的服务器、网络和存储等基础设施。然而,这些设备更新换代很快,一旦利用率低,就会造成无形的资源浪费,增加数据中心建设成本。

1.2 信息资源重复建设,无法真正实现资源共享

高校资源建设尚未遵照统一的技术标准规范,导致数据异构、格式冲突、可扩展性和通用性差,缺乏开放的互操作接口,“信息孤岛”现象层出不穷,优质信息资源难以共享。

1.3 信息资源分布不均,资源使用效率较低

不同区域间高校的信息资源建设水平良莠不齐。国内一些知名高校拥有丰富的信息资源,但仅能使有限区域内的少数人获益,供大于求会造成优质信息资源闲置。而一些普通高校由于缺乏有效的共享渠道和机制,难以获取优质的信息资源而造成资源的紧缺[1]。

1.4 信息资源运维难度大、成本高

面对复杂多变的信息环境,高校不仅面临着高成本的人力、物力投入,还面临着更高难度的系统运维。单纯增加人员管理,难以提高系统运维的效率。一旦发生故障很难快速恢复,从根本上来说系统的安全稳定性有待提高。

2 云计算在促进高校信息资源共享中的优势

云计算作为一种新型的服务交付和使用模式,通过网络以按需、易扩展的方式向用户提供所需的硬件、平台、软件和网络资源[2]。提供资源的网络被称为“云”,“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取、按需使用和扩展、按使用量付费。这种特性经常被称为像水电一样使用IT基础设施、软件和资源服务。

2.1 虚拟化技术提高了高校基础设施利用率

虚拟化技术作为云计算的核心技术之一,将高校现有的硬件设备整合为虚拟资源池,屏蔽服务器、网络、存储等物理设备间的差异,动态部署、分配给不同的应用和服务,提高底层资源的利用率,降低建设成本。实验证明,采用虚拟化技术能使每台服务器的平均利用率从7%提高到68% ~80%;部署时间从小时级降低到分钟级;服务器重建和应用加载时间从20 h~40 h降低到15 min~30 min;建设成本节约 30%以上[3]。

2.2 云存储技术提高了高校信息资源共享能力

将高校物理位置分散的异构信息资源进行整合,存储在“云”这个庞大的计算与存储集群中,由云端集中管理和调度。实现信息资源的分布存储和集中管理,避免信息资源重复建设,消除信息孤岛,共同营造一个信息共享空间。例如:Amazon Simple Storage Service(S3)是Amazon公司提供的基于云平台的网络存储服务。借助S3,用户可将数据存放到存储云上,通过互联网进行访问和管理,可以节省用户维护数据的成本。通过S3提供的REST或者SOAP接口,云平台中的应用程序也可以自动访问、调用存储云中的数据。

2.3 并行处理和分布式计算技术提供了强大的计算能力,且动态可扩展

通过大规模分布式文件系统,将信息资源以分块和多副本备份的方式分散存储在云中,对数据的分析处理也以大规模并行计算和分布式计算技术实现。例如:谷歌文件系统(google file system,GFS)和Hadoop分布式文件系统(hadoop distributed file system,HDFS)共同采用的MapReduce编程模型,运行于一个虚拟服务器集群上,采用并行处理的方式将数据或应用程序的功能分割成若干个模块,由网络上多台计算机协同完成。此外,云平台提供各种开放API支持异构接入,根据需求灵活扩展,自动同步、实时更新信息资源,为在更广的范围内实现信息资源共享创造条件。

2.4 云计算营造稳定安全的信息空间

通过云计算实现分布式、异构信息资源的负载均衡,避免网络过载。利用冗余备份、容错容灾等技术避免因操作不当而造成的数据丢失、破坏以及病毒入侵、服务中断、硬件损坏等威胁高校信息资源共建共享的安全问题。同时,也使用户从复杂、专业性极强的网络安全与系统运维中解脱出来,而专注于资源应用本身。现有的云服务提供商如Amazon、IBM、Google大多提供了集VPN、身份认证、数据加密、冗余备份、安全存储等技术于一体的安全保障体系,用于保障云平台的安全性和服务的连续性。

3 高校信息资源共享云平台的核心架构

结合高校信息资源建设存在的问题及云计算在资源建设中的优势,拟采用云计算技术构建高校信息资源共享云平台。设计理念是以面向服务的架构(SOA)为基础。对信息资源实施分布存储和集中管理为方法,以实现信息资源开放共享为目的。其体系架构自下而上分为物理层、平台层、资源整合层、应用层和访问层(如图1所示)。

3.1 物理层

物理层也称基础设施层,主要负责为整个平台的正常运行提供硬件支持。主要包含服务器集群、网络设施和高性能存储集群等。利用虚拟化软件将这些设备虚拟为一个大型资源池,屏蔽各类不同型号设备之间的差异,对上层提供统一的服务接口,以基础设施即服务(IaaS)的方式向上提供动态可伸缩的物理资源。

3.2 平台层

平台层以平台即服务(PaaS)的方式提供上层应用程序开发环境、运行环境、数据库环境、开放API和Web Service模块。开放API是一种新型Web 2.0服务模式,利用这些API可以对分散资源和服务进行整合,能带来具有新价值的Web服务[4]。将平台层部署在物理层提供的虚拟硬件资源上,构建相互隔离的、基于不同业务需求的虚拟机,并且通过多机冗余备份,提高数据的安全性和服务的可用性。

图1 高校信息资源共享云平台体系架构

3.3 资源整合层

资源整合层介于平台层和应用层之间,是高校信息资源共享平台不可或缺的组成部分。该层主要实现各种元数据库、索引库的构建,借助一系列标准化辅助工具(导入导出工具、编目工具、元数据生成工具等[5])进行资源元数据的生成、编辑、转换、导入、导出等操作。将高校分散、异构的多媒体素材、网络课程、视频等各类信息资源进行标准化,整合成统一的信息资源视图,简化高校信息资源管理,同时为上层应用服务的实现打好基础。值得指出的是,在对高校信息资源进行标准化时,必须严格遵循相关的技术标准规范,使标准化的资源具有规范性和互操作性。在构建云平台前期,已结合国内外资源建设现行标准,构建了教育资源标准化的概念模型及元数据实例表,为资源的标准化做好了准备。借助元数据生成工具对资源进行元数据提取的流程(如图2 所示)[6]。

图2 元数据提取流程

3.4 应用层

应用层包含管理中间件和应用服务两部分。在管理中间件的统一调控下,使资源按照用户需求进行安全、高效地配置,保证资源共享云平台发挥最佳效能。在此基础上,应用服务部分再根据用户需求灵活定制个性化的资源应用系统。用户只需通过云平台提供的用户交互接口进行一次登录,就可实现对校内所有信息资源系统的登录和访问[7]。

3.5 访问层

访问层包括用户自助服务门户和云平台管理门户,是不同身份角色的用户访问云平台的入口。用户通过SaaS方式获取个性化云服务,系统管理员负责统一身份认证和系统管理。此外,各种软硬件、应用程序均存储、运行在云中,而不是本地计算机。用户不需要配置高端设备,利用现有的各种移动设备如智能手机、笔记本电脑、平板电脑通过网络即可接入云平台。

4 高校信息资源共享云平台的实现技术与实例

高校信息资源共享云平台的实现主要涉及虚拟化技术、分布式存储、并行计算等关键技术在云平台上的具体实现。下面结合具体实例加以介绍:

4.1 物理层

物理层主要提供IaaS服务,实现的关键技术是虚拟化技术,包括对服务器、网络和存储设备的虚拟化。目前比较成熟的硬件虚拟化软件有VMware公司的vSphere系列、微软公司的Hyper-V系列和思科公司的XenServer平台[8]。这些虚拟化软件提供对物理设备的系统管理。以服务器虚拟化为例,将服务器虚拟化为多个虚拟机,根据上层应用需求分配合适的虚拟硬件资源,实现资源的统一调度以及不同进程之间的负载均衡,提高服务器利用率。在对服务器进行虚拟化时,可借助市场主流虚拟化软件如VMware ESX将虚拟化平台直接架构在物理层之上,客户机原有OS无需做任何修改即可被划分成多个相互独立的虚拟OS相互隔离运行于虚拟化平台上。由VMware ESX构建的虚拟机架构主要包括两大模块:虚拟机管理器(VMM)负责对硬件资源进行抽象,包括CPU和内存等的虚拟化。VMkermel作为监控平台,负责对虚拟机进行托管以及对物理资源的管理和调度。利用VMware ESX进行虚拟化的应用实例如图3所示[9]。

4.2 平台层

图3 服务器虚拟化实例

平台层主要提供PaaS服务,实现的关键技术是分布式计算和并行处理,主要负责解决云平台服务器集群间的协同工作,同时提供超大规模计算和海量存储能力。可借助现有比较成熟的Google App Engine(GAE)在线应用平台,提供在线开发、测试、部署、运行网络应用程序、Microsoft Windows Azure平台为应用程序提供运行环境、Salsforce.com应用程序开发平台以及Hadoop平台进行平台层的构建。以Hadoop平台为例,Hadoop分布式文件系统HDFS用于实现大规模数据可靠的分布式读写,它是一个结构化、可扩展、具体日志功能,适用于大数据集应用程序的分布式文件系统,具有高效的数据读写和容错能力[10]。它以文件和目录的形式组织用户数据,支持创建、删除、修改、复制文件和目录等操作,用户可通过命令接口或HTTP浏览器即可浏览HDFS文件。HBase分布式数据库运行于HDFS之上,作为数据的实际存放容器,具有良好的伸缩性、有序、高可用性。MapReduce分布式计算模型用于实现大规模数据计算,它是一个数据分析任务的编程模型,提供了在大规模计算机集群上对海量数据进行分布式并行处理的方法,采用主从结构,主服务器负责调度所有任务,子服务器执行被调配的Map任务和Reduce任务。利用Hadoop平台构建平台层的实例如图4所示。

图4 Hadoop分布式计算实例

4.3 应用层

应用层主要提供SaaS服务,面向用户提供个性化定制、资源导航、智能检索等服务,具有统一接口界面、单点登录和一站式访问等特性。保证实现的关键技术有Web 2.0、多租户技术、认证安全、定价计费、服务整合、开发定制等技术[11]。Web 2.0技术作为新一代互联网技术,具有交互性、社会性等特征,用于实现系统界面和用户接口的封装,以提高界面的交互性和灵活性。多租户技术实现用户共享同一资源池中的软硬件资源,按需使用资源并能够进行灵活配置,且用户之间相互隔离、互不影响。以Force.com多租户架构的实现为例,它通过元数据驱动的体系结构,实现数据、公共元数据和用户专用元数据等组成的共享数据库。在运行时引擎的调度下使每个用户的数据和定制的专用元数据之间相互隔离,能够按照用户需求个性化定制应用程序,实现高性能、可扩展、按需定制的多租户应用。利用Force.com多租户技术构建多租户应用的实例如图5所示。

图5 基于元数据驱动的多租户应用实例

文章结合云计算技术构建了高校信息资源共享云平台,并对其体系架构及实现进行了深入剖析。该平台的实现需要虚拟化、分布式计算、多租户等多种关键技术之间的协同,借助现有比较成熟的云平台应用实例构建高校信息资源共享云平台,可缩短平台开发周期、为平台的上线应用提供良好的技术支持。此设计方案旨在将云计算技术应用于高校信息资源建设,以期为资源共建共享提供新思路,其应用效果还应在实践运行中得以验证,也是下一步需要完成的重点工作。当然,高校信息资源共享云平台的构建也同样面临着挑战。云计算的标准化尚未完善,支撑云平台运行的云服务商尚未达成统一的技术标准、服务标准。在服务能力、服务质量、运行维护和能效管理等方面参差不齐,同时还面临不同云平台的数据和应用无法相互迁移,造成云平台孤立、云服务商垄断等问题。因而,加快云计算技术标准化,为云平台提供统一标准的接口,为用户提供统一标准的云服务,成为今后亟待解决的问题。

[1]沈丹丹,江正.对高校教育信息资源共享策略的思考[J].软件导刊,2010,(11):81

[2]褚军亮,宋立荣.云计算用于网络科技信息资源整合服务初探[J].中国科技资源导刊,2010,11(6):43

[3]陈江静.云计算环境下地方高校信息资源共享的最大化[J].科技情报开发与经济,2011,(15):84

[4]王文清,陈凌.CALIS数字图书馆云服务平台模型[J].大学图书馆学报,2009,(5):13

[5]严冰,单从凯.数字化学习资源中心建设的探索与创新[J].中国远程教育,2011,(8):45

[6]苗丽,彭月英,裴国庆.基于语义网格的高校信息资源共享探索[J].广西师范学院学报,2008,(3):85

[7]孙荣,孟凡立,张慰.论数字校园环境下高校教学资源的整合运行策略[J].现代教育技术,2012,(5):48

[8]雷万云.云计算技术、平台及应用案例[M].北京:清华大学出版社,2011:5

[9]虚拟化与云计算小组.云计算宝典技术与实践[M].北京:电子工业出版社,2011:152

[10]王翔,潘郁.基于云计算的协同技术创新平台[J].计算机工程与应用,2011,47(15):59

[11]虚拟化与云计算小组.云计算宝典技术与实践[M].北京:电子工业出版社,2011:298

猜你喜欢
资源共享虚拟化服务器
交通运输数据资源共享交换体系探究与实现
福建省交通运输信息资源共享平台
服务器组功能的使用
人力资源共享服务模式研究
通信控制服务器(CCS)维护终端的设计与实现
PowerTCP Server Tool
针对大数据背景下工程造价信息的资源共享
基于OpenStack虚拟化网络管理平台的设计与实现
对基于Docker的虚拟化技术的几点探讨
浅析虚拟化技术的安全保障