基于开源项目的高校私有云平台

2012-04-29 03:39应毅顾问叶传标
现代教育技术 2012年12期
关键词:私有云数字校园云计算

应毅 顾问 叶传标

【摘要】针对高校传统信息化建设中存在的重复建设、能耗高、信息孤岛等问题进行研究,提出一种基于SPI的校园云计算框架体系,同时阐述云计算在数字校园建设中所带来的节约投资成本、提高资源共享水平、节能减排等六种优势。在对业界流行的云平台实施方案进行分析的基础上,给出一种基于开源项目的高校私有云平台的建设架构,已开展的工作说明该方案是建设智慧校园的有效途径。

【关键词】教育信息化建设;数字校园;云计算;私有云;开源项目

【中图分类号】G40-057【文献标识码】A【论文编号】1009-8097(2012)12-0099-04

一、数字化校园与信息化建设的现状

近年来,高校的教育信息化得到了前所未有的发展,作为信息化的基础设施一一校园网已经融入到教学、科研、实验、管理各个领域中,尽管数字校园和各种应用系统为高校的学生、教师和管理人员提供了很多的服务,节省了时间和精力,但还是存在若干问题:

(1)高校信息化建设需要投入大量的经费来购置硬件资源,由于经费投入不能从学校层面整体规划,加之各部门之间存在“行政壁垒”,几乎每一个业务部门新建一个信息系统都需要重新购置一套服务器设备。同时,硬件设备更新换代的周期越来越短,投入的设备往往使用不了多长时间就面临着淘汰,结果导致资源重复建设,且利用率低、共享率低、维护成本高。

(2)随着信息化进程的不断深入,无论是企业还是高校,都发现能源消耗已经成为IT支出的一项重要组成部分。服务器增加的同时,配套用电量将呈指数级上升,在机房设计布局不合理的情况下,冷却部分所占用的能耗比例更高。数量巨大的计算机设备将会造成大量的能源消耗,这已成为数字校园建设中不容忽视的问题。

(3)信息系统的建设通常都是按峰值情况规划的,但是高校的信息系统有其特殊性,例如招生网站在每年高考结束至填报志愿之前,点击量就相当大,而其他时段并发数就很低,学校的门户网站、教务处的登分查分系统都有类似情况。为了保证高使用率时系统的可靠性,只能进行冗余建设,这造成巨大浪费。

(4)由于没有统一的系统建设规划,缺乏数据标准,各职能部门的数据组织形式和数据管理方式不尽相同,建设的信息系统越多,数据越分散,且不规范、不一致、甚至不准确,共享困难,形成信息孤岛,在需要综合利用数据进行统计分析、数据挖掘、决策支持时往往遇到很大困难,未能充分发挥数字校园应起到的作用。

二、云计算在数字校园建设中的应用

信息化建设的现状不容乐观,在很大程度上阻碍了数字校园的发展。云计算技术恰逢其时地出现了,将云计算运用于教育领域,用其改善教育信息化建设,将有效提高信息资源开发利用水平,推动我国高等教育的发展。

2009年4月,美国国家标准与技术研究院(NIST)提出云计算SPI(SPI是SaaS、PaaS、laaS的首字母缩写)架构体烈”。在此基础上,结合教育信息化技术的特点,本文给出校园云计算的分层架构,如图l所示。最底层为物理硬件,其上是操作系统与虚拟设备,HypervisorManagement负责对虚拟设备的管理,这三者构成IaaS。PaaS主要由服务器和中间件组成。最上层是业务应用和对外接口。

基于上述架构的云计算系统在数字校园建设中具有以下优势:

(1)许多学校都有大量的老式PC,这类计算机多数只是硬件配置低无法升级到新的操作系统或安装新的应用软件而被淘汰,硬件本身还可以正常工作。通过云平台将它们集中起来对外提供服务,就不用再投入大量资金购买昂贵的硬件设备,负担频繁的维护与升级,能极大的节约硬件购买和维护的成本。

(2)通过多节点冗余的方式,云计算系统能够容忍节点错误,自动检测失效节点,并将之排除,以保证系统的正常运行。云计算系统采用分布式存储的方式来存放数据,即为同一份数据存储多个副本。通过以上两种措施,云平台能够保证应用的高可用性和数据的高可靠性。

(3)云计算对基础设施进行了统一的配置和管理,按需进行动态分配,充分利用空闲的计算资源,提高系统的整体计算能力和效率,使服务器的数量减少(每撤掉一台服务器,意味着每年减少11.4吨CO2排放,降低信息技术设备的电源能耗,在节能、环保、降低成本的同时,达到构建低碳型教育的新型学校的目标。

(4)云计算把CPU、存储设备、网络等资源整合在一起形成了一个统一的资源池,这种集中管理利用资源的方式将有效消除资源独立分散造成的资源闲置、资源浪费以及基础设施超负荷现象,使基础设施得到充分利用。

(5)存储资源的共享和教育信息资源的共建能有效避免校内各部门的信息沟通不畅,减少信息孤岛的产生,降低数据冗余,增强数据安全性和一致性,使统一数据管理和校级数据集成成为可能,同时也为学校领导和各管理部门进行OLAP、数据挖掘提供支持。

(6)作为典型云计算应用的虚拟桌面,能够在“云”中为用户提供远程的计算机桌面服务。通过对终端桌面的集中控管,能有效降低机房管理工作量,降低软硬件的管理和维护成本,强化数据安全。长期的大规模的采用桌面虚拟化技术,在延长传统台式机使用寿命的同时,还有利于减少碳足迹(CarbonFootprint),建立绿色的校园机房。

三、基于开源项目的高校云平台

由于需要很强的资源协调能力和一定的技术厚度,目前云计算主要是由几个大公司(如IBM、Dell)倡导和实施,并且大部分应用于商业目的。如果直接采用大厂商成熟的云计算方案,固然实施简单使用方便,但是成本巨大,且后期维护还需大量资金,所以大公司的云计算方案不适合高校云平台的建设。开源项目就成为必然选择。

RedHat是全球最大的开源技术厂商,其开发的Fedora系统是全球使用最多的Linux免费发行版本,开源的KVM和OpenShiR也在由RedHat开发和维护,RedHat的开源策略使得其产品具有较低的成本。

如图2所示,以RedHat的软件产品为主体,给出基于开源项目的高校私有云平台的理论架构,用于指导实践与应用。

最底层由计算服务器、存储设备、网络设备等硬件设施组成,为上层提供最基本的存储和计算服务。

国内院校的信息化建设程度不同,即使是学校内部,也因设备购置的先后顺序,可能既有已经淘汰的廉价PC,也有用于科学计算的高性能服务器。为了屏蔽差异性,需要采用单机虚拟化技术将物理层的设备虚拟成一个巨大的基础设施资源池。单机虚拟化是通过运行多个操作系统把一台计算机当做多台机器使用,提高设备的使用效率。在线迁移是云计算系统保证高可用性的最重要技术,当一个节点超载时,可以将一个操作系统的实例(以及它的应用程序)迁移到一个新的、不怎么繁忙的节点上。基于Linux的进程迁移在同构系统中比较容易实现,但异构节点之间的迁移难度很大。在云计算系统中,通过虚拟化实现节点同构后,可以规避这个难题。所以需要提供同构的运行节点,即运行同一种操作系统的节点,以便简化管理。基于Linux的开源虚拟化软件主要是KVM和Xen。KVM将虚拟化技术作为操作系统的一种特性集成到Linux内核中,现在由RedHat开发和维护,建议在部署虚拟机时大量使用。为了支持Citrix的虚拟桌面解决方案,也可以部署少量的Xen虚拟机。尽管大部分通用的云计算系统都依赖虚拟化技术提供同构的虚拟节点,但有一些专用的云计算系统(如Hadoop)也可以不需要虚拟化技术的支撑。不能运行KVM的极老式PC可以直接安装Linux,建议使用免费的Fedora操作系统(RedHatLinux的社区版本)。以上三种部署方案可以根据实际情况选择使用。

虚拟设备的管理主要由OpenStack完成。OpenStack由NASA(美国国家航空航天局)和Rackspace合作开发,于2010年7月开源,它主要分为云计算(Nova)和云存储(Swift)两个模块。所做的工作主要是对虚拟设备进行统一配置,统一管理,并实时监测负载需求,自动分配基础设施,达到弹性平衡资源、节能降耗的目的。OpcnStack默认的虚拟化引擎是KVM,但也提供对Xen的支持。

高校云平台的PaaS主要由OpenShift、Hadoop、CitrixVDI(VirtualDesktopInfrastructure)组成。

通用性、可复用是传统中间件的重要特征,大部分的PaaS开源技术都是在传统中间件的基础上发展而来的。OpenShift源自RedHat,于2012年5月开源。由于RedHat的开源背景,OpenShiff支持几乎所有的主流开发语言和框架,包括:Java/JavaEE、PHP/Zend、Python、Perl、Ruby/RubyonRails、Seam、Hibernate,还集成了常用的AppServer和DBServer:JBoss、MySQL、mongoDB(NoSQL数据库)。Openshift通过为开发人员提供在语言、框架和云上的更多选择,使开发人员可以构建、测试、运行和管理B/S应用程序,在此标准化平台上二次开发SaaS应用可以省去基础性、重复性的工作,一般可减少60~70%的工作量。当然,OpenShift除了为应用层提供软件的支撑平台外,还可以通过互联网向用户直接提供软件开发环境。

与OpenShiff不同,Hadoop只是一种基于批处理技术的PaaS开源产品,由Java语言编写,可以直接运行在Linux之上,也可以运行在虚拟机上。Hadoop由HadoopCommon、HDFS、HadoopMapReduce核心部件组成。MapReducetsl是把以往通用的以MPI/PVM为基础的并行计算技术理念加以简化和提炼后,形成的能并发处理海量数据的并行编程模型,最早由Google于2004年提出。以此为基础,Hadoop实现了海量数据的管理和分布式数据处理,使传统的分布式计算中的数据分割和错误管理等复杂问题解决于系统内部,从而取得较好的松耦合型数据处理效果和系统伸缩性。

CitrixVDI由XenDesktop和XenApp组成,构建在Xen虚拟机上。XenDesktop技术将操作系统的安装和运行分离开来,当用户登录桌面时,实际登录的是Desktop服务器,服务器这时为用户开辟了一个空间,在这个空间中调入操作系统的内存映像供用户使用,所以后台只需管理一个桌面系统。XenApp技术将应用与操作系统分离,应用安装在App服务器上,用户打开一个应用实际上是在App服务器上创建一个应用程序的实例。

上述laaS、PaaS组件中除了CitrixVDI外,KVM、Xen、Fedora、OpenStack、OpenShift、Hadoop皆是开源产品,这将大大降低建设高校私有云平台的成本。

高校云平台的最上层主要提供四种服务:在线应用、云计算辅助教学(CloudComputingAssistedInstructions)、高性能计算(HighPerformanceComputing)和虚拟教室。

在线应用提供最为接近用户的服务——B/S应用程序。在OpenShift的支持下,原先的门户网站、办公自动化系统、数字图书馆等信息系统都可以移植到云平台下。CCAI主要构建在OpenShift之上,教师利用云平台提供的服务,构建个性化教学的信息化环境,教育者充当云服务管理者的角色,整合、归类和管理教育信息资源,开展教学设计,优化教学过程,提高教学质量。Hadoop提供了HPC所需的计算和存储能力,在线应用的集中和CCAI的推广解决了信息孤岛问题,使数据集成、资源共享成为常态。在此基础上,可以使用HPC进行综合数据分析、BigData挖掘,同时它也是一个廉价的科学计算平台。虚拟教室由虚拟桌面和虚拟实验室组成,虚拟桌面需要得到CitrixVDI的支持,实验室都可从“云”中获得。

除此之外,SaaS层还需要留出开放接口,以便云平台为校园物联网提供计算和存储服务。

四、挑战与建议

以上述私有云平台框架为理论基础,己开始落地实施:基于物理Fedora和KVM虚拟机的Hadoop系统己搭建完成,进行了初步的大数据处理工作,主要是云框架的应用和MapReduce算法的改进:OpenStack的安装和对KVM管理的技术验证工作己接近完成;OpenShift正处于部署实验阶段。

虽然云平台的建设已开展部分工作,但仍旧面临诸多挑战。高校私有云有其自身特点:由于都是内部使用,所以不必考虑计费、多租户等问题;大部分组件使用开源产品,虽然节约了成本,但是缺乏技术支持,需要进行长期的技术储备;校内院系及各职能机构长期的各自为政会成为统一建设的人为阻碍,所以需要从校级高度成立专职的IT部门,对全校云平台的建设进行整体规划,尤其是中长期建设规划,并从政策和经费上支持以云计算构建的公共服务体系,不断提高数字校园水平。

由于云计算能带来信息资源、计算资源、存储资源甚至包括软件资源在内的快捷方便的共享,所以在云平台建设中,初期立足本校资源,长期应校校联合,建立起较大的区域云或院校联合云,以达到各高校IT资源的有效共享和应用。

五、结束语

云计算应用于数字校园是高校信息化建设的里程碑,使用开源项目构建私有云平台既能解决信息化建设中的现存问题,又能在获得云计算优势的同时将建设成本最小化。本文主要在这方面进行了研究,已开展的工作说明这个建设方向具有可行性,但同时也存在巨大挑战,建设部门需充分发挥创新性与创造性,把握住云计算的实质内涵及发展趋势,努力促进我国教育信息化建设和数字校园创新发展,争取智慧校园早日实现。

猜你喜欢
私有云数字校园云计算
企业创新私有云平台的搭建探究
论数字校园环境下高校教学资源的整合运行策略
高校私有云的架构和实施
虚拟网络建设思考与实现
校园App的设计与营销
基于Direct3D的三维虚拟校园交互式漫游系统
“互联网+”背景下高职院校数字校园建设的探索与实践
基于云计算的移动学习平台的设计
实验云:理论教学与实验教学深度融合的助推器
云计算中的存储虚拟化技术应用