张明
摘要:介绍了云计算的基础知识:定义、分类、产生和发展、特点以及核心技术。通过分析传统实验中心在建设与管理方面存在的问题与不足,提出了一种基于云计算的实验中心建设与管理新模型。其在可靠性、可用性、扩展性、经济性、安全性、方便性等诸多方面都具有前者无法比拟的特点和优势,具有实用和推广价值。
关键词:云计算;实验中心;实验室;虚拟化
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)10-0059-04
自从2006年8月9日,Google首席执行官埃里克.施密特在搜索引擎大会上首次提出“云计算”(Cloud Computing)的概念以来,短短几年时间,云计算得到了前所未有的重视和发展,并且一些基于云计算的产品也从“云端”的概念变成了“落地”的实用产品,基于云计算思想和技术的产品肯定会越来越多,并且会逐渐改变人们的开发和使用方式。
1 云计算
云计算是并行计算、分布式计算、网格计算的延伸、发展和整合,是虚拟化、效用计算、IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)等概念混合演化的结果,云计算的基本架构如图1所示。在普通用户的应用中,“云盘”、“云安全”、“云存储”等就是云计算生根落地的产物。
1.1 云计算的定义
云计算是二十一世纪初提出的一个新概念,至今为止,云计算仍没有一个统一的标准定义。根据维基百科的定义,狭义的云计算是指IT(Information Technology,信息技术)基础设施的交付和使用模式,是指通过网络以按需、易扩展的方式获得所需的资源(包括硬件、平台、软件)。其中提供资源的网络被称为“云”,“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取、按需使用、随时扩展、按使用付费。广义的云计算是指服务的交付和使用模式,是指通过网络以按需、易扩展的方式获得所需的服务[1]。
1.2 云计算的分类
1)按照云计算的建设、运营和使用对象的不同,云计算可以分为公有云、私有云和混合云。
① 公有云:云服务提供商建设、运营供其他用户使用的云计算网络,称之为公有云。
② 私有云:企事业单位自己建设、运营供自己使用的云计算网络,称之为私有云。
③ 混合云:企事业单位使用的云服务中,既有云服务提供商建设运营的云计算网络,也有自己建设运营的云计算网络,将其称之为混合云。
2)按照所提供的云服务的类型不同,云计算可以分为基础设施即服务(Infrastructure as a Service, IaaS)、平台即服务(Platform as a Service, PaaS)和软件即服务(Software as a Service, SaaS)。
① IaaS 是指以服务的形式提供主机、存储和网络等虚拟基础资源。
② PaaS 是指以服务的形式提供中间件、服务引擎、开发环境和开发工具等平台资源。
③ SaaS 是指以服务的形式为企事业单位或个人用户提供软件资源。
1.3 云计算的产生和发展
2006年8月9日,Google首席执行官埃里克.施密特(Eric Schmidt)在搜索引擎大会上首次提出了“云计算”(Cloud Computing)的概念,从此云计算得到了广泛的重视和快速的发展[2]。
1)云计算在国外的发展
2007年8月,IBM推出了“蓝云(Blue Cloud)”计划,2008年8月,IBM投资3.6亿美元在美国北卡罗来纳州开始建立云计算数据中心;2007年10月,Google在全球宣布了云计划,并且与IBM合作,将全球很多大学纳入云计算计划;2007年,Amazon开发了“弹性计算云(Elastic Computer Cloud,EC2)”服务,用户可以按需购买数据中心的处理能力;2007年11月,Yahoo建立了一个小规模的云,2008年7月,又与HP、Intel以及伊利诺斯州大学香槟分校、新加坡信息通信发展管理局、德国卡尔斯鲁理工学院共同建立了开源试验场Open Cirrus进行云计算方面的研究和教育;Microsoft开发了云平台Azure[3-4]。
2)云计算在国内的发展
2008年3月,Google首席执行官埃里克.施密特在北京访问期间,宣布在中国推出云计算计划,并且与清华大学合作开发大规模数据处理课程;2008年5月和6月,IBM先后在无锡太湖新城科教产业园和北京IBM创新中心建设了两个云计算中心;2008年11月,广东电子工业研究院与东莞松山湖科技产业园共同建立了云计算平台;后来,中国移动通信研究院推出了名为“BigCloud”的云计算平台,提供并行数据挖掘、云存储、大容量数据库、搜索引擎等业务;华为提供端到端的云计算解决方案;阿里巴巴推出了“阿里云”;百度推出了基于云计算的“框计算”;金山、奇虎360、瑞星等安全公司也相应地推出了各自的“云安全”服务[5-6]。
1.4 云计算的特点
相比较于并行计算、分布式计算和网格计算,云计算具有如下特点[1-7]:
1)超级规模。“云”可以做到相当大的规模,一个“云”可以整合大量的服务器等网络资源,而且不同“云”之间也可以整合。从理论上讲,它可以整合无限多的资源,只受经济因素的影响。
2)虚拟化。云计算支持轻量级的客户端,即用户在任意时间、任意位置、使用任意终端设备,只要连接网络就可以从云端获取相应的服务。对使用者而言,“云”被封装为一个抽象的实体,为用户提供各种所需的服务,对用户透明。
3)高可扩展性。一方面,云计算可以兼容不同硬件厂商的产品。另一方面,“云”的规模可以动态伸缩,提供给用户的服务也可以动态伸缩,依据用户的需求而变。
4)高可靠性。“云”使用了数据冗余备份、多副本容错、计算节点同构可互换等技术以及专业的管理和严格的权限措施来保障所提供服务的高可靠性,用户使用云计算比使用本地计算机更加可靠。
5)通用性。云计算不针对特定的行业、服务和应用,在云端就可以开发出不同的服务和应用以满足不同的需求。
6)经济性。一方面“云”可以由大量的廉价网络节点来构成,企业无需自建昂贵的数据中心;另一方面,用户只需按需购买服务,不会造成浪费。仅在需要资源时获取资源并仅为所使用的资源付费,可以减少投资资本和运营成本
7)方便性。云计算对用户端所使用的设备要求低,计算机、平板电脑以及智能手机都可以随时随地通过网络接入云计算,可以在不同设备间实现数据和应用的共享。
1.5 云计算的核心技术
云计算的实质是一种以数据和处理能力为中心的密集型计算模式,它融合了多项技术,核心技术主要有虚拟化技术、资源管理技术、信息安全技术、编程模式和平台管理技术等[8][9]。
1)虚拟化技术
虚拟化是云计算最重要的核心技术之一,它为云计算服务提供基础架构层面的支撑,没有虚拟化技术也就没有云计算服务的落地与成功。虚拟化是一种在软件中仿真计算机硬件,为用户提供虚拟资源的服务形式。虚拟化技术打破了系统各硬件间的物理划分,实现架构的动态化,物理资源的集中管理和使用。虚拟化的最大好处是合理调配计算机资源,使其更加高效,同时增强系统的弹性和灵活性、降低成本、改进服务、提高资源利用效率。
在云计算中,虚拟化分为两种模式。其一是将一台性能强劲的服务器虚拟为多个独立的虚拟服务器即虚拟机,服务不同的用户。其二是将多个服务器虚拟为一个更加强劲的虚拟服务器,完成特定的功能。这两种模式的核心都是统一管理,动态分配资源,提高资源利用率。
2)资源管理技术
资源管理技术主要包括数据存储技术和管理技术。云计算的一个主要特点是能够快速、高效地处理海量数据,为了保证数据的高可靠性,云计算采用分布式数据存储技术,将数据存储在不同的物理设备中。这样不仅摆脱了硬件设备的限制,同时提高了扩展性,能够快速响应用户需求的变化。目前,Google的GFS(Google File System)和Hadoop开发的开源系统HDFS(Hadoop Distributed File System)是比较常用的云计算分布式存储系统。
云计算不但要有大量的存储设备、网络设备,而且要有效地对这些设备和数据进行管理,不仅要保证数据的存储和访问,还要能够对海量数据进行特定的检索和分析。Google的BT(Big Table)数据管理技术和Hadoop开发的开源数据管理系统HBase是比较常用的云计算数据管理技术。另外,云计算系统中的资源非常庞大,硬件设备繁多,并且有可能跨跃多个地域,资源管理技术也要有效地管理这些资源,保证正常提供服务。
3)信息安全技术
云计算中的信息安全技术主要包括数据不能丢失和数据不能被非法或非授权访问。调查数据表明,安全问题已经成为阻碍云计算发展的最主要因素之一。要保证云计算能够长期、稳定、快速发展,安全是首先需要解决的问题。在云计算体系中,涉及到网络安全、服务器安全、软件安全、系统安全等等。目前,在云计算中常用采用混合云、私有云、身份验证、访问监测、数据备份、数据冗余等安全技术。
4)编程模式
云计算是一个多用户、多任务、支持并发处理的系统,高效、简捷、快速是其核心理念,旨在通过网络把强大的服务器计算资源方便地分发到终端用户,同时保证低成本和良好的用户体验。因此,相对于传统应用,其编程模式也应改变,云计算中广泛采用分布式并行编程模式,Google的MapReduce是当前主流的云计算编程模式。MapReduce的主要思想是将要执行的任务分解成Map(映射)和Reduce(化简),Map将数据切割成不相关的区块,分配给大量主机进行处理,达到分布式运算的效果,然后通过Reduce将结果汇总输出。
5)平台管理技术
云计算系统中资源规模庞大,服务器、网络设备众多并且分布在不同的区域,系统上同时运行着大量的应用,这就需要一套有效的平台管理技术,实现硬件资源和软件资源的统一部署、统一管理、统一分配、统一监控,保证整个系统正常、有序、高效地运行。
2 传统的实验中心建设与管理现状
传统的实验中心基本架构如图2所示。通常,一个单位的实验中心下设多个实验室,每个实验室以及办公区相对独立,各自通过代理或交换机接入校园网,再通过校园网接入Internet。每个实验室均单独部署和建设,一般由服务器、交换机等网络设备、计算机以及辅助设备构成。
在实际建设与管理过程中,传统的实验中心主要存在如下问题:
1)每个实验室相对独立,不同的实验室之间无法进行资源共享,办公区也无法访问各个实验室的软硬件资源,造成资源的浪费与使用上的不便。
2)每个实验室单独规划、建设和管理,功能比较单一,因此会造成有些实验室利用率很高甚至出现供不应求的情况,而有些实验室利用率很低甚至出现常年闲置的情况。
3)每个实验室单独购置服务器,造成服务器硬件成本高。多个应用程序无法兼容安装在一台服务器上或同一个网络操作系统中,会造成一个实验室为了满足要求购置多服务器的情况,而且服务器的资源无法动态调整,无法负载均衡。
4)实验室一旦建设完成,难于按业务进行扩展,应用部署时间长,升级复杂。系统的可靠性低,无法即时应对突发性事件,数据容易丢失等。
5)实验室中的每台计算机要安装大量的应用软件,以满足不同课程及教师的上课、实习和实训需求,导致计算机启动速度慢,运行速度慢等现象。
6)遇到全国计算机等级考试或承接各种技能竞赛时,为了不影响正常的教学科研,通常都要通宵加班,安装考试或竞赛要求的系统和应用软件,之后又需要加班恢复到之前的系统。
7)进行系统补丁、杀毒软件和病毒库升级更新、应用程序升级更新时,实验中心管理人员需要逐个实验室逐台计算机进行更新和维护,工作量大。
8)不同实验室的建设时间不一样,硬件的品牌和型号不一样,开设的课程和实验也不一样,这就需要安装不同的操作系统和应用程序,进一步加重了实验中心管理人员的工作量。
3 基于云计算的实验中心建设与管理
基于上述的分析,传统的实验中心在建设与管理方面主要存在资源无法动态调整、无法充分共享、无法负载均衡;实验室及硬件设备利用率高低不一;管理维护不便、工作量大等不足。为此,充分利用云计算的优势,提出了一种基于云计算的实验中心建设与管理新模型。
3.1 云计算实验中心基本架构
基于云计算思想的实验中心基本架构如图3所示。
1)云数据中心
实验中心的存储磁盘阵列以及服务器进行集中的建设与管理,汇聚成云数据中心,为所有的实验室以及办公区提供存储和各种服务,不再为每个实验室单独配备磁盘阵列和服务器等共享型的硬件资源。
2)云数据中心虚拟化技术
一方面,服务器虚拟化,即将服务器物理资源虚拟化为逻辑资源,从而一台服务器可以变成几台甚至几十台相互独立的虚拟服务器(虚拟机),让CPU、磁盘、输入输出等硬件资源可以动态管理、动态调控,而且每个虚拟机可以安装不同的操作系统和应用程序,为不同的用户群体提供相互独立的服务,不再受限于物理设备的限制。另一方面,磁盘阵列虚拟化,即把一个磁盘阵列资源虚拟化为逻辑资源,变成大量的相互独立的硬盘阵列,为学生和教职工提供相互隔离的云存储空间。
3)云数据中心管理平台
云数据中心通过管理平台对服务器和磁盘阵列等硬件资源进行统一、集中式的管理与维护,实现集中管理、按需扩展、弹性计算、负载均衡、灾难恢复、性能监测等功能。
3.2 云计算实验中心的优势分析
1)服务器、磁盘阵列整合,实现完全的资源共享
将所有的磁盘阵列和服务器等硬件共享设备进行整合,统一规划、部署、建设成为云数据中心,这样每个实验室和办公区均可以随时访问云数据中心中的共享资源,打破了单一实验室单一功能的限制,进而均衡和提高了各个实验室的利用率。
2)云数据中心集中管理,按需扩展,安全可靠
云数据中心的硬件设备可以根据整个实验中心的需求变化进行规划和建设,解决了设备浪费、负载不均衡等现象。另外,方便按需扩展软硬件服务,通过冗余备份、虚拟服务器迁移等一系列安全措施,提高整个系统的安全性、可用性和可靠性。
通过云数据中心管理平台进行集中管理,方便、快捷、安全,而且可以即时按需扩展。
3)应用虚拟化技术进一步提高了设备利用率,节约成本
一方面,服务器应用虚拟化技术后,一台服务器变成多台虚拟服务器,每台虚拟服务器可以安装不同的操作系统和应用程序,为不同的用户群体提供相对独立的服务,从而提高了数据中心设备的利用率。另一方面,在各个实验室的客户机中应用虚拟化技术后,可以将程序、数据等放在数据中心运行,然后通过虚拟化技术推送到客户机,减轻了客户机的硬件要求,从而使一些老旧计算机也可以承担实验任务,延长了计算机的服务年限,节约了建设成本。
4)管理员集中管理维护,提高了工作效率
应用虚拟化集中管理以后,实验中心所有实验室的设备都可以通过云数据中心统管,不管是全国计算机考级考试、计算机技能竞赛等更换系统和应用程序,还是平常系统打补丁、软件升级更新等都可以通过管理平台集中实现,不再需要每个实验室每台计算机单独进行,提高了整个管理水平和工作效率。
4 结束语
通过分析传统的实验中心在建设与管理方面存在的问题和不足,结合云计算的优势,提出了一种基于云计算的实验中心建设与管理新模型。这种模型不但解决了传统实验中心在建设与管理方面的不足,而且在建设成本、资源管理与共享、可靠性、可用性、扩展性、安全性等方面都具有明显的优势,具有重要的现实意义和推广价值。
参考文献:
[1] 侯楠.基于云计算的异常检测研究[D]. 南京:南京邮电大学,2010.
[2] 窦立莉.基于云计算的高校信息化建设应用[J].中国高新技术企业,2011(22):51-52.
[3] 刘昶言.云计算中混合云互通及其资源管理机制研究[D]. 北京: 北京邮电大学,2010.
[4] 陈康,郑纬民.云计算:系统实例与研究现状[J].软件学报,2009,20(5):1337-1348.
[5] 肖斐.虚拟化云计算中资源管理的研究与实现[D]. 西安: 西安电子科技大学,2010.
[6] 李铮.多媒体云计算平台关键技术研究[D].合肥: 中国科学技术大学,2011.
[7] 梁焱.基于云计算的智慧黄山景区数据基础设施规划方案[J].中国园林,2011(9):26-29.
[8] 王含章.可信云计算平台模型的研究及其改进[D].中国科学技术大学,2011.
[9] 中国外包.云计算的核心技术有哪些?[EB/OL]. http://www.chnsourcing.com.cn/outsourcing-news/article/86554.html.