浅谈云计算的现状及其主要技术

2013-12-10 03:40张贵强等
科学时代·上半月 2013年11期
关键词:数据存储虚拟化云计算

张贵强等

【摘 要】云计算是一种新型的计算模式,是IT产业发展的新阶段。主要介绍了云计算的发展和特点,分析了云计算的体系结构和关键技术,包括:数据存储技术、虚拟化技术和数据管理技术。

【关键词】云计算;体系构架;虚拟化;数据存储

随着多核处理器、虚拟化、分布式存储等技术的迅速发展,产生了一种新的计算模式——云计算,它是分布式计算、并行计算和网格计算的发展。云计算概念发端于Google和Amazon等超大规模的互联网公司,随着这些公司业务的不断成功,作为其支撑技术的云计算也得到了业界的普遍认可,现如今,云计算已被普遍认为是IT产业发展的新阶段。据IDC ( 互联网数据中心) 估计,从2009年到2013年四年内,云计算能为全球带来8000亿美元的新业务收入,为我国带来超过11050亿人民币的新业务收入。所以可以毫不夸张地说,云计算代表着未来技术的发展趋势,云计算将变革整个IT行业。

1.什么是云计算

1.1 云计算的概念

从20世纪80年代个人电脑的发展开始,PC的计算能力不断增强,用一台PC就可以存放个人需要的所有数据并完成处理工作,但在互联网时代,一家互联网公司提供服务时需要用到远超过个人规模的数据,这些数据的存储和处理需要成千上万台机器的协同工作才能完成。这种服务器规模不是个人能够提供的,只有大型公司或机构才能拥有,这好像又回到了更早以前的Mainframe时代。从Mainframe到PC再到云,这正是计算机技术螺旋上升的发展过程。

云计算是个新兴的名词,目前对它的定义和内涵还没有公认的界定,当前云计算的定义主要包括如下几种:

(1)IBM技术白皮书中云计算的定义是:“云计算一词用来描述一个系统平台或者一种类型的应用程序。一个云计算的平台按需提供动态的部署、配置、重新配置以及取消等服务。”

(2)维基百科给云计算下的定义:云计算将IT相关的能力以服务的方式提供给用户,允许用户在不了解提供服务的技术、没有相关知识以及设备操作能力的情况下,通过Internet获取需要的服务。

(3)中国云计算网将云计算定义为:云计算是分布式计算、并行计算和网格计算的发展,或者说是这些科学概念的商业实现。

对于云计算的定义,虽众说纷纭,但普遍认为云计算是通过互联网提供按需的、面向海量数据处理和完成复杂计算的平台。云计算的孕育和发展离不开并行计算技术、虚拟化、SOA、容错技术、安全技术和海量数据处理技术的发展,当然也离不开宽带网的普及。

1.2云计算的特点

(1)大规模的服务

云计算是一种分布式计算模式,而且是有规模经济驱动的计算模式,因此,大规模的服务是云计算的首要特征,只有大规模的云计算才能实现云计算各种服务优势,尤其是服务的能力和服务的规模经济。

(2)高可靠性

云计算系统由大量商用计算机组成集群,向用户提供各种数据处理服务。随着计算机数量的增加,系统出现错误的概率大大增加。因此,云计算必须采用措施来保障服务的高可靠性,即数据冗余和分布式存储技术。

(3)虚拟化

云计算通过虚拟化技术把各层次功能封装为抽象实体,对用户提供各层次的云服务,这样用户可以在不了解它的具体实现方法和具体位置的情况下,在任意位置、使用各种终端从云中获取应用服务。

(4)经济性

云计算通过组建一个采用大量的商业机组成的集群来提供网络服务,这相对于同样性能的超级计算机花费的资金要少很多,充分体现了云计算的低成本优势。

(5)可扩展性

“云”的规模可以动态扩展,来满足各种用户的应用需求和用户规模的不断增长需要。

(6)服务多样性

用户可以支付不同的费用,以获得不同级别的服务。

2.云计算的体系构架

云计算的体系构架分为五个层次:物理层、核心层、资源构架层、开发平台层和应用层。每一层提供不同形式的服务,这些服务均可以将Web Services的UI接口提供给用户,所有服务具有可靠、安全、可扩展、按需服务、经济等特点。

2.1物理层

物理层是云计算的底层基础设施层,包括分布在不同地理位置的各种局部资源,主要提供局部资源支持,包括存储资源、传感器、服务器、网络等。典型的市场产品有IBM-Morgan Stanleys、Computing Sublease等。

2.2核心层

核心层在物理资源层之上实现基本的分布式资源管理,通过各种抽象服务提供分布式应用的部署环境。核心层功能可以通过OS kernel、超级监督者、虚拟机监视器或集群中间件实现抽象服务,提供KaaS给分布式应用的部署者。典型的市场产品有Globus、Condor等。

2.3资源构架层

资源构架层在内核层之上构建计算机资源构架,提供分布式计算服务。本层提供的基本分布式资源服务包括IaaS,DaaS,CaaS。其中,IaaS是分布式计算服务,提供灵活、高效、高强度的计算服务,IaaS主要通过虚拟技术实现。DaaS是分布式存储服务,提供可靠、安全、大容量、便捷的数据存储服务。CaaS是网络通信服务,提供可靠、安全的网络通信服务。典型的市场产品有Amazon EC2、Amazon S3、Microsoft CSF等。

2.4开发平台层

开发平台层在资源构架层之上构建开发平台,提供各种分布式开发服务,同时也为程序开发者提供扩展、负载均衡、授权、email、用户界面等多样服务支持。PaaS加速了应用服务部署,支持应用服务扩展。典型的市场产品有Google App Engine、Sales force Apex System等

2.5应用层

应用层在开发平台上开发各种应用程序,提供各种分布式应用服务。应用程序提供者负责软件的开发、测试、运行、维护、升级,为用户提供安全、可靠的服务。典型的市场产品有Google Apps、Sales force CRM System等。

3.云计算关键技术

云计算是一种新型的计算方式,是一种数据密集型的超级计算。在数据存储、虚拟化、数据管理、编程模式等多方面具有自身独特的技术。

3.1 数据存储技术

云计算必须具备高可靠性、高吞吐率和高传输率。云计算采用冗余存储的方式来保证存储数据的可靠性,即为同一份数据存储多个副本。同时,云计算的数据存储技术必须具有高吞吐率和高传输率来满足大量用户的需求,并行地为大量用户提供服务。

云计算的数据存储技术主要有Google的非开源的GFS和Hadoop开发团队开发的GFS的开源实现HDFS。大部分IT厂商,包括雅虎、英特尔的“云”计划采用的都是HDFS的数据存储技术。云计算的数据存储技术未来的发展将集中在超大规模的数据存储、数据加密和安全性保证以及继续提高I /O速率等方面。

3.2 虚拟化技术

云计算通过虚拟化为应用提供了灵活可变、可扩展的平台服务。利用虚拟化技术,在单个服务器上实现多个虚拟机并运行多个操作系统和应用,从而提高服务器的利用率。云计算的虚拟化技术的核心是Hypervisor,Hypervisor在虚拟机和底层硬件之间建立一个抽象层,拦截操作系统对硬件的调用,为驻留在其上的操作系统提供虚拟的CPU和内存。目前VMwareESX和CitrixXenServer能直接运行在硬件上,虚拟的操作系统又运行在Hypervisor之上,从而能够按照用户需求提供IT基础设施。

3.3 数据管理技术

云计算系统对大数据集进行处理、分析向用户提供高效的服务。因此,数据管理技术必须能够高效地管理大数据集。其次,如何在规模巨大的数据中找到特定的数据,也是云计算数据管理技术所必须解决的问题。

云计算的特点是对海量的数据存储、读取后进行大量的分析,数据的读操作频率远大于数据的更新频率,云中的数据管理是一种读优化的数据管理。因此,云系统的数据管理往往采用数据库领域中列存储的数据管理模式。将表按列划分后存储。云计算的数据管理技术中最著名的是谷歌提出的BigTable数据管理技术。由于采用列存储的方式管理数据,如何提高数据的更新速率以及进一步提高随机读速率是未来的数据管理技术必须解决的问题。

4.结束语

目前,云计算还处于起步阶段,但它将改变用户对计算资源的使用方式,使得用户从以桌面为核心转向以Web为核心。文中讨论了云计算的现状和主要技术,云计算代表了未来技术的发展方向,云计算成为普及性服务是大势所趋。

参考文献:

[1]中国电子商务研究中心[EB/OL].htto://b2b.toocle.com,2009-12-03.

[2]张建勋,古志民,郑超.云计算研究进展综述[J].计算机应用研究,2010(02).

[3]陈全,邓倩妮.云计算及其关键技术[J].计算机应用,2009(09).

[4]陈丹伟,黄秀丽,任勋益.云计算及安全分析[J].计算机技术及发展,2010(02).

[5]冯登国,张敏,张妍,徐震.云计算安全研究[J].软件学报,2011(22).

作者简介:

张贵强(1981-),男,甘肃甘谷人,硕士研究生,讲师,研究方向为计算机安息安全及网络编程。

基金项目:

兰州石化职业技术学院2012年教育教学研究项目(JY2012-22)

猜你喜欢
数据存储虚拟化云计算
开源数据库数据存储的实现路径分析
基于Android开发的APP数据存储研究
哈希算法在物联网数据存储中的应用
基于云计算的移动学习平台的设计
实验云:理论教学与实验教学深度融合的助推器
云计算中的存储虚拟化技术应用
浅谈虚拟化工作原理
用户怎样选择虚拟化解决方案
虚拟化整合之势凸显
虚拟化技术:绿色IT的希望