宋金朋 李卓文
新乡职业技术学院 河南新乡 453000
摘要:云计算是网络技术发展与创新的必然产物,对于我国计算机互联网技术的发展起着重要的作用。云计算的出现,不仅将基础设施建设、资源存储以及网络资源等,以服务形式免费提供给用户应用,同时还改变了传统用户应用计算机的操作模式。因此,本文将对云计算和云数据管理技术进行分析。
关键词:云计算;云数据;管理技术;分析
1 前言
随着计算机网络技术的不断发展,云计算和云数据管理技术作为一种全新的互联网应用模式,能够更好地满足数据几何速度增长的趋势和存储要求。
2 云计算概述
2.1 概念
云计算这种计算方式是基于互联网相关服务中的增加、交付以及使用几种模式,在云计算方式中,如果软硬件的信息和资源是共享的,那么就可以按照所设定的命令进行信息和资源的传递,将信息和资源传递给其他的计算机,由于云计算的活动是依赖于互联网,所以大部分的时间都会涉及到由互联网进行提供很多动态易扩展的资源,而且通常这些资源都是虚拟的。狭义上所说的云计算指的是在IT行业中一些基础设施的交付及其使用模式,同时指根据自身需求得到一些资源,这些资源的获得是通过网络的方式得到的;从广义上看云计算指的是各种服务如何进行交付及其使用模式有哪些,客户如何得到所需要的服务,这些服务得到的方式是通过网络按照需求扩展的方式来得到。服务包括了IT、不同的软件以及同互联网相关的内容,也可以是一些设定的服务。通过上面的论述我们可以知道计算成为了一种可以在互联网中流通的商品。
2.2 特征
云计算的特征主要表现为付费性、管理性、友好性、良好性、扩展性以及存储性和分布式等,同时还具有经济性、多样服务性、高可用性、可靠性以及编程模型高层次性。其中,经济性表现为:组建一个具有商业机特性的超级计算机通常需要非常多的资金,而一个拥有非常多商业机的集群只需超级计算机费用的很小一部分;多样服务性表现为:它可根据用户支付金额的多少来决定用户所享受的服务级别;服务提供性表现为用户和云计算之间是透明的,用户要想实现机制服务不需要知道云计算的细节和具体机制,一样能够获得想要的服务;高可用性表现为系统通过计算机的高性能、海量存储来提升服务,并让云计算对失效节点的检测实现自动化,有效排除失效节点,以确保云计算正确性;可靠性主要表现为:云计算是由大量的计算机组成商用群来实现用户所需要的数据处理,因此计算机越多,出错率就会越高,但是云计算是采用存储分布式和数据冗余的软件方式,所以数据正确性有保证,这在很大程度上有效地避免了大量应用硬件情况的发生;对于编程模型的高层次性而言,其主要表现为云计算由高层次模型编程组成,用户通过自行简单学习,可编写属于自己的、满足自己要去的程序。
2.3 工作原理
无需借助本地计算机(或者是远程服务器),便能够将计算合理分布在一系列分布式计算机上,以实现对企业数据中心运行的有效优化,并和互联网形成有效对接。如此一来,企业便能够将所需资源及时而准确地切换到相关应用上,然后结合实际需求对相关计算机及存储系统进行即时访问。云计算属于一项极具实用价值的新技术,使计算能力具有商品性质,并通过网络予以兜售,不仅节约了销售成本,同时还具有实用快捷的优点。
2.4 体系结构
云计算体系结构具有一定的复杂性,且较为庞大,以“云”网络为中枢,连接一系列并发的网络计算以及相关服务,能够在虚拟化技术的帮助下,对各个服务器的能力进行扩展,并借助云计算平台把一系列资源有机地结合在一起,从而为用户提供强大的计算能力及存储能力。一个相对完整的体系主要包括四大部分,一是云端用户,二是服务目录,三是管理系统,四是部署工具、监控、服务器集群。
3 云计算数据的特点
3.1 云计算系统采用的是虚拟化的技术,所谓虚拟化技术指的是计算元件并不在真实的状态下运行,所以它并不受硬件容量的限制,无形之中扩充了硬件的容量。针对软件重新配置过程较为复杂的状况进行简化,这样做的目的是使软件虚拟机的开销减少,同时可以支持更多的操作系统。这个技术还能使软件应用硬件之间产生隔离的作用,在这里包括了两种模式分别是裂分模式和聚合模式,裂分模式是将单一的资源分成不同的虚拟资源,而聚合模式同裂分模式恰好是一个相反的过程。
3.2 云计算系统采用的是分散式的海量数据存储方式,整个系统的组成是很多的服务器,这样就可以实现同时为很多的用户服务,由于服务器不同,所以整个系统采用的是分散的方式来进行数据的存储,同时使用冗余存储这样的方式来确保数据是可靠的。
4 云数据管理技术
4.1 Big Table技术
Big Table技术可以说是一个具有一定规模的分散式的大数据库,它的目的就是为了使数据在管理上实现结构化,而分散式的数据库,就有超强的存储能力,存储能力可以超过1PB。Big table我们可以把它看成是一个排序的、稀疏的、多维的地图,其中的单元格都有唯一的坐标,这个坐标由行、列和时间戳三个元素进行定位。这项技术在工作中执行任务时,能够随时对任何的Tablet进行分配,按照任务的指令将其分配到指定的Tablet服务器,同时有效利用master服务器对子表负载监视。
4.2 Dynamo技术
Dynamo技术不仅具有存储系统的分布式、数据库和高可用行,而且还具有专有存储系统的键值结构、Hash表分布式,因此Dynamo可直接提供底层支持与AWS,并且可不用暴露于外网。Dynamo技术的优点是通过它所提供的N、R、W三个使用参数,并根据自己来调整需求进行的实例,Risk、Project Voldemort以及Apache Cassandra是比较典型的Dynamo技术,其中N表示的是副本个数,R表示的是可达到读取一致、读取成功的个数,W表示的是认为写入成功的个数,但并不要求副本个数全部成功,当读取成成的个数加上写入成功大于副本个数,就可以保证最终的数据一致性,当读取成成的个数加上写入成功小于副本个数,则不可以保证最终的数据一致性。此外,Dynamo对于不同版本对象进行的处理功能、记录功能也是支持的,它的工作原理是将不同版本的應用提供给自己,并让自己达到比对方更加灵活的目的。
4.3 GFS技术
GFS是一个拥有文件分布式的大型系统,它主要为云计算提供具有大量的存储空间,GFS技术通常与Big Table、Chubby等技术联合应用,可形成一个需解决的方案。GFS技术应用过程中,将整个节点系统分成数据块服务器、主服务器以及客户端三大类,其中数据块服务器是为系统提供存储的具体装置,它将数据转换成文件直接存放在Chunk Server之中,Chunk Server数目通常与GFS规模成正比关系,即Chunk Server数目越多,则GFS规模就会越大;主服务器是用来管理GFS的节点,它主要是保存系统提供元数据,同时也是GFS系统中文件处理中心,对整个系统文件进行管理;客户端可以提供一种形式库文件,它为系统提供一组应用程序专用的访问接口,并且接口可以不用按照POSIX规范进行,当需要连接时,直接和库文件所在的库进行连接,直接从库文件中找到需要调用的库函数。
5 结束语
总而言之,云计算的应用前景非常广阔,云计算的数据所具有的海量、异构以及不确定性的特点使云计算的云数据管理面临着一定的困难。上文中简要叙述了三种云数据管理技术,希望对计算机互联网的发展有所帮助。
参考文献:
[1]刘正伟.文中领.张海涛.云计算和云数据管理技术[J].计算机研究与发展,2012,(1).
[2]吴吉义.傅建庆.张明西.平玲娣.云数据管理研究综述[J].电信科学,2010,(05).
[3]李晓伟.沈艳秋.云计算及其发展进程[J].科技信息,2011,(15).