云存储系统的架构及关键技术

2016-05-16 03:43雷玉堂
中国公共安全 2016年5期
关键词:存储设备存储系统架构

□ 文/雷玉堂



云存储系统的架构及关键技术

□ 文/雷玉堂

云存储以其成本低廉、可扩展性高、易于管理等优点已成为未来存储发展的一种趋势。

云存储属于云计算系统,作为云计算的外延而存在,其不同的是配置了大量存储空间。通过分析三层模型可知,云计算和云存储具有相同的接口层、访问层,而且云存储在基础层方面拥有数据安全和数据管理的部分功能。

本文主要论述云存储系统组成的架构体系,组建云存储架构的3种模式与所需的基本标准,设计选择部署云存储平台需考虑的要点与6大因素,中国UIT云存储构架实现方案,最后论述云存储系统的10大关键技术。

云存储架构的类型

云存储架构分为通过服务来架构和通过软件或硬件设备来架构两类。

传统的系统利用紧耦合对称架构,这种架构的设计旨在解决HPC(高性能计算、超级运算)问题,现在其正在向外扩展成为云存储从而满足快速呈现的市场需求。下一代架构已经采用了松弛耦合非对称架构,集中元数据和控制操作,这种架构并不特别适合高性能HPC,但是这种设计旨在解决云部署的大容量存储需求。

1、紧耦合对称(TCS)架构。构建TCS系统是为了解决单一文件性能所面临的挑战,这种挑战限制了传统NAS系统的发展。HPC系统所具有的优势迅速压倒了存储,因为它们需要的单一文件I/O操作要比单一设备的I/O操作多得多。业内对此的回应是创建利用TCS架构的产品,很多节点同时伴随着分布式锁管理(锁定文件不同部分的写操作)和缓存一致性功能。这种解决方案对于单文件吞吐量问题很有效,几个不同行业的很多HPC客户已经采用了这种解决方案。这种解决方案很先进,需要一定程度的技术经验才能安装和使用。

2、松弛耦合非对称(LCA)架构。LCA系统采用不同的方法来向外扩展。它不是通过执行某个策略来使每个节点知道每个行动所执行的操作,而是利用一个数据路径之外的中央元数据控制服务器。集中控制提供了很多好处,允许进行新层次的扩展:

a.存储节点可以将重点放在提供读写服务的要求上,而不需要来自网络节点的确认信息。

b.节点可以利用不同的商品硬件CPU和存储配置,而且仍然在云存储中发挥作用。

用户可以通过利用硬件性能或虚拟化实例来调整云存储。

c.消除节点之间共享的大量状态开销也可以消除用户计算机互联的需要,如光纤通道或infiniband,从而进一步降低成本。

d.异构硬件的混合和匹配使用户能够在需要的时候在当前经济规模的基础上扩大存储,同时还能提供永久的数据可用性。

e.拥有集中元数据意味着,存储节点可以旋转地进行深层次应用程序归档,而且在控制节点上,元数据经常都是可用的。

云存储的通用结构模型及其平台架构

对比传统的存储设备,云存储是一个由网络设备、存储设备、服务器、应用软件、公用访问接口、接入网和客户端程序等多个部分组成的系统。在云存储系统中,各个部分以存储设备为核心,通过应用软件集合来对外提供数据存储和业务访问服务。

1、云存储的通用结构模型。云存储的通用结构模型如图所示。

云存储的通用结构模型

存储层:存储层是云存储最基础的部分,包括存储设备层和存储设备管理层。存储层由各种各样的存储设备和网络设备组成,为了实现低成本,这些存储设备以及网络设备通常都是普通的商业产品,而不是可靠性更高的高端设备,系统的可靠性由一系列软件集合来保证。存储设备可以是网络连接式存储(NAS)和由小型计算机系统接口(ISCSI)所建立和管理的存储区域网等IP 存储设备,可以是服务器连接存储(SAS)和小型计算机系统接口(SCSI)磁盘阵列等直连式存储(DAS)存储设备。云存储中的存储设备往往数量庞大且分布多不同地域,彼此之间通过广域网、互联网或者FC光纤通道网络连接在一起。

存储设备层之上是一个统一存储设备管理系统,即存储设备管理层,用来实现对存储设备的逻辑虚拟化管理、多链路冗余管理、硬件设备状态监控及故障维护等功能。

基础管理层:云存储并不是一个单点存储系统,而是一个由成千上万存储设备和服务器构成的一个集合体,其基础管理层是云存储系统中最为核心的部分,也是云存储中最难以实现的部分。基础管理层通过集群、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之间的协同工作,使多个存储设备可以对外提供同一种服务,提供更大更强更好的数据访问性能,并在实现了良好的扩展性的同时,也满足了高可用性以及性能的需求。

基础管理层还通过CDN内容分发系统、数据加密技术保证云存储中的数据不会被未授权的用户所访问,同时,通过各种数据备份和容灾技术和措施,保证云存储中的数据不会丢失,保证云存储自身的安全和稳定。

应用接口层:应用接口层是云存储中最灵活多变的部分,是用户利用云存储资源进行应用开发的关键部分。云存储供应商通过应用接口层,对客户提供统一的协议和编程接口(通常这些协议都是与平台无关的)。即根据实际业务类型,开发不同的应用服务接口,提供不同的应用服务。如视频监控应用平台、IPTV和视频点播应用平台、网络硬盘引用平台,远程数据备份应用平台等。

访问层:访问层是基于云存储开发的应用程序的入口,云存储系统通过提供标准的公用应用接口来使授权用户享受云存储服务。云存储运营单位不同,云存储提供的访问类型和访问手段也不同。云存储服务商可以根据服务类型和用户的不同,来提供不同访问手段,从而保证数据的安全性和服务质量。

2、云存储平台整体架构。云存储平台整体架构如图所示。

云存储平台整体架构

由图可知,云存储平台自底向上依次是:数据存储层、数据管理层、数据服务层以及用户访问层4个层次。

数据存储层:云存储系统对外提供多种不同的存储服务,各种服务的数据统一存放在云存储系统中,形成一个海量数据池。从大多数网络服务后台数据组织方式来看,传统基于单服务器的数据组织难以满足广域网多用户条件下的吞吐性能和存储容量需求;基于P2P架构的数据组织需要庞大的节点数量和复杂编码算法保证数据可靠性。相比而言,基于多存储服务器的数据组织方法能够更好满足在线存储服务的应用需求,在用户规模较大时,构建分布式数据中心能够为不同地理区域的用户提供更好的服务质量。

云存储的数据存储层将不同类型的存储设备互连起来,实现海量数据的统一管理,同时实现对存储设备的集中管理、状态监控以及容量的动态扩展,实质是一种面向服务的分布式存储系统。

数据管理层:云存储系统架构中的数据管理层为上层提供不同服务间公共管理的统一视图。通过设计统一的用户管理、安全管理、副本管理及策略管理等公共数据管理功能,将底层存储及上层应用无缝衔接起来,实现多存储设备之间的协同工作,以更好的性能对外提供多种服务。

数据服务层:数据服务层是云存储平台中可以灵活扩展的、直接面向用户的部分。根据用户需求,可以开发出不同的应用接口,提供相应的服务。如数据存储服务、空间租赁服务、公共资源服务、多用户数据共享服务、数据备份服务等。

用户访问层:通过用户访问层,任何一个授权用户都可以在任何地方,使用一台联网的终端设备,按照标准的公用应用接口来登录云存储平台,享受云存储服务。

物联网环境下云存储系统的体系结构及平台的结构模型

物联网是一个规模庞大的信息计算系统,这个系统需要一个强有力的平台提供计算和存储服务来支撑其应用需求。

而云计算是通过互联网将计算能力和存储空间有限的一系列IT 设备整合成一个具有强大计算能力和海量存储空间的系统,其超大规模、高扩展性、高可靠性正好满足物联网对计算资源和存储资源的需求,并已成为支撑物联网应用的一个强有力的平台。云计算面向物联网提供计算资源和存储资源两种服务,其中,存储资源服务就是云存储。云存储服务是整个云计算平台最底层的服务,是与云计算模式相匹配的存储模式,以满足整个系统对数据的存取访问。实际上,物联网也是一种数据密集型的信息系统,从传感层到应用层,时刻都有海量数据需要存取,同时对数据的敏感度比较高,一旦数据丢失或损坏,将严重影响系统的可用性。因此,物联网中云存储的大规模应用也不是一朝一夕能够实现的,随着物联网应用规模的不断扩大,云存储将经历着从为小范围物联网应用服务的私有云存储,发展到为某个行业应用服务的行业云存储,最后发展到各种云存储互联泛在阶段。下面就介绍一下,云存储在物联网环境下应用的体系架构及其平台的结构模型。

1、物联网环境下云存储系统的体系结构。

基于云存储的物联网体系结构如图4-4所示。

图4-4 基于物联网的云存储体系架构

图4-4给出了云存储平台在整个物联网的体系结构中的位置,物联网整个体系结构从下到上依次可分为感知层、传输层、处理层、应用层4层。

感知层:主要用来收集周围可被感知物品的信息,并将这些感知信息简单处理后通过各种接入网传递到传输层。

传输层:它将融合后的感知信息传输到处理层,再将处理层的反馈信息传递到感知层的各个设备。

处理层:它提供存储和处理功能,提供数据分析、局势判断和控制决策等处理功能,云存储便设立在这一层来提供存储服务来满足整个系统对数据的访问。

应用层:应用层在架构的最上层,它建立不同领域中的各种应用。

物联网环境下云存储系统的工作原理是,云存储接受传输层提交的感知数据,并采用合适的策略(如按照地理位置就近原则)存储数据,提供访问接口,供云计算信息处理平台对数据进行分析处理,并将处理的结果存放起来,供应用层访问。

2、物联网环境下云存储平台的结构模型

物联网环境下云存储平台的结构模型如图4-5所示。

图4-5 物联网环境下云存储平台的结构模型

由图可知,如果不看物联网环境,整个云存储平台主要由云存储管理器和云存储资源池两大部分构成。

云存储管理器。云存储管理器是整个云存储平台的“大脑”,主要任务是负责存储资源的管理和调度。云存储管理器以系统管理为核心,以用户管理、安全管理、存储资源管理、服务管理和云数据管理等为子管理模块。这些子管理模块分别分布在各个不同的服务器节点上,接受系统管理模块的统一管理。

系统管理模块:它是云存储管理器中的核心部件,掌握着整个云存储系统的拓扑结构和底层操作系统,以及所采用的文件系统的基本信息,协调各个子管理模块的工作。同时,系统管理模块制订各种各样的策略,并将其分发到各个子管理模块中去,例如文件分块大小、存储分区大小、存储空间分配策略、冗余副本个数、节点故障处理、安全等级等。子管理模块根据这些策略实现自身功能。

存储资源管理模块:它实现存储资源的管理和分配,主要功能如下:

a.监控整个系统中云存储节点的运行状态,及时发现故障节点,并采取相应的策略选择新的存储节点,来代替原有节点提供存储服务;

b.发现新添加的存储节点,实现对其透明访问;

c.采取合适的负载均衡功能保证系统的可靠性;

d.将大的数据块划分为较小的数据,并将这些小型数据块分配到不同的存储节点上,实现分布式存储。

云数据管理模块:它的主要功能是实现对元数据的管理,元数据是存储文件基本信息的一种数据。当一个文件被创建的时候,文件的一些基本信息如文件名、文件大小、文件存储位置、文件访问控制等,将被作为一个元数据项存放在元数据文件中。当有文件访问请求时,系统首先查找该文件的元数据信息,根据元数据信息找出该文件的存储位置,然后向相应的存储节点发出数据访问请求。

服务管理模块:它定义了不同等级的云存储服务和用户为此支付的费用,用户可根据自己的实际需求选择合适的存储服务;用户管理模块负责管理整个云存储系统中用户的基本信息,实现对用户的访问认证及访问权限的授予;安全管理模块实现对整个云存储系统的安全管理,采用各种安全技术如防火墙技术、入侵检测技术、加密技术等来保证整个系统的安全性。

云存储资源池。云存储资源池是由多个云存储节点构成,这些云存储节点,可能分布在不同地点。通过存储虚拟化技术,将其整合为一大容量虚拟存储设备,用户可以像使用物理存储设备那样来使用。

结束语

云存储以其成本低廉、可扩展性高、易于管理等优点已成为未来存储发展的一种趋势。对于物联网应用服务提供商来说,云存储模式使其节省了构建存储平台所带来的昂贵的成本投入,应用服务商可以以较低的代价享受到先进的存储技术。数据的存储和管理工作,完全由云存储服务商按照自己的要求来做。这样可以将更多的资金投入到本身的其他业务开发中去。

猜你喜欢
存储设备存储系统架构
基于FPGA的RNN硬件加速架构
功能架构在电子电气架构开发中的应用和实践
分布式存储系统在企业档案管理中的应用
基于云服务的图书馆IT架构
天河超算存储系统在美创佳绩
WebGIS架构下的地理信息系统构建研究
浅析铁路视频监控存储设备设计
华为震撼发布新一代OceanStor 18000 V3系列高端存储系统
基于电池管理系统的数据存储系统设计
Windows环境下禁用USB存储设备程序设计与实现