基于混合云的企业信息平台架构研究

2014-04-29 09:43张子浪
网络空间安全 2014年4期
关键词:负载均衡数据安全架构

【 摘 要 】 本文基于混合云,探索企业信息平台的架构问题。由于私有云的处理能力有限,在遇到季节性的峰值需求时难以应对;此时,公有云是一种很好的选择,其处理能力远远超出私有云,由于其规模效应,短期而言,成本也低于私有云。然而,将敏感的数据存放到公有云上存在一定的安全隐患,而且,将应用系统部署到公有云上,跨云的负载均衡也存在一定的技术复杂度。本文结合私有云与公有云的优势,给出一种企业信息平台的参考架构,并进行应用系统的负载均衡、数据的安全和混合云互操作性的探讨。

【 关键词 】 混合云;数据安全;负载均衡;企业信息平台;架构

【 文献标识码 】 A

1 引言

企业要利用信息化向内部员工、外部顾客或者合作伙伴提供高质量的服务,如果企业规模较小,发展速度也不是很快,那么对信息化的要求也不会很高,采用何种IT架构也显得不是那么重要,即使采用传统的IT架构也能满足要求。然而,如果企业规模较大,处于较快的发展阶段,比如以每隔一周左右的时间产生一个分店,或者新开一个分公司,或者进入一个新的行业,采用传统的IT架构难以满足业务快速发展的要求。这些企业对IT系统提出了更高的要求,一些信息化水平起点较高、信息化建设步伐较快的企业已经部署了私有云,快速满足业务需求的同时,也提高了IT资源的利用效率。

然而私有云存在一定的局限性,在以下几种情况当中单独依赖私有云难以满足企业的IT需求。

不同的企业,工作负载的需求是不一样的。处于高速发展当中的企业,工作负载的需求呈现稳定增长的态势,处于稳定发展的企业,工作负载的需求也处于稳定状态。处于高速发展中的企业,如果采用购买基础设施的方式对私有进行扩容,那么其在IT支出方面的成本也会随着工作负载需求的增加而不断增加。

不同类型的应用系统,工作负载的需求也不一样。

一些工作负载的需求具有周期性变化的特点。例如电子商务应用程序,在销售旺季时,用户访问量也相应较大;在销售淡季时,用户访问量也相应较小。销售旺季时的工作负载的峰值需求是平时的几十倍甚至上万倍。类似的还有大型在线体育赛事直播网站,其工作负载的峰值需求也比平时大得多。

私有云在应对工作负载的峰值需求时,其处理能力达不到相应要求,私有云的处理能力达不到相应的要求。当然,私有云的架构方式支持弹性扩展,但按照峰值的需求去增加建设IT系统和IT基础设施,会造成很大的浪费,因为一年当中只有几次或者较短的时间才会用到额外的计算资源、带宽资源、网络资源,大部分时间这些资源处于闲置状态。

尽管工作负载的需求在波动,工作负载的峰值需求可从历史经验中得到数据,比如根据去年的情况,预测当年的需求。还有一种情况是峰值需求不可预测。比如,有一家互联网的企业,即将上线一款新的应用,很明显,应用的访问量与受欢迎程度成正比,如果很受用户欢迎,那么访问量就大,反之访问量就小。是否受到用户的欢迎只有上线以后才能发现。在某个时间段内的用户访问量更难预测。这种对于访问量未知的不确定性导致了很难对私有云的基础设施提出量化的需求。

私有云在应对不断增加的工作负载需求、工作负载的峰值需求、不确定性的工作负载需求存在局限性。针对私有云的这些局限性,租用公有云是一种很好的选择,由于公有云的规模效应,短期内使用成本较低,而且公有云的处理能力也较强。在应对不断增加的工作负载需求时,可通过租用公有云,而不是购买基础设施的方式降低成本。在应对峰值需求时,企业可以根据历史经验,把应用系统预先部署到公有云上,先让本地私有云承担一定的负载,当负载超过一定的阀值时,通过自动化的方式,触发公有云上的应用系统提供服务,当峰值需求消失后,企业可将整个负载转移到私有云当中,毕竟,租用会产生一定的成本。在应对不确定性的需求时,亦可采用这种动态地使用公有云资源的方式,为节省成本,需求平稳后,再将负载迁移到内部的私有云中。

近两年来,继公有云和私有云之后,混合云成为热点。企业采用混合云,能够充分发挥私有云和公有云的优势。然而,混合云目并不像私有云那样成熟,主要存在以下问题:数据安全性带来的问题和跨云的应用系统如何进行负载均衡,以及两个云之间的集成问题。

所有这些问题,需要和企业整体的信息化建设一起来考虑。企业在信息化建设的过程中,一般基于一个统一的信息平台进行信息化系统的建设、规划、运维。例如在混合云的坏境中,应用系统不再位于一个云当中,而是分布在两个云当中,两者之间需要进行数据的同步,平台提供一种数据同步的机制。因此,原先基于私有云的企业信息平台需要调整或者重新设计,以适应混合云的环境。

由于基于混合云的企业信息平台的建设涉及到多种技术及相关标准,技术复杂度相对较高,在建设之前进行架构设计,将有助于企业信息平台的实现以及满足业务系统建设和运行的需要。

目前针对基于混合云的企业信息平台的架构的相关论文相对较少,主要是IT厂商或者云服务提供商提出了混合云的解决方案,本文的企业信息化平台的架构会与这些解决方案相结合,从而为架构的实现提供了多种选择。

本文给出的架构对于应用系统的开发人员设计云感知的应用程序具有参考意义,同时对公有云服务提供商业提出了一定兼容性的要求,以方便和私有云进行集成,最后该架构能够对企业建设基于混合云的企业信息化平台提供参考。

在此先介绍云计算的相关概念以及混合云的复杂性,然后结合主流IT厂商及开源的云管理平台,提出基于混合云的企业信息平台架构。基于这种架构,对应用程序的负载均衡和混合云的安全性进行了探讨。最后从避免供应商锁定的角度,对混合云的互操性性的相关技术进行了研究。

2 云计算的定义及模型

2.1 云计算定义

NIST认为云计算是一种模式,能以泛在的、便利的、按需的方式通过网络访问可配置的计算资源(例如网络资源、服务器资源、存储资源、应用和服务),这些资源可实现快速部署与发布,同时它以最少的管理开销及最少的与供应商的交互,迅速配置提供或释放资源。云计算具有无处不在的网络访问、快速的伸缩性、可计量的服务、按需自助服务、资源池五个基本特征;包括软件即服务、平台即服务、基础设施即服务三种交付模型,包含公有云、私有云、混合云、社区云四种部署模型。endprint

2.2 云交付模型

云提供了三种交付模型,包括基础架构即服务,平台即服务,软件即服务,这些模型确定了用户的共享与多租户级别。

云计算的一个前提是服务被多个用户访问,而且服务要在用户之间实现一定程度的隔离,避免用户之间互相影响。

由于数据库被广泛使用而且很多应用或者服务都要依赖数据库服务,因此以多租户使用数据库服务为例,说明云交付模型和多租户模型。当然多租户模型的使用不限于数据库服务,也适用于其它服务。

基础架构即服务。这种模式在物理服务器上安装虚拟机管理程序,虚拟机管理程序是虚拟机运行的容器,数据库则部署到虚拟机中。每个租户获得一个或者多个虚拟机。

平台即服务。这种模式依赖标准化的硬件和统一的操作系统。数据库在多个操作系统中运行提供了更高的可靠性和灵活的扩展性。租户的隔离通过向每个租户分配数据库的单独实例实现。

软件即服务。在这种模式中,所有的租户共享一个数据库实例。租户的隔离要通过应用系统和数据库相结合的方式实现。

2.3 云部署模型

公共云向普通公众开放,其基础设施由云供应商所有。

私有云一般由某个组织单独占有和使用,它的基础设施可以存放于组织内部和异地。

社区云由某个社区独占式地使用,社区是一组来自不同组织、具有相同兴趣或任务的人。

公有云能满足高峰工作负载时的可伸缩性要求,但由于公有云由多个组织共享使用,隔离性和数据安全性不能得到很好的保证,而私有云由单个组织控制,安全性相对较高,但可伸缩性不如公有云。

混合云指公有云与私有云的合并使用,它包含两个不同的基础架构,但这两个基础架构又能无缝地链接到一起,工作负载可在私有云和公有云之间来回迁移,数据可以同步,应用系统可跨基础架构运行。

3 混合云的复杂性

负载管理。混合云的一个典型使用场景是应对工作负载的峰值需求。混合云的应支持跨云的负载均衡,即如何在两个云之间调度资源,既兼顾性能的要求,又考虑成本要求。

互操作性。一旦和特定的云供应商进行集成,如果没有遵循技术标准,那么锁定供应商后容易造成转移成本过高。比如私有云和公有云中运行虚拟机的能力应该相同,即虚拟机镜像文件可在两个云之间平滑迁移。私有云之间与公有云之间的网络需要连接在一起,同时为降低部署的复杂度,应用程序所依赖的IP地址无需修改就都能在两个环境中运行。

安全性。一些数据需要同步到公有云当中,这些数据将暴露在企业的外部,私有云和公有云连接在一起,位于私有云中的服务可能遭受外部攻击。

云供服务应商的选择及管理。尽管可从可靠性、安全性、成本、SLA、合规性等方面去衡量云供应商,但毕竟有些指标难以衡量,或者短期内难以衡量,比如可靠性。在某些场景,可能不只使用一个云供应商的服务,整个服务的质量由多个云供应商共同决定,要保证各个云供应商至少满足SLA中规定的内容。

4 混合云的架构

基于开源的OpenStack,HP提出了混合云的解决方案,但侧重点放在云管理平台上,通过集中的云管理平台,集中地管理基于传统的IT架构的资源和基于私有云的架构以及公有云上的资源。

微软公司提供了基于HyperV技术的Windows Server 2008或者Windows Server 2012操作系统构建私有云,同时提供Windows Azure公有云服务。

VMware则侧重提供基于私有云的相关虚拟化产品及相关混合云的解决方案。被Ctrix公司收购的CloudStack作为IaaS的运管理平台,与亚马逊公司的AWS公有云相结合,提供混合云的解决方案。

基于混合云的企业信息平台的架构,应与产业内标准、成熟的技术相结合,充分借鉴优秀的解决方案,结合企业的实际需求进行设计,以下是平台的各个组成部分:

集成。私有云与公有云要进行集成,可从数据同步、应用集成与消息同步、服务器点对点连接、VPN加密连接等方面进行集成。

混合云管理平台:包括资源管理(服务器、网络、存储)、服务管理(账单、服务度量、账号)、动态工作负载管理、高可用性和安全管理(备份、监控、负载均衡、高可用性)、虚拟机映像管理(操作系统ISO、自定义模板)和管理接口(用户接口、API接口)。

PaaS 层的中间件分为两类:一类是传统的中间件:身份认证、内容管理、报表引擎、工作流引擎、消息队列、服务总线;另一类为适合分布式存储和计算的中间件或服务,比如基于NoSQL的数据库中间件,分布式计算框架MapReduce。

应用层。根据应用的可伸缩性分为两类:传统应用和云原生态的应用。传统的应用一般为C/S架构或者三层架构,基于关系型数据库存储,数据库一般采用主从式架构,当负载增加时,扩展能力有限,而且扩展难度较大。企业应用ERP、CRM等属于这类型的应用。

云原生态的应用采用非共享的架构,基于NoSQL技术存储,对大的数据集进行分片存储,计算节点只依赖本地存储,因此进行伸缩时,只需要增加或者减少节点即可。电子商务应用、大数据分析属于这类型的应用。

5 混合云中的负载均衡

在使用混合云来满足峰值需求时,需要对私有云和公有云中的资源进行管理和调度。在资源管理中使用阀值策略能够动态平衡工作负载的需求,即当工作负载的需求超过预先设定的阀值水平后,阀值策略指示系统创建必要的资源实例;当工作负载的需求低于预先设定的阀值水平后,阀值策略指示系统释放额外的资源实例或者取消先前的资源分配。

阀值的定义应该反映具体内容,比如应用服务器每秒接收的HTTP连接数、应用服务器的响应大于10秒所占整个响应时间的比例,以反映系统整体的缓慢程度。持续时间也是一个重要的阀值,一般与其他阀值结合使用,比如可定义HTTP连接数大于HTTP连接数阀值并且持续时间大于持续时间阀值这样的综合阀值作为系统的检测条件。endprint

动态创建资源或者释放资源实例一般通过自动化的脚本实现,从系统检测到阀值到系统做出响应之间的时间段必须近乎瞬间。虚拟机开启的时间大约是40-50秒,因此可根据需要,提前开启虚拟机。

跨云的负载均衡要求应用程序做出适当调整,应用程序能够跨越私有云与公有云之间运行。Global load balance(全局负载均衡)负责在公有云、私有云之间的工作负载需求的动态平衡,Local load balance(本地负载均衡)负载云私有云或者公有云内的平衡。

如果应用程序的数据架构采用的不是主从式,而是利用数据分片技术进行水平分割,那么省去了在公有云与私有云之间同步数据,而且本地的应用访问本地数据,减少了网络延迟。

6 混合云的安全性

数据的存放位置,安全技术、云服务商的安全管理水平将影响混合云的安全性。

企业应将敏感的数据信息存放在私有云当中,而将非敏感数据存放在公有云当中。例如电子商务应用程序,可将产品目录存放在公有云中,而将用户的账号、信用卡等信息存放在私有云中,部署在公有云中的API调用的方式访问这些数据。这种设计保证了企业不会失去对敏感数据的物理控制力度。

从技术的角度,构建多层次的防护体系,主要包括物理安全、网络安全、平台安全、数据保护、身份标识和访问安全,应用程序安全。目前加密技术应用较为广泛,标准的网络加密技术有SSL、VPNs和 SSH;较新的数据加密技术AES,为提高加密解密性能,可采用硬件方式实现,例如Intel的CPU就包含AES相关的新的指令。数据加密的另一个替代方法是数据匿名化,即隐藏数据中的个人身份信息。

选择合适的云服务商。混合云的安全目标与私有云都是一样的,即保护企业的信息资产。然而安全管理的责任主体发生了变化,整个系统的安全由企业和云供应商共同负责。例如企业使用公有云的IaaS服务,那么Iaas的安全由云供应商负责,应用的安全由企业负责。因此运服务供应商的信息安全管理水平显得非常重要,通过了ISO27001认证的云服务供应商更能获得用户的信任。

7 混合云的互操作性

7.1 开放虚拟格式OVF

虚拟化的技术在20世纪60年代被开发,以便对对昂贵的大型主机进行多路复用。如今虚拟化的技术被大量应用于云计算中,成为云计算的一个关键技术之一。

虚拟机是虚拟化中最为常见的词汇,虚拟机管理程序则作为虚拟机运行的容器,它负责创建、运行、管理、调度虚拟机,支持在同一个系统上运行不同的操作系统,操作系统与操作系统之间互相独立,一个操作系统的故障不会影响另一个系统的故障。

虚拟化通过将物理服务器虚拟为多台服务器,提高了资源的利用效率,在应用系统的部署及交付方面,虚拟化也发挥着重要的作用。

应用程序一般依赖特定的操作系统环境、相关组件,以及配置文件,以及硬件资源的要求。多层的应用程序往往包含数据库服务器,应用服务器,Web服务器、文件服务器等,这种应用程序如果需要负载均衡以及集群,那么,整个应用程序的部署过程将非常复杂。

虚拟设备能够简化复杂的部署过程,它提供了一种创建、分发和部署软件的新方式。虚拟设备通常用于承载单个业务应用程序,是一个自成一体、预先配置的软件堆栈,包括1个或多个虚拟机,每个虚拟机可独立运行,而且自带操作系统和相关的应用,并明确其所需的虚拟资源。

由于多种虚拟化平台VSphere、XEN、HyperV的存在,虚拟设备具有可移植性才有意义,这就是开发虚拟格式规范(Open Virtualization Format,简称OVF)的作用所在。各个虚拟化平台中虚拟机的配置文件都不一样,OVF将这些配置统一为文本格式。

由于各个虚拟化平台的虚拟机映像格式不一样,有的支持特定自身私有格式以及一种或者多种其它格式,有的支持个格式有限,因此虚拟设备还不能100%可移植。例如VSphere以vmdk作为镜像格式,而此格式在非VSphere的平台缺乏广发的支持,XEN支持此种格式,但HyperV不支持。

随着OVF被广泛接受以及厂商的支持,虚拟设备的可移植性会得到进一步的加强。

7.2 网络虚拟化

服务器虚拟化的普及要求虚拟设备具备可移植性,OVF规范的实现则保证了这种跨虚拟化平台的可移植性。然而,虚拟设备所连接的网络却没跟上步伐,虚拟机的移动受制于物理网络。

在混合云的环境中,私有云与公有云的网络拓扑结构往往不一样,而工作负载有时需要在公有云于私有云之间进行分布式式部署。一个典型的B/S应用程序由前端展现层、中间业务逻辑层、后端数据库层。这三层根据需要,这三层可以根据需将负责前端展现层的Web服务器部署在公有云中,应用服务器和数据库服务器则部署在私有云中。

由于私有云与公有云之间的网络拓扑结构往不一样,此时就涉及到IP地址的重新配置问题,如果还有一些安全策略,比如防火墙,那么涉及到大量的IP地址修改。

网络虚拟化有助于无缝混合云的建立,不需要重新配置网络和虚拟机,虚拟机的位置和跨子网动态迁移有一定的灵活性,可将工作负荷迁移到任何地方。

网络虚拟化为虚拟机提供虚拟网络,就像服务器虚拟化为操作系统提供虚拟机,网络虚拟化能在一个物理网络上提供多个虚拟网络,虚拟网络独立于网络,和物理网络完全脱耦。这样,虚拟机迁移时,网络跟着迁移,无需人工干预,就可大量添加或者转移工作负载。

8 结束语

云计算不再停留在概念阶段,很多企业已经部署私有云,混合云将成为一种趋势,企业信息平台的架构也要做出相应的调整,以便充分利用混合云的优势,在采用阀值策略动态平衡动作负载的需求的同时,保障企业敏感信息的安全;企业应用可为两类:传统应用和云原生态的应用,整个架构的设计应满足这两类应用的需求。企业为避免供应商的锁定,在建设混合云时,要采用标准化的技术促进私有云与公有云的互操作性,更换云供应商时,整个系统无须进行重大的调整。

参考文献

[1] Oracle. A Pragmatic Process for Cloud Adoption. http://www.oracle.com/technetwork/topics/entarch/oracle-pg-cloud-adoption-r3-0-1556804.pdf.

[2] Intel. Developing a Highly Available, Dynamic Hybrid Cloud Environment.http://www.intel.com/content/dam/www/public/us/en/documents/best-practices/developing-highly-available-dynamic-hybrid-cloud-environment.pdf.

[3] CSA. Security Guidance For Critical Areas Of Focus In Cloud Computing[2011-11-14].https://downloads.cloudsecurityalliance.org/initiatives/guidance/csaguide.v3.0.pdf.

[4] DMTF. Open Virtualization Format Specification[S/OL].[20l3-08-30]. http://www.dmtf.org/sites/default/files/standards/documents/DSP0243_2.0.1.pdf.

作者简介:

张子浪 (1978-),男,中国社会科学院研究生院,MBA,工程师;主要研究方向和关注领域:企业架构、混合云、多维数据聚合。endprint

猜你喜欢
负载均衡数据安全架构
基于云控平台雾计算架构的网联汽车路径控制
部署推进2020年电信和互联网 行业网络数据安全管理工作
工信部:2021年初步建立网络数据安全标准体系
数据安全政策与相关标准分享
异构环境下改进的LATE调度算法
基于负载均衡的云资源调度策略研究
多站点同步更新系统的设计
模糊理论在Ad hoc网络通信领域的应用
VIE:从何而来,去向何方
企业架构的最佳实践