文/吴驰 龙涛 于俊清
为了满足各类信息系统日益增长的IT资源需求,降低架构及管理复杂度并实现IT资源的快速交付和弹性分配,基于虚拟化技术建设云数据中心已成为当前高校信息化部门的首选。然而,从大多数高校数据中心的建设实践看,虚拟化技术在计算、网络和存储这三大体系上的应用程度并不均衡,尤其是存储虚拟化并未引起足够的重视,已成为高校数据中心建设的短板。
高校应用系统类型复杂,数量繁多。在建设和运行过程中,其存储容量需求往往呈现螺旋上升趋势。数据中心建设时,往往由于对存储容量需求无法准确预估,项目预算或建设周期限制等原因,存储扩容成为常态。在扩容过程中,往往由于技术发展,采购限制等种种原因,不得不放弃在原有设备上进行扩容或采购相同设备的方案,而采购新的异构存储设备。随着存储系统规模的不断扩大,以下问题便凸显出来:
1.管理复杂度急剧增加
由于不同厂商的存储设备底层架构、管理界面和软件功能都有较大的差别,在异构存储环境下,配置和管理的复杂度无疑会大大增加。不同设备间的数据复制、迁移等操作需要较高的成本。
2.存储资源利用率无法有效提升
在异构存储环境下,各存储设备往往会形成容量壁垒,无法实现统一的资源调度,资源利用率无法有效提高。
3.存储系统高可用实现困难
异构存储环境下,增加设备、架构调整或者数据迁移都往往需要对存储设备进行离线操作,这样无疑会降低存储系统的可用性。而实现高可用的技术手段,如存储镜像等,又会由于异构存储间的技术壁垒无法顺利实现。
根据SNIA(存储网络工业协会)的定义,存储虚拟化是指“通过将存储系统/子系统的内部功能从应用程序、服务器、网络资源中进行抽象、隐藏或隔离,实现独立于应用程序、网络的存储与数据管理”。简单来说,存储虚拟化技术能够通过屏蔽具体物理设备的物理特征,将各类存储设备资源进行整合,为上层服务器提供一个能够统一配置管理的逻辑存储资源池,从而有效地解决了异构存储架构带来的种种问题。
存储虚拟化技术有多种实现方式和途径。一般情况下,根据虚拟化在I/O路径中不同的实现位置,可分为基于主机的虚拟化、基于存储设备的虚拟化和基于存储网络的虚拟化。
1.基于主机的虚拟化
基于主机的虚拟存储依赖于代理或管理软件,它们安装在一个或多个主机上,实现存储虚拟化的控制和管理。由于控制软件是运行在主机上,会占用主机资源且存在不同操作系统间的兼容性问题。因此,这种方法的可扩展性较差,实际运行的性能不是很好。
基于主机的方法也有可能影响到系统的稳定性和安全性,因为有可能导致不经意间越权访问到受保护的数据。这种方法要求在主机上安装适当的控制软件,因此一个主机的故障可能影响整个SAN系统中数据的完整性。软件控制的存储虚拟化还可能由于不同存储厂商软硬件的差异而带来不必要的互操作性开销,所以这种方法的灵活性也比较差。但是,因为不需要任何附加硬件,基于主机的虚拟化方法最容易实现,其设备成本也最低。
2.基于存储设备的虚拟化
基于存储设备的虚拟化依赖于存储设备的控制器软件功能模块,这种虚拟化技术往往只能解决同一厂商系列设备的虚拟化问题,无法支持包含多个厂商设备的复杂存储系统的虚拟化。依赖于存储供应商的虚拟化功能模块将会在系统中排斥简单的硬盘组和简单存储设备的使用,因为这些设备并没有提供存储虚拟化的功能。采用该存储虚拟化技术也会导致存储系统在建设过程中的品牌唯一问题。当然,对于已经采用同一厂商不同系列存储设备的数据中心来说,该方案能够较容易地实现存储资源的虚拟化和统一管理。
3.基于存储网络的虚拟化
基于存储网络的虚拟化是指在存储系统的SAN网络设备上实现存储虚拟化功能。根据其数据路径和控制路径的耦合情况,可分为对称虚拟化和非对称虚拟化两种。对称虚拟化是指数据路径与控制路径重合,在数据读写的过程中,在主机到存储设备的路径上实现虚拟存储。具体实现时,实现虚拟化功能的设备安装在主机和存储设备的数据通道内,所有控制及数据访问都必须通过该设备。该实现方式无需对现有SAN架构进行任何更改,也无需占用任何的主机资源。
非对称虚拟化是指数据路径与控制路径不重合,在主机到存储设备的路径外实现虚拟存储。非对称存储虚拟化设备位于主机和存储之间的数据通道之外,通过其他的网络连接方式与主机系统通信,因而在主机中需要安装专门的客户端软件,所面临的问题与基于主机的存储虚拟化类似。
华中科技大学从2012年开始启动数据中心建设,根据需求,采用了分级建设的模式,建成了面向学校人事、学工、设备等重要应用的核心数据中心(如图1)及满足学校各二级单位网站、信息系统建设需求的二级数据中心(如图2)。
图1 核心数据中心架构
图2 二级数据中心架构
可以看出,在两级数据中心的架构中,均采用了接入SAN网络的存储虚拟化控制器设备实现了基于存储网络的对称存储虚拟化。在这种架构下,虚拟化控制器将异构的存储设备虚拟化为一个统一的存储资源池,服务器不再直接访问任何的存储设备,而是通过存储虚拟化控制器构造的存储虚拟化层进行数据读写。
从应用实践看,存储虚拟化的实施为数据中心的建设和运维带来了以下几点好处。
1.降低了存储系统建设和管理的复杂度
由于采用了存储虚拟化技术,数据中心的运维人员在日常管理与维护中通常无需对单一存储设备进行操作,而是通过存储虚拟化控制器提供的统一界面,对存储资源进行管理。对存储系统扩容时,可以灵活地根据需求、成本、项目预算等因素考虑采用利旧,对原有设备扩容及采购异构存储等多种方案。学校两级数据中心自2012年起的多次扩容中,先后采购了三个厂商的多台存储设备并利旧使用一台存储设备。由于采用了存储虚拟化技术,所有扩容实施均实现了业务的不中断操作。
2.实现了存储资源的有效利用
与传统存储配置方式相比,基于虚拟存储的自动精简配置技术可以实现存储资源的有效利用,能够有效地避免物理存储空间因超量分配导致的闲置。同时,存储虚拟化技术通过构造存储资源池,突破了单一设备的容量壁垒,实现了设备的容量整合。
3.存储系统的高可用易于实现
通过存储虚拟化控制器能够非常容易在不同存储设备上定义和实现存储同步镜像及双活且对主机透明,当单一存储设备因故障、检修等原因需要停机时,不会影响相关业务的运行。2015年,学校核心数据中心中一台主存储由于电源发生故障须停机维修,因为采用了存储虚拟化技术,所以维修过程中也实现了业务的不中断运行。
4.可实现存储资源的服务质量管理
通过存储虚拟化技术,可以实现存储系统中异构存储的差异化管理。通过配置不同服务级别的存储资源池,可以将不同性能的存储设备分类管理并分配给对应需求的应用系统。例如,可以把高端的存储资源集中分配给关键应用,而把较低端的存储资源分配给非关键应用。
和所有技术相同,存储虚拟化技术在带来以上便捷性的同时,也存在着一些弊端和问题。主要体现在以下几点:
1.性能瓶颈及单点故障风险
在某些存储虚拟化实现方式下,例如对称存储网络虚拟化时,由于所有主机对存储设备的访问均通过存储虚拟化设备,其设备性能就成为了整个存储系统的性能瓶颈,并带来了单点故障风险。虽然存储虚拟化设备厂商均采用了大容量Cache等技术应对性能瓶颈,但对于一些高性能存储设备而言,采用对称存储网络虚拟化设备时,仍无疑会出现“小马拉大车”的情况。对于单点故障风险,存储虚拟化设备厂商在设计中也进行了充分考虑,采用了物理冗余等一系列措施进行保障。
2.厂商绑定风险
虽然存储虚拟化技术实现了异构存储的统一管理,但就存储虚拟化设备而言,仍只能进行单一选择。这就意味着,一旦选择了某个厂商的存储虚拟化设备,在扩容中,则必须选择该设备所兼容的存储设备。所以在存储虚拟化设备选择前,须充分了解该设备的兼容性列表。
所以,存储虚拟化技术能够方便地实现存储设备的统一管理及存储资源的整合,有效地提高存储系统资源利用率、可用性及可扩展性,并大大降低管理复杂度和成本。
高校在数据中心规划和建设过程中应当充分重视和研究存储虚拟化技术,根据自身需求和特点灵活使用,以提升数据中心存储服务的质量。