金晖,罗堃, 欧兵
1.四川大学华西第二医院 信息管理部, 四川 成都 610041;2.四川大学生命科学学院 教务处,四川 成都610064
存储虚拟技术的发展及在医院的应用现状
金晖1,罗堃1, 欧兵2
1.四川大学华西第二医院 信息管理部, 四川 成都 610041;2.四川大学生命科学学院 教务处,四川 成都610064
存储虚拟化技术就是将不同的物理存储设备,比如RAID、JBOD、磁带库等,通过不同的接口协议SCSI、ISCSI、IFCP等 和一定的手段来集中管理[1]。从主机的角度看它不是多个硬盘,而是一个分区或者一个卷,如同一个超大容量的硬盘,这些分区或者卷利用计算机操作系统平台上的卷管理软件进行管理,把多个磁盘组或多个磁盘条带组织起来,虚拟成统一的数据块集,这样操作系统就可以统一而方便地使用所有磁盘。对于用户来说,虚拟化的存储资源就像是一个巨大的存储池,存储池可跨多个存储系统[2],通过将一个或多个目标的服务或功能与其他附加的功能进行集成来提供全面的功能服务。虚拟化作用在一个或者多个实体上,这些实体则是用来提供存储资源及服务的,在单一控制界面动态地管理和分配存储资源,用户不必关心自己的数据在哪一个具体的存储设备上。
简而言之,就是将底层存储设备进行抽象化管理,对存储硬件资源进行抽象化表现,其核心是虚拟存储结构[3],在服务器层屏蔽存储设备硬件的特殊性,只保留其统一的逻辑特性,从而实现存储系统集中、统一而方便的管理。整个存储系统中的虚拟存储部分就像计算机操作系统,对下层管理各种具体设备,对上层提供相对统一的运行环境和资源使用方式。
存储虚拟化是伴随大型计算机的发展而出现的,在20世纪70年代,由于当时存储设备的容量小、价格高、大型应用程序或多程序应用都受到了极大的限制,为克服这一局面,人们开始采用存储虚拟化技术[4]。首先出现在缓存控制器阵列RAID,该技术诞生于1987年,由美国加州大学伯克利分校提出,它是将多块硬盘通过硬件或软件方式结合成虚拟的单块大容量的磁盘来使用,大大提高了系统的容错度、稳定性和冗余性。到20世纪80年代初期,一些厂商提出服务器共享存储的思路,出现了网络附加存储NAS,使服务器集中存储数据且不受地点限制,提供前所未有的灵活性,多个用户可以同时读写存储,访问相同数据集,提高用户间的协作能力及可扩展性。到20世纪90年代中后期,随着网络技术发展与处理能力的大幅提高,传统的单机数据处理方式不能满足信息系统发展的要求,被以数据为中心的网络存储所取代,存储系统与网络系统结合起来,产生了网络存储系统,存储区域网络SAN[5-6]的出现进一步推动了存储虚拟化的发展,与此同时产生了存储资源整合的概念,SAN通过有效共享存储资源提高容量利用率,有助于企业整合存储资产,便于利用通用软件工具简化管理,并可远距离复制关键信息,显著提高灾难的保护能力,避免了数据损坏。21世纪初,各存储厂商将先进的虚拟化技术引入到自己的产品中,这些功能不仅提高了利用率,而且支持异构存储外部连接,实现不停机数据迁移和移动,提高业务连续性,可进行逻辑磁盘分区,多层存储以及精简预配置,利用精简预配置,可在应用程序写入数据时,分配磁盘或文件系统的物理容量,而不用在配置时进行预分配[7]。
存储虚拟化主要是通过动态伸缩的存储池,统一接管存储系统中的所有已分配和未分配的存储资源,并协调利用,应用服务器群组通过FC、SAS等通讯方式访问存储池中的存储资源,存储虚拟化具有广泛的兼容性,可以支持标准协议的不同品牌、不同型号的磁盘阵列,将其划入统一的存储池来进行管理和分配,为应用系统提供灵活、高效、差异化的服务[8]。
存储虚拟化是物理存储的集合(图1),是将多个物理存储设备集合成一个逻辑的存储设备,这样就能简化存储管理。人们都在讨论实现存储虚拟化的最好方法,但是没有一种方法可以适用于所有环境,需要根据具体情况采用不同的架构方式。
图1 HIS、LIS、PACS应用系统的虚拟化整合
2.1 带内虚拟化
在主服务器和存储设备之间实现虚拟功能,是传统的产品和存储系统经常采用的方法,其特征是带内/对称存储虚拟化技术采用x86软件或专有硬件以及软件存储系统,看起来就像是始于存储设备,终于主服务器。这是最常见的存储虚拟化形式。优点是无需代理主机,相关部署实例和超高速缓存能够帮助实现各项性能,同时保持灵活性,最大的好处就是异构存储的兼容性很强,其次就是不占用主机资源。缺点是实施部署复杂,在网络路径上增加了一个额外的环节,增加了主机和物理存储设备之间的延时,还要求具备强大的错误和故障处理逻辑以确保经过缓存和确认的I/O被安全地存储到后端设备[9],是一种比较适合医院存储虚拟化的构架方式。
2.2 带外虚拟化
带外存储虚拟化设备安装在主机和存储之间的数据通道之外,因而主机中需要安装专门的软件。其特征是带外/非对称存储虚拟化技术可以减少带内存储存在的性能问题。但是,带外存储需要依靠代理主机和元数据控制器访问存储设备,这样就使存储虚拟化变复杂了。优点是实施容易,缺点是需要占用主机资源。 带外虚拟化系统一般部署于大规模存储系统,通常管理大量的异构存储设备[10]。
3.1 虚拟化对于存储和网络的性能开销
存储虚拟化的应用是在物理存储和架构之间增加了一层抽象层,包括交换机和服务器。增加工作会占用CPU,影响其他计算机存储和应用,会增加延迟性。 但是依赖于部署的存储虚拟化产品,实际上增加了性能,这也是为什么对于医院来说寻求基于应用的存储虚拟化是很重要的,由于存储虚拟层中间缓存的存在,这样频繁访问磁盘的过程得以减少,尽可能地让低性能存储发挥出最大性能。
3.2 移除虚拟层面临的困难
存储虚拟化应用对于医院是个重大的决定,一旦部署,从存储到服务器以及物理存储之间是完全抽象的,但是所有的管理工作在控制台是可以清晰地呈现出来,可以知道那个磁盘存放了医院的核心数据。退出存储虚拟化是有风险的,需要备份数据,移除虚拟层,然后把数据恢复到物理存储设备上。特别需要指出的是在最初实施虚拟化的过程中也要备份医院业务数据。
3.3 支持存储系统的在线扩容
存储虚拟化可以帮助存储容量扩增自动化,不需要手动的配置,存储虚拟化能够运用策略,分配更多的存储容量给所需的应用。存储虚拟化也可以允许存储资源在传送的过程上进行更改或者升级,这些操作都无需中断应用性能,减少了修理和维护所需要的存储宕机时间。以前可以选择停机扩容,但是随着医院业务的逐步加大,夜间的繁忙程度已经相当于几年前的白天所发生的工作量,同时许多工作,例如:统计数据的预计算、数据库备份、重建索引等工作都在夜间进行,停机意味着将推迟和延误这些作业,时间推移会造成很多问题,特别是服务器的压力会变大。在业务量急剧增长的情况下,在线扩容已经成为必须要准备的技术,而存储虚拟化就是最好的解决方案。
3.4 存储虚拟化对容灾恢复的影响
存储虚拟化会影响备份和容灾的整合,在许多情况下复制要在两个相同的存储系统之间进行,复制的数据完全映射到原始的存储系统。在一个虚拟存储环境中,数据几乎可以复制到任何一个位于容灾站点的存储硬件上,当旧的存储被新的取代时,旧的硬件可以重新部署到容灾站点。常见的做法就是在升级新存储的时候,并没有马上将旧存储淘汰,而是利用存储虚拟化镜像技术做异地数据容灾。存储虚拟化管理的软件能够同步高性能和低性能存储设备,保证同步的效率,镜像的过程也不会影响主机的性能,存储虚拟化管理的软件已经非常强大和智能。
3.5 降低成本提高效率
存储虚拟化的采用,为许多存储相关的新技术,比如:重复数据删除、云存储提供了可能,可以排除许多新技术应用的障碍,人们需要做和考虑的只是采用存储虚拟化策略来解决问题,在不干扰用户和应用程序的情况下根据预先定义的政策实现数据迁移。
目前医院逐步建立了许多不同的应用系统,在实施的初期,为了保证系统的独立性和可维护性,都是尽量将存储分开,而且各个公司开发的系统都使用独立的数据库,并且配置了独立的存储空间,免得引起混淆,便于分清责任。这种分布各异且不相同的存储资源的不断发展,最终导致管理变得复杂,存储资源利用率低[11-12]。
存储虚拟化的采纳可将存储利用率提高80%以上,使得在存储系统和使用存储的应用之间增加了一个提取的环节,应用程序将不再需要知道它们的数据保存在哪个磁盘、分区或存储子系统中。如果一个应用程序与某些特定的存储资源相联,那么任何对于这些资源的中断都将会降低该应用的可用性。通过存储虚拟化,应用程序就不会再与某个物理性的存储程序相联系了,使得开发基于大量文件存储的程序变得非常简单,程序员只需要关注业务应用而不需要关注底层相关的性能、空间等问题。
鉴于这种架构的复杂性使得利用虚拟化技术的时候,可以从以下3个层面来实施。
4.1 服务器层面
服务器厂商和软件厂商,如VMware、Microsoft等都有相应的方法,通过逻辑卷LVM来实现,逻辑卷管理将物理存储映射到逻辑卷,不用管理存储设备的物理参数,这种虚拟化存储系统对于服务器的性能要求比较高[13]。
4.2 网络层面
在服务器和存储之间的SAN交换机串入或者旁路接入具有存储虚拟化管理和应用软件的硬件装置。前一种是利用其中的虚拟化层软件和存储系统的元数据来实现数据的传输和元数据的访问,后者是通过将数据传输和元数据访问分离解决虚拟化问题。
4.3 存储环境
一般可以通过交换架构、磁盘阵列虚拟化以及整合到应用设备内的虚拟化。不同的存储厂商具有相应的虚拟化技术,如:IBM的SVC 、EMC的Invista网络存储虚拟解决方案、HDS的TagmaStore通用存储平台等,他们的技术侧重不同,各有千秋。存储虚拟化“隐藏”了许多表面的物理系统,用一种通用的方式管理不同的设备,存储虚拟化也给所有的存储应用提供了一个一致的界面,换言之,不同厂商的存储阵列都有自己的存储应用,如复制、镜像、闪存等,而实际的应用每个医院的系统不同,在这些异构盒上加入存储虚拟化,就可以使用一套单独的存储应用,这样就没必要学习多重应用,对于数据转移和整合来说,医院业务数据具有极少的破坏性。 另外对于具体的应用,如果想从RAID0转到RAID5,首先需要备份数据,创建另一个RAID 5 LUN,然后把数据传到新的LUN,这是具有风险的,如果想要创建分层存储,可能有两到三个独立存储池作为第一层、第二层、第三层,我们不能把这些存储池放在一起,而存储虚拟化正好解决了这些问题,允许在异构池之间进行复制工作。
总体来说,满足医院临床信息化不断增长和迅速变化的需求将是未来几年医院信息化发展的首要任务[14-15]。如何灵活应对架构和需求的变化,存储虚拟化技术是值得关注的一项技术,而且这项技术现在已经变得越来越成熟可靠,医院采用虚拟化的思维来管理所有应用的存储数据成为一种可行的趋势。
[1] 马锡坤,于京杰,杨国斌.存储虚拟化技术在医院信息系统平台中的作用[J].中国医疗设备,2011,26(10):39-40,50.
[2] 黄达文.存储虚拟化技术在电力企业的应用[J].数字技术与应用,2010,(8):115-116.
[3] 康琼.存储虚拟化技术探讨[J].长江大学学报(理工卷),2010, (3):594-595.
[4] 赵建华,韩智慧.浅谈存储虚拟化与服务器虚拟化[J].电脑知识与技术,2009,5(21):5606.
[5] Kochut A,Bobroff N,Beaty K,et al.Management issues in storage area networks: detection and isolation of performance problems[C].Network Operations and Management Symposium,2004,1(4),453-466.
[6] 向小佳,余宏亮.一种基于存储虚拟化的异步远程镜像系统[J].计算机学报,2009,32(10):1905-1914.
[7] 龚松春.存储虚拟化关键技术研究[J].信息通信,2011,(3):40-41.
[8] 吴绪东.基于统一网络存储的医院数据中心设计[J].医疗卫生装备,2011,(1):45-47.
[9] 贺少领.存储虚拟化的技术研究[J].电脑知识与技术,2011,7(8): 5442-5444.
[10] 周炜,谭怀亮,易乐天,等.基于带外存储虚拟化的逻辑卷高性能快照[J].计算机研究和发展,2012,49(3):636-645.
[11] 李先锋,王凯芸,吕强,等.三甲医院虚拟化技术的研究与实践[J].中国医院,2012,16(2):12-14.
[12] 刘旻,梁悦,孙立淼.虚拟技术在医院信息化中的研究与应用[J].中国病案,2010,(1):54-56.
[13] 吴文刚.存储虚拟化技术的应用与分析[J].山西经济管理干部学院学报,2009,17(2):82-84.
[14] 华琛.医院信息系统平台建设与虚拟技术[J].中国信息界(e医疗),2010,(12):55.
[15] 潘传迪.用虚拟化技术构建医院园区网络[J].中国医院,2012, (2):69-70.
Development and Application of Storage Virtualization in the Hospital
JIN Hui1, LUO kun1, OU Bing2
1.Department of Information Management, Huaxi Second Hospital of Sichuan University, Chengdu Sichuan 610041, China;
2.Office of Teaching Affairs, College of Life Science of Sichuan University, Chengdu Sichuan 610064, China.
随着存储虚拟化技术的不断发展以及医院面临HIS、PACS、LIS和EMR系统容量的日益增加,存储的管理变得越来越棘手,异构存储整合成为必然。本文综述利用虚拟化技术将不同的物理存储作为单个集合的资源来进行集合、识别、配置和管理,不仅能减少管理问题,而且能有效提高存储的利用率,降低新增存储的开销。
虚拟化技术;医院信息化;存储整合;存储池
With the development of storage virtualization technology and the increasing capacity of systems such as HIS, PACS, LIS and EMR, storage management in the hospital becomes increasingly diffcult, thus, integration of heterogeneous storage becomes inevitable. This paper demonstrates that taking each physical storage as a single convergence to collect, recognize, configure and manage resources can not only reduce management problems, but also improve the utilization rate of storage and reduce the additional storage cost.
virtualization technology; hospital informatization; storage consolidation; storage pool
TP333;R197.324
A
10.3969/j.issn.1674-1633.2014.06.024
1674-1633(2014)06-0071-03
2013-10-28
2014-01-13
作者邮箱:li_jin_zh@163.com