潘珊珊
(西安欧亚学院信息工程学院,陕西 西安 710065)
随着时间的推移和业务的发展,今天大家都面临信息爆炸的威胁:数据量快速增长,数据有效期长,历史数据积累率高,数据相对分散,共享水平低等一系列的问题暴露在我们面前。
以数据为核心,加强对数据的高质量的管理是现阶段的首要工作。数据的高质量管理包括合理存储数据、快速查询数据、安全备份数据、灾难恢复数据等诸多内容。当一个IT系统中有三个以上的应用系统同时存在,且相互之间存在某种联系时,存储系统及数据整合便迫在眉睫。数据的整合、集中要从存储系统整合开始,要充分保证数据的安全、完整、快速被应用系统调用,又能保障高度的扩展性、数据的共享和相互利用,采用新的存储虚拟化技术和产品改造传统架构是数据集中的首要工作。
各大企业信息中心已经经过了多年的建设,已经形成了涵盖多业务系统、多部门、多主机的跨业务综合平台,由于项目建设周期长,造成了目前多子系统独立运行的局面,这就导致存储可能成为整个系统发展和容灾建设的瓶颈,更直接的后果是数据的分散存储及不易于管理。目前各大企业信息中心已经提出数据整合和存储虚拟化平台(开放式存储平台)的建设目标,包括:
对分布存储在各自系统的数据实现集中和统一的存储管理;
对数据库管理的集中;
对服务器系统的改造,尤其是对原单点服务器向集群系统的改造。
综合这些现状及需求,都需要以一个统一的数据存储平台为基础,对于各大企业信息中心的系统规划来说,首先考虑存储和数据整合,企业信息中心目前的磁盘阵列设备和数据基本上都是各自孤立的,基于这种现状,实现统一存储虚拟化和数据整合是系统发展和系统容灾的前提。
在整合的基础上,自然实现了多个数据库的物理集中,而数据库本身的集中可以此为基础进行应用上的调整。同时,可以集中存储为平台,调整服务器系统,建设为一个开放的存储平台,可以适应任何的服务器环境包括集群环境的变化,为企业建立标准化的信息,更好的为企业业务发展服务。
SNIA(存储网络工业协会)关于虚拟化的定义是:通过将一个(或多个)目标服务或功能与其它附加的功能集成,统一提供有用的全面功能服务。典型的虚拟化包括如下一些情况:屏蔽系统的复杂性,增加或集成新的功能,仿真、整合或分解现有的服务功能等。
各大企业信息中心存储虚拟化与数据整合将是一个长期运营的系统,为保证系统的长远发展,需要我们在系统建设前做好长远的发展规划:
3.2.1 总体规划,分步实施
企业信息中心业务系统将是一个不断发展的项目,不可能一步到位,首先是满足规划期数据整合和容灾基础建设的需求,即应用系统中心统一存储平台,同时在统一的虚拟存储平台中实现所有应用和备份数据的统一分级管理,实现近线备份,接下来的规划是:以整合的虚拟存储池为基础,实现同城数据级实时远程容灾;
3.2.2 系统扩展的规划
本文所讨论的设备应能满足企业信息中心自身数据存储和容灾的需求以及5年以上的发展,且设备具有很好的扩充性;
所设计的系统架构上也具有横向扩展能力,在设备本身达到扩展极限的时候,可以通过添加设备保证系统处理能力在线升级;
3.2.3 远程容灾的规划
当企业信息中心的IT系统建立起来后,所有的业务将逐步依赖于IT系统的运营,除了本地数据备份和归档、同城容灾以外,将来应考虑建立跨区域的容灾中心,保证企业信息中心的业务连续性。
依据虚拟化引擎的位置不同,存储虚拟化技术分为带内和带外两大类。如果引擎工作在数据的访问通道上,那么就成为带内虚拟技术,否则就是带外虚拟技术。
虚拟化引擎在系统设计中占有重要的地位。无论带外还是带内技术,都需要虚拟化引擎对整个系统的存储资源进行驱动。一旦虚拟化引擎出现微小的问题,那么将影响整个存储系统的工作,导致所有主干应用业务的宕机,对企业信存储系统的连续性产生重大的影响。因此推荐选择成熟度较高的产品和技术,避免出现功能上的严重缺陷、兼容性的缺陷等问题。
虚拟化可以帮助各企业完成三个重要的工作,即调整、利用和优化,从而有助于创建一个在经济方面和生态方面都极为出色的数据中心。利用存储虚拟化技术从而进行数据整合,找到了一条从调整存储资源入手,进而利用再到优化的途径。此成熟度模型允许IT合并他们所有的存储,并根据需求应用它们,以满足应用需求,并能够通过一系列通用的软件和流程进行管理。当整个环境成熟时,IT可以从简单的数据合并和迁移,经过容量适中的层和数据移动性,再实施自动化的、基于策略(甚至也可以是基于内容)的数据分配,最终移到其最佳层。
存储虚拟化是一个重要的指标,也是与存储有关的 CAPEX的一个重要组件。通过虚拟化,可以显著提高平均存储利用率,因为不会再以一种分散的方式采购、管理和配置存储,并能实现峰值容量。各企业能够减少浪费的存储成本,其容量等同于 IT环境中搁置的存储容量。
在企业信息化建设过程中,由于各类信息系统建设阶段所依赖的技术局限性,积累了大量采用不同技术平台的异构数据源,尤其是存储资源的混乱,从而导致数据资源的分散。这些数据源所依赖的业务应用系统、数据库管理系统甚至操作系统平台之间均存在不同,这些分散的、不同的计算机信息系统支持了业务的发展要求,但是,异构数据源的整合、集成也成为信息化建设过程经常遇到的一个现实问题,也越来越成为制约信息化建设和实现数据共享,以及使信息化建设投资重复的一个重要因素。充分利用先进的数据整合技术,通过存储虚拟化来整合数据、共享信息,推动信息化向更高层面发展成为必然。
利用现今成熟的存储虚拟化技术整合存储资源,从而达到对数据资源的重新规划和整理能够有效解决日益严重的"信息孤岛",繁重的数据采集、整理和分析任务,多数据源、异技术架构的数据存储等诸多问题,将在企业信息化建设进程中日益发挥不可替代的重要作用。
[1]刘朝斌,谢长生,张琨。存储网络虚拟化关键技术的研究与实现.计算机科学2004年(31)
[2]谢川,虞勤.虚拟存储及应用分析.数据库与信息管理.2007年
[3]周庆佐、贾瑞新、柯冬香等.多信息系统数据整合的研究与实现2004年第164-197期
[4]曹志英,李冠宇,谢益武,董杰,柴建忠;企业现有应用系统的概念层数据整合技术与方法;计算机工程与应用;2003年08期