文|美国康普公司 兴 嘎 徐 鹏
2008年推出的《电子信息系统机房设计规范》(GB 50174-2008)是我国针对数据中心建设设计的最新标准规范。在这个规范中,将电子信息系统机房分为A、B、C三级。对于A级机房的定义如下:“第一,系统中断将造成重大经济损失;第二,系统中断将造成公共场所秩序的严重混乱。”根据以上两点定义,无疑我们可以确认金融行业的数据中心,基本上都可以认为是A级数据中心。因为,我们通常讲的金融行业,一般包括银行、期货、保险、证券、基金等,对于这些行业,一旦其数据中心服务中断,均会造成重大经济损失以及严重的社会影响。
同时,我们也在GB 50174-2008标准的附录中,看到了对于A级数据中心标准推荐“宜采用实时智能管理系统”。对于标准的这一点推荐,已使我们看到对于数据中心基础设施的管理,智能化管理无疑是未来的发展趋势。
目前,在金融类的数据中心中已经开始采用了实时智能管理系统,对其基础设施进行智能化的管理,本文就是在目前的情况下,对于智能化基础设施管理系统在实践之中的经验进行了一定的分析和总结,作者希望通过本文的说明,能够使读者对于实时智能管理系统在数据中心流程管理中的功能定位和应用有一个更加深入的了解,进而通过多个角度的视角,能够建立一个对于智能化管理系统较全面地理解,并能够使智能管理系统在数据中心的管理中发挥其应有的效能。
本文将从以下几个问题去展开探讨:
(1)为什么标准会在A级数据中心中推荐采用智能化基础设施管理系统?是基于什么样的出发点?
(2)智能化基础设施管理系统在数据中心的既有实践是怎样的?
(3)智能化基础设施管理系统在数据中心管理中有哪些特别的功能?
目前对于智能化基础设施管理系统在智能化建筑中的应用,已经有不少文章做了介绍,但是对于智能化基础设施管理系统在数据中心中应用是怎样的,很少有介绍。笔者正是希望通过本文的一些介绍,能够给读者一个视角,去初步了解到智能化基础设施管理系统在智能化建筑和在数据中心中管理的不同点。
下面,就第一个问题,让我们去了解一下金融数据中心的特点,以及其在管理上一般流程,进而我们才能理解为什么标准会推荐在这类数据中心中宜采用实时智能管理系统的原因。需要说明的是,以下的一些总结和图表,并没有一个具体的指向,而是根据我们在金融数据中心的一般经验而得出的,所以这一点需要提醒读者注意。
金融行业数据中心是有其自身的特点,这些特点既有普遍性,也同时具有行业的特殊性。一般来讲,金融数据中心是长期存在发展的,这就导致其需要不断调整自身去适应外部环境需求的变化,由于这种不确定性,无疑从运维管理的角度,如何通过高效能的管理达到高级别的服务等级,一直是一个巨大的挑战。那么,金融数据中心主要有哪些特点?
根据一般的经验,我们对于金融数据中心的特点作了如下的归纳:
(1)金融数据中心一般长期建设发展,长期运维管理,规模日渐庞大。
(2)金融数据中心各种类型的硬件设备种类齐全,且不断增加。
(3)金融数据中心各种类型的应用特别繁多、复杂,且时有变化。
为什么会这样说?因为,金融数据中心一般都是在一个长期的过程中不断建设、发展和变化之中,在这个过程中,不同时期有不同时期的平台设备,同时也建立了基于不同平台的各种应用系统,这些异构的、复杂的、多样的系统,对于运维人员来说,一直存在管理、安全、兼容性等许多复杂的问题和挑战,这也是对于数据中心的基础设施的管理,特别需要智能化管理系统主要原因之一。
再来,就是金融数据中心一般都是流程化的管理,那么这个流程一般是怎样的?
金融数据中心在长期的运维管理之中,已经有完善的管理架构和流程。图1是一个简单的金融数据中心管理架构示意图,该架构仅供参考。一般从金融数据中心运维的角度,有一些管理功能团队是必不可少的,如维护支撑团队、网络团队、主机团队、平台运维团队、安全审计团队等,当然还有更细的划分,本文不做讨论。
图1 IT维运系统架构示意图
由上可知,通过管理运维架构的明确职能划分,进而建立起标准的管理运维工作流程和应急的工作流程。那么怎样才能更有效的管理好数据中心?目前一般均以ISO 20000标准为框架,建立符合ITIL“最佳实践”的IT服务管理体系。即通过将技术、流程、人员三者的完善整合,而对外提供高效的数据中心服务级别。
我们接下来讨论的是目前常见的数据中心流程化的操作中,对于基础设施的运维管理存在的一些问题:
(1)目前,对于数据中心基础设施的管理运维,还没有一个适用的标准,特别是布线管理。
(2)目前,大家均意识到数据中心基础设施的重要性,但是在建设初期,很难考虑到后期的发展变化。而目前我们知道,大多数数据中心在建成几年内都会有一次较大的变更。而这种变更带来的管理压力是巨大的,尤其是布线管理,目前采取的办法是一般不要动,如果一定要变更,在目前系统之上新增为主。
如上所述,我们意识到金融数据中心的大规模、集中化、复杂化带来了管理上的巨大挑战,这个挑战是多方面、多层次的,其中包括基础设施的管理挑战。
现在,我们已经对于金融数据中心管理上所要面对的挑战有了一个初步的了解,下面,我们需要了解一下智能化基础设施管理系统对于管理方面,能够提供哪些帮助?
一般来讲,对于智能化建筑的综合布线系统,我们认为“综合布线智能管理系统工作在物理层,而通常网管软件工作在网络层,它能告诉网管员逻辑链路的故障,但不能告诉网管员物理故障的位置,这一点恰恰是智能布线系统的功能之一。智能布线系统能够实时、准确、方便的提供布线系统端到端的链路连接,并且实时监控其状态,并自动更新、记录所有的信息文档到数据库中,节省操作复杂性,提高管理效能。”
针对如上的理解,可能读者会有疑问,在数据中心中这些功能并不一定有用,如果确是如此,那么为什么数据中心要采用智能布线管理系统?回答这个问题,首先要对如上理解作一个分析,应该说这个理解是不全面的,因为实时智能布线管理系统,其主要理念是:“可视+知识+控制”。怎么理解这个理念?“可视”即通过软硬件结合布线系统建立可视的基础架构管理系统;“知识”即由于可以直观的看到,就可以帮助管理人员建立基础架构的整体概念;“控制”即由于有了完整的基础架构的概念,则进而通过流程化的操作,避免人为的失误,从而极大地提高管理效能,为前端用户提供高质量的服务,最终达到降低管理运行成本的目标。
综上所述,针对数据中心的智能化管理,目前市场上有多种相关软件系统,但一般都是针对数据中心的多厂商设备平台而言,包括服务器、网络设备等,使得运维管理人员可以进行审计,保障安全。而“实时智能化管理系统”主要的不同是:首先是基于智能化配线架软、硬件平台的建立;其次通过软硬件系统的交互提供一套实时的物理层基础设施的可视管理工具;最后基于以上两点建立一套物理层基础设施管理流程(电子工作单系统)。这是实时智能化管理系统的根本不同之处。
表1摘自《数据中心布线系统设计与施工技术白皮书》,这个表格总结了纯软件和软硬件平台的管理功能上的差别。
表1 布线管理软件和智能电子布线管理系统
通过表1比较,同样是工作单流程,虽然均是通过软件手工建立,但由于智能化管理系统有硬件平台的配合,使得电子工作单的执行操作,可以由智能化硬件平台的操作导航,并且有完整的计划和非计划的操作记录,这使得基于电子工作单的管理可以很好的整合到流程化的管理之中,这一点是纯软件系统所无法实现的。
下面,我们通过一个例子进一步的进行说明。
第一步,智能化基础设施管理系统的操作人员定义:一般涉及到四类人员:网络工程师、网络主管、现场操作员、IT审计人员。
第二步,进入流程化操作,如图2所示。
第三步,流程化操作以后,哪些相关人员可以从智能化基础设施管理系统中获得所需信息和报告?如表2所示,无疑其中有许多功能和信息是可以帮助管理人员,使其从被动变为主动,从复杂表格管理变为直观数据库管理,从非计划操作变为计划操作。
图2
表2
当然,除以上功能之外,目前智能化基础设施管理系统结合了电子配线架系统,也同时提供了许多专门针对于数据中心的管理功能,比如:
服务器部署功能:即对于数据中心常用的服务器,系统建立模板,在通过电子工作单和服务提供的功能,使得在数据中心服务器部署时,变得直观、可视且方便、简单。
机柜容量管理:这个功能可以让管理人员管理到数据中心的每一个机柜的安装空间容量和电源容量,这样的服务器部署时可以即时判断可用的机柜和最佳部署位置。
如上,还有许多在数据中心管理上的高级功能,由于不是本文讨论的重点,所以不再赘述。
今天,在IT行业数据中心是热点中的热点,那么在数据中心中也有许多的热点,如绿色、节能、虚拟化、智能、高效等,同时如何应对管理复杂大型数据中心的挑战,也是我们所关注的,这也是本文所探讨的。