面向业务的自动化运维管理探究

2015-01-23 09:17李威顾海林
中国科技纵横 2015年1期
关键词:虚拟化运维管理系统

李威 顾海林

【摘 要】 管理云计算、大数据等互联网新技术为企业的IT运维管理带来了新的机遇和挑战,而随着管理的上收,电力信息化系统需要实现资源的自动化运维。

【关键词】 自动化运维

1 变革中的国家电网信息化系统

随着国家电网公司信息通信融合、信息化SG-ERP工程建设、应用的不断深入,信息系统已经融入到了电网企业生产经营的各个部分,信息化工作不再仅仅是生产经营的支撑活动,而已经成为生产经营环节不可缺少的组成部分。成为保障企业安全生产的重要因素。信息系统运维工作作为企业信息化工作的主要组成部分,肩负着保障信息系统安全、可靠运行,确保信息系统在企业生产经营发挥重要作用的重大使命。建设安全稳定、架构合理、功能完备,标准规范”的信息系统运维综合监管平台,将有力地提高运维服务的工作效率和质量。

2 运维管理现状与焦点

狭义上的IT运维管理也就是我们通常说的网络管理,它是监督、组织和控制网络通信以及信息处理所必需的各种活动,包括设备监控、应用与业务监控、网络接入安全、信息安全、人员监控、业务优化、大数据分析等多个层面。随着云计算、SDN、Web 3.0等技术及潮流的成熟落地,企业系统规模的不断扩大,业务应用的持续增加,其IT基础设施的架构越来越复杂。越来越多的企业CIO已经意识到,从业务的角度对技术进行整合或者像业务一样运营管理IT变得越来越重要。否则将难以胜任新形势的业务需求,并且极有可能陷入不断投入黑洞。

国家电网公司数据通信网络及信息业务系统以往主要采用各省分散建设、分级管理的管理模式,各级单位技术体制、层次结构、配置标准、运行策略、维护模式等存在明显差异。

流程体系建设是信息系统运维工作的核心。通过流程体系的规范化标准化建设,明确各层级、各部门在数据通信网及信息系统的角色等为、程序步骤、职责内容、工作标准、输出成果等,一方面,理顺业务协作关系,推进数据通信网及信息系统的稳定、安全、高效运转,另一方面,也为后续信息系统运维建设和考核体系建设提供基础和依据。

目前,公司数据通信网及信息系统难以实现全网监控、调度与资源管理的最大技术性障碍在于IT系统的缺失,而相关的组织职责落实、流程运转协同、工作考核评价等工作,也受制于IT系统的全面支撑。因此,在国家电网数据通信网改造工作将近完成之时,有必要尽快启动面向全网及信息系统业务的综合运维管理平台的建设工作。

综合运维管理平台建设的目标是:建立一个集中的,适应国网公司实际业务需求的支撑系统,对各类、各层级运维管理系统实现信息集成交互和功能整合重构,实现全网性业务监控、全网性配置调度和全网性资源管理,提升运维管理的标准化和科学化水平,提高网络运维效率和运维质量,为实现网络运维管理从分散管理演变为集中管理,实现事件及时发现、业务快速部署、故障快速处理、资源透明可控、业务综合保障提供技术手段的基础。

3 新技术趋势

IT正从辅助工具向业务引擎演进, IT管理也出现了新的趋势。

3.1 趋势一:IT管理的负责人级别不断提升

随着IT业务的重要性不断提升,IT管理的重点也不断向业务倾斜。出现了针对主机的管理,针对服务器的管理,针对数据库和中间件的管理,这也就是人们常说的业务管理系统BSM。IT管理的负责人由网络维护责任人提升为企业管理层领导。IT管理作为企业的核心业务,已经成为了一个系统工程。IT管理责任直接由企业的CIO承担。为了提升IT管理效率,减少IT管理的随意性和不可控环节,减少IT管理者个人技能水平的差异对IT管理的影响,实现对IT管理进行量化评估,业内先进的过程管理方法论被直接运用到了IT管理里。从设定IT目标到IT的关键流程设计与KPI制定, 从IT关键信息采集到IT信息及IT管理员信息的大数据挖掘和智能分析,形成IT和企业业务的决策指导,并对参与IT管理的人员进行绩效评分,从而达成IT管理过程的持续改进。

在这个演进过程,IT管理的负责人级别越来越高,管理维度从开始的网络管理到业务管理,再进一步提升为针对人的管理。传统网管、BSM、ITSM三者间相互依存,统一协调成为IT管理团队上下拉通的有效手段。

3.2 趋势二:移动办公成为IT管理的新关注点

当前针对终端的管理日益重要,为了保障企业IT系统的稳定,保障企业核心信息的安全,,身份认证、病毒检查、补丁检查、黑白软件管理、用户行为审计成为了企业IT管理的必要需求,并在金融、能源电力、企业、政府等机构获得了广泛的应用。

BYOD需求在未来几年会日益高涨,企业员工希望在家里或出差期间也能及时处理企业的紧急业务。不再拘泥于PC或笔记本电脑,实现随时随地接入、办公、视频通讯、文件共享等等,这种“酷”的工作方式已经成为现实。

然而对IT管理者而言,让终端接入更加方便、安全、可控成为新IT管理的又一主要任务。他们要关注网络的接入安全,企业信息安全,避免外来人员窃取企业核心机密信息或带来网络安全风险。

3.3 趋势三:IT运维管理向自动化方向发展

目前IT涉及的资源包含网络、计算、存储、软件及中间件等多种资源,如何构建面向应用的网络,如何实现IT业务的快速开通、快速调整、资源快速回收成为当前IT管理的焦点。然而面对数量众多的网络设备、服务器、网络业务,通过人工实现IT业务的按需调配困难重重。

同时,企业越来越多的应用到虚拟化技术。虚拟化技术实现了软件与硬件资源的解耦。但如何将这些分散而又相互关联的资源统和起来为业务服务?如何管理这些繁杂的对象?只有一条路,实现“IT自动化管理”。只有“IT自动化管理”才能够将众多繁杂的资源统一监控、统一调度、快速部署、快速调整统一回收。未来的IT管理一定是自动化智能管理的天下。

4 自动化运维架构分析

云计算、大数据等互联网新技术为企业级IT管理带来了更多的机遇与挑战,同时对IT运维管理系统在管理策略、技术架构、产品性能和操作体验等方面提出新的能力要求。如何通过这些能力切实地为客户解决信息共享、资源整合、业务快速部署和业务有效保障等IT管理需求,我们来看新技术架构如何引领IT运维管理革新。

4.1 面向云端的体系架构

云计算时代的IT运维管理系统和平台应以全面开放作为自己的体系架构目标。IT运维管理系统应可视为一个基础信息和服务提供平台,提供和开放文件存储管理、关系型数据管理(RDBMS)、非关系型数据管理(NoSQL)、倒排索引管理(Inverted Index)、通用消息队列管理等一系列平台服务,及资源管理、用户管理、故障管理、连接管理等各层次的业务功能服务。用户可以通过IT运维管理系统提供的丰富接口,提取有价值的信息和功能整合到自己的系统中,形成自己的业务管理与监控平台。

新一代的IT运维管理系统应基于面向服务和扩展的体系架构,通过精简、优化和重构原有各类平台服务和业务功能服务,并将其封装为不同粒度的REST(REpresentational State Transfer,表征性状态迁移)Web服务并对外开放。对主流网络设备厂商的各类型网络设备命令行、SNMP、NETCONF提供一致的配置与协议处理,在异构应用系统间提供序列化对象、XML、JSON、ASN.1等各类消息的通信与转换。使用户能够充分利用这些服务接口,提取有价值的信息或业务流程整合到自己的应用系统中,将IT系统的价值深入融合到企业的管理中。

4.2 资源自动管理与编排

云计算的部署与应用使网络规模变大的同时也给IT系统的运维管理和控制带来新的要求。运维管理系统需要能够将云计算基础设施的各种资源进行虚拟化,为数据、计算能力、存储以及其他资源提供一致的逻辑视图来实现资源的池化,并能依靠自动化的手段来对各项资源进行高效地调度、管理和分配。

IT及网络管理系统需要通过对VMware、Hyper-V、KVM、Xen等多种虚拟化技术的抽象进行统一管理,并配合支持MDC(Multitenant Device Context,多租户设备环境)、VCF(Vertical Converged Framework,纵向虚拟化技术架构)的网络设备,提供资源管理、拓扑计算、故障检测和性能监控方案,满足不同架构的虚拟化应用和管理要求。

在完善虚拟化管理能力的同时,IT及网络管理系统更应着重加强自动化管理与配置功能。以全新的自动化编排方案,协助用户进行应用资源的合理分配,自动发现各种物理和虚拟资源,将其纳入网络和计算资源池,同时还可以将网络资源、计算资源进行切片,基于业务需求进行资源的分配和组合。

4.3 随需而变

国家电网公司IT及网络管理系统的用户往往已经在使用着自己已有的ERP、CRM、员工自助等各类型IT系统。基于员工使用成本及学习曲线方面的考虑,企业级用户往往希望新的IT及网络管理应用系统与已有系统的界面外观、功能描述、操作体验保持一致。

“唯一不变的就是变化本身”,在IT网络系统的管理与应用中,同样适用。因而IT运维管理系统应该能够做到便捷地按需定制,即能够根据用户的要求量身剪裁,使系统的界面外观、功能描述、操作体验更加贴近和符合用户的既有使用习惯。

灵巧的IT运维管理系统中应提供可定制的界面主题框架、内容展示配置框架和服务运维管理框架,从而实现对界面风格、背景图、配色、图标、功能导航栏、窗口视图、内容组织、业务流程及实现方式进行自由地定制和调整,满足国家电网公司用户对于管理界面的功能、风格,实现更个性化的管理需求,达到随需而变的目标。真正地践行着“您无需改变习惯,我们为您的习惯而改变”的设计和服务理念。

5 实践

像业务一样运营IT是CIO共同目标,它的目的是保障业务服务质量,提高IT对业务的贡献,最终实现从单纯的支撑部门转变为业务增长的引擎。这项工作对于很多企业的IT部门来说,这都是极富挑战性的。因为IT部门受到很多既有的应用、技术、技能和习惯的限制。在IT与业务的整合程度上来说,理想与现实尚存在差距,情况并不尽人意。不少企业已经实施或正在计划部署云计算相关系统,但通常只是提高了IT部门的工作效率,并未产生效益,这与“重工具、轻管理”的思想残存不无关系。

从技术上来说,要实现上述目标,可以按照以下三个步骤来完成(如图1所示)。

5.1 融合

这是构建贴合业务的IT系统的第一步。融合管理的理念不是在云计算之后才有的,但云计算使融合管理成为必然。早在几年前,IT管理员们就发现,当IT越来越成熟,其承载的企业业务系统日趋复杂,单一、面向功能的管理系统由于标准不一、各自为政,一旦企业IT设施发生变化或用户核心业务进行调整,往往很难适应。一般而言,在底层的IT基础设施一般包括网络、存储、服务器(物理/虚拟)、动力环境等,深层次的配置、故障处理可以由各自的管理系统完成,但需要有一个统一的界面完成监视、告警等数据的呈现(如图2所示)。很难想象,一旦某项业务出现问题,管理员需要手动或依次在各个环节进行定位、排错,这样的管理模式只能说达到资源的整合,但未达到资源管理的“水乳交融”。

融合的IT基础架构管理显得越来越重要,IT管理员不仅可以在一个平台上了解各种IT资源的状态和利用情况,还可以进行资源的按需调配。

5.2 虚拟化

虚拟化就是把物理资源转变为逻辑上可以管理的资源,以打破物理结构之间的壁垒,该技术将存储、网络连接和计算等资源有机地结合到一起,创建了一个数据中心的更加融合的基础架构。虚拟化技术在数据中心里不断增长的应用已成为不争的事实,通过虚拟化能够减少物理设备的数量,降低能耗,并且增加数据中心的灵活性,从而减少数据中心的整体拥有成本。

但虚拟化在简化数据中心结构的同时也给管理带来了新的难题。由于虚拟化用多个物理实体创建一个逻辑实体,或者用一个物理实体创建多个逻辑实体,真实的物理实体对外具有不可见的特点,对日常的运维管理提出了挑战。如今,在存储、网络、服务器、应用系统等各领域的虚拟化技术已经相对成熟、标准(如图3所示)。

困扰之处在于如何将这些不同类型的虚拟化技术贯穿起来。值得庆幸的是,已经有一些标准、方案在致力于改进它们之间的联系,如物理交换网络和服务器内的虚拟交换网络之间的协同。随着服务器虚拟化技术的大规模应用,网络和服务器的边界变得模糊,还引发了新的问题——网络及计算资源的调度问题。在创建虚拟机或虚拟机迁移时,VM主机能否正常运行,不仅需要在服务器上的资源合理调度,还需要网络连接的合理调度。网络管理者必须确认当物理服务器运行虚拟机时,同样的交换机端口也被分配给了虚拟机使用的虚拟局域网,同样的配置包括ACL和QoS等网络配置。管理人员可以实时轮询相关的迁移建议在管理系统中手工执行迁移建议或设置参数自动触发迁移建议,以保障网络配置能够正确及时迁移。上述流程如图4所示。打通网络、计算之间的隔阂,实现资源的融合管理和智能调度,将是实现数据中心基于业务调度,并最终实现自动化的关键。

5.3 自动化

在上述两个阶段之后,还有最重要的一个步骤——自动化。自动化是一个比较大的概念,要一一说清可能会大费周章,但我们的目的是明确的,归根到底,就是要“向管理要效益”,要转变大多数企业中IT部门的从属、“工具性”角色,和企业业务紧密的结合起来。从这个角度说,自动化就是通过IT管理使得IT更加智能,保障业务安全顺利地开展,平衡 IT资源与 IT 需求,提高敏捷性以快速应对新的业务要求。

举个例子,企业组织就像生物有机体一样,各业务部门就像心脏、大脑、胃、四肢等器官,它们都有固定的隔膜、外形。自动化阶段的IT,就像食物、水、氧气、化学物质等基本养分。虽然器官的隔膜有足够的结构和强度,但是并不妨碍基本养分畅通无阻地穿过,使整个IT与业务真正融为一体。

当前,自动化不像融合、虚拟化相对成熟,该领域正在进行深刻的变革,Openflow、SDN等技术实际上都是为了解决这个问题。为了屏蔽不同厂商、不同型号设备的差异,使IT管理员聚焦在服务本身,必须要作到对资源及业务的快速开通,如图5示意。在云时代的数据中心环境中,以开通一项Web应用为例,从客户接入设备(用户认证信息、VPN资源)、承载网设备(ACL、QoS资源)、数据中心设备(VLAN资源)上分别进行配置,打通管道,最后在服务器上建立虚拟机,分配存储资源并搭建应用,这就要求管理系统建立一种机制,将各种资源提供的能力抽象出来,从业务的角度部署、监控和评估,帮助用户摆脱业务规划、实施、变更和监控的管理复杂性,提高服务提供者响应云服务需求的业务快速部署能力,最大限度地提高服务提供者的在基础设施建设中的投资价值。

H3C iMC智能管理中心从2007年发布第一个版本到最新发布的V7版本,刚好契合了上述的三个步骤(如图6所示)。

在继承iMC V5的虚拟化管理能力上,iMC V7基于HTML5架构,提供了全新的自动化编排方案,可以自动发现各种物理和虚拟资源,将其纳入网络、计算资源池,合理进行资源分配。同时iMC V7可以将网络资源、计算资源进行切片,基于业务要求进行资源的分配和组合,如图7所示,具体包括:

提供设备能力模型集,屏蔽配置复杂性;

将设备能力提取、抽象、封装为可编排调度的服务接口;

自动化编排,实现IT业务快速交付与变更,并提供第三方接口。

6 结语

新一代的IT运维管理系统应以云计算环境下的服务体系架构设计,最大化系统的可伸缩性和可扩展性,并提供资源的统一管理与服务编排、操作体验与业务流程定制、各种主流访问客户端中适宜及一致的使用效果、便捷的内容发现与检索、业务数据的挖掘与应用等各项能力。

IT发展到云时代,已经没有人否定其重要性,但企业IT部门尚不能沾沾自喜。统一融合、虚拟化等绝大多数的新技术、新方法只能为企业提高效率,而真正提高效益的工作,仍集中在业务部门中,IT仍只是支撑的手段。唯有构建高度自动化的IT运营管理系统,才能使得企业的IT站在决策指导的高度,为企业效益的提高贡献力量。

参考文献:

[1]《基于ITIL的IT服务管理基础篇》.清华大学出版社.

[2]《H3C智能管理中心技术白皮书》.

[3]《网络管理维护大师》.四川电子音像出版中心出版.

猜你喜欢
虚拟化运维管理系统
基于James的院内邮件管理系统的实现
运维技术研发决策中ITSS运维成熟度模型应用初探
基于OpenStack虚拟化网络管理平台的设计与实现
基于LED联动显示的违停管理系统
对基于Docker的虚拟化技术的几点探讨
虚拟化技术在计算机技术创造中的应用
海盾压载水管理系统
基于ITIL的运维管理创新实践浅析
存储虚拟化还有优势吗?
基于RFID的仓储管理系统实现