张立斌
DOI:10.16644/j.cnki.cn33-1094/tp.2016.09.012
摘 要: 首先介绍了军队云数据中心的技术体系和ITIL管理体系的相关概念。然后根据军队信息化建设的特点规律,在比较了传统IT管理模式和IT服务管理模式的差异的基础上,设计了裁剪后的基于ITIL的军队云数据中心运维管理核心流程。最后提出了基于ITIL的军队云数据中心运维管理实施策略。将此方法应用在军队云数据中心的运维管理中,可以提升军队信息化建设中的IT服务质量,为提升军队信息化建设水平提供新思路。
关键词: ITIL; IT服务管理; IT服务质量; 数据中心
中图分类号:TP399.08 文献标志码:A 文章编号:1006-8228(2016)09-45-04
Research on the application of ITIL in the operation and maintenance
management of military cloud data center
Zhang Libin
(92493 Unit, PLA, Huludao, Liaoning 125000, China)
Abstract: This paper introduces the related concepts of the technology system and ITIL (Information Technology Infrastructure Library) management system of military cloud data center. According to the characteristics and laws of the military information construction, on the basis of comparing the differences between traditional IT management mode and ITSM (IT Service Management) mode, the core operation and maintenance processes of military cloud computing data center based on ITIL are designed. And the operation and maintenance management implementation strategy of military cloud data center based on ITIL is put forward. Application of this method in the operation and maintenance management of military cloud data center can improve the IT service quality in military information construction, and provide a new way of thinking to improve the level of
military information construction.
0 引言
人类社会正由工业化时代向信息化时代迈进。以信息化为核心的世界新军事变革,正改变着传统的战争形态和建军模式。推动军队向信息化转型已成为世界各国的共识。如何科学认识军队信息化建设的内涵,应对军队信息化建设面临的问题,是当前我军面临的重大而紧迫的战略任务。在军队信息化建设快速推进的大背景下,采用“大数据”、“云计算”等相关技术,建设军队数据中心成为军队信息化基础设施和基础支撑环境建设的必然选择。怎样结合军队编成特点,借鉴行业内成熟、科学的管理体制,确保军队数据中心安全、高效运行,发挥应有的效益,实现科学高效的运维管理是值得深入研究的课题。
1 军队云数据中心技术体系及ITIL管理体系
1.1 军队云数据中心技术体系
军队数据中心建设运用云理念,采用“逻辑集中、物理分散”的分布式架构,搭建“四横两纵”(四横即基础设施层、数据支撑层、服务支撑层和应用层,两纵即安全保障和运维管理)的技术体系结构。其中,基础设施层对应云资源(IaaS)层,数据支撑层和服务支撑层对应云平台(PaaS)层,应用层对应云服务(SaaS)层。
1.2 ITIL管理体系
ITIL(IT Infrastructure Library,信息技术基础设施库)是国际上通行的IT服务管理模型,最早由英国政府在20世纪90年代发布,经过近20年的实践和探索,已形成一套IT服务管理最佳实践指南,是一个客观、严谨、可量化的标准和规范[1-3]。
ITIL的核心是“服务管理”,包括10个流程和1项管理职能,通常划分为“服务支持”和“服务提供”两组。“服务支持”包括与IT运维管理相关的服务台、事件管理、问题管理、配置管理、变更管理和发布管理等1项管理职能及5个流程;“服务提供”包括与IT管理相关的服务级别管理、IT服务财务管理、能力管理、IT服务持续性管理和可用性管理5个流程。传统IT管理模式与IT服务管理模式的区别见表1。
2 军队云数据中心运维管理核心流程设计
由于军队的特殊性,其云数据中心的运维管理与传统的IT服务管理不同,因此建议采用裁剪后的ITIL流程,即采用隶属于ITIL的“服务支持”流程组的运维管理服务台职能和事件管理、问题管理、配置管理、变更管理4个流程模块构成军队云数据中心运维管理的基本框架。
2.1 运维管理服务台
运维管理服务台是用户与运维管理人员之间的技术联系点,其职能是接受、转发,以及处理用户发起的电话、邮件、在线服务请求,监控平台运行过程中提交的告警和故障事件。
运维管理服务台的运行模式主要有分布式、集中式和虚拟式三种类型。根据军队下属单位多、业务系统跨地域性强的典型业务部署情况,并综合考虑技术的成熟度,选择分布式运维管理服务台。其优势在于:可依据各下属单位的具体情况进行部署,提供本地化的IT运维服务,满足用户个性化需求。运维管理服务台运行模式如图1所示。
图1 运维管理服务台运行模式
2.2 事件管理模块
事件是指引起或可能引起服务中断或服务质量下降的不符合IT服务标准的活动[3-5]。事件管理模块的设计就是为了迅速解决此类活动,避免其对业务造成不利影响。引入该流程的目的不是要找出引发事件的根本原因,而是在服务级别与业务优先级的范围内,尽可能缩短IT业务中断时间,提高服务的可用性。事件的优先级是按照服务级别与业务优先级限定的范围设置的,它是衡量事件管理的重要指标,优先级的高低决定事件处理的优先顺序和事件处理的时限[6]。事件优先级的定义如表2所示。
事件管理模块包含以下内容。
⑴ 事件接收和记录。负责接收和记录所有用户或系统报告的IT事件。该环节的主要关注的是准确和完整的记录事件相关信息。
⑵ 事件分类和初步支持。事件可分为申告、故障、告警、咨询等不同类别,需要为所有事件根据其特性分类并确立优先级。
⑶ 调查和诊断。如果遇到一线支持人员无法独立解决的事件,此时可运用知识库、诊断工具、在线信息资源等对事件进行分析,如仍不能解决问题,可调用二线支持人员寻找解决方案。
⑷ 解决和恢复。一线或二线运维支持人员对事件进行处理,并将处理完的事件反馈给服务管理平台,由服务管理平台通知用户,并由用户对其进行确认。
⑸ 紧急事件和事件升级。如事件被定义为紧急事件,服务管理平台应立即将其提交给一线人员,并上报事件管理者和相关管理层,对该事件如何妥善处理提供决策。
⑹ 结束事件。结束事件的前提是运维管理人员得到用户确认事件获得解决的答复,在事件结束后在尽可能短的时限内更新事件库和知识库,确保事件信息得到及时和准确的记录,为后续工作提供支持和依据。
2.3 问题管理模块
问题是一个或多个存在或隐藏着的事件的深层次根源。问题管理关注的是如何找到引发事件的根本原因,而非简单地提供修复服务[7]。问题管理的目标是减少影响信息系统正常运行的事件的出现次数,避免引起同类事件的根源问题重复出现,转变被动的运维管理模式。
问题管理模块主要包括以下内容。
⑴ 问题登记。服务管理平台会将事件管理中无法在其解决范围内解决的问题,转入问题管理流程,并将事件的基本信息提交到问题管理流程。
⑵ 问题的分类。问题管理实施者按照事件的优先级及事件的类别、影响等级、发生的频率进行分类。
⑶ 问题的调研与诊断。问题处理人员在收到问题申请单后,按照专业类别,由指定专业人员对事件问题进行分析。
⑷ 评估影响与风险范围。确定导致问题的根本原因,综合考虑成本与风险。
⑸ 解决方案归档。处理方案并更新知识库。问题处理人员根据分析与诊断,制定处理方案,并提交变更申请,转入变更管理流程。
⑹ 分发处理结果与报告。当变更管理实施后,问题管理者会对变更后的情况进行评估,确定事件的影响范围,如果影响范围小,则采取分发处理结果与报告结束问题;如果事件影响范围较大,则问题管理者还需通知相关的问题实施者重新评估问题的影响范围,重新制定合适的解决方案。
2.4 配置管理模块
配置管理模块是管理所有IT配置项,建立配置项之间的关系,核实IT基础设施记录的准确性并对存在的错误进行及时纠正,确保其他服务流程调用配置项信息的完整性与准确性[8]。其设计的重点是:为信息系统运行提供准确、可信的配置项信息,减少IT服务中断的几率,降低无约束变更带来的风险。
配置管理模块的主要内容如下。
⑴ 服务规划。由配置管理者组建配置管理小组,根据运维制度和规范、标准,制定配置管理计划,分析现有的配置需求,确定配置目标、配置范围及所需要的资源。
⑵ 配置识别。由配置管理实施者根据配置项的信息选择配置范围、属性,制定命名规则、关系、类别以及配置基准线,并对配置项信息进行初始化。
⑶ 配置项控制。配置管理实施者对需要进行变更的配置项进行审核与维护,确保当前配置项信息的准确性,并定期将配置管理数据的信息与现实的物理组件比对。
⑷ 配置状态报告。配置管理实施者对每个生命周期的配置项记录进行维护,并定期以报告的形式对受控的配置项状态及变更信息进行记录。
⑸ 配置审计验证。配置管理者定期对配置管理数据库的配置项进行审计验证,确保已授权的且与现实情况吻合的信息录入到配置管理数据库。
⑹ 产生配置报告。配置管理者负责提交配置管理数据库有关的分析报告、影响等级分析报告以及IT基础设施的状态报告。
2.5 变更管理模块
变更管理流程是为了主动改善服务,提高业务运行效率与用户满意度,提高变更的质量,减少对业务的影响,降低成本。
变更管理模块的主要流程内容如下。
⑴ 变更登记。每一个变更都以RFC(变更请求文档)加以记录,每个文档都有惟一的标识码便于后续跟踪,由配置管理者负责更新入库管理。
⑵ 分析变更请求。变更请求一般是指重大的变更,对小的变更请求不予受理,比如更换IP地址就没必要发起变更请求。
⑶ 变更情况分类。变更管理者根据变更请求文档所描述的变更情况,判断优先级、变更所需要的资源对其分类。
⑷ 变更方案设计。主要指变更计划的制定、变更进度表的制定。
⑸ 变更测试。每一个变更方案都必须在实施前,通过模拟环境进行变更测试,否则不予实施。
⑹ 变更实施。被审批通过的变更方案,由变更实施者根据发布流程并按要求统一实施。
⑺ 变更效果回顾。主要是了解变更的目标是否实现,用户对变更的结果是否认同,有没有产生隐性的风险,相关的资源与成本是否得到合理的利用,是否超出预算范围等,如果还有问题,必须制定相应的回退计划,及时恢复到变更前的状态。
⑻ 解决方案入库与报告。对变更实施成功的效果、实施经验与相关信息需要提炼,总结为相关的文档报告,并将变更方案与配置信息入库。
3 基于ITIL的军队云数据中心运维管理实施策略
“三分技术,七分管理”。为保证运维管理实施的高质量和效益发挥,在军队云数据中心实施基于ITIL的运维管理,需要遵循以下策略。
顶层设计,全员参与。信息化建设的顺利推进和成功实施必须采用自顶向下,集中统筹的模式,在军队云数据中心的运维管理实施上注重顶层设计,强调全员参与,制定全面、有效的管理规章制度并强调终端落实,培养全员的信息化意识和规范化运维的观念,提高军队信息化建设的质量,发挥军队信息化建设的效益。
优选工具,先易后难。“工欲善其事,必先利其器”,要想在军队云数据中心的运维管理中取得良好效果,应引入或自主研发适合的管理工具,对中心运行所涉及的基础设施、具体应用和网络安全等实现“纵向到底、横向到边”的全覆盖管理。并在具体实施过程中先针对较容易实施的流程重点突破,吸取成功经验和失败教训,实现以点带面,滚动发展。
锻炼队伍,培养人才。人才是兴军之本,无论军队如何改革、战争形态如何改变,培养素质过硬的军人,才是我军在未来战场上取得胜利的有力保障。加强信息化人才队伍建设,是军队信息化建设科学发展的根本依托,也是我军信息化建设的一项基础性战略任务。因此,在军队运维管理人才的培养上,首先要确立人才是第一资源的理念,完善人才培养的目标体系、培养体系、内容体系,用好军队院校、科研院所等军队渠道,借助地方高校、大型信息企业等社会渠道,建立健全人才选拔任用、考核评价、奖励激励机制,培养出高素质的运维管理人才。
军民融合,协调发展。充分利用国家在信息服务领域长期积累的经验和成果,将军队云数据中心的运维管理研究纳入到国家信息化整体战略和发展体系中去,有效利用民用资源和技术,吸纳和借鉴地方成熟的经验、教训,减少浪费,少走弯路。实现技术军民通用,设施军民共用,资源军民互补。
4 结束语
为适应当前军队新军事变革的现实需求,军内多家单位已经建成或正在筹建基于大数据和云计算等技术的军队数据中心,而要充分发挥其军事和经济效益,是与科学和有效的运维管理密不可分的。本文借鉴ITIL在IT服务管理领域的成功实践,设计和实施军队云数据中心运维管理的框架和流程,以有效提升基于信息化的新军事能力,实现建设信息化军队,打赢信息化战争的强军目标。今后还需进一步细化和完善流程设计,并考虑采用量化的方法对实施效果进行评估。
参考文献(References):
[1] Jan van Bon著,章斌译.IT服务管理—基于ITIL的全球最佳
实践[M].清华大学出版社,2006.
[2] 陶雷,莫赞.基于ITIL的高校经济管理实验中心管理模式研
究[J].实验技术与管理,2009.9.
[3] 傅晓华.基于ITIL的上海农商银行IT服务管理研究[D].华东
理工大学,2010.
[4] 刘建权.加油站运维管理系统的设计和实现[J].全国商情,
2013.12.
[5] 佘振国.基于ITIL事件管理的5T系统维护流程[C].第五届中
国智能交通年会暨第六届国际节能与新能源汽车创新发展论坛优秀论文集(上册)—智能交通[C],2009.
[6] 王芳,江琳,王洪业.基于ITIL的客票系统运维体系之事件及
问题管理研究[C].第七届中国智能交通年会优秀论文集——智能交通技术,2012.
[7] StewartH.C.Wan.IT Service Management for Campus
Environment-Practical Concerns in Implementation. HongKong Science and Technology Parks Corporation,2007:709-712
[8] 韦杰.基于构件的软件配置管理中版本管理关键技术研究[D].
大连海事大学,2006.
Key words: ITIL; ITSM; IT service quality; data center