王月 李明
[摘 要] 本文首先提出IT运维管理的发展趋势,并对国内企业IT运维管理现状进行分析。在现状分析的基础上,结合IT运维管理领域的发展趋势,提出国内企业IT运维管理存在的问题。在充分借鉴IT运维管理最佳实践以及结合国内企业IT运维现状特点的基础上,提出一套适合国内企业运维特点、满足企业未来IT发展需求的IT运维管理模式,以及提升IT运维管理水平的建议。
[关键词] ITIL;IT运维管理;国内企业
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 06. 014
[中图分类号] F270.7;TP307 [文献标识码] A [文章编号] 1673 - 0194(2014)06- 0019- 03
近几年,国内企业均将建成世界(国际)一流的大型公司作为其发展目标,这就需要与之匹配的信息系统平台作支撑。自2000年以来,国内大型企业的信息化工作进入到一个快速的发展时期。按照整体规划,国内大型企业已经实现了集中建设的目标,今后将继续推进系统深化应用,并实现集中化运维管理,这给传统模式的运维工作带来了巨大的挑战。因此,亟需构建一套先进规范、运行高效的运维管理体系来满足提升管控能力的要求。
1 IT运维管理发展趋势
1.1 向集中化管理转变
集中化管理是当前IT运维管理的发展趋势,对主机设备、网络设备、存储设备、备份设备、数据库、中间件、应用软件、桌面系统等进行“集中监控、集中维护、集中管理”成为企业IT运维管理的必然选择。
1.2 注重与业务的融合
IT运维管理体系越来越注重与业务的融合,正逐步向业务靠拢,IT部门正在由从一个纯技术中心逐步转向服务导向的中心,目标更是直指业务中心。同时,以业务为中心,驱动IT系统的建设和运营管理,在提高IT效率的同时推动业务价值的形成。
1.3 以ITIL为最佳实践,指导运维工作
目前,ITIL作为当今IT运行服务管理的主要方法论已经被欧洲、美洲、澳洲、亚洲的很多企业采用,全球已经有1万多家知名的公司在参考里面的方法管理自己的IT系统。ITIL已被认为是世界IT服务管理领域的标准,同时也使得ITIL在IT服务管理中应用越来越广泛。
1.4 向自动化管理发展
目前,越来越多的企业开始运用专业化、标准化和流程化的手段,来实现运维工作的自动化管理。通过自动化监控系统能及时发现故障隐患,将IT运维服务由“被动”变为“主动”,防患于未然。例如,全天候自动检测与及时报警能够实现IT运维的“全天候无人值守”,大大降低IT运维人员的工作负担。与此同时,通过自动化诊断能够最大限度地减少维修时间,提高服务质量。因此,对于越来越复杂的IT运维来说,自动化管理是提升IT运维管理的过程,也是未来一个重要的发展趋势。
2 国内企业IT运维管理现状
2.1 IT运维管理现状
随着信息化的逐渐深入,企业的应用系统日益复杂,特别是数据集中之后,业务对IT持续运行的需求日益强烈,同时保证系统7×24正常运行也变得尤为重要。IT服务管理理念引进中国后,国内信息化的建设在参照了国际的流行趋势后,结合国内企业的现状进行运维管理体系的建设,在一些企业取得了重大成就,并且国内企业充分结合ITIL最佳实践和企业的IT运维管理的现状,从整体上提升了IT系统的运维管理水平。
通过调研中石化、中海油、国家电网、中烟信息4家企业的IT运维管理现状,从运维体系、流程、工具、团队4个方面进行对比分析(见表1)。从表1案例来看,IT运维管理都借鉴ITIL国际标准建立了相关流程,并遵照实施,其共同之处体现在以下4个方面:
从运维体系来看,中石化、中海油、国家电网、中烟信息均采用三级运维体系架构。
从运维流程来看,服务交付域和服务控制域中涉及的事件、问题、变更、发布、配置5个流程已得到全面应用,这5个流程是快速响应和解决用户提报问题的关键流程,直接决定运维服务水平高低。通常与流程相关的关键绩效指标会在与客户签订的服务级别协议(SLA)中体现出来,之后这些指标会在内部团队和外部供应商之间进行分解,以保证服务的可靠性和可用性。
从运维工具来看,多采用与ITIL流程吻合度高、先进、应用广泛的运维管理平台,如SM7和Remedy。这些平台的应用,使运维人员和运维流程得到固化;同时,也使知识库的作用得到最大限度的发挥,运维服务能力得到不断提升。
从运维团队来看,出于信息安全的考虑,大多为内部支持队伍,且少有将全部运维工作外包出去。这些内部支持队伍均取得ISO 20000认证,或者运维相关资质如CCOE认证。
2.2 IT运维管理存在的问题
在现状分析的基础上,结合IT运维管理领域的发展趋势,可以看出国内企业在以下几个方面需要改进。
2.2.1 向集中化管理转变各企业的运维水平参差不齐,缺乏工具支持
目前各企业的运维管理水平也存在较大差距,有些企业已经初步建立了运维管理流程和工具,但在实际执行效果上并不尽如人意;更多企业的运维管理工作还处在不尽规范的状态,缺少相关的管理流程和工具,更多的是依靠運维人员的个人能力维系业务系统的运维管理。另外,有些企业的信息系统运维工作缺乏有效工具的支持,运维流程效率的体现很大程度上依赖于适当工具的使用,包括监控系统去获取客观的数据,IT服务管理平台掌握对运维流程关键点的控制等。
2.2.2 系统建设与运维并举,运维管理环境和运维团队尚不稳定
目前从总体来看,国内企业的信息化还处在建设和运维并行的阶段,而且这种特点还将持续较长一段时间。这种并行特点给统一和整合的IT运维管理体系的建设带来了环境和团队方面的挑战。
2.2.3 量化考核和评价机制需进一步完善
目前,国内企业的IT部门量化考核和评价机制还不完善,缺乏服务质量评价指标体系。而为配合运维管理工作规范化的开展,应提前制定必要的管理制度、绩效衡量和质量评价体系等,这些内容是实现运维管理工作目标的必要手段。
3 国内企业实施IT运维管理的对策建议
未来,运维管理模式的建设方向是一体化集中管控模式。为此,国内企业在设计运维管理模式时,必须考虑组织特点和未来的发展方向,尤其要考虑,随着基础设施、应用的大集中模式的实现,未来国内企业会搭建以IaaS、PaaS为主,逐步尝试SaaS的私有云,集中化的运维管理模式必须能够支撑未来企业云环境的管理。
3.1 IT运维管理模式建议
借鉴IT运维管理发展趋势,结合国内企业的现状特点,建议IT运维管理以统一的技术工具平台为支撑,遵照统一规范的运维流程执行,明确出人员角色,涵盖三级运维体系。IT运维管理体系的建设涵盖组织模式、管理制度、管理流程、绩效考核、知识管理、技术支撑等内容。
3.1.1 组织模式
为了实现一体化集中管控的运维管理,建议将运维管理机构、运维服务机构到后台支持团队3个层次进行统一,按照业务设立统一的运维团队,为用户提供统一的IT运维服务。
3.1.2 制度规范
管理制度体系分为“信息化运维管理办法”、“各服务管理流程序文件”、各信息系统项目根据具体情况再制定实施细则和操作指南以及表单4个层次(如图1所示)。
3.1.3 管理流程
建立统一的服务管理流程,包括分别面向用户的服务支持流程,如事件、问题等流程。以及面向客户服务交付流程,如容量管理、可用性管理等流程。
3.1.4 绩效考核
绩效考核从IT运维管理体系的目标出发,按照组织、流程和岗位角色分解,形成“IT运维组织KPI关键绩效指标—流程KPI—角色岗位KPI”3层相互关联的绩效考核指标体系。
3.1.5 知识管理
整合知识资源,建立一套“统一、集中”的运维知识管理平台,以便为总部及所属企事业单位IT运维工作提供支持。
3.1.6 技术支撑
建立集中统一的运维管理平台,包括服务流程平台、监控平台、知识管理平台等。
3.2 提升IT运维管理水平的建议
3.2.1 各企业参照统一标准搭建运维管理体系
各企业运维管理体系采用急用先上的原则,将目前存在的问题最突出的内容、日常运维中最不可或缺的内容建设完成,按照系统搭建运维服务台,建立统一的用户服务体系及内部管理体系,具备必要的运维管理能力,改变目前无流程、无工具或流程执行不到位的现状,初步搭建规范统一的运维管理体系。
3.2.2 配套运维管理工具,提升体系的执行效率和效果
通过运维工具可以实现对IT服务过程工作流程的精确管理,将人员和流程固化,实现运维人员、流程、技术的有机整合,實现常规及突发状态的应急管理,实现运行故障的提前预警。同时,从管理、制度和技术等角度出发,将系统运维工作相关信息、资源进行整理、分类,建立统一的、不断丰富、完善的运维知识库,为运维人员学习培训、信息共享提供方便,从而提升管理体系的执行效率和效果。
3.2.3 建立持续优化机制,确保体系高效运转
运维管理体系建设是一个持续发展、不断改进的过程。体系实施后,在规范日常工作的同时,注重加大自检力度,成立检查小组,定期检查数据、记录及职能角色等执行的合规性,产出表单的完整性,认真出具自检报告。对体系执行过程中存在的问题提出改进措施,并跟踪监督落实。同时,随着人员素质和知识水平的提升以及运维管理模式的转变,运维管理体系也需持续改善,改进和优化运维管理流程,以适应业务部门和管理不断升级的需求。因此,要建立持续优化管理体系机制,加强管理投入,定期度量和持续优化管理体系,确保体系高效运转下去。
主要参考文献
[1]庞玉东,樊少明.基于ITIL的中国石油IT运维管理体系研究[J].信息技术与标准化,2012(8),50-53.
[2]李长征.国家部委IT运维管理体系案例[J].电子政务,2008(12):26-33.