张 霞ZHANG Xia(中航飞机西安飞机分公司 信息技术处,西安 710089 )
基于ITSM的企业IT运维管理信息系统初步设计
张 霞
ZHANG Xia
(中航飞机西安飞机分公司 信息技术处,西安 710089 )
随着企业各类信息系统的建设完成和大量投入应用,系统的安全性、稳定性以及运行维护的可靠性越来越被人们关注。文章基于对ITSM及相关标准的研究,通过对现行IT运维工作的实际情况进行研究,初步设计了适用于企业当前信息化信息系统运行维护特点的IT运维管理信息系统。
IT运维;ITSM
近些年,中国企业的信息化建设工作经历了以IT建设为重心的快速大发展时期。如今这部分企业中,大多数IT建设工作已经完成,多数信息系统渐渐趋于平稳。如何在IT建设过程中更多的考虑IT运维工作,已逐渐成为企业信息化部门亟需思考和面对的工作。企业通过学习IT服务的国际标准及成熟的信息技术治理理论,借鉴国内、外企业中IT运行维护的最佳实践和先进管理经验,综合自身IT运行维护现状,构建合理、高效的IT运维模式。
现代企业内部拥有的信息化系统规模越来越大、功能越来越多、基础设施的升级更新也很快速,这些特点决定了企业信息化运维所面临的困境会越来越明显。
1)企业信息化进程的不断加速,促使企业内部的硬件、软件、网络以及各类业务应用系统不断升级更新及扩充。随着企业硬件设备的增多、业务系统的大量上线,导致运维过程中暴露出的问题越来越突出。由于硬件设备种类不同、品牌不同,系统结构、平台、数据、网络及应用的异构性,导致发生故障时定位问题会有所困难。运维人员长期处于“救火状态”,与此同时,业务部门却不甚满意。
2)IT运维管理并没有专人负责,IT人员在解决完各自的问题之后,往往就要投入其他工作中,导致问题背后隐藏的深层次原因不能被及时发现和处理。如果发生与运维相关问题时,业务人员正在处理其他更重要的业务,还可能会导致运维工作不能及时被相应,影响运维的效率。这样的结果,会导致运维处理问题周期短、质量低、效率不高、用户意见大等问题。
依据以上情况可知,IT部门目前的运维管理信息系统存在下述问题:
(1)运行监控的广度和深度不够
现有运维系统侧重于对硬件资源进行监控管理,对软件资源的管理较弱。由于对企业的软件资源监控支持能力不足,导致对用户的运维需求无法提供及时有效的支持。
(2)内容展现不够全面
现有运维系统运行展现内容不够全面,缺少预警信息统计和展现,缺少对设备性能信息的直观展现界面,无法满足及时监控的管理要求。
(3)缺少基于ITIL规范的服务流程
现有运维管理信息系统的设计,与ITIL(信息技术基础架构库)的运维管理理念存在很大差距。缺少事件管理、问题管理、变更管理、配置管理、发布管理等关键流程管理功能,无法满足现阶段服务管理流程要求,同时缺少运维管理制度建设和执行考核方面的功能。
由以上论述可知,企业IT部门的运行维护管理工作将迎接下述三类挑战:
(1)如何保证企业现有IT资源(软、硬件)在业务活动中长期稳定运行。企业内部需要7*24小时不间断保障的生产系统日益增多,大量业务访问量对系统性能的要求也不断增加;
(2)各类业务信息系统的复杂性越来越高,如何确保IT系统的运行效率满足业务要求是运行维护的关键问题。需要运行维护的业务信息系统数量激增,业务信息系统的架构日无复杂,业务信息系统的数据量持续增多;
(3)企业安全保密任务越来越艰巨,如何确保业务信息数据的安全系数与企业安全等级要求相匹配,也是我们面临解决的问题。信息安全体系的建设以及应急处理机制,数据中心的预警、检测、应急处理及自我恢复能力日趋重要。
IT运维服务,作为IT服务中最主要也是最基本的服务,是由企业内部IT部门,根据企业自身的管理制度和业务流程,借助信息化手段和技术,对企业现有IT硬件资源、软件资源、业务系统进行整体维护以及对运维人员管理的过程。大量数据统计显示,在IT项目的整个生命周期,IT的运行维护管工作几乎占用了百分之80的时间。权威咨询公司Gartner Group的统计结果显示,由产品自身和应用技术引发的问题只占了所有问题的20%,与流程有关的失误造成的问题占了总数40%,而与人员有关的失误造成40%的问题。这就说明,IT运行维护中出现的大部分问题并非是由技术能力欠缺造成,绝大部分问题的源头来自管理。大部分问题源自流程和人员的失误,流程失误包括管理程序的变更、程序调试过程中的疏漏,人员失误包括因人员主观上的知识错误、能力缺陷和主动或被动误操作所导致的问题。为此,世界上很多企业和部门都对此进行探索,通过大量的实践和对统计数据的分析,以实践经验和成果为基础,总结出一种新的IT运维管理方法论,就是ITSM(IT Service Management,IT服务管理)。
IT服务管理,顾名思义,是面向IT服务的管理,其管理核心是管理用户对IT的需求。ITSMF(国际IT服务管理论坛)任务,ITSM是一种以流程为导向、以客户为中心的方法,它通过整合IT服务与组织业务,提高组织IT服务提供和服务支持的能力和水平[1]。因此,ITSM又被描述成IT管理的“ERP解决方案”。
总体而言,ITSM是服务于IT的管理方法集合,是系统化的、有序的、完整的协同流程集合,其工作重心是保证IT的服务质量,其管理对象是用户的IT需求,其目的是保证IT服务质量,其依据是控制服务级别协议(SLA),其管理内容涵盖了问题管理、变更管理、配置管理等主要流程管理。
目前,企业IT整体运行维护工作划分为两类:IT技术人员主动发起的运行维护和IT技术人员被动受理的运行维护。主动运行维护多属于例行检查,是IT人员每天都要完成的工作,重复性较多;被动运行维护来自于用户的各种需求,运维人员需要针对用户的需求去作出快速响应,确保服务及时有效。企业信息中心技术人员按照现有的运行维护流程,借助运维管信息系统,对日常的IT业务进行维护管理其维护范围主要涵盖机房环境监控、基础设施监控、业务应用系统运维等。
图1 IT服务管理示意图
传统的IT运行维护模式一般具有以技术为导向、IT人员多充当“救火队”角色、被动、不可重复&混乱、流程不标准、偏向从IT部门内部考虑等特点。ITSM则具有流程为导向、预防为主、主动、可重复&职责明确、正式流程、从业务角度考虑等特点。
实现IT运行维护管理的流程化、规范化,对IT部门而言意义重大。运行维护人员可以及时梳理、分析、归纳和总结发生的问题,使工作安排更加合理,避免相关人员因陷入杂乱琐碎的问题处理过程而无法脱身,能够极大提高工作效率。
流程是IT服务管理的基础,IT服务管理的流程建设需要与企业业务相结合,同时遵循PDCA循环过程,不断对现有流程进行改进和完善。企业的业务流程取决于企业的战略规划目标,IT服务来源于企业的业务流程,而IT服务能力最终又将对企业的战略规划产生影响。这一过程遵循PDCA(戴明环)模型,是一个不断循环、互动的正反馈。
图2 企业IT服务管理流程示意图
企业目前正在大力实施AOS体系建设,AOS是质量、成本、效率三要素并重。AOS业务流程梳理及优化,能够使各类业务流程显性化,促进各类要素的提升。利用AOS梳理过的标准化、规范化的业务流程,利用信息化平台完成对标准化、最优化的业务流程的固化,更快、更好的形成符合自身特点,具有自身特色特点,反应敏捷、高效可靠的IT运行维护管理模式,实现以ITSM为基础的企业IT运行维护流程化和自动化。
通过对目前IT管理的各个方面如服务器管理、网络管理、系统软件管理、应用系统管理、数据库管理等多方面进行调研,生成了符合IT部门运行维护需求的流程,并将这些流程整合为特定的IT服务。
面向服务的IT运行维护管理可初步设计如图3所示。
基于ITSM的IT运行维护管理信息系统,可以将IT运行维护服务管理分为六大功能模块,初步可设计为资产管理、监控管理、应用管理、安全管理、流程管理和运维综合分析六大功能模块。
基于ITSM的企业IT运维管理信息系统功能模块的划分及构成如图4所示。
其中,各个业务模块的具体功能描述如下:
1)资产管理模块:资产管理模块可以实现对IT系统各类软、硬件资产的使用、成本等信息的维护和统计;
2)监控管理模块:监控管理模块可以实现对IT基础设施的监控管理。IT基础设施管理包括存储、备份系统管理、主机系统如服务器、小型机等管理、安全系统如安全设备及安全软件管理、网络系统如交换机、路由器等管理、桌面系统如PC终端等管理,以及机房动力及环境如空调、电力等管理;
3)应用管理模块:应用管理模块包括对各类核心业务应用系统的监控,实现对应用系统进行日常应用问题处理、应用集成以及应用改进等功能;
图3 IT运行维护管理框架图
4)安全管理模块:安全管理模块包括对企业内部大量PC终端的安全维护,以及对主机、网络设备、安全设备等资源的安全监控;
图4 IT运维管理信息系统功能模块图
5)流程管理模块:流程管理模块涉及服务台、事件管理、问题管理、变更管理、配置管理、服务级别管理、知识管理等业务;
6)运维综合分析模块:运维综合分析模块可以在各个管理功能的基础上,实现企业IT环境整体运行情况的分析,帮助管理人员了解运维现状,制定或修订运维计划。
结合上述IT运行维护流程及对应的IT运行维护管理系统,企业可以提供给用户更快更好的运行维护服务,为用户提供便利的工作条件,提升用户满意度。
企业通过建立合理的IT运维流程和管理系统,在确保系统的安全性、稳定性、运维的可靠性的同时,能够为用户提供更好的服务,及时解决信息化系统使用过程中出现的各种问题和故障,做到想用户所想,急用户所急,就能更好实现IT运行维护服务管理的目标和主要任务。
[1] 李冰,李心科.基于ISO20000的农村金融IT服务管理的应用与研究[J].电子技术,2011,8.
Preliminary design of enterprise IT operation and
maintenance management information system based on ITsM
TP29
A
1009-0134(2016)08-0120-04
2016-06-22
张霞(1980 -),女,河南人,高级工程师,硕士,研究方向为航空制造企业信息化。