陈春华,梁奂,李军
(1.中国电信股份有限公司广州研究院,广东 广州 510630;2.中国电信股份有限集团公司,北京 100033)
IT服务管理(ITSM,IT Service Management)的核心思想是IT组织不管它是企业内部的还是外部的,都是IT服务提供者,其主要工作就是提供低成本、高质量的IT服务。IT组织提供了哪些服务、服务的名称、服务状态则会通过服务目录来呈现。服务目录可以成为IT组织与客户沟通的基础和桥梁,是IT组织建立服务文化、合理组织内部资源的重要工具,这样的服务目录有利于建立IT与业务的紧密关系,最后实现以客户为中心,提供高质量的IT服务的目标。但是如何梳理建立IT服务目录,并保障IT组织所提供的服务满足客户期望是实施ITSM的一项比较艰巨的任务。
服务目录就是企业的IT组织提供的IT服务视图,记录了IT部门提供了哪些正在运营的服务或将要提供哪些服务,服务的质量标准、服务时效、服务状态等服务信息。服务目录分为业务服务目录和技术服务目录。业务服务目录是用业务的语言描述了IT组织向客户提供了哪些服务以及计划提供哪些服务,其体现了业务的需求,是从客户视角理解的服务目录,这是服务目录的客户视图。技术服务目录是业务服务的能力分解,技术服务的实现由进程、接口、服务器、数据库和中间件等支撑项来支持。这是从技术服务的视角理解服务目录,而且它并不是客户视图的一部分。这2个服务目录之间的模型如图1所示。
某电信运营企业信息化部作为企业内部IT服务的提供者,经过多年的IT服务实践,以业务需求为驱动,建立M BOSS(Management&Business Operation Supporting System)体系,支撑全业务发展和客户服务需求。但由于历史的原因,对MBOSS到底提供哪些业务服务,这些业务服务由哪些技术服务组成还没有形成完整的、体系化的视图。
为进一步通过技术服务目录全面反映其自身的情况,并通过业务服务目录将其自身呈现为一个IT服务提供者,企业信息化部制定了IT部的服务目录梳理方法,并梳理了主要的业务服务目录和技术服务目录。
图1 业务服务与技术服务的模型
通过以下4个步骤,梳理IT部的服务目录:
(1)梳理企业业务流程:参照电信运营企业的业务流程框架(e TOM,enhanced Telecom Operations Map),从运营支撑与就绪、服务开通、服务保障、服务计费等业务流程域进行梳理。如服务开通域的关键流程环节包括营销、销售、订单管理、服务配置、资源配置及分配、服务激活等。
(2)梳理面向客户的IT业务服务目录:基于MBOSS体系中的业务规范、系统规范对支撑业务流程的业务服务进行分类,如支撑订单管理的根据业务规范可分为面向客户的新入网服务、变更服务、充值缴费等服务,新入网业务服务又可根据受理的业务类型不同细分为下一层级的业务服务,新入网服务可细分为CDMA移动业务新装服务、固网宽带新装服务等,而业务变更服务又可分补换卡服务、过户服务等。业务服务分级图如图2所示。
(3)梳理面向内部运维的IT技术服务:依据MBOSS业务及功能规范中的依赖关系以及系统实现时间情况梳理业务服务对应的IT技术服务。如通过梳理发现CDMA新装业务服务可以分解为用户档案查询、资费套餐查询、订单生成及处理、订单送服务开通、服务开通处理、服务开通送自动激活、服务开通报竣(即订单施工完成)、订单归档和资料同步计费等技术服务。而订单生成及处理的技术服务可以根据系统实现的情况进一步梳理出所对应的服务支撑项,包括进程、接口、服务器、数据库和中间件等组件。业务服务与技术服务、服务支撑项的关系示意图如图3所示。
(4)制定业务服务的质量评估指标:根据业务规范,与业务部门讨论制定每个业务服务的质量指标,形成业务服务目录。根据以上步骤和方法,梳理形成IT部提供给面向外部客户的部分业务服务目录样例,具体如表1所示。
前面梳理出了业务服务目录,约定了服务标准,但如何来保障所提供的服务能满足客户要求,这就需要有基于服务视角的有效监控方法。即要改变原来的服务器、应用进程相对分离的监控方法,基于前面梳理清楚的业务服务——技术服务——服务支撑项的关系,根据业务服务的质量指标,制定出技术服务的业务指标并加以监控,再根据服务支撑项的特征制定合适的监控项,这样通过这2个层面的指标监控实现集约服务视角的监控,可及时发现服务提供过程中的问题或者潜在风险,进而采取有效措施,从而保障所提供服务的质量。
图2 业务服务分级图
图3 业务服务与技术服务、服务支撑项的关系
表1 业务服务目录样例
具体方法说明如下:
(1)定义技术服务的监控项和指标。根据CDMA新装服务所对应技术服务(如图3所示,具体包括用户档案查询、资费套餐查询、订单生成及处理、订单送服务开通、服务开通处理、服务开通送自动激活、服务开通-CRM报竣)的特点来定义相应的监控项以及对应的业务指标。如用户档案和资费查询监控指标项为页面的响应时长(指标为不超过3秒);订单生成及处理技术服务的监控项定义为订单受理量及订单受理失败量、服务开通处理服务可监控待处理单量、平均处理时长、环节总订单量等,其具体指标的阀值可根据实际运营经验进行逐步优化调整,最后达到一个合理的阀值。其它技术服务可以进行类似处理。这样通过对每个技术服务的指标进行监控,就可以及时发现异常情况。
(2)梳理并定义服务支撑项的监控项和指标。根据系统实际情况把每一个技术服务对应的接口、服务器、数据库、中间件及进程等服务支撑项梳理出来,并根据支撑项的特征定义相应的监控项技术指标。如订单生成及处理的技术服务的支持项可以分为进程、服务器、数据库、中间件和接口等5类,针对服务器的监控项指标可定义为CPU利用率、内存利用率、IO利用率和磁盘利用率,接口的监控项指标可定义为调用接口总次数和调用接口的成功率等。
表2 CDMA新装业务服务的监控方法
(3)系统固化监控方法实现对服务的监控。先梳理技术服务对应的服务支撑项在系统中部署的具体接口名、进程名、服务器的IP地址、数据库和中间件名,具体如表2所示。然后再按照下面几种方法,部署到系统中。这样就通过支撑业务服务的每个技术服务的监控,可以发现某个技术服务的正常与否,同时又通过各服务支撑项的监控,可以发现技术支持项服务是否正常,通过服务支撑项与技术服务项的联合监控就可监控到业务服务的正常与否。即使发生告警或异常,由于服务间的关联关系清晰,可快速定位出异常服务或支撑项,这样就可以采取有针对性的处理措施了。
其中监控项常用的监控方法说明如下:
(1)页面的可用性和响应时长:可通过拨测来监测当前IT技术服务的可用性与响应性能。
(2)订单量或者失败量获取:可通过jdbc协议主动采集当前IT技术服务处理数据情况获得吞吐瓶颈与异常数据等指标或者通过业务系统主动部署信息点自动送出信息。
(3)关键进程监控方法
◆采用PS进程方法查看状态与性能;
◆通过进程日志是否增长与关键字监控判断进程的状态。
(4)接口监控方法
◆通过探测接口监测其可用性与响应时长;
◆通过接口业务系统主动生成信息点来进行判断。
(5)服务器监控方法:通过部署代理或远程协议(telnet/ssh)采集服务器可用性及性能指标。
(6)数据库监控方法:通过jdbc协议主动采集数据库可用性及性能指标。
(7)中间件监控方法:可通过SNMP/JMX协议采集中间件可用性与性能。
服务目录的梳理是企业实施IT服务管理的一项重要内容,需要组织业务部和IT部人员来共同梳理服务目录并约定服务质量。如何保证服务质量就要组织系统的运维人员进行业务服务——技术服务——系统的支撑项的关系梳理,只有准确理顺了这三者的关系,才有了服务监控的基础,再通过系统实施,就能较好地实施基于服务的监控,这样就能及时发现服务提供中的潜在风险,并采取有效措施,从而保障服务的质量满足客户期望,提升客户满意度,提升IT服务的价值。
[1]陈春华,梁奂,李军.云资源池环境下的IT服务管理系统优化及实施策略[J].移动通信, 2013(16).
[2]陈春华,李军,梁奂,等.资源池环境下的IT服务管理实施策略[J].电信科学, 2012(9).
[3]陈春华,梁奂.全业务电信运营商的IT服务管理实践探讨[J].电信科学, 2011(3).
[4]中国电信股份有限公司.中国电信CTG-MBOSS V2.0规范——IT服务管理规范V2.0[Z].2010.
[5]Peter Brooks.IT服务管理指标[M].丰祖军,译.北京: 清华大学出版社, 2008.