基于ITIL的视听新媒体运维指标体系研究

2015-05-05 01:59王晓霞
电视技术 2015年1期
关键词:运维指标体系指标

何 晶,王晓霞,郭 嘉

(1.广播科学研究院互联网视听技术研究所,北京 100866;2.云南省广播电视局科技处,云南 昆明 650031)

基于ITIL的视听新媒体运维指标体系研究

何 晶1,王晓霞1,郭 嘉2

(1.广播科学研究院互联网视听技术研究所,北京 100866;2.云南省广播电视局科技处,云南 昆明 650031)

视听新媒体运行维护指标体系作为视听新媒体系统的重要组成和支撑部分,对于提高视听新媒体运行维护管理水平具有重要意义,在当前条件下应不断完善。参考ITIL的成熟实践经验,结合视听新媒体的技术特性,系统论述了构建该体系的背景、思路、主要内容和注意事项,希望能给相关运维团队提供支持。

视听新媒体;运行维护;ITIL;指标体系

近年来,运维管理是视听新媒体服务平台重要的生产和管理活动之一。建立和健全视听新媒体系统运维管理体系直接影响到服务水平高低和用户体验的满意程度,直接关系到视听新媒体全面协调可持续发展。

咨询机构艾瑞指出,在2014第一季度,中国在线视频市场规模达36.8亿,同比增长59.2%[1]。2014年2月,网络在线视频覆盖人数达到4.1亿,较1月环比增长0.6%,较去年同期增长7.2%,处于稳定发展态势。正是视听新媒体业务的快速增长,技术系统需不断扩大规模,提升服务能力,运维系统也随之升级。如何更有效地利用现有资源,提高运维团队的工作效率,规范服务流程是目前各大视听新媒体机构面临的普遍问题。

从笔者走访调研的多家视听新媒体服务机构来看,运维团队都希望从应急、无序和被动的“救火队员”模式向计划、有序和主动的“管理员”模式转变,进一步提高视听新媒体系统的稳定性和可靠性。

信息系统运行维护其本质是单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档等,对IT运行环境(如硬软件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理[2]。指标指的是衡量目标的单位或方法,而指标体系指的是若干个相互联系的指标所组成的有机体。因此视听新媒体运行维护指标体系是以视听新媒体技术系统为研究对象,选取多个相互联系的指标并组成一个有机的整体,反映、衡量技术系统中的相关方面的管理能力或水平。

视听新媒体具有服务个性化、便利性、业务快速迭代、持续更新的特点,发布技术体制与传统媒体完全不同,技术系统的边界需要重新界定,因此需要建立并逐步完善视听新媒体的运行维护指标体系,对各种运行维护工作中的复杂管理对象进行抽象和归类,形成一套完整的运行维护指标体系。

1 运维指标体系目的

与传统媒体相比,视听新媒体具有能够为受众提供交互式、个性化、便利化的视听服务的特点。此外,快速迭代、持续演进等互联网产品化理念使得视听新媒体业务快速发展。因此视听新媒体运行维护也应在价值、能力、维护和监控等多个方面与传统媒体不同。

创建视听新媒体运行维护指标体系主要有以下3个目的:

1)始终强调以视听新媒体业务为中心的运维管理,突出新媒体变化快的特点,同时也能帮助新兴视听新媒体服务提供商能快速构建高水平的运维服务体系;

2)确保实现高水平的服务能力和质量,提高业务需求的契合度和运维团队的服务意识,从而确保运维的价值符合视听业务需求;

3)运维服务可计量,大量采用量化的方法分析流程中影响服务能力和质量的因素,并为系统的改进提供有力的数据支撑。

进一步,从价值、能力、维护和监控4个方面考虑:

1)在价值方面,运行维护的服务价值和用户规模相关,一方面用户规模不断增长,运行维护所付出的成本也不断上升,但是由于视听新媒体存在边际效用递减的现象,即每个用户所分摊的运维成本在不断下降。

2)在能力方面,与传统媒体提供在业务和基础设施方面的技术保障之外,视听新媒体要充分保障对外服务的容量和质量,因此可用性、容量和服务级别协议部分较传统媒体会有更多的指标项来衡量。

3)在维护方面,视听新媒体由于业务软件的快速迭代,软件变更频率和时间要求比较高,需要着重在变更的方面设置相关指标来保证不断变化的业务要求。

4)在监控方面,除了传统的事件监控之外,希望运维团队能够在被动处置事件的同时,能够进行积极主动地预防性管理,查找事件背后存在的问题和隐患,因此补充了对问题的管理。

2 运维指标体系设计思路

2.1 采用ITIL作为运维指标体系的方法论

指标体系的架构借鉴当前较为先进的运行维护服务经验,经过反复考虑,将ITIL作为运维指标体系的方法论。

在IT项目的生命周期中,大约80%的时间与IT项目运营维护有关。世界上许多企业和政府部门进行了长期的探索和实践。以这些企业的经验和成果为基础,逐渐形成了一种新的IT运营管理方法论,那就是IT服务管理(IT Service Management,ITSM)[2]。英国商务部(OGC)从20世纪80年代开始组织开发的用于解决此类问题的IT管理标准体系——IT基础架构库(Information Technology Infrastructure Library,ITIL)。经过近20年的发展,在包括政府、企业和非营利组织中得到了广泛的支持与应用,应用ITIL可以提高管理IT变化的能力、降低成本,有效协调IT和业务的运作,满足组织目标又符合业务需要。

尽管ITIL具有普遍的意义,但仍然要“正确恰当”地应用ITIL,也就是说并不是视听新媒体的机构都要实施ITIL的全部流程,也不是要完全按理论去照搬某个流程。希望根据这种方法论来指导视听新媒体机构有选择地实施其中某些流程或者流程中的某些部分,能切实提高运维效率、提升业务能力和降低运维成本。

目前中央电视台在传统技术系统中已经基于ITIL提出了一套完整的运行维护指标体系,提升传统播出机构的运维服务能力,可见ITIL体系可以有效运用在传媒机构的技术系统运行维护工作中来[3],见图1 。

图1 ITIL 体系框架

2.2 参考和借鉴多个领域的标准规范

技术系统的运维涉及到技术领域非常全面,为了形成较为规范的指标体系,进行了大量的标准对标工作,参考了多个国家、行业技术标准和规定,为本指标体系提供了有力帮助。本指标体系共设置了125项指标,其中39项指标参考相关标准,部分内容见表1。

表1 指标体系中参考的标准及规定

2.3 指标分级

对于指标,可根据反映现象的直观程度分为3个级别,级数越大,越能直观反映相关目标的绩效;级数越小,越能反映相关目标的总体变化趋势。简单来说,级别由大到小,如同数学方法中的求导。

一级指标对每个类别进行总体绩效评估,是该类别二级和三级指标的算术加权,如服务容量指标,可形成管理年报,服务于高层领导、用户等。

二级指标可反映运行情况的阶段性总结,为改进服务运行质量提供基线,可较为直观地反映一组数据的一般情况,如在线平均时长等,可形成运行月报或事件管理月报告,服务于技术部门主管或流程中的监督管理角色。

三级指标用于日常运维工作任务记录和执行情况的检查,以业务为核心进行运维质量评估,如漏洞发现数量、点播卡顿次数等,可形成检查表、巡检表等,服务于具体运维操作人员。

3 运维指标体系主要内容

3.1 整体框架

为了更好地使视听新媒体平台在处理决策和执行方面更为有序,参考ITIL实践框架,从战略上划分为价值管理、能力管理、维护管理和监控管理4个大类。每个大类中各自又细分多个类别,见图2。

图2 指标体系层次

此外,根据对运维部门的流程梳理,会提供两组流程,如图3所示。一个是运维服务交付,包括成本、服务级别协议、连续性、容量和可用性管理,目的是面向业务部门的需求,通常需要和业务部门共同设定目标;另一个是运维服务支持,包括变更、资源、事件和问题管理,目的是满足业务部门要求,通常是运维团队内部设定目标。

图3 指标体系流程模型

3.2 价值管理

价值管理主要为运维成本管理,即技术系统运行和维护的成本管理。由于随着近几年的视听新媒体业务量不断增长,IT设备和系统规模增长很快,IT运维成本居高不下,而且逐年增加的趋势会非常明显。由于运维部门通常定位为成本中心,对运维成本的核算、控制缺乏有效管理,很难在业务规模、服务质量和成本之间找到平衡,尽管机构对技术系统建设的投入很大,但运维投入相比较而言会稍显不足,须通过设备人员比、运维成本等指标对运维效率进行考察,避免成本管理成为运维管理体系中较为薄弱的环节。

3.3 能力管理

能力管理的目标是视听新媒体运维服务尽可能满足业务的发展目标,易于扩展,并具有可用性、连续性和安全性。建立起一整套的视听服务能力和质量指标,从而实现端到端可测量的业务功能与质量保证。因此,能力管理包括服务级别协议管理、容量管理、可用性管理、连续性管理和信息安全管理。

通过服务级别协议和容量管理,能满足业务部门和用户对高质量的业务、服务和基础设施资源规模的服务期望,因此服务级别协议和容量管理均细分为业务、服务和资源3个子类型。业务子类型侧重于从业务部门角度设置相关能力和质量指标,如直播切换时间、点播播出时长。服务子类型侧重于从用户角度设置相关能力和服务质量指标,如直播并发数、点播播放量。资源子类型则侧重于底层技术组件的性能,如CDN、数据库、存储方面的技术指标。

可用性管理考察一段时间内的系统功能正常发挥的程度,该部分参考广播电视停播统计方法规范。

连续性管理考察发生灾难性事故时,是否能确保技术系统仍然能够支撑业务的运作,该部分参考信息系统灾难恢复规范。

信息安全管理是从安全的视角对IT运维过程中的各种信息进行管理和控制。该部分参考信息安全事件分类分级规范,并增加漏洞和防篡改方面的指标设置。

3.4 维护管理

维护管理目的是帮助运维部门实现系统资源的完整和可靠,并保证随着业务升级而同步更新,通过资源的有效配置和变更支持业务扩容和升级,确保任何变更对正在运行的系统产生最小的负面影响。在维护的过程中通过知识管理建立相关记录档案供查阅,保证变更具有可追溯性。

变更管理是将任何重要的授权、计划的服务、服务组件和相关文档进行增加、修改和删除等活动纳入指标统计中来。设置了若干关键点,如链路倒换、设备迁移和业务上线等。

资源管理可以保全IT资产,跟踪和控制变更,提供精确可查询的配置信息。其中重点包括设备、出口链路和能耗3个方面。

根据调研,知识管理在视听新媒体领域尚处在初级阶段。各个机构仍在摸索有效的知识管理工具和方法,因此根据总局对于文件、报表的管理要求,仅设置运维档案记录数一项指标。

3.5 监控管理

监控管理通过采集、分析和处理3个步骤,处理系统出现的各种情况。监控管理包含了事件管理和问题管理两部分。事件管理目标是尽可能快地解决突发事件或意外事件,使之恢复到正常的服务操作,并且使突发事件或意外事件对业务操作的负面影响减到最小。问题管理目的是消除警告、故障等事件的深层次根源以防止相关事件的再次发生。

事件管理是使用各种可能的办法,快速地让业务恢复,事件除了包括常见的消息、警告和故障三级事件,说明当前系统的健康状况,还增加了故障响应、处置以及解决方面的指标。

问题管理是主动、预防性管理,查找事件存在的问题和原因,从根本上解决问题。问题管理的来源可以是事件触发的,找出事件发生的根本原因;也可以是在巡查过程中发现的一些薄弱环节或有待改进的环节。对问题的指标设置要点在问题的流程管理,包括识别、登记、跟踪和解决等多个步骤。

4 运维指标体系注意事项

在运用运维指标体系的过程中,有以下注意事项:

首先,由于该指标体系在服务能力和质量上需要与相关部门的配合,可能也会涉及业务流程和工作习惯的调整,因此首先需要获得管理层高度重视和业务部门的认可。

其次,还要有一个相对独立的质量控制体系。和业务部门工作结合的越紧密,就越需要有一个相对独立的质量控制体系,对IT运维工作的执行进行全方位的监控。

本运维体系是多家运维团队的经验集合,还应该结合实际情况去运用,部分指标设置了较为灵活的定义方式,如卡顿率,需结合自家对于卡顿时长的定义进行运用,不是照抄照搬。建立指标体系目的是发现指标数值变化的规律,解决深层次的问题,对于运维团队绩效评估必须确立正确的价值导向。

本指标体系覆盖面广,不可能在短期内全面实施,应该根据实际情况,选取实施重点,如可设置“近期、中期和远期”的三阶段,逐步实施,逐步完善,并归纳出本系统的核心维护指标,加以深入分析和利用。

5 总结与展望

因此,在视听新媒体运维系统建设中,应深入理解本运维指标体系的核心理念,采用ITIL作为运维指标体系的方法论,参考和借鉴多个领域的标准规范,对各种视听业务为核心的工作流程和资源等复杂的管理对象进行抽象和归类,统一到一套抽象和专业化的运维指标当中来。形成结合自身运维的现状,解决工作中的实际问题,稳步推进,逐步实现对运维的科学管理,实现对运维过程的风险控制,实现运维团队的价值。

此次指标体系注重的是对于自身流程的管理,希望能通过指标体系建立起符合视听新媒体的一套运维指标体系,而生存周期管理、外包服务管理等内容作为有益的补充,希望能在下一次指标体系修订的时候加以完善。

[1]徐昊. 艾瑞咨询:2014Q1中国在线视频市场规模达36.8亿元,内容与终端是企业两大核心发展战略[EB/OL]. [2014-04-29]. http://video.iresearch.cn/others/20140429/230499.shtml.

[2]于捷.解读IT运维管[EB/OL].[2014-05-29]. http://network.chinabyte.com/195/11009695.shtml.

[3]百度百科. IT服务管理[EB/OL].[2014-05-29].http://baike.baidu.com/link?url=agMe52 KHY73 SmvxIdx LKRNdKO 2l0 PaAIhf Wad QY4d ZFE8k ZLRVhL GVD c61pgM01c.

[4]刘丹,琚宏伟. 全媒体时代电视台引入ITIL的技术管理实践[J]. 现代电视技术,2012(10): 131-134.

责任编辑:李 薇

Indicator System of New Media O&M Based on ITIL

HE Jing1,WANG Xiaoxia1,GUO Jia2

(1.AcademyofBroadcastingScienceInternetTechnologyInstitute,Beijing100866,China;2.RadioandTelevisionBureauofScienceandTechnologyDepartmentofYunnanProvince,Kunming650031,China)

Indicator system of operation and maintenance system in audio & visual of new media area is an important component part the new media IT system. Under the current conditions, the level of operation and maintenance management continues to be improved. So some mature experiences in ITIL are given for reference, which combined with the technical characteristics of audio & visual of new media. They are systematically discussed that the background of the whole system, purpose, main content, considerations and recommendations. It is hoped to provide technical advises to the operation and maintenance team in relevant area.

audio & visual of new media; operation and maintenance; ITIL; indication system

TN94

B

10.16280/j.videoe.2015.01.036

2014-06-10

【本文献信息】何晶,王晓霞,郭嘉.基于ITIL的视听新媒体运维指标体系研究[J].电视技术,2015,39(1).

猜你喜欢
运维指标体系指标
一类带临界指标的非自治Kirchhoff型方程非平凡解的存在性
运维技术研发决策中ITSS运维成熟度模型应用初探
最新引用指标
莫让指标改变初衷
风电运维困局
杂乱无章的光伏运维 百亿市场如何成长
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
基于ITIL的运维管理创新实践浅析
制造强国的主要指标