刘权
(中国移动通信集团南方基地,广州 510640)
传统的IT系统故障监控一般以单个设备告警为主,缺乏系统层面、业务层面的监控和分析能力,通常仅实现对单个设备的告警进行监控,却无法关联到整个系统业务可用性。现代IT系统的管理系统已逐渐向面向业务监控的发展方向演进,通过梳理IT系统每个单个设备或服务器的告警与整个IT系统业务可用性之间的关系,直接关联展示设备告警对IT系统业务可用性的影响关系,从而判断生成业务可用性告警。由于IT系统的一个业务往往与多个设备相关联,因此往往要经过非常复杂的“点与面”的告警影响关系建模。要做好这个模型,必须梳理清楚设备的每个设备告警与系统业务可用性之间的影响系数,在实际的IT系统部署情况中不同IT系统业务影响模型可能都不一样,每个设备对系统业务的影响系数也存在差异,即便是由同一个厂商开发和承建的系统,在不同的省份部署实施,其业务关系影响模型和系数也会不尽相同,因此管理系统必须考虑如何准确的建立各个被管IT系统的业务影响关系模型。如果建模过程中因为缺乏合适的方法理论,缺乏动态、高效的建模工具,那么建立起来的关系模型就会变得较为机械,适用性差,难以满足日益变化的IT业务对象。
CMDB技术的引入可以有效地解决业务关系建模难的问题,借助CMDB提供的配置信息库,整个建模过程变得高效化和自动化,并能随着IT业务对象的变化而不断的动态更新和完善,准确地反映业务对象本身。
配置管理数据库(CMDB,Configuration Management Database)是ITIL中最核心的概念之一。CMDB在ITIL中的定义是提供IT相关配置信息,存储与管理企业IT架构中设备的各种配置信息,它与所有服务支持和服务交付流程都密切相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。所有为提供IT服务需要的人员、流程、技术实施中涉及到的所有元素,都被称为配置项CI(Configuration Item),而CMDB就是所有CI信息的集合和存储。
CMDB模型的描述是为结构中元素定义统一的描述模板,为使其模型具有较强的通用性和可移植性,采用语义透明的模型描绘语言,便于模型的适配,有助于实现管理的自动化,如图1所示,CMDB模型中包含的配置项域、配置项组、配置项类及其关系等。
图1 CMDB模型通用结构图
在网管系统监控平台中引入CMDB模块,CMDB负责提供统一的公共数据模型(CDM),各个模块理解和共享CDM从而将监控平台的流程、资源和告警数据通过CMDB关联起来,如图2所示。CMDB模块提供业务构件,业务构件封装所有对配置项的操作,并与流程管理中的每个关键业务步骤相关联。通过共享数据接口实现业务构件与流程的关系对接,实现应用映射与可视化,完成了CMDB与流程管理的结合,同时多层次的结构使之结合具有良好的复用性和可扩展性,实现客户环境下模型的扩充。
CMDB通过联邦、调和、复制等技术,统一配置数据。CMDB提供沟通渠道,包括灵活的建模工具、丰富的数据服务和创新的共享接口等。系统模块间接口设计如图3所示。
图2 系统模块架构图
为保证监控平台中的资源与CMDB中的资源的一致性、故障定位的准确性,CMDB与监控平台集成时需要进行一次初始化的配置同步,并且建立两者资源的唯一标示映射,同时在监控平台上记录CMDB中对配置项的命名,作为和其它系统交换数据时对配置项的唯一标识,如图4所示。
图3 CMDB与监控平台结合架构图
图4 初始化同步的实施过程
网管监控平台与CMDB集成后,设备的入网、升级、退网等以变更管理流程的形式在NMS网管监控平台与CMDB两者中实现变更同步。如图5所示。
图5 同步变更
图6 CMDB在事件管理中的具体运用
图7 CMDB资源树状图
CMDB不仅记录CI的属性信息,也记录CI之间的关联信息。例如某一个Oracle的运行实体和系统业务应用之间的关系、业务应用和业务的关系等,这样IT管理人员就能够在故障发生时,通过对业务影响程度的评估,确定排除故障的优先级,首先确保关键应用的可用性和质量。将最高影响级别中的业务节点定义为业务影响根节点,这个根节点可能是设备所属的系统本身,也可能是与之发生关系的外部系统,甚至可能是涉及到的全网。图6描述了CMDB数据模型中各对象与业务影响模型中各对象的对应关系。
以CMDB中录入的各级资源对象以及各对象之间的关系为基础,自动在监控平台中生成出对应的、形象的业务影响视图。
在中国移动南方基地全国网管系统监控平台引入CMDB的原理和技术,实现了对被管理的网管系统的业务告警的监控和管理。
根据被管系统资源对象之间的实际关系,在CMDB配置模块中选择合适的关系模型,将资源信息和资源关系录入到CMDB中,在系统可查看生成每个被管网管系统的资源关系树状图,如图7所示。
CMDB中的资源信息和资源关系通过接口同步到监控平台中,监控平台中能够自动根据CMDB的业务依赖关系创建业务影响视图。从监控平台的告警业务影响视图可见,某被管网管系统的应用服务器出现“进程down告警”和“CPU利用率告警”时对网管系统各个功能模块的影响情况,并且监控平台中的业务影响视图能够根据CMDB关系的变化而变化,相关对象的告警能够在业务影响视图中传递。
[1] 李文璟, 王迎雪, 王颖. 基于分域的IT配置管理数据库信息模型[J]. 北京邮电大学学报, 2009.
[2] 刘鹏. 基于CMDB的网络管理事件处理系统的设计与实现[D].成都:电子科技大学,2008.