精细化与综合化打造运营商管理运营新引擎

2014-06-09 14:21中国移动天津公司霍文睿
通信世界 2014年18期
关键词:网管工单运维

中国移动天津公司 | 霍文睿

精细化与综合化打造运营商管理运营新引擎

中国移动天津公司 | 霍文睿

在安全、可靠、通畅的基础上,如何在网络结构日趋复杂且规模不断壮大的情况下仍能降低运营成本、提高运营效率,是这几年运营商普遍关心的问题。

随着分布式、云计算、大数据挖掘等IT技术手段的日趋成熟,运营商从全程全网以及降低成本、提高效率的角度出发,逐渐向管理精细化以及技术综合化的趋势迈进。

从管理角度,网络设备运行情况不再是衡量运维管理的惟一标尺,端到端网络质量、网络投诉比、告警工单比、故障平均处理历时、四网协同情况等都逐渐成为运营商运维管理的范畴。而从技术角度,网管支撑系统也由原先专业化的各大专业网管向综合网管的方向迈进,以此支撑强大的云计算技术以及大数据挖掘技术。

管理精细化

在安全、可靠、通畅的基础上,如何在网络结构日趋复杂且规模不断壮大的情况下仍能降低运营成本,提高运营效率是这几年运营商普遍关心的问题。

以往运营商大网的运营采用传统模式,由监控人员从各专业网管上或设备OMC上发现告警进行派单(大部分为自动派单)至设备维护中心,设备维护中心受理工单并修复故障回复工单,监控人员确认故障已恢复后归档工单。

看似顺理成章的闭环管理,随着网络规模变大且结构日趋复杂后,问题日趋凸显出来且漏洞也越来越多。比如一条传输光缆断裂会导致传输设备、无线设备乃至核心设备均上报多条告警,派发多张工单至各设备维护单位;夜间业主拉闸或市电停电导致多个基站断电退服以及多个WLAN AP退服;设备维护单位以设备故障修复为标准,网管监控以告警是否清除为标准;网管系统故障导致工单派发大量延误或生成大量“重复”工单;工单派发到设备维护单位后又层层转派,导致故障处理历时增加……这些问题的出现导致网络运维效率低下,运营成本也由于越来越多的人参与派发及转派工单而一路走高。

为了切实使运维人员从日趋增加的工作量中解放出来,并解决日常工作中遇到越来越突出的矛盾问题,运营商提出了精细化运维管理的概念。

通过把告警产生、工单预处理、工单派发、工单处理、工单报结等运维流程进行梳理、结合设备资源及各类历史数据、变长流程为短流程,以工单直派一线班组为主线,优化告警、工单生成派发流程,并形成了一系列量化指标进行评估,使整个运维流程可以像网络质量一样可以不断优化,从而提升运维效率同时降低运维成本,一定程度上也盘活了原来进行工单转派过程中的人力消耗。比如通过对准确的资源数据及告警正文信息的梳理,创新及优化关联规则,使单一设备、单专业不同设备、跨专业设备告警关联,不断压缩工单数量;通过精细化派单规则以及告警历史数据的统计规律特性,平衡派单时延等参数与故障响应灵敏度的关系进一步提高告警工单比;通过漏告警比率、告警呈现及时率等指标不断优化网管系统的有效性和可靠性;通过梳理资源、告警、预处理专业、维护班组等关系来优化工单处理流程,变层层转派工单为直派故障处理一线人员,从而缩短故障处理历时;梳理完善工单预处理,提高监控人员远程处理修复故障的能力,使工单准确有效派发至一线维护班组,从而提高派单准确率和命中率。

在管理流程精细化后,原来负责派发及转派工单的人员变为监控预处理人员,从一定程度上提升了这部分人员的指挥调度及故障预判的能力;通过一系列量化指标的优化,提升了网管系统服务于网络运维管理的能力,同时也给网管支撑系统带来了新发展的管理需求和技术需求,推动网管系统由专业化向综合化的方向发展。

技术综合化

运维管理的精细化,也突显了全程全网的概念,使网管支撑系统不得不由原先的专业化、功能化走向综合化、一体化。

近几年,各类网管系统层出不穷,同时IT各项技术蓬勃发展,塑造出以话务、数据、传输、动环为专业,以告警、性能、流程、资源、展示、分析、优化、控制为主要功能的各类网管支撑系统,大大小小的支撑系统软件多达几十种,但使用效率低、支撑运维生产能力不够等已成为不争的事实。

整合现有资源,打通各软件的接口,形成综合化程度更高的支撑系统已经迫在眉睫。同时大数据挖掘技术、云计算技术等大大提高了系统的运算能力、存储能力以及可靠性,使构建综合化的网管支撑系统成为可能。

系统分层化

系统综合化不代表系统没有新的统一架构,而是重新构建一套新的架构,即三层体系架构(采集层、数据共享层、系统应用和呈现层)。将原各系统从设备侧采集的一切数据都纳入采集层平台进行管理;数据共享层实际是将采集的数据进行处理、分析、入库;系统应用和呈现层则根据用户需要部署各类应用将下层整合的数据进行输出。

虽说新系统架构实现了系统一定程度的综合,但各系统应用层之间仍需有不少内容需要交互,这时就需要打通各系统之间的接口,将必要的信息进行传递,从而使精细化的管理流程落地。

信息关联化

原网管系统能力不足的主要体现就是信息关联的能力不足,系统接口多样化、定制开发周期慢、源数据采集位置不统一导致了系统关联综合能力较弱。

重新搭建的系统架构将克服这一瓶颈。由于采集层数据源的一致,可以使各类信息很好的关联起来。比如通过资源数据一致性将动环、无线、传输、核心网的告警进行关联,从而避免单个故障导致多个不同专业设备均出现大量告警的情况;通过核心网的资源关联,打通告警、性能、业务统计、信令交互等多个模块,使网络各层面的信息统一呈现。

数据潜能待挖掘

综合化的系统建成后,每天会有大量的性能数据、业务数据、运维数据、安全数据生成入库,为运营商提供各种数据挖掘潜能。

通过历史性能数据的挖掘,可以从多维度分析预测网络的性能指标,为优化提供参考;通过对业务类型及流量的分析,可以进行用户行为预测,从而给市场部门营销提供参考;通过对告警工单数据的挖掘,可以进一步优化流程及规则,提升运维效率。

猜你喜欢
网管工单运维
客服工单监控技术的开发与研究
基于量化考核的基层班组管理系统的设计与应用
运维技术研发决策中ITSS运维成熟度模型应用初探
风电运维困局
给水网管的优化布置研究
杂乱无章的光伏运维 百亿市场如何成长
基于HANA的工单备件采购联合报表的研究与实现
配电线路的运维管理探讨
北京市中小学网管教师培训需求研究
电力95598热线全业务集中后的工单预警机制