高 鑫,马 里,来 来
(中国电信股份有限公司杭州分公司,杭州 310066)
网络运营质量提升的核心就是网络的安全性提升[1],而网络的安全则包含网络架构安全、传输光路安全、业务承载安全,三者密不可分,层层递进,将网络安全这抽象概念从点到线,从线到面依次展开。网络架构安全就是着重解决同板卡、单链路的隐患;传输光路安全在避免传输通道同缆、同路由问题的同时又要保证光路衰耗控制在正常范围内;业务承载安全即评估各种型号设备的性能,保证业务在安全稳定环境下运行。试想,如果通过人工发现的方式去发现网络安全问题,仅同板卡检测就涉及到上千块板卡,在几万端口中分类甄别是否是同板卡就犹如大海捞针,况且,这仅仅是一次检查的工作量,而网络安全和运营质量提升是一项常态化的工作,需要定期开展排查和整治。
显然,采取传统的手工方式根本无法应对如此多的工作,必须创新方式方法将人工干预的环节和时限降至最低,才有可能做好日常隐患排查,实现网络运营质量提升。
图1 隐患处理项
大数据技术,曾经被称为数据仓库的逻辑延伸。大数据就是一个大型的数据仓库,一般有一个能支持业务决策的业务重点[2]。从电信级网络维护的角度出发,大数据技术可以视为一种“从海量设备节点、光路节点中获取各种参数,利用各自规则来主动发现问题、分析问题、定位问题[3],从而提高维护效率,进而提升网络运营质量”的手段。
本文的研究方法在功能部署上分为统一数据采集、数据整合、统一数据分析和人工处理等四层(如图2所示)。四个层级按照顺序进行逐层执行,经过前三个层级的智能采集、整合和分析后,将会极大地降低需要人工处理的工作量,从而达到将人工干预的环节和时限降至最低的目的。
图2 大数据功能部署图
图3 隐患排查处理工作流程
同时,我们设计一套基于上述四个层级模块的隐患排查处理工作流程(如图3所示),纵观整个流程,所有工作项都是循环推行,都是发现到整改、再发现、再整改的过程。人工干预的环节仅仅在处理一项,扫描发现问题、分析隐患全部由系统自动完成。下文将详细描述该方法在光功率整治这一网络运营质量提升重要场景中的具体应用。
全网光功率控制是对杭州电信汇聚层及以上的4万多个光口进行实时监控,范围涉及到数据设备、IPRAN、无线L网、传输设备。过程涉及到采集、存储、分析、查询验证四大环节。其中查询涉及到多网管联动,数据设备、IPRAN设备通过SNMP方式采集,采集结果通过FTP格式送至光功率采集模块,传输设备直接在采集模块上通过CORBA接口采集,无线的L网设备通向北向指令的方式采集。当采集完成后,光功率系统通过专业标示进行分类,送至不同的数据库进入数据处理环节。同时引入分析库进行分析(如图4)。譬如,数据专业会引入中继信息、综合资源系统对全程光路、中继平衡性进行分析,通过人工录入的经验值对衰耗大的光路一一标示,通过前后两次采集值的差距来分析光路是否存在波动。最终形成清单和趋势图(如图5)。
图4 光功率系统对各专业的分析
从本文研究的方法投入到全网光功率整治中使用以来,根据今年年初的T0清单,当时合计发现267条隐患中继,截止6月底完成量为245条,除部分郊县节点(存在实际困难)完成率较低外,其余POP内的中继光路整治效果良好,其中市区已经连续2个月未发现隐患中继。同时,利用大数据,可以对隐患光口按区域、按业务属性进行分类,光功率达标率直线上升,设备稳定运行,即便有光路挖断、板卡吊死的“天灾”,但是通过跨板卡,光路不同路由的保护,真正影响业务的故障少之又少,网络整体质量稳步提升。
图5 光功率的变化趋势及清单
通过本文中方法的应用,在短短的几个月的时间内,完成了之前几年城域网建设和维护中遗留的隐患整治,网络运营质量的提升离不开运维人员的辛勤努力,也离不开“自动化+大数据分析”[4]带来的效率提升,充分印证“科学是第一生产力”是亘古不变的真理。
伴随着CT技术的IT化和网络技术的不断演进,SDN/NFV已经成为了当前的产业大趋势。SDN重新定义了网络架构,给了运营商更强的网络掌控能力;而NFV则改变了网元结构与状态,极大提升了运营商的网络与业务管理能力。无论是SDN还是NFV,都改变了运营商传统的业务运营方式[5],对日常的网络运营带来了巨大的颠覆和挑战,因此如何不断与时俱进,不断将大数据技术和其它新技术应用在日常的运维工作中提升效率就变成十分重要。