流控功能忽视不得

2018-03-04 23:00
网络安全和信息化 2018年8期
关键词:机房排查基站

ONU是英文Optical Network Unit的缩写,即光网络单元。ONU分为有源光网络单元和无源光网络单元。本文涉及到的PON使用光纤连接到OLT,然后OLT连接到ONU,指的是有源ONU,它主要提供数据、IPTV(即交互式网络电视)等业务,被广泛应用到宽带用户的接入上,在互联网开通的过程中发挥着重要的作用。

笔者单位最近在开展点播业务的时候,遇到了点播视频卡顿的问题,通过在机房搭建测试环境,然后入户排查,最终将故障定位在了ONU的设置上,在将ONU上联口流控功能开启后,故障解决。接下来就详细介绍一下整个故障的处理过程。

故障现象

近一段时间以来,点播业务作为主推业务陆续开通,可是在开通的过程中,我们接到同事反映,点播视频出现卡顿的现象。

故障分析

在展开排查的同时,进一步收集故障信息,得知部分点播用户使用点播服务出现卡顿、马赛克等现象。为了尽快解决故障,需要寻找一个平衡点,即可以比照的参照物。在点播业务正式商用之前,为了提供一个良好的点播监测平台,我们对点播业务进行全天候监测,主要涉及到点播平台关键设备的网管,具体包括交换机在线状态、主备服务器服务状态、用户在线数量实时统计、故障告警等其他常见参数。

在对点播平台网管进行梳理,并在数据机房对点播业务进行了实时观看后均没有发现问题。根据用户报障的信息,我们迅速锁定了就近的数据基站,在靠近用户侧的数据基站对反映点播故障的视频节目进行查看,也没有发现视频卡顿的问题。这样我们就可以肯定视频资源是没有问题的。

故障解决

既然点播视频资源和基站测试正常,下一步就需要按照网络层次排查下汇聚和接入网,即EPON设备,在排查设备之前需要了解下网络拓扑情况,具体的网络拓扑情况即BRAS直连OLT,然后使用ONU入户,实现互联网和点播的接入工作。刚才我们介绍到在覆盖报障用户的数据基站测试点播正常,那么可以排除整个链路的带宽使用情况,即BRAS和OLT,PON口的流量,这样故障就逐步缩小在了OLT的PON以下。我们来到用户侧进行查看,在用户侧我们首先排查的是物理层的问题,即网线、高清线等环节,均没有发现问题,尝试更换ONU设备,在设备更换后,并将ONU端口的数据配置成功,再次观看点播视频时,视频卡顿的现象均没有出现,经过长时间观察,没有再次出现视频卡顿的问题。这样故障就解决了。

经验总结

问题分析到这里似乎故障的处理十分简单,只是在机房对点播平台进行了查看,然后在用户侧更换了一台ONU就解决了故障。将新更换的ONU和故障ONU进行对比,发现型号和外观就存在很大差异。将故障ONU带回机房进行测试,对故障现象进行了还原,然后通过查找资料和请教厂家工程师,得知该款ONU设备上没有开启流控功能,网络中的流量影响到了视频业务,开启流控功能后能够有效抑制这个影响。具体解决办法是,在ONU配置模式下执行uplink flowcontrol enable命令,开启流控功能即可。

上面我们从得知故障现象,然后再使用寻找可以比照参照物的方法,在机房搭建测试环境,并根据网络拓扑结构,逐步将故障定位在了ONU上,最终达到了解决故障的目的。

针对此款ONU出现的问题,我们专门制定了解决方案,具体方法是,对在网使用该型号的ONU进行远程升级,对升级带来的影响进行了评估,计划采取分批次、由少到多逐步远程升级,并根据报障情况灵活采取单个ONU开启流控功能相结合的办法,对升级过程中出现升级失败的情况采取更换ONU的办法解决,这在一定程度上将用户上网的影响降低到最小,同时也达到了在快速解决故障的基础上兼顾了经济成本。

猜你喜欢
机房排查基站
高层建筑消防安全排查情况及处理对策
配网二次回路故障的排查分析
给家中来个危险排查吧
数据中心机房气流组织研究在某机房的应用
如何排查并改错
基于移动通信基站建设自动化探讨
可恶的“伪基站”
基于GSM基站ID的高速公路路径识别系统
N通信公司机房节能技改实践
新型有线电视机房UPS系统的配置