“二分法”在PON网络维护中定位流氓猫的应用分析

2014-09-24 18:09郑国泰
无线互联科技 2014年7期
关键词:二分法

郑国泰

摘要:介绍了流氓ONU的常见类型,阐述了运用“二分法”现场定位流氓猫的思路和方法。

关键词:PON;流氓ONU;二分法1引言

随着光接入网络的大规模建设,网络运营与维护的矛盾逐步显现出来。特别是PON网络中出现的异常(流氓)猫(ONU),由于其发生故障时具有一定的隐蔽性和欺骗性,故障定位较为困难,严重影响了客户感知。本文从PON网络的实际维护出发,通过对日常维护中碰到的典型、疑难故障案例进行总结分析,归纳出运用“二分法”快速定位流氓ONU(猫)的思路和方法。

2流氓ONU的技术原理

在PON系统中,一般采用单纤双向传输方式,上行帧和下行帧同步,每帧包括一个或多个光网络单元(ONU)的信息。上行数据流以TDM的方式共享上行带宽,光线路终端(OLT)在下行帧中以字节为单位指示上行数据流在上行帧中允许的位置,OLT在下行物理控制块(PCBD)中发送时隙授权,这些时隙授权指示了每个ONU发送上行数据流的开始时间和结束时间。这样在任意时刻只有一个ONU可以访问媒质,在正常工作状态下不会发生碰撞。如果有ONU不按照OLT的带宽映射方式发送数据流,可能会导致整个PON口无法正常工作。长发光ONU就是这样一种“流氓”ONU,其特征是占据了其他ONU发送上行数据流的时隙,使其他ONU不能正常工作。由于ONU硬件问题(多数为激光器问题),导致ONU长发光或随机发光,导致PON口下其他ONU不能上线或频繁上下线,这种ONU就称为流氓ONU。

3PON网络维护中存在的问题

相对于传统铜缆接入网络,光接入网具有相对成本较低、无源纯介质网络及资源占用少等诸多优势,是接入网络发展必然趋势。但是在近几年大规模光网建设和光进铜退中,光网的维护问题也逐渐暴露出来。其一是维护方式的转变,装维人员需要转变维护观念,相对铜缆,光接头安装工艺和光纤的布放要求较高,给装维人员维护技能提出了更高的要求;其二是光网整个运维体系的建立需要时间,接入网网络维护必然经历阵痛期,客户流失和客户感知受损带来很大压力;其三是由于整个网络向用户侧前移,设备的安全性和稳定性带来考验,特别是相对于FTTH(E8C)的终端,由于终端属于运营商定制性质且安放在用户家里,终端工作的稳定性和用户不可控性带来了很多问题,如定制终端由于工作环境或制造性能等原因常会出现工作异常,影响整个PON口下其它用户正常使用;有些恶意用户将ONU的端口环路,引发网络风暴,影响大量用户业务中断;诸如此类终端,我们均归类为异常(流氓)光猫。这些流氓光猫随着光网建设的推进,光猫的工作年限越久必然会长期存在而且越来越多,给光网维护带来越来越大的困维。如何应对该类异常光猫给光网维护带来的影响呢?下面我们用几个实际处理的典型案例加以分析。

4几个典型案例分析

案例1:E8-C新装故障

故障现象:ADSLD2244608578光猫注册到49%

故障处理过程:查BRAS发现终端有时可以拿到TR069IP地址,ITMS也可以管理到,使用辅助注册功能,提示注册失败。重启后不能立即获取不到TR069IP地址,ITMS无法管理,需要等很久才能获取到TR069IP地址。到现场处理,通过烽火网管查看同一PON口下有两个终端在线,其中一个ONU在发大量发送广播报文,判断是环路引起,经查该用户是停机用户,在网管上把环路终端删除后,该ONU立即可以注册成功。

案例2:博罗园洲上南华为MA5680T/0/16/4下带大量用户业务时通时不通

故障现象:PON口下大量终端无法上线,宽带和语音使用不正常。

故障处理过程:查看华为网管有“端口下存在非法入侵的流氓ONT”告警,但无法定位出具体是哪台ONT,PON口下终端大量处于“初始状态”,PING其中一台正常在线的终端IP地址会5~6%丢包。现场拔纤排除故障ONU后故障恢复。

案例3:博罗商业街站点15槽位3下带用户大量报障

故障现象:博罗商业街站点15槽位3下带用户报上网不正常,电话经常断线,新终端无法注册。

故障处理过程:故障报给厂家核查,更换过PON口光模块、PON板故障未处理好,厂家现场抓好包一个星期未处理好。后采用“二分法”现场拔纤,网管配合PING包找出异常ONU后故障恢复,该故障有个特点就是异常ONU接入后PON口下的网络时延突增至1000ms。

案例4:MA5680T下的ONT采用LOID注册,特定ONTID无法上线。

故障现象:巽寮局上报MA5680T下挂ONT特定ONT ID 8无法添加上线,必须在OLT上修改ONT ID为非ONI ID 8,才能够让ONT上线,比如将ONT ID修改为25,或者60,这个ONT才能稳定上线。

故障处理过程:华为研发通过现场测试和检查发现特艺厂家ONT异常挂死,在ONT挂死的同时,该ONT占用了ONT ID 8的相关资源,并且不释放,OLT检测到该ONT不响应,产生Losi,Lomi等,OLT认为ONT下线。当有新的ONT想以ONT ID 8上线时,该挂死的ONT会在ONT ID为8的上行时序内发干扰性的上行光,导致光路出现ONT ID为8上行光时序内的上行光冲突,进而持续影响ONT ID为8的ONT稳定注册上线。最终表现为一个PON下,特定的ONT ID无法稳定注册上线,进而无法使用。这种流氓猫和传统的流氓猫不一样,属于特定ONT ID的流氓猫,这种流氓猫的影响相对较小,只影响一个特定的ONT ID,但是这种故障一旦具有规模性,会导致网络故障排查相当困难。

从以上几个故障案例中可以看出,故障处理时限普遍较久,故障定位困难;除了少数厂家在OLT设备开启了OLT的环路检测功能后,能对环路的流氓猫进行自动检测和隔离外,针对其它异常猫的自动检测和隔离功能均无法实现,说明了异常光猫存在的复杂性;这些故障均是通过现场逐个拔纤从而定位出流氓猫的,但是现场逐个拔纤耗时耗力,效率也较低,给排障带来很大困难。

5解决思路和方法

综上案例,异常ONU存在共同的故障现象,均是霸占其它ONU的资源,破坏正常ONU与OLT的交互,只是影响范围不一样。根据以往经验,如发现PON口下的所有或部分ONU工作不稳定,无法注册、终端反复上下线等奇怪现象,PON口下就可能存在流氓猫干扰。通常来说,以上故障现象有可能原因如下,在故障判断上应先排除其它因素,再来考虑流氓猫的问题。

1)OLT的PON口光模块故障;

2)PON口收光功率值处于临界状态;

3)OLT的PON板故障;

4)ODN故障(包括一级分光和二级分光器);

5)存在异常的ONU。

目前我们总结流氓猫共有以下几种:

a)存在自发光的ONU,有两种形式出现:A、常发光的ONU,B、随机发光的ONU;

b)PON口下某台ONU存在环路现象,这种情况一般伴随出现PON口下大量的广播包增长;

c)ONU存在某种故障导致PON口下所有ONU的网管时延突增,甚至达到1000ms级;

d)ONU存在某种故障导致PON口下所有ONU不正常的丢包,丢包率达5~6%;

流氓猫一般来说是不受控终端,所以大多数只能现场进行拔纤才能彻底解决,而逐个拔纤却又是一个效率较低的方法。能否有更好的拔纤方式呢?经过多次测试,我们发现一种能大大提高现场拔纤效率的方法,称之为“二分法”,操作方式为先在一级分光器端拔掉下挂二分之一二级分光器,查看其他ONU是否正常在线并使用正常,若正常,说明异常ONU在拔掉一半二级分光器中,依此方法排查,可定位出异常ONU在哪台二级分光器中;然后在二级分光器中也通过“二分法”,即拔掉二分之一ONU,查看其他ONU是否正常在线并使用正常,若正常,说明异常ONU在拔掉一半ONU中,依次方法排查,可定位出异常ONU,现场拔掉即可。拔纤过程中,需要同时进行业务验证,才能达到效率最高。

为什么“二分法”相对于逐个拔纤法效率更高呢?我们做一个简单分析,假设一个二级分光组网的网络,第1级分光为1:8分光,第2级也是1:8分光,总分光比为1:64,如上图所示,如果用逐个拔纤法,定位异常猫在那台2级分光器上面,则需最少1次最大8次插拔尾纤才能判断出流氓在那台2级分光器;定位出2级分光器同样需要最大8次插拔尾纤才能定位出异常猫,也就是说现场排除一个异常猫,采用逐个拔纤法最大需要插拔16次尾纤才能定位,如果是一个一级1:64分光,则最大需要插拔64次尾纤才能定位出流氓猫,显然这样的操作对于现场维护来说会效率会非常低,且效果也不好。同样的场景,如果采用“二分法”进行拔纤,第1种二级分光组网时,最大用4次插拔就能定位出二级器,一共只需用8次插拔尾纤就能定位出流氓猫;如果是1:64分光,则只需要最大6次就能定位出流氓猫,相对于逐条拔纤法,效率大大提高。分光比越大,定位效率也越高。

6结束语

在运营商没有将定制终端与OLT厂商在标准中作进一步规范和明确之前,实现由OLT直接检测并自动隔离异常ONU显得办法不多。在此前提下,当前绝大多数光网维护处理流氓猫故障只能从实际出发,通过现场拔纤进行排除,而这其中采用“二分法”进行现场拔纤是被证明了的效率较高一种拔纤方式。在后续的几次流氓猫的故障处理中,我们通过“二分法”现场拔纤大大减少故障定位时间,处理效率也得到有效提高。

[参考文献]

[1]百度文库.网络风暴基本原理.

摘要:介绍了流氓ONU的常见类型,阐述了运用“二分法”现场定位流氓猫的思路和方法。

关键词:PON;流氓ONU;二分法1引言

随着光接入网络的大规模建设,网络运营与维护的矛盾逐步显现出来。特别是PON网络中出现的异常(流氓)猫(ONU),由于其发生故障时具有一定的隐蔽性和欺骗性,故障定位较为困难,严重影响了客户感知。本文从PON网络的实际维护出发,通过对日常维护中碰到的典型、疑难故障案例进行总结分析,归纳出运用“二分法”快速定位流氓ONU(猫)的思路和方法。

2流氓ONU的技术原理

在PON系统中,一般采用单纤双向传输方式,上行帧和下行帧同步,每帧包括一个或多个光网络单元(ONU)的信息。上行数据流以TDM的方式共享上行带宽,光线路终端(OLT)在下行帧中以字节为单位指示上行数据流在上行帧中允许的位置,OLT在下行物理控制块(PCBD)中发送时隙授权,这些时隙授权指示了每个ONU发送上行数据流的开始时间和结束时间。这样在任意时刻只有一个ONU可以访问媒质,在正常工作状态下不会发生碰撞。如果有ONU不按照OLT的带宽映射方式发送数据流,可能会导致整个PON口无法正常工作。长发光ONU就是这样一种“流氓”ONU,其特征是占据了其他ONU发送上行数据流的时隙,使其他ONU不能正常工作。由于ONU硬件问题(多数为激光器问题),导致ONU长发光或随机发光,导致PON口下其他ONU不能上线或频繁上下线,这种ONU就称为流氓ONU。

3PON网络维护中存在的问题

相对于传统铜缆接入网络,光接入网具有相对成本较低、无源纯介质网络及资源占用少等诸多优势,是接入网络发展必然趋势。但是在近几年大规模光网建设和光进铜退中,光网的维护问题也逐渐暴露出来。其一是维护方式的转变,装维人员需要转变维护观念,相对铜缆,光接头安装工艺和光纤的布放要求较高,给装维人员维护技能提出了更高的要求;其二是光网整个运维体系的建立需要时间,接入网网络维护必然经历阵痛期,客户流失和客户感知受损带来很大压力;其三是由于整个网络向用户侧前移,设备的安全性和稳定性带来考验,特别是相对于FTTH(E8C)的终端,由于终端属于运营商定制性质且安放在用户家里,终端工作的稳定性和用户不可控性带来了很多问题,如定制终端由于工作环境或制造性能等原因常会出现工作异常,影响整个PON口下其它用户正常使用;有些恶意用户将ONU的端口环路,引发网络风暴,影响大量用户业务中断;诸如此类终端,我们均归类为异常(流氓)光猫。这些流氓光猫随着光网建设的推进,光猫的工作年限越久必然会长期存在而且越来越多,给光网维护带来越来越大的困维。如何应对该类异常光猫给光网维护带来的影响呢?下面我们用几个实际处理的典型案例加以分析。

4几个典型案例分析

案例1:E8-C新装故障

故障现象:ADSLD2244608578光猫注册到49%

故障处理过程:查BRAS发现终端有时可以拿到TR069IP地址,ITMS也可以管理到,使用辅助注册功能,提示注册失败。重启后不能立即获取不到TR069IP地址,ITMS无法管理,需要等很久才能获取到TR069IP地址。到现场处理,通过烽火网管查看同一PON口下有两个终端在线,其中一个ONU在发大量发送广播报文,判断是环路引起,经查该用户是停机用户,在网管上把环路终端删除后,该ONU立即可以注册成功。

案例2:博罗园洲上南华为MA5680T/0/16/4下带大量用户业务时通时不通

故障现象:PON口下大量终端无法上线,宽带和语音使用不正常。

故障处理过程:查看华为网管有“端口下存在非法入侵的流氓ONT”告警,但无法定位出具体是哪台ONT,PON口下终端大量处于“初始状态”,PING其中一台正常在线的终端IP地址会5~6%丢包。现场拔纤排除故障ONU后故障恢复。

案例3:博罗商业街站点15槽位3下带用户大量报障

故障现象:博罗商业街站点15槽位3下带用户报上网不正常,电话经常断线,新终端无法注册。

故障处理过程:故障报给厂家核查,更换过PON口光模块、PON板故障未处理好,厂家现场抓好包一个星期未处理好。后采用“二分法”现场拔纤,网管配合PING包找出异常ONU后故障恢复,该故障有个特点就是异常ONU接入后PON口下的网络时延突增至1000ms。

案例4:MA5680T下的ONT采用LOID注册,特定ONTID无法上线。

故障现象:巽寮局上报MA5680T下挂ONT特定ONT ID 8无法添加上线,必须在OLT上修改ONT ID为非ONI ID 8,才能够让ONT上线,比如将ONT ID修改为25,或者60,这个ONT才能稳定上线。

故障处理过程:华为研发通过现场测试和检查发现特艺厂家ONT异常挂死,在ONT挂死的同时,该ONT占用了ONT ID 8的相关资源,并且不释放,OLT检测到该ONT不响应,产生Losi,Lomi等,OLT认为ONT下线。当有新的ONT想以ONT ID 8上线时,该挂死的ONT会在ONT ID为8的上行时序内发干扰性的上行光,导致光路出现ONT ID为8上行光时序内的上行光冲突,进而持续影响ONT ID为8的ONT稳定注册上线。最终表现为一个PON下,特定的ONT ID无法稳定注册上线,进而无法使用。这种流氓猫和传统的流氓猫不一样,属于特定ONT ID的流氓猫,这种流氓猫的影响相对较小,只影响一个特定的ONT ID,但是这种故障一旦具有规模性,会导致网络故障排查相当困难。

从以上几个故障案例中可以看出,故障处理时限普遍较久,故障定位困难;除了少数厂家在OLT设备开启了OLT的环路检测功能后,能对环路的流氓猫进行自动检测和隔离外,针对其它异常猫的自动检测和隔离功能均无法实现,说明了异常光猫存在的复杂性;这些故障均是通过现场逐个拔纤从而定位出流氓猫的,但是现场逐个拔纤耗时耗力,效率也较低,给排障带来很大困难。

5解决思路和方法

综上案例,异常ONU存在共同的故障现象,均是霸占其它ONU的资源,破坏正常ONU与OLT的交互,只是影响范围不一样。根据以往经验,如发现PON口下的所有或部分ONU工作不稳定,无法注册、终端反复上下线等奇怪现象,PON口下就可能存在流氓猫干扰。通常来说,以上故障现象有可能原因如下,在故障判断上应先排除其它因素,再来考虑流氓猫的问题。

1)OLT的PON口光模块故障;

2)PON口收光功率值处于临界状态;

3)OLT的PON板故障;

4)ODN故障(包括一级分光和二级分光器);

5)存在异常的ONU。

目前我们总结流氓猫共有以下几种:

a)存在自发光的ONU,有两种形式出现:A、常发光的ONU,B、随机发光的ONU;

b)PON口下某台ONU存在环路现象,这种情况一般伴随出现PON口下大量的广播包增长;

c)ONU存在某种故障导致PON口下所有ONU的网管时延突增,甚至达到1000ms级;

d)ONU存在某种故障导致PON口下所有ONU不正常的丢包,丢包率达5~6%;

流氓猫一般来说是不受控终端,所以大多数只能现场进行拔纤才能彻底解决,而逐个拔纤却又是一个效率较低的方法。能否有更好的拔纤方式呢?经过多次测试,我们发现一种能大大提高现场拔纤效率的方法,称之为“二分法”,操作方式为先在一级分光器端拔掉下挂二分之一二级分光器,查看其他ONU是否正常在线并使用正常,若正常,说明异常ONU在拔掉一半二级分光器中,依此方法排查,可定位出异常ONU在哪台二级分光器中;然后在二级分光器中也通过“二分法”,即拔掉二分之一ONU,查看其他ONU是否正常在线并使用正常,若正常,说明异常ONU在拔掉一半ONU中,依次方法排查,可定位出异常ONU,现场拔掉即可。拔纤过程中,需要同时进行业务验证,才能达到效率最高。

为什么“二分法”相对于逐个拔纤法效率更高呢?我们做一个简单分析,假设一个二级分光组网的网络,第1级分光为1:8分光,第2级也是1:8分光,总分光比为1:64,如上图所示,如果用逐个拔纤法,定位异常猫在那台2级分光器上面,则需最少1次最大8次插拔尾纤才能判断出流氓在那台2级分光器;定位出2级分光器同样需要最大8次插拔尾纤才能定位出异常猫,也就是说现场排除一个异常猫,采用逐个拔纤法最大需要插拔16次尾纤才能定位,如果是一个一级1:64分光,则最大需要插拔64次尾纤才能定位出流氓猫,显然这样的操作对于现场维护来说会效率会非常低,且效果也不好。同样的场景,如果采用“二分法”进行拔纤,第1种二级分光组网时,最大用4次插拔就能定位出二级器,一共只需用8次插拔尾纤就能定位出流氓猫;如果是1:64分光,则只需要最大6次就能定位出流氓猫,相对于逐条拔纤法,效率大大提高。分光比越大,定位效率也越高。

6结束语

在运营商没有将定制终端与OLT厂商在标准中作进一步规范和明确之前,实现由OLT直接检测并自动隔离异常ONU显得办法不多。在此前提下,当前绝大多数光网维护处理流氓猫故障只能从实际出发,通过现场拔纤进行排除,而这其中采用“二分法”进行现场拔纤是被证明了的效率较高一种拔纤方式。在后续的几次流氓猫的故障处理中,我们通过“二分法”现场拔纤大大减少故障定位时间,处理效率也得到有效提高。

[参考文献]

[1]百度文库.网络风暴基本原理.

摘要:介绍了流氓ONU的常见类型,阐述了运用“二分法”现场定位流氓猫的思路和方法。

关键词:PON;流氓ONU;二分法1引言

随着光接入网络的大规模建设,网络运营与维护的矛盾逐步显现出来。特别是PON网络中出现的异常(流氓)猫(ONU),由于其发生故障时具有一定的隐蔽性和欺骗性,故障定位较为困难,严重影响了客户感知。本文从PON网络的实际维护出发,通过对日常维护中碰到的典型、疑难故障案例进行总结分析,归纳出运用“二分法”快速定位流氓ONU(猫)的思路和方法。

2流氓ONU的技术原理

在PON系统中,一般采用单纤双向传输方式,上行帧和下行帧同步,每帧包括一个或多个光网络单元(ONU)的信息。上行数据流以TDM的方式共享上行带宽,光线路终端(OLT)在下行帧中以字节为单位指示上行数据流在上行帧中允许的位置,OLT在下行物理控制块(PCBD)中发送时隙授权,这些时隙授权指示了每个ONU发送上行数据流的开始时间和结束时间。这样在任意时刻只有一个ONU可以访问媒质,在正常工作状态下不会发生碰撞。如果有ONU不按照OLT的带宽映射方式发送数据流,可能会导致整个PON口无法正常工作。长发光ONU就是这样一种“流氓”ONU,其特征是占据了其他ONU发送上行数据流的时隙,使其他ONU不能正常工作。由于ONU硬件问题(多数为激光器问题),导致ONU长发光或随机发光,导致PON口下其他ONU不能上线或频繁上下线,这种ONU就称为流氓ONU。

3PON网络维护中存在的问题

相对于传统铜缆接入网络,光接入网具有相对成本较低、无源纯介质网络及资源占用少等诸多优势,是接入网络发展必然趋势。但是在近几年大规模光网建设和光进铜退中,光网的维护问题也逐渐暴露出来。其一是维护方式的转变,装维人员需要转变维护观念,相对铜缆,光接头安装工艺和光纤的布放要求较高,给装维人员维护技能提出了更高的要求;其二是光网整个运维体系的建立需要时间,接入网网络维护必然经历阵痛期,客户流失和客户感知受损带来很大压力;其三是由于整个网络向用户侧前移,设备的安全性和稳定性带来考验,特别是相对于FTTH(E8C)的终端,由于终端属于运营商定制性质且安放在用户家里,终端工作的稳定性和用户不可控性带来了很多问题,如定制终端由于工作环境或制造性能等原因常会出现工作异常,影响整个PON口下其它用户正常使用;有些恶意用户将ONU的端口环路,引发网络风暴,影响大量用户业务中断;诸如此类终端,我们均归类为异常(流氓)光猫。这些流氓光猫随着光网建设的推进,光猫的工作年限越久必然会长期存在而且越来越多,给光网维护带来越来越大的困维。如何应对该类异常光猫给光网维护带来的影响呢?下面我们用几个实际处理的典型案例加以分析。

4几个典型案例分析

案例1:E8-C新装故障

故障现象:ADSLD2244608578光猫注册到49%

故障处理过程:查BRAS发现终端有时可以拿到TR069IP地址,ITMS也可以管理到,使用辅助注册功能,提示注册失败。重启后不能立即获取不到TR069IP地址,ITMS无法管理,需要等很久才能获取到TR069IP地址。到现场处理,通过烽火网管查看同一PON口下有两个终端在线,其中一个ONU在发大量发送广播报文,判断是环路引起,经查该用户是停机用户,在网管上把环路终端删除后,该ONU立即可以注册成功。

案例2:博罗园洲上南华为MA5680T/0/16/4下带大量用户业务时通时不通

故障现象:PON口下大量终端无法上线,宽带和语音使用不正常。

故障处理过程:查看华为网管有“端口下存在非法入侵的流氓ONT”告警,但无法定位出具体是哪台ONT,PON口下终端大量处于“初始状态”,PING其中一台正常在线的终端IP地址会5~6%丢包。现场拔纤排除故障ONU后故障恢复。

案例3:博罗商业街站点15槽位3下带用户大量报障

故障现象:博罗商业街站点15槽位3下带用户报上网不正常,电话经常断线,新终端无法注册。

故障处理过程:故障报给厂家核查,更换过PON口光模块、PON板故障未处理好,厂家现场抓好包一个星期未处理好。后采用“二分法”现场拔纤,网管配合PING包找出异常ONU后故障恢复,该故障有个特点就是异常ONU接入后PON口下的网络时延突增至1000ms。

案例4:MA5680T下的ONT采用LOID注册,特定ONTID无法上线。

故障现象:巽寮局上报MA5680T下挂ONT特定ONT ID 8无法添加上线,必须在OLT上修改ONT ID为非ONI ID 8,才能够让ONT上线,比如将ONT ID修改为25,或者60,这个ONT才能稳定上线。

故障处理过程:华为研发通过现场测试和检查发现特艺厂家ONT异常挂死,在ONT挂死的同时,该ONT占用了ONT ID 8的相关资源,并且不释放,OLT检测到该ONT不响应,产生Losi,Lomi等,OLT认为ONT下线。当有新的ONT想以ONT ID 8上线时,该挂死的ONT会在ONT ID为8的上行时序内发干扰性的上行光,导致光路出现ONT ID为8上行光时序内的上行光冲突,进而持续影响ONT ID为8的ONT稳定注册上线。最终表现为一个PON下,特定的ONT ID无法稳定注册上线,进而无法使用。这种流氓猫和传统的流氓猫不一样,属于特定ONT ID的流氓猫,这种流氓猫的影响相对较小,只影响一个特定的ONT ID,但是这种故障一旦具有规模性,会导致网络故障排查相当困难。

从以上几个故障案例中可以看出,故障处理时限普遍较久,故障定位困难;除了少数厂家在OLT设备开启了OLT的环路检测功能后,能对环路的流氓猫进行自动检测和隔离外,针对其它异常猫的自动检测和隔离功能均无法实现,说明了异常光猫存在的复杂性;这些故障均是通过现场逐个拔纤从而定位出流氓猫的,但是现场逐个拔纤耗时耗力,效率也较低,给排障带来很大困难。

5解决思路和方法

综上案例,异常ONU存在共同的故障现象,均是霸占其它ONU的资源,破坏正常ONU与OLT的交互,只是影响范围不一样。根据以往经验,如发现PON口下的所有或部分ONU工作不稳定,无法注册、终端反复上下线等奇怪现象,PON口下就可能存在流氓猫干扰。通常来说,以上故障现象有可能原因如下,在故障判断上应先排除其它因素,再来考虑流氓猫的问题。

1)OLT的PON口光模块故障;

2)PON口收光功率值处于临界状态;

3)OLT的PON板故障;

4)ODN故障(包括一级分光和二级分光器);

5)存在异常的ONU。

目前我们总结流氓猫共有以下几种:

a)存在自发光的ONU,有两种形式出现:A、常发光的ONU,B、随机发光的ONU;

b)PON口下某台ONU存在环路现象,这种情况一般伴随出现PON口下大量的广播包增长;

c)ONU存在某种故障导致PON口下所有ONU的网管时延突增,甚至达到1000ms级;

d)ONU存在某种故障导致PON口下所有ONU不正常的丢包,丢包率达5~6%;

流氓猫一般来说是不受控终端,所以大多数只能现场进行拔纤才能彻底解决,而逐个拔纤却又是一个效率较低的方法。能否有更好的拔纤方式呢?经过多次测试,我们发现一种能大大提高现场拔纤效率的方法,称之为“二分法”,操作方式为先在一级分光器端拔掉下挂二分之一二级分光器,查看其他ONU是否正常在线并使用正常,若正常,说明异常ONU在拔掉一半二级分光器中,依此方法排查,可定位出异常ONU在哪台二级分光器中;然后在二级分光器中也通过“二分法”,即拔掉二分之一ONU,查看其他ONU是否正常在线并使用正常,若正常,说明异常ONU在拔掉一半ONU中,依次方法排查,可定位出异常ONU,现场拔掉即可。拔纤过程中,需要同时进行业务验证,才能达到效率最高。

为什么“二分法”相对于逐个拔纤法效率更高呢?我们做一个简单分析,假设一个二级分光组网的网络,第1级分光为1:8分光,第2级也是1:8分光,总分光比为1:64,如上图所示,如果用逐个拔纤法,定位异常猫在那台2级分光器上面,则需最少1次最大8次插拔尾纤才能判断出流氓在那台2级分光器;定位出2级分光器同样需要最大8次插拔尾纤才能定位出异常猫,也就是说现场排除一个异常猫,采用逐个拔纤法最大需要插拔16次尾纤才能定位,如果是一个一级1:64分光,则最大需要插拔64次尾纤才能定位出流氓猫,显然这样的操作对于现场维护来说会效率会非常低,且效果也不好。同样的场景,如果采用“二分法”进行拔纤,第1种二级分光组网时,最大用4次插拔就能定位出二级器,一共只需用8次插拔尾纤就能定位出流氓猫;如果是1:64分光,则只需要最大6次就能定位出流氓猫,相对于逐条拔纤法,效率大大提高。分光比越大,定位效率也越高。

6结束语

在运营商没有将定制终端与OLT厂商在标准中作进一步规范和明确之前,实现由OLT直接检测并自动隔离异常ONU显得办法不多。在此前提下,当前绝大多数光网维护处理流氓猫故障只能从实际出发,通过现场拔纤进行排除,而这其中采用“二分法”进行现场拔纤是被证明了的效率较高一种拔纤方式。在后续的几次流氓猫的故障处理中,我们通过“二分法”现场拔纤大大减少故障定位时间,处理效率也得到有效提高。

[参考文献]

[1]百度文库.网络风暴基本原理.

猜你喜欢
二分法
二分法解非线性方程的算法设计和Matlab程序
用“二分法”看七年级学生数学应用题的审题
二分法求解无视觉白烟临界扩散点
基于二进制/二分法的ETC状态名单查找算法
“二分法”求解加速度的分析策略
“二分法”求解加速度的分析策略
基于深度学习的数学教学思考——以“用二分法求方程的近似解”为例
估算的妙招——“二分法”
“二等分点”还是“三等分点”
“二分法”教学中的几个问题