小议贝尔7342 OLT某槽位用户不能上网故障原因分析及处理

2016-03-13 08:52南京邮电大学玥南京欣网通信科技股份有限公司于立峰
电子世界 2016年13期

南京邮电大学 凌 玥南京欣网通信科技股份有限公司 于立峰



小议贝尔7342 OLT某槽位用户不能上网故障原因分析及处理

南京邮电大学 凌 玥
南京欣网通信科技股份有限公司 于立峰

【摘要】本文主要介绍PON系统网络(无源光网络)的组成及PON系统网络中相关OLT、ONU、ODN等设备的概念;PON系统网络中PON的上下行传输原理介绍;贝尔7342 OLT设备的概念及其相关AACU-C(报警控制单元)、EXNT-A(主控板)、ELT8-A(PON板)等板卡的功能和作用;贝尔7342 OLT设备中某块PON口板(ELT8-A板)下挂用户不能上网故障原因的分析、故障原因的排查以及处理方法;今后处理障碍过程中需要注意的问题等。

【关键词】PON;OLT;ELT;上网故障原因分析及处理

一、引言

目前,随着IP及网络技术的迅速发展,IP化、智能化、融合化、扁平化的下一代综合信息服务网络逐步完善,各运营商结合自身企业战略转型发展的需要提出实施全光网建设,解决用户各种接入的需求,为用户提供优质高效的服务,因此EPON、GPON等技术运用也越来越广泛。

二、PON概念介绍

1、PON介绍

PON(Passive Optical Network,无源光网络)。所谓无源光网络是指ODN(光配线网)不含有任何有源电子设备及器件,全部由Splitter(光分路器)等无源器件组成。PON是一种基于P2MP拓朴的技术,有ONU(Optical Network Unit,光网络单元)、OLT (Optical Line Terminal,光线路终端)、ODN(Optical Distribution Network,光分配网)等组成。

PON系统由于采用了WDM技术,因此实现了数据流信号在单根光纤上的双向传输。同时为了区分在同一根光纤上不同用户的上下行方向的数据流信号,其上行数据流信号采用TDMA(时分复用方式)技术传输;下行数据流信号采用广播技术传输。

2、贝尔7342 OLT设备

贝尔7342 OLT设备是基于ITU-T G.984的宽带光接入系统,可以为用户提供语音、数据和视频等多种接入服务。主要有AACU-C、ELT8-A、EXNT-A等板卡。

其中:

AACU-C(报警管理单元):每个OLT机框安装1块,具有基于机框的报警管理功能;

ELT8-A(PON板):每个OLT机框最多可安装14块,每1块LT上有8个SC/UPC连接器,用于PON光纤终接;

EXNT-A(主控板):每个OLT机框最多可安装2块,主备份使用。每块上有4个SC/UPC连接器,为千兆以太网的信号发送和接收提供接口。

贝尔7342 OLT设备的一些特点:

(1)丰富的多种业务接入能力:PON系统可提供数据、视频、语音等多种业务的接入能力,业务透明性强,真正实现了全业务接入与“三网融合”;

(2)强大的处理能力和高系统密度:可以提供4 PON/线卡,最大250Gb主控板和10Gb上联口;

(3)长距离接入:可以提供至少1.25Gb/s的带宽,光纤单纤接入距离可到20km;

(4)建设和维护成本低:PON设备相对简单,系统占用局端资源少,尤其是初期投入和维护投入都较低,但投资回报率高;

(5)可扩展性高:PON网络大多采用点到多点网络架构,这种扇形的网络架构既可节省光纤的资源,又能对这种共享带宽的网络架构提供非常灵活的带宽分配。当系统需要扩充时,所需改动的部分很少,方便今后扩容;

(6)较好的QoS保证机制:PON网络对各种业务的带宽分配和保证都有一套完整的保证体系。对于不同业务等级的服务质量、优先级保证等技术措施方面能提供多种应用的解决手段,实现用户级的SLA。因此,用户可根据接入设备的业务等级或重要性的不同,分别设置不同的服务等级。对重要的用户或重要的设备,设置灵活、实时、可靠的响应机制,从而实现了广泛的多业务、不同服务等级、不同服务质量的综合接入解决办法;

(7)极强的抗干扰能力:无源光网络由于用了光纤这种纯介质网络,避免了电磁和雷电干扰的影响,非常适合在自然条件恶劣的地区使用;

(8)根据需要只要更换部分硬件和软件就可提供EPON和GPON业务。

三、某块PON口板(ELT8-A板)下挂用户不能上网故障原因的分析及处理

某局7342 OLT第6槽位PON口板(ELT8-A板)下挂用户用户大面积故障,有部分用户正常。现场跟踪确认第6槽位上有好多用户都无法上网,检查OLT上都能学到用户的MAC,用户就是无法上网,重启PON板和更换PON板都无效,也没有发现“流氓”ONU。通过检查PON口流量,发现6-7 PON口流量有点异常,同时发现:

"EBRGPORT-1-1-6-7-14-0-463:MN,EXCEPTOVLD,SA,10-10,14-50-40,,,:

”Excessive number of exception packets received””告警

从告警信息分析初步判断故障原因为6-7PON口下挂的6-7-14这个ONU用户电脑中病毒或有环路,造成6槽下面的很多用户上网故障。打死这个ONU后,故障解除,业务恢复。

进一步分析确认:默认情况下,如果有用户中病毒发大量ARP报文,系统应该给告警提示的,但是没有任何动作。一块PON口板(ELT8-A板,即LT板)只有1个CPU,所有协议报文都会送到这个CPU进行处理,包括ARP报文,由于没打开上行协议报文限速,那么如果某个用户发起大量的ARP,超过了CPU处理的门限,CPU就会忙于处理这个用户的ARP,而无法处理其他用户的PPPOE、ARP、IGMP或者DHCP报文等,从而引起该LT板下的部分业务受影响。现场只是针对这个用户进行了简单粗暴的处理,后来通过在软件版本上增加支持了OBC defense这个功能,在配置EONT的时候打开VLANLIMITRATEMODE=ENABLED,系统会自动限速并打死这个用户,屏蔽环路ONU或者中毒电脑,并对其进行隔离,从根本上解决了该问题。

四、结束语

对于任何故障一定要现场跟踪检查,先通过一些简单手段的处理来恢复业务,然后进一步通过一些技术手段来处理及规避哪些意外障碍的发生,这样才能为运营商提供优质高效的服务。

作者简介:

凌玥(1995—),女,江苏无锡人,大学本科,现就读于南京邮电大学计算机专业,研究方向:计算机通信。