浅析ZXONE 8300典型故障的发生和处理

2012-04-29 13:54吴蕾
科技创新导报 2012年28期
关键词:误码网元单板

吴蕾

摘?要:本文主要阐述了中兴ZXONE 8300在日常维护中经常出现的故障以及障碍分析处理的常用方法,在交换、传输以及数据的本地网管系统的维护中,都需要熟练掌握ZXONE 8300的故障分析的技巧,以便能够更快、更准地找出故障,解决故障,提高ZXONE 8300的网络质量。

关键词:业务中断误码环回故障定位

中图分类号:TP273 文献标识码:A 文章编号:1674-098X(2012)10(a)-0119-01

1 下面介绍一下典型故障及分析

1.1 业务中断类故障

1.1.1故障现象

1)业务不通,同时网管上有告警报告(也有网管上没有告警报告的情况)。2)主光通道或监控通道不通。3)多波长或单波长业务不通。

1.1.2 故障原因

A、外部的原因:1)供电电源故障。2)光纤、光缆故障。3)接地异常。

B、操作不当:1)网元、网管数据配置错误。2)由于误操作,设置了单波得环回。3)由于误操作,更改、删除了配置数据。

C、设备对接问题:单板失效或性能劣化。

D、设备原因:单板故障或自然损坏。

1.1.3 业务中断故障的分析与处理

排除外部原因:首先检查设备供电电源,如设备掉电,则该网元在网管上变灰色,不可管理,该网元上的上、下游网元对应单板上报无光告警,同时出现多波长、主光通道业务中断。其次检查光纤连接,以确认光路连接正确且光板收发接口良好。检查网元的光功率,如果无光,或者光功率与正常值差异极大,证明线路有问题,调整光接口,再观察是否消失。另外还要检查业务电缆是否有虚焊、漏焊、接触不良现象,可以用OTDR(光时域反射仪)进行测试,来找出故障点,并进行相应的处理,如熔纤,观察告警是否消失。最后要检查设备接地,可能是DDF/ODF架没有接地或传输设备和交换设备之间没有共地,从而存在较大的压差,该原因可能导致业务中断,网管上查不出告警和性能。

检查网元配置数据:(1)检查单波是否做了软件或者硬件环回,如果存在环回,则需要解除相应环回,否则做了相应环回的单波业务都会中断。(2)检查网元配置的数据是否正确。(3)检查是否人为插入了告警,导致业务不通。

1.2 误码类故障

故障现象主要有:(1)ODU的输出光功率在短时间内有较大幅度的变化。(2)网管上有误码性能及越限告警

故障原因可能为:

A、可能存在的外部原因:(1)光纤插头不清洁。(2)光纤性能劣化,损耗过高。(3)设备接地不好。(4)设备附近有强烈干扰源。(5)设备散热不好,工作温度过高。(6)电源电压不稳、产生浪涌。(7)工作时间过长,灰尘太多。

B、设备对接问题(1)光纤插头连接不正确。(2)光转发类型单板、汇聚类型单板传输性能劣化。

C、设备原因1)光转发类型单板、汇聚类型单板故障或自然损坏。2)其他单板故障。

误码类故障的分析与处理过程:误码类故障通常情况下是由于光缆线路的盘放半径小于最小弯曲半径、光缆不清洁,使系统中存在较大反射所致。根据误码的大小和多少,造成的影响也不同。持续的大误码将可能导致业务中断,暂时的小误码导致业务受到损伤,但不会中断。可以采用观察分析法、仪表测试法、替换法进行处理。

排除外部原因:(1)首先检查线路收发光功率是否在指标范围内:光功率过高或过低,都会导致接收光模块接收光信号不正常,并同时引起误码。如果输入光功率不正常则调整衰耗器或清洁尾纤接头。(2)检查设备接地情况,可能是DDF/ODF架没有接地或传输设备和交换设备之间没有共地。(3)检查设备的时钟配置是否正确,时钟配置是否成环。(4)检查设备温度,排除由于机房环境、设备防尘网堵塞、风扇故障等原因导致的设备温度过高或过低。(5)检查设备附近是否有雷电、高压输电线、电源或其他电子设备带来的电磁干扰。

检查设备对接问题:按照尾纤上得标签检查尾纤是否插错,如果是连接错误,设备有可能不产生输入信号丢失告警,但将会产生大量的异常性能值。

检查设备硬件:(1)观察误码情况,若某站所有光转发类型单板、汇聚类型单板都有误码,可能是前面线路有问题或光放大类型单板、合分波类型单板存在问题。(2)若只有某块光转发类型单板上报误码,可能是前一级光转发类型单板、汇聚类型单板传输性能劣化导致。通过环回定位故障到发端单板或者收端单板,更换相应的单板。

2 故障处理原则

我们在处理设备故障时,应该遵循一“查看”、二“思考”、三“动手”的基本原则。所谓的“查看”是当维护人员发现障碍后,首先应该仔细检查设备的故障现象,包括:设备的故障点、告警原因、严重程度,有没有直接原因造成此故障,如停电、雷击等。只有全面了解设备的故障现象,才能透过现象看本质。“思考”是结合自己的知识进行分析,进行故障定位,判断故障点和故障原因。“动手”是指根据以上步骤找出故障点后,我们可以采取相应操作来排除故障,比如:修改数据、更换电路板等。

3 故障定位的原则

我们知道由于传输设备自身的特点——站点之间的距离较远,因此在进行故障定位时,最关键的一步就是将故障点准确定位,在将故障点准确定位后,就可以集中精力来排除该点的故障。

故障定位的一般原则是:(1)首先排除外部的可能因素,如光纤断、交换故障或电源问题等,再考虑传输设备的问题。(2)其次要尽可能准确定位产生问题的部位,再将故障定位到单板。(3)在分析告警是,应该先分析级别高的告警,再分析级别低的告警。

4 结语

在日常的设备维护工作中,有时候容易出现操作不当导致的故障。尤其在改网、扩容、升级时,会出现新老设备混用,新老版本不同而造成的错误操作。所以要求我们维护人员提高维护水平和维护经验,时刻保持清晰的头脑。同时,在日常维护中要善于总结,简化判断步骤,这样在维护的设备出现故障时,才能以最快、最短的时间找到故障原因并及时给予处理,尽可能地缩短障碍历时,提高工作效率。

猜你喜欢
误码网元单板
摄影作品
摄影作品
单板U型场地滑雪关键技术动作及训练方法
ZPW-2000A电码化轨道电路误码问题分析及解决方案
一种全网时钟同步管理方法
一种基于CAN总线的误码测试方法
单板层积材带来的内部生产模式
多支路两跳PF协作系统的误码性能
光网络设备ECC常见问题解决思路剖析
误码问题分析与处理