SDH光传输系统典型故障分析及处理方法

2015-05-30 03:17王静怡
中国新通信 2015年21期
关键词:故障处理

王静怡

【摘要】 文章归纳并论述SDH传输系统故障排查的原则、方法和处理步骤;通过专网故障处理的实例,分析论述处理业务中断和误码两大类故障的排查过程,重点分析不同方法在故障排查工作中的灵活及其效果。

【关键词】 光传榆 故障处理 SDH

光通信是目前电力通信网的主要传输方式,而SDH作为一种结合了大容量光纤传输技术的体制,因其成熟的体系和较高的容量已在电力系统专网汇聚层、接入层中得到广泛应用。SDH承载了大部分办公自动化、生产、管理业务,既能满足电力系统专网专用、分区隔离的要求,又具有较高的可靠性和实时性,很好的满足了电力系统通信的要求。庞大的SDH网络对维护人员的日常维护效率,特别是发生故障时的快速排查及抢修能力提出了较高的要求。本文根据理论和经验,归纳并论述SDH传输系统故障排查的原则、方法和步骤,旨在为设备维护提供参考,为故障处理提供合理思路。

一、故障处理前的準备

SDH系统故障处理主要是对光线路和设备的检查及操作,运行维护人员必须熟知系统的各方面情况才能做好故障处理工作,具体如下:

1、熟悉SDH原理知识,了解传输系统告警信号流及告警产生机理。

2、熟悉所维护系统的管理和运行状况。主要是设备和网管的操作,能够迅速做好故障现场数据的采集与保存;同时熟悉设备配置情况、机盘功能、接口情况、面板上各种告警灯和指示灯的显示情况。

3、熟悉工程组网信息,包括网络拓扑、业务配置、设备运行状态,以及相应工程文档的存放位置,能够迅速做好故障现场数据的采集与保存。

4、熟悉常用仪表、工具的基本操作。SDH光传输系统常用仪表有:光功率计,光时域反射仪(OTDR),误码仪,2M话路分析仪等。

二、故障定位的基本思路和方法

2.1故障定位的原则

故障定位的关键思路是:将故障点准确定位到单站。

定位的基本原则可以概括为:先外部,后传输;先单站,后单板;先线路,后支路;先高级,后低级。

1)先外部,后传输。在定位故障时,应首先排除外部的可能因素。首先判断是传输问题还是其它设备故障问题。首先排除光纤故障、中继线路、供电电源,接地等故障问题。

2)先单站,后单板。在定位故障时,首先要尽可能准确地定位出是哪个站,然后再定位出是该站的哪块板。

3)先线路,后支路。线路板的故障常常会引起支路板的异常告警,因此在进行故障定位时,应遵循“先线路,后支路”的原则。

4)先高级,后低级。即进行告警级别分析,首先处理高级别的告警,如危急告警、主要告警,这些告警已经严重影响通信,所以必须马上处理;然后再处理低级别的告警,如次要告警和提示告警。

2.2故障定位及排除的常用方法

故障定位的常用方法和一般步骤可简单地总结为:“一分析,二环回,三换板”。

2.2.1告警性能分析法

告警性能分析法是通过网管获取告警和性能信息,进行故障定位的方法。可以全面、详实地了解全网设备的当前或历史告警信息,获取设备性能事件的具体数值。例如:由A、B站构成的网路,当A站点出现MS_RDI、HP_RDI、LP_RDI,而B站点出现R_LOS、TU_AIS告警时,基本可以确定R_LOS告警为根源告警,即A到B传输方向光路故障。

也可以通过查看通过设备告警指示灯和单板指示灯获取告警信息。但设备指示灯仅反映设备当前的运行状态,对于过往故障无法表示,且只能反映告警级别,不能准确告知具体告警,具有较大的局限性。

2.2.2环回法

环回法是SDH传输设备定位故障最常用的方法。环回有多种方式,如内环回与外环回,软件环回与硬件环回,线路环回与支路环回等。进行环回操作时,首先应进行环回业务通道采样,即从多个有故障的站点中选择其中的1个站点,从所选站点的多个有问题的业务通道中选择其中的1个业务通道;然后画出所采样业务的1个方向的路径图,图中要标出该业务的源和宿及所经过的站点、所占用的VC4通道和时隙等(如图1所示);最后逐段环回,定位故障站点及单板。采样业务方向路径图如图1所示,可以在依据中断业务的路径图,在3号站第2块支路板的第1个2M通道外接一个2M误码仪,监测业务好坏。

2.2.3替换法

替换法就是使用一个工作正常的物件去替换一个疑似工作不正常的物件,从而达到定位故障、排除故障的目的。可替换物件包括电缆、光纤、法兰盘、电源、单板、设备等。替换法适用于排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等;或故障定位到单站后,用于排除单站内单板或模块的问题。

2.2.4配置数据分析法

查询、分析设备当前的配置数据。例如:时隙配置、复用段的节点参数、线路板和支路板通道的环回设置、支路通道保护属性等。分析以上的配置数据是否正常来定位故障,若配置的数据有错误,需进行重新配置。

该方法主要适用于将故障定位到单站后,进一步定位故障。一些典型的配置错误导致的故障包括:J1字节设置错误导致HP_TIM告警;C2字节配置错误导致HP_SLM告警;业务配置错误导致TU_AIS/AU_AIS告警;TPS参数配置错误导致TPS倒换失败;MSP节点参数设置错误导致MSP环倒换失败;SNCP参数配置错误导致倒换失败等。

更改配置法适用于有空余时隙、通道、或槽位或一个VC4中的部分业务时隙中断情况。具体方法包括:在时钟告警、指针调整时,更改时钟配置;怀疑单板或母版故障时,更改板位配置;更改时隙配置;以及在以太网和对接故障时,更改单板参数配置。

2.2.5仪表测试法

仪表测试法指采用各种仪表,如误码仪、光功率计、光时域反射仪、SDH分析仪等来检查传输故障。例如:用2M误码仪测试业务通断、误码;用万用表测试供电电压,检查电压过高或过低问题。用光时域反射仪针对R_LOS、R_LOF告警,排查光纤通断或光板故障问题。一般适用于排查传输设备外部问题、设备对接问题或设备性能指标问题。

2.2.6经验处理法

在一些特殊的情况下通过复位单板、单站的掉电重启、重新下发配置等手段可有效及时的排除故障、恢复业务。但建议此方法应尽量少用,因其不利于故障原因的彻底清查。遇到这种情况,除非情况紧急,一般还应尽量使用前述方法,或请求支援,尽可能地将故障定位出来,以消除设备内外隐患。

三、故障处理案例分析

3.1业务中断类故障

对业务中断类故障,首先分析外部原因,典型的检查次序是:供电电源、接地、环境异常、光纤或电缆故障。其次分析人为原因,如误操作设置了光路或支路通道的环回,误操作更改、删除配置数据,设置业务未装载等。也可能是设备本身故障,如单板失效或性能不好。

定位方法可以采用告警分析法、逐段环回法、替换法和更改配置法。定位的步骤可具体为:检查各站登录是否正常,检查有无设备告警;检查保护倒换是否正常;分析故障,即通过环回或更改配置定位到单站;将故障进一步定位到设备板卡并解决。下面就常用复用段保护环为例,阐述故障排查的方法和步骤。

图2是容量为STM-4的双纤双向共享复用段保护环(MSP环),其中网元1为中心节点,各站均有到网元1的业务,其它各点之间没有业务。逆时针(东发西收)方向为工作环,第1、3VC4为工作或保护时隙,第2、4VC4为空闲时隙。故障现象为:网元2与网元3间断纤,上报R_LOS告警,网元1和网元3之间E1业务中断,均上报TU_AIS,其它业务正常。

本案例中,根据故障情况进行分析,首先应排除因线路自动保护倒换(APS)啟动不成功所造成的业务不通的情况。查询告警并检查倒换状态,若系统未进行自动线路倒换,应检查APS协议是否启动,必要时重新配置并下发MSP参数,并重新启动APS协议,直到线路保护倒换成功执行。

在保护倒换执行的情况下,仍存在E1业务中断,则应首先画出倒换后的信号流,并采用“逐段环回”或“更改配置法”将故障定位到单站。案例中倒换后的业务信号路径可用图3表示。

明确了信号流向,可以综合应用告警分析法和逐段环回法将故障定位到单站。本例中的分析定位可用图4所示流程图表示。

定位过程中,也可以采用“更改配置法”,这里以“配置单向广播业务”为例,从网元1开始,分别配置指向网元1、2、3、4指定时隙的广播业务,使得该广播业务能够遍历网元1至4的相关支路板、交叉板和线路板,根据每个网元的业务接收情况来判断故障点的位置。

将故障定位到单站后,可使用“替换法”分析定位具体的故障板块,分析定位过程可用图5所示流程图表示。

3.2误码类故障

造成误码类故障的原因一般分为外部原因(如光功率问题、接地故障、环境温度、电缆故障、设备外部干扰(瞬时大误码))、人为原因(如时钟配置错误),或设备本身故障(交叉板、时钟板、线路板或支路板单板失效或性能不好)。处理方法也可以综合应用告警性能分析法、更改配置法、逐段环回法和替换法。

下面就无保护链为例,阐述故障排查的方法和步骤。图6中网元1为中心节点,其他点均与网元1有业务,各其它各点间没有业务。网元3东向有大量RSBBE、MSBBE、HPBBE告警,网元4西向有MSFEBBE、HPFEBBE、LPFEBBE,网元1有LPBBE告警。

本案例中,在排除了外部故障(如电磁、温度)等的干扰后,可结合各网元故障告警进行分析:由网元1、4和网元3、4之间出现的误码告警及对端告警可知LPBBE为网元1收网元4的低阶误码;而RSBBE、MSBBE、HPBBE为网元4到网元3的光路误码(高阶误码)。

从而,低阶误码是由网元3、4间的高阶误码所造成,因此,故障应在网元3、4之间,可综合应用告警性能分析、环回和替换法进行故障定位,分析过程如图7所示。

四、小结

本文从SDH光传输的故障处理原则、主要处理方法、处理步骤思路几个方面,总结归纳了SDH传输系统的故障处理经验。同时通过实例,重点阐述了业务中断类和误码类故障的处理思路和步骤,为传输系统的日常维护和故障处理提供了参考。光传输系统是通信网的重要组成部分,传输质量的好坏直接制约着通信网的服务质量。

作为SDH系统维护工作者,应充分了解故障处理的基本原则,灵活掌握并综合应用各种常用方法,并明确典型故障的处理思路和步骤,才能够有效进行运维管理和故障排查,为信息业务提供良好的数据传输平台。

参 考 文 献

[1] 周晓民,王永平,靳秀峥,等.SDH 光传输系统培训手册[M].深圳:华为技术有限公司编辑出版中心.1999:1-4.

[2] 肖萍萍,等.SDH 原理与技术[M].北京:北京邮电大学出版社,2002:10-12.

[3]曾甫全,李勇,王河.光同步传输网技术[M].北京:北京邮电大学出版杜,1996;18-38.

[4]邓忠札,赵晖,等.光同步数字传输系统测试[M].北京:北京人民邮电出版社,2001:52-54.

[5] 李丽君.光纤通信[M].北京:北京大学出版社,2010:78— 18O.

[6] 杜继红.SDH 系统常见故障处理及其维护方法[j].电力学报,2007,(2),1-3.

猜你喜欢
故障处理
试析汽轮机检修中油系统的常见故障及处理方法
智能阀门定位器的工作原理及故障处理
变电运行故障处理维护技术解析
高校网络维护与故障处理探析
电力变压器高压试验技术及故障处理
钢铁冶炼机械设备的故障诊断及处理分析
大型化工装置仪表自控系统的故障处理研究
基于计算机网络故障处理及网络维护方法研究