广电系统SDH传输网络故障的分析与处理

2012-03-15 01:30
电视技术 2012年16期
关键词:余杭网元光盘

李 芳

(杭州市广播电视科学技术研究所,浙江 杭州 310008)

1 同步数字传输系列(SDH)概述

高度发展的信息社会促进有线电视向数字化、综合化和智能化方向发展,通过广播电视网络向用户提供广播电视及多种多样业务。同步数字传输系列(SDH)传输体制是从准同步系列(PDH)发展进化来的,具有PDH的优点。SDH规范了数字信号的帧结构、复用方式、传输速率等级、接口码型等,融光纤技术、线路传输、交换功能于一体,SDH具有协调一致的管理、操作和业务灵活调度。凭借传输信息量大、网络利用率高、抗干扰考辐射强、自愈保护性好等优势,SDH传输网在国家、省市级骨干网中得到广泛应用。

SDH设备作为广播电视传输网的重要组成部分,SDH传输系统的日常维护工作直接影响着广播电视网的安全运行。特别是SDH骨干网的光链路的安全,不仅影响整个SDH传输网的保护机制,也影响着传输业务的性能指标,需要引起技术运维人员的特别重视。

2 常见故障分类

SDH光通信以光波为载体,以光导纤维为传输媒质,因此,光链路安全对SDH网络安全意义重大。导致SDH光同步数字传输设备光链路出现故障的原因很多,按故障的来源大体可分为以下6类常见故障[1]:

1)光缆尾纤故障。包括光缆尾纤中断、光缆线路总衰耗过大;尾纤弯曲半径过小,法兰盘接头有灰尘及尾纤头脏、光纤配线架法兰接触不良等。

2)单板故障。包括光线路板、时钟板、交叉板、主控板、电源板等器件损坏及因环境、温湿度等影响机盘正常工作等情况。

3)电源系统故障。包括交流停电、蓄电池放不出电、设备直流掉电及熔断器故障等,电压不稳造成光线路板损坏。

4)电缆故障。包括45 Mbit/s中继电缆中断,数据配线架侧45 Mbit/s输入/输出端口脱落或接触不良等。

5)网管系统故障。包括网管与设备之间的通信故障或系统异常而造成DCC通道中断,死机、网元失联等。

6)操作不规范故障。工程人员对网络拓扑、光链路走向、设备性能不熟悉,冒然开通或跳光纤;对端光盘未卸下尾纤,冒然使用光时域测试仪,造成对端光盘损坏等。

由此看来,以光路故障对SDH承载业务的影响最大,本文着重分析光链路故障及相应的处理方法。

3 故障判断的基本思路和方法

3.1 故障定位的关键

故障定位的关键是将故障点准确定位到单站、机盘。SDH通信系统的特点是:一条通道中出现任何一个“故障源”,在下游各站设备上都会出现告警指示。因此设备发生告警只是一个现象,处理之前首先要对告警性质进行分析,然后再定性处理。故障处理时需要全线协调配合工作,盲目从事会造成错误判断,影响故障的及时处理。因此故障定位的关键在于将故障点准确定位到单站、单板。

3.2 故障定位的基本原则[2]

1)先外部,后传输。在定位故障时,应先排除外部的可能因素,如光纤断、电缆或电源问题。

2)先单站,后机盘。在定位故障时,要尽可能准确地将故障定位到单站。

3)先线路,后支路。光群路盘的故障常常会引起支路盘的异常告警。

4)先高级,后低级。在分析告警时,应首先分析告警级别高的告警,再分析级别低的告警。

3.3 故障定位的常用方法

故障定位的常用方法有:一分析;二环回;三换盘。1)发生故障时,首先通过对告警事件、性能事件、业务流向的分析,初步判断故障点范围;

2)通过逐段环回,排除外部故障,最终将故障点定位到单张,乃至单盘;

3)通过换盘,排除故障点(故障盘寄回厂家修理)。

3.4 故障处理的常用方法[3]

SDH设备故障定位和处理的常用方法有:1)网管告警信息分析法;2)环回法;3)替换法;4)更换配置法;5)仪表测试法;6)经验处理法。

4 故障的告警分析

杭州阿尔卡特SDH传输网,由杭州、余杭、临安、淳安、建德、桐庐、富阳、萧山等网元组成,均采用复用段保护方式,分别向杭州地区的二五区县传输数字电视和模拟电视业务(见图1)。其中,数字电视传输网由阿尔卡特1660SM设备构成,模拟电视传输网由阿尔卡特1664SM设备构成。根据对阿尔卡特SDH传输设备的运维经验,对常见的光链路告警分析总结如下。

阿尔卡特1660SM设备的告警级别分为:严重告警(CRITICAL红色)、主要告警(MAJOR橙色)、次要告警(MINOR黄色)、提示告警(WARING蓝色)和已消失的告警(CLEARED绿色)等。

光路板的端口主要由SPI(SDH物理接口)、RST(再生段终端)、MST(复用段终端)、MSP(复用段保护)等几部分组成(见图2)。

4.1 SDH物理接口(SPI)常见告警

1)LOS:Los Of Signal,信号丢失。

2)LOF:Loss Of Frame,帧丢失;连续4帧不能正确接收到帧定位信号,则会产生OOF帧失步告警,当连续3 ms出现OOF时,会发出LOF帧丢失告警。

3)URU:Underling Resource Unavailable,在板卡上检测到设备失效。4)TD:Transmitter Degrade,发送端劣化。5)TF:Transmitter Failure,发送端失效。

4.2 再生段终端(RST)常见告警

1)URU:Underling Resource Unavailable,在板卡上检测到设备失效。

2)RS-TIM:再生段踪迹标识J0字节失配。

3)CSF:Communication Subsystem Fail,通信子系统故障。

4)PM-AS:Performance Monitoring Alarm Synthesis,性能监视综合告警。

4.3 复用段终端(MST)常见告警

1)DS:Degraded Signal,被降级的信号(BER>1.00×10-6)。

2)RDI:Remote Defect Indication,远端缺陷指示(相当于FERF)。

3)EBEF:Excessive BER,误码率越限(BER>1.00×10-3)。

4)AIS:Alarm Indication Signal告警指示信号。

5)CSF:Communication Subsystem Fail,通信子系统故障。

6)CPE:Communication Protocol Error,通信协议故障。

7)PM-AS:Performance Monitoring Alarm Synthesis,性能监视综合告警。

4.4 其他常见告警

1)LOP:Loss Of Pointer,指针丢失。

2)LAPD:Link Access Protocol on D channel,通信协议故障。

4)DRIFT:频偏,时钟故障。

5)FF:Fuse Failure,电源故障。

6)RI:Resource Isolation,设备与网管失联。

5 SDH层次结构特点

判断故障,需要根据SDH的层次结构特点来分析。

1)首先判断故障属于物理层、再生段、复用段还是通道层。然后根据各通道层在系统中的对应位置或作用,定位到单盘。

2)根据路由和时隙查找故障点,分析交叉的时隙规则,查看故障是否发生在整个东向、西向,还是某个业务板、接口板,或者是某个VC12,VC3,VC4时隙。

3)物理层、再生段、复用段、通道层的故障及机性能之间的相互影响关系如图3所示。其中通道又分为高阶通道和低价通道。高阶通道为155 Mbit/s以上速率,如155 Mbit/s,622 Mbit/s等,低阶通道为155 Mbit/s以下速率,如2 Mbit/s,34 Mbit/s,45 Mbit/s等。

6 复用段倒换机理

从图1可以看出,采用杭州广播电视传输网,是一个中心站(杭州)向环上其余站点发送广播业务。典型的单环拓扑结构SDH传输网络,适合采用复用段保护方式。复用段倒换就是以复用段为基础的,(STM-N)/2作为主用工作信道,(STM-N)/2作为备用保护信道。倒换与否根据环上传输的复用段信号的质量决定的,倒换是由K1K2字节做携带的APS协议来启动,当复用段出现问题时,工作信道上的业务都切换到备用信道上。因此,当光纤中断了,该复用段跟着也就断了,导致复用段保护倒换。有时光缆没有中断,出现误码过大、帧丢失、信号劣化等条件也会导致复用段保护倒换。

所以,SDH光路上出现以下4种告警会导致复用段倒换,要特别注意:1)Loss Of Signal,信号丢失;2)Excessive BER,误码越限;3)Loss Of Frame,帧丢失;4)Degraded Signal,信号劣化。复用段保护在发生光缆中断、光缆割接、光盘故障、监控盘故障等故障时,自动发生复用段倒换,以保护SDH传输的业务不中断。

7 故障案例

根据运维实际工作中遇到的典型故障,利用故障判断的基本方法进行告警分析,故障定位及处理。

7.1 双光纤同时中断或出现故障

故障描述:某日,本端A网元的西向光盘上报“LOS”,“CSF”告警,远端B网元的东向光盘上报“LOS”,“CSF”告警,发生复用段倒换(见图4)。

告警分析:双光纤故障问题是SDH的最常见故障。应从告警分析入手,关键是判断故障点在A网元或在B网元,还是在光缆上。

具体分析如下:

1)“LOS”无光告警。当A网元光盘收不到光功率时,或者接收光功率过大或过小,超出过载点或小于接收灵敏度,出现无光告警。同理B网元光盘收不到光功率时,也会上报“LOS”无光告警。

2)“CSF”通信子系统故障。因为光缆中断会造成本地A网元和远端B网元之间的通信故障,A,B网元同时上报“CSF”告警。

原因分析:发生光链路双向故障,主要原因有:1)由于光缆或尾纤同时中断2根;2)发送端发送激光器故障;3)接收端接收光模块故障;4)接收端接收光功率过大或过小,超出收光模块指标范围;5)活动连接器接触不良或法兰盘损坏。

处理方法:1)最好先用光功率计测试测量接收端的接收光功率,如在ODF架上,或者直接在光板上测试接收光功率,如果测不到光功率,则可能是光纤断了,或对端发送光功率有问题。用这个办法来查找出现告警的故障点是光纤断了,还是对端光发送不好,或者光接头脏了还是本端的故障。2)如果没有光功率计,可以用短路光纤在ODF架或者在光盘上做收发环回,用此方法来判断故障是光纤断了还是光盘故障。3)通过光时域分析仪检查光缆的断处。然后根据实际情况进行处理,排除故障。

处理结果:排查后确定是过路车辆挂断SDH骨干网光缆,经工程队抢修后,恢复正常。

7.2 单光纤中断或出现故障

故障描述:A网元的西向光盘上报“LOS”,“EFER”,“DS”,“LOF”,“AIS”,“CSF”告警,B网元的东向光盘上报“FERF”,“RDI”,“CSF”告警,发生复用段倒换(见图5)。

告警分析:单光纤故障问题是常见故障。应从告警分析入手,关键是判断故障点在A网元还是在B网元,或者在光缆上。

具体分析如下:

接收端A:1)“AIS”指示告警,全1,即A网元收不到B网元过来的信号;2)“EBEF”误码超出门限值(BER>1.00×10-3),即B点发信号太弱,或者光路衰减太厉害,造成A点接收端光信号误码越限;3)“DS”信号劣化信(BER>1.00×10-6),即B点发信号太弱,或者光路衰减太厉害,造成A点接收端光信号劣化;4)“LOF”当A点连续4帧不能正确接收到帧定位信号,会产生R-OOF帧失步告警,当连续3 ms出现R-OOF时,会发出R-LOF(再生段-帧丢失)告警;5)“LOS”无光告警。当A点收不到光功率,或者接收光功率过大或过小,超出过载点或小于接收灵敏度,将出现无光告警。

发送端B:“FERF”,即A网元没有收到B网元过来的信号,A网元上报“AIS”后,A网元给B网元一个信息“FERF”,通知B网元。B网元上报“FERF”远端接收失效(或者“RDI”远端缺陷指示)告警。

另外,由于网管与网元之间通信,是通过光纤传输的,只要A,B之间的光纤中断,不管是中断1根还是2根,都会造成本端网元和远端网元的通信故障,上报“CSF”(通信子系统故障)。

故障原因:发生光链路单向故障,主要原因有:1)光缆或尾纤只断1根;2)B端发送激光器故障;3)A端接收光模块故障;4)B端接收光功率过大或过小,超出收光模块指标范围;5)活动连接器接触不良或法兰盘损坏。因为单光纤中断会造成单端网元的通信中断、获取的线路时钟源中断,因此当出现光线路上“LOS”时,通信协议跟着出错,上报“CSF”告警。

处理方法:1)单光纤故障问题和双光纤故障一样,最好先用光功率计测试测量本端网元A的接收光功率;2)通过短路光纤在ODF架或者在光盘上做收发环回,来判断故障是光纤断了还是光盘故障。3)通过光时域分析仪检查光缆的断处。然后根据实际情况进行处理,排除故障。

处理结果:排查后确定是接收端A的法兰有故障,更换后,告警消失。

7.3 光纤跳错,造成数字电视无信号,模拟电视有信号

故障描述:某日,发现模拟电视传输网:余杭1664SM/17#光盘上报“LOS”告警,杭州1664SM/18#光盘上报“LOS”绿色,“LOF”橙色告警。模拟电视7个区县均有信号。数字电视传输网:余杭1660SM/28#光盘上报“LOS”告警,杭州1660SM/25#光盘正常,上报告警。数字电视7个区县业务全部中断,复用段保护没有倒换。

故障排查:SDH传输工程师、区县前端技术人员及工程施工人员一起排查。

模拟电视SDH设备:1)杭州1664SM/18#光盘用光功率计,测收、发余杭方向的光功率均正常;2)用OTDR检查,杭州至余杭的光路,收发两纤均为35 km,也正常;3)到余杭站点,将余杭1660SM的杭州方向的2根尾纤都拔去,在杭州网元对应光盘上仍然能收到光功率为正常范围。

数字电视SDH设备:1)杭州发、余杭收,上报“LOS”,拔去杭州光盘上的TX尾纤后,告警没有变化,复用段也没有倒换,说明这根纤有问题;2)余杭发、杭州收,无报警,拔去杭州光盘上的RX尾纤,余杭上报“LOS”,复用段发生倒换,说明这根纤是正常的;3)用OTDR检查,杭州至余杭的光路,拔去余杭的尾纤,发现出现“busy”打不出曲线,说明对端有光发过来,有其他光信号存在。

故障原因:施工队光缆割接施工时,误将数字电视、模拟电视、数据宽带3种不同设备的光纤混淆,造成业务中断。

为什么利用相同路由光缆承载的数字电视业务出现中断,而模拟电视业务没有中断呢?原来是SDH网络配置的方向不同,模拟电视主路信号是从杭州到萧山,最后一站到余杭,不用再往下传了。所以当余杭和杭州之间光缆出错时,复用段不倒换,也不影响其他区县的模拟电视业务。数字电视主路是从杭州到余杭,最后一站是萧山。所以当余杭和杭州之间光缆出错时,复用段不倒换,就造成了其他所有区县的数字电视信号中断。

故障处理:到余杭站点,用1 550 nm光发机发射光功率,在杭州中心机房用光功率计测收到的光功率。一根一根地对光纤,待全部光纤对上号以后,将正确的尾纤接入相应SDH设备光盘,故障排除。

8 结束语

SDH传输技术在广播电视传输系统得到广泛应用。SDH光传输系统的复杂性,提高了设备运维人员的工作要求,增加了故障处理难度。运维工程师需要熟悉SDH基本原理,了解SDH的常用开销字节、告警、帧结构、逻辑功能块、单板硬件等,熟悉SDH的组网拓扑、保护属性、业务分配、运行状态,同时需要有严谨的工作态度和高度的责任心,做好现场数据采集,熟悉故障定位原则和处理方法,才能快速有效地排除SDH故障。随着广播电视数字化、网络化的发展,做好SDH传输系统的技术保障,必将有力推动广播电视事业的迅速发展。

[1]代红.浅谈SDH系统常见故障处理及维护方法[J].内蒙古科技与经济,2007(8):297-298.

[2]王朋.SDH传输设备的维护和故障定位分析[J].中国有线电视,2006(2):196.

[3]吕习良.SDH传输故障处理分析[J].通信世界,2008(9):B25-B26.

猜你喜欢
余杭网元光盘
“你好亚运!余杭@未来”
光盘行动
杭州余杭 “三位一体”推进殡葬改革
一种全网时钟同步管理方法
《杭州余杭径山》《晨曲》
光盘小熊
电子商务网上法庭运行的实践与思考——以余杭法院为样本
Java EE平台在综合网元管理系统中的应用研究
S1字节和SDH网络时钟保护倒换原理
光盘光荣