张琳 王艺旋
[摘 要] 针对电力通信系统广泛应用的光传输设备SDH的核心部件交叉单元,提出了交叉单元在渠首变此次故障的处理方案。本方案依着减少传输设备故障,保证业务正常传输的原则,对传输设备网管告警中具体的现象及处理进行了系统分析。
[关键词] SDH;交叉单元;告警
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 22. 031
[中图分类号] TM73 [文献标识码] A [文章编号] 1673 - 0194(2014)22- 0051- 02
0 引 言
目前光通讯在通讯方式中占据主导地位,也是电力通讯网的主要传输方式。电力系统通信网是我国专用通信网中规模较大、发展较为完善的专网。在工作中如何有效地做好光通讯设备的日常维护,确保其安全稳定地运行,是非常重要的。
在日常运行维护中南阳供电公司渠首变SDH光设备出现的交叉单元所发生的故障及处理分析过程,使更深刻了解了数字同步的重要性,同步是保证通信质量的关键因素,若失步就会出现业务质量受损甚至中断。本文对该故障进行了简单的归纳和总结。
1 故障现象
220kV渠首站省网光端机在前期正常运行中先是在早上8时在X1(HLXC384),X2(HLXC384),I7(MCS5)槽位出现BIT Slightly Degrade(BIT轻微劣化)告警,不到1分钟渠首变所有业务板卡出现BIT Failed(BIT失败)告警,相关光口DEG(信号劣化),2M业务端口LOS(信号丢失),业务中断。对端相应站相关光口7:57左右出现DEG(信号劣化),8:00左右出现LOF(帧丢失)告警。渠首变网元在8:06失连。在8:28左右,渠首变网元与网管通信恢复,相关中断业务也同时恢复,X2(HLXC384)出现BIT Failed(BIT失败)告警,根据BIT Code,该告警指示TMU DSP Failed。
如图1所示。
2 故障定位
板卡的故障类型一般分为硬件故障、软件故障和外围设备故障3类。现单板在位,但业务出现中断。外围设备光纤无中断电源也并无异常,业务配置在前期工作中正常运行。
该故障出现有以下特征或步骤:
(1)当该故障发生在时钟(TMU)主用的HLXC384上时,另一块备用HLXC384上会出现BIT Slightly Degrade(BIT轻微劣化),其他业务板卡则出现BIT Failed (BIT失败)告警,业务中断。
(2)随后当BIT Failed(TMU DSP Failed)出现在故障HLXC384上,时钟切换,业务恢复。
(3)当故障HLXC384被更换,所有告警消失。
通过综合分析这些告警,交叉单元在主板不能正常工作的情况下,”1+1”备用交叉板也没能及时切换至通道正常运行。可以将故障定位到交叉连接单元主用时钟(TMV)所在板卡(HLXC 384)故障。
3 故障分析
本次故障主要原因是随着通信网络规模的扩大,BITS设备的投运,BITS设备可以避免时钟劣化的现象,网元传输的误码率可以更好地控制,但是SDH网元仅仅只是时钟精度高是不够的,SDH网还要实现同步。
SDH设备由子架和功能单元组成。其中功能单元中的交叉连接单元由交叉板组成,设备支持交叉板“1+1”热保护,就是一台设备上同时插两块交叉板,一主一备。当主用交叉板故障后,备用交叉板立即启动代替主用板工作,信号失效时间小于50ms,从而达到不间断运行的目的。但是使用中往往只设置一个跟踪时钟。
故障是由于主用时钟(TMU)所在HLXC384板卡故障引起。由于XDM设备时钟单元在HLXC交叉连接卡上,无论外部时钟(External)、线路时钟(Line)或内部时钟(Internal)均是通过该时钟单元(TMU)给各业务板卡和通信板卡提供时钟,当这个时钟质量降低但又未达到切换条件时,导致各业务板卡上承载业务均出现信号质量严重下降,从而导致了中断。最后时钟单元因板卡故障最终不能工作时,出现BIT Failed引发时钟单元切换到备用板卡上的TMU,从而恢复了该网元的时钟,除故障HLXC外的各板卡随之工作正常。
4 故障处理
(1)确认各站HLXC板卡上时钟(Timing)已设置关联互为保护。
(2)在HLXC出现BIT Slightly Degrade告警时,有时可能因不是主用等原因暂未影响业务,也需及时处理。
(3)在HLXC同时出现BIT Slightly Degrade,其他各业务卡也出现BIT Failed时,需立即检查时钟所在HLXC,并从网管上冷复位该板卡,以使时钟和业务立即切换到备用HLXC的TMU上。
(4)处理结果是我班组人员进站更换故障板卡(X2 HLXC384)后恢复正常。
5 结 语
南阳地区省网光纤传输网络只有一套系统组成,所以SDH光设备的各个单元中“1+1”备用板的作用就尤为重要。另外在SDH设备中由不同的板卡相互配合而工作,任意一种板卡故障都有可能引起SDH系统故障,这些故障将影响本网元的所有业务。现电网通信业务中接入有稳控保护、差动保护、远动等各种业务,若业务接入的中断,会给电力系统造成损失,SDH中不间断运行为电网的安全可靠运行提供强有力的后盾,应引起我们足够的重视。