SDH网络通道误码故障分析

2019-11-23 08:01程涛
云南电力技术 2019年5期
关键词:误码网管时钟

程涛

(云南电力调度中心,昆明 650011)

0 前言

SDH 传输网络具有的多业务接入能力,较大的带宽,丰富的维护字节信息,良好的自愈能力,能够适配电网中诸如稳控、继保、自动化等各类生产实时业务可靠运行。一般的网络故障,通过SDH 的网管告警信息,可以快速定位故障并组织消缺。但是对于通道误码故障,往往需要对各种原因排除以及大量环回实验才能找到故障症结所在。通道误码类以故障位置处于传输设备的内外部进行分类,2M 板卡以外的部分称为传输外部故障,需要现场运维人员对可能造成误码的原因进行逐一排查;2M 板卡面向传输设备的方向称为传输内部故障,故障的定位需要网管侧值班人员通过一系列性能、告警观察以及环回实验来完成。

1 外部误码故障原因以及排查

1)2M 接头虚焊漏焊:此种故障经常伴随有网管业务上下侧设备T_los 告警或者业务使用侧的通道异常告警,是较为明显易判断的故障,找到业务对应的2M 端子,对2M 端子的熔接情况重新检查,如果肉眼无法分辨(虚焊),建议直接更换2M 头。

2)接地不好:此类故障可能没有网管告警信息显示,只能通过查端口性能事件查看端口违规编码性能事件。此时需要检查传输设备是否真正共地;柜电源上直流地(BGND)与保护地(PGND)是否接岔;各项接地电阻值是否能达到工程要求等、数字配线架未引入保护地(PGND)等方面查找问题。现场运行的变电站中,通信机房一般采用联合接地方式。如果在误码站点出现了未使用联合接地的方式,通过测试直流地(BGND)与保护工作地(PGND)之间电阻的方法就不可取了,因为设备不可能停电检测。此时唯有利用万用表测试业务侧与设备侧地电位差情况,来判断共地情况是否良好。如果共地情况良好,业务还是异常,只有排查接地方式是否达到规程要求采用联合接地方式,接地线规格采用大于35 mm²的导线,并就近接入环形接地母线,环形接地母线一般采用截面大于90 mm² 的铜牌或大于120 mm² 的镀锌扁钢。

3)2M 线缆问题:现网的运行的2M 业务中,通常都是75 Ω 的非平衡中继线缆,检查该线缆的问题需要从两方面重点排查:中继线路过长或者DDF 至业务使用部门之间使用了其他中继设备(协议转换器)引入误码;同轴线缆的屏蔽层接地不好。业务使用部门与通信机房有时候相隔较远,不可避免的需要延长2M 线缆或者添加中继设备,这会使得通道收到干扰的概率大大增加,接口波形出现失真从而误码。对于同轴线缆的接地好坏的判断,同样是参考上述共地良好情况的判断,如果线缆屏蔽层电压与保护地(PGND)之间电压若小于100 mv 表示屏蔽层接地情况较好。此时可断开业务端的2M 接头,判断业务侧与传输设备侧之间的2M屏蔽层之间是否有较大电位差(0.5 v),防止业务使用方与传输设备不共地,导致信号畸变而导致通道误码。

2 传输内部误码故障原因

2.1 线路经过光缆路径裂化,收光光功率过低

光口收光功率一直维护SDH 传输网核心参数,随着光缆运行年限的久远,纤芯质量下降不可避免,这也是电网一直安排的空余纤芯测试必要性的体现,任何时候都应该保证收光功率在光口的收光灵敏度范围内,同时需要留有3db 的富裕度。

2.2 光纤接头不清洁或尾纤本身老化

作为一个在故障排查中容易被忽视的常用器件,尾纤本身的质量以及清洁程度需要优先得到确认。

2.3 时钟同步网出现问题

时钟同步网做作为SDH 网络基础,需保证全网各个节点网元时钟同步。其中的主要原则为全网跟踪一个时钟源,对于单一节点需具备准备主备时钟跟踪链路。在单一链路故障情况下不应导致时钟源丢失或者时钟成环。一旦误码,时钟问题应当率先排除,逐步排查业务路径经过的各个节点时钟跟踪状态是否正常。

2.4 线路板或者交叉板故障

作为业务通道需经过的线路板与交叉板,一旦故障往往直观体现是承载通道质量下降。定位此类故障单板只能使用环回法逐段定位。

2.5 设备散热不良

如果是设备本身温度过高,通常都会利用自身的传感器上报告警,从而让网管感知到,此类故障大多数原因是机房环境不好,灰尘积累过多导致风扇转速下降,不能及时散热,设备温度升高,电子元器件工作出现异常导致误码。处理该类问题平时就得做好机房巡视工作,定期清洗防尘网,检测机房空调工况,一旦发现机房温度过高告警,不拖延,及时派人到现场处置。

2.6 设备的一些补偿装置

云南电力通信网由于存在一些长跨度(大于120 km)的通信站点,导致通信网络需要额外配置一些诸如光放之类的光路子系统,这些系统配置参数需要经过合理推算才能应用到实际网络。发生故障时,这些设备参数的配置合理性以及是否在正常运行都需要一一检测。对于10 G 光路,发端光功率过大引发非线性效应,色散补偿欠补、过补都是通道误码的罪魁祸首。

3 故障的定位处理

首先是通信调度员接收业务部门申告,220 kV 版木线主一保护通道1、主二保护通道1 通道异常。

接下来查看省级传输B 网网管U2000 查看该通道的告警情况,通道告警状态显示无异常。通道无告警情况业务部门反馈通道质量不好,需要查看通道性能事件。生产实时类业务对通道状况比较敏感,少量的误码事件也许达不到上报告警的门限,但是对于继电保护业务已不可接受。

图1 通道误码性能情况

可以看到两条通道低阶通道的远端背景块误码、误远端误码秒等少量性能事件。由此故障定位的方向已确认为整个传输内部通道出现问题,需要使用环回法对故障进行精准定位。

图2 通道路由图

通过网管系统与资源系统查询可知该条电路由省干网与地区网对接电路组成。

步骤1:在省干网版纳变侧故障的通道打开伪随机码测试。之所以采用伪随机码测试,可以免除现场运维人员携带2M 测试仪至现场后才能开展故障定位。

步骤2:之后便是利用环回法对通道进行测试,观测伪随机码的接收情况。

图3 通道环回位置设置图

如图3 所示,业务从版纳侧出发,通道可以从整个省干传输网被环回且性能正常。那么省干网的问题已基本排除。环回范围需要继续扩大,因地区网设备采用的是ECI 设备,并不支持从完整电路任意部分作环,所以只能将整条完整电路改接至环回点落地,通过设置2M端口的环回以实现对环回点的任意设置。

图4 电路改接后环回位置设置图

本案例中故障节点刚好处于地区网与省干网对接部分,当设置为地区网思茅变环向版纳变时,通道即出现了误码状况。这时检查再查看光板的对接性能状况。

图5 省干网与地区网对接光口性能

可以看出地区网思茅变ECI 光设备接收端出现了复用段误码性能事件。至此故障位置已经锁定于思茅变站内的地区网设备接收端或者是省干网设备的发送端。普洱局通信人员可以不用到木乃河变以及版纳变的情况下直奔思茅变作光口本地光口环回实验作进一步精确定位。通过现场实验发现,思茅变地区网设备在自环情况下均有误码,故障点锁定为思茅变地区网光模块故障,现场更换光模块后,本次故障消除。

4 结束语

误码是SDH 传输网络常见并较难排除的一类故障。遇到故障时首先需要对类别进行区分。对于传输系统外部故障,需要重点检查信号的接地问题,以及现场施工工艺质量,而对于传输内部的问题,则需要综合的运用告警、性能观察法,环回法对故障点进行精准定位。不同传输设备的厂家对于环回的支持功能不尽相同,但都可以通过改接电路落地点方式达到选择任意范围环回的目的。本文仅仅是通过云南省干传输网中出现的故障案列,对综合运用上述方法处置通道误码提出一些较快定位故障点思路,以供各位通信运维人员借鉴。

猜你喜欢
误码网管时钟
别样的“时钟”
古代的时钟
ZPW-2000A电码化轨道电路误码问题分析及解决方案
一种基于CAN总线的误码测试方法
给水网管的优化布置研究
有趣的时钟
时钟会开“花”
昭通市全覆盖数字电视直放站综合网管系统建设技术方案
“五制配套”加强网管
潘小芳(太原铁路局太原通信段网管中心,太原 030012)