王 萍(长江海事局信息中心,湖北 武汉 430014)
浅谈SDH传输系统在专网通信中的维护管理*
王 萍
(长江海事局信息中心,湖北 武汉 430014)
文章从长江通信专网SDH系统维护人员的角度出发,分析当前SDH系统在通信专网中所发挥的作用及其日常维护中应具备的维护知识。根据专网中的各种故障现象,析论维护人员处理光传输系统故障时的原则方法、基本手段及注意事项;通过专网故障处理的实例,阐述故障处理原则、网管功能在维护工作中灵活运用所产生的效果。
光传输;故障处理;SDH
现代通信网正向数字化、综合化、智能化和个人化方向发展,大容量的传输光纤网络的建立,为信息高速公路提供了长足发展的空间,频带的不断扩宽,如同不断扩展的能容纳大量车流的高速公路。SDH(Synchronous Digital Hierarchy,同步传输体系)[1]正是在传输网技术大发展这一背景下诞生的光传输体系,它弥补了PDH(Plesiochronous Digital Hierarchy,准同步数字体系)在复用的方式不能满足信号大容量传输要求的缺陷,并制定了接口规范,从而为多种网络的互连创造了便利。
目前,SDH技术因其成熟的体系和较高的容量已在各大专网系统的汇聚层、接入层中被广泛采用。庞大的SDH网络,对维护管理的效率和维护人员的业务水平提出了较高的要求。本文将从SDH概念出发,根据理论和经验,归纳并论述在SDH运行维护中应遵循的原则和判断故障的手段,旨在为设备维护提供参考、为故障处理提供合理思路。
SDH的概念源自美国的贝尔实验室,这是在80年代初为解决标准光接口问题而提出的,随后不断的发展显示出这一概念的潜在革新作用。
SDH体制有一套标准的信息结构等级,即有一套标准的速率等级。基本的信号传输结构等级是同步传输模块STM-1,相应的速率是155Mbit/s,它是一种标准化的信息结构等级,由净负荷、指针和段开销(含再生段和复用段开销)构成,重复周期为125微秒,即每秒传送8000 帧[2]。开销内的字节用于传送SDH网络中的控制与维护信息,包括帧定位字节、比特间插奇偶校验字节、DCC数据通信通道、K1/K2自动保护倒换通道等;高等级的数字信号系列,例如622Mbit/s(STM-4)、2.5Gbit/s(STM-16)等可通过将低速率等级的信息模块例如STM-1用字节间插同步复用而成,复用的个数是4的倍数。由于采用了同步复用方式和灵活的映射结构, SDH系统可将PDH低速支路信号复用进SDH信号的帧中,在将低速支路信号复用成STM-N信号时,一般要经过3个步骤:映射、定位、复用[3][4]。
所谓映射,就是使各种支路信号在SDH网边界与虚容器(Virtual Container,简称VC)适配的过程,其实质是使各种支路信号与相应的虚容器容量同步,以便使虚容器成为可以独立地进行传送、复用和交叉连接的实体。映射的方式包括异步映射、字节同步映射、比特同步映射。SDH将目前PDH体系的各种数字信号以及ATM信元映射进STM-N帧内各种规格的虚容器之中,就是通过映射技术。
定位是指通过指针调整,使指针的值时刻指向低阶VC帧的起点在TU净负荷中或高阶VC帧的起点在AU净负荷中的具体位置,使收端能据此正确地分离相应的VC。
复用则是一种使多个低阶通道层的信号适配进高阶通道层,或把多个高阶通道层信号适配进复用层的过程。SDH采用了净负荷指针技术,将低速支路信号复用成高速信号,其复用过程是类似于“容器传送”,即指将低速信号根据不同的速率进行规范,然后有标志性地封装起来,整体传送。
与PDH体制不同,按SDH组建的网是一个高度统一的标准化、智能化的网络,它采用全球统一的接口以实现设备多厂家环境的兼容,在全程全网范围实现高效、协调一致的管理和操作,能实现灵活的组网与业务调度,实现网络自愈功能,并提高网络资源利用率。由于维护功能的加强, SDH系统大大降低了设备的运行维护费用。
2.1 机房环境的维护
光传输设备的运行状态依赖于其所在的机房环境,做好机房的环境维护,有利于其间通信设备的运行。对于通信机房,维护人员应时刻保持机房的整齐、清洁,保证机房的温湿度处于正常设备范围(机房温度应保持在20土5摄氏度范围内,相对湿度为30-75%),各机柜排列正规,通信线缆布线整齐,各类仪表、维护工具应定位存放;机房内不易堆放过多的物品或杂物,以免妨碍通行和工作,应预留足够的空间确保维护工作的开展。机房应采取有效的防尘措施、配备灭火设备,并有防静电措施,如防静电地板、防静电手环等。配备的设备机柜、备品备件柜、仪器仪表柜、工器具柜等均应符合阻燃要求。机房内的照明设施应能够满足设备的维护检修要求,同时需配备应急照明设备。
维护人员在实施维护工作中,还应特别注意电力供应系统的安全,并对配电柜、开关电源、蓄
电池等做定期维护。
2.2 光传输网管的信息搜集
SDH的运行、管理和维护离不开网管的作用。在日常工作中,网络监控人员在网管上掌握SDH网络状态信息,包括链路状态、网元状态、端口性能等,结合现场人员收集的设备故障现象,才能有效、准确地做出故障判断。
2.2.1 查看告警
当SDH系统发生故障时,一般会伴随有告警事件和异常性能数据的产生,通过对这些信息的分析,可大概判断出所发生故障的类型和位置。网管中的告警类型种类繁多,包括端口信号丢失、光功率越限、AIS告警指示信号、信号劣化、误码过大、板卡脱位、网元脱管等。在对这些信息进行收集之后,将能初步判断光纤、支路电路、单板的运行状况,对准确查找故障点有积极作用。
2.2.2 性能监测
网管的性能监测功能能实时查看光功率、端口误码等各项设备性能数值。
通过对模拟性能的查询,能查看到光接口的收发光功率大小。光功率值是SDH系统的一项重要性能,输入光功率异常(过低和过高)会导致系统产生误码,甚至导致业务中断,这一数值可以对当前网络的链路状况提供参考。
通过对数字性能的查询,则可以了解到所查看的端口误码情况,根据误块秒、严重误块秒、背景误块秒[5]等指示判断故障的来源。
除以上的监测项目,网管还能查看诸如板卡工作状态、链路主备切换、电路路由情况、时钟源走向、光以太网口流量甚至设备温度等系统状态,这些监控手段能帮助维护人员进行传输网络状态分析,及时发现故障隐患。
2.2.3 掌握信号流向
每条经过网管下发的电路,均可通过电路查询功能查看到电路的起止点和经由站点等路由信息。此外还可以利用绘制拓扑图的方式,绘制出机房内所有业务链路的信号流向图,这样可更直观、方便地查看电路在各通信设备间的连接情况,便于今后维护工作的开展。
2.3 光传输故障处理原则
能有效完成SDH故障的处理,是对维护人员的基本要求。网管人员首先对信号流向、告警事件和性能数据进行分析,初步判断故障点范围;然后逐段分析各个环节,排除尾纤或光缆故障,并最终将故障定位到单板;最后,通过换板或换纤,排除故障问题。
进行故障处理,应遵循传输故障排查的基本原则,即“先抢通后修复、先外部后传输、先网络后网元、先高级后低级”的原则[6]。
(1)先抢通在用业务,后进行故障修复。出现故障,影响业务通信时,首先应使用备用电路或设备,保证业务的正常通信能尽快恢复,然后再进行故障的排查和修复。
(2)先定位外部,后定位传输。在进行通信系统的故障定位时,应该首先排除外部设备的问题,包括光纤中断、接入设备故障和电源掉电等,将外部因素排除之后再考虑传输设备的故障问题。
(3)先定位网络,后定位网元和单板。传输设备出现故障时,有时不会只是一个单站出现告警信号,而是在很多单站同时会上报告警。这时我们需要通过分析和判断缩小导致故障的范围,快速、准确地定位出是哪个网元或单板的问题。对于线路的故障,也应从大方位出发,现检查干线线路和板卡,再检查支线线路及设施。
(4)先分析高级别告警,后分析低级别告警。在分析告警时,应首先分析高级别的告警,如紧急告警、主要告警;再分析低级别的告警,如次要告警和提示告警。只有主次分明,才能准确进行故障定位。
2.4 常见设备故障的修复
光链路故障是SDH比较常见的故障类型, SDH系统网元间的连接即是通过光链路进行互联,组成广域网。根据对网管上的性能参数与告警信息的收集,同时结合对光设备的光纤、光口等物理设施的检查,可以较准确地判断出故障。
常用的光设备检测仪表包括SDH综合测试仪、OTDR光时域分析仪、光功率计等。利用OTDR对光缆测试,能获取光缆的衰耗情况、断点位置等准确信息,这些有效信息将会为故障的定位提供判断依据。光功率计能测量收发光功率值,得到的数值可判断出SDH光口的收发光是否正常,进而判断故障。SDH综测仪的功能更加全面,不仅有光功率、误码的指示,还能对端口的抖动、漂移、频偏等性能指标进行测试,适用于巡检和日常维护。
检查光链路时不仅要针对广域网主干光缆,同时还需重视对机房尾纤的检查。尾纤损耗过大、连接错误,都将引起光功率的异常和信号的丢失。传输中常使用的尾纤有SC、FC、LC头等,维护人员应在日常工作中做好对尾纤的维护,注意对尾纤的清洁。在进行尾纤头清洁时,需禁止眼睛正对光接口板的激光发送口和光纤接头。对于无法正常使用或衰耗较大的尾纤,应及时进行替换。
支路板上的链路故障也将影响在用的传输业务,与支路业务有关的故障包括2ME1电接口信号丢失、以太网链路故障等。2ME1电接口业务故障的基本判断方式是环回测试,一端在DDF数字配线架上做环回,另一端用2M测试仪进行性能监测。当发现信号丢失或误码过大等现象时,可采用检查干线光缆、检查支路单板、重配2M电路、更换传输系统至终端的2M同轴线缆、更换端口等手段解决。以太网电路故障的基本判断方式是两端互ping,两端电脑如果无法互相访问,或丢包严重,在主干链路和以太网板正常的情况下,则可采取重配以太网电路、更换端口或更换网线等手段排除电路故障。
板卡故障是SDH系统中发生频率较高的故障之一。板卡的种类繁多,包括业务板卡、网元主控板、时钟接口板、核心交叉板等[7]。各种板卡和网元背板一起构成了SDH的核心部分。各类板卡在长期运行中均会出现老化、脱位等现象,从而引起故障。面对板卡故障定位,最有效的解决方法是替换法:替换该板卡并查看故障状况、判定故障位置。更换板卡时,需佩戴防静电手环;重插板卡时,应注意母板插针被损坏,防止造成板卡无法工作、系统短路。将板卡插入网元插槽时,当感觉到单板插入有阻碍,应严禁强行插入,需调整单板位置后再进行尝试。板卡到位后,应锁紧单板,以免单板脱位。在更换网元主控板时,应注意防止网元侧所存储的数据丢失,在更换前做好网元数据的上载与备份。日常的维护工作中,对网元和网管的数据也应做到定期备份,以防止数据损坏、丢失造成的网络瘫痪。
总之,对于SDH系统故障的处理,应首先以尽快恢复业务为原则:如果有备用通道,先将业务调到备用通道。在故障处理时,应先分析故障现象,定位原因后再进行处理。在故障处理完成后,需做好故障的处理记录,保存台帐和数据。2.5 故障处理修复实例
长江通信专网重庆至宜昌段SDH光传输系统共由15个网元组成。近期系统不时上报DEG信号劣化告警,影响了多条E1传输电路。根据对告警信息的收集,逐条查看受影响电路,发现电路均经过重庆、宜昌两个网元,由此初步判断故障源头可能由重庆或宜昌网元所引起。打开重庆、宜昌网元的干线光板、支路板分别查询光功率、数字性能,发现重庆的一个155M光口上报ESNE(本端误码秒),对端为宜昌网元,宜昌对应的155M光口上报ESFE(远端误码秒),两网元通过运营商提供的线路互连。至此,故障范围被缩小至具体的端口或线路上。由于故障暂未影响业务,从而不存在业务抢通问题,可直接由先外部后传输的顺序进行故障排查。抛开传输设备,联系运营商对该链路进行检查,运营商确认该段链路无衰耗,运行正常;再分别检查两地机房尾纤,并更换重庆、宜昌的光板、光模块,最终当更换了宜昌网元的光模块后,误码完全消失。由此,可说明故障原因在于宜昌光模块的发光口故障,更换模块后,故障便得以排除。
如上例所示,收集网管信息是分析告警现象的有力手段,而当网管告警信息量较大时,则须按先高级后低级的顺序进行判断,找准故障根源。例如,某网元出现包括多个AU4通道的指针丢失(LOP)、远端缺陷指示(RDI),多个支路业务板的帧失步(OOF)以及主干光板再生段(RS)误码指示等告警,此时首先应检查主干线路和光板以排除再生段等高级别告警。光板告警可由检查光功率、端口自环检查等手段排查,排除高级别告警之后,再进行AU4及业务板卡的残留告警排除工作。由于告警信息显示多个AU4通道和支路板均有告警指示存在,因此初步定位故障点为该网元的核心交叉板。维护员利用网管中的交叉板倒换功能,将主用业务倒换至备用板,网管告警指示消失。由此可见,告警由主用交叉板故障所致,更换此板卡后,系统得以恢复正常。此实例表明当维护员面对大量告警时,需按等级从高至低进行筛选,根据先主干光板、核心交叉板后业务板、端口的顺序进行检查,灵活运用网管,才能起到事半功倍的效果。
文章从机房环境维护、网管信息收集、故障处理原则、几种链路故障处理、设备板卡替换等几个方面,总结和归纳了SDH在长江专用通信网中的维护手段和经验,同时通过实例,阐述了故障处理原则在日常故障排查工作中的运用和作用,为类似专用通信网光传输系统的维护人员提供了参考。传输系统是通信网的重要组成部分,传输质量的好坏直接制约着通信网的发展。作为光传输系统和SDH的维护工作者,特别是专用通信网的维护工作者,只有了解这一体系的基础维护知识,并能充分利用网管手段,才能有效地进行运维管理,为各信息业务提供良好的数据传输平台。
[1]周晓民,王永平,靳秀峥,等.SDH光传输系统培训手册[M].深圳:华为技术有限公司编辑出版中心, 1999:1-4.
[2]肖萍萍,等.SDH原理与技术[M].北京:北京邮电大学出版社,2002:10-12.
[3]曾甫全,李勇,王河.光同步传输网技术[M].北京:北京邮电大学出版社,1996:18-38.
[4]邓忠礼,赵晖,等.光同步数字传输系统测试[M].北京:人民邮电出版社,2001:52-54.
[5]李丽君.光纤通信[M].北京:北京大学出版社, 2010:178-180.
[6]杜继红.SDH系统常见故障处理及其维护方法[J].电力学报,2007,(2):1-3.
[7]赵晓强,等.基于SDH的多业务节点设备用户培训授课手册[M].深圳:中兴通讯学院出版中心, 2007:44-48.
TN914.3+32
B
1672-9846(2013)03-0083-04
2013-06-28
王 萍(1962-),女,湖北武汉人,长江海事局信息中心运维中心通信业务管理员,助理工程师,主要从事通信业务管理工作研究。