王惠
(中国联合网络通信有限公司长春市分公司,长春 130000)
所谓自愈网,就是无需人为的干预,网络就能在极短的时间内(ITU-T规定为50 ms以内),使业务自动从故障中恢复传输能力,在自愈过程中,各种业务不会中断,用户感觉不到网络已经发生了重组。自愈是生存性网络最突出的特点。
自愈环从结构上可划分为:通道保护倒换环和复用段保护倒换环。从按照进入环的支路信号与由该支路信号分路节点返回的支路信号方向是否相同来区分,又可以将自愈环分为单向环和双向环。从按照每对节点间所用光纤数来分,又可以分为二纤环和四纤环。下面介绍一下应用最为广泛的两种自愈环即二纤单向通道倒换环和二纤双向复用段倒换环。
单向通道保护环简单的一句话就是 “双发选收”,逆时针为主环方向,一般为“东发西收”。主要在集中形业务为主的环网中采用。
二纤双向复用段保护是利用时隙交换技术,使光纤容量的一半作为工作信道,另一半作为保护信道, 它的保护倒换属于双端倒换,即故障两侧的节点要同时倒换,所以需要协议来完成。
二纤单向通道倒换环的业务容量等于所有进入环内的业务量的总和,即等于节点ADM的系统容量STM-N。
而二纤双向复用段倒换环由于只能利用一半时隙,所以环的最大业务容量为K/2×STM-N。其中K为环网中的节点数。
倒换时间是指ADM检测到倒换条件并能完成倒换动作的时间。ITU-T规定的倒换目标值为50 ms,由于单向通道保护环不需要APS协议,倒换动作少,因而业务恢复时间也最短。
在日常维护工作中,由于各厂家设备稍有不同,现举华为OSN3500设备SDH自愈环发生的典型问题进行分析,以及对故障排除方法做简单介绍。
3.1.1 组网描述
某局使用华为设备组建二纤单向通道保护环,为集中型2 Mbit/s业务,业务中心站为NE1,逆时针为主环方向,即东发西收。但由于光缆一直未到位,NE3与NE4的光纤未连接。因此,实际组网为一个断纤环,如图1所示。此种状况该局业务运行一直正常。
图1 组网图1
3.1.2 故障现象
某日,维护人员认为NE3和NE4间的光板一直有R-LOS告警,影响对正常告警的处理,决定用尾纤将这两个站点未用的光板自环。第一天,维护人员到达NE3站后,用尾纤将该站东向光板加入合适的光衰进行自环,观察光板红灯熄灭,业务运行正常;第二天,维护人员到达NE4站,用尾纤将NE4西向光板加入合适的光衰进行自环,观察光板红灯熄灭,业务正常。随即离开机房。但10 min后全网业务中断。查看网管没有任何告警。
3.1.3 故障分析及处理
(1)在NE3和NE4间断纤的情况下,以下业务走的是备环:NE2、NE3到NE1的业务;NE4收NE1的业务。
(2)当NE3的东向光板自环时,是NE3的备环方向光路恢复正常,因此对各站业务没有影响,即原来收主环的还收主环,收备环的还收备环,业务仍保持正常。
(3)当NE4西向光板自环时,为NE4的主环方向恢复正常。由于2 Mbit/s业务的通道保护是恢复式的,即如果主环方向正常,则10 min后业务将自动倒换回主环。这样,原来走备环方向的业务即NE2、NE3到NE1的业务; NE4收NE1的业务;10 min后倒换回主环。而此时主环的业务却是NE4环回的业务,所以业务中断。
(4)在这种情况下,全网通道无告警及误码等引起通道倒换的告警,因此所有站没有任何告警信息,但业务中断。
(5)维护人员返回4号站,将自环尾纤拔掉或将NE2、NE3到NE1的业务;NE4收NE1的业务倒换到备环方向,业务将恢复正常,此时网管查询保护倒换状态异常。
3.1.4 结论和建议
对于通道保护环,在断环保护倒换动作的情况下,切勿随便将光路自环或做软件环回操作,若一定要通过自环判断故障,一定要分析一下可能产生的影响。
另外,从上面的例子中可以看出,其实有一个关键分析点——NE4西向告警消失10 min后业务中断。这里的10 min提示,希望大家重视,10 min正好是保护倒换的恢复时间。我们平时在处理故障时千万不要忽略这些宝贵的线索。
3.1.5 思考
上例为通道保护环的分析结果,那么我们想一下如果是复用段保护环,结果会怎样呢?
如果是复用段保护环,在某段光路断纤的情况下,复用段正常保护倒换,且业务正常。将此复用段保护环用尾纤将故障光口环回,无论是环回单站还是双站,查询保护子网属性可见此复用段仍处于保护倒换状态,业务正常。因为复用段倒换需要APS协议,而硬件环回时K字节传递错误,保护倒换不能恢复,所以环网仍处于保护倒换状态,业务正常。针对此种特点,当复用段环两中继段发生误码问题时,可以通过环回来判断故障点。
3.2.1 组网描述
某组网如图2所示,4个网元组成的一个2.5 Gbit/s复用段保护环MSP,网元A为网管中心站,A站到其它各个站有业务。
图2 组网图2
3.2.2 故障现象
某日,网元D掉电后,环网发生正常倒换,但网元C经由网元D到网元A的业务中断。其余业务正常。
3.2.3 故障分析及排除
(1)首先查看网元C到网元A之间的业务,记录业务路由:网元C(E1:17~32) ←→网元B (W1:17~32←→E1:1~16) ←→网元A(W1:1~16)。可见在配置网元D的穿通业务时,进行了的VC12级别的时分交叉:(W1:17~32←→E1:1~16);这样当网元D节点失效后,网元A和C将进入倒换状态,而双向复用段倒换是以VC4为基础的,将导致穿通点的时分交叉信息丢失。
(2) 现在来具体看一下倒换后的路由:先看C→A方向:网元C (E1:17~32→W9:17~32)→网元B (E9:17~32→W9:17~32)—网元A (E9:17~32→W1:17~32) 本来网元A收网元C的业务为W1:1~16时隙,倒换后却为W1:17~32,业务中断;再看A→C方向:网元A (W1:1~16→E9:1~16)→网元B (W9:1~16→E9:1~16) →网元C(W9:1~16→E1:1~16) 本来网元C收A的业务为E1:17~32时隙,倒换后却为E1:1~16,业务中断。
(3)重新配置业务,将各站点穿通业务的时分取消。
3.2.4 结论和建议
应合理规划时隙,避免穿通业务的时分交叉。否则有时分业务的节点一旦故障,就会引起经过此网元穿通的时分业务中断。还有可能发生网管无任何告警,但业务不通,倒换时出现错接的情况。