胡明朴
一、OTN技术背景
OTN是通过G.872、G.709、G.798等一系列ITU-T的建议所规范的新一代“数字传送体系”和“光传送体系”,它参考DWDM和SDH技术,结合了光域和电域处理的优势,提供巨大的传送容量、完全透明的端到端波长/子波长连接以及电信级的保护。它在提供与WDM同样充足带宽的前提下,具备和SDH一样的组网能力,具有可扩展性强、客户信号的完全透明传送、灵活的光电交叉、多级串联连接监视(TCM)、强大的前向纠错能力(FEC)等特点,成为当前最广泛运用的传送网技术。
二、SNCP原理和特点
SNCP,是ITU-T建议中的一个保护功能,是一种1+1方式采用单端倒换的保护,主要用于对跨子网业务进行保护,具有双发选收的特点。它是基于业务的保护,使用工作路径和保护路径的概念,无站间协议,保护的所有监测、倒换动作,都是单站完成。稳定性高,业务配置灵活多变。SNCP保护作为SDH系统中的一种基本保护方式,正是由于SNCP特有的配置简单、无需协议支撑以及倒换快速等优点,在OTN网络中也被作为一种基本的保护方式而使用。
温州的OTN网络采用了华为的6800/8800/9600设备,其SNCP的实现有如下的基本结构:(图1)
主控板完成SNCP业务的判断、业务路由分析和配置数据下发,包括:监测点的设置,SNCP业务属性数据的下发,同时负责收集SNCP业务状态的收集和上报。
交叉板板完成从线路板收集线路板监测的SNCP业务的状态并实现业务源的倒换过程,同时把收集的SNCP业务状态的变化情况上报给主控。
线路板主要完成对SNCP业务的监测,定时向交叉板报告业务的监测状态,当业务状态发生变化时,实时通知交叉板SNCP业务发生的变化。
SNCP的倒换状态优先级顺序是CLEAR>LOCK>FS-W/FS-P>实际监测激励>MS-W/MS-P。
倒换时间是指系统启动保护倒换动作到保护倒换完成的时间;拖延时间是指从宣告信号劣化或信号失效到启动保护倒换实施方案之间的时间。业务受损时间主要包括倒换时间和拖延时间。在国标中规定:少量业务情况,倒换时间要求小于50ms;大量业务情况,倒换时间建议小于50ms。拖延时间对于有SNCP混合组网来说是有用的,网络目标要求这些时间应可根据具体的VC来设置。倒换发生之前在整个拖延时间期限内应对缺陷条件(SD,SF)进行连续的监视。对于单一组网或者进行SNCP业务测试时,拖延时间一般建议设置为0。
在SNCP和MSP混合组网,若有业务同时具有两种保护时,为了防止二次倒换,需要要设置SNCP的拖延时间。
三、故障处理
(1)根据故障现象确定故障业务路径,由于SNCP保护环有两条业务路径,因此首先要确定故障时,当前业务所走的是哪条路径。这必须依赖于准确的通道路由资料,因此做好通道路由规划异常重要。
(2)根据告警和性能确定收方向有故障还是发方向有故障,由于一般业务都是收发双向的,当两个网元间的业务出现故障时,可根据告警确定是收业务方向有故障还是业务发方向有故障。如可根据以下常见的本端和远端的告警或性能数据确定:
如源端发生ODU_SNCP_PS告警的则其收缩端的主用业务中断,宿端对应通道应产生ODUk_PM_SSF告警,其他穿通站点的相应通道也均上报ODUk_PM_SSF告警。
(3)通过更换单板排除故障
通过A、B两步定位出故障站点和故障单板后,首先检查数据设定情况,排除数据设定的错误后,通过逐一更换可能存在问题的单板,基本可排除故障。
四、典型案例分析
温州电信OTN网络有两个平面,采用了华为6800、8800、9600设备,一个是40G的OTN网络、另一个是有OLP保护的100G OTN网络。下面就结合几个典型故障分析下SNCP的故障原因。
(1)SNCP业务不通
故障现象:
文成城关至温州南站配置一条GE的SNCP专线业务,业务不通。(图2)
处理步骤:
1.检查源端和宿端的业务配置,双发及选收业务均正常配置;
2.检查剩余站点的穿通业务配置,瑞安万松站点只配置一条NS2线路发NS3线路的路径,漏配了一条NS3线路发NS2线路的路径;
3.添加NS3线路发NS2线路的业务后,业务正常开通;
4.在网管上强制倒换后业务没有受到影响。
故障总结:
1.由于SNCP业务配置较复杂,尤其在网络较大、环网上OADM站点较多时,往往需配置很多路径,容易出错。因此业务不通时,首先应检查配置是否正确;
2.为避免漏配数据,在配置穿通业务时,应尽量在“新建交叉业务”对话框中创建双向业务;
3.业务正常开通后需做倒换测试,以验证备用路由是否正常。
(2)未开启非介入监视功能导致ODU1-PM-SSF告警不上报
故障现象:
温州南站至平阳昆阳开通了2条ODU1级别的SNCP业务,某日平阳昆阳对苍南灵溪方向光放板故障,2条业务正常倒换,且苍南灵溪、瑞安安阳相应通道均上报ODU1-PM-SSF告警,但温州数码城站无任何告警上报。
处理步骤:
查询数码城站设备是否对ODU1-PM-SSF告警是否实施了告警屏蔽或反转。确认相应通道均未告警屏蔽或反转。
由于是PM通道告警无法上报,所以查询NS3板的PM通道监视功能是否开启。确认数码城站相应的NS3板均未上报PM通道非介入监视功能。
在网管上将2个通道的PM非介入监视功能使能后,ODU1-PM-SSF告警正常上报。
故障总结:
由于在配置SNC/N的保护时,需要使能PM非介入监视功能,否则会导致保护组配置无法正常下发。因此在配置有NS3板至TOM板业务的站点,均开启PM非介入监视功能。而数码城站,由于没有支路单元,所有业务均为NS3板至NS3板的全穿通业务,导致该功能未使能,告警不上报。
五、结束语
SNCP是一种收到广泛使用的电层保护方式,比起光层的OLP保护来说更安全,但也更复杂。SNCP有着主备两条路径,故障处理时必须清楚两条路径的走法以及当前的主备用关系。故障处理时需要遵循先恢复业务再处理故障的思路来,首先就是查看是否倒换成功,不成功则进行人工强制倒换,之后再对故障路由进行处理。