巨型ECC网络对传输系统环保护的影响研究

2021-01-26 08:36许文渊
铁路通信信号工程技术 2021年1期
关键词:网元传输网子网

许文渊

(中国铁路上海局集团有限公司上海通信段,上海 200434)

SDH网协议路数SDH网络中的嵌入控制信道(Embedded Control Channel,ECC)是传送操作、管理和维护(OAMP)信息的逻辑信道。随着铁路各类业务需求的高速增长、不同铁路线路的业务互联互通,作为承载网的传输网网元数已经高达400~500个,SDH网络的ECC需要管理的网元越来越多,极易导致巨型ECC网络问题影响传输系统稳定性和业务的安全性。通过研究分析ECC原理、巨型ECC网络对传输网络造成的影响,提出巨型ECC网络分割方法来解决ECC网络风暴的问题。

1 网管对网元进行OAM管理

SDH网络的操作维护管理(Operation Administration and Maintenance,OAM)功能具有高度自动化水平,能根据用户需求利用网管终端完成对管理网元的命令下发及数据查询工作,完成准同步数字体系(PDH)系统所无法完成的业务实时调配、告警故障定位、性能在线测试等功能。铁路SDH传输系统常见的网元管理组网示意如图1所示。当SDH传输网管在对网元进行维护时,至少需一个网关网元(GNE1)与网管服务器进行通信(网线直连,通过TCP/IP协议),非网关网元(NE2-NE4)通过ECC与网关网元连接,进而实现与网管间的数据信息传输,从而实现网管对整个网络的OAM。

图1 网管、网关网元、网元通信关系管理组网Fig.1 Network management, gateway network element,network element communication relationship management networking

在铁路传输系统中存在大量的区间点对点业务,主要为信号CTC、供电SCADA、FAS、应急、防灾等业务。目前客专线传输系统主流保护方式为二纤双向复用段保护环,它不仅最适用于上述分散型业务组网,同时能有效提高传输系统通道利用率、节约投资,如图2所示。

2 巨型ECC网络产生的原因分析及影响

2.1 巨型ECC网络产生的原因

图2 某客专线传输系统组网示意图Fig.2 Schematic diagram of transmission system networking of a passenger dedicated line

1)随着铁路传输网网络规模的不断扩大,一个传输网络内ECC互通的传输网元数量多达400~500多个,随着更多的网元入网,传输设备支持的DCC路数越来越多,如华为公司的OSN7500可支持达到160路DCC路数。无论网络多大,ECC都能互通,通过ECC可以支持对更多网元的管理。当网关网元ECC互联网超过一定数量的子网(为保证ECC网络的正常性能,通常建议单个ECC子网的网元数量需不高于50个,保证基本可用需不高于64个),就可以称为巨型ECC网络。

2)由于管理DCN本质上是个星形网络,其带内带宽最大为768 kbit/s,且不可扩展。当某个传输系统网元规模过于庞大,此时网络管理DCN的拓扑也会相应变大,对网络的路由计算速度会造成较大影响;同时,因网络的变化造成路由广播信息不停的在全网范围内广播,使得路由不断重算,再加上网络中每个网元的路由表收敛时间差距,就影响了管理DCN拓扑的稳定性,而且因组网规模过大,在网络故障时因传输距离、告警数量导致管理DCN数据流量扩大,进而造成网络拥塞。由于在DCN网络中传送的数据包是有生命期的(缺省为63),当该网络路由因故发生变化时,数据包在传送过程中有可能造成传输路径不断变化,如由较多网元组成的传输环或链型网络一旦出现断纤,相关数据包极有可能因经过较长路由使得在达到目标网元前出现丢失。在一个大型网络某个网元脱网的路由信息广播到整个网络需经过一定时间,但当信息传达到整个网络时,可能该脱网网元又恢复可达或者该网络其他网元又脱网了,进而造成整个网络不停振荡。

2.2 巨型ECC网络造成的影响

巨型ECC网络易导致主机异常复位。网元主控板的内存容量是固定的,当网络中的网元过多时,ECC网络路由表的数据流量依然很大,当网络发生任何变动时,会导致主控板的短期内接收到的待处理网络信息达到峰值,严重时会造成主控板的异常复位。因为SNCP和TPS的倒换机制在交叉板,因此主控板复位时,这两类保护无影响。但对于复用段保护倒换,由于倒换协议下发至交叉板完成,对设备不影响,但在主控板复位后会触发主控板倒换,将造成网元配置下发或数据下载失败。

巨型ECC网络导致网元脱管。传输网管以每分钟为周期向所有网元发送监视信号,若连续2次无法收到传输设备的返回值时,逻辑上便认定该网元的连接中断。因此当第一次连接报文通信异常时,第二次的报文有一点时间上的延时,传输网管大概率就会做出传输设备脱管的判断,当同一网络内的ECC过量时,就会容易导致传输设备的脱管现象,直到传输设备再连续两次与传输网管的通信正常后,脱管故障恢复,因每台传输设备与网管间的跳接点长度不一,会造成传输设备恢复的时间和频率也不一样。

巨型ECC网络的路由稳定性差。D1-D3字节的速率为固定的192 kbit/s,在所有网元开启性能监控已经占用部分通信带宽的情况下,当网络变化时路由广播信息需要在网络中不断广播、不断反复计从而算造成ECC路由不稳定。在一个大型网络某个网元脱网的路由信息广播到整个网络需经过一定的时间,但当信息传达到整个网络时可能该脱网网元又恢复可达或者该网络其他网元又脱网了,进而造成整个网络不停的振荡,期间又增加了网络的通信量。针对华为设备的ECC收敛时间测试结果如表1所示。

3 巨型ECC网络的解决方案

通过对巨型ECC网络进行切割优化,将一个大的ECC子网络(管理网元数量超过400个及以上)划分为多个小的ECC子网,并且关闭各个小的ECC子网之间互联互通端口的ECC,把路由信息和数据限制在某个子网内传播,不会扩散影响到其他网络。通过合理规划ECC子网组网,可有效避免因ECC网络过大造成的传输网网络不能正常监控和管理通道堵塞问题。

通过增加SDH网络中网关网元的数量,将原有的大网划分成不同的小子网,实现巨型ECC网络分割。每个子网内建议同时设置主备用两个网管网元,保障在ECC子网分割后的非网关网元与网关网元之间可达。这样由于网关网元数量的增多,与网管进行DCN连接的带宽将大大增加,每个子网内的网元都有足够的带宽与网管直接通信,不仅可以减少网络维护开销,提高整个网络的管理水平,还能增强ECC通信网络的稳定性。

巨型ECC网络的分割原则:一是要保证网络出现异常情况时,网管仍能和分割前一样可管理所有传输网元,避免影响维护;二是每个ECC子网内的传输网元数量不能超过建议的数量范围;三是完成ECC子网分割优化后,按分层、分域的管理原则,网络上任何一处断纤或其他异常情况,应确保数据包在到达目的网元前不被丢弃或消失,确保能够达到分割前的ECC路由恢复(保护)能力。

4 巨型ECC网络分割对环保护的影响

4.1 巨型ECC网络分割后对SNCP子网连接保护影响

如图3所示,SNCP的保护方式为“首端双发、末端选收”,正常工作状态下,NEA到NEB的业务在NEA设备侧表现为双发,分别经过子网1(工作通道)和子网2(保护通道),同时到达NEB,NEB优先监测工作通道是否正常,若正常则从工作通道收取NEA的业务,即可完成NEA至NEB之间的业务通信。如果子网1工作通道发生中断,NEB在监测到子网1工作通道不通后,NEB倒换从子网2的保护通道收取NEA的业务,实现正常通信,待子网1工作通道正常后,NEB再次倒换至子网1的工作通道进行通信。通过分析SNCP子网连接的保护方式可知,业务倒换的功能实现主要在起始点和终结点实现,与子网内的其他网元主要提供业务即可,无需参与倒换过程,因此即使将起始点和终结点分割在不同的ECC子网内,也不会对SNCP保护造成任何影响。

4.2 巨型ECC网络分割后对二纤双向复用段保护环(MSP)影响

MSP复用段环的保护方式相比SNCP较复杂一些,但因其多用于分布式业务,在目前客专线传输系统组网中应用广泛,MSP环的保护方式将两个网元之间的光纤时隙资源一分为二,前一半时隙为工作,后一半时隙为保护,如图4所示,NEA至NEC的业务经过S1工作时隙,经过NEB达到NEC,如果A-B之间光缆中断,NEA和NEB的保护状态由正常状态变为倒换状态,NED和NEC的保护状态由正常状态变为穿通状态,相对应的NEA至NEC的业务将经过NED-NEC-NEB后到达NEC,在经过NED-NEC-NEB区段使用的是后一半的保护时隙,从倒换原理看,业务倒换时需要环内的所有网元共同参与才可以完成。而通过APS协议控制环内的网元在发生倒换时,需要利用APS协议,由APS协议来给一个环网内的各个网元起名字后统一管理,APS协议信息由K1、K2携带,目的节点标识码(5~8 bit)。由于只有4 bit,因此一个复用段保护环上的网元数最多不能超过16个,环上网元号最小的节点编号为0,按照东发西收方向逐一为1、2、3……14、15,环网内每个网元都有对应的数字编号,当发生倒换时APS协议将指挥各个网元各司其职。ECC分割需要关断网元间的DCC通道,关闭后两个网元之间将无法互通,对MSP的保护倒换。

如图5所示,按照客专线传输系统组网情况,将整个系统分割为黄色和红色两个ECC子网,子网与子网之间不可通信,分别由各自的网关网元与网管进行通信,此时原环网B-C-D-E-F因子网划分,将网元B分离出环网,为了保障D-E之间的光缆中断后,E-F网元也可与网管正常通信,需要在网元B设置DCC透传,实现网元C直接与网元F进行通信。对于B-C-D-E-F环网来说,由于网元B设置了DCC穿通,该环网实际通信可达的网元变为C-D-E-F,网元B将不可达,ECC分割后对MSP环保护是否会产生影响。

图4 二纤双向复用段保护环(MSP)连接工作与保护示意图Fig.4 Schematic diagram of connection and protection of two-fiber bidirectional multiplex section protection ring (MSP)

图5 ECC分割示意图Fig.5 ECC segmentation diagram

APS协议使用的是K1、K2字节,DCC通信使用的是D1-D3字节,K字节和D字节虽同属于复用段开销,但D字节用于网元网管之间、网元和网元之间OAM信息通路,K字节用于传送自动保护倒换信令,使网络具备自愈功能,相互之间没有关联,是不同的开销字节,关闭D字节不会影响K字节的功能,反之亦然。因此针对图5中巨型ECC网络分割后,网元B设置的DCC穿通,虽然会造成同一MSP环内个别网元的DCC通信不可达,但不会影响APS协议中K字节的传送,对MSP环网的保护没有影响。

5 结论及展望

随着铁路行业逐渐发展,传输网络的子网将会越来越大,巨型ECC网络的影响和对网络的危害,迫使需要进行ECC子网分割,划分成多个小的ECC子网,以提高网络整体运行安全性,本文对SNCP保护和MSP保护两种情形的ECC分割方案进行分析,对巨型ECC网络执行DCC通道关断的方式可以实现巨网ECC的分割,以满足当前铁路客专的组网保护方式。此方案在京沪高铁上海局管段已实施ECC子网分割,取得了较好效果。

猜你喜欢
网元传输网子网
光通信传输网的故障定位及处理技术
IP 数据网+光传输网协同控制技术研究
5G无线网络架构对传输网的影响浅谈
计算机网络课程中网络测试命令的应用
子网划分问题研究及应用
浅谈5G带给传输网的挑战
基于DMAIC分析过程的A企业仓储出库流程优化研究
基于Petri网的L企业产品设计变更执行流程优化研究
交换机敏感计数器监控分析系统在现网中的应用
关于中兴公司通信设备环回方面的讨论