陈宝民
(北京市合力电信有限公司,北京 100010)
随着互联网、多媒体、5G等业务的飞速发展,传输网络规模急剧增大。为了传输网络承载业务能够安全、稳定的运行,必须要对传输网络服务平台进行及时有效的调度、监控等,其关系到传输网络中网关和嵌入式控制管道(Embedded Control Channel,ECC)是否可以实现自愈,并且将信息畅通地传递出去。同时,因为网管网元管理ECC通信网络的能力非常有限,所以通常业界要求同一ECC网络中网元的数量不能大于128个。如果传输网络规模不断扩大,网关中的网元数在300以上,则会严重影响网络的日常运行和维护。因此,需要进行合理规划,避免ECC子网的规模过大,从而造成严重的隐患。
ECC主要应用于同步数字体系(Synchronous Digital Hierarchy,SDH)网元间通信,是用来传递电信管理网络(Telecommunication Management Network,TMN)信息,提高网元管理的便捷性。两个SDH网元的光纤进行连接时,采用段开销的再生段字节数据通信信道(Data Communication Channel,DCC)字节能够对TMN信息进行传送,无光纤连接但需要TMN信息的网元采用扩展ECC。两个网元利用网口,通过交叉网线实现连接目的,从而传送TMN信息[1]。
SDH的DCC构成嵌入控制通路协议栈的物理层。再生段DCC或DCCR采用同步传输模块N极(Synchronous Transport Module Level N,STM—N)段开销字节D1~D3作为192 kb/s基于消息的通路操作;复用段DCC或DCCm采用TM—N段开销字节,将其作为576 kb/s基于消息的通路操作。
在网管系统中,网管网元、计算机采用TCP/IP协议通信,网关网元、普通网元则是采用ECC实现协议通信,其原理如图1所示。NE1是网关网元,其是通过网线进行通信,利用IP地址进行识别。而NE1、NE2、NE3、NE4彼此之间的通信则是利用ECC通道实现的,通过网元ID信号识别。ECC信号流和业务信号流无关,如果关闭了DCC通道,那么将会导致ECC信号不流通,但是不会对业务造成影响。
图1 网管系统ECC协议通信原理
首先,ECC通信是一致路由,即是指1、4号网元之间的ECC走1到4和4到1路径,在同一对光纤上对于信号进行传输。其次,基于正常路由下,通过网关网元来登录非网关网元,网管走短路径。在短路径不正常的情况下可以更改为长路径,而在长路径和短路径均不正常的情况下不能进行登录。再次,ECC为双向路由,因此在无保护链且一根线缆中断之后,不能登录。最后,ECC通道采用发端并发才有路由来建立收端。基于最短路径建立路径,阻断路由是路由表中的逻辑距离,也就是间隔站点的数量,并不是实际距离[2]。
(1)光网络组网规模过大。在出现业务故障后,光网络会出现较多的告警数量,且需要较长的传送距离。
(2)组网规模过大会增加网络管理DCN的拓扑,从而影响路由计算速度。网络在发生变化后,路由广播信息将会在网络中进行传播,并且需要重复计算路由,每一个网元的路由表存在着不同的收敛时间,如果收敛时间过长,将会导致管理数据通信网络(Data Communication Network,DCN)的关键链路拥塞。
(3)传递告警信息、路由信息均会导致管理DCN的数据流增加,从而发生拥塞。
一般情况下,DCC链路越多时,信息量越集中,但带内带宽保持不变。短路径寻径方式下,无论网元进入多少DCC或是网元的转发能力多强,网元的管理信息出口仅有一条,那就是最短路径DCC,因此通常会出现数据拥塞现象。
网络过大的情况下,网管与网元的通信量也会随之增加。网管需要对于网络中某些元素的信息进行定期查询。此外,网元将生成一些性能和告警数据,并通知网管。这些数据必须通过网络中的主干网络元素,如网关。因此,在网关网元中接收到所有终端网元的数据之后,将会由网关承担通信任务,而流量超出网关网元支持的最大限度之后,会导致通信稳定性降低。
每一个告警的开始信息与结束信息都包括大约30个字节。当仅使用D1~D3时,单个DCC链路的测量传输容量约为20 KB/s,所以在无性能监控信息的情况下,每秒能够发送700多个告警。而网管在接收到告警之后,并未及时响应会导致告警反复上报,从而出现严重的网络堵塞情况。性能监控和上报启用之后,管理通道上的数据拥挤情况将会更加严重。当每个DCC信道通常已满时,DCC信道的瓶颈处会发生丢包。由于目前没有缓冲区溢出处理机制,缓冲区满后,所有ECC层直接拒绝溢出消息,无任何的通知和反馈,顶层软件不知悉。当所有报警同时报告且当前设备的DCC转发缓冲区受到限制时,由DCN管理的瓶颈上的DCC转发缓冲区将溢出,导致消息丢失。
与小型网络相比,大型网络稳定性差,网络维护成本高。一个大的网络中间有一个网元拖网,在1 min内,网管尝试和设备通信;如果两次连接未成功(2 min超时),则判定连接失败。另外,若第一次连接报文丢失,则第二次报文延迟则可能会导致瞬间拖网的错误评估[3]。
断开或恢复光纤时,需要更新ECC路由。在此更新和调整期间,某些网络元素将无法访问。当网元无法访问时,整个网络都会传输路由信息,方便所有网元了解这一网元无法访问。传播此路由信息需要耗费一些时间。在此期间,可以再次访问或有其他网元脱网,这将使整个网络保持振荡。路由信息在传播过程中会增加网络流量,当网元数量较大时,网络拓扑收敛速度减慢,导致大量管理信息丢失。
当站点数量较大时,经过不断更新路由表和接收到的数据包流量,会导致内存不足、频繁中断,甚至主机异常重启,最终会影响保护更改、分发配置或从网络下载元数据。
本文优化ECC网络通信技术采用网络分层分域的方式,利用DCN进行管理。因此,划分一个大网络,编程多个小ECC子网,每一个子网之间关闭互通的STM-N 光/电接口的ECC,保证在小网内传播路由信息,不会进一步扩散到其他的网络。而这一优化方案需要增加网关网元的数据,所有的子网均需要通过网关网元来实现和网管的通信需求。利用DCN可以使网关与中心网管直接进行通信。
首先,在子网中星形业务的中心节点设置ECC子网网关,可以有效避免基于DCC窄带宽信道的管理DCN传输大量管理信息,降低DCN出现堵塞的概率。 其次,在子网中入路光纤最多的设备上设置ECC子网网关,从而降低子网中基于DCC的管理DCN再次发生拥塞。
将相邻的网络设计为同一个子网,使其成为ECC子网内网元。子网存在多个链路和环路的情况下,选择网关网元时,需要在最多环路和链路的设备上进行。但是对于环网而言,ECC分割方案必须要保证环上断纤之后,依旧可以正常的监管各个网元[4]。
为了保障网内ECC路由的可靠性,在分割ECC网络通信技术的过程中,主要选择主网关结合备网关的方式,这样可以避免某一网关DCN路由失效从而导致整个网络的监控功能丢失。
DCN带宽传输通道选择的2 Mb/s通道是由另一个网络(非监控网络)提供,带内传输通道DCN使用传输字节D执行ECC路由成环。多业务传送平台(Multi-Service Transport Platform,MSTP)数据板提供DCN通道,利用MSTP自带的数据单板来提供DCN传输通道。该体系结构适用于现有的网络数据板,如果选择受监控网络提供的服务通道,即使网络服务没有自愈保护,也必须考虑DCN的风险。
为了使各个ECC子网之间独立,将ECC子网之间互通的ECC关闭。
(1)将ECC进行扩展,使ECC子网之间的互通可以关闭。
(2)利用STM-N光/电口的方式来关闭ECC子网互通。
(3)对于环网ECC路由关闭的相关建议:因为保障ECC路由的可靠性对于维护网络具有重要价值,所以对于成环网络,分割ECC后为了避免DCN失效而产生故障,并且使故障得到及时有效的护理,可以选择关闭同一段光路上与网管距离更近的一侧单板ECC。除此之外,这一方式在出现某一个DCN路由不可达的情况下,可以打开可达网元的相应单板ECC进行恢复。但是在两个子网合并路由的情况下,则需要避免两个子网的网元数量过多[5]。
分割ECC网络后需要开展功能验证与倒换测试,包括ECC可达路由数量是否能够满足要求、光缆中断之后的ECC路由是否平滑等。
某地的本地传输网络选择华为公司的SDH产品。在T2000网管上,当前一共分布着2 480台华为传输设备,主要包括Metro1000、Metro5000、Metro3000、OSN7500、OSN6800、OSN3500等。其中一个汇聚环的网管带有345个网元,在物理上属于同一个网络,其所有都是通过光路实现连接。各接入环基于环环相切的方式进行连接,未开展分层规划,也并没有采取隔离措施。图2为常见的网元管理组网示意。在该网络中,各个汇聚节点所具有的网元数量不等,A1网元数量为15个,A2网元为35个,A3为59个,A4为36个,A5为29个,A6则是17个,A8的网元数量为41个。
图2 常见的网元管理组网
ECC子网的划分。划分ECC子网来选择网关网元。根据如图3所示的组网情况选择核心汇聚节点作为网关网元。ECC子网分割的原则:首先,可靠性原则。在将ECC进行分割之后,必须要确保网络异常的情况下,如断纤、换板、DCN异常时,网管仍旧可以达到各网元,从而有效避免对维护造成影响。其次,根据分层与分域的管理原则。对ECC进行分割,能够在网络光纤中断情况下保证ECC段前路由的保护能力。最后,确保性能。需要将每一个ECC子网中的网元数量保持在一定范围内[6]。此外,因为需要考虑ECC数据量的限制和网络管理控制的方便,所以根据国内外运营商的建议和做法,将ECC子网中的最大网元数严格控制在64个内。
图3 传输网络 ECC 子网划分示意图
(2)建立、调测DCN路由。基于划分的ECC子网方案,规划如图4所示的DCN传送通道。基于DCN的路由规划方案,选择独立的2 Mb/s速率DCN路由,使网管通过DCN通道来访问各个网关网元。DCN 2 Mb/s路由选择其他传输通道,如使用MSTP单板来实现2 Mb/s数据业务的传输,或是其他厂家传输设备以及独立的DCN网络等。
图4 传输网络 ECC子网DCN传送通道
(3)关闭各个子网之间的ECC路由。基于上述采用的ECC子网划分方式,需要将全部STM-N光口关闭,保障路由信息与数据仅在小的ECC子网内进行传播,而不会扩散到其他ECC子网络中。但是为了能够将大的ECC子网分割成多个小的ECC子网,需要增加相应的网关网元,使小ECC子网中的非网关网元均可以通过网管和网关网元进行数据信息通信。网关网元通过DCN的数据通信网与中心网管通信。将网络中闲置的光口全部关闭,避免在新设备入网或是子网间新增光纤连接过程中导致ECC振荡,如果需要更改网络配置或是接入开通新光纤,需要与网管管理员提前申请,经过对影响范围评估后才可以进行[7]。该方案的执行可以大大提高ECC通信网络的稳定性,避免网络维护过程中的开销消耗过大,从而使整个网络的管理更加有效可控;因为ECC 网络过大将会对网络运行与维护方面造成影响,所以为了避免这一情况,需要对于多重因素、网上经验、业界做法等方面进行综合考虑,同时需要对于ECC组网进行合理的规划。
倒换测试及功能验证。经过一系列的测试,环上任何一处发生断纤,都不会出现网元脱管,每一个子网的ECC可达路由数最多不大于60个,ECC巨网可以成功分割。
随着当前我国通信行业的飞速发展,传输网络作为各个系统中的通信基础,其网络会不断增加,巨网ECC的影响与对网络的危害需要将ECC通信网络进行子网分割,使其成为多个小的ECC子网,这样才可以保障网络运行过程中的安全。ECC 巨网是当前现网非常常见的一种网上问题,随着传输网容量的不断增加,其问题也在随之增加。如果不及时实施有效的解决措施,会出现更为严峻的后果。ECC网络通信的优化可以降低网络维护层面的风险,从而提高网络的可扩展性和生存性,有效避免ECC网络通信风暴导致的不良结局。通过对于ECC网络通信进行优化,能够最大限度地降低网络隐患,保证传输网可以稳定运行。因此,ECC通信网络的优化可以认为是传输网络转型过程中的重要组成部分[8]。
本文主要对于巨网ECC通信网络执行DCC通道透传的方式来对ECC通信网络进行分割,并且能够满足绝大多数情况下的组网方式。而对于ECC组网过程中,需要注意的相关事项与其规划建议可以总结为以下几个方面。
在组网比较复杂的情况下,一个汇聚节点可以根据STM-N光口的不同方向进行拆分。也就是说,同一个汇聚节点分别可以拆分到不同的ECC子网中,并设置DCC透传,从而划分同一网元中的不同ECC子网。
汇聚节点可以代表多个汇聚节点,如NEA等。在数据大于等于2的情况下,建议选择主用网关结合备用网关的方法,这样可以有效提高网络的稳定性,避免在一个网关DCN失效的情况下丧失对整个网络的监控。将各个子网进行分割之后,每一个子网都需要具有自己的网关网元,并且可以通过外部DCN与网管进行连接。
DCN具有多种实现方式,如利用传输网的MSTP方式,通过协议转换器+SDH、DCN专网以及路由器等方式。而每一种实现方式拥有不同的优势和劣势,所以需要根据实际情况规划DCN ,有保护的DCN 路由建议优先选择。
SDH网络的ECC分割方法也可以在波分复用(Wavelength Division Multiplexing,WDM)网络中使用。
ECC子网在经过分割之后依旧成环,避免成为链导致保护丧失,通过D字节透传,促进ECC路由成环。
优化传输网才可以确保网络安全性,提高网络容量,确保各类业务的开通,满足各种业务的需求。同时还可以实现安全可靠、高效运营、调度灵活、快速业务提供、保障企业发展的基础传送网络。