软交换CS域CE网络的应急预案

2015-05-30 00:05陈平炜
企业技术开发·中旬刊 2015年8期
关键词:路由器应急

陈平炜

摘 要:文章对软交换CS域CE网络的应急预案进行了分析,适用于漳州联通公司移动通信网软交换CS域CE在节假日、设备故障、自然灾害、反恐事件、公共突发事件、重大活动、军事演习的应急通信保障,以及在自然灾害和其他突发事件中遭到破坏情况的应急处置和通信恢复。

关键词:软交换;路由器;应急

中图分类号:TN915.02 文献标识码:A 文章编号:1006-8937(2015)23-0074-02

1 网络概况

漳州联通软交换网络备采用中兴软交换设备和CE设备,CE路由器采用中兴T64E和T600,交换机采用T64G。MSC SERVER下挂两个MGW,其中一个MGW与MSC SERVER同机房同网段,另一个MGW在另一个机房,需要跨CE跨IP承载网流量。

2 通路组织情况

2.1 总体介绍

软交换CS域CE设备提供软交换端局MGW和MSC SERVER之间信令传输的承载,主要包括CE路由器和汇聚交换机。现网每个局点配置一对CE路由器,每个机房配置一对汇聚交换机。一对汇聚交换机通过GE接口,以口字型接入一对CE路由器;一对CE路由器通过GE接口以口字型接入本地一对AR路由器。软交换端局MSC Server和MGW通过GE/FE连接至汇聚交换机。AR路由器与CE路由器间采用静态路由协议,CE路由器之间或者汇聚交换机之间起VRRP协议。根据IP承载设计的特点,软交换的信令流,在默认情况下,通过CE1-AR1路由器上IP承载网,回程路由也是通过AR1-CE1来疏通的。只有1侧设备出现故障时,才会启用2侧设备。而且,只要下一跳的2侧和1侧链路完好,流量会在下一跳从2侧回到1侧设备,回程路由亦是如此。

2.2 漳州分公司CE及软交换网络结构、业务流量介绍

漳州移动网络公司在荣昌机房、新浦机房2个局点设有软交换设备,如图1所示。

2个局点各设置了1对中兴T600路由器,作为CE 接入设备。在荣昌3层、新浦5层2个有软交换设备的机房内各设置1对中兴T64G作为汇聚交换机。业务流量流向:ZZMGW1归属ZZSS1,信令流量流向ZZMGW1<->漳州荣昌3层T64G-1<->ZZSS1(注:由于ZZMGW1和ZZSS1在同一网段)ZZMGW2归属ZZSS1,信令流量流向ZZMGW2<->漳州新浦5层T64G-1<->漳州新浦CE1<->漳州AR1<->漳州荣昌CE1<->漳州荣昌3层T64G-1<->ZZSS1,从另一个角度分析漳州荣昌CE路由器出的问题,将会影响漳州MGW2下挂用户的业务,以及XMSS3对漳州MGW1业务的备用功能;漳州新浦CE路由器出问题,将会影响漳州MGW2下挂用户的业务,以及XMSS3对漳州MGW2下挂用户业务的备份功能;漳州荣昌T64G出问题,将会影响漳州MGW1、漳州MGW2下挂用户的业务以及XMSS3对漳州MGW1下挂用户业务的备份功能;漳州新浦T64G出问题,将会影响漳州MGW2下挂用户的业务,以及XMSS3对漳州MGW2下挂用户业务的备份功能;若汇聚交换机之间的互联链路(该TRUNK为VRRP的心跳检测链路)全部中断,将造成下挂软交换设备找不到网关,业务全阻。

3 应急措施

正常情况下,具体流量如图2所示。

3.1 主用CE路由器与汇聚交换机的链路中断后

主用CE路由器与汇聚交换机的链路中断后,根据部署的VRRP协议备用CE路由器成为master,但是软交换设备的网关不改变。

出流量:软交换端局->{1}->{9}->{3}->{10}->{5}->{12}->{8};入流量:由于主用AR路由器到软交换设备路径优于备用AR路由器到路径,因此入流量依然主用AR路由器->{7}->{11}->{6}->{12}->{5}。此时,如果{6}中断,将造成业务全阻。

3.2 主用CE路由器与主用AR之间链路中断

出流量:软交换端局->{1}->{9}->{4}->{11}->{6}->{12}->{8};入流量:备用AR路由器->{8}->{12}->{6}->{11}->{4}->{9}->{1};此时,如果{6}中断,将造成业务全阻。如果{3}中断,可能会造成业务全阻。

3.3 软交换设备的主用链路中断

出流量:软交换端局->{2}->{10}->{3}->{9}->{4}->{11}->{7};入流量:主用AR路由器->{7}->{11}->{4}->{9}->{3}->{10}->{2};此时,如果{3}中断,可能会造成业务全阻。

3.4 主用汇聚交换机宕机

出流量:软交换端局->{2}->{10}->{5}->{12}->{8};入流量:主用AR路由器->{7}->{11}->{6}->{12}->{5}->{10}->{2}

3.5 主用CE路由器宕机出流量

软交换端局->{1}->{9}->{3}->{10}->{5}->{12}->{8};入流量:备用AR路由器->{8}->{12}->{5}->{10}->{3}->{9}->{1}

3.6 CE路由器之间的相关故障

CE路由器之间的互联链路全部中断、软交换备用链路中断、备用汇聚交换机与备用CE路由器之间链路中断、备用CE路由器与备用AR路由器间链路中断、备用汇聚交换机宕机、备用CE路由器宕机:由于业务正常情况下,只通过{1}、{9}、{4}、{11}、{7}主用AR路由器疏通流量,因此只要主用侧设备、链路正常,备用侧链路或设备故障,不会影响业务的流量流向。

3.7 汇聚交换机之间的互联链路全部中断

通常情况下,汇聚交换机之间采用多条链路捆绑为一个TRUNK,其中单条链路的中断不会影响该TRUNK的正常。但是由于该TRUNK为VRRP的心跳检测链路,如果该TRUNK的所有链路都中断,将造成下挂软交换设备找不到网关,业务全阻。

4 应急启动条件及处理措施

4.1 故障判断过程

在MGW(新浦10.1.66.165/荣昌10.0.67.37)上ping荣昌Server (10.0.67.39),如果MGW能ping通荣昌Server,但是话务不通,则判断为软交换设备故障,启动软交换应急预案。

如果MGW不能ping通荣昌Server,或大量丢包,则判断为承载网故障,启动CE应急预案。立即检查CE设备情况,使用PING、TRACERT等手段,逐段判断链路是否正常。初步判定故障点后,如果业务仍不正常,则说明设备或链路故障,但由于某种原因,流量未自动切换到备用路由上,则启动如下处理过程。

4.2 CE故障处理流程以及应急方法

CE故障处理流程以及应急方法,此处理流程在MGW与Server之间通信异常,初步判断故障为承载网故障的情况下适用。

①若网管能正常使用,荣昌MGW1(10.0.67.37)无法PING通荣昌SERVER(10.0.67.39),则判断T64G部分端口故障,可为MGW1或SERVER重新分配端口,重新PING测,确认故障恢复;若网管也无法正常使用,则判断为T64G整机故障,则复位SIPI单板,将T64G-2倒换为主用。

②若新浦MGW2(10.1.66.165)无法PING通荣昌SERVER(10.0.67.39),则启动以下操作步骤。

在新浦MGW(10.1.66.165)上ping新浦MGW网关地址(新浦T600路由器VRRP的浮动IP地址):10.1.66.161;如果新浦MGW不能ping通MGW的网关地址,则定位为新浦MGW与新浦T600-1设备之间通信有故障,需要检查新浦MGW的地址和网关配置,检查新浦MGW与新浦T64G-1交换机,新浦T64G-1交换机与新浦T600-1路由器之间的链路以及设备状态。如果无法判断定位具体故障,则启用应急方法,如果启用应急方法后,MGW到Server通信仍异常,则直接转步骤3。

应急方法:Shutdown新浦T600-1的上下行端口和荣昌AR1与新浦T600-1互联的端口;或断开新浦T600-1的上行和下行链路。即:断开新浦T600-1与新浦T64G-1之间的链路,同时断开新浦T600-1与AR-1之间的链路。如果新浦MGW能ping通MGW的网关地址,则转步骤2。

③在新浦MGW(10.1.66.165)上ping AR-1路由器与新浦T600-1互联的接口地址(AR-1与新浦T600-1互联地址):10.0.64.177;如果新浦MGW不能ping通AR-1与新浦T600-1互联地址,则定为新浦MGW与AR-1之间通信故障,需要检查新浦T600-1与AR-1之间的链路是否正常工作,T600-1与AR-1设备运行是否正常。如果无法判断定位具体故障,则启用应急方法, 如果启用应急方法后,新浦MGW到荣昌Server通信仍异常,则转步骤3。

应急方法:Shutdown 新浦T600-1的上下行端口和荣昌AR1与新浦T600-1互联的端口;或断开新浦T600-1的上行和下行链路。即:断开新浦T600-1与新浦T64G-1之间的链路,同时断开新浦T600-1与AR-1之间的链路。如果新浦MGW能ping通AR-1路由器与新浦T600-1的互联地址,则转步骤3。

在荣昌Server(10.0.67.39)上ping Server网关地址(荣昌T600的VRRP浮动IP):10.0.67.33。如果荣昌Server不能ping通荣昌Server的网关地址(荣昌T600-1的VRRP浮动IP),则定位为荣昌Server与荣昌T600-1之间通信故障,需要检查荣昌Server的地址和网关配置是否正确,检查荣昌Server与荣昌T64G-1,荣昌T64G-1交换机与荣昌T600-1之间的链路是否正常,检查荣昌T64G-1和T600-1设备是否正常。如果无法定位到具体故障,则启用应急方法,如果启用应急方法后,新浦MGW到荣昌Server通信仍异常,则直接转步骤5。

应急方法:Shutdown 荣昌T600-1的上下行端口和荣昌AR1与荣昌T600-1互联的端口;断开荣昌T600-1的上行和下行链路。即:断开荣昌T600-1与荣昌T64G-1之间的链路,同时断开荣昌T600-1与AR-1之间的链路。如果荣昌Server能ping通荣昌Server的网关地址(荣昌T600-1的VRRP浮动IP地址),则转步骤4。

在荣昌Server上ping AR-1路由器的荣昌侧接口地址(AR-1与荣昌T600-1的互联地址):10.0.64.141;如果荣昌Server不能ping通AR-1与荣昌T600-1的互联地址,侧定位为荣昌T600-1与AR-1之间通信故障,需要检查荣昌T600-1与AR-1之间的链路是否正常,荣昌T600-1与AR-1设备是否正常工作。如果无法定位到具体故障,则启用应急方法,如果启用应急方法后,新浦MGW到荣昌Server通信仍异常,则转步骤5。

应急方法:Shutdown 荣昌T600-1的上下行端口和荣昌AR1与荣昌T600-1互联的端口;断开荣昌T600-1的上行和下行链路。即:断开荣昌T600-1与荣昌T64G-1之间的链路,同时断开荣昌T600-1与AR-1之间的链路。

如果Server能ping通AR-1与Server侧T600-1的互联地址,MGW到Server通信仍异常,则转步骤5。

4.3 疏导后业务的恢复测试

业务路由倒换后,从MGW ping MSC SERVER,观察ping测是否丢包,时延是否正常。如果ping测正常,说明MGW和MSC SERVER之间的IP承载恢复正常,观察业务是否恢复正常(详见“三、疏导后业务恢复测试”)。如果ping测不正常,说明MGW和MSC SERVER之间的IP承载仍有问题,回到“故障初定位和处理措施“,进行下一步的处理。

参考文献:

[1] 李家龙,陈燕林,王松柏.软交换系统A/Iu CS口IP化改造的研究与应用[J].数字技术与应用,2014,(5).

[2] 任华,孙建强,王晓周.软交换核心网CE设备安全保障探讨[J].电信工程技术与标准化,2013,(5).

猜你喜欢
路由器应急
多维深入复盘 促进应急抢险
买千兆路由器看接口参数
维持生命
路由器每天都要关
完善应急指挥机制融嵌应急准备、响应、处置全周期
应急管理工作没有节假日
路由器空闲时是否需关闭
应急管理部6个“怎么看”
无线路由器的保养方法
国际新应急标准《核或辐射应急的准备与响应》的释疑