软交换GSM-R 核心网的容灾能力及测试

2011-08-15 00:51甘从海尚长顺
电气化铁道 2011年2期
关键词:容灾核心网测试

甘从海,尚长顺

0 引言

GSM-R(GSM for Railways)系统是专门为铁路通信设计的综合专用数字移动通信系统。它主要提供无线列调、编组调车通信、区段养护维修作业通信、应急通信、隧道通信等语音通信功能,可为列车自动控制与检测信息提供数据传输通道,并可提供列车自动寻址和旅客服务。

随着铁路建设规模的不断扩大,铁路通信的安全可靠性日趋重要。由于移动交换机在铁路网络中的特殊地位,它往往覆盖较大范围的多条线路,当出现重大灾难情况时,如人为操作失误、设备故障、自然灾害等,移动交换机的故障可能会导致大范围的业务中断,严重影响多条铁路线的运营安全。因此,核心网必须具备热备份的容灾(Disaster Tolerance)能力,以确保网络的安全性和可靠性。

1 软交换GSM-R 移动通信网络组成

软交换GSM-R 移动通信网与传统GSM-R 移动通信网的主要区别在于软交换GSM-R 核心网引入了控制和承载分离的软交换架构,将传统网络中的MSC(移动交换中心)分离成MSC Server 和MGW(多媒体网关),其中MSC 服务器负责信令处理、路由和业务;MGW 负责媒体流处理。软交换GSM-R 移动通信网络组网示意图略。

2 容灾的定义及评价标准

在给出容灾的定义之前,有必要先给出灾难的定义。从一个信息系统的角度讲,一切引起系统非正常停机的事件都可以称为灾难。大致可以分为3种类型:(1)自然灾害,包括地震、火灾、洪水、雷电等;(2)设备故障,包括系统的CPU、硬盘等损坏,电源中断以及网络故障等;(3)人为操作破坏,包括误操作、人为蓄意破坏等。

容灾就是在上述灾难发生时,在保证生产系统的数据尽量少丢失的情况下,保持系统的业务不间断地运行。

现在工业界都以数据丢失量和系统恢复时间作为标准,对某个容灾系统进行评价,公认的评价标准是RPO(Recovery Point Objective)和RTO(Recovery Time Objective)。

RPO:恢复点目标,以时间为单位,即在灾难发生时,系统和数据必须恢复到的时间点要求。RPO 标志系统能够容忍的最大数据丢失量。系统容忍丢失的数据量越小,RPO 的值越小。

RTO:恢复时间目标,以时间为单位,即在灾难发生后,信息系统或业务功能从停止到必须恢复的时间要求。RTO 标志系统能够容忍的服务停止的最长时间。系统服务的紧迫性要求越高,RTO的值越小。

3 软交换GSM-R MSC 容灾能力与测试

3.1 容灾能力分析

传统的GSM-R MSC 组网模式下,1 个BSC(基站控制器)只能和1 个MSC 相连,因此当1 个BSC到MSC 的话务拥塞并不能将拥塞的话务疏导到其他MSC 下,可能造成话务拥阻甚至瘫机。

软交换GSM-R MSC 容灾采用MSC 双归属方式。MSC 双归属是指MGW 与一个以上的MSC Server 连接,平常注册到一个MSC Server 上,当该MSC Server 故障后,MGW 会自动注册到另外一个MSC Server 上。一个MSC Server 也可以控制多个MGW。不同的MSC Server 和MGW 可以放置在不同的地域,以实现异地容灾备份。

MSC 双归属可以采用以下3 种不同的模式:

(1)1+1 主备用模式。2 个MSC Server,一个承担所有的业务,而另一个不承担业务。数据备份链路用来实时同步主备MSC Server 之间的数据配置、用户数据等。心跳链路用来检测配对的MSC Server 是否正常,以便判断是否倒换。

(2)1+1 负荷分担模式。在该模式下,2 个MSC Server 各自都承担部分业务。正常情况下,MGW1 注册到MSC Server1,MGW2 注册到MSC Server2,BSC1 连接到MSC Server1,BSC2 连接到MSC Server2。如果MSC Server1 故障,则业务按如下路径进行处理:BSC1→MGW1→MSC Server2,BSC2→MGW2→MSC Server2。该方式下2 个MSC Server 应尽量异地安装。

(3)N+1 备份模式。在该模式下,一个MSC Server 作为另外N 个MSC Server 的备份,这个备份MSC Server 平时不承担业务,只有当另外N 个MSC Server 其中之一故障时,才承担故障MSC Server 的业务。

在GSM-R 网络中,由于网络容量不大,目前开通的软交换MSC 只采用了1+1 主备用方式。相比1+1 负荷分担模式,该方式的优点是逻辑上只有一个MSC,减少了维护的复杂度,避免了MSC间的切换。缺点是抗自然灾害能力差。

3.2 测试方法

为了保证GSM-R 核心网的安全可靠,必须对其容灾能力进行测试。在成都、太原、沈阳等铁路局,对软交换GSM-R MSC 核心网进行了不同项目的测试,具体方法如下:

(1)主用/备用MSC Server 数据同步测试。在主用MSC Server 新开一些测试中继链路进行大话务量测试,通过人机命令进行MSC Server 切换,检查备用MSC Server 数据与主用MSC Server 数据是否一致,记录PRO。确认大话务量测试是否正常。

(2)1+1 主备用方式(MSC Server 故障)测试。采用软件退出服务或强制断电方式使主用的MSC Server 处于故障状态,检查正在进行的通话是否中断,可否立即建立新的呼叫。从不能立即建立呼叫记录到可建立呼叫的时间作为恢复时间目标RTO。

(3)1+1 负荷分担方式(MSC Server 故障)测试。采用软件退出服务或强制断电方式使MSC Server1 处于故障状态,检查正在进行的通话是否中断,可否立即建立新的呼叫。恢复MSC Server1,待从网管上确认系统恢复正常之后,再使MSC Server2 处于故障状态,检查正在进行的通话是否中断,可否立即建立新的呼叫。该方式下应不影响立即建立新的呼叫,否则可判为未满足 MSC SERVER 负荷分担方式。

(4)MGW 负荷分担测试。采用分别断开MGW1 或MGW2 与MSC Server1 的链路,使其中的一个MGW 工作,进行各种呼叫拨测,如MS(移动台)↔MS,MS↔FAS(铁路调度系统)用户,MS↔PSTN(公共电话交换网)用户,保证2 个MGW 单独工作时均能进行各种呼叫。否则可判为未满足MGW 负荷分担方式。

4 结束语

在实际测试中发现有些设备主用/备用MSC Server 数据同步功能不完善,需要人工对2 个MSC Server 同时操作,若只对其中的一个MSC Server操作,就会造成数据不同步。1+1 主备用方式也会造成系统全局业务中断数分钟,在目前尚未实现不影响业务完成主/备MSC Server 倒换。

猜你喜欢
容灾核心网测试
幽默大测试
GSM-R核心网升级改造方案
“摄问”测试
“摄问”测试
“摄问”测试
5G移动通信核心网关键技术
关于建筑企业容灾备份系统方案的探讨
基于中兴软交换的电力通信网络容灾系统建设
基于数据容灾技术在企业信息系统中的应用研究
核心网云化技术的分析