李 龙,周 健
(1. 爱立信(中国)通信有限公司,北京 100102;2. 广东赛诺科技发展有限公司,广东 南海 528200)
在传统的移动通信网络中,一个 RNC/BSC只能与一个MSC相连,而在MSC POOL组网中,一个RNC/BSC可以与多个MSC相连,MSC POOL的方案基于3GPP的标准TS 23.236“Intra Domain Connection of RAN nodes to Multiple CN Nodes”,MSC POOL 技术简称为 A-Flex(GSM),Iu-Flex(WCDMA),MSC POOL可以在MSC间分担网络负荷,提升整个核心网资源利用率,节省设备投资。实现MSC级的容灾备份,提高网络可靠性。减少局间位置更新,降低C/D接口信令流量。减少局间切换,提高用户通话质量。
(1)NRI长度为7位。
(2)23 bit位:预留,缺省值为“0”。为今后省际间相邻POOL的NRI分配冲突或扩容预留。
(3)21~22 bit位:省内自行按四色原理规划,保证POOL间NRI不重复。
(4)17~20 bit位:POOL内区分每个MSC-S的标识。按照上述原则,NRI使用7位,则每个NRI支持50万用户,NRI应该按照4色原理分为如下4组:
(1)000XXXX:包含 14个 NRI,取值为 2~15(0和 1建议不用,防止池组外手机携带该相同NRI接入池组,导致负荷分配不均)。
(2)001XXXX:包含16个NRI,取值为16~31。
(3)010XXXX:包含16个NRI,取值为32~47。
(4)011XXXX:包含16个NRI,取值为48~63。
?
TMSI它包含一个NRI域,NRI域位于TMSI的第23~14 bit。在定义NRI时,可以定义其长度和值。NRI长度的范围是0~10 bit。MSC POOL功能的实现依赖于MSC池中的各MSC启用TMSI重分配功能,包括位置更新时分配TMSI和业务接入时分配TMSI。
(1)MSC Server广播当前可用容量方式:①MSC Server可以向与之相连的MGW广播当前MSC Server的负荷状况;从而使MGW能够根据各MSC Server当前可用容量动态调整负荷;②可设定是否下发以及广播的起始时间、广播周期;③MGW根据收到的各 MSC Server的当前可用容量对新接入本 MSC POOL的用户进行负荷分担;④核心技术:动态调整分发算法。
(2)手动配置MSC Server容量方式(必须配置):在MGW上手动配置 MSC Sever容量,MGW 根据手动配置的 MSC Server容量进行用户分发。
(3)如果两种方式同时打开,MGW首先采用“MSC Server广播当前可用容量”方式。
(4)符合自动调整只对未选择MSC Server的用户有用,适合小步幅、自动调整。
(5)对运营的好处:①MSC Server和MGW间的负荷通知机制不涉及无线侧网元,在CN侧内部完成,不需要CN节点和RAN节点紧耦合;②解决了因为MSC与BSC之间A接口无负荷反馈机制,导致BSC无法自动调整分发、必须运维人员干预的问题。
(1)根据TMSI中的NRI字段值分配话务和信令:BSC节点根据TMSI中的NRI字段值将话务和信令分配给池组中相关联的MSC成员。如果关联某个TMSI用户的话务或者信令中的NRI字段值没有相应的池组MSC成员与之对应,或者某个NRI字段值对应的池组MSC成员处于非ACTIVE状态,MSC Selection将被启用将相关信令和话务分配到新的池组MSC成员上。
(2)MSC过负荷处理:如果MSC池组中某个MSC成员过负荷,它将向池组内服务区内所有BSC发送OVERLOAD消息(BSSAP CL消息)。BSC收到OVERLOAD消息后,将丢弃部分分配到该过负荷MSC成员上的Mobile originated transactions。MSC中定义了在过负荷状态下OVERLOAD消息发送给 BSC的时间间隔。MSC Selection算法将只选取没有过负荷的MSC池组成员分配话务。在位置更新的过程中,当基于 TMSI的话务分配机制发现话务路由目的地的某个池组成员 MSC处于过负荷状态,这个位置更新操作将被拒绝。在极端情况下,如果池组内所有MSC成员都处于过负荷状态,BSC将拒绝所有A-bis接口收到基站的CHANNEL REQUIRED消息。处理紧急呼叫时,MSC Selection算法将不考虑MSC过负荷状态。
(3)在一些状况下,必须将登记在某个MSC池组成员中的用户用一种有效的手段移出以避免正在或预计发生的网络服务影响。MSC重选(re-selection)功能使得运营商将用户按比例(X%)的从某个MSC池组的成员移出并登记到另一个池组成员中。MSC重选(re-selection),意味着BSC将选择在自己覆盖内的并登记在某个池组中MSC中部分用户,使这部分用户在下一次位置更新操作时进行MSC成员重选。
(1)A接口的用户平面(User Plane):每个MSC池组成员拥有自己的 TDM 用户平面的设备(A-interface)在远端MGW/BSC中。所以,在MGW和BSC中的A接口的TDM设备必须分别针对每个MSC池组成员并分别进行规划设计。
图1 MSC POOL的组网应用图
(2)A接口的控制平面(Control Plane):①MSC中的总信令负荷与BSC中总的话务处理负荷(BSC能够处理的最大用户数量)成比例。如果BSC属于MSC池组区域内,BSC必须与MSC池组中所有的MSC成员之间开启信令链路。BSC对于每个MSC池组成员的总BSSAP信令负荷应相同,并平均分配于每条信令链路上。②无论BSC是否属于MSC池组与否,BSC与所有相连MGW之间物理链路上的总BSSAP负荷不受影响。即,BSC和MGW之间的用于承载BSSAP信令的物理设备资源T不受MSC池组配置的影响。
(3)针对MSC池组有“冗余”意味着当池组中某个甚至某些MSC成员发生故障不可用时,将会导致其他可用MSC成员及其相关A接口的冗灾时的负荷增加。即,针对分配给每个MSC池组成员的每个TDM设备组和BSSAP信令链路(MGW和BSC之间)设计时应该充分考虑到为冗灾的需要预留足够的空闲处理能力,用以应对各种不同的故障。
(4)每个MSC池组成员的SIGTRAN信令必须支持端到端的SCTP associations 到所有提供远端BSC接入的MSW。为了支持优化 MSC池组区域用户之间的话务连接(最短连接路径),我们建议每个 MSC池组成员能够选择并控制为池组内BSC提供连接的所有MGW。即,关于MGW选择的数据(MGG、路由等)必须在所有MSC池组成员中统一并一致的配置定义。同样,所有为池组内BSC提供连接的MGW必须统一并一致的配置定义所有MSC池组成员。即,每个MGW必须有针对每个池组成员MSC-X的相关虚拟MGW的VMGW_X配置和定义(X=1,2,Z..)。
(5)MSC容量受到的影响:MSC处理能力因MSC局间切换的减少而增加(池组内的MSC之间没有局间切换)减少到HLR的Location updates的负荷。
话务分配的变化:①地理位置相同的呼叫(同一BSC下)可能变成了不通MSC池组成员间的呼叫;②地理位置不同的呼叫(不同BSC下)可能变成同一MSC内的呼叫。
一般按照缺省的话务模型MSC可减少大约3%左右负荷,但实际减少的负荷取决于MSC池组当地的实际情况。池组内部MSC和MGW的同时处理话务能力SCC (Simultaneous Call Capacity)在池组功能激活前应重新评估设计。
(1)MSC Server故障是指该MSC Server不能正常处理话务,需要终止其服务功能,以免其对MIP中其他话务产生负面影响。根据MSC Server的不同故障原因,处理的具体步骤也会有一些差异。
但总的处理过程应为:①在MIP的BSC中,去激活到该故障MSC Server的信令链路,同时将该故障MSC Server的状态置为“INACTIVE”的状态。②登陆故障MSC_Server,在故障MSC_Server中去激活所有出局信令链路。至此,该故障MSC Server就已经和整个网络隔离开来了,不再有话务路由到该故障MSC Server上来。③根据网络的负荷状况,在BSC中适当调整位置更新的时间设置。④其相邻MSC/VLRs停止切换到退服MSC,删除相邻MSC group数据中退服MSC。与退服MSC有Co-operating VLR关系的MSC/VLR更新其Co-operating VLR相关定义。池组中的Proxy Co-operating VLR定义需更新。⑤检查池组中其他MSC成员中正常工作MSC Server的负荷和话务状况。检查的要点是CP的负荷、VLR中登记的用户数、出入中继的话务量和信令链路的负荷。如果检查过程中发现 CP超负荷、出入中继和信令链路拥塞等现象,则应按照相应的紧急处理流程进行处。简单说来,以下应急方法有助于减轻负荷,避免系统崩溃:闭POOL的边界站,以减少接入到POOL内的用户数,闭出入中继数。在MSC Server中取消系统鉴权功能来减轻系统信令负荷,打开选择性鉴权。关掉统计和系统指标测量,提高BSC中的小区的接入门限,限制接入某些小区。通过改变BSC中可接受的信道请求数来将话务扼杀在BSC中,以减轻系统的负荷。⑥进行拨打测试,看是否故障正在恢复。
在等待一个周期性位置更新时长后,所有的用户都能登记到新的MSC Server上并能进行各种业务。
(2)MSC Server故障恢复后,根据MSC Server的不同故障原因,恢复操作的具体步骤也会有一些差异。但在故障MSC Server恢复正常、需要重新引入到MSC POOL网络时,总的可按照以下步骤执行:①首先检查该 MSC Server中的数据和状态,确认已符合再入网条件。②登陆到该故障MSC Server上,激活所有的出局信令链路。③在MIP网络的每个BSC中激活到该MSC Server的信令链路,并将该MSC Server的状态置为激活。④在 BSC中重新设置容量因子,将到发生故障 MSC Server的值调大,将到其他MSC Server的容量因子调小,以便绝大多数新入网的用户都能登陆到该恢复的MSC Server上去,以加快池组中MSC Server之间的用户数的平衡。⑤在BSC中设置原有MSC的迁移因子,并将Mode设置为“RESELECT”。重选功能的开启和 PART值的设置能将一定比例的用户从原有的MSC Server上移走。⑥如果几个MSC Server之间的用户数有极大差异时,也可将用户数大的 MSC Server的状态设成“BARRED”的状态,这样,当用户主动接入(MO类话务)该MSC Server时,这些用户将被移走。⑦根据网络的负荷状况,适当调整BSC中位置更新的时长,以便加快用户的迁移。⑧在MSC中检查负荷和登记的用户数。⑨一旦MSC Server中的用户数基本均衡,则在BSC中将容量因子修改成原有的值,并将MSC的状态都置成“ACTIVE”的状态。⑩相邻MSC/VLRs恢复切换到恢复的MSC,重定义恢复MSC到相邻MSC group数据中。与恢复MSC有Co-operating VLR关系的MSC/VLR恢复原有 Co-operating VLR相关定义。池组中的 Proxy Cooperating VLR定义需恢复原有定义。
本文详细解析了移动通信网络中的MSC POOL工作原理、组网、故障描述及处理过程。以当前移动通信网络为背景,阐述了MSC POOL在未来移动通信组网中的优势。
1 中国移动山东公司.爱立信 MSC-POOL原理及维护案例介绍,2010.10.
2 MSC POOL在移动网络应用与组网.电信网技术,2009.8.3 Ericsson Alex.