周 燕 赖彩明 中国联通江西省分公司云网运营中心 南昌市 330000
主叫呼叫视频炫铃用户时,炫铃平台与主叫终端间进行媒体会话更新流程(音频改视频),网络处理200与UPDATE发生乱序,触发491,乱序主要是消息处理时延、核心网消息转发机制、终端消息传送间隔三个因素叠加产生。
通过对现场反馈的信令码流进行分析,出现异常的呼叫出现在视频彩铃流程中。因为视频彩铃业务流程的引入,主叫侧需要连续发送200OK(UPDATE)消息和UPDATE消息,均携带SDP。如图1所示。
图1 中31步为资源预留完成后,被叫侧视频彩铃业务向主叫终端发送了视频彩铃的UPDATE消息,终端收到此UPDATE 消息后,向被叫侧依次发送36 步200OK(UPDATE)消息和37步UPDATE消息。这两条消息,进入核心网时的间隔时间非常短,经过多个网元转发后产生乱序,收到乱序消息的网元会针对乱序的UPDATE回复491 响应。图2 是从vMax 导出的全网码流,IBCF(91.200)收到乱序的UPDATE消息回复了491。如图2所示。
图2 乱序码
根据RFC3311协议定义,在发送携带SDP Offer请求消息的情况下,再收到对端的请求消息携带SDP Offer。此时需要发送491响应,对于收到491的一端,需要定时重发请求来解决冲突。如图3所示。由于200OK(UPDATE)消息和UPDATE 消息在这一流程中发送间隔较小,经过多个网元转发后产生乱序,协议也定义了收到乱序的网元发送491,终端收到491后重发UPDATE即可解决此问题。
图3 RFC3311针对491的定义及处理流程意见
从现场信令分析此场景,大部分终端收到491后能够重发UPDATE,使呼叫接通,极少部分终端不能正常处理发送CANCEL。
综合分析,SBC 返回200OK(UPDATE)消息和UPDATE消息间隔较小的原因是SBC到PCRF rx接口流程时延过长,大于同大区的江苏和浙江;VIMS核心网大区化后,承载网CR设置与大区中心不匹配(山东、河南、江苏),造成大区内信令消息无法从接入省直接送达大区,需要经过大区外承载网CR中转,而接入省和大区中心网元信令交互数量巨大,本案例中SBC 转发UPDATE前与PCRF交换的RX消息就需在江西IMS、江西EPC、江苏DRA三者之间diameter消息流转4个,数据包在江西与南京之间经上海CR转接,共传递8次,承载网总耗时约80ms(单次10ms),核心网设备处理开销约40ms,由此延误了SBC返回200OK(UPDATE)消息并造成200OK与UPDATE消息传至核心网乱序产生491。承载网拓扑路由如图4所示。
图4 承载网拓扑路由图
图5 IMS主叫平均接续时长图
(1)应急方案
EPC上针对号段修改基于签约接入融合SMF,使4G用户通过大区PCF网元进行RX流程,测试结果显示该方案可以优化30 毫秒左右时延,可以有效规避491问题,省内已部署5地市全号段基于签约接入融合SMF,已成功解决5地市问题终端掉话问题。
(2)优化方案
省内根据集团要求开通江西-南京承载网直达链路,业务路由直达后江西到南京承载网环回时延降低6ms左右,SBC发收AAR/AAA间隔降低约23ms,SBC主叫时延优化60ms左右,省内因491错误码导致的失败数量下降50%。
(3)长期方案
从以下几方面协调核心网厂家进行功能优化。
◎SBC版本优化,收到200消息后不等AAA,立即转发200消息,200与UPDATE间隔加大约80ms。
◎PCRF/PCF 版本优化,收到AAR 消息后不等RAA,立即响应AAA,200 与UPDATE 间隔加大约40ms。
◎研究IMS网络和视频炫铃平台对收到乱序消息纠错处理机制,减少网络侧发出491消息。
目前江西联通已实施了以下几个措施,成功解决了491流程冲突问题,同时优化VoLTE主叫平均接续时延超过300ms。
(1)承载B 网省内AR 直连江苏AR 的路由改造工作。
(2)EPC上针对全部省内号段修改基于签约接入融合SMF,通过大区PCF网元进行RX流程。
(3)SBC开启主叫RX流程不等位置信息。