黄智瀛,白锡添,杜安静
(中国移动通信集团广东有限公司深圳分公司,广东 深圳 518038)
5G有非独立组网(Non-Stand Alone,NSA)和独立组网(Stand Alone,SA)两种组网方式[1]。5G NSA网络语音主要采用VoLTE的解决方案,由4G LTE网络承载。5G SA网络的语音解决方案主要有VoNR(Voice over NR)和EPS FB(EPS Fallback)两种。VoNR是由5G网络(无线网+核心网)和IMS系统承载语音业务。EPS Fallback主要指从NR回落到4G LTE通过VoLTE的方式实现语音业务[2]。在当前5G SA阶段,主要采用EPS Fallback方式。在EPS Fallback通话结束后,为保障用户感知,终端需要快速返回5G NR,即快速回落(Fast Return,FR)。5G SA组网与NSA组网的语音业务差异明显,信令承载在NR侧,信令面(接入、切换和掉话)优化分析需基于NR网络,无法继承NSA网络LTE信令面优化,因而需要全新的信令面分析方法来应对语音体验的挑战。5G SA路测优化中,语音业务相关的指标主要有EPS FB和FR的成功率与时延等。本文结合实际网络优化经验,详细剖析5G SA语音端到端信令流程,总结出5G SA语音端到端的信令分析与优化方法。
当5G网络还没有部署VoNR时(即NR还无法提供语音业务承载时),语音业务采用回落的方式,即EPS FB的方式承载到LTE[3]。EPS FB按照执行方式分为基于重定向和基于切换两种方式。同时,Fast Return也分为基于重定向和基于切换两种方式。EPS FB和Fast Return业务判决流程分别如图1所示。
图1 EPS FB与Fast Return的业务流程
EPS FB和FR的业务流程主要通过制定对应的策略实现。制定策略时需要综合考虑语音业务建立时延和数据业务中断时延等因素。
深圳移动5G SA语音策略如下:
(1)EPS FB回落LTE频点只配置锚点FDD 1800和室分的E/F频点,同时通过优先级+连接态频率偏置的设置,确保只有在室内区域回落到室分的E频段;
(2)FR策略基于最佳性能考虑,FR返回策略选择“切换”模式,由于NR4.9主要用于热点,覆盖不连续,Fast Return只返回到2.6 GHz覆盖层。
5G SA语音路测优化时如果发现EPS FB问题,则进入路测信令分析过程。该过程主要是根据路测信令对比EPS FB正常流程进行分析,从而确认导致EPS FB失败的场景和原因,并解决出现的问题[4]。基于切换的EPS FB信令流程如图2所示。
EPS FB的具体分析信令过程和对应的分析与优化方法如下。
步骤1:当UE发起EPS FB呼叫时,主叫UE发送ESR后,NR侧核实是否成功建立RRC。若未成功,则确认当前NR覆盖情况。如果覆盖正常且RRC建立失败或无响应,则依据NR随机接入失败的定位方法分析NR侧问题。
步骤2:检查主叫NR gNodeB侧是否发送测量控制,若未下发B1测控,则:
(1)检查对应小区的移动性开关和EPS FB开关是否开启;
(2)核查该站点4G邻区是否添加;
(3)检查外部邻区频点的优先级是否为推荐的优先级策略。
步骤3:UE是否上报B1测量报告,若未上报,则:
(1)检查小区的B1测量报告上报的判决周期设置是否正常;
(2)查询EPS FB门限配置是否合理,避免周边无符合条件的LTE小区;
(3)检查对应LTE小区是否存在弱覆盖或者小区故障。
步骤4:检查NR侧是否触发NR至LTE的切换或者重定向,若未触发,则:
图2 基于切换的EPS FB流程
(1)检查此小区是否配置正确的邻区;
(2)检查LTE的邻区是否存在PCI冲突;
(3)在gNodeB进行信令跟踪,检查是否5GC核心网导致的切换命令未下发;
(4)如果所有的邻区切换准备都失败,则根据频点优先级盲重定向至LTE小区。
步骤5:检查主叫UE是否在LTE发起RRC接入,并且成功建立RRC。若未成功,则从LTE侧分析RRC接入失败的具体原因。LTE侧的分析方法已较成熟,此处不再赘述。
步骤6:检查主叫UE是否发起并完成TAU流程,UE若收到TAU Reject消息,则需要在核心网MME侧进行信令跟踪,判断TAU Reject的原因。
步骤7:检查被叫UE是否收到Paging消息,若未收到,则分析此时被叫UE是否有其他流程。如果被叫没有其他流程但仍旧未收到Paging消息,则需要跟踪核心网AMF和gNodeB侧的信令来定位问题。
步骤8:检查主叫UE是否成功收到Update/180 ring消息,若未收到,则基于IMS侧返回的错误码判断失败原因。比如,返回错误代码487,表示IMS侧存在异常。
5G SA语音路测优化时如果发现FR问题,则进入路测信令分析过程。该过程主要是根据路测信令对比FR正常流程进行分析,从而确认导致FR失败的场景和原因,并解决出现的问题。基于切换方式的Fast Return流程如图3所示。
图3 基于切换方式的Fast Return流程
Fast Return的具体分析信令过程和对应的分析与优化方法如下。
步骤1:当EPS FB呼叫结束后,检查主叫LTE侧是否发送B1测量控制。若未下发,则:
(1)检查对应LTE小区的移动性开关和Fast Return开关是否打开;
(2)核查站点的5G邻区是否添加;
(3)检查5G邻区的异频频点和外部邻区频点的优先级是否正确配置;
(4)检查UE的切换策略,即对于存在的QCI,有无设置为必须切换且没有不能切换的承载。
步骤2:检查UE是否上报B1测量报告,若未上报,则:
(1)查询EPS FB门限配置是否合理,避免周边无符合条件的5G小区;
(2)检查周边NR小区是否弱覆盖或者小区故障;
(3)排查UE是否存在问题。
步骤3:检查LTE侧是否触发LTE至NR的切换或者重定向流程,若没有触发,则:
(1)检查小区是否配置外部邻区;
(2)检查小区是否配置邻区关系;
(3)检查NR的邻区是否存在PCI冲突;
(4)在eNodeB侧进行信令跟踪,排查是否为5GC核心网导致的切换命令未下发。
步骤4:检查主叫UE是否在NR发起RRC接入,并且成功建立RRC。若未成功,分析此时NR侧的覆盖、干扰以及容量等情况,按常规流程分析NR侧的RRC接入问题。
步骤5:检查主叫UE是否发起注册更新流程和注册更新消息是否完成。UE若收到注册更新失败消息,则需要在核心网AMF侧进行信令跟踪,判断更新失败的原因。
5G SA语音EPS FB流程复杂,涉及终端、4G基站、5G基站、4G核心网、5G核心网以及IMS域等。EPS FB接入时延分析主要基于终端侧信令流程分为多个不同阶段。信令包含SIP消息和L3信令部分。EPS FB接入时延分段及各段的典型值如图4所示,分为T1~T7共7个阶段,总典型值为4 s左右。
图4 EPS FB时延流程分段
针对呼叫建立时延问题,采用流程分段来分析。
(1)T1段(起呼),从主叫起呼到B1测量控制下发。
主要信令过程包括:
①NR侧RRC Request到NR侧Invite,主要为UE在idle状态下发起业务,先进行RRC建链过程。它主要核查是否存在空口覆盖或者干扰等原因导致空口丢包等。
②SIP消息Invite到SIP消息100 Trying。该过程在P_CSCF收到主叫的invite消息后,先给UE发送100 Trying,然后再与PCF交互。
③SIP消息100 Trying到B1测量控制下发RRCReconfiguration。主叫侧收到100 Trying后,网络侧P_CSCF(SBC)向5GC、gNodeB请求专有承载的建立。gNodeB根据配置,拒绝QCI=1的建立并触发EPS FB的流程。此时gNodeB向UE发送B1测量控制消息,若该过程时延较大,主要在P_CSCF(SBC)、SMF、AMF以及gNodeB上进行抓包分析,重点关注SMF与AMF处理流程。
(2)T2段(测量),从B1测量控制下发RRCReconfiguration到B1测量上报Measurement Report。如果此段时延比较大,主要原因为UE内部对外部信号测量机制导致,包括终端原因、无线覆盖弱以及异频频点配置不合理等[5]。
(3)T3段(切换判决),从B1测量上报MeasurementReport到切换命令MobilityFromNRCommand。该段时延主要涉及gNodeB收到B1测量报告后选择切换目标小区,通过AMF、N26接口、MME以及eNodeB预留切换资源,且可通过单用户抓包分析定位处理过程中时延较长的点。
(4)T4段(回落),从收到切换命令Mobility FromNRCommand到发送TAU请求。
①切换命令到切换完成RRCConnectionReconfigurationComplete,主要是切换执行阶段。如果时延较长,主要考虑空口因素导致的时延增加,如覆盖陡降等场景。
②切换完成到TAU Request,此段主要为UE在LTE侧入网过程中接入、UE能力查询阶段。此过程要考虑空口的覆盖、干扰影响的时延,还需要考虑无线与核心网交互之间是否带来额外时延。
(5)T5段(TAU),从TAU Request到TAU Complete。若此段时延较大,主要在于核心网侧,可在5GC核心网的AMF、SMF网元跟踪数据包进行分析。
(6)T6段(被叫建立),从TAU Complete到183 Session Progress。若此段时延较大,主要为被叫侧引入,可以查看被叫侧UE是处于Idle状态还是处于Connect状态,以及被叫P_CSCF与PCF之间的交互时延等。
(7)T7段(振铃),从183 Session Progress到180 Ring。它主要为主被叫媒体面编解码协商的过程与SIP信令面的交互。此段弱时延较大,要关注主被叫UE和主被叫P_CSCF(SBC)对编解码处理的时延,以及排查主被叫空口是否由于覆盖、干扰、切换等因素导致时延变大。
在深圳移动SA语音性能攻坚优化中,应用SA端到端信令面分析与优化的方法,识别出4个维度12类问题,并从语音策略、端到端流程和基础网络(邻区、NR/FDD1800质差)3个方面进行优化提升,使得SA语音整体指标达成目标。
经过11轮测试优化,SA语音信令端到端优化效果如下:
(1)EPS FB接通率从81%提升到99.69%,解决的典型问题包括:
①因5G至4G重定向TAU拒绝导致EPS FB失败,MME完成升级后已解决;
②修补全网5G至4G邻区1万余条,解决了200多个由于邻区漏配、PCI混淆以及邻区一致性等问题导致的EPS FB失败问题;
③通过RF调整优化FDD1800质差问题点200多个,提升EPS FB回落成功率;
④因5GC、DNS数据不全导致语音建立失败,定位核心网问题约10多个。
(2)EPS FB时延达标率从96.46%提升年到98.45%,典型经验与优化措施包括:
①EPS FB由切换模式改为盲重定向模式,时延提升约250 ms,并全网推广;
②邻区乒乓切换优化,即全网优化乒乓切换问题点150多个,减少切换时延约1 s;
③通过RF调整优化回落至FDD1800质差小区的问题点200多个,降低回落时延;
④升级网络版本解决流程冲突导致的EPS FB时延大。
(3)Fast Return返回时延从7 s减少到1.3 s,解决的典型问题包括:
①2.6 GHz与4.9 GHz多频组网问题,通过调整策略让FR不再返回4.9 GHz,降低FR时延;
②NR质差问题,通过RF优化解决NR质差和弱覆盖问题约200多个,降低了FR时延。
深圳示范网格SA语音指标11轮优化指标提升过程情况如图5所示。
图5 深圳示范网格SA语音11轮优化指标提升情况
语音业务是5G SA网络的基本业务之一。在SA网络商用之前,通过遍历测试充分发现并解决网络问题是网络优化的主要手段,有效保障语音“打得通,听得清,不掉话”体验,是5G SA语音网络建设的里程碑。本文介绍了SA语音EPS FB和Fast Return的业务流程与策略,结合实际网络优化经验,剖析了EPS FB和Fast Return的端到端信令流程。针对信令过程中的各种失败问题和时延问题,详细分析可能的原因和优化措施,提出了一套5G SA语音分析与优化方法。