5G语音关键技术和体验提升策略

2022-11-17 01:24王海飞马传项洪涛涌
江苏通信 2022年5期
关键词:时延语音编码

王海飞 马传项 洪涛涌 丁 博

中邮建技术有限公司

0 引言

5G时代,语音业务仍是必需的基本业务能力。5G沿用4G的话音架构,基于IMS提供话音业务。5G独立组网模式下,语音、视频和数据业务都承载在5G网络上,基于5G的大带宽、低时延特性,带来更佳通话体验。5G网络还新增一些针对语音的技术,进一步提升语音体验。

1 5G语音解决方案

5G组网类型分为NSA(non-standalone)组网和SA(standalone)组网两类,不同组网类型的语音解决方案不同。5G语音解决方案演进路径如图1所示,运营商可以根据其5G网络的建设情况选择合适的演进路径。

图1 5G语音解决方案演进路径

1.1 NSA组网下语音解决方案

NSA组网下的5G语音解决方案采用的是4G语音解决方案,当4G网络支持VoLTE(即部署了IMS)时,5G终端在4G网络中直接基于VoLTE进行语音业务。当5G终端处于LTE小区覆盖边缘时,语音业务通过SRVCC切换至2G或3G网络。具体实现方式如图2所示。

图2 5G终端基于VoLTE进行语音业务

当4G网络不支持VoLTE(即未部署IMS)时,5G终端的语音业务通过CS Fallback回落至2G或3G网络。具体实现方式如图3所示。

图3 5G终端基于CS Fallback进行语音业务

1.2 SA组网下语音解决方案

当5G网络支持VoNR时,5G终端直接基于5G网络进行语音业务。当5G终端处于NR小区覆盖边缘时,语音业务通过PSHO(packet switched handover)切换至4G网络,即采用4G网络的语音解决方案。具体实现方式如图4所示。

图4 5G网络支持VoNR时的语音解决方案

当5G网络不支持VoNR时,5G终端的语音业务通过EPS Fallback回落至4G网络。具体实现方式如图5所示。

图5 5G网络不支持VoNR时的语音解决方案

上述两种方案中都涉及到了5G回落到4G的技术,即VoNR的PSHO和EPS Fallback,且都是在5G网络覆盖变差的情况下使用的,那二者之间具体的差异是什么呢?

VoNR的PSHO:用户在拨打或接听语音电话时,优先基于5G网络进行VoNR业务,只有在进入到NR覆盖效果较差或无覆盖的场景下,才需要进行PSHO切换。PSHO切换不需要中断RRC连接(基于RRC重配置),属于无缝切换,因此基本不影响用户感受。

EPS Fallback:用户在拨打或接听语音电话时,在建立通话之前就必须从5G网络通过PSHO切换或重定向回落至4G网络进行VoLTE。目前一般采用PSHO切换和重定向同时部署的方式,而重定向方式下会中断RRC连接,整体回落时间相对较长。不管采用哪种方式,EPS Fallback的接入时延都比VoNR更长一些,对用户感受的影响较大。

1.3 不同解决方案语音质量对比

不同解决方案的语音MOS(mean opinion score)分值和接通时延对比如表1所示。

表1 不同语音方案的MOS分和接入时延

2 VoNR关键技术

5G网络新增了一些关键技术,包括EVS语音编码、ROHC语音包头压缩等,用于保障VoNR通话质量,提升用户使用体验。

2.1 EVS语音编解码

5G智能终端默认语音编解码器使用3GPP标准化增强语音服务(EVS),与2G到4G网络中的窄带语音和高清语音相比,它提供了更好的语音质量体验。

如表2所示,EVS通过支持多速率语音编码,提升编码的灵活性和效率,运营商可根据现网中的终端能力等因素来选择需要支持的语音编码速率。

表2 EVS不同编码方式支持的编码速率

EVS与其他常用语音编码方式相比,可以提供更高的语音质量。如图6所示,采用EVS编码(EVS-SWB或EVSFB)后,MOS分可达4.6分,已接近满分5分,因此采用EVS编码使得5G语音质量提升了一个大台阶。

图6 EVS编码体验提升效果

2.2 ROHC语音包头压缩

语音编码过程中的压缩环节,可以有效减少语音信号中的冗余信息,节省传输和存储资源。经过语音编码过程的压缩环节后,会得到语音编码速率,语音编码速率×语音帧的发送或接收周期=语音帧大小,也就是常说的语音数据包。ROHC(robust header compression)压缩的对象就是语音数据包的包头部分。如表3所示。

表3 IP语音数据包的头部开销

2.3 基于MAC CE调速

MAC CE即MAC Control Element,用 于gNodeB和UE之间的MAC层控制信令。基于MAC CE的调速功能支持gNodeB根据上行空口能力,通过MAC CE向UE提供推荐速率信息;同时支持UE在空口能力提升时向gNodeB查询推荐速率。该功能可以协助UE进行更合理的语音速率调整,即协助UE通过调整编码速率来应对空口速率变化。

推荐空口速率依据3GPP协议约定,示例中的推荐速率分别对应推荐速率表中的Index 11和Index 14,如表4所示。在协议中未约定空口速率对应的语音编码速率,需要依据产品的具体实现而定。

表4 推荐速率表

Index NR Recommended Bit Rate value (kbit/s)17 120 18 140………

3 5G语音体验提升技术

为进一步提升VoNR语音通话质量,各厂家还开发了一些技术来支撑VoNR,主要包括:(1)基于重传次数增加的覆盖优化;(2)上行RLC(radio link control)分段优化;(3)MCS(modulation and coding scheme)优化;(4)上行RB预留;(5)基于语音质量的异频切换;(6)禁止切换入异站非VoNR邻区;(7)基于覆盖的VoNR和EPS Fallback自适应;(8)禁止基于测量方式配置SCell;(9)与站内UL CoMP功能配合优化;(10)与窄带宽BWP2和DRX功能配合优化。

3.1 基于重传次数增加的覆盖优化

5QI1承载只能采用UM模式,gNodeB针对语音数据包最多4次HARQ调度重传,如果用户处于小区边缘,即使重传4次也可能无法准确传输。增加HARQ重传次数,增加上行重传机会,提高上行数据传输的成功率。在降低丢包率、提高覆盖率的同时,每增加一次HARQ重传,会增加一定时延。

3.2 上行RLC分段优化

当信道质量较低时,上行动态调度分配的TBS(Transport Block Size)会随之调小,使得RLC分段变多。RLC分段变多会导致VoNR语音包时延增大、丢包率抬升以及上行开销增多问题。上行RLC分段优化功能通过限制上行动态调度分配的TBS来控制上行RLC分段数,以提高信道质量较低时的语音质量。

3.3 MCS优化

MCS优化包括上行MCS选阶优化和下行MCS快速降阶两部分,均支持为VoNR用户选择合适的MCS阶数来提升语音传输质量。

3.4 上行RB预留

gNodeB为语音业务预留特定位置和数量的RB资源,在资源不足时,保障语音业务资源。语音用户可优先使用预留的RB资源,预留的RB资源被占满后可以继续申请使用非预留的RB资源,非预留的RB资源按照正常的调度流程分配。

3.5 基于语音质量的异频切换

当网络中存在语音质量低的VoNR用户时,支持对这类用户进行基于语音质量的异频切换,以确保用户的语音业务体验。基于语音质量的异频切换遵循与基于覆盖的异频切换相同的流程,仅支持测量模式,不支持盲模式。其中的切换功能启动判决、测量控制下发和测量报告上报的实现与基于覆盖的异频切换存在差异。

3.6 禁止切换入异站非VoNR邻区

当VoNR用户向不支持VoNR的异站邻区切换时,由于切换过程中的同频干扰可能导致RRC重建或掉话,影响语音业务体验。本功能支持gNodeB禁止VoNR用户切换至不支持VoNR的NG-RAN异站邻区。并且,当VoNR为非连续组网时,gNodeB会进一步指示VoNR用户对E-UTRAN邻频点进行测量,在满足切换条件的情况下,VoNR用户可从NG-RAN小区切换至E-UTRAN邻区。

3.7 基于覆盖的VoNR和EPS Fallback自适应

当网络中同时支持VoNR功能和EPS Fallback功能时,UE能够自适应选择进入EPS Fallback语音呼叫流程或VoNR语音呼叫流程,以确保语音用户处于最佳覆盖状态。

3.8 禁止基于测量方式配置SCell

当CA(Carrier Aggregation)用户基于测量方式配置SCell(Secondary Cell)时会产生GAP测量,而GAP测量期间会因为停止调度而影响语音业务体验。本功能支持对于进入CA状态后再发起VoNR语音业务或发起VoNR语音业务后再进入CA状态的用户,禁止通过下发异频测量的方式配置SCell,避免GAP测量对语音业务体验的影响。

3.9 与站内UL CoMP功能配合优化

当VoNR功能和站内UL CoMP功能同时开启时,gNodeB支持对VoNR用户生效站内UL CoMP功能,并提高VoNR用户生效站内UL CoMP功能的优先级,从而提升VoNR语音业务在小区交叠区域的上行传输可靠性以及上行覆盖能力。

3.10 与窄带宽BWP2和DRX功能配合优化

本功能基于不同的问题和场景分别通过支持如下功能来避免VoNR语音包的丢包和传输时延增大等问题。

(1)支持基于VoNR用户数不生效窄带宽BWP2。由于窄带宽BWP2的带宽有限,PDCCH资源以及可用PUSCH资源受限,会导致语音包调度阻塞、丢包和传输时延增大的问题,这类问题会随着VoNR用户数的增加而加重。

(2)支持在5QI1承载建立前不生效DRX。当DRX功能生效时,VoNR用户在休眠期无法进行调度,使语音包传输时延增大并导致丢包。本功能支持在语音呼叫建立过程中推迟DRX生效。即gNodeB在语音主叫用户5QI1承载建立前不生效DRX,可以有效降低该用户的语音承载建立时延。

(3)支持基于信道质量不生效窄带宽BWP2或DRX。对于处于窄带宽BWP2状态或处于DRX工作模式的VoNR用户,在信道质量变差时,gNodeB将支持该小区内的VoNR用户从窄带宽BWP2切换至全带宽BWP1或退出DRX,以更有效地降低传输时延和丢包,从而提升语音质量。

(4)支持在拥塞场景下不生效窄带宽BWP2。对于处于窄带宽BWP2状态的VoNR用户,当小区的窄带宽BWP2资源不足导致用户拥塞时,gNodeB对新接入该小区的VoNR用户不再配置窄带宽BWP2,同时禁止已接入该小区的VoNR用户切换至窄带宽BWP2,以更有效地降低传输时延和丢包,从而提升语音质量。

3.11 语音用户的PUSCH功率差异化配置

语音用户的PUSCH功率差异化配置:在空口质量较差的场景,语音数据包丢包的概率增加,但是此时UE可能还未满功率发射,为提高语音小包业务可靠性,可提高用户PSD,确保满功率发送语音包。

针对语音用户,设置差异于数据用户的PSD:(1)为提高VoNR小包业务可靠性,在功率没有用完的情况下,可增大功率谱密度;(2)通过配置VoNR PUSCH功率偏置,保证UE发送小包业务时功率可用满。

3.12 ROHC语音包头压缩与头解压失败恢复

gNodeB将在用户使用语音业务时启动ROHC流程,通过减少语音包头部负荷降低无线链路时延,减少无线资源消耗。ROHC头解压失败恢复功能,可减少丢包,减少MOS值降低概率,同时避免在远点时退出ROHC引起语音中断丢包,提升覆盖。

4 结束语

高质量的无线环境是保障VoNR语音质量的“基础”,VoNR端到端问题分析定位是“难点”。打得通、接得快、无掉话、听得清是VoNR的4个关键指标。VoNR性能指标受终端、空口、基站、传输、核心网等多种因素影响,都有可能导致服务质量下降。

针对农村等广覆盖区域,5G网络的连续覆盖是保障VoNR通话的关键。而在城市场景,无线环境复杂,室外重叠覆盖、室内弱覆盖场景则成为影响VoNR通话质量的关键因素。覆盖问题解决周期较长,需要提前识别并制定措施,提升VoNR业务感知。

本研究对VoNR技术的先进性和优化方案进行了研究分析,对VoNR的技术方案、特性、优化提升进行了阐述。RF性能是基础,VoNR语音质量是重点,端到端定位是难点。VoNR语音相对数据业务,对网络覆盖、邻区规划、系统干扰、传输质量等的影响更敏感,对网络优化的要求更高。在聚焦VoNR优化的同时,打造VoNR优质网络具有重要意义。

猜你喜欢
时延语音编码
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
基于GCC-nearest时延估计的室内声源定位
Genome and healthcare
对方正在输入……
基于改进二次相关算法的TDOA时延估计