杨拓,胡丽洁,王飞,刘建军,胡南,李男,胡臻平
(1. 中国移动通信有限公司研究院,北京 100053;2. 中国移动通信集团有限公司,北京 100032)
5G NR 网络在为用户带来超高速率、超低时延体验的同时,也为5G 终端能耗带来更大的挑战。大带宽传输、更多的收/发天线数目会显著提升5G 终端的射频前端和收发链路的能耗,同时5G 网络支持eMBB、uRLLC 和mMTC 等多种业务,严格的时延要求和更复杂的数据处理需求也会显著提升基带处理器的计算和处理能耗。在4G网络时代,智能终端普遍只有1 天的待机时长,如果5G 终端不进行节能优化,其待机时长将会进一步下降,严重影响5G 终端和5G 网络的用户体验。
3GPP 标准化组织从R16 版本开始开展了NR 终端节能技术的相关研究。R16 终端节能技术[1]主要针对连接态下的终端能耗问题进行优化,提出了DRX 唤醒信号、动态跨时隙调度、MIMO 层数自适应、Scell 2ormant BWP、终端辅助信息上报等节能技术,大幅度减少了终端不必要的PDCCH 检测、PDSCH 缓存的能耗。从R17 版本开始将主要涉及空闲态下的终端节能技术,进一步扩大节能技术范畴、降低5G 终端能耗。
在LTE 和NR 中,空闲态终端采用非连续接收(DRX)的方式检测寻呼,终端在每个DRX 周期检测一次寻呼机会(PO),如果检测到寻呼PDCCH 则继续接收调度的寻呼消息。但是由于空闲态下终端休眠时间较长,终端在每次检测PO之前需要进行时频域的跟踪同步,在确保同步之后再检测PO 和接收寻呼消息。在LTE 中终端利用每个时隙都传输的CRS 进行寻呼检测前的时频域跟踪同步,而在NR 中,空闲态终端只能利用周期性发送的SSB 进行时频域跟踪同步。
为了分析空闲态终端进行时频域跟踪同步和检测寻呼的总能耗,假设终端需要3 个CRS 或者SSB burst 才能完成时频域跟踪同步,一个PO 的寻呼概率为10%,其他系统参数假设见表1。
在本节的空闲态终端能耗分析中,根据3GPP R16 终端节能技术报告[1]中提出的终端能耗分析模型,参考文献[1]中仅给出NR 的物理层过程相对能耗、睡眠转换时间和转换能耗。本文假设NR 空闲态终端的工作在带宽为20 MHz的初始BWP上,与LTE的系统带宽相同,因此LTE 的PDCCH 和PDSCH的单位检测能耗与NR 相同,同时假设CSR 处理的相对能耗与SSB 处理的相对能耗也相同,LTE 系统下UE 的不同睡眠过程的时间和转换能耗也与NR相同。NR 和LTE 系统下不同的物理层流程的单位相对能耗和时间见表2,NR 和LTE 系统下的睡眠转换时间和转换能耗见表3。如果终端在检测或者处理不同的物理信道或者信号之间的时间间隔大于表3 中某种睡眠状态的转换时间,终端即可以进入该种睡眠状态,终端在该种睡眠状态下的能耗见表2。
LTE 空闲态终端检测寻呼的物理层流程和能耗状态时间分布如图1(a)所示,假设终端需要检测3 个CRS 完成时频域跟踪同步,一个PO 的寻呼概率为10%(即90%的PO 终端只需要检测PDCCH,10%的PO 终端既需要检测PDCCH,也需要检测PDSCH)。终端在接收CRS 之前处于深度睡眠状态,之后唤醒连续接收3 个CRS,检测PO,再重新进入深度睡眠状态,根据表2 和表3的参数,计算得出在一个DRX 周期内,LTE 终端的平均能耗如式(1):
表1 NR 系统参数假设(空闲态)
NR 空闲态终端检测寻呼的物理层流程和能耗状态时间分布如图1(b)所示,假设终端也需要检测3 个SSB burst 完成时频域跟踪同步。终端在接收SSB 之前处于深度睡眠状态,之后唤醒接收3 个SSB burst,检测PO,两个SSB burst 的时间间隔为18 ms,SSB和PO之间的时间间隔为8 ms,终端可以进入中度睡眠状态,检测完成PO 之后最后重新进入深度睡眠状态,根据表2 和表3 的参数,计算得出在一个DRX 周期内,NR 终端的平均能耗如式(2):
表2 空闲态能耗模型(NR/LTE)
表3 睡眠转换时间和转换能耗(NR/LTE)
图1 LTE/NR 空闲态终端寻呼检测流程和能耗状态
NR 终端相比于LTE 终端在空闲态下的能耗提升大约73%,主要原因就是NR 中终端只能利用20 ms 周期传输的SSB 进行时频域跟踪同步,导致终端在检测寻呼之前需要提前唤醒很长一段时间,终端在提前唤醒的时间内只能进入中度睡眠,而在LTE 中这段时间终端处于深度睡眠的状态,导致NR 终端空闲态能耗比LTE 终端提升较多,这是NR 相比于LTE 的不足之处。
而造成寻呼检测能耗的另一个问题是寻呼设计本身带来的错误概率问题,无论是LTE 还是NR 为了节省网络侧的信令开销,寻呼消息都是一个PO 内的一组终端设计的,而不是为每个终端单独设计。具体的,如果这一个PO 内至少有一个终端需要被寻呼,这一组的终端都会检测到一个由P-RNTI 加扰的寻呼PDCCH,并且读取PDCCH 调度的寻呼消息(paging message)。寻呼消息中会指示真正被寻呼的终端ID,如果终端发现自己的ID 与寻呼消息中指示的ID 相匹配,则该终端是真正被寻呼的,需要进入连接态接收数据,否则终端是没有被真正寻呼的。正是由于终端必须读取寻呼消息才能判断是否真正被寻呼,导致了一个PO 内部分没有被寻呼的终端也需要检测寻呼 PDCCH 和接收寻呼PDSCH,造成了不必要的能耗开销。极端情况下,一个PO 内只有一个终端需要被寻呼,而其他终端都需要检测寻呼PDCCH 和PDSCH,也就是造成了所谓的寻呼错误检测概率问题,这个问题是LTE 和NR 都存在的,即使某个终端检测到了寻呼PDCCH,也有很大的概率不是真正属于它的寻呼。
根据第2 节的分析,5G 终端空闲态终端能耗问题主要由于周期性的SSB 传输造成时频域同步过程时间较长,以及寻呼流程的设计造成终端不必要的寻呼检测。3GPP 在R17 NR 技术标准中也针对以上两个问题进行终端节能技术的研究和标准化[2],预计将于2021 年12 月冻结相关技术标准,本节将基于以上两个问题提出5G 终端在空闲态的节能优化技术。
空闲态终端需要连续检测多个周期的SSB,造成了终端在检测寻呼的PDCCH 之前需要唤醒较长时间,能耗提升。因此,降低终端在时频域跟踪同步过程能耗的最简单的方式是为空闲态终端提供更多、更密集的参考信号辅助跟踪同步,而不仅仅是依赖于SSB。
为了提高连接态终端的时频域跟踪同步性能,NR 中引入了TRS(tracking RS)作为时频域跟踪同步信号,但是R15/16 NR 标准中,TRS 只能通过RRC 专属信令为连接态终端进行配置。对于空闲态终端,引入额外的TRS 辅助终端进行寻呼检测之前的时频跟踪同步可以有效降低终端的唤醒时间,降低能耗。但是NR 设计初衷引入周期性间隔传输SSB而非每个时隙都传输CRS的最主要目的是降低网络的参考信号开销、提高频谱效率,如果为空闲态终端提供额外的辅助TRS,需要避免对系统参考信号的开销造成影响、避免形成类似LTE CRS 一直存在(always-on)的信号。因此,为空闲态终端配置的额外辅助TRS 应该是目前网络内已经存在的为其他连接态终端配置的TRS。
那么如何为空闲态终端提供已经存在网络中的TRS 的配置信息呢?一种简单的方法是通过系统消息广播被空闲态的终端使用的TRS 的配置信息。但是如果该TRS 的配置信息更改,或者使用该TRS 的连接态终端离开小区或者进入非连接态,导致了网络内没有连接态终端使用该TRS,基站只能通过系统消息更新通知空闲态终端其他可以使用的TRS 配置信息甚至通知终端停止TRS服务的信息。由于无法保证连接态终端一直处于本小区的服务下,或者面向连接态终端的TRS 的配置保持不变,基站可能会频繁地进行系统消息变更来更新广播的TRS 的配置信息或者开关该功能,甚至导致空闲态终端为了接收TRS 的配置信息造成更多的额外能耗。如果想一直为空闲态终端提供TRS 服务,网络可能不得已将TRS 这种按需配置的信号,变成一个需要一直存在的信号,这就与NR 设计的初衷不符。
为了解决这个问题,另一种高效地为空闲态终端提供额外的TRS 配置信息的方法是通过高层信令通知处于空闲态的终端仍然可以使用其在连接态下已经配置过的TRS[3]。配置信息包括:通知终端在空闲态其在连接态已经配置过的TRS 是否继续可用、可以继续使用的时间以及可以使用的其他条件。例如,在RRC 连接释放消息中,如图2 所示,基站通知终端其在连接态下哪些TRS的配置信息在空闲态可用,可用的时间,或者指示终端在空闲态可以使用的除SSB 以外的参考信号的配置信息,包括参考信号的周期、频域密度、带宽、长度、天线端口等。
图2 RRC 连接释放信令流程
在这种方式下,网络侧可以基于终端的使用特征、地理位置等统计信息,做到有据可循地配置,而不是泛泛地将其他终端连接态的配置直接笼统地用于空闲态终端。例如,对于白天办公室的智能手机终端,其移动范围有限,但是由于工作需求,这些终端不定期有电话、微信等业务将其从空闲态寻呼至连接态。这些终端会在空闲态和连接态之间频繁切换,基站就可以为其提供额外的TRS 服务,持续传输相同的TRS。但是其他终端例如室外终端,其移动范围较大,或者业务量很低的终端,基站没有必要为其提供TRS 服务。基站通过终端的网管数据,例如,终端进入RRC连接态/空闲态的时间比例,终端的地理位置信息,综合使用大数据等技术,通过对过往数据采集分析,进行是否为某个特定终端提供TRS 服务、如何配置TRS 的决策。通过这按需的TRS 配置方式,既避免形成一直存在的信号降低系统性能,又可以针对性地对需要频繁被寻呼唤起的终端提供TRS 服务,降低其能耗。
在引入TRS 之后,终端检测寻呼的唤醒过程就会缩短,同时由于TRS 是一个宽带的参考信号,终端可以使用更少的TRS 完成时频域跟踪同步,另外TRS 的周期配置比SSB 的周期(20 ms)更短,终端的同步过程时间可以进一步减少。假设额外TRS 的周期为10 ms,每个周期内发送连续两个时隙的TRS,终端只需要2 个周期的TRS 进行时频域跟踪同步,终端检测TRS 的能耗与SSB 相同,终端的寻呼检测流程和能耗状态如图3 所示。
图3 基于TRS 的终端寻呼检测流程和能耗状态
根据表2 和表3 的参数,可以计算利用TRS进行时频域跟踪同步下空闲态终端的一个DRX周期内的平均能耗如式(3):
相比于利用SSB 进行时频域同步跟踪,仅基于TRS 的时频域同步跟踪就可以节省大约40%的能耗。在实际系统中,终端可以根据基站的TRS和SSB 的周期配置,选择周期更短或者距离PO更近的参考信号进行同步,实现能耗的最优化。
根据第2.2 节的分析,造成终端能耗的另一个问题是寻呼检测错误概率的问题,由于一个PO内的一组终端都只能检测一个相同的寻呼PDCCH,造成了部分终端不必要的寻呼检测能耗。为了解决这一个问题,一种方法是引入寻呼组指示符(paging group in2icator,PGI),在终端检测寻呼之前指示终端是否需要检测本次寻呼,避免不必要的能耗开销。
在NB-IoT/MTC 技术中已经引入了相关技术节省寻呼能耗,在R15 版本中提出了唤醒信号(wake up signal,WUS),唤醒信号与PO 具有一一对应的关系,一组PO 的终端检测到唤醒信号才会检测之后的PO。在R16 的演进技术中,进一步提出了基于终端分组的唤醒信号(UE-group WUS),即将一个PO 组的终端分成多个小组,每个小组分别对应一个唤醒信号。
在NR 寻呼中,也可以采用类似的寻呼组指示的方法,将一个PO 组的终端分成多个子组,利用其他信号或者信道指示哪些子组需要检测之后的PO。具体的寻呼组指示符的设计可以采用以下两种方式。方式一采用基于序列的寻呼组指示符设计,也即每一个子组对应一个寻呼组指示符序列,检测序列的子组终端才需要检测寻呼PDCCH,如图4 所示,终端子组1 和4 检测到了PGI 序列,则需要检测当前PO。该种设计方式采取序列设计,终端的检测复杂度低,但是由于每一个终端子组都需要对应一个PGI 序列,网络侧的信令开销较大,尤其是终端分组较多的情况。
图4 基于序列的寻呼组指示符设计
方式二采用基于PDCCH 的寻呼组指示符设计,即将PGI 信息承载在一个PDCCH 上,通过PDCCH 携带的bitmap 信息指示哪些终端子组需要检测当前PO,如图5 所示。终端子组1 和4 对应的比特为1,因此这两个终端子组需要检测当前PO。这种方式的好处是网络侧的信令开销较小,只需要一个PDCCH 即可,并且可以支持更多的终端分组数量,但是终端检测PDCCH 的复杂度和能耗开销会比序列检测更大。
图5 基于PDCCH 的寻呼组指示符设计
不管是基于序列还是基于PDCCH 的PGI 设计,终端检测的复杂度都会比正常的PDCCH 的复杂度较低,并且不需要精细的时频域跟踪同步。假设终端检测PGI 之前只需要检测一个SSB 用作时频域同步跟踪,检测PGI 的能耗与SSB 相同,并且PGI 和SSB 在时域上相邻,在引入PGI 之后,终端的能耗分析如图6 所示,并与图1(b)作对比。
其中在有寻呼的情况下,相比于之前的流程,终端增加了PGI 的检测能耗,一个DRX 周期内的平均能耗为式(4):
图6 寻呼指示符下的终端寻呼检测流程和能耗状态
在没有寻呼的情况下终端不需要检测后续的SSB 和寻呼,一个DRX 周期内的平均能耗为式(5)。
由于对一个PO 的用户进行了分组,一个子组的寻呼概率会小于一个PO 的寻呼概率[4],假设将一个PO 的终端分成了5 个子组,则每个子组的寻呼概率为终端在引入了PGI 之后的平均能耗为2.67 × 2% +1.47 ×98% =1.49,相比于第2.1 节的能耗降低了大约44%。
本文首先进行了5G 终端在空闲态下的能耗分析,并对比了LTE 终端的能耗,其次分析了造成5G 空闲态终端能耗问题的原因。针对5G 空闲态终端能耗问题,提出了空闲态终端可持续使用连接态下已配置的TRS 辅助时频域跟踪同步,以及引入寻呼组指示符指示避免终端错误检测寻呼的空闲态终端节能方案,并进行了能耗分析,分析结果表明节能方案可以降低5G 终端的能耗,为后续5G 商用终端的空闲态节能技术指明了方向。同时3GPP R17 终端节能项目也正在对相关问题进行研究,本文的研究结果也为3GPP 的标准化进程做出贡献。