张勐,唐勐,粟欣,吕铁军
(清华大学,北京 100089)
伴随着信息技术的不断发展,催生了如V2X、云VR等大量的新兴应用,这些新应用对网络提出了高速率、低延迟的通信需求以及高分辨率、鲁棒链接的感知需求[1]。一方面,传统方案中基站外挂雷达方式将极大增加硬件成本[2]。另一方面,下一代网络将采用mmWave+mMIMO制式,高频波在提供高质量的数据传输的同时,也将提供高精度的感知能力[3-4]。因此,通感一体化设计成为了一种可行的解决方案[5-6]。
对于感通融合系统(ISAC,Integrated Sensing And Communication),mmWave 对路损的敏感性将导致位于基站不同距离处的用户信道状态有显著差异且感知与通信性能对距离的敏感性不同[7],故而简单的固定分配资源方案将导致性能欠佳。早期感通融合方案开发了估计率为感知指标,并以传输速率为通信指标,得以推导用于衡量系统通感能力的加权和速率[8-10]。然而雷达估计不是从类似于通信数据符号的可数分布中得出的,因此,估计速率度量不是雷达性能的精确表示。
故文献[11-12]面向V2V 场景,通过将整个周期拆分为感知间隔与通信间隔方式实现感通融合。基于率失真理论中的失真度量开发一种类似于克拉美罗下界(CRLB,Cramer-Rao Lower Bounds)的MMSE 通信度量-失真最小均方误差(DMMSE,Distortion MMSE),并以测距CRLB 和测速CRLB 作为感知指标推导了可用于衡量系统感通能力的指标—感通MMSE 加权和。文中可通过灵活调整感知时长占比方式获得最佳的系统感通“和”性能。文献[13]将其推广至V2I 场景并基于空分方式区分多用户。文中对于任意用户而言,基站发射机发射一体化信号后,一方面用户通信接收机接收解调实现数据传输,另一方面经用户反射后由基站雷达接收机接收回波信号并解析出用户的目标状态信息(距离、速度、俯仰角、方位角),通过为各用户灵活分配功率方式使得多用户的系统感通“和”性能最佳。而文献[14]考虑到当用户距离基站较近时,用户将横跨多个分辨率单元,故感知需较大波宽完整覆盖用户以获得较高的感知精度,而较大的波宽将导致通信性能下降,因此将一个完整帧拆分为感通子帧和通信子帧。其中感通子帧同时实现感知与通信功能,通信子帧仅实现通信功能。通过灵活的分配感通子帧所占比例使得系统感通“和”性能最佳。目前的工作焦点在统一通信与感知度量并获得系统感通“和”性能最佳而忽略了各用户通感性能公平度问题。基于现行方案,系统资源将更多向信道状况好的用户倾斜,造成信道状况好的用户获得冗余的性能,而信道状况不好的用户将获得远低于期望的性能。而保障公平度将极大改善上述问题。
如图1 所示,本文针对V2I 场景,建立了V2I-ISAC网络的系统模型,并提出了一个保障公平度的时间与功率资源分配方案。具体而言,首先基于空分方式区分多用户,然后开发感知公平度、通信公平度指标,通过在多用户间分配功率以及为感通车辆调节感通子帧占比的方式使得用户公平度与系统感通“和”性能综合性能最佳。仅需牺牲少量感通“和”性能即可保证较高的多用户间公平性。
图1 V2I场景示意图
本文考虑由单个毫米波(mmWave,millimeter Wave)基站以及K个车辆组成的车辆对基础设施(V2I,Vehicle to Infrastructure)网络。基站处配置两个射频链路数为NRF且天线尺寸为NBS=NBS,XNBS,Y的混合架构的均匀天线平面阵列,其中一个用作通信的收发机及感知的发射机,另一个用作感知的接收机。其中NBS,X和NBS,Y分别为均匀平面阵列(UPA,Uniform Planar Array)的行列阵子数,并为每辆车配备了一个采用天线尺寸为NUE=NUE,XNUE,Y模拟架构的均匀天线平面阵列用作收发机。如图1 所示,基站形成多个不同宽度波束照射不同车辆,并如图2 所示,将传感过程视为感通帧和通信帧交替进行的过程[15],基站依照所处时间不同以执行不同任务,其中通信帧时基站仅执行下行通信任务。感通帧时,又将其分为感通子帧和通信子帧[14]。感通子帧时基站由发射机发射一体化信号,由车辆接收机接收解调后,在实现下行通信的同时,经由目标反射后接收机接收回波,进而实现目标状态信息的感知任务,通信子帧时与通信帧一样仅执行通信任务。为后文中讨论方便,因而在此特定义:当车辆处于通信帧阶段时,则称之为通信车辆;当车辆处于感通帧阶段时,则称之为感通车辆。
图2 为任意时刻各车辆帧结构示意图:
图2 任意时刻各车辆帧结构示意图
本文中假设首先通过波束训练实现多车辆初始接入,并在链路维持阶段基于文献[14] 所提方案,实现波束实时对准,并在任意t时刻预估得第t+1 时刻的各车辆的目标状态信息。则对于任意t时刻,首先基于目标状态信息计算得第t+1 时刻各车辆的信道增益,然后基于信道增益,以测距CRLB、测速CRLB、测角CRLB 以及通信有效频谱效率为性能指标,考虑多用户间的通信公平性、感知公平性以及系统感通“和”性能来为各车辆灵活的分配系统功率以及为感通车辆灵活分配感通子帧时长占比,并在第t+1 帧开始时即将时间分配情况告知车辆。
(1)发射信号
本文中基站处采用混合mmWave 天线阵列结构,因而第t个时隙时基站处经过数字预编码以及模拟预编码后获得的发射信号为:
而基站在t时刻发往第k个车辆的波束成形向量可表示为:
由于本文中仅针对通过模拟预编码处理V2I 网络的高动态问题,因而可假设系统已采用简单的迫零预编码设计了数字预编码矩阵。
(2)通信接收信号
本文中假设所考虑的mmWave-ISAC 系统采用几何信道模型,通常而言,在良好覆盖的mmWave AP 区域内,LOS 路径的能量占据主导性。因此,本文中假设LOS 主导。则第t时刻时基站到第k个车辆的信道矩阵可表示为[16]:
而第k个车辆将选择组合向量:以最大化接收信号能量。其中,θT,k(t),φT,k(t)分别表示导向第k个车辆的波束方向的方位角和俯仰角。
则在时隙t时BS到第k个车辆的波束对齐等效下行信道为:
由于采用了迫零预编码,可认为波束之间的多用户干扰已被消除,则系统可以被近似地分解开。因而在时隙t,第k个UE 的接收信号可以表述为:
(3)雷达接收信号
本文中将车辆建模为扩展目标模型,车辆几何结构中均匀分布着Scatter 个可分辨散射体。雷达回波信号可看作这些可分辨散射体反射波的线性组合,任意一个可分辨散射体可假设为点目标。通常近程通信雷达信道可建模为双选择(时间和频率选择)模型[17-18]。且对于感知回波而言,LOS 路径的能量占据主导性,因此,本文假设LOS 主导。则第t个时隙时基站照射由第k个车辆的第sca个反射到基站接收端的信道矩阵可表示为:
此时(θR,k,sca(t),φR,k,sca(t))与(θT,k(t),φT,k(t))表示基站的接收机的LOS 路径的到达角和基站发射机发射角。
为便于测量角度域信息,基站接收机不做波束成形。在大规模MIMO 情况下,转向矢量彼此渐近正交[18],因此来自不同散射体的反射回波不会相互干扰,基站可以单独处理每个回波信号。因而在时隙t,基站接收到来自第k个车辆的第sca个散射体接收信号可近似为:
本文中需要联合考虑感通“和”性能以及用户公平度,本节将依次建立以系统感通MMSE 加权和评估系统的感通“和”性能,以通信公平度衡量用户间通信性能公平性,以感知公平度衡量用户间感知性能公平性的感通一体化指标体系,具体见下文。
(1)通信性能指标
本文中将ak定义第k个感通车辆感知子帧占感通帧时长比例。则当0≤ak≤1 时,据文献[19] 可轻易推导通信有效DMMSE 度量为:
(2)感知性能指标
在高斯白噪声背景下,克拉美罗下界代表参数估计的MMSE 下限。则 当0≤ak≤1 时,据文献[19] 可轻易可得与车辆k有关的感知性能指标为:
距离估计CRLB:
速度估计CRLB:
等效俯仰角CRLB:
等效方位角CRLB:
(3)JRC 性能指标
1)系统感通MMSE 加权和
系统感通MMSE 加权和取值越小,代表系统感通“和”性能越佳。该表达式表达形式为各车辆的测速CRLB、测距CRLB、测角CRLB 以及通信有效频谱效率之和,具体如下:
2)通信公平度
3)感知公平度
本文以车辆间分配功率以及为感通车辆感通子帧在感通帧的时间占比为自变量,联合考虑系统感通MMSE加权和、感知公平度以及通信公平度,建立多用户场景下的资源分配模型。可建立如下优化目标函数:
其中ωcost、ωcb、ωrb分别为感通MMSE 加权和、通信公平度以及感知公平度的权重。代表各通感车辆的感通子帧时长占比的向量,并将纯通信车辆表示为基站分配给各车辆的功率权重向量,其中表示第k个车辆分配到的功率占总功率的比例。C1 约束表示第k个车辆的用于感通子帧的占比取值情况,取值不大于1 且不小于0。C2 约束表示所有车辆所分配功率和为总功率,且任意车辆分配的功率不得小于0。
功率分配及时间分配间存在耦合关系,并非完全独立。据此,模型分解为如下子问题:
表达式依次为功率分配以及时间分配。具体而言,对于功率分配问题,C3 约束表示任意功率分配向量下,通过调整a可获得的最小成本Raw,则功率分配问题表述为在可行域内寻找一个功率分配向量γ0使得成本Raw最小。对于时间分配问题:C4 约束表示任意时间分配向量下,通过调整γ可获得的最小成本Raw,则时间分配问题表述为在可行域内寻找一个时间分配向量a0使得成本Raw最小。且不论是功率分配还是时间分配,由于受到通信/感知公平度约束的制约,因而无法使用通用的凸优化方法、直接求解最优值。群智算法是解决该问题的有效途径。
本文借鉴人工蜂群(ABC,Artificial Bee Colony)以及模拟退火思路,提出了一种改进的交叠优化求解算法。算法过程具体如下:
将功率分配的解集表示为:
对于一个功率分配向量而言,任意维度为车辆分配到的功率,其取值为0.01 到1,且必须保证所有车辆的功率和为总功率。时间分配策略解集为:
对于一个时间分配向量而言,任意维度为感通车辆用于感通子帧的时间占比,其取值为[0,1]。步长为一个符号占总时长的比例。
效用函数写为:U=Rr,以联合优化的目标值作为效用函数。
改进的交替迭代资源分配求解方法如下所示:
初始化:初始化阶段包括设定初始时间为t=0,并初始化最大时间为Tmax。以及对初始时刻的策略初始化。即首先初始化策略为等功率分配,然后将初始化为各感通子帧占比初始化为1 的向量。
Loop fort=0,1,2,…
◆子问题选择:在每个时间步长,依概率决定当前将迭代的子问题,即该时刻是进行功率分配还是时间分配,并用pro表示,并计算效用。
◆结果搜索:为各维度随机生成一个变化步长,生成新的探索策略,且保证,并计算当前效用。
◆结果更新:
其中P(•)是事件概率,μ是学习因子,同时其他子问题的结果保持不变,即。
◆更新t=t+1:
本文中所提算法采用结果更新概率更新求解结果,且参考模拟退火算法,使得结果更新的概率密度服从玻尔兹曼分布。具体而言,当子问题搜索的结果好于当前的结果时,玻尔兹曼分布将以一个较高的概率来改变当前结果,否则,结果将倾向于保持不变。本文中通过概率更新结果的方式,可以最大程跳出局部最优,并如文献[20]所证明,在时间充足的前提下,可收敛到全局最优。
本文在matlab 中搭建如图1 所示场景:分别依次随机放置4、8、10、12、14、16 辆车辆,并依次将车辆的前2 辆(I 型,即感通车辆固定)、前50%的车辆(II 型,即感通车辆与通信车辆成比例)以及除最后2 辆车辆(III型,即通信车辆固定)设置为感通车辆。在波束对准前提下,首先基于毫米波通信/雷达信道模型生成环境信道增益参数,最后基于所提算法为多用户分配资源。并如此重复300 次实验后取均值。仿真参数如表1、表2 所示:
表1 仿真试验场景的详细参数
表2 算法仿真参数
图3 描述了不同感通车辆占比情况下固定分配方案、基于ABC 方案[21]以及本文所提方案伴随车辆数目增加系统耗时变化图。由图可知,本文所提方案的计算复杂度远低于基于ABC 方案的计算复杂度,略差于固定分配方案的计算复杂度,具有较快的求解速度。虽然伴随着车辆数目增加系统计算复杂度会增加,但据图可知本文所提算法的耗时增加幅度相对较小,依然可保证较快的求解速度,可保证较好的鲁棒性。
图3 耗时随车辆数目的变化情况图
图4 描述了不同车辆占比情况下固定分配方案、不考虑公平度方案[14]以及本文所提方案伴随着车辆数目的增加系统感通MMSE 加权和的变化趋势图。由图可知,本文所提方案可获得比固定分配方案更好的感通能力,并且伴随着车辆数目的增加系统整体的感通能力会提升。
图4 感通MMSE加权和的变化趋势图
图5 与6 分别描述了不同感通车辆占比情况下固定分配方案、不考虑公平度方案[14]以及本文所提方案伴随车辆数目增加系统通信公平度以及感知公平度的变化趋势图。由两图可知,本文所提方案可获得略差于固定分配方案具有带来的公平度。而相较于不考虑公平度方案,本文所提方案具有更优的通信与感知公平度,并且虽然伴随着车辆数目增加系统公平度会均会变差,但据图可知,相比起不考虑公平度方案,本文所提算法变差的幅度更小,可保证较好的鲁棒性。
图5 通信公平度随汽车数目增加变化趋势图
图6 感知公平度随汽车数目增加变化趋势图
本文所提方案综合考虑了系统感通“和”性能以及感知公平度与通信公平度。相较于不考虑公平度分配方案,仅仅通过略微牺牲通感MMSE 加权和的方式即可获得较优的通信公平度和感知公平度,而更优的公平度则反映了多用户获得期望的性能的能力,并提出了改进的交替迭代搜索算法,相较于基于ABC 方案,求解时可更加快速地收敛以保证实时性要求。本文做决策时仅仅考虑瞬时性能,而未考虑长效性能影响,因而进一步研究可基于DQN 等强化学习方法,将长期影响因素也容纳进来。