李佳林 彭淑燕 姜 炜 刘是枭
1(重庆邮电大学 重庆 400065) 2(维沃移动通信有限公司 广东 深圳 518049)
近年来,随着居民消费水平的提高,国内汽车工业发展迅速,以及汽车市场消费结构多样化,越来越多的人选择购买汽车来进一步提升生活质量。用车的人越来越多,势必会造成交通拥堵、事故发生概率提升等问题。为了降低日常交通的负荷并提供更安全可靠的驾驶辅助信息进而减少事故的发生概率,V2X(Vehicles-to-everthing)通信技术应运而生。
根据3GPP定义,支持V2X sidelink通信的V-UE(Vehicle type user equipment)可以在两种模式下进行资源分配:基站调度授权的频谱资源进行数据传输的集中式资源分配模式、V-UE自己从未授权的资源池中选择资源的分布式资源分配模式,称为UE自主资源选择[2]。针对与无覆盖或覆盖盲区这种场景,车辆无法通过基站来获得资源,且V-UE当前的无线环境不能通过小区切换或者其他的方法来改善的时候,则可以根据预配置让V-UE进行自主资源选择。
当前对于D2D通信技术下的资源分配方面的研究主要有:文献[3]提出多阶二部图匹配算法,让蜂窝用户选择干扰小的D2D用户共享资源。仿真结果表明该算法可以提高系统的容量。但仿真场景仅限于单小区,多小区的干扰情况并未考虑。文献[4]提出一种基于功率控制和信道分配的联合算法,利用注水算法求得每个D2D用户可用的资源集合和最佳的发射功率,根据可用资源集合利用组合拍卖为D2D用户分配最合适的信道资源。仿真表明所提算法提升了系统的吞吐量且提高了频谱利用率。文献[5]提出一种基于D2D技术的V2X通信下的联合自主资源选择和资源分配机制,文中通过不同UE选择的不同资源选择模式,对应不同资源选择模式的功率约束条件和资源选择约束条件,分别得到最优的发射功率和资源分配机制。仿真结果表明此机制提升了系统的吞吐量和信息值。文献[6]提出了一种通过对D2D场景中用户之间的链路状态预测,在预测到某个D2D对的链路状态不稳定时造成断链或同频干扰时调整D2D用户的发射功率和信道,来保证链路状态的稳定。文献[7]提出了在V2I和V2V用户共存的一种高效的资源配置和功率控制算法(ERVPC),先为所有V2I用户以最大香农容量分配RB,然后V2V用户与V2I用户共享RB,V2V用户通过测量SINR和功率控制来选择相对合适的RB和发射功率。仿真结果表明,该算法能在系统吞吐量和RB利用率上有提升。文献[8]中提出了一种基于内点法和匹配算法的资源分配机制,实现了用户之间竞争资源的公平性并同时解决频谱分配、功率控制和频谱共享的问题。
总体来看大多数研究都是基于集中式的资源分配模式对于分布式资源分配模式研究较少。由于分布式资源分配模式下V-UE获得的干扰信息和信道信息相比基站获得信息来说不够完整、精确,可能选择了不适合的资源进行占用,尤其对于非周期业务,V-UE无法预测自身的业务包达到时间,因而历史的干扰是不可控的,不能用来预测当前或未来一段时间可能的干扰情况,正因为非周期业务下的各种不可控因素,3GPP至今在其Release 16版本中对5G V2X在分布式资源分配模式下的非周期业务的资源分配机制仍在如火如荼的讨论中。
目前分布式资源分配模式下非周期的资源分配机制3GPP建议使用动态的随机资源选择机制,这种方式可能导致包传输的一定时延,在业务负载低的时候会提升可靠性,随着业务负载的增加,可靠性会降低。3GPP通过讨论得出:用于处理5G中的周期业务而设计的资源分配机制并不适用于非周期业务,但在RAN1 #96会议上有提案[9]提出可以应用感知+半静态调度(LTE-mode- 4)的机制为其以较短的预留间隔预留资源。以mode- 4的方式虽然能在资源选择时获取一些辅助信息,但由于V-UE无法像基站那样可以获取比较多且精确的信道信息来选择合适资源,导致多个UE复用同一资源而造成同频干扰,尤其是在非周期业务下来包的时刻不确定,以过预留的方式以周期性的资源分配用来传输非周期业务,显然存在资源的浪费情况。针对非周期业务目前存在的问题,本文提出一种基于SA-M(Scheduling-assignment monitor)监听的半静态的过预留增强机制和一种动态的基于LBT-like(listen-before-talk-like)的资源分配机制,并分别与半静态的LTE-mode- 4机制和动态的随机选择机制进行了对比。
本系统模型考虑到偏远地区道路存在无覆盖或覆盖盲区的V2V系统,V-UE在双向3车道的高速公路上以空间泊松点过程随机撒点,假设V-UE数量为V={V1,…,Vk,…,VK},每个V-UE用户采用单播的传输模式进行通信,在自身一定范围内随机选择一个其他V-UE为接收V-UE成为V2V对,则共有K个V2V对,如图1所示,两车之间存在V2V链路的即为V2V对,箭头指向的V-UE为接收机,数据链路只存在于有V2V链路的车辆之间。
为了体现撒点的随机性,我们利用前车保险杠与后车保险杠之间距离大小来确定车距进而控制车流密度和随机性的体现,采用式(1)来建模撒点过程。
d=max(exp rnd(Aved),2),Aved=2×speed
(1)
式中:d为车距;Aved表示平均车距,由每辆车的车速(单位:m/s)决定,exp rnd为MATLAB函数,表示生成参数为Aved的指数随机分布的随机数。
对每一条车道依次撒点,从车道最左侧开始,初始化撒点位置为车道最左侧横坐标加上车距,每撒一个点前计算一次车距,下次车的坐标以上次车的横坐标为基准加上车距,直至某次车的横坐标超过车道长,则该车道撒点完毕,进行下一车道撒点。
每当V-UE有业务包到达时,将在资源池中自主选择合适资源进行占用,无须基站参与,资源池中时域上资源粒度为一个时隙或一个TTI,频域上为100个RB(resource block)。那么第k个V-UE在时隙i上的SINR为:
(2)
所有V-UE共享同一资源池,当场景中V-UE数量增大业务负载增多时必会进行资源复用,而复用在同一时隙上的所有发射V-UE所属的接收V-UE都存在数据传输链路时,那么彼此之间则会出现干扰,距离越近干扰就越强。为了减少资源碰撞带来的影响,时域上传输时隙的选择就显得尤为重要。
在非周期业务中,为了使V-UE在选择资源时获取一些参考信息,我们仍然使用SPS(Semi-Persistent Scheduling)。将SA信息分成两种:一种是存储当前发送时隙和预留时隙的SA-A;另一种是仅存储当前发送时隙的SA-B。如图2所示。
可以看到,假设UE1和UE2在时刻1有业务包到达,分别选择了时隙5和时隙3的资源进行占用发送数据,并都以相同的预留间隔预留了一段时间里的资源,UE1和UE2分别配置了SA1-A和SA2-A控制信息(此SA-A中包含当前数据包的占用资源位置信息和预留资源位置信息),等待发包时刻同第一个数据包一同发出。在往后发包时刻,UE1和UE2还需配置SA1-B和SA2-B(此SA-B信息仅保存当前数据包占用的资源位置信息)同往后的数据一同发出。不失一般性,假设V-UEi选择了时隙I,则V-UEi的SPS资源预留集合RRGi:
RRGi={I+Xn}n=1,2,…,n
(3)
式中:n为最大预留周期;X为预留间隔。SAi-A中包含RRG和时隙I,SAi-B中包含每次发送数据的slot,若在第t个预留slot不送数据则SA-B为空,SA-B∈RRGi。
如图3所示,在时刻8,UE3有业务包到达。而从时刻1到时刻8这段历史时间里,UE1和UE2已经将自己的数据包发出,则SA-A信息也已经伴随UE1和UE2的第一个数据包发出。UE3利用感知技术在时刻3感知到了UE2的SA2-A,并在时刻5感知到了UE1的SA1-A,进而知道UE1和UE2的预留资源。自时刻3起,开始监控UE2的SA2-B,自时刻5起,开始监控UE1的SA1-B,直至UE3分配了资源。UE3通过对SA-B的实时监控,发现在属于UEb预留的时隙资源7并没有SA2-B发出,则UE3则认为UEb在其后续的预留资源上停止占用,UE3将UE2的预留信息标记为失活的状态,所以在资源选择窗中无须排除UE2的预留资源,随后在资源选择窗随机选择一个可用资源进行占用。不失一般性,每个UE从其他UE获取的SA-A中得到的预留信息由式(4)确定。
(4)
式中:PSAi-A={0,1}表示第i个UE的SA-A是否接收成功,由发射SA-A的UE与感知SA-A的UE之间的有效SINR与BLER映射得出。
每个V-UE获取的其他所有UE的历史SA-B的集合SAGB通过式(5)确定。
SAGB={(slotSA1-B),(slotSA2-B),…,(slotSAk-B)}
(5)
式中:SAGB∈CR,slotSAk-B表示第k个UE的SA-B中历史发送的集合,由式(6)确定。
(6)
SA-A的历史预留资源集合由式(7)得出。
CRRH={(RRH1·PSA1-A),(RRH2·PSA2-A),…,
(RRHK·PSAK-A)}
(7)
式中:CRRH表示第k个UE的历史预留资源,其中RRHk={TTIH|TTIinitial≤TTIH≤TTIcurrent}∩RRGk。
获得SAGB与CRRH之后,就可将丢失的SA-B筛选出来,根据丢失的SA-B的下标锁定UE ID。丢失的SA-B由式(8)算出。
MSA-B=SA-G○CRRH={m1,m2,…,mK},
mk={CU(slotSAk-B)∩RRHk}
(8)
式(8)中○运算定义为SAGB与CRRH中对应下标进行求交集再求补集运算,其中slotSAk-B∈RRHk。
从MSA-B中的每个mi里选出数值最大的,再与对应RRH中最大的进行比对。若MSA-B中的与对应RRH中最大的相等,那么就将该下标的UE的SA-A标记为激活,在CR中保持不变;若小于则认为是失活态,在CR中进行删除。进行如上一系列计算,目的就是为了检测出CR中已被感知的预留资源RRG在进行SA监听后还剩余哪些UE的RRG。
假设当前UE的CR中的剩余的RRG表示为CRresidue,那么在当前调度UE的资源选择窗中被预留的资源可从CRresidue筛选出来,那么当前资源选择窗中被预留的资源由式(9)得到。
RRC-TTI={slot|TTIcurrent≤CRresidue≤TTIcurrent+Tdelay}
(9)
需要注意的是,RRC-TTI的内容反映的是UE在当前自身资源选择窗里面被SA信息指示的当前资源选择窗中哪些时隙已被哪些UE占用、预留。根据感知结果,只能可能有两种情况:1) 当前资源选择窗有某个或某几个时隙未被占用、预留。2) 当前资源选择窗中所有时隙都被占用、预留。
针对情况1),只需在未被占用或预留的时隙上进行随机的选择一个时隙,并以式(3)进行资源预留。针对情况2),只需在当前资源选择窗中选择最少的一个被其他UE指示了预留或占用的,若资源选择窗中每个时隙被指示预留、占用的UE数量同样多,则进行随机选择。
上述方式可能会遇到某几个UE复用到了同一资源的情况。如图3所示,若UE2和UE3之间的干扰过大,在时刻19同时有包发出的话,则会导致UE3和UE2虽发包成功但由于干扰问题接收机收包不成功而丢包。这种情况下可根据接收机的收包反馈ACK/NACK进行相应调整操作。由于后选择资源的UE对先选择UE的SA-A已标记为失活,所以无法查到。若反馈NACK则对最先分配资源的UE进行资源调整。确定修改SPS的用户和触发SPS调整条件,如图4所示。
非周期业务中,虽然可以利用基于SA-M的机制进行资源选择,但此机制仍然是一种半静态的资源分配方式,会出现预留了资源却不使用的情况,导致资源的浪费,且对其他有重要业务的UE来说是不公平的,尤其在控制信息开销方面。所以针对非周期业务,考虑使用动态调度的方式。为了解决非周期业务下随机资源选择导致的问题,本文提出基于类似先听后说(Listen before talk,LBT)机制。
当UE有业务到达时,UE将会初始化一个counter计数器,计数器大小可根据最大传输时延确定,可配置为:
counter=traffic-priority{1/2low,1/5high}×delay
(10)
counter计数器配置完成后,对当前时刻发出的所有SA进行感知,通过获取当前时刻上所有SA中的RSSI的累加值,与阈值进行对比,若该RSSI累加值小于该阈值,则counter减去一个减数,我们这里将减数定义为subtra,且将subtra初始化为1,即counter=counter-subtra。若该RSSI累加值大于该阈值,counter保持不变,subtra增加1。当某个时刻,UE的counter计数器小于等于0时,则在该时刻后的一个时刻上的传输时隙上进行发包。每个传输时隙,不是counter减少就是subtra增加。
假设某个UEx在T时刻有业务包达到,通过感知当前TTI上SA,获取的SA集合表示为:
SA-G={SA1·TP1·PSA1,SA2·TP2·PSA2,…,
SAk·TPk·PSAk}
(11)
(12)
仿真参数详见表格1中,考虑到当RSSI的值为-80 dBm左右时可以频率复用,所以本文将门限值Threshold设定为-80 dBm。
表1 仿真参数
性能评估指标中的平均收包率(Average packet reception ratio,Ave-PRR)和平均来包接收间隔(Average Packet Inter-Reception,Ave-PIR)是来自3GPP协议(文献[10])中定义的关于系统级仿真性能评估指标,平均PRR测量的是发射V-UE与V-UE之间的距离在[a,b]范围的所有V2V对的平均收包率,其中a与b的值由式(13)确定:
a=i×20b=(i+1)×20i=1,2,…,15
(13)
一个V2V对的PRR由X/Y确定,X表示成功接收的包的数量,Y表示总的发包数量,发射V-UE与接收V-UE在[a,b]范围内的所有V2V的平均收包率由(X1+X2+…+Xn)/(Y1+Y2+…+Yn)确定。一个V2V对的PIR表示前一个接收成功的包与后一个接收成功的包之间的时间间隔,由(t1+t2+…+tn)/n计算得到,其中t1到tn为时间间隔,n为成功接收包的数量,平均PIR由(T1+T2+…+Tn)/N确定,其中T1到Tn为在发射UE与接收UE之间的距离在[a,b]范围内的所有V2V队的PIR,N为V2V对数量。多次进行仿真评估,对仿真数据取算数平均值,以防止结果的偶然性,仿真数据统计出的曲线图如图5-图7所示,且图中横坐标distance index(i)表示距离索引,为发射机与接收机之间的距离范围,其中,i=1,2,…,15,代入式(14)中,由远到近,表示15种距离范围。
对于各种机制控制信息开销问题的对比,由于系统级仿真对于控制信道建模意义不大,且V2X业务多与安全服务和自动驾驶有关,牺牲一些开销提升安全性是有价值的,所以本文没有对控制信息开销问题其进行仿真,但显然本文所提SA-M机制要比mode- 4控制信息总数据包的累积开销多一倍。
图6为平均PRR的曲线图,可以看出SA-M机制性能最优。由于根据SA提供的资源占用与预留信息,让UE能选择相对自身有利的资源进行占用,而实时地对SA进行监控,实时地获取资源占用信息;对于在某些预留时刻应该收到SA而没有收到的情况,进行了相应操作以增加避免资源选择窗中无资源可选的情况出现,增加其他UE的可选资源数量。此操作可能造成资源复用而受到强干扰导致丢包,因此对于丢包的用户进行资源重新选择,因为预留资源是固定不变的,那么相应受到干扰的情况会一直持续,若对丢包用户不进行SPS重配置,那么该用户的所有数据包都不能接收成功。且由于是实时对SA监控,资源窗中被排除的资源任何时刻都不同,选择的资源有大概率与上次不同,因此重新选择的资源上的干扰情况与上次选择的资源的干扰情况有大概率不同。
LTB机制与mode- 4机制相比,接收V-UE与发射V-UE距离较近时,mode- 4较好,随着接收V-UE距离越来越远,mode- 4性能逐渐劣于LBT。分析原因是mode- 4机制下的SA感知和干扰测量都是基于发射V-UE,发射V-UE和接收V-UE处于较近的距离时,两者受到的干扰区别不是特别大,所以选择的资源能够满足传输。在接收V-UE离发射V-UE距离较远时,接收V-UE的受到的干扰就与发射V-UE的大不相同了,可能存在对发射V-UE来说能够用于传输的时隙资源,而对于接收V-UE来说干扰特别大,又由于是半静态的,一旦选择到了不合适的资源,则在一段时间内受到的干扰不会有太大的改变,导致随着距离的增加,性能下降得厉害。而LBT机制虽然也是基于SA感知和干扰测量,但不是一旦测到合适的时隙资源就占用,而是在测到几次满足传输要求的时隙资源后的下一个时隙资源上进行数据传输,并且是动态的调度,每次来包的时刻接收V-UE受到的干扰情况都不一样,因此随着距离的增加,性能下降比较平缓。
从图7平均PIR可以看出,mode- 4机制由于获得资源选择的参考信息较多(SA和干扰测量),所以总是优先考虑未被其他UE占用和干扰较少的资源进行占用并预留,而忽略了传输时延,随着仿真时间往后推移,资源选择窗中的资源总是在最大时延时存在干扰最小的时隙资源,所以造成的前后接收成功包的时间间隔是最大的。LBT机制与mode- 4机制同样都是优先考虑避开干扰强的资源而不考虑时延的问题,由于需要测得一段时间里面的资源为传输资源后才进行发包,若以在时延方面表现不佳,在距离指示点6的位置与mode- 4相交的原因可以从平均PRR里面找到原因,平均PRR也是在距离指示6的位置与mode- 4相交且收包率逐渐高于mode- 4,丢包的概率多了,那么前一个包接收成功到后一个包接收成功的这段时间自然变长。SA-M机制仅基于SA的监控来选择资源,不是优先选择未被占用的或干扰少的,而是优先选择未被监听到的SA的资源或被SA指示较少的预留资源,在资源选择窗中基于SA监控的原因,不一定总是在最大时延附近才有未被SA指示或被SA指示较少的预留资源。随机资源选择无资源选择参考信息的接入,可能会实时发送,可能会延时一段时间发送,具有随机性,所以在前后包接收时间间隔上表现最优。
从图8可以看出,随着接收机距离不断增加,每种机制都呈现出下降的趋势,平均吞吐量的表现和平均PRR表现出来的内容相似,是平均PRR在整体系统性能上更加直观的体现,平均收包率提高,在这个范围内的平均吞吐量也会有相应的提高。在距离较近时,由于随机选择机制没有资源选择的参考信息,性能最劣,与同样作为动态资源分配的LBT-like的机制在吞吐量上劣势相比平均收包率的劣势更为明显。而半静态分配的mode- 4和SA-M则与平均收包率表现相近,差距不是特别明显,SA-M较mode- 4吞吐量最大仅提升了5%。
本文在无基站覆盖情况下提出了在分布式资源分配模式中针对非周期业务下的两种资源分配机制。两种机制的决策是由协议预定义,根据UE业务确定使用哪种机制。第一种采用半静态调度的方式,通过对SA的实时监控,能够知晓哪些UE虽已预留资源但未发包,进而对该UE的预留资源标记为失活状态,那么其他UE即可对该资源进行占用,且对于预留到同一时隙资源的UE导致丢包的情况进行了SPS重配置,避免预留周期内所有包的丢失;第二种采用动态调度的方式,基于LBT的资源分配机制,每次来包UE都将初始化一次计数器counter,根据获取的SA和门限值来判断counter是否该减少,当counter递减到零,则在当前时刻的下一个时隙资源上进行包的发送。通过仿真结果可以看出,半静态调度方式在非周期业务中的表现较好,尤其是本文提出的SA-M机制提升了系统整体的吞吐量和可靠性,但在时延方面表现中规中矩,在高可靠性场景下,SA-M机制较合适。在动态调度中本文提出的LBT机制以牺牲一定的传输时延的代价来提高收包的概率,在远距离V2X通信的非周期也业务下,若不考虑时延问题使用LBT机制较合适。此外,本文中的两种机制同样适用于5G V2X的其他场景。