侯绪艳 尹学锋 张琳坚
(1.同济大学电子与信息工程学院,上海 201804;2.华为技术有限公司,上海 201206)
无线信道是无线通信系统的重要组成部分,是再现真实传输场景和改善通信质量的关键[1]. 许多现有的信道模型中多径分量通常以簇的形式存在,所以进行有效的信道建模除了具有反映实际传播环境的数据外,更重要的是研究合适的多径簇优化模型.因此,需要选择合适的分簇方法将多个参数维度上扩展的多径分量(例如时延、多普勒频率和方向角)进行分簇. 对于多输入多输出(multiple-input multiple-output, MIMO)通信信道来说,基于多径分量的簇尤其重要[2-4],忽略分簇会导致对信道容量的高估,并导致传播场景复杂化[5-6]. Sub-6 GHz频带的现有信道模型中,多径分簇聚类算法主要应用于由高精 度 参 数 估 计(high accuracy parameter estimation,HRPE)算法获得的多径分量,例如空间交替广义期望最大化(space-alternating generalized expectationmaximization, SAGE)算法[7]. 同时,可以通过簇在参数空间中的中心位置及其扩展来有效描述簇的分布和扩散特征. 因此,许多最先进的MIMO信道模型都依赖于多径簇的概念[8],如大多数标准化的MIMO信道模型3GPP-SCM[9]、WINNER II[10]、IEEE 802.11n[11]、COST259 DCM[12-13]和COST273[14],将多径分量聚类以降低模型的复杂性并优化模型的仿真性能.
随着5G技术的蓬勃发展,智慧出行已成为出行“标配”,高铁乘客的可靠通信服务的需求也越来越高[15]. 高铁的高移动性和周围环境的快速变化造成的明显的多普勒效应,再加上快速的多径衰落给高铁信道研究带来了巨大的挑战,并且5G网络还导致快速的小区切换和基站的密集部署[16]. 与传统的公共移动通信方案相比,高铁方案中的测量活动相对受限,需花费大量的时间和材料,且还需获得高铁管理部门的许可才能在车厢中进行测量. 常见的测量方法主要包括基于信道探测仪的主动测量和基于现网的被动测量. 被动测量是指将5G基站发送的5G下行链路信号用于多种场景中的信道提取.
文献[17-20]针对不同高铁场景的信道属性(例如路径损耗,时延扩展(delay spread, DS)和Ricean K因子)利用主动测量的方法在不同频带上进行了分析和建模. 与主动测量相比,通过被动测量获得的信道特性与用户体验到的真实信道更加一致,有着更高的模型遍历性和更高的保真度. 文献[21]提出了一种新颖的基于长期演进(long term evolution,LTE)的信道测量,基于测量数据分析了小区组合或单链路区域中功率时延分布(power delay profile,PDP)、多普勒频率扩展(Doppler frequency of spread,DoS)和DS的特性. 文献[22]基于服务中的LTEA网络进行了信道测量活动,在隧道和非隧道情况下比较了信道的DS和K因子. 文献[23]提出了基于几何的路径损耗模型.
目前,4G频带中高铁信道已取得大量的研究成果,包括不同情况下的大尺度和小尺度信道特性模型[24]. 6 GHz以下或毫米波频段也有一些5G宽带信道模型的测量数据和特性分析. 文献[24]介绍了高铁在2.35 GHz时车厢部分的信道特性. 文献[25]建立了以25.25 GHz为中心的500 MHz带宽的宽带高铁信道模型. 上述文献分析了关键信道特性,但不足以准确评估高铁通信系统的性能.
本文进行了一项基于5G新无线电(5G new radio,5G-NR)网络服务的研究工作,对中国上海到无锡的高铁进行了下行信道数据采集并建模.
构建5G信道模型,首先需要开发一套5G现网信道测量系统来采集信道数据,如图1所示.
图1 5G下行信道被动测量系统Fig. 1 5G passive sounding system for downlink channels
针对Sub-6 GHz频段设计的被动信道测量系统有着如下特性:1)出于对信号连续采集的需要,作为信号采集设备的软件无线电外设(software-defined radio, SDR)采用双通道采集信号,不仅可以满足同时采集两路信号的要求,而且可以保证接收到的数据没有中断. 2)双通道之间的校准需要考虑,尤其是它们之间相对的初始相位差. 为此,每次测量前需采用SDR发送的与实际采集环境中相同的射频信号,通过馈线连接两个通道,对接收到的数据进行采集存储,在后处理中用于对双通道在此次测量中的响应,包括对通道间的相位差异、相位噪声进行分析与建模,其结果用于高精度参数化分析处理. 3)测量室外场景时,由于天线增益太低,需在接收端使用低噪声放大器(low noise amplifier, LNA)来放大接收信号的功率.
本次测量的是上海-无锡高铁沿线列车车厢内的5G信号,两全向天线摆放在窗边进行数据采集.沿途高铁专网小区信息见表1.
表1 沿途高铁专网小区Tab. 1 High-speed rail private network communities along the way
5G下行信道特征分析和信道建模的过程如图2所示.
图2 基于簇的信道模型构建流程图Fig. 2 Flowchart of channel characteristics and cluster-based modeling
对于基于簇的宽带信道建模,当在时变环境中进行测量时,有必要将连续的信道观测数据分为多个段,每个段都代表一个保持广义平稳(wide-sense stationary, WSS)特征的信道. 可以基于多径分量在多个参数维度上的分布来执行这种分段过程. 多径分量参数的估计可以通过HRPE算法来计算,例如广泛使用的SAGE算法[26]. 采用KS-testing准则分段算法来自动确定每个段中的快拍数量,并利用信道样本数据进行随机模型构建. 信道数据是通过被动测量获得的,由于无法获得基站的响应,因此多径分量的扩散效应将大于真实的观测结果,传统Kmeans聚类算法不再是最合适的选择. 通过对Kmeans算法进行改进,并和高斯混合模型(Gaussian mixture model, GMM)算法的聚类性能进行比较,选择更适合的聚类算法,并将获得的参数空间(如时延域、多普勒域和角度域)中的聚类统计特征构成随机信 道模型.
1.2.1 分段方法
被动测量情况下需合理进行数据分段,以确保每个数据段均由满足WSS准则的信道观测组成. 每个段合适的快拍数量的确定需要考虑信道平稳特征并确保足够数量的样本以提取信道特征之间的平衡.KS-testing算法通过比较连续快拍中的由时延域、多普勒域、方向域参数构成的多径分量的经验累积归一化功率分布(cumulative normalized power distribution, CPD)来对数据进行分段,可根据单个维度中信道的功率谱来计算[27].
通过比较Dmax和显著性水平为5%的Dstat临界值来检查假设,Dmax为参考快拍和第n个快拍的CPD的最大差值. 临界值Dstat[28]为
式中:阈值系数 α为对应显著性水平的常数[29],通常为1.36;Mn为在第n个快拍中估计的路径数量;M′为参考快拍估计的路径数量.
假设检验H0表示从第n个快拍获得的路径估计和从参考快拍获得的路径估计具有相同分布. 当且仅当Dmax<Dstat时,H0为真,将n增加1. 如果第n个快拍的H0为假,则将第n个快拍视为与参考快拍属于不同的信道,表示上一段快拍结束,第n个快拍被视为新的参考快拍.
对所有快拍执行完以上步骤后,将获得多个数据段,每个数据段都包含一定数量的快拍,均满足相同 的WSS状态.
1.2.2 分簇方法
多径分量的扩展效应在被动测量场景中更为重要,需评估不同的聚类算法以选择合适的方法. 基于HRPE算法提供的估计结果,本文采用K-means和GMM聚类算法对多径分量进行分簇,并采用高铁场景测量数据对这两种算法的分簇性能进行比较.
1) K-means聚类算法
通常,多径分量之间的欧几里得距离用于计算多径之间的聚合分离程度. 对于信道建模,簇将相邻的多径分量分为多个组,每个段中多径分量的距离用于计算簇时延、多普勒域和角度域的分离聚合度.对于高维信道估计数据,多个域的影响是不同的,仅使用欧几里得范数作为多径分量之间的距离是不合适的,需采用多径分量的距离和功率加权的形式进行聚类. 第j个和第k个多径分量之间的距离χjk为
式中:λ 在特定的测量环境中是一个常数,不受主观影响的情况下用于对时延距离和角度域距离的加权处理;τj和τk表示多径分量的时延;ητ表示时延的标准偏差. 在动态场景中,多普勒距离的计算公式与时延计算公式一致.
2) GMM聚类算法
理论上,如果某个GMM融合的高斯模型个数足够多,之间的权重设定得足够合理,则GMM可以拟合任意分布的样本. GMM通过将数据样本分配给多径分量后验概率最大化的多元高斯分布来实现. 通过Akaike信息准则(Akaike information criterion, AIC)选择合适的聚类数量,来评估统计模型拟合的良好程度. AIC准则可以表示为A=2k-2ln(L),k为参数模型的数量,L为模型出现的概率.A值用来权衡估计模型的复杂性和拟合数据的优度,当A值最小时,模型最佳.
3)分簇算法的性能评估
聚类分析是为了找到数据中每个多径之间的关系. 簇内的相似度越大,簇间的差异越大,聚类效果越好. 一种聚类有效性评估方法即轮廓分析,使用图形工具来评估簇内样本的聚集程度,可应用于Kmeans和GMM聚类算法. 样本的轮廓系数可通过三个步骤来计算:①将样本x与所在簇中其他点之间的平均距离作为簇内聚合度a;②将样本x与其最近簇的所有点之间的平均距离视为簇间分离度b;③将簇间分离度与簇内聚合度之差除以两者中的较大者,以获得单个样本的轮廓系数Λ,计算公式如下:
轮廓系数 Λ 的取值范围为[-1, 1]. 当簇内聚合度等于簇间分离度时,轮廓系数为0. 当b>>a时,轮廓系 数约为1,这时该模型的性能是最好的.
高铁从上海到无锡,主要经过郊区和居民区,而基站则沿铁路部署,发射功率为47.8 dBm. 通过构建虚拟天线阵列来估计多径分量的角度域参数. 高铁的高速移动会引起周围环境的快速变化,带来明显的多普勒效应和多径分量的快衰落,导致某些路径的参数估计精度大大降低,因此需识别并删除估计错误的“伪路径”. 针对高铁场景,连续采集8 s测量数据,提取信道冲激响应(channel impulse response,CIR)间隔为20 ms,等于两个连续CSI-RS之间的间隔,采用HRPE算法共提取出300个快拍,覆盖距离为600 m;然后采用KS-testing算法将300个快拍分成30个段,每个段都符合WSS过程.
选取其中一个数据段分别采用K-means和GMM聚类算法对多径分量进行分簇并对比. 图3为不同协方差矩阵类型下采用AIC进行聚类数量选择的结果,由于当A值最小时对应的分簇数量最合适,所以由图3可以看出,当聚类数量k为9,协方差矩阵类型 为全角共享时,分簇效果最好.
图3 不同聚类数量k的AICFig. 3 AIC for various k
为比较两种聚类算法的性能,基于K-means和GMM算法的分簇结果来计算轮廓系数,如图5所示.可以看出:对于GMM算法,存在一些值为负的异常值,而其他轮廓系数均小于0.7;K-means算法总体轮廓系数值大于GMM,因此K-means分簇效果优于GMM. 尽管GMM算法能够对不同簇之间的重叠进行建模,但由于5G应用中真实环境的混乱性质,多径分量的分布无法由GMM准确描述,提取的参数意义不大,因此采用K-means算法对多径分量进行聚类. 高铁场景中,对8 s的测量数据进行分簇产生270个簇,并将其特征应用于模型建立.
图5 采用GMM和K-means算法进行分簇的轮廓系数分布Fig. 5 Contour coefficient obtained from contour analysis of clustering using GMM and K-means algorithm
图4为基于AIC方法获得的分簇数量分别采用GMM和K-means算法获得的分簇聚类结果,其中标记有相同颜色和图例的多径分量被分到同一个簇,段的簇数为16. 可以看出,采用K-means算法进行聚类的多径在二维参数空间中不重叠也不覆盖,与GMM算法相比,且相同簇中的多径分量更加紧凑.
图4 利用AIC采用GMM和K-means算法获得的分簇聚类结果Fig. 4 Clustering result obtained by using the K-means method and GMM method based on AIC
将针对高铁场景建立的基于簇的宽带信道模型与文献[10]中介绍的WINNER II模型进行比较,结果如表2所示. “5G-NR”是指本次工作基于被动测量活动中建立的模型,包括 DS、DoS和来波水平角扩展(azimuth spread at arrival, AsA). 根据3GPP TR38.901标准,对数正态分布适用于拟合扩展参数,以DS为例,对数正态概率密度函数的期望对数和方差分别用μlgDS和σlgDS表示.cDS表示分簇的平均DS. 可以看出,5G-NR和WINNER II模型信道参数具有相似的值,得到的簇的数量一致,但DS较小,可能是测量中的铁路结构较高导致的. 值得一提的是,我们在此处建立的模型包括信道的多普勒频率特性,这对于高铁场景尤其必要.
表2 针对高铁场景两种信道模型性能对比Tab. 2 Performance comparison of 2 high-speed-train channel model
对Sub-6 GHz频段的高铁场景进行了信道测量,数据采集利用被动信道测量系统,可以接收5G下行链路信号(例如CSI-RS),以表征100 MHz带宽的传播信道. 通过KS-testing算法对多个快拍中的多径分量进行分段,以确保每个段中观察到的信道都符合WSS过程. 利用GMM和K-means聚类算法对由时延、多普勒频率和来波水平角三维域组成的多径分量进行分簇,最终选择K-means算法来构建基于簇的模型,因为它在簇内紧凑性、簇间分离性、排他性和时间消耗方面均优于GMM. 并根据测量结果,建立了5G-NR基于簇的随机信道模型. 与现有的标准模型WINNER II相比,本文模型更真实地描述了信道特性,并且是根据5G-NR服务网络的确切环境中采集的数据构建的,因此更符合真实情况的信道.