基于机器学习的5G室内定位方法

2022-08-17 13:31张千坤陈任翔钟志刚周国栋中讯邮电咨询设计院有限公司北京00048中讯邮电咨询设计院有限公司郑州分公司河南郑州450007
邮电设计技术 2022年7期
关键词:时域载波幅值

张千坤,陈任翔,钟志刚,周国栋(.中讯邮电咨询设计院有限公司,北京 00048;.中讯邮电咨询设计院有限公司郑州分公司,河南郑州 450007)

1 概述

根据定位环境,无线定位系统可分为2种:室内无线定位系统和室外无线定位系统,室外无线定位系统,主要采用的是GPS 定位[1-2],而室内定位主要采用的是无线网[3-5]、蓝牙[6]、超宽带(UWB)[7]等技术。5G网络的大带宽、低时延、高可靠特性,为业务提供必要的网络基础,推动业务的不断丰富。业务应用场所有80%以上在室内,而室内定位由于GPS 信号弱无法满足室内业务位置服务的需求。随着业务的发展,室内定位的需求越来越强烈。由于室内环境复杂,如物体位置的随机移动、多路径散射、电磁干扰等,在室内进行精确的目标定位相比室外来说要困难得多。因此5G 室内场景急需一种定位精度高、复杂度低,且对设备以及终端没有要求的定位方法。

本文首先将采集到的CSI[8]通过逆傅里叶变换转换到时域,在时域进行滤波,消除多径的影响,然后再将滤波后的CSI转到频域,在频域进行加权求和处理,减少频率选择性衰落的影响,得到有效的CSI,同时,为得到更加准确的CSI 序列,本文还采用灰色预测模型GM(1.1)[9],对频域的CSI 序列进行预测,构建新的CSI序列,减少了采集CSI的数量,降低了计算复杂度,然后用新的CSI 序列带入路径损耗模型进行距离估计。室内定位的难点主要在于室内路径损耗模型的建立,传统的路径损耗模型主要是基于经验或者确定性方法[10],经验性模型比如对数-正态模型,这些模型的参数都是基于特定的环境,在比较复杂的室内环境,效果比较差,确定性模型比如射线跟踪模型,一般来说可以较好地还原室内环境的传播特性,但是缺乏计算效率,同时需要室内环境的几何信息以及材质信息,一旦传播环境发生变化就需要重新计算。因此本文基于机器学习方法,构建新的路径损耗模型,在室内不同的采样点采集CSI 并计算UE 与天线之间的距离,并将这2 种信息输入到决策树构建新的路径损耗模型,用于距离估计。最后结合多个天线并采用最小二乘法实现用户的准确定位(见图1)。

图1 定位架构

2 CSI预处理

2.1 CSI幅值信息预处理

本文采集到的原始CSI 数据表征的是频域上的值,为信道频率响应(CFR),OFDM 通信系统中不同的子载波的CSI可以表示为:

式中:

D——信号的路径

αk——第k条路径的信号衰减

τk——第k条路径的信号传播时间

fn——载波频率,fn=f0+nΔf

Δf——相邻2个子载波之间的频率差

CSI 可以通过快速傅里叶逆变换(IFFT)变换到时域,表示形式为信道脉冲响应(CIR):

式中:

φi和τi——对应的相位和时延

如果可以得到时域信号的信道脉冲响应,便可以区分不同路径的信号。本文根据CSI 的这种特性,对信号进行分离得到主径信号,提高距离估计的精度。

本文选择CIR 最大幅值的50%作为阈值,将低于50%的部分滤除从而减少多径衰减的影响,然后利用快速傅里叶变换(FFT)将时域CSI 转换到频域。滤波前和滤波后的CSI时域幅值如图2(a)和2(b)所示。

图2 滤波前和滤波后的CSI时域幅值

从图2可以看出,经过滤波以后,保留了直射径以及信号比较强的反射路径部分,信号比较弱的路径在时域受到了抑制。

将滤波后的时域CSI 进行FFT 变换得到的频域CSI幅值如图3所示。

从图3中可以看出,CSI在进行时域滤波以后幅值相比滤波前更加稳定,可以提高距离估计的精度。

图3 原始频域CSI以及滤波后的CSI幅值

2.1.2 频域幅值衰落补偿

由于在5G NR 系统中,带宽最小为100 MHz,在市区特别是室内环境下,系统带宽大于相干带宽,采集到的CSI数据会受到频率选择性衰落的影响,如图4所示。

图4 CSI幅值信息

图4 为在同一地点采集到CSI,从图4 中可以看出不同子载波的幅值相差比较大,如果只选择最大的CSI 幅值带入距离估计模型进行计算则会导致较大的距离估计误差。因此本文选择联合所有的子载波的幅值一起进行距离估计,本文将所有的子载波都赋予不同的权值,并对加权以后的所有子载波进行求均值计算得到一个有效的CSI,可以表示为:

最终得到的CSI可以表示为:

式中:

fk——第k个子载波的载波频率

K——子载波的个数

f0——信号的中心频率

e-jφi——第i个子载波的相位

CSIeff,i——第i个子载波的有效CSI

将图4中采集到的CSI的幅值按照式(4)进行处理得到的有效CSI幅值如图5所示,相比图4,图5的幅值跨度在1以内,要稳定的多。

图5 有效CSI幅值

2.2 灰度预测模型生成新的CSI序列

灰色系统理论是关于信息不完全或不确定的系统的控制理论,为了预测发展趋势,可以有效提高建模序列的平滑性。

灰色预测的基础是采用灰色预测模型,本文采用GM(1.1)模型,设置原始的有效CSI数据序列,表示为:

其中n为有效CSI的数量。

灰色预测模型的过程如下,首先生成新的数据列:

其中a,u为待解系数,分别称为发展系数和灰色作用量。

对累加生成数据做均值生成B与常数项向量:

利用最小二乘法求解灰参数,

将灰参数带入式(7),得到

将上述结果累减还原,即可得到预测值

根据灰色预测模型的式(6)~式(12),可以得到预测的CSI值为:

得到预测CSI 值以后,本文采用加权预测方法,即:

其中,这里w1和w2根据测试结果选取0.5 时,精度最高。

3 基于机器学习的路径损耗模型及定位

3.1 路径损耗模型训练

基于机器学习的路径损耗模型主要包括以下几个步骤。

b)对这些输入输出数据进行归一化处理,具体如下:

其中x表示的是需要归一化的特征值,xN表示的是归一化后的特征值。

c)模型选择,本文选择随机森林对模型进行训练,如图6 所示,在室内空间设置N个采样点,采集天线到终端的距离、天线距离地面的高度以及CSI 作为样本值D,表示为:

图6 随机森林流程图

yi——第i个采样点与天线的水平距离

采用有放回的方式每次随机抽取m个样本,抽取T次,则可以得到T个子集,记为Di,i=1,2,…,T。

在训练数据集所在的输入空间中,递归地将每个区域划分为2 个子区域并决定每个子区域上的输出值,构建二叉决策树,具体如下:

选择最优切分变量j与切分点s,求解:

阅读不是让学生记住多少知识,而是在阅读的过程中最终学会阅读。因此,家长在阅读绘本的过程中可以渗透相关绘本阅读的策略,比如,看图获取信息并进行推断,对后来发生的事进行预测,阅读中的自我提问,结合学生的实际等。家长们可以根据自己的优势和特长自主设计大胆尝试,让孩子们充分体验阅读带给他们的快乐,进一步提升他们的阅读能力,培养他们热爱阅读的浓厚兴趣和良好习惯,从而让孩子们逐渐学会阅读绘本,构建阅读力。

遍历变量j,对固定的切分变量j扫描切分点s,选择使式(17)达到最小值的(j,s);

用选定的(j,s)划分区域并决定相应的输出值:

继续对2 个子区域调用式(17)和式(18),直至满足停止条件。

将输入空间划分成M个区域R1,R2,…,RM,生成决策树:

其中I为指标函数。训练得到决策树后即可得到室内环境下的路径损耗模型。

新的预测值可以对T个决策树的预测取平均,表示为:

其中T为决策树的数量。

3.2 模型误差分析

用构建的随机森林模型进行预测后,需要建立恰当的评价指标来验证模型的准确性。在模型验证时,可以用均方根误差(RMSE)、平均绝对百分比误差(MAPE)、平均绝对误差(MAE)来反映误差的大小,计算值越小说明模型训练的效果越好。

其中PLq为测量值,PLq′为预测值,本文采用RMSE和MAE来表征模型预测的效果。

3.3 位置估计

利用路径损耗模型,可得到用户与天线之间的水平距离之间的关系,在室内某一位置采集到CSI以后,可得到用户与天线之间的距离,联合多个天线与用户之间的距离,对用户进行定位,假设有3 台基站,位置分别为(xa,ya)、(xb,yb)、(xc,yc),根据几何关系得到:

式中:

dab、dbc、dac——目标到第1 个AP 与到第2 个AP 的距离之差、目标到第2 个AP 与到第3 个AP 的距离之差、目标到第1个AP与到第3个AP的距离之差

(xi,yi)表示目标的位置点,如图7所示。

图7 多基站定位模型

4 误差分析

本文采用数据集来验证路径损耗模型的效果,本文将基于随机森林的训练模型与基于ANN 的训练模型进行对比,得到的结果如图8所示。

图8 误差分布

从图8 可以看出,基于随机森林训练的模型要优于人工神经网络,本文计算这2 种模型的MSE 和MAE并与对数-正态模型(log-Distance)进行对比,得到的结果如表1所示。

表1 3种模型的MSE和MAE对比

本文分别将这3种模型的预测值与真实值进行对比,得到的结果如图9所示。

图9 预测值与真实值的对比

从图9 中可以看出,基于随机森林的预测结果与真实值最为接近,而基于对数-正态模型的预测结果最差,这是因为对数正态模型只是一个经验值,并不能代表室内信号传播的真实情况,误差相对较大。将预处理后的CSI输入到训练好的模型即可得到距离信息,然后联合多个天线的水平距离信息即可得到用户的位置,定位结果如图10所示。

图10 定位结果

从图10中可以看出,本文提出的基于机器学习的定位效果要明显优于基于对数-正态模型,其中对数正态模型是在室内进行校准过,所使用的参数为最优参数。

5 结论

随着5G网络的开发和部署,网络规划对路径损耗预测的准确性、复杂度和通用性提出了更高的要求。同时路径损失模型在室内定位方面也起着重要的作用,建立距离与能量之间的对应关系对定位的精度有很大的影响。基于机器学习的方法,特别是监督学习,可以建立复杂的非线性关系,提高路径损耗预测的准确性。本文提出一种基于机器学习的适用于数字化室分的室内定位方法,采集信道状态信息数据,并通过时频域处理以及灰度预测模型提高数据采集的准确性、稳定性、减少数据采集的数量,并根据机器学习算法在室内训练路径损耗模型,更加真实地反映室内的信号传播特性,仿真结果表明,该方法相比传统的对数-正态模型预测精度有很大的提升,将此模型用于距离估计以及定位将极大地的提高定位的精度,同时可以解决目前5G定位中需要设备之间同步的问题。

猜你喜欢
时域载波幅值
OFDM 系统中的符号时域偏差估计
室温下7050铝合金循环变形研究
大功率微波部件多载波无源互调分析与实验验证
硬件时域门技术在宽频带天线罩测试中的应用
频域滤波产生的时域端点效应及避免方法
网络分析仪时域测量技术综述
低载波比下三电平NPC逆变器同步SVPWM算法
可靠性步进电机细分驱动技术研究
中国移动LTE FDD&TDD载波聚合部署建议
平地机作业负载谱分析