基于随机森林算法的智能NB-IoT覆盖评估

2021-09-16 06:50钟检荣中国联通北京市分公司北京100038
邮电设计技术 2021年8期
关键词:训练样本窄带原始数据

曾 伟,刘 哲,钟检荣(中国联通北京市分公司,北京 100038)

0 引言

窄带物联网(Narrow Band Internet of Things,NBIoT)作为5 G 低功耗大连接场景的前期技术已得到了广泛关注,NB-IoT 目前已成为各大运营商物联网采用的主流技术。与传统通信技术相比,窄带物联网技术具有低成本、低功耗的特点,应用范围更加广泛。在技术路径的选择上,窄带物联网技术对传统通信技术做了极大的简化,为了节省终端功耗,不支持终端的MR测量上报。通过传统手段来获取NB-IoT网络的信号状况,不仅周期长、成本高、效率低,而且部分业务场景点难以覆盖,因此无有效的手段获取网络覆盖状况成为了窄带物联网技术发展中亟待解决的难题。在人工智能日益成熟、应用愈发广泛的今天,在NBIoT网络覆盖评估引入随机森林算法,有望解决这一难题,为窄带物联网的进一步推广应用扫清障碍。

1 NB-IoT覆盖线性评估

在目前的技术手段与实践中除了路测评估之外,利用NB-IoT 网络与UMTS900M 网络同站址同天馈的特点,常采用覆盖线性评估的方法。共天馈小区信号空间传播路径大致相同,路径损耗差基本定于不同频段空间损耗差。基于UMTS900M 网络栅格化MR 数据构建路损矩阵,并利用发射功率和路径损耗差别,实现对NB-IoT网络栅格的覆盖预测评估,如图1所示。

图1 NB-IoT覆盖线性评估原理

1.1 理论推导

由于NB-IoT网络与UMTS网络采用1∶1同站址组网,共用天馈系统,2 张网络在射频特性上,如天线挂高、方位角、天线角等保持一致。所以,NB-IoT 网络与UMTS 网络的天馈损耗(Feeder loss)和天线增益(An⁃tenna Gain)相同,接收信号强度差别只与发射功率(Tx Power)和路径损耗(PathLoss)有关。发射功率差异如表1所示。

表1 发射功率差异

路径损耗可以由自由空间传播损耗公式计算得到。自由空间传播损耗公式:

由式(1)可知,在传播距离相同的情况下,路径损耗只与工作频率相关,中国联通NB-IoT网络使用的频段为900 MHz与U900网络同频段,所以2张网络的路径损耗一致。

综上所述,如用U900 网络作为NB-IoT 网络覆盖线性评估的参照物,那么在同站址共天馈场景下可计算N900网络覆盖强度:

N900 接收信号强度-U900 接收信号强度=32.2-33=-0.8 dB;即N900 RSRP=U900 RSCP+0.8 dB

1.2 实测矫正

1.1 节通过理论说明了通过U900 的覆盖强度来估算NB-IoT 网络覆盖强度的可行性,U900 的覆盖电平与N900的覆盖电平存在规律差异。在实际应用中,由于网管平台采集及解析U900 MR 数据产生的偏滞,U900 与N900 的覆盖差值还需要经过实测矫正。选取了一片区域进行验证,对45 个测试点的U900 与N900进行CQT测试,对比测试结果,如图2所示。

图2 N900 RSRP与U900 RSCP的实测差值示意图

从图2 可以看出,U900 覆盖电平值与N900 覆盖电平值整体差值保持平稳,确实存在规律性差异,差异值平均为4 dB,即U900 RSCP 比N900 RSRP 高约4个dB,因此N900 RSRP≈U900 RSCP+4 dB。

2 随机森林模型的建立

随机森林是一种统计学习理论,是利用bootsrap重抽样方法从原始样本中抽取多个样本,对每个bootsrap样本进行决策树建模,然后组合多棵决策树的结果,通过投票得出最终结果。随机森林模型具有很高的预测准确率,对异常值和噪声具有很好的容忍度,且不容易出现过拟合。

2.1 数据的来源与选取

本文以目标点位处的U900 制式的RSCP 值、U900制式的EcIo 值、L1800 制式的RSRP 值、L1800 制式的SINR 值、U2100 制式 的RSCP 值、U2100 制式 的EcIo值、经度、纬度及采样点与主服务基站距离这9个指标作为输入特征;目标点位的NB-IoT覆盖电平值作为输出特征。

在原始样本集中,输入特征数据可以直接从网管后台提取相关指标,输出特征通过实地测试的方法获得。同样的,在评估待测点位的NB-IoT 覆盖电平值时,只需要从后台网管提取待测点位的9 个输入特征值即可。

2.2 随机森林算法模型

随机森林算法是一种集成学习算法,综合多个决策树的预测结果得到最终结果。随机森林中随机是核心,通过随机的选择样本、特征,降低了决策树之间的相关性。随机森林中的随机主要有2 层意思,一是随机在原始训练数据中有放回地选取等量的数据作为训练样本,二是在建立决策树时,随机地从特征中选取一部分特征建立决策树。这2种随机使得各个决策树之间的相关性较小,可进一步提高模型的准确性。随机森林算法分为如下3个步骤。

步骤1,生成原始数据样本集,模型输入量的个数为9 个,输出量的个数为1 个。选取N个NB-IoT 网络终端点位来生成原始数据样本集,一条原始数据样本包含9 个输入特征值和1 个输出值。原始数据样本集包含N条原始数据样本。

步骤2,用步骤1生成的原始数据样本集通过有放回抽样M次生成训练样本集,建立窄带物联网覆盖评估模型,评估模型以随机森林算法为核心,由M 棵决策树组成。每棵决策树都由一个训练样本集生成,决策树生成时从根节点开始,采用最小二乘偏差(LSD)方法递归确定每个节点的分裂变量和分裂点,直到满足停止条件,如图3所示。

图3 随机森林模型生成图

步骤3,获取待测点位的9 个模型输入数据,通过窄带物联网覆盖评估模型计算出待测点位的信噪比值。将9 个模型输入数据输入模型,每棵决策树都可以得出1 个信噪比值,记为f1(x),f2(x)…fm(x),M棵决策树所得结果的平均值即为模型的输出结果。即:

在步骤2 中,训练样本集的生成方法是:从N条原始样本数据集中,有放回随机抽样n(n≤N)条原始数据样本,再从每条原始数据样本中随机选取k(k≤9)个输入特征值与1 个输出值,生成1 个训练样本集。1 个训练样本集为一个n×(k+1)的数组。

生成决策树时的最小二乘偏差(LSD)方法是求解:

其中,ti是分裂特征,是分裂点,R1,R2是按照分裂点划分的2个区域:

c1,c2是R1,R2两区域内的平均值:

xi,yi是模型的输入和输出,i ∈{1,2,…n},j ∈{1,2,…k}。

遍历特征ti,扫描分裂点,选择使最小二乘偏差达到最小值的分裂特征和分裂点(ti,),作为决策树的分裂依据。

为了控制过拟合现象的发生,可以把决策树生成停止条件指定为:某一分裂点左右任意一分支的数据集样本数小于5%×n。

3 结果对比分析

本文构建了2 种NB-IoT 覆盖评估模型,选取同一片区域对线性评估模型和随机森林模型的效果进行验证,通过评估值与实测值的对比,来验证模型的准确性,比较模型的性能。如图4和图5所示。

图4 线性评估模型NB-IoT覆盖评估值与实测值对比图

图5 随机森林模型NB-IoT覆盖评估值和实测值对比

结果表明,由线性评估模型推算出的评估值与实测值大部分偏差在20 dB 以内,标准偏差σ=10.5,评估结果较为一般。而由随机森林模型推算得出的评估值与实测值有显著的相关性,标准偏差σ=5.7,在覆盖电平值较差的区域采样点偏差大,这与NB-IoT弱覆盖区域采样点较少有关,如能增加采样点补充进训练样本集,则评估精度还可以进一步提升。

综上所述,由随机森林模型得到的评估值较为理想,弥补了NB-IoT 网络覆盖评估不准确的漏洞,具有市场推广意义。

4 结束语

本文深入研究NB-IoT覆盖的评估方法,结合人工智能领域的随机森林算法,探索出一种开展NB-IoT覆盖评估的有效方法。对比线性差值评估方法,有效提高了覆盖评估精度,大大提高了覆盖预测评估效率。

对NB-IoT物联网覆盖的精准评估,可以有效地指导NB-IoT网络规划建设和优化运维,精准助力业务部门对潜在用户的售前牵引,为运营商物联网业务的部署应用提供了有力支撑。NB-IoT 点位的评估优化,支撑了包括北京联通亦庄智能井盖项目、丰台水位监控项目以及新冠疫情期间隔离报警设备项目在内的一批重点项目,均取得了显著的效果。

猜你喜欢
训练样本窄带原始数据
受特定变化趋势限制的传感器数据处理方法研究
人工智能
LATE水平集图像分割模型的矩形窄带法①
直扩系统中的窄带干扰抑制
直扩系统中的窄带干扰抑制
论航空情报原始数据提交与应用
基于小波神经网络的网络流量预测研究
对物理实验测量仪器读数的思考