基于机器学习算法的5G重点业务KQI和KPI关系研究

2022-12-06 09:51任小强罗志文陈苗苗王春佳西南交通大学希望学院四川成都60400中国移动通信集团甘肃有限公司甘肃兰州730000
邮电设计技术 2022年10期
关键词:视频流算法指标

任小强,罗志文,陈苗苗,王春佳(.西南交通大学希望学院,四川成都 60400;.中国移动通信集团甘肃有限公司,甘肃 兰州 730000)

0 引言

服务质量(QoS)根据关键性能指标(KPI)来定义,可反映网络质量,如丢包、延迟和抖动的情况。体验质量(QoE)则表示用户主观感知的质量,用关键质量指标(KQI)表示,例如“非常好”“好”“差”。KPI不是面向应用服务的,没有考虑用户业务感知,只能反映部分网络性能。即使KPI 正常时,也存在用户业务感知差的情况。5G 网络采用网络切片技术,旨在提供具有不同业务需求的端到端应用。预计未来几年,5G 网络业务感知问题主要依靠KQI 指标优化定界。由于KQI指标涉及网元多,数据流程长,端到端影响因素众多等问题,运维人员主要靠专家经验数据判断,准确定位问题原因较难。随着计算机处理性能的不断提升,机器学习算法得到了较好发展,例如线性回归(LR)、逐步线性回归(SWLR)、支持向量回归(SVR)、随机森林回归(RFR)和决策树回归(DTR)等机器学习算法在行业都得到了较好应用[1-2]。为了改善用户业务感知,提升网络运行性能,本文提出基于机器学习算法的KQI 与KPI 指标关系分析模型,重点评估5G 网络中端到端视频业务和文件下载业务的业务感知质量模型,探索关键质量指标(KQI)与底层KPI指标的关系。

1 算法总体框架

QoS 通过KPI 表示,QoE 通过KQI 表示,最终用户所体验的KQI 可以由KPI 通过复杂的映射关系来确定[3]。本文选择机器学习算法完成KPI 到KQI 指标的映射分析。总体建模框架如图1 所示,包含3 个阶段:数据收集阶段、训练阶段和应用阶段。这种模型框架允许使用直接测量的KPI指标(如DT测试、UE信令跟踪)或基于OTT 收集的数据集来训练模型,运营商可以通过调整配置参数来优化网络,该模型甚至可以预测出未知的业务感知指标。

图1 算法总体框架

测量数据集作为模型的输入,来源于无线侧KPI参数、无线基站配置参数、DT 测试数据和采集的KQI指标数据。此外,网络和配置参数以及其他数据集,也包括用户设备(UE)和应用程序层服务所在的服务器之间路径上的中间网络的信息,如核心网、传输网、Internet骨干网和应用程序提供者的网络。

训练阶段将前面收集的数据集合作为模型的输入,将KQI 与其他指标关联起来。这里选择监督回归技术对KQI与KPI的关系进行建模分析。为了防止过拟合问题,这里使用经典的K-Fold 交叉验证算法,它将原始数据分成K组(K-Fold),将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,这样会得到K个模型。这K个模型分别在验证集中评估结果,最后对误差MSE(Mean Squared Error)加权平均就得到交叉验证误差。为了评价模型质量,引入决定系数R2来判断回归方程拟合的程度,该系数表示目标变量的预测值和实际值之间的相关程度平方的百分比,是评价模型质量的常用系数之一。R2为1 表示该模型可以完美的预测数据,R2为0 表示完全无法预测数据。同时采用RMSE(均方根误差)衡量预测值与真实值之间的偏差,RMSE 对数据中的异常值较为敏感,如果得到的RMSE 较小,则可以用它建立预测模型,否则重新建模。

在应用阶段,模型将网络的数据配置和性能作为输入,并获得这些条件下预测的业务感知KQI 指标。在此阶段,该模型还考虑了额外获取数据集的可能性,以重新训练模型,处理之前无法获得的数据。

2 算法模型设计

2.1 测试网络环境

为了收集测试数据,利用中国移动某省的5G实验网络,包括10 个5G 宏站,5 个5G 室分站点,1 套包含AMF、SMF、UPF 和计费网元的网元结构。所有参数设置可以通过iManager U2000客户端进行自助配置。数据收集部分包括1 个测试终端UE、pioneer 测试软件、GPS和1个应用服务器组成。

在数据收集阶段,pioneer 测试软件收集UE 在不同参数配置下的训练数据集,测试开始时,UE 收集网络无线KPI指标,启动业务服务时,pioneer测试软件收集业务感知指标KQI。这里主要分析了文件下载业务和视频业务。文件下载业务的KQI 为文件传输延迟(IFTD)、文件传输平均吞吐量(FATH)、总文件传输延迟(TFTD)[4]。视频业务的KQI 指标包括视频流启动延迟(VSSD),即终端对视频流的初始请求到视频可以开始播放的瞬间的延迟;视频流吞吐量(VSTH),即视频流数据在完整播放期间的平均下载速度;视频流失帧频率、失帧次数和失帧时间(VSS)。

在培训阶段,使用Matlab 编写ML 建模模块,对结果进行处理并建立模型。该模块在远程客户端执行,通过SSH(Secure Shell)接口从终端接收特定无线网络配置参数和该网络配置下的KQI指标。

2.2 KQI指标建模

为了实现KQI 指标评估,初始值参数为参考信号接收功率(RSRP),参考信号接收质量(RSRQ),接收信号强度指示器(RSSI),可用BW 和网络负载这些指标当做自变量。测试UE 捕获的KQI 数据被认为是要构建模型的因变量。为了评估测试终端UE 在文件传输业务下的KQI,把每个文件的大小也作为自变量。使用9 000 个测试数据集,包含9 种文件大小(1 KB、10 KB、100 KB、500 KB、1 MB、5 MB、10 MB、20 MB、100 MB)、4 种可用带宽(5、10、15、20 MHz)、3 种网络负载(空负载、低负载和满负载),为这些参数的所有可能组合收集了KPI 和KQI。另外,在不同网络条件下收集了2 400 个视频业务样本数据,每个视频长度为60 min,形成360P、720P和1080P 3种不同分辨率的视频。

评估FTP 业务的KQI与前面描述的KQI相同。而对于视频业务,评估的KQI 为VSSD 和VSTH。由于在实验过程中产生的失帧数量并不显著,VSSD 指标没有被考虑。这里选择缓存视频流达到规定分辨率所需的最大时间(VTMaxQ)作为一个KQI指标[5-6]。

在训练阶段评估了5 种主要的机器学习算法:线性回归(LR)、逐步线性回归(SW-LR)、支持向量回归(SVR)、随机森林回归(RFR)和决策树回归(DTR)。LR是最经典的回归技术,它定义了一个因变量和几个自变量之间的线性关系。SW-LR 是LR 的改进形式,它利用逐步回归算法筛选并剔除引起多重共线性的变量,得到最优变量集合。支持向量机是一种用于回归的自适应向量机。DTR 通过跟踪决策树结构中从初始节点到包含预测的最终节点的分支来预测输入数据。RFR是由多棵回归树加权组合成的预测模型。

3 算法结果分析

图2是5种回归技术按照K-Fold交叉验证算法进行分析的结果,对于文件传输业务,RFR 和DTR 回归算法的相关性最好,TFTD和FATH的R2值接近1,可以根据TFTD 和FATH 指标优化客户感知。对于IFTD,所有回归技术的R2值都接近于零,这个指标不能用于衡量用户的业务感知,对于视频业务,RFR、DTR、SVR分析的VSTH 和VTMaxQ 指标相关性较高,相关性系数总体大于0.8,但是VSSD 的相关性系数小于0.6,不能作为无线网络优化重点参数。

图2 算法分析结果

为了评估每种算法的处理时间,表1 比较了每个机器学习算法和经过训练得到KQI指标所需的执行时间。

表1 训练得到KQI指标所需的执行时间

对于FTP服务,在回归过程中,变量的重要性是决定哪个预测因子对结果有更大意义的关键因素。决策树模型给出了量化每个变量重要性的简单方法,图3显示了使用决策树模型分析得到的KPI指标权重。权重值越低,表示它的重要性就越低。结果表明,可用的BW、负载是决定TFTD 的关键指标,而RSRP 和RSSI 对FATH 有显著影响。对于IFTD,所有的KQI 指标基本没有相关性。

图3 KQI与对应KPI指标权重

在视频流业务中,SINR 反映了UE 和5G 基站之间信道内的干扰和噪声。SINR、RSRP参数与VSTH之间应该有一个映射模型,可以通过重点优化SINR、RSRP指标来提升视频业务的KQI 指标。根据仿真数据,预测了FATH和SINR之间的映射模型如下:

其中PSNR 为视频流FATH 指标的峰值信噪比。令I(i,j)表示原始视频流图像帧的强度值,K(i,j)表示失真视频流图像帧的强度,然后均方误差(MSE)定义如式(2)所示,其中m,n表示视频图像的行数和列数。

视频帧的PSNR 指标定义如式(3)所示,Max[(Ii,j)]为视频帧的最大强度值;对于8 位图像,通常Max[I(i,j)]=255。

采用曲线拟合的方法,得到FATHPSNR与SINR 的关系如图4所示,在这种情况下,参数a和b分别为-15.39和79.52,可以看到拟合程度接近96%,说明此模型是可行的,预测和模拟结果之间的匹配验证了本文的映射模型。

图4 FATHPSNR与SINR关系

R2决定系数表示回归方程的拟合程度,用于度量回归算法模型的性能。结果表明,使用完整数据集训练的模型性能优于使用部分数据集训练的模型。对于完整的数据集,R2的值与图4 中分析结果类似,差异不大,如图5 所示。然而,对于DTR 和RFR 回归算法来说,TFTD 中使用部分数据集与完整数据集分析的差异较大,如图6 所示,这是因为文件数量增加时,DTR 和RFR 算法的性能大大降低,从而对TFTD 指标具有明显的影响。

图5 数据集对VSTH的影响分析

图6 数据集对TFTD的影响分析

4 应用效果分析

4.1 低速率基站优化

真实场景的测试表明,造成文件下载业务感知差的主要因素有MR 覆盖率(32%)、RRC 连接平均数高(25%)和MR 重叠覆盖度高(21%)等。该模型关联分析的定位准确性为83.3%,能有效分析现网小区KQI劣化的主要原因,按本算法给出的优化建议实施后,5日平均下载速率环比提升13%~20%。

4.2 视频业务优化

选取视频业务质差强相关的VSTH 指标作为KQI,分析其与无线KPI 的关联关系。应用本模型对498 个基站进行了关联性分析。造成VSTH 指标差的几个主要因素有SINR>20 dB 的采样点占比(29%)、UE 高发射功率占比(24%)和平均TA 值(9%)等。算法自动定位VSTH 指标差的主要原因是SINR<-3 dB的采样点占比过高,优化后,5 日平均下行丢包率从优化前3.39%下降到3.06%。

5 结束语

本文针对5G的视频流业务和文件下载,通过机器学习算法构建2 种业务的KQI 指标评估模型,分析KQI 指标评估模型与KPI 指标的关系。网络运营商可以使用该模型来预测最终用户的QoE 水平,提高运维效率。

猜你喜欢
视频流算法指标
一类带临界指标的非自治Kirchhoff型方程非平凡解的存在性
边缘实时视频流分析系统配置动态调整算法研究
基于视频流传输中的拥塞控制研究
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
最新引用指标
莫让指标改变初衷
进位加法的两种算法
铁路货场智能大门集装箱全景图像采集方法研究
美国视频流市场首现饱和征兆