基于Hadoop的LTE性能分析及预测系统设计

2020-01-03 08:59杨林根邹景永
现代计算机 2019年33期
关键词:基站数据库性能

杨林根,邹景永

(1.广东水利电力职业技术学院计算机系,广州510635;2.广东白云学院计算机系,广州510450)

0 引言

随着4G网络的普及,为了网络的稳定,使网民在优越的网络环境中娱乐或办公,确保LTE的基站性能稳定是一个重要的基础。因此实时监控LTE性能计数器是一个必要的环节,判断性能计数器是否正常工作,是否出现故障,或预测性能计数器是否即将出现故障,从而及时作出处理。确保网民的良好的网络体验。

LTE基站的建设越多,传统的维护检测方式大大增大成本。因此采用有效的检测方式是维护LTE基站的基础。在大数据的驱动下,本方将使用LTE基站中的性能数据,分析出基站的运行情况,做到及时反馈及预测,从而使用户有更好的上网体验。

1 系统需求分析

1. 1 LTE基站性能指标需求

为了能够较准确地从数据中分析LTE基站的性能,经分析,得出以下指标能够对分析LTE基站性能有较大的关联(以下计算公式为通用公式,与基站直接提供的计算方式区别)。

(1)RRC连接建立成功率

干扰或者弱覆盖,会导致无线链路质量差,导致信令不能正常收发,系统资源紧张也可能导致无线资源可分配导致无法建立RRC连接。

RRC连接建立成功率=RRC连接建立成功次数/RRC连接建立请求次数*%。

(2)E-RAB建立成功率

无线环境的优劣、智能天线的性能、相关参数的设置合理性都会影响E-RAB建立成功率。

E-RAB建立成功率=(Attach过程E-RAB建立成功数目+Service Request过程E-RAB建立成功数目+承载建立过程E-RAB建立成功数目)/(Attach过程ERAB请求建立数目+Service Request过程E-RAB请求建立数目+承载建立过程E-RAB请求建立数目)×100%。

(3)E-RAB掉线率=(eNodeB触发的释放原因为异常的E-RAB释放总次数+小区切换出E-RAB异常释放总次数)/E-RAB建立成功总次数×100%。

(4)负荷(基站主控板、信道板平均负荷值)

该数据只能反映计算器的运行情况。

(5)CQI高阶占比

SINR低导致CQI占比差,进而MCS阶数低,最终影响网络下行速率。CQI高阶占比对基站优化起重要作用。

(6)上行PRB平均利用率

(7)下行PRB平均利用率

(8)PDCP层上行用户面流量

(9)PDCP层下行用户面流量

1. 2 系统的功能需求

在详细调查各项业务流程的基础上,确立该分析系统由FTP文件扫描下载模块、XML文件解析模块、文件数据抽取模块、Hive统计调度模块、Sqoop加载入库模块、性能预测模块组成。

1. 3 系统的性能需求

本系统除了实现相应的功能模块之外,还需要结合使用的实际情况,确保系统的稳定性、可扩展性、可维护性、高效性。系统要求从采集到数据加载入库在15分钟内完成30G的数据分析,不能出现任务滞留。

1. 4 预测算法的整合

在机器学习中,数据是输入,也是起点。数据质量的高低或优劣将直接影响最终的算法效果[1]。因此,需对上述原始数据进行必要的数据清理、数据集成、数据归约和数据离散化等数据预处理步骤。

数据预处理后进行主成分分析,有利于消除逻辑回归模型分析中各特征指标存在的多重共线性,即每个指标都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠;另一方面,主成分分析能够实现降维从而减少不必要的计算开销[2]。

因此,本文采取主成分分析法对原始指标进行主成分分析(即寻找能够反映原始数据的关键因子),并计算出各主成分的贡献度,一般选取累计贡献度超过80%的主成分因子形成新指标空间。但本系统中不剔除维度。

将新特征指标进行线性映射目的是将主成分分析的输出结果进行变换满足逻辑回归模型的输入要求。

经过上述主成分分析后,提取出的新指标空间(即主成分)zi将其进行线性映射到新的空间分量θi为:

其中,βi是各新指标zi的贡献度,即主成分分析中计算出来的贡献度。

在计数器性能分析问题的建模中,采用了逻辑回归(Logistic Regression)模型。

其中,θi为新指标空间的线性映射结果。

2 系统设计

2. 1 系统架构设计

系统架构是系统设计的基本所在,本系统可简单的分为三层结构,源数据层、数据分析层、数据运用层。源数据层是通过Java采集程序采集LTE计数器数据进行预处理并存储在HDFS中,主要存储清单级文件。数据分析层是以Hive为主的数据分析,主要是对清单数据进行统计,加载等操作。数据运用层是面向用户的,主要是数据的可视化及功能展示[3]。

图1 系统架构图

2. 2 系统功能结构设计

在绘制系统结构图的过程,实际上就是对系统功能模块进行分解设计的过程,即合理地将数据流程图转变为所需要的系统结构图。

系统结构图能直观地了解系统的结构模式,理解系统的各个功能的结构,能更方便使用和理解整个系统。

本系统主要分为六大模块,每个模块都是一个运行的程序,通过任务表的关系将六个模块串联起来,从数据的流向程序的基本结构图如图2所示。

2. 3 系统数据库设计

数据库是各个业务工作流程的末端,系统所有业务都需要依赖数据库,由此可知数据库在系统中所起的作用。构建一个高效的数据库模型,有助于提升数据的存取效率,进而会影响到系统的性能。因此在进行系统设计时,数据库设计是极其重要的一环,需给予重视。

图2 系统功能结构图

在设计数据库模型时,需遵循设计的基本准则,具体如下:

(1)实体表不能既无主键也无外键,若数据库中存在上述实体表,则会加大后续的数据分析难度,影响系统性能。

(2)在使用面向数据的SQL语言进行程序设计时,尽量采取优化算法。

图3 数据关系模型设计

3 结语

本系统主要是通过对LTE基站主要性能指标数据进行统计分析处理,实时预测监控基站性能,面对故障及时采取应对措施,或提前做好预防工作。解决数据量的变化对LTE基站带来的影响。

猜你喜欢
基站数据库性能
UIO-66热解ZrO2负载CoMoS对4-甲基酚的加氢脱氧性能
夏季五招提高种鹅繁殖性能
基于NETMAX的基站网络优化
5G基站辐射对人体有害?
5G基站辐射对人体有害?
桌面端,GTX 1650并不是千元价位的显卡好选择
可恶的“伪基站”
数据库
数据库
数据库