5G蜂窝网络高维数据异构特征映射降维仿真

2021-11-17 08:37鞠瞻君刘亚娟
计算机仿真 2021年6期
关键词:高维降维识别率

鞠瞻君,刘亚娟

(吉林大学,吉林 长春 130012)

1 引言

伴随移动网络的快速发展,不仅极大便利了人们的日常生活,也对提高了各种网络软件运行的整体质量,通信数据呈现大幅增长的趋势。但使用人数过多、数据信息量过于庞大,导致运行速度变得缓慢或者出现卡顿等现象。为了可以应对新兴移动数据流量的大幅增长,各界已经对5G蜂窝网络展开深入研究。

王士同等人[1]提出一种多核学习降维方法,将网络中大量数据通过映射函数反射到高维空间中,在这个过程中可能会促使数据流结构出现异变的现象,为了能够保持原数据的流形结构,从原数据中获取重要数据信息与映射空间信息,把两者相结合,使其在高维投影空间中能够较好地保存原数据的流形结构,很大程度的降低因数据在映射空间中产生异变而对降维结果造成的影响。原信息与特征信息组成的方法描述为核之间的耦合,再进行优化处理获得其核权重系数,可操作性较好,但该方法在时间消耗较长。

毛晓菊等人[2]提出一种集群分类映射关联降维聚类方法。根据模糊变换、模糊关联聚类、集群分类映射、阈值查找和应用等技术,建立低维特征的多标签模糊关联模型,再利用模糊相关评价将高维文本转化为低维的模糊关联向量,避免维数灾难问题。所提算法不要求分类区域呈现凸性特征,适用性更加广泛。该算法的计算复杂度较低和分类精度较好,但是没有考虑到数据在特征空间中的局部性质,无法保持样本在新特征空间中存在原有的分布结构。

基于此,提出5G蜂窝网络高维数据异构特征映射降维方法,通过随机矩阵,保留了原有的数据特征并排除了冗余度,再根据半监督正则化方法,进一步优化高维数据异构特征映射降维。

2 5G蜂窝网络高维数据异构框架

5G蜂窝网络[3],可以很大程度的加强网络数据管理能力、信息转发能力以及整体网络系统容量。同时能够对高维数据异构进行管理,达到所预期的效果,促使5G蜂窝网络被普遍使用,变得更加广泛化、智能化。

未来移动网络数据流量会大幅增加,用户对网络流量时速的要求也越来越高,4G网络已经不能够满足人们的使用需求,提出了5G蜂窝网络,它能够实现对用户行为和业务内容的智能感知和优化[4],能够进一步掌握网络页面的分离情况,确保网络软件的升级、优化等性能,从而加快网络软件更新速度,能够高效率的减少在运行过程中所消耗的大量成本,还具有开放性、可编程性、灵活性以及可扩展性,并有较好的发展前景和广泛的可适用性。

为了能够更好地使用缓存技术,需要对5G蜂窝网络中的数据实施研究分析,促使其变得更加智能化。5G蜂窝网络高维数据在异构数据[5]领域中具有通用性、易用性以及可扩展性。能够灵活地根据数据流量的需求在热点区域扩容数据面传输资源,依据服务数据对象技术,能够在网络中对异构数据源进行统一数据访问模式,还便于进行二次开发以及新型数据源的引入。5G蜂窝网络在数据处理能力方面更加高效,缓存技术能够按照用户需求和业务特征等因素进行处理,能够很大程度的减少网络传输时所带来数据流量浪费。

统一描述访问和数据转换作为异构数据的主要功能。在这其中统一性的数据访问,也包括了针对数据进行详细描述模块,该模块是在对原始数据抽取后的基础上,对其进行抽取描述和访问区的构建[6]。数据转换是根据其相对应的规则以及需要进行转换的数据集合组来构建的,其中数据源的模块分别是根据对该数据获取的信息以及对数据分析后的结果构成。高维数据异构框架如图1所示。

图1 高维数据异构框架

现阶段,无线智能设备的不断普及,蜂窝网络流量也随之加快增长,为了满足5G蜂窝网络覆盖需求,使大规模无线网络普遍覆盖,需要对多种高维数据结合、异构[7]进行特征映射降维处理,从而使网络流量运行更加快速,容量更庞大。

3 高维数据异构特征映射降维

3.1 随机矩阵理论

当随机矩阵的行数与列数的数值接近最大值时[8],行列的比值保持不变状态。当矩阵维数接近于最大值能够满足随机矩阵的收敛性,可以较精确的识别高维数据。M所描述的是随机矩阵,其表达式为

M=EET/L

(1)

在式(1)中,E作为N×L的随机矩阵,其均值为0,方差是1,使Q=N/L,当Q作为固定值时,L→∞,那么随机矩阵M特征值的概率密度P(λ)其表达式为

(2)

(3)

(4)

式中,λmax与λmin分别作为随机矩阵M的最大特征值和最小特征值。然后,根据相关矩阵C和随机矩阵M的性质,将相关矩阵C分成符合随机矩阵区域与差异区域,再对相关矩阵进行改进处理,排除相关矩阵内存在的噪声。

3.2 异构数据特征选择

在一定程度上来讲,高维数据是一组由众多数据集组成的复杂且数量多的数据集,该数据根据不同的数据形式,将会以不同的形式出现,这之间虽是同为高维数据但由于形式不同所呈现出的数据格式便有所不同,与此同时易购数据在运行传输的过程中,同样也具有多种变形和特征。数据量也会随之增加,从而出现新的数据结构格式。

特征选择作为一项高维数据预处理方式,能够很大程度的降低特征维数[9],在不改变原本特征空间性质的基础上,在原空间内选取一部分重要的特征,重新构成一个新的空间。特征项选择的优劣程度会严重影响数据聚类的准确率。

在进行高维数据异构特征选择时,运用互信息作为度量标准。设置N×L数据矩阵D,F={f1,f2,…,ft}作为特征的整体集合,S={s1,s2,…,sk}作为类别集合,然后建立互信息矩阵M,其表达式为

(5)

在k的值比较小时,无法符合随机矩阵的条件,故对互信息矩阵M实施增广处理,复制m此,为M=[M,m(M)],为了能够恢复初值的行列比,将m=(L-1)2/(N*k)-1,所得式为

(6)

为了保持数据的合理性,对互信息矩阵M按照式(7)和式(8)形式进行规范化、中心化以及标准化处理,获得矩阵Md。再按照式(9)运算获得t×t的特征相关性矩阵C,将其根据式(10)进行奇异值分解,其公式如下

ij=Iij-(maxIi-minIi)/2

(7)

(8)

(9)

C=UΛV

(10)

Cnew=UΛnewV

(11)

在高维数据异构中含有大量的特征,其中还存在许多相关度较低的冗余特征,相关度较高得特征之间还存在大量的噪声数据,因此需选择合适的特征,再对特征进行降维处理。

3.3 半监督正则化映射降维

在高维数据进行异构时[10],要求数据具有完整性、一致性、准确性以及及时性。运用半监督正则化方法,对高维数据异构特征映射降维。为了防止函数目标的过度拟合,采用正则化回归模型,其表达式为

(12)

(13)

(14)

故,在式(12)还能够表式为

(15)

式中,γK描述的是目标空间函数的系数,默认数值为0.005/l,γI描述的是在几何函数中的系数,默认数值为0.05N2/l。

最小化处理的显示映射[12]表达式即

(16)

对式(15)差采用矩阵计算,获得目标函数,其表达式为

(17)

通过半监督正则化方法处理矢量特征,获得显示映射和数据最低维度。

4 仿真结果

在进行仿真时,本文运用Windows7操作系统对所提算法降维效果进行检测,语言编制系统为Mstlab7,内存为8GB,根据Cloudsim平台构建5G蜂窝网络环境下高维数据异构特征映射降维仿真平台。采样大型数据库,首先对高维数据做PCA降维处理,并保存其97%的主要内容。选择具有高维数据和异构数据的数据集合,之中有39个异常数据记录,持续数值为5*10条TCP,在每条记录中都包含12个高维数值属性。其中设定的具体参数如表1所示。

表1 实验设置参数

充分结合分类器,则5G蜂窝网络高维数据异构特征映射降维框图如图2所示。

图2 异构特征映射降维框图

分别观察文献[1]算法、文献[2]算法以及本文算法的识别率,从而进行对比分析。目标维数d按顺序取值为1~30维,邻域KD的取值为7。在3种算法不同维数下的识别率如表2所示。

表2 平均维数识别率

从表2的对比中可以看出,本文算法在对高维数据异构特征映射降维时,识别率最高,能够处理大量样本,平均识别率比文献[1]和文献[2]高出1.54%和0.56%。本文算法能够在低维空间下更清晰的显示映射,具有较高识别率。

为了进一步验证不同方法降维的效果,进行对比实验,实验结果如图3所示。

图3 降维效果的对比图

如图所示,文献[1]方法的降维效果较为模糊,只能识别出几个特征点,文献[2]方法的降维效果较为清晰,能够识别出具体区域,而所提方法降维效果最为清晰,能够识别出具体的农田、村落,识别效果较为理想。

在此基础上,对三种方法的降维过程在网络运行时所消耗的时间,对比结果如4所示。

图4 运行消耗时间

从图中能够看出,样本数量在不断增多时,本文算法运行时间一直保持平稳的状态,耗时较短,时间复杂度与其它2种算法相比较较小,具有显著的优越性和准确性。

5 结论

在高维数据中含有大量显著特征的数据集,这些数据集大幅降低了蜂窝网络的性能。因此,降维对于5G蜂窝网络就显得尤为重要。

1)所提算法对高维数据异构特征映射降维时,构建随机矩阵进行特征选择,运用半监督正则化方法处理矢量特征,获得显式映射进一步进行降维处理,缩短了运行时间,提供了降维效率。

2)在平均识别率方面,所提算法比文献[1]和文献[2]高出1.54%和0.56%;在实验个数为600个时,所提算法用时比文献[1]方法、文献[2]方法少60s和40s,具有明显优势。

3)由于时间有限,此次实验在时间消耗方面还有提升的空间,这也是我未来的研究方向。

猜你喜欢
高维降维识别率
基于相关子空间的高维离群数据检测算法
基于数据降维与聚类的车联网数据分析应用
我国实现高噪声环境下高效高维量子通信
降维打击
我科学家实现高效的高维量子隐形传态
高维洲作品欣赏
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别
人工智能现状和发展