基于差分进化算法的网络多属性大数据聚类挖掘方法

2021-03-18 02:46宋蓓蓓
宁夏师范学院学报 2021年1期
关键词:特征分析差分聚类

宋蓓蓓

(安徽工业经济职业技术学院 计算机与艺术学院,安徽 合肥 230051)

随着动态分布式网络信息传输技术的发展,动态协同网络的数据信息维数越来越多,需要结合大数据和云信息处理技术,构建网络多属性大数据聚类挖掘模型,提高网络数据的检测和识别能力.通过网络多属性大数据的聚类挖掘和特征分析,构建网络多属性大数据聚类分析模型[1],提高网络的信息管理能力,相关的网络多属性大数据聚类挖掘方法研究,在网络的组网设计和大数据信息管理中具有重要意义[2].

网络多属性大数据聚类挖掘建立在对数据候选特征分析的基础上,通过贝叶斯关联规则分析,进行网络多属性大数据聚类挖掘[3],传统方法的网络多属性大数据聚类挖掘方法主要有基于网络爬虫的大数据挖掘技术[4],通过设置网络爬虫TCP/IP协议栈,对网络大数据进行布局分配以实现数据采集,并通过解决网络层次间的挖掘传输问题,完成聚类挖掘技术模型的搭建.基于模糊卷积神经网络的大数据聚类挖掘方法[5],构建网络多属性大数据聚类挖掘的联合特征分析模型,通过自相关统计分析和模糊度匹配,进行网络多属性大数据聚类挖掘.但是上述传统方法进行网络多属性大数据聚类挖掘时的适应度水平不高,抗干扰性不好.

针对传统方法存在的弊端,本文提出基于差分进化算法的网络多属性大数据聚类挖掘方法.在构建网络多属性数据参数采集模型的基础上,结合差分进化算法进行网络多属性大数据特征参数的聚类挖掘优化设计,从而实现大数据特征聚类和可靠性挖掘.最后进行仿真测试分析,显示了本文方法在提高网络多属性大数据聚类挖掘能力方面的优越性能.

1 网络多属性大数据存储特征分析

1.1 存储结构分析

为了实现基于差分进化算法的网络多属性大数据聚类挖掘,构建网络多属性大数据参数采集和优化存储结构模型[6-7],并采用多维特征空间融合和匹配调度的方法,进行网络多属性大数据的传输结构分析.

首先采用演化贝叶斯参数估计方法,进行网络多属性大数据的网格分块区域调度[8],在临近区域中,将边缘特征融合测度作为网络多属性大数据挖掘的候选区域,遍历这些区域获得网络多属性大数据的聚类中心子集.在候选目标集中,得到网络多属性大数据聚类信息熵为

(1)

式中,xi、xj表示网络多属性大数据挖掘候选区域在[i,j]矩阵下的信息权重值,σ表示候选目标信息参数.

采用熵函数聚类方法,进行网络多属性大数据分布式概率重组,得到网络多属性大数据聚类的随机概率密度的分布条件p(vi|y=1)

(2)

式中,μ0、σ0分别为网络多属性大数据的目标样本数据和标准信息差.

采用多维特征分解方法,进行网络多属性大数据信息特征重构,得到网络多属性大数据的模糊信息聚类样本分布为

(3)

通过构造网络多属性大数据的分类存储器,利用多维信息重组和分块区域分解技术,构建网络多属性大数据的参数采集模型,其表达为

(4)

式中,α<ζ<β,l(z)为网络多属性大数据样本位置,Dα和Dβ分别为正样本和负样本.根据参数采集结果,采用信道转换和均衡配置方法进行动态结构性重组,得到网络多属性大数据存储结构模型如图1所示.

图1 网络多属性大数据存储结构模型

以网络多属性大数据的存储结构为基础进行分析,从而实现网络多属性大数据的优化聚类和挖掘[9].

1.2 网络多属性大数据特征分析

采用稀疏性特征分析方法进行网络多属性大数据的随机测量矩阵分解,结合快速特征收敛性控制方法,通过网络多属性样本重组[10],得到网络多属性大数据的模糊相关系数

(5)

式中,lt为网络多属性大数据的聚类区域.

结合灰度特征重组和语义分布式融合方法,得到网络多属性大数据聚类的随机概率密度函数

(6)

(7)

采用机器学习分类方法,得到网络多属性大数据的联合特征分布参数φ和θ.采用重采样策略,得到网络大数据的特征随机测量矩阵分解的计算公式

(8)

(9)

综上分析,实现对网络多属性大数据存储结构分析和大数据特征分析[11].

2 网络多属性大数据聚类挖掘优化设计

2.1 网络多属性数据的特征融合

在实现网络多属性大数据存储特征分析的基础上,采用快速特征收敛性控制方法,建立网络多属性大数据的随机检测模型,通过灰度特征信息重组方法,得到网络多属性大数据聚类的更新规则约束参量θ的解

(10)

根据网络多属性大数据的属性分布进行模糊聚类,得到网络多属性大数据差分进化的约束相关性因子为

(11)

式中,R=(rij,aij)m×n表示网络多属性大数据融合的特征分布矩阵,基于数据层面构建大数据分类模型,得到网络多属性大数据分类的联合特征解

(12)

式中,tij表示数据空间的类间指数分布参数,uij表示网络多属性大数据的互信息熵.

以P为网络多属性分布的概率密度,根据网络多属性大数据的融合参数满足

(13)

式中,Ui,j(t)表示网络多属性大数据动态特征分布信息熵.

基于决策边界的多数类样本分析方法,得到共享的通道数为N,构建网络多属性大数据聚类的联合关联决策函数为:

(14)

综上分析,采用差分进化方法,进行网络多属性参数识别和聚类.

2.2 网络多属性大数据聚类挖掘优化

基于网络多属性大数据的特征融合结果,设定网络多属性大数据的互信息特征向量用vi表示,且vi=((w1,t1),(w2,t2),…,(wj,tj)),通过差分进化方法进行网络多属性大数据的聚类中心寻优.遍历网络多属性大数据聚类区域的候选目标集,得到多属性大数据聚类的模糊集为

V=Pi∈P(i=1,2,…,m)+|vi+Ek|2.

(15)

使用联合特征分布式进化方法,得到网络多属性大数据聚类挖掘的公式为

(16)

式中,Vi表示网络多属性大数据的关联分析度量值.

在非线性可分的数据集中,得到网络多属性聚类挖掘输出的相似度系数为

(17)

式中,pi,j(t)为网络多属性大数据的分布集,Δp(t)为网络多属性大数据分布的联合特征参数分布集.用4元组(Ei,Ej,d,t)来表示网络多属性大数据的主特征量,采用决策树调度和多属性差分进化算法,得到聚类挖掘输出的联合特征量

(18)

式中,m为网络多属性大数据聚类挖掘的进化维数,(dik)2为非线性数据集.

结合差分进化算法,构建网络多属性大数据聚类挖掘优化模型,其表示为

(19)

式中,‖xk‖2表示网络多属性大数据的决策性自变量.

综上分析,通过差分进化算法进行网络多属性大数据的聚类中心寻优,实现对网络多属性大数据的特征聚类和可靠性挖掘.实现过程如图2所示.

图2 网络多属性大数据聚类挖掘实现过程

3 仿真测试

网络多属性大数据采集的样本长度为1024,数据分类的属性为12,关联规则分布维数为5,相似度融合系数为0.36,差分进化的迭代次数为100,根据上述参数设定,得到网络多属性大数据统计特征量分布如图3所示.

图3 网络多属性大数据统计特征量分布

根据图3所示的大数据统计特征量分布检测结果,实现数据聚类,得到聚类挖掘预测效果如图4所示.

图4 数据聚类挖掘预测值

分析图4得知,本文方法进行网络多属性大数据的特征聚类挖掘的聚敛度水平较高,数据聚类融合性较好.

为了进一步验证本文方法的应用性能,将文献[4]方法和文献[5]方法作为对比方法,与本文方法分别就其数据分类的准确率与聚类挖掘的识别率两项指标进行对比分析,记录运用三种方法进行网络多属性大数据聚类挖掘的数据分类的准确率,得到对比结果如图5所示.

图5 数据分类正确率

对比图5得知,本文方法对网络多属性大数据分类的正确率较高,明显高于文献[4]和文献[5]方法的正确率,由此可见,本文方法进行网络多属性大数据聚类挖掘的性能更好.

运用三种方法测试网络多属性大数据挖掘的识别率,得到对比结果如图6所示.

图6 数据聚类挖掘的识别率

根据图6得知对比结果得知,本文方法进行网络多属性大数据聚类挖掘的识别率较高,且相对稳定,由此可知,本文方法能够有效提高网络多属性大数据聚类挖掘的识别率.

4 结语

构建网络多属性大数据聚类分析模型,提高网络的信息管理能力,本文提出基于差分进化算法的网络多属性大数据聚类挖掘方法.采用多维特征空间融合和匹配调度的方法,进行网络多属性大数据的传输结构分析,采用稀疏性特征分析方法进行网络多属性大数据的随机测量矩阵分解.采用快速特征收敛性控制的方法,建立网络多属性大数据的随机检测模型,采用差分进化方法,进行网络多属性参数识别和聚类挖掘.研究得知,本文方法进行网络多属性大数据聚类的收敛性较好,特征聚类性较强,提高了数据的检测识别率.

猜你喜欢
特征分析差分聚类
RLW-KdV方程的紧致有限差分格式
符合差分隐私的流数据统计直方图发布
2013—2020年开封地区无偿献血人群HIV感染状况及特征分析
数列与差分
1822号台风“山竹”演变特征分析
穆夏艺术特征分析
近60年银川气温变化特征分析
数种基于SPSS统计工具的聚类算法效率对比
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法