基于多分类器融合的信息中心网络源数据检测

2020-03-18 09:42柯建波

智能计算机与应用 2020年10期

柯建波

(广东工业大学华立学院，广州 511325)

0 引言

随着网络通信技术的发展，在信息中心网络中的数据规模不断增大，需要对信息中心网络源数据进行有效的识别和检测，提取源数据的关联规则集，根据网络通信的输出特征量进行自适应特征检测和识别，滤除源数据的干扰信息，提高信息中心网络的数据管理能力，研究信息中心网络源数据的优化检测方法，在实现信息中心网络的数据信息集成管理和调度中具有重要意义[1]。

对信息中心网络源数据的检测是建立在对数据的优化挖掘和融合聚类处理基础上，建立信息中心网络源数据的关联规则分布特征集，结合模糊相关性约束控制方法，进行信息中心网络源数据的自适应特征分离和检测。当前，对信息中心网络源数据的检测方法主要有谱特征检测方法、模糊相关性检测方法、融合聚类检测方法等。其中，文献[4]中提出一种基于非平稳数据融合的信息中心网络源数据的高效定位挖掘的检测方法，采用点扫描方法在传输链路层进行信息中心网络的传输数据采样，结合特征分离和自适应的信息融合技术，实现信息中心网络的源数据检测和挖掘，但该方法的计算开销较大，实时性不好[2]；一种基于交互式信息融合的信息中心网络源数据检测模型，进行信息中心网络的链路传输信道分析和特征重构，根据数据检测结果进行模糊聚类和挖掘，提高网络数据检测的准确性，但该方法在进行数据检测中的均衡性不好[3]；基于模糊PID信息融合和可达标识的信息中心网络源数据检测方法，采用PID神经网络检测器进行数据检测，结合关联信息挖掘方法，提高数据检测的准确性，该方法在进行大规模数据挖掘的实时性和抗干扰性不好[4]。

针对上述问题，本文提出一种基于多分类器融合的信息中心网络源数据检测方法，首先，构建信息中心网络源数据的统计序列重组模型，建立基于模糊C均值聚类的多模级联分类器；其次，采用数据特征的融合法和分裂法进行数据聚类中心寻优控制，实现网络源数据检测优化；最后，进行仿真实验分析。仿真结果说明本文方法在提高信息中心网络源数据检测准确性方面的性能优越。

1 信息中心网络源数据重组模型及特征挖掘

1.1 信息中心网络源数据相空间重组

为了实现对信息中心网络源数据检测设计，首先构建网络源数据的相空间重构模型，结合对原始数据的五元组特征分析结果，进行源节点定位和子图模式分析，建立网络源数据的连通图模式结构，根据源节点模式的匹配结果进行关联规则挖掘和端口结构分析，构建网络源数据的节点匹配模式，根据多分类器融合结果进行信息分类，实现网络源数据的优化检测，实现结构如图1所示。

图1 信息中心网络源数据检测的实现结构图

根据图1所示的信息中心网络源数据检测结构模型，进行检测算法设计，构建网络源数据分布的有限数据集模型为式(1)：

X={x1,x2,…,xn}⊂Rs.

(1)

信息中心网络中对源数据采样集合中含有n个样本，信息中心网络源数据的有限论域内，数据的统计样本序列为xi，对应数据的特征采样序列为i=1,2,…,n，特征矢量为式(2)：

xi=(xi1,xi2,…,xis)T.

(2)

在信息中心网络节点连通图中，构建信息中心网络源数据的高维特征空间分布结构模型，采样相空间重构技术，构建反映信息中心网络源数据关联特征的本体模型，相空间重构的关联权重为式(3)：

ω=((ω1,a1′), (ω2,a2′),…,(ωn,an′))T，

ωj∈[0,1].

(3)

在高维相空间中，信息中心网络源数据的嵌入维特征量和主成分特征集为式(4)：

(4)

式中，m为关联权重指数；(dik)2为相似度特征集，结合语义本体映射方法源数据的样本特征分布式重构，根据xk与Vi的测度距离，得到第i个信息中心网络源数据的特征分布子图，由此实现信息中心网络源数据重组，结合重组模型进行特征挖掘和信息融合聚类[5]。

1.2 数据的特征挖掘

(5)

(6)

根据信息中心网络源数据的有限论域的特征匹配模型进行信息融合，得到关联规则调度集满足式(7)：

|Δfx(X,t)|≤Fx(X,t)|Δfθ(X,t)|≤Fθ(X,t).

(7)

对信息中心网络源数据的关联规则集进行自动排序，得到数据的特征融合分量描述为式(8)～式(10)：

(8)

(9)

(10)

取sinθp=θp， cosθp=1，进行网络源数据的特征挖掘和属性归集，描述为式(11)：

(11)

2 数据检测优化

2.1 信息中心网络源数据分类融合

(12)

K(xi,xj)=,

(13)

K(xi,xj)=(+1)d,

(14)

K(xi,xj)=exp(‖xi-xj‖2/2σ2).

(15)

式(15)中σ=0.707。根据网络源数据的特征分布属性进行分类融合，得到融合结果为式(16)～式(19)：

(16)

(17)

(18)

(19)

在源数据的检测过程中，得到源数据分类的迭代加速公式为式(20)：

(1-ω)xi(k)+ωxi-(k+1)=xi(k+1),

i=1,2,…,n.

(20)

采用决策树信息融合方法进行网络源数据的多分类器融合，实现信息融合优化。

2.2 数据检测的多模级联分类

构建基于模糊C均值聚类的多模级联分类器，采用数据特征的融合法和分裂法进行数据聚类中心寻优控制，令p=R(r)Θ(θ)Z(z)ejwt，在置信度α下提取信息中心网络源数据的谱特征量为式(21)：

(21)

在云计算环境下的信息中心网络源数据堆栈模型表示为式(22)：

(22)

结合模糊相关性的约束控制方法，构建信息中心网络源数据的统计特征量，表示为式(23)：

eR,j=(|yR,j(n)|2-R2,R)×yR,j(n)*.

(23)

以特征提取结果为输入参考量，得到信息中心网络源数据的分布式差异特征提取结果为式(24)：

(24)

分别对i(i=1,2)条网络源数据的检测通道进行信息融合，滤除干扰信息，由此确定网络源数据多维特征检测值为式(25)：

u=[u1,u2,…,uN]∈RmN.

(25)

构建网络源数据统计特征分布模型，式(26)：

(26)

其中，GX(x,y)是网络源数据的特征指向性函数，m，n分别是网络源数据的嵌入维数和延迟，结合定量递归分析方法，实现网络源数据检测，得到检测输出为式(27)～式(29)：

(27)

(28)

(29)

其中，P(X)、P(Y)表示网络源数据的联合关联规则分布集，X、Y为网络源数据的采样延迟，P(X∩Y)是网络源数据的互信息函数，X、Y为网络源数据的模糊特征序列分布集。综上分析，实现基于多分类器融合的网络源数据检测。

3 仿真实验与结果分析

为了测试本文方法在实现信息中心网络源数据检测中的应用性能，结合MATLAB进行仿真实验，网络源数据库采用Deep Web 200G，数据样本集为2 000，测试集为100，对信息中心网络源数据采集的时间长度为1 024，离散采样频率为fs=10*f0Hz=10 KHz，数据包的数量设置为N=1 000，根据上述仿参量设定，进行网络源数据检测，首先进行网络传输数据采样，得到采集的数据波形如图2所示。

图2 信息中心网络的数据采样

采用相空间结构重组方法进行源数据的信息特征挖掘和重构，得到重构结果如图3所示。

在高维相空间中实现网络源数据的关联规则挖掘，对提取的网络源数据的关联特征集分类融合，实现数据的优化检测，得到检测输出如图4所示。

分析图4得知，采用本文方法能有效实现信息中心网络源数据检测，输出数据的抗干扰性较好，特征分辨能力较强，采用不同方法测试信息中心网络源数据检测的准确性，得到对比结果见表1，分析得知，采用本文方法进行信息中心网络源数据检测的准确概率较高。因为本文方法通过对提取的网络源数据进行了关联特征集合并和分类融合，提高了数据检测的精度，相比其他方法在抗干扰性和检测的准确性方面具有优越性。