胡志英
(安徽文达信息工程学院 计算机工程学院,安徽 合肥 231201)
随着网络信息传输技术的发展,数据链路层网络包的数量越来越多,规模越来越大,需要构建数据链路层网络包的优化捕获和特征提取模型,结合模糊特征检测和信息重构的方法,进行数据链路层网络包的优化捕获和特征提取,通过层次化的数据信息融合聚类,进行数据链路层网络包的信息聚类分析,在层次化结构模型中,实现数据链路层网络包检测和鲁棒性分析,提高数据链路层网络包检测和自适应性[1-2],相关的数据链路层网络包捕获和特征检测方法研究在智慧网络构建中具有重要意义,相关的数据链路层网络包捕获方法研究受到人们的极大关注.
传统方法中,对数据链路层网络包捕获的方法主要有关联规则挖掘方法、基于空间像素序列重组的数据链路层网络包捕获方法及基于统计特征分析的数据链路层网络包捕获方法等[3].文献[4]中提出基于递归熵特征提取的数据链路层网络包捕获方法,采用模糊相关性融合聚类方法进行数据链路层网络包调度,通过自相关特征匹配,采用层次化演化聚类方法进行数据链路层网络包检测和捕获,提高了数据链路层网络包捕获能力,但该方法进行数据链路层网络包捕获的自适应性不好,特征辨识度不高.文献[5]中提出基于关联规则挖掘的数据链路层网络包捕获方法,采用匹配滤波和模糊度寻优检测额的方法进行数据链路层网络包捕获过程中的干扰抑制,根据关联规则特征检测结果,实现数据链路层网络包捕获,提高检测的精度,但该方法进行数据链路层网络包捕获的计算开销较大,复杂度较高.
针对上述问题,本文提出基于多空间内存共享的数据链路层网络包捕获方法.采用网格分块特征匹配方法进行数据链路层网络包的分块融合处理,结合分区域的统计特征分析方法,进行数据链路层网络包的大数据挖掘和统计信息分析,进行数据链路层网络包的分块融合和递归分析,采用定量递归分析方法进行数据链路层网络包的多尺度融合处理,实现数据链路层网络包的优化捕获,在多空间内存共享环境下,进行数据链路层网络包捕获过程的自动化配准和收敛性控制,提高数据链路层网络包捕获的自适应性.最后进行仿真实验分析,展示了本文方法在提高数据链路层网络包捕获能力方面的优越性.
为了实现数据链路层网络包大数据挖掘,采用网格分块特征匹配方法进行数据链路层网络包的分块拆分处理,结合分区域的统计特征分析方法,进行数据链路层网络包的大数据挖掘和统计信息分析.采用分层结构挖掘的方法,进行数据链路层网络包的网络分格特征挖掘和信息分析[6],在数据链路层中,通过自适应的结构重组方法[7-9],进行数据链路层网络包的层次化分割,分割模型为
(1)
(1)式中,Mi表示数据链路层网络包捕获的递归熵分布中位数,Lm为数据链路层网络包检测的最小分辨阈值,fm为数据链路层网络包的模糊度检测分量,fless表示各维度下数据链路层网络包的模糊度因素.在得到层次分割模型后,进行数据链路层网络包的大数据特征分析,分析数据特征的分布结构式为
(2)
根据(2)式,运用分区域的统计特征分析方法,将数据链路层网络包大数据通过层次分割所获取的数据信息进行特征分析,并结合决策树特征分割的方法,得到多空间内存共享下的分布集为
Xi={∂v(x1),∂v(x2),…,∂v(xn)}.
(3)
根据多空间内存共享下的分布情况,通过空间区域化重建,构建数据链路层网络包的大数据挖掘模型为
(4)
通过上述分析,完成对数据链路层网络包的大数据挖掘.
通过对数据链路层网络包的大数据挖掘和统计信息分析,提取数据链路层网络包的相似度特征量,形成对数据链路层网络包大数据的预处理.通过演化特征融合分析方法,进行数据链路层网络包的分块融合和递归分析,在层次化聚类中心,进行数据链路层网络包的聚类过程的收敛性控制,建立数据链路层网络包的关联规则分布集.采用统计分析方法,建立数据链路层网络包的相似度特征分布矩阵为
(5)
其中,Wij为数据链路层网络包标记特征点,构建数据链路层网络包的包络特征检测模型,统计数据链路层网络包标记点,结合模糊聚类方法进行数据链路层网络包的融合分析,在有限的数据链路分布集X={x1,x2,…,xn}⊂Rs中,得到数据链路层网络包标记的n个样本,其中样本xi通过空间区域融合,得到数据链路层网络包的多空间融合度分布序列表示为(w1,j,w2,j,…,wtj),其中t表示为数据链路层网络包的编号数目,wtj为数据链路层网络包挖掘的加权系数,采用语义特征分解和本体结构映射,得到数据链路层网络包的自适应加权系数为
(6)
其中,maxlFreqi,j为dj之间数据链路层网络包之间的差异性特征量,表示为
(7)
(7)式中,
(8)
其中,di和dj为数据链路层网络包捕获的相似度属性,通过数据链路层网络包标记特征点,进行数据信息融合,构建数据链路层网络包的信息融合模型为
(9)
(9)式中eij表示数据链路层网络包的全局变量.根据上述分析,完成数据链路层网络包的信息融合.
在上述所构建的数据链路层网络包大数据检测模型的基础上,采用定量递归分析方法进行数据链路层网络包的多尺度融合处理,实现数据链路层网络包的优化捕获,完成数据链路层网络包大数据的优化统计和自适应捕获[10].在进行分块特征匹配和信息融合处理时,结合分区域的统计特征分析方法,进行数据链路层网络包的大数据挖掘和统计信息分析,建立数据链路层网络包码元分布序列[11].采用层次化融合方法,进行数据链路层网络包检测的模糊度函数为
(10)
其中,z0为数据链路层网络包的自相关特征量,zi为i点处采集的数据链路层网络包的实测值,di表示数据捕获点i和点0的距离,S为数据链路层网络包的实测点统计特征量,K为自适应加权系数.通过相似度特征分析[12],采用基于位置的自动化协议融合方法,得到数据链路层网络的相空间分布特征解,得到基于位置的关键词分布序列A={a1,a2,…,an},B={b1,b2,…,bm}.数据链路层网络包的报文标记函数为
(11)
基于位置的协议逆分析方法,得到报文标记的格式分组模型为
(12)
通过模糊度寻优方法,进行数据链路层网络包的状态转移控制,得到关联规则集定义为
(13)
其中,dm+1(m)为数据链路层网络包集在第m点的预测值,dk+1(m)为采用第m点处采集的数据链路层网络包的频繁项集.通过包络特征提取和标记样本分析,进行数据链路层网络包的特征融合和优化提取.
在进行数据链路层网络包的聚类过程的收敛性控制,建立数据链路层网络包的关联规则分布集后,通过演化特征融合分析方法,进行数据链路层网络包的多空间内存共享,演化特征融合分布函数为
(14)
在网络会话报文协议中,建立数据链路层网络包检测的权重因子集为
(15)
其中,
P(K=T)=C(A+di)+s(B-dj),
(16)
P(K=1|K=T)=(NB+dj)*C,
(17)
P(R=1)=(NS-di)+S2,
(18)
(17)式中,NB为数据链路层网络的分布维数,(18)式中NS为表示模糊度标记特征量.通过网格分块区域融合分析,对数据链路层网络包捕获过程的自动化配准和收敛性进行有效控制,从而完成多空间内存共享.
(19)
(20)
其中,Oabj(U;c)=(uaj+ubj)+(uaj-ubj)-1,uaj和ubj表示多空间内存共享维数.
根据数据链路层网络包捕获输出结果,结和多维度参数融合,对数据链路层网络包捕获进行优化,优化结果为
(21)
综上所述,根据优化结果可知,运用本文方法,数据链路层网络包特征提取、多空间内存共享、捕获输出,能够使得数据链路层网络包的捕获得到优化.
为了验证本文方法在实现数据链路层网络包捕获中的应用性能,进行仿真测试分析,采用Matlab进行数据链路层网络包捕获的算法处理,得到数据链路层网络包的采样节点数为150,对数据链路层网络包信息捕获的维数为24,数据链路层网络包的匹配系数为0.34,多空间融合度为0.17,信息捕获的延迟为12 ms,特征采样的频率为16 Hz,根据上述参数设定,进行数据链路层网络包采样和捕获优化,得到原始的数据链路层数据如图1所示.
图1 原始的数据链路层数据
以图1的数据链路层网络数据为研究对象, 进行数据链路层网络包捕获,数据包捕获输出如图2所示.
图2 数据链路层网络包捕获输出
分析图2得知,利用本文方法进行数据链路层网络包捕获的输出特征聚类性较好,测试数据链路层网络包捕获的召回率,得到对比结果如图3所示.
图3 数据链路层网络包捕获的召回率对比
分析图3得知,本文方法进行数据链路层网络包捕获的召回率较高,测试其捕获精度,得到对比结果见表1.
表1 数据链路层网络包捕获的准确概率对比
分析表1得知,本文方法进行数据链路层网络包捕获的精准度较高.
通过层次化的数据信息融合聚类,进行数据链路层网络包的信息聚类分析,本文提出基于多空间内存共享的数据链路层网络包捕获方法.实验结果表明,采用本文方法进行数据链路层网络包捕获的自适应性较好,数据的召回率较高,对数据链路层网络包捕获的准确概率较高.