基于入侵特征选择的网络异常数据检测模型

2017-06-23 07:47米洪杨习贝
现代电子技术 2017年12期
关键词:数据挖掘

米洪+杨习贝

摘 要: 为了提高网络运动可靠性和安全性,针对传统的防火墙检测方法对网络异常数据检测准确性不高的问题,提出一种基于入侵特征选择的网络异常数据检测模型。对网络传输信道中的数据采用关联维求解方法进行特征挖掘提取,并对提取的关联维信息特征进行优选实现入侵信息识别和分类,结合模糊C均值聚类算法实现对网络异常数据的有效挖掘和检测。仿真结果表明,该检测模型能提高对网络异常数据和入侵信息的有效识别和检测能力。

关键词: 异构集成网络; 异常数据; 数据检测; 数据挖掘

中图分类号: TN911.23?34; TP393 文献标识码: A 文章编号: 1004?373X(2017)12?0069?03

Abstract: Since the detection accuracy of the traditional firewall detection method for network abnormal data is not high, a novel network intrusion data detection model based on feature selection is proposed in this paper to improve the network reliability and security. The correlation dimension solution method is adopted to realize feature mining and extraction of information data in network channel. The extracted correlation dimension information features are optimized to achieve intrusion information identification and classification, and finally implement effective mining and detection of abnormal network data in combination with fuzzy C means clustering algorithm. The simulation results show that the proposed detection model can improve the effective identification and detection abilities to deal with network abnormal data and intrusion information.

Keywords: heterogeneous integrated network; abnormal data; data detection; data mining

大規模异构集成网络通过集成无线网络、光纤网络和移动通信网络实现超宽带、大容量的数据信息传输。在大规模异构集成网络中由于路由链路的开放性,容易导致节点断开入侵链接,产生异常数据,对网络中异常数据的检测是保障网络可靠稳定运行的关键[1]。对大规模异构集成网络的异常数据检测算法的研究主要采用统计信息分析方法[2]、防火墙检测方法[3]、模糊推理检测方法和异常信息特征重排方法等[4?5]。采用相应的特征提取算法进行网络异常数据信息的特征提取和信息分类,实现对大规模异构集成网络中信号模拟和状态重组,实现网络异常数据检测,但是传统方法在异常数据检测中容易受到干扰因素的影响,导致检测性能不好。对此,本文进行网络异常数据检测模型的改进设计,得出可行性结论。

1 网络异常数据检测模型改进实现

1.1 基于模糊C均值聚类的入侵特征选择

在上述进行了网络异常数据的信息建模和特征提取的基础上,对提取的关联维特征进行模糊C均值聚类[6],实现对入侵特征的优选和控制,进行网络异常数据检测。实现本文提出的基于入侵特征选择的网络异常数据检测模型的设计。网络异常数据入侵特征模糊C均值聚类的过程描述为:

(1) 首先选择一个C值,确定网络异常数据分类簇的总数。若网络入侵关联维特征集规模为m,令作为聚类中心,其中,并计算入侵关联维特征集聚类簇的根节点与簇心的距离。

(2) 在关联维特征集中选择C个实例,初始化采样频率中心为,,。

(3) 使用简单的欧拉距离将网络入侵特征信息采样簇分配到最近的簇中心,如满足:

那么。执行交叉变异,得到的一组标量采样序列为异常数据时间序列。

(4) 使用每个簇的实例来计算网络入侵特征信息时间序列的分布时滞:

(5) 如果网络入侵特征信息时间序列的分布时滞等于上次迭代的平均值,当满足时,则中止程序,否则返回第(3)步,令,并且计算新的模糊C均值聚类中心。

通过上述模糊C均值聚类,实现入侵特征选择。

模糊C均值聚类一般处理伪码如下:

double Distance(feature extractio&, intrusion informatio&);

//确定初始聚类中心点

struct point{double x;double y;}; //簇对象

integrated network{

private:

point fuzzy C means //簇的值

pointnovel data networ; //簇的平均值

list eltrybvts; //簇包括的元素

public:

cluster(const point& Point){

//构造入侵特征信息的时间窗口函数

tag.x = Point.x;

tag.y = gtrhbbt.y;}

point GetAverage(); //计算簇的平均值

point integrated network Value(); //獲得簇的值

void Clearfeaturesampling(); //清空元素

void SetTagValue(const point&); //设置设计检测器

void AddEfrgrgent(pgrgt);

//添加一个异常数据的搜索元素

};

void K Average(pofrgtgt[],list&);

在终止条件约束下进行模糊C均值聚类的簇间分类,使得局部误差平方和最小,从而实现对网络异常数据的入侵特征优选。

1.2 网络异常数据检测的模型设计

通过上述对网络入侵关联维特征提取和分类,把有限数据集合分为C类,根据分类结果进行网络异常数据检测,大规模异构集成网络节点数据传输的包络模型为:

2 实验测试分析

本实验仿真计算机使用Intel i5?3230M 2.6 GHz 双核CPU,4 GB DDR3 RAM作为硬件配置,算法编辑软件为VC++结合Matlab 7,对大规模异构集成网络中的CUP2015实验数据库中的数据进行异常数据检测仿真分析,数据库中分布有4组数据集,分别记为D1,D2,D3,D4,数据量分布为1 TB,2 TB,3 TB,4 TB,特征点检测权重系数ω设定为0.67,测试样本的训练集长度为100,数据在网络传输信道中的分布谱图如图1所示。

由图1的数据分布谱图可见,原始的数据受到网络传输介质和网络空间中的干扰因素较多,导致数据分布的状态具有无序性,需要进行特征提取和聚类处理。采用关联维求解方法进行特征挖掘提取,结合模糊C均值聚类方法进行数据聚类,得到网络异常数据聚类处理后的谱分析结果如图2所示。

从图2得知,通过C均值聚类处理和入侵特征选择,提高了异常数据的特征分类性能。表1给出了采用本文方法进行异常数据的检测测试结果,采用500次实验计算准确检测的均值,得到本文方法和传统方法的对比结果如图3所示,从表1的结果得知,本文方法对4组数据集的准确检测率较高,误检率角度、检测时间开销较小,从图3的结果对比得知,本文方法的平均准确检测精度高于传统方法,证明了本文方法的优越性。

表1 改进算法的测试结果

3 结 语

本文提出一种基于入侵特征选择的网络异常数据检测模型。对网络传输信道中的数据采用关联维求解方法进行特征挖掘提取,对提取的关联维信息特征进行优选实现入侵信息识别和分类,结合模糊C均值聚类算法实现对网络异常数据的有效挖掘和检测。实验测试结果表明,该检测模型能提高对网络异常数据和入侵信息的有效识别和检测能力,精度较高、性能较好。

参考文献

[1] REN Tianpeng, YUEN Chau, GUAN Yongliang. High?order intensity modulations for OSTBC in free?space optical MIMO communications [J]. Wireless communications letters, IEEE, 2013, 2(6): 607?610.

[2] ZHANG Q, ZHU Q Y, ZHANI M F, et al. Dynamic service placement in geographically distributed clouds [J]. IEEE journal on selected areas in communications, 2013, 31(12): 762?772.

[3] 吴鸿华,穆勇,屈忠锋,等.基于面板数据的接近性和相似性关联度模型[J].控制与决策,2016,31(3):555?558.

[4] 余晓东,雷英杰,岳韶华,等.基于粒子群优化的直觉模糊核聚类算法研究[J].通信学报,2015(5):74?80.

[5] 孙超,杨春曦,范莎,等.能量高效的无线传感器网络分布式分簇一致性滤波算法[J].信息与控制,2015,44(3):379?384.

[6] 何信旺,芮赟,王宗杰,等.滤波器组UMTS系统的信道估计研究[J].计算机技术与发展,2015(9):57?60.

[7] 周立军,张杰,吕海燕.基于数据挖掘技术的网络入侵检测技术研究[J].现代电子技术,2016,39(6):10?13.

猜你喜欢
数据挖掘
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于并行计算的大数据挖掘在电网中的应用
数据挖掘技术在中医诊疗数据分析中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
数据挖掘技术综述与应用
基于GPGPU的离散数据挖掘研究
利用数据挖掘技术实现LIS数据共享的开发实践
高级数据挖掘与应用国际学术会议