岳小冰, 任越美
(河南工业职业技术学院 电子信息工程系,南阳 473000)
基于生物地理优化算法的网络入侵检测
岳小冰, 任越美
(河南工业职业技术学院 电子信息工程系,南阳 473000)
特征提取和选择是网络入侵检测的一个关键步骤,针对当前特征提取算法存在的缺陷,以提高入侵检测正确率为目标,提出了一种基于生物地理优化算法的网络入侵检测模型。对当前网络入侵检测研究现状进行分析,找到当前模型检测正确率低的原因,建立网络入侵检测特征提取和选择的数学模型,采用生物地理优化算法对该数学模型进行求解,并根据求解结果建立最优的入侵检测模型,在Matlab 2014平台上进行了仿真测试。结果表明,该模型可以找到最优的特征,提高了入侵检测的正确率,具有较高的实际应用价值。
互联网; 入侵行为; 特征提取; 检测模型; 生物地理优化算法
网络规模不断扩大,网络入侵频率不断上升,传统网络防范措施难以满足网络发展的要求,而入侵检测是一种主动防范措施,已成为当前网络安全领域的研究热点[1-3]。
多年以来,学者们对网络入侵检测问题进行了大量的研究,首先采用遗传算算法、粒子群优化算法提取网络入侵信号的特征[4],然后建立网络入侵检测模型,其中粒子群优化算法使用最为广泛。网络入侵信号具有非平稳性和时变性时,传统算法无法准确描述网络入侵的类型[5-8]。生物地理优化算法是一新型的群智能优化算法,,可以提取到更加丰富的网络入侵信息,描述各种类型网络入侵信号,为此提供了网络入侵信号特征提取方法[9]。除了提取网络入侵信号的特征之外,还要建立网络入侵信号检测的分类器,当前主要采用神经网络、支持向量机等[10-12]建立分类器,其中神经网络要求网络入侵样本多,网络入侵检测的成本高;支持向量机没有神经网络的约束,但网络入侵分类器的构建时间长,工作效率低[13]。
针对当前特征提取算法存在的缺陷,以提高入侵检测正确率为目标,提出基于生物地理优化算法的网络入侵检测模型。首先建立网络入侵检测特征提取和选择的数学模型,然后采用生物地理优化算法对该数学模型进行求解,并根据求解结果建立最优的入侵检测模型,最后在Matlab 2014平台上进行了仿真测试。
(1)
式中,λ和μ为迁入率和迁出率;I和E为最大迁入率和迁出率。
根据栖息地物种数量s概率Ps对栖息地量进行突变,突变概率函数为式(2)。
(2)
式中,Mmax为最大突变率,Ps是栖息地中物种数量所对应的概率;Pmax=arg(max(Ps)),s=1,2,…,n,且有式(3)。
(3)
BBO算法存在迭代后期极易陷入局部最优的缺陷,为此提出了改进BBO算法(IBBO)。具体如下
(1) 采用余弦迁移模型,其计算方式为式(4)。
(4)
(2) 采用加权因子的部分迁移算子。根据λi选择需要迁入的栖息地Xi,确定Xi后,根据μj选择需要迁出的栖息地Xj;然后从Xj中随机地选择SIV替代Xi中相应SIV,对迁移算子进行加权,那么迁移算子变为式(5)。
(5)
式中,α是均匀分布的随机数。
柯西分布产生远离原点的随机数比高斯分布要高,这样能有效避免算法陷入局部最优,因此采用柯西变异算子对栖息地进行变异,具体为式(6)。
(6)
式中,C(0,1)为标准柯西分布[13]。
为了测试BBO算法的性能,选用2个常用基准函数进行对比,函数形式具体如式(7)和(8)。Sphere函数为式(7)。
(7)
Rosenbrock函数为式(8)。
(8)
IBBO算法和BBO算法的收敛曲线,如图1所示。
从图1可知,IBBO算法的收敛速度明显优于BBO算法,对比结果验证了BBO算法的有效性。
网络入侵检测特征可以表示为:S={s1,s2,…,sn},si∈{0,1},i=1,2,…,m,其中“1”表示该特征被选中,“0”表示相应特征未被选中,m表示网络特征维数,入侵检测特征选择的数学模型为式(9)。
(9)
根据式(9)可知,网络入侵检测找到一个满足多约束条
(a) Sphere
(b) Rosenbrock图1 生物地理优化算法改进前后的性能测试
件的最优特征子集,是一种典型的多约束组合优化问题。特征选择目标是选择尽可能少的特征,并获得更高的网络入侵检测正确率,因此适应度函数定义为式(10)。
(10)
其中,wa表示特征数量的权重,Nf表示特征的总数,Acc表示验证集入侵检测正确率,wf表示权重,fi表示特征选择状态,即有式(11)。
(11)
IBBO算法的工作流程,如图2所示。
为了测试WP-LSSVM的网络入侵检测性能,选择Matlab作为实验平台,网络状态类型为:DoS、Probe、R2L、U2R、Normal,它们类别的标签分别为:1~5,不同网络入侵类型的样本数量见表1所示。
表1 不同网络入侵类型的样本分布
图2 网络入侵检测型的工作流程
采用遗传算法(GA)、粒子群优化算法(PSO)进行对比对比实验。
不同网络入侵检测模型的实验结果如图3-图5所示。
图3 网络入侵检测正确率
图4 网络入侵检测的误检测率
图5 网络入侵检测模型的执行时间
对图3-图5进行分析可知:
(1) GA的网络入侵检测效果最差,这是因为GA存在收敛速度慢,难以找到全局最优特征,导致网络入侵检测正确率低。
(2) PSO算法的网络入侵检测结果要优于GA的网络入侵检测结果,这是因为PSO算法找到了比GA更优的特征,获得更加理想的网络入侵检测效果,但是检测正确率有待提升。
(3) IBBO算法网络入侵检测效果最佳,因为IBBO提取较好的网络入侵特征向量,建立了检测正确率高的网络入侵检测分类器,降低了网络入侵检测的错误率。
为了提高了网络入侵检测速度,获得更加理想的入侵检测结果,提出生物地理优化算法的网络入侵检测模型,采用生物地理优化算法选择网络入侵特征,以降低特征给数,减少计算复杂度,仿真实验结果表明, 本文模型提高了入侵检测率,可以很好的满足入侵检测的在线要求,具有广泛的应用前景。
[1] 卿斯汉,蒋建春,马恒太,等. 入侵检测技术研究综述[J]. 通信学报,2004,25(7):19-29.
[2] 王永全.入侵检测系统(IDS)的研究现状和展望[J]. 通信技术, 2008, 41(11): 139-143.
[3] 周荃, 王崇骏.基于人工智能技术的网络入侵检测的若干方法[J].计算机应用研究, 2007, 24(5): 144-148.
[4] 郭亚周,高德远.模糊聚类分析在入侵检测系统中的应用研究[J]沈阳理工大学学报,2005,24(4):26-28.
[5] 饶鲜,董春曦,杨绍全.基于支持向量机的入侵检测系统[J].软件学报,2003,14(4):798-803.
[6] 汪兴东,佘堃,周明天,等.基于BP神经网络的智能入侵检测系统[J].成都信息工程学院学报, 2005,20(1):1-4.
[7] 李文华. 基于聚类分析的网络入侵检测模型[J]. 计算机工程, 2011, 37(17):96-98.
[8] 孙晓艳, 郑淑丽, 沈洪伟.优化的RBF神经网络在入侵检测中的应用[J].合肥工业大学学报(自然科学版), 2008, 31(11):1794-1797.
[9] 杨富华, 彭刚.PCA-SVM在网络入侵检测中的仿真研究[J].计算机仿真, 2011, 28(7): 146-149.
[10] 朱永宣, 单莘, 郭军.基于免疫算法的入侵检测系统特征选择[J].微电子与计算机,2007, 24(3):20-22.
[11] 饶鲜,杨绍全,魏青,等. 基于熵的入侵检测特征参数选择[J]. 系统工程与电子技术,2006, 28(4): 599-601.
[12] 黄辰林,赵辉,胡华平.基于分布自治代理的层次入侵检测系统设计[J].计算机工程与应用, 2001, 6(37): 47-49.
[13] 宋宇翔, 刘琰. 特征和分类器联合优化的网络入侵检测算法[J]. 计算机工程与应用, 2012, 48(19): 77-81.
Network Intrusion Detection Based on Biogeographic Optimization Algorithm
Yue Xiaobing, Ren Yuemei
(Department of Computer Engineering, Henan Polytechnic Institute, Nanyang 473000, China)
Feature extraction and selection are key steps of network intrusion detection. In view of the current defects of feature extraction algorithm, in order to improve the intrusion detection accuracy, this paper put forward a kind of network intrusion detection model based on the biological geographical optimization algorithm. First the current status of network intrusion detection research was analyzed, the cause of the low accuracy of the current model was found, and then a mathematical model of network intrusion detection feature extraction and selection was established, and then the biogeography optimization algorithm was used to solve the mathematical model. According to the result, an optimal model of intrusion detection was given, and finally in the Matlab simulation test is carried out. Results show that the model can find the optimal characteristics, improve the accuracy of intrusion detection, and has higher application value.
the Internet; invasion behavior; feature extraction; detection model; biogeography optimization algorithm
河南省科技计划项目(142102210557);南阳市科技攻关项目(KJGG 51,KJGG 38).
岳小冰(1989-),女,学士,助教,研究方向:计算机应用。 任越美(1984-),女,硕士,讲师,研究方向:图像处理。
1007-757X(2017)08-0015-03
TP391
A
2017.02.12)