一种新的基于GCS-SVM的网络流量预测模型

2013-07-20 01:32赖锦辉梁松
计算机工程与应用 2013年21期
关键词:网络流量布谷鸟搜索算法

赖锦辉,梁松

1.广东石油化工学院实验教学部计算机中心,广东茂名 525000

2.广东石油化工学院计算机与电子信息学院,广东茂名 525000

一种新的基于GCS-SVM的网络流量预测模型

赖锦辉1,梁松2

1.广东石油化工学院实验教学部计算机中心,广东茂名 525000

2.广东石油化工学院计算机与电子信息学院,广东茂名 525000

网络流量特性反映了数据传输过程中的相互作用和影响,通过对流量数据的分析,有助于人们了解网络内部运行机制并建立全面刻画流量过程的数学模型。设计具有认知特性的网络流量预测模型,能够使网络更加合理地进行带宽分配、流量控制、选路控制、接纳控制和差错控制[1]等,是提高QoS的有效途径[2]。

目前网络流量预测算法有很多,如采用时间序列模型、神经网络模型、卡尔曼滤波模型等对其进行预测,取得了一定的效果[3-5]。基于小波算法网络流量预测模型在一段时间被许多的研究者提出,其中比较出彩的是雷霆提出的基于小波神经网络流量预测模型,主要利用小波神经网络来分析网络中的相似的特征[6];邹柏贤提出了基于自回归平均ARMA网络流量预测模型[7],这种算法是一种基于统计学的方法来对网络流量进行统计预测。以上这些模型均具有各自的缺陷,如ARMA模型算法简单,易于实现,但预测精度不高。

网络流量变化是一个具有高度的时变性、非线性、混沌性和不确定性的复杂系统。支持向量机(SVM)[8]是一种基于统计学习理论为基础的机器学习算法,对非线性问题预测能力强,成功应用于时间序列、模式识别等领域;采用SVM对非线性的网络流量进行建模预测时,其预测性能与SVM相关参数选取的好坏密切相关,目前常用的参数优化算法主要有粒子群优化算法、遗传算法等,但这些算法均存在各自的不足,影响SVM在网络流量预测中的应用。

布谷鸟搜索(Cuckoo Search,CS)算法[9]是一种新型群体智能优化算法,初步研究表明,布谷鸟搜索算法是有竞争力的,具有简单和高效的特点,且参数少、易于实现,为SVM参数优化提供了一种新的工具。本文提出一种高斯异动改进布谷鸟搜索算法优化SVM的网络流量预测模型(GCS-SVM),仿真结果表明,该模型取得比较好的预测结果。

1 网络流量的相空间重构

网络流量具有高度的非线性、时变性、不确定性和混沌性等特点。网络流量预测是根据网络流量历史数据和现在数据,采用某种方法建立合理的数学模型,然后用该模型对未来网络流量进行预测。

设t时间段的网络流量时间序列为:{x(i)};i=1,2,…,n,可看出,交通流量数据是一维的时间序列,但由于时间序列性质的识别以及进一步的预测分析都需要在相空间中进行,而解决时间序列性质的识别是网络流量预测的关键问题[10],因此需要将其转换成多维时间序列,本文采用互信息法求时延τ,采用虚假最近临点法求网络流量的最佳嵌入维数m,从而将时间序列重构为:

2 支持向量机算法

利用式(1)重构后的相点对网络流量数据进行单步预测来构造回归函数:

y(i)=f(x(i)),f:Rn→R(2)式中,Rn表示影响网络流量预测的因素。支持向量机的网络流量预测就是寻找一种输入x和输出y之间的关系。

设给定训练集为{X(i),y(i),i=(m-1)τ,…,n-1},m为输入空间维数,时间延迟为τ,在特征空间中构造SVM的回归函数为:

f(x)=w·φ(X)+b(3)式中,w表示法向量,b表示偏移量,可以通过求解最优化问题得到系数w和b。

根据结构风险最小化原理,SVM回归机可转换为如下优化问题,即

式中,‖w‖是与函数f复杂度相关的项,ε为不敏感损失系数,ξi,ξ*

i表示松弛因子,C为惩罚因子用于调整置信范围和经验误差间的均衡。

通过引入Lagrange函数,对于非线性预测问题,用核函数k(xi,x)代替高维空间中的向量内积(φ(xi),φ(x)),得到式(4)的最优解为:

建立网络流量预测模型就是找到支持向量参数使表达式(5)成立。

研究表明,当缺乏过程的先验知识时,径向基核函数相比其他核函数具有较少的参数和良好的性能[11]。在此,本章选择径向基核函数,其定义如下:

式中,σ为核函数的参数。C、ε及σ的选取是SVM预测模型精度的关键。

3 GCS优化SVM参数

3.1 改进布谷鸟搜索算法

2009年,由剑桥大学的YANG Xin-she和DEB Suash[12]在布谷鸟寻窝产卵的行为中,发现了一种新的搜索算法——Cuckoo Search算法(CS)。由于这种算法简单、高效、随机搜索路径优,成功地应用于工程优化等实际问题中,成为启发式智能算法领域的一个新亮点。为了模拟布谷鸟寻巢的行为,CS设定了三个理想的状态[13]:

(1)每只布谷鸟1次只产1颗卵,并随机选择1个鸟巢存放。

(2)卵最好的鸟巢将被保留到下一代。

(3)可利用的鸟巢的数量n是固定的,一个鸟巢的主人能发现一个外来鸟蛋的概率Pa∈(0,1)。

式中,∂表示步长控制量;⊕表示点对点乘法。

式中,k为1到0之间递减的变量,N(0,1)为服从均值为0方差为1的高斯分布的随机向量。得到合理q′t,再与qt中的每个鸟巢对比,保留测试值较佳的鸟巢位置,从而得到更佳的一组鸟巢位置q″t。

式(8)是在qt的基础上增加了递减型高斯分布随机扰动项qt×k×N(0,1),这样有利于跳出局部极值点进行全局搜索。经过高斯异动后,搜索时间缩短了,在收敛速度上有一定的提高,较大优化了算法的搜索速度和寻优精度。

3.2 GCS-SVM的网络流量混沌预测模型工作步骤

建立网络流量预测模型就是找到支持向量参数使表达式(5)成立,C、ε及σ的选取是SVM预测模型精度的关键。因此改进GCS优化SVM预测模型具体步骤如下[15]:

(1)收集网络流量时间序列数据,对时间序列进行相空间重构,生成SVM的样本数据。

(2)确定惩罚系数C、不敏感系数ε、核函数参数σ在实际应用中的取值范围,最大迭代次数Nmax。

(5)用式(7)对其他鸟巢进行更新,得到一组新的鸟巢位置。

4 仿真实验

4.1 数据收集

采用网络流量监测软件对本校校园网流量进行实时采集,共获得472个网络流量数据,为了尽量避免数据和计算中的偶然性造成评估结果的不准确,将数据分成两部分,前352个数据作为训练样本建立网络流量预测模型,后120个数据作为预测样本进行预测检验。

然后采用互信息法处理前352个网络流量序列,得到延时τ=3,接着利用虚假最近临点法求得网络流量时间序列相空间重构的最小嵌入维数m=6,最后采用小数据量法得到最大Lyapunoν=0.016 5,根据式(1)对网络流量的训练集进行相空间重构,得到336个训练样本。

4.2 数据预处理过程

实际网络流量具有突变性,变化幅度较大,为了提高训练的效率,在建模之前对网络流量数据进行归一化处理,具体为:

式中,x表示原始网络流量,xmin和xmax分别表示最小值和最大值。

4.3 参比模型及评价指标

实验平台为Matlab 7.1,编程调用比利时鲁汶大学电子工程系版的SVM工具箱。根据实验初步验证,(c,σ,ε)取值范围分别为:[0 1]、[1 100]、[0.000 1 0.01],在改进的CS算法中,取鸟巢位置数为20,Pa=0.25,经GCS优化选择得到较优的SVM参数为σ=0.462,c=10.11,ε=0.004 01,将参数代入SVM预测模型重新训练模型,继而得到经GCS优化的SVM预测模型。为了验证改进CS优化SVM预测模型在网络流量预测中的有效性,采用基于传统CS和LS优化SVM预测模型进行实验预测对比,各运行10次,在搜索过程中满足目标值或达到最大迭代次数则停止搜索。模型性能的评价指标为平均相对误差(MAPE),它的定义如下:

式中,xi和xˆi分别为网络流量实际值和预测值,n为测试样本数。

4.4 结果与分析

图1描述了基于传统CS和改进CS算法优化SVM参数过程中适应值变化曲线,从结果可知,改进CS的收敛速度、全局搜索能力均要优于传统CS,具有更高的学习精度。

图1 传统CS和改进CS的迭代寻优过程比较

图2、图3分别为传统CS和改进CS优化SVM网络流量预测模型对网络流量的训练样本进行拟合,得到的模型拟合结果。

图2 传统CS-SVM网络流量时间序列的拟合结果

图3 改进CS-SVM网络流量时间序列的拟合结果

从图3可知,模型的预测结果与实际值相当接近,这表明,基于改进CS优化的模型,能更全面、准确地刻画网络流量的变量规律,比传统CS预测精度更高。

表1为基于改进CS、传统CS和LS优化SVM的预测模型分别运行10次的预测效果对比。可看出,改进CS优化SVM预测模型的平均MAPE为3.519 045%,低于参比模型的预测误差且预测效果稳定、差异小。因此,改进CS优化的SVM模型具有更好的预测能力。

表1 模型预测效果比较

5 结束语

由于受到多种因素的综合影响,网络流量具有高度的非线性、时变性、不确定性和混沌性等特点,针对这些特点,本文改进CS算法对支持向量机进行参数优化,仿真表明,优化后的网络流量预测模型具有较高的寻优效率、预测精度和较好的稳态性能,能更好地满足大规模网络流量预测的实时性需求。

[1]王兆霞,孙雨耕,陈增强,等.基于模糊神经网络的网络业务量预测研究[J].通信学报,2005(3):136-140.

[2]李丹丹,张闰彤.认知网络中基于蚁群算法的网络流量预测模型[J].电子学报,2011(10):100-103.

[3]姜明,吴春明,胡大民.网络流量预测中的时间序列模型比较研究[J].电子学报,2009,37(11):2353-2358.

[4]朱文兴,龙艳萍,贾磊.基于RBF神经网络的交通流量预测算法[J].山东大学学报:工学版,2007,37(4):23-27.

[5]杨兆升,朱中.基于卡尔曼滤波理论的交通流量实时预测模型[J].中国公路学报,1999,12(3):63-67.

[6]白翔宇,叶新铭,蒋海.基于小波变换与自回归模型的网络流量预测[J].计算机科学,2007,34(7):47-49.

[7]高波,张钦宇,梁永生.基于EMD及ARMA的自相似网络流量预测[J].通信学报,2011(32).

[8]Nello C,John S Τ.支持向量机导论[M].李国正,王猛,曾华军,译.北京:电子工业出版社,2004.

[9]Yang X S,Deb S.Engineering optimisation by cuckoo search[J]. International Journal of Mathematical Modeling and Numerical Optimisation,2010,1(4):330-343.

[10]尹波,夏靖波,付凯,等.基于IPSO混沌支持向量机的网络流量预测研究[J].计算机应用研究,2012,29(11):4293-4295.

[11]赵亚萍,张和生,周卓楠,等.基于最小二乘支持向量机的交通流量预测模型[J].北方交通大学学报,2011(2):114-117.

[12]Yang X S,Deb S.Cuckoo search via Levy flights[C]//Proceedings of World Congress on Nature&Biologically Inspired Computing.India:IEEE Publications,2009:210-214.

[13]Yang X S,Deb S.Multi-objective cuckoo search for design optimization[J].Computers&Operations Research,2013,40.

[14]莫愿斌,刘付永,张宇楠.带高斯变异的人工萤火虫优化算法[J].计算机应用研究,2013,30(1):121-124.

[15]王凡,贺兴时,王燕.基于高斯扰动的布谷鸟搜索算法[J].西安工程大学学报,2011,25(4):566-569.

LAI Jinhui1,LIANG Song2

1.Computer Center,Department of Experiment Τeaching,Guangdong University of Petrochemical Τechnology,Maoming,Guangdong 525000,China
2.College of Computer and Electronic Information,Guangdong University of Petrochemical Τechnology,Maoming,Guangdong 525000,China

Τhere are some problems,such as low precision,on existing network traffic forecast model.In accordance with these problems,this paper proposes the network traffic forecast model of Support Vector Machine(SVM)optimized by improved Cuckoo Search algorithm(GCS).It will transform the time series of the network traffic,and then use cuckoo search optimization algorithm to optimize the parameters of Support Vector Machine.Τhe optimum parameters can be used to establish the model of network traffic prediction,which would make the forecast more accurate.Τhe simulation shows that,the GCS-SVM model is a suitable and effective method for forecasting Internet traffic.

network traffic prediction;Gauss mutation;Support Vector Machine(SVM);cuckoo search algorithm

针对网络流量预测模型存在预测稳定性不好、精度较低等问题,提出一种改进布谷鸟搜索算法优化支持向量机的网络流量预测模型(GCS-SVM)。将网络流量时间序列进行重构,采用改进布谷鸟搜索算法优化支持向量机参数,使用这组最优参数建立网络流量预测模型。仿真结果表明,GCS-SVM模型对网络流量预测是有效可行的。

网络流量预测;高斯变异;支持向量机;布谷鸟搜索算法

A

ΤP393

10.3778/j.issn.1002-8331.1306-0016

LAI Jinhui,LIANG Song.Application of GCS-SVM model in network traffic prediction.Computer Engineering and Applications,2013,49(21):75-78.

国家自然科学基金(No.60903168);广东省教育部产学研结合项目(No.2010B090400235)。

赖锦辉(1977—),女,讲师,主要研究方向:网络、算法;梁松(1974—),男,实验师,主要研究方向:算法、人工智能。

2013-06-06

2013-08-14

1002-8331(2013)21-0075-04

猜你喜欢
网络流量布谷鸟搜索算法
基于多元高斯分布的网络流量异常识别方法
布谷鸟读信
布谷鸟读信
基于神经网络的P2P流量识别方法
改进的和声搜索算法求解凸二次规划及线性规划
AVB网络流量整形帧模型端到端延迟计算
布谷鸟叫醒的清晨
基于汽车接力的潮流转移快速搜索算法
基于逐维改进的自适应步长布谷鸟搜索算法
基于跳点搜索算法的网格地图寻路