基于小波变换的网络流量组合预测模型

2014-04-03 01:45崔兆顺
计算机工程与应用 2014年10期
关键词:网络流量小波差分

崔兆顺

CUI Zhaoshun

天水师范学院 物理与信息科学学院,甘肃 天水 741001

College of Physics and Information Science,Tianshui Normal University,Tianshui,Gansu 741001,China

随着网络应用范围日益广泛,网络的拥塞越来越频繁,网络流量预测可以为网络管理员提供技术支持,帮助其及时调整网络控制策略,提高网络服务质量,因此网络流量建模与预测一直是网络研究中的重点[1]。

网络流量数据实质上是一种时间序列数据,传统预测模型有差分自回归移动平均模型(ARIMA)、自动回归模型(AR)等[2-3],它们假设网络流量一种平稳变化的数据,实际上,网络流量是多种因素综合作用的结果,具有随机性、时变性等非平稳变化特点,传统模型难以准确对网络流进行长期预测,应用范围具有局限性[4]。针对网络流量的非平稳性,一些学者将非线性理论引入到网络流量建模与预测中,出现支持向量机、灰色理论、神经网络等网络流量的预测模型[5-7],它们可以较好地描述网络流量变化趋势,网络流量的预测精度得以提高[8]。由于网络流量是一种受多种影响因素综合作用的复杂系统,单一预测算法只能描述其部分或片段信息,难以全面、准确对其变化规律进行预测。基于著名的M-竞争理论,一些学者建立了组合的网络流量预测模型,结果表明,组合模型能够较大限度地利用各种预测样本信息,比单个预测模型考虑问题更系统,更全面[9-10]。同时由于网络流量具有多尺度特性,有学者提出一种小波分析和ARIMA相融合的网络流量预测模型,取得了不错的预测效果[11];然而该模型采用单一ARIMA模型同时对高频和低频部分进行建模,难以准确描述网络流量复杂变化特性,预测有待进一步提高[12-13]。

为了提高网络流量的预测精度,利用ARIMA强大的线性预测能力和最小二乘支持向量机(LSSVM)优异的非线性预测力,提出一种小波变换的网络流量组合预测模型(WA-ARIMA-SVM)。首先利用小波分析对网络流量进行多尺度分解,提取不同频率成分序列,然后分别采用ARIMA和LSSVM对高频和低频进行预测,最后重构预测结果,并采用仿真实例对模型性能进行测试与分析。

1 WA-ARIMA-LSSVM的网络流量预测模型

1.1 网络流量的小波分解与重构

小波分析可以提取每个数据点上不同频率带的小波系数信息,使信息量最大化,因此采用小波分析对网络流量进行,得到尺度 j的近似系数为:

式中,1≤j≤J。

尺度 j下的网络流量细节系数表示为:

网络流量在经过尺度 j下的小波分析后的结果为{d1,d2,…,dj,cj}。

网络流量可采用近似和细节系数进行描述,即小波重构:

1.2 ARIMA预测算法

由于网络流量的高频序列可以近似看作平稳时间序列,因此采用差分自回归滑动平均模型(ARIMA)的进行建模,其包括自回归AR(Auto Regressive)、I差分(Differencing)和滑动平均MA(Moving-Average)组合,比自回归滑动平均模型(ARMA)更加灵活,其结构描述为:

式中,∇d=(1-B)d是差分算子。

网络流量预测模型ARIMA的建立关键是确定回归和平滑参数,阶数通过自相关函数(ACF)和偏自相关函数(PACF)决定,ARIMA建模过程如下:

(1)网络流量序列的平稳化处理,如果网络流量序列是非平稳的,那么就通过差分处理使其平稳化。

(2)模型的识别,主要通过ACF和PACF确定ARIMA模型的阶数 p、q。

(3)采用最适合的参数建立网络流量模型。

1.3 最小二乘支持向量机

LSSVM是标准支持向量机的一种改进,改善了求解速度和收敛精度,并具有更优的泛化推广能力,网络流量的低频部分表示长期趋势,具有非线性变化特点,因此采用LSSVM对低频序列进行建模与预测[12]。设训练数据集为:X={xi,yi},i=1,2,…,N ,xi是输入样本,yi是期望输出,N为样本总数,通过映射函数将训练集映射到一个高维特征空间,映射关系可描述为:

式中,ω为权向量,b为阈值。

根据结构风险最小化原则计算参数ω、b的值,那以LSSVM回归模型为:

式中,c为惩罚因子;εi是实际值与输出值间的误差。

由于ω的维数较高,对式(7)进行直接求解相当困难,因此引入拉格朗日函数进行求解

式中,ai是拉格朗日乘子。

依据KTT条件,由

消去ω、εi可以得到如下的方程组:

由 Mercer条件可得:K(xi,xj)=φ(xi)Tφ(xj),K(xi,xj)为核函数,采用最小二乘法求解a和b,得

采用径向基核函数作为LSSVM的核函数,其定义为:

式中,σ是核宽度参数。

1.4 网络流量的组合预测流程

步骤1收集网络流量历史数据,并其进行相应预处理,具体如下:

式中,xmin和xmax表示分别最小值和最大值。

步骤2采用小波分析对网络流量进行分解,得到低频分量A1和高频分量D1。

步骤3采用ARIMA对网络流量的高频分量D1进行建模与预测。

步骤4采用LSSVM对网络流量的低频分量A1进行建模与预测。

步骤5采用小波分析对低频和高频的预测结果进行重构得到组合预测结果。

步骤6采用式(14)对预测结果进行反归一化处理,得到最终预测值。

综合上述可知,WA-ARIMA-LSSVM的网络流量预测流程如图1所示。

图1 网络流量的组合建模与预测流程图

2 仿真实验

2.1 网络流量数据

数据来源于http://newsfeed.ntcu.net/~news/2012/[13]的每小时网络流量,其获得1000个数据{x(i)},i=1,2,…,1000,具体如图2所示。选择前800个数据作为训练集,建立网络流量预测模型,其余200个样本作为测试集对模型性能进行检验。

图2 网络流量时间序列

2.2 网络流量的非平稳性分析

对图2的网络流量变化特性进行分析,其ACF和PACF如图3所示,从图3可知ACF和PACF具有明显振荡波动,不符合平稳序列的变化特征,是一种非平稳的时间序列,因此采用ARIMA难以建立准确的预测模型。

图3 网络流量ACF和PACF值的变化图

2.3 网络流量的小波分解

首先采用Matlab 2012的小波分析工具箱对图2网络流量进行分解,网络流量的低频和高频部分如图4所示。

图4 网络流量的小波分解

2.4 结果与分析

(1)网络流量的一步预测

采用ARMA对网络流量的高频序列进行建模,其ACF和PACF直方图如图5所示,从图5可知,该高频序列的自相关性较高,需进行差分处理,经过3阶差分后,高频序列趋于平稳,因此ARIMA差分参数d=3,然后确定模型参数的 p、q ,最后确定最优模型为ARIMA(3,2,3),得到网络流量高频序列一步预测结果。

图5 低频分量的ACF和PACF

设置LSSVM参数c=125.125,σ=1.555,然后采用LSSVM对网络流量低频序列进行训练,建立相应的预测模型,得到低频序列的一步预测结果。采用小波分析对低频和高频预测结果进行重构,WA-ARIMA-LSSVM的一步拟合结果和预测结果如图6所示。从图6可知,无论拟合值或者是预测值,均与网络流量的实际值相当接近,拟合和预测误差均较小,结果表明,WA-ARIMA-LSSVM可以较好地描述网络流量随机性、时变性等非平稳性变化趋势,建立了整体性能较优的预测模型。

图6 WA-ARIMA-LSSVM的一步预测性能

(2)网络流量的多步迭代预测

在实际应用中,网络流量预测时间越长,对网络控制越有利,因此多步预测性能也是评价模型优劣的重要标准。本文对网络流量进行向后20步预测仿真测试,预测结果如图7所示,从图7可知,WA-ARIMA-LSSVM可以向后准确预测8步,可以满足网络流量预测的实际要求。

(3)与其他模型的预测性能对比

图7 WA-ARIMA-LSSVM的多步预测性能

为了更进一步检验WA-ARIMA-LSSVM的有效性,分别使用ARIMA、RBF神经网络(RBFNN)、LSSVM、小波分析+ARIMA(WA-ARIMA)和小波分析+LSSVM(WA-LSSVM)进行对比实验,并选择预测结果的均方根误差(RMSE)作为模型性能评价指标,RMSE定义如下:

式中,yi为实际网络流量值,为模型的预测值。

不同模型预测结果的RMSE见表1,从表1可知,相对于对比模型,WA-ARIMA-LSSVM获得了更好的网络流量预测结果,预测误差最小,这是因为通过小波分解网络流量,挖掘隐含于数据中的复杂变化特性,然后LSSVM和ARIMA分别对低频序和高频序列进行预测,可以准确描述网络流量的变化趋势。

表1 WA-ARIMA-LSSVM与其他模型的性能对比 (MB·s-1)

3 结语

由于网络流量具有时变性和非线性等变化特点,单一预测难以获得较好的预测精度。提出一种基于WA-ARIMA-LSSVM的网络流量预测模型。结果表明,相对于其他预测模型,WA-ARIMA-LSSVM可以更加准确刻画网络流量变化趋势,全面反映网络运行状况,预测结果可以为网络管理员提供有价值的参考信息。

[1]Nguyen T T,Armitage G.A survey of techniques for internettraffic classification using machine learning[J].IEEE Communications Surveys and Tutorials,2008,10(4):56-76.

[2]Jun Jiallg,Papavassiliou S.Enhancing network traffic prediction and anomaly detection via statisticalnetwork traffic separation and combination strategies[J].Computer Communications,2006,29(10):1627-1638.

[3]罗赘骞,夏靖波,王焕彬.混沌-支持向量机回归在流量预测中的应用研究[J].计算机科学,2009,36(7):244-246.

[4]高波,张钦宇,梁永生.基于EMD及ARMA的自相似网络流量预测[J].通信学报,2011,32(4):47-56.

[5]姜明,吴春明,胡大民.网络流量预测中的时间序列模型比较研究[J].电子学报,2009,37(11):2353-2359.

[6]李捷,候秀红,韩志杰.基于卡尔曼滤波和小波的网络流量预测算法研究[J].电子与信息学报,2007,29(3).

[7]孙知信,张玉峰.基于多维支持向量机的P2P网络流量识别模型[J].吉林大学学报:工学版,2010,40(5):1298-1303.

[8]蔡晓丽,宁慧.基于最大熵算法网络流量预测模型研究[J].计算机仿真,2011,28(10):107-110.

[9]Bao Rong Chang,Hsiu Fen Tsai.Improving network traffic analysis by foreseeing data-packet-flow with hybrid fuzzy based model prediction[J].Expert Systems with Applications 2009,36(3):6960-6965.

[10]Este A,Gringoli F,Salgarelli L.Support vector machines forTCP traffic classification[J].Computer Networks,2009,53(14):2476-2490.

[11]Chen Y,Yang B.Small-time scale network traffic prediction based on flexible neuraltree[J].Applied Soft Computing Journal,2012,12(1):274-279.

[12]Dong-Chul Park.Prediction of network traffic using dynamic bilinearrecurrentneuralnetwork[C]//Fifth International Conference on Natural Computation,2009,2:419-423.

[13]熊南,刘百芬.基于自适应粒子群优化LSSVM的网络流量在线预测[J].计算机应用与软件,2013,30(9):21-24.

[14]赖锦辉,梁松.一种新的基于GCS-SVM的网络流量预测模型[J].计算机工程与应用,2013,49(21):75-78.

猜你喜欢
网络流量小波差分
基于多元高斯分布的网络流量异常识别方法
构造Daubechies小波的一些注记
数列与差分
基于神经网络的P2P流量识别方法
基于MATLAB的小波降噪研究
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
AVB网络流量整形帧模型端到端延迟计算
基于差分隐私的大数据隐私保护
相对差分单项测距△DOR
基于FPGA小波变换核的设计