【摘 要】对于网络工作安全和可靠性要求,来进行网络流量预测研究。网络流量的性质有如下几点:时变性、非线性以及高度自似性。在对网络流量的预测中,过去的传统方法,已经无法满足预测精度的要求,因为传统方法很难抓住网络流量的时变性和自相似性。为了能够更好的预测网络流量,结合网络流量的特性,利用ARIMA模型可以高精度的实现对网络流量的预测。ARIMA模型先通过差分法把网络流量的基础数据进行平稳化处理,捕捉网络流量的自相似性,第二步是把处理后的数据通过ARIMA模型进行拟合检测,由于ARIMA模型能够很好的抓住网络流量的时变性和自相似性,因此提高了预测精度。模拟预测结果很好的说明ARIMA模型比其他类型的模型预测的精度要高,并且把网络流量的规律呈现的更加直观,因此这种ARIMA模型在网络流量预测中越来越具有优势。
【关键词】网络流量;预测;时间序列;自回归模型
一、引言
现代科学技术的不断发展也带动了网络技术的发展,网络规模增长速度非常快,各种网络信息在网络动态中交互传递,对此必须保证网络信息传递的安全,网络管理员只要掌握好各个网络节点中的流量数据,就可以对整个网络进行有效的调控。网络工作者在网络设计时必须要考虑到网络流量特性的问题,很多网络流量模型近几年也在不断的被研究出来,网络流量预测模型的研究也受到很大程度的重视。例如几种比较有名的预测模型:马尔科夫模型、泊松过程模型,近几年开始有学者提出自回归模型的概念。由于网络的不断发展,规模不断增大,网络流量本身已经发展成为一种具有多种特性的事物,这给传统网络流量预测模型的预测造成了困难,因为传统模型预测方法很难捕捉到流量的时变性、以及高度自私性等特征。本文介绍的ARIMA模型,是一种同其他类型预测模型相比具有明显优势的新型预测模型。
二、网络流量预测原理
网络流量的内涵是指网络上传输的数据总量,在采集网络流量的原始数据时,间隔采集就可以获得一组组时间序列。通常情况下,可以采用下面这种方式来对网络流量数据进行描述:
由于网络的快速发展,网络的规模越来越大,网络流量的各种特征也越来越难以捕捉到,传统预测手段很难呈现数据之间的时间关系,因此现代的网络流量预测变成了复杂时间序列回归系统问题。ARIMA模型能够很好的捕捉到网络流量的各种特征,对时间序列性数据的研究具有很好的效果,因此在经济时间序列得到了很广泛的应用,解决了许多传统预测模型无法解决的难题,本文将会介绍ARIMA模型预测的基本方法。
三、基于 ARIMA模型的网络流量预测
1、ARIMA模型的描述
ARIMA模型之所以能很好的提高预测精度,在于其相对于传统预测模型而言,很好的捕捉到了网络流量的几种特征,把采集到得数据通过处理,然后通过建立好的最佳预测模型,来对网络流量数据进行仿真预测。模拟预测结果很好的说明ARIMA模型比其他类型的模型预测的精度要高,并且把网络流量的规律呈现的更加直观。
对某一满足ARIMA( p, q)模型的样本数据集{w t= 0, 1, , },取自然对数并对其进行d次差分(差分算子阶数d通常取0或1,最多取2),可以得到平稳的ARIMA( p, q)序列,在确定模型参数并进行拟合和检验后,就可以进行网络数据流量的预测,利用希伯特空间上线性算子的基本理论,可以证明对于离散的、连续的、标量以及向量的情况,用一个ARIMA(n,n-1)模型可以把任一平稳随机系统逼近到所要求的精确程度,而在实际应用中,大量的随机系统可以恰当地用ARIMA(2,1)模型来模拟。
对其参数的估计和定阶有很多种方法,几种常见的例如矩估计、线性建模、HDW、极大似然估计等方法,其中“矩估计方法”精度不高,一般作为其它更好方法的迭代初值,另几种方法各有所长,本篇论文选择的方法则是线性建模,一次来确定ARMA模型的参数。
根据最后 AIC和 SBC值最小化原则得到 AR IMA( p, q,d)的参数达到最优, 对于用不同参数模型计算的结果也可以采用真实数据对其进行相似系数和拟合度的分析, 如果相似系数和拟合度最大, 则该模型就最优模。
四、仿真分析
1、采集数据
为了对本文提出模型的效果进行拟合和检验, 本文采集对 CERNET山西主节点一台 CISCO6509设备某端口流出流量进行监测, 采样时间间隔为 5分钟, 如图所示:
2、数据处理
从上图可以看出,该模型在初始阶段拟合效果不太好, 但经过大量数据的计算后, 在最后 48小时模型得到了较好的拟合效果, 与原始流量曲线的走势基本相符。
4、网络流量的预测
使用上述所到的 AR IMA 模型对未来 24小时的网络流量进行预测, 预测结果如图所示:
上述部分是基于ARIMA模型对在网络流量预测中的应用介绍,ARIMA模型作为一种新型预测模型,同过去的几种模型相比较起来,预测效果非常的直观。与其他预测模型相比,优越性可见一般,具体预测指标如下表所示:
五、总结
传统的网络流量预测方法的预测基础是建立在流量满足线性关系,但实际上,这种关系式并不是始终都是成立的,实际网络流量数据中包含了很多的非线性因素,它的表现规律并不很直观,因此运用传统的方法对网络流量的预测,其预测精度并不高,为了解决传统预测手段精度不高的问题,本文围绕如何准确预测网络流量模型这一目标, 提出了基于 ARIMA 的网络流量时间序列模型, 本文详细阐述了模型的数学算法和实现方法。仿真结果表明, 在实际的网络流量环境中, ARI-MA模型降低了预测误差, 提高了预测精确度, 具有较强的适应能力。
参考文献:
[1]张冉,赵成龙. ARIMA模型在网络流量预测中的应用研究[J]. 计算机仿真,2011,02:171-174.
[2]薛可,李增智,刘浏,宋承谦. 基于ARIMA模型的网络流量预测[J]. 微电子学与计算机,2004,07:84-87.
[3]崔文亮. 基于ARIMA模型的网络流量预测[J]. 软件,2012,11:221-223.
[4]郝占军. 网络流量分析与预测模型研究[D].西北师范大学,2011.
[5]李菁菲. 基于小波技术和ARIMA模型的网络流量预测研究[D].山东大学,2010.
作者简介:
赵俊峰,性别:男,天津工业大学在职研究生,研究方向:控制理论与控制工程,工作单位:威世通用半导体(天津)有限公司 工程师。