基于离散变量的多尺度网络流量短期预测仿真

2021-11-17 08:37周其龙
计算机仿真 2021年5期
关键词:网络流量尺度数值

周其龙

(河南师范大学新联学院,河南 郑州 450000)

1 引言

网络流量短期预测是网络管理中不可忽视的问题[1]。预测结果的精准度、实时性以及应用范围直接影响网络管理的效率。目前,通常使用的预测方式为线性与非线性预测。以小波分析为基础,进行非线性预测成为新的研究热点,但小波分析的计算复杂程度较高,并且需要多次重复计算。由于网络流量具有结构多样、相似面积大、流量数据多变等特点,因此,非线性预测方法的精准度较低,在流量短期预测中不具有可行性,实用性不高。基于此,提出基于离散变量的网络流量预测方法,可充分适应网络流量的不确定和突发性。

龙震岳[2]等人针对传统网络预测模型泛化能力弱、准确度低的缺点,提出组合小波包分解和灰狼横纵多维混合寻优算法,对短期网络流量进行预测。首先利用小波分解网络流量,将其划分成多个频段序列,通过优化模型对得到的序列进行单步或者多步预测处理;然后重构并累计预测数值,最终得到未来短时间内网络流量数值。田中大[3]等人在高斯过程回归模型的基础上,提出补偿自回归积分滑动平均模型的网络流量预测方法。首先利用布鲁克·德赫特·申克曼的统计量检验法,确定网络流量的时间序列特征;然后通过补偿自回归积分滑动平均模型进行非平稳建模,构建符合时间序列规律的预测模型,优化算法进行误差序列建模,最终运用预测模型得到的数值与误差值相加,所得结果为最终的网络流量预测数值。

但上述方法未考虑短期网络流量的突发性和不确定特征,预测结果会出现一定偏差,结合以上方法中的优秀部分,提出基于离散变量的多尺度网络流量短期预测方法。仿真结果表明,所提方法能够掌握时间序列的变化规律,具有更高的预测精度和更小的预测误差。

2 多尺度特性分析

按有序性排列规律的变量数值,称为离散变量。其中的变量数值通常为整数,可通过计数获取得到。离散变量的布局及应用在数据预测中占据重要地位,首先要明确离散变量的用途,确定每个数值的取值范围,然后根据所需完成的预测目的解决问题。

在网络流量中,许多随机现象的数值也被称作变量,每个量的数值都是不固定的,即随机数据的数量表现。

假设基于离散变量[4]的网络空间设为S={e},离散变量定为X=(e),是网络空间S中的实际单值函数。可被用于以下三个方面:

1)离散变量决定网络空间。

2)离散变量X=(e)是满足一定条件的函数。取值范围具有随机性,但要在网络空间S范围内。

3)网络预测可用离散变量的取值概述。

由此可见,基于离散变量进行的网络流量预测,其体现的统计规律性可全面判定预测结果的可行性,并进一步提高预测精度。

引入离散变量,分析网络流量固有的多尺度特性,成为进行多尺度网络流量短期预测最有效的方法。采用网络流量多尺度特征进行直接表示,在选择适当离散变量的情况下,可更直观得知在不同尺度下,网络流量的参数值,为后续预测计算作出良好的铺垫。

3 多尺度网络初始流量获取

多尺度是网络流量中的主要特征,主要表现为长关联性、相似特征以及多层次等。不仅体现在Internet网络中,也存于无线网络中。多尺度网络[5]流量的复杂性主要体现在时间尺度与统计层面两者的突发性特点上,因此多尺度网络下,流量的性能相比其它要求更高。

由于网络流量具有复杂性和多变性等特点,在引入离散变量的基础上,对初始流量数据进行多尺度划分,从而获取到在网络频率[6]特征不相同情况下,近似数值与细节数值。近似数值指划分之前的初始流量数据,具有与基本性质相似的分量数据。其中不包括高频网络下留存的未划分相似特性;细节数值指的是动态流量,可映射出细节特征的短期关系。因此,根据多尺度网络流量预测的要求,在保持初始流量数据降低的同时,还可完成噪声消除的提前处理,使得网络流量的复杂特点得到划分。

相关网络流量预测研究人员,曾做过关于离散变量的一种数学转换。简而言之,就是将多尺度网络中,初始一个一维的信号表现形式,最终划分成两个一维信号,可概括成时间线上的逼近信号,以及尺度频率上的细节信号。基于预测的多尺度网络流量,设尺度函数为φ0和流量函数为φ0,从而进行多尺度网络初始流量的获取。

为了获取初始流量,利用流量函数φ0和尺度函数φ0,同时结合高阶矩阵,构建无条件的基数值。在多尺度网络中,假设Pj为逼近信号,j为多尺度范围,随着多尺度范围发生变化,Pj也随之改变,Pj中包含的采样信息越少,初始信号数据越逼近。在多尺度网络流量中,逼近信号都涵盖上述尺度的采样信息,并维持一定幅度的频谱数据信息。同理,伴随尺度范围j的扩大,Pj逐渐缩小,但其周期时长不发生改变。通过上述分析,得到多尺度网络逼近信号的求解公式为

Pj=Pj-1-Dj

(1)

其中,Dj为细节信号。上述计算结果包含在划分的子空间{Vj}∈z中,同时满足条件Vj-1⊂Vj。

多尺度网络流量是将流量X(k)映射到子空间Vj中,得到逼近信号与流量之间关系如下

Pj={VjX(k)}

(2)

也可表示为:

(3)

在上述式(2)和式(3)中,映射关系因子ax(j,k)可通过流量X(k)以及φ0的定义得出

ax(j,k)=〈X(k),φ0〉

(4)

同样的,通过下述关系式可得出细节信号与流量之间的关系表示为

(5)

其中,映射关系因子dx(j,k)可通过下述定义得到

dx(j,k)=〈X(k),φ0〉

(6)

根据上述多尺度网络流量关系,得出流量的求解关系式,即

(7)

在变量相对单一的离散数据信息中,构建预测多尺度网络流量短期预测模型,可达到收敛速度快、平稳程度高、误差小的流量预测目标,且极具有效性。多尺度网络初始流量的获取为构建准确的短期预测模型奠定了基础。

4 多尺度网络流量短期预测

对多尺度网络流量进行短期预测,需要构建短期预测模型,多尺度网络流量预测模型[7]的建立,对于网络存储空间[8]的规划、网络性能[9]指标等具有重要意义。

多尺度网络流量短期预测是基于离散变量构建的模型,将离散变量函数和多尺度函数进行正交,在离散变量中,选取的尺度函数θ(t)、变量函数μ(t),可得到两个函数的取值范围如下

(8)

以及

(9)

为了将离散变量引入到多尺度网络流量短期预测模型中,重点考虑经过计算得到的离散信号A(k),以此为作为多尺度分析的基础。网络流量短期预测主要是运用逼近信号Pj进行流量预测计算。因此,将得到的逼近信号分成两部分,对前部分结合尺度函数进行网络流量尺度线性预测,预估其数值,随之利用变量函数,对后半部分进行预测流量估计,由此得到,逼近信号与尺度函数和变量函数的正交结果关系表示为

Pj=θ(k)·μ(k)

(10)

现阶段,在网络流量预测中最常用的是线性预测模型,其中,主要有自回归AR、平均滑动以及自回归基础上的滑动模型,简称ARMA模型。

假如Z(t)为时间序列,模型ARMA(p,q)中,若X(k)具有稳定性,针对其中每个流量变量k,可列出流量与尺度函数、变量函数及时间序列的关系为

X(k)=μ(k)X(k-1)θ(k)+Z(t)

(11)

以此类推,可通过多项式将其表达,其中因子不同。ε代表P阶多项式中的尺度因子,υ代表Q阶多项式中的线性预测因子,B代表前项公式中的移动算子,得到流量线性预测表达式为

υX(k)=B·Z(t)·ε·Pj

(12)

若数据在ARMA模型中具有稳定性,假如时间序列呈现变化趋势,破坏数据的稳定性,可使用差分算子增强流量预测的稳定性。定义差度数值为1,将差分算子设为σ。则得加入差分算子增强后的流量预测效果表达式为

(13)

若上述表达的是时间多项方程形式,在结束有限次数内的差分,可符合模型检测。假设差分次数表示为d,因此,得到基于模型ARMA(p,d,q)的流量预测模型为

(14)

因此,基于离散变量的多尺度网络流量短期预测[10],可采用ARMA模型,得到需预测网络流量的逼近信号,在多尺度中选取最佳预测部分,进行预测模型的参数估计,预测两部分各自参数值,从而得到网络流量短期预测数值。

5 预测精准度检验

使用平均相对误差[11],表示为δ,用于判定预测结果的精准程度,即平均相对误差精度值为

(15)

假设存在两个预测模型,分别用M1和M2表示,预测的数值分别用f1和f2表示,则可得到最终预测流量结果

(16)

在上述式(16)中,β1和β2表示回归参数值[12],ω代表随机干扰系数。

若满足δ=y-fi(i=1,2),则可得到两个预测流量数值的平均相对误差精度值的实际结果

(17)

预测结果检验:当平均相对误差精度值δ=1时,可说明预测结果准确。若想提高预测模型的预测精度,可通过提高平均先谷底误差精度值来实现,校验工作流程如下所示:

第一步,根据计算得到的网络流量预测结果,对其进行模型的序列排序。

第二步,排列完成后移入待评价指标中,选择最佳模型。

第三步,测试实际网络流量与预测流量数值差。

第四步,输出检验结果,数值越小,则准确度越高,证明所用方法的可行性更高。

至此,完成了基于离散变量的多尺度网络流量短期预测方法。

6 仿真研究

为了验证所提基于离散变量的多尺度网络流量短期预测方法的有效性,进行了一次仿真。

6.1 仿真方案及运行过程

仿真方案:选用MATLAB软件构建模型,将尺度参数设置为3,网络协议选择被普遍使用的TCP版本,总体过程如图1所示,为仿真过程图,基于离散变量对多尺度网络进行分解和构建。

图1 仿真过程

首先,当设定初始流量表示为H为0.8420时,合成流量H′的数值为0.8393,由此可看出,多尺度网络下离散变量能表现出流量的特性,因此,可总结出不同的流量样本呈现如下特点:其一,当多尺度网络流量超过1秒时,可表现其多变性特点;其二,网络流量在多尺度中稳定性差。

从下图2中可看出,将离散变量下的多尺度网络流量按照尺度特征,表示为4个层次,分别设置为A1,A2,A3,和A4,逐层记性分析,得到的参数如图中D4所示,基于离散变量下对多尺度网络流量进行分析和重构,精准度设定不同的情况下,分析得出网络流量平稳性的变化趋势,以及周期变化特征,提高了网络流量短期预测的精准度。

图2 网络流量多尺度分析

6.2 仿真结果

图3为所提方法的预测流量、非线性预测方法的预测流量与实际流量的对比图。

图3 预测流量与实际流量对比图

分析图3可知,采用所提基于离散变量的多尺度网络流量短期预测方法进行流量短期预测后,其预测流量曲线几乎与实际流量曲线重合,而非线性预测方法的预测流量与实际流量间存在较大差距,远低于实际流量。充分说明,所提方法的预测精度较高,预测效果十分理想。

根据图3的流量预测结果可知,在120s的测试时间中,实际流量约为118Gb。以这一结果为依据,分别采用自回归滑动模型预测方法、组合小波包分解和灰狼预测方法和所提方法进行短期流量预测,测试三种不同方法的预测精度。将干扰因素考虑到仿真中,得到对比结果如图4所示。

图4 三种不同方法的预测流量对比结果

分析图4可知,采用自回归滑动模型预测方法进行短期流量预测,在120s的测试时间内的预测流量约为55Gb;采用组合小波包分解和灰狼预测方法,在120s的测试时间内的预测流量约为51Gb;采用所提方法进行短期流量预测,120s内的预测流量约为117.5Gb。与图3中的实际流量结果对比可得,两种对比方法的预测结果与实际流量相差较大,预测精度较低,而所提方法的预测结果与实际流量只相差0.5Gb,充分说明,所提方法的预测精度更高。

通过上述实验证明离散变量下流量预测的实用性以及有效性,即随着时间的变化,流量浮动变化较小,说明所提方法对于实时性提供了良好的保障。

针对网络流量预测而言,分析了解多尺度网络特征具有重要意义,网络流量预测的精准度对于网络效率的提高、流量控制研究工程的实施、网络性能的优化具有重要的研究意义。

7 结论

短期网络流量的预测对于规划网络存储空间、提高网络性能等具有重要作用。提出基于离散变量的多尺度网络流量短期预测,构建离散变量下的预测模型,并对预测结果进行检验。经仿真表明,所提预测方法精准度更高,精确掌握流量的尺度序列规律,可被应用于网络流量工程研究中。

猜你喜欢
网络流量尺度数值
环境史衰败论叙事的正误及其评判尺度
大数据驱动和分析的舰船通信网络流量智能估计
体积占比不同的组合式石蜡相变传热数值模拟
基于双向长短期记忆循环神经网络的网络流量预测
数值大小比较“招招鲜”
舰船测风传感器安装位置数值仿真
铝合金加筋板焊接温度场和残余应力数值模拟
一种用于敏感图像快速加密的图像注入技术仿真
以长时间尺度看世界
9