李巧侠
(西安铁路职业技术学院 土木工程学院, 西安 710600)
随着互联网络的迅速发展,网络成为人们交流和沟通的一种重要工具,再加上网络上业务种类不断增加,网络流量值急剧增加,因此网络流量的预测引起了人们的广泛关注,但网络流量受到经济、环境等因素综合影响,变化具有随性、混沌,同时受到上网时间、价格等因素影响,其变化十分复杂,如何提高网络流量预测精度是网络管理领域研究中重点[1-2]。
针对网络流量预测问题,国内外学者进行广泛、深入的研究,提出许多优秀的网络流量预测模型[3],当前网络流量预测值可以分为:基于传统统计学理论的网络流量预测模型[4-5],如线性回归模型,它们是主要基于线性理论进行建模,假设网络流量是一种单一线性变化规律,简单、易实现,但是实际网络流量变化不是简单的线性变化特点,同时具有非线性变化特点,如随机性、时变性,导致该类模型的网络流量预测误差大[6-7]。另一类为基于现代统计学理论的网络流量预测模型[8],其中神经网络应用广泛,由于神经网络具有良好的非线性学习能力,获得较理想的网络流量预测结果[9-11]。神经网络在训练过程中,要进行不断迭代更新权值,收敛速度慢、大,易出现“过拟合”的网络流量预测结果[12]。极限学习机(extreme learning machine,ELM)是一种学习速度的神经网络,只需要进行一次迭代就可以完成神经网络的训练,工作得到了大幅度。由于网络流值变化十分复杂,单一模型无法获得高精度的网络流量预测结果[13]。
为了提高网络流量的预测精度,提出了基于组合模型的网络流量预测模型(WA-ELM)。首先采用小波分析(wavelet analysis,WA)对网络流量进行多尺度分解,并对每一个分解分量进行混沌处理,然后通过极限学习机对混沌处理后的分解量进行预测,对它们的预测结果进行重构,最后与其它模型的仿真对比实验,以验证WA-ELM的有效性和优越性。
相空间重构的工作思想为:系统的任一分量演化由与其相互作用的分量决定,相关分量信息隐藏在该分量演化过程中,因此可通过分析某一分量的时间序列,了解原系统的动力学特性,提取和恢复出原系统的规律[13]。设网络流量时间序列为:x(t),t=1,2,…,N,选择嵌入维数m和延迟时间τ,可进行重构,得到一个多维向量序列X(t),挖掘隐藏于网络流量时间序列的变化规律,恢复网络流量的原动力系统,如式(1)。
X(t)=x(t),x(t+τ),…,x[t+(m-1)τ]
(1)
式(1)中,M=N-(m-1)τ,M为相点个数。
小波分析可对信号进行多尺度细化,包括分解和重构两部分,其中Mallat算法是一种快速小波变换算法,具体为式(2)。
(2)
信号重构形式为式(3)。
(3)
(4)
式(4)中,αi为连接权值;bi为回归误差;βi为输出权值。
式(4)的矩阵形式为式(5)。
Hkβk=Tk
(5)
式(2)中的βk的值为式(6)。
(6)
ELM的回归形式为式(7)。
βif(αix+bi)
(7)
ELM的学习步骤为:
(1) 当样本比较多时,通过Sk得到初始输出权值为式(8)。
(8)
(2) 将新数据(xk+1,tk+1)融入原始数据集中,输出权值Pk+1与βk+1的为式(9)。
(9)
式(9)中,hk+1=[f(α1xk+1+b1)f(α2xk+1+b2)…f(αLxk+1+bl)]。
(3) 增加训练样本的长度,然后转到(2)继续执行。
(4) 当全部训练样本学习完后,终止学习,建立相应的回归模型。
(1) 对网络流量进行小波分解,得到不同分量,并对不同分量进行相空间重构;
(2) 利用极限学习机对重构后的低频分量和高频分量分别建立相应的网络流量预测模型,得到低频分量和高频分量的预测结果;
(3) 最后对分量的预测结果进行重构和融合,得到网络流量预测结果。
WA-ELM的网络流量预测模型工作流程,如图1所示。
图1 WA-ELM的网络流量工作流程
为测试WA-ELM的网络流量预测性能,采用http://newsfeed.ntcu.net/~news/2016/的主节点路由器的每小时网络流量作为实验对,收集1000个样本,选择100个样本作为测试样本,其它样本作为训练样本。如图2所示。
图2 实验数据
选择单一极限学习机(ELM)、小波分析+BP神经网络(WA-BPNN)作为对比模型,采用平均相对百分比误差(MPAE)和均方根误差(RMSE)对预测结果进行评价,它们为公式(10)、(11)。
×100%
(10)
(11)
采用小波分析的Mallat算法对网络流量进行分解,得到的低频序列a1和高频序列d1、d2,然后估计网络流量的τ和m,结果如表1所示。
表1 各分量m和τ的值
根据表1中的τ和m分别对网络流量时间序列的特征分量进行重构,得到各个分量的学习样本。
3.3.1 单步预测结果
采用ELM对网络流量的各分量进行学习,建立各分量的预测模型,得到各分量的预测结果,采用小波重构对分量预测结果进行融合,得到网络流量的最终预测结果,单步拟合和预测结果,如3所示。
(a) 拟合结果
(b) 预测结果
从图3可知,WA-ELM可以有效拟合网络流量变化特点,同时能够对网络流量的变化趋势进行准确刻画,是一种拟合和预测精度均很高的网络流量预测模型。
ELM、WA-BPNN和WA-ELM的单步预测误差,如表2所示。
表2 单步预测性能比较
从表2可知,WA-ELM的MAPE和RMSE均小于ELM、WA-BPNN,这是因为采用小波分析可以对网络流量进行细分,有助于网络流量的建模,同时采用ELM可以更好反映网络流量的变化趋势。
3.3.2 多步预测结果
网络流量建模主要是姨将来网络流量变化趋势进行估计,单步预测的时间提前量过小,常要进行网络流量的多步预测,WA-ELM多步拟合和预测结果,如图4所示(此处提前3步)。
(a) 拟合结果
(b) 预测结果
从图4可以看出,WA-ELM的多步拟合和预测误差要大于单步拟合和预测误差,但是预测精度满足实际应用要求,具有较好的泛化、推广性能。
ELM、WA-BPNN和WA-ELM的单步预测误差,如表3所示。
表3 多步预测性能比较
在表3中,ELM的网络流量多步预测结果的MPAE和RMSE最大,次之为WA-BPNN,而MPAE和RMSE最小为WA-ELM,这表明WA-ELM集成了小波分析和极限学习机的优点,构建了整体性更优的网络流量预测模型,明显改善了网络流量的预测效果。
网络流量是多种因素的综合结果,因此具有随机性、周期性、混沌性变化特点,再加网络业务数量增加,网络拥塞频率日益频繁,网络流量的预测结果可以帮助管理人员提前了解网络流量的变化态势,对其进行研究具有重要意义。针对单一模型无法准确描述网络流量变化特点,提出了WA-ELM的网络流量预测模型,并通过仿真实验得到如下结论:
(1) 采用小波分析对网络流量数据进行分解,得到更加细微的网络流量变化特点,有助于挖掘网络流量的变化态势,提高了网络流量的预测精度。
(2) 采用混沌理论对网络流量的分解进行相空间重构,将一维时间数据变化多维时间序列,挖掘网络流量数据之间的时间变化关系,有利于后续的网络流量建模与预测。
(3) 采用极限学习机对网络流量数据进行学习,建立了理想的网络流量预测模型,获得了比其它模型更好的网络流量预测结果,具有更高的实际应用价值。