范 敏
(杭州职业技术学院,浙江杭州310018)
随着视频业务蓬勃发展,视频已经成为网络中的主要流量,VBR(Variable Bit Rate)作为网络视频通信的主要方式,对其建立准确的预测模型,有利于设计缓冲区、合理分配带宽,防止网络拥塞产生,从而为用户提供可靠的QoS(Quality of Service)保障,因此,VBR视频流量建模和预测成为当前研究的重要课题[1]。
针对VBR视频流量预测问题,国内外学者对其进行了大量的研究,提出一些预测模型[2]。传统预测模型主要基于时间序列分析,并基于线性建模,然而由于VBR视频流量受到多种因素影响,具有非线性、突变性等变化特点,难以建立精确的数学模型,因此时间序列预测模型的预测误差较大,在实际应用中存在着很大的局限性[3]。大量研究表明,VBR视频流量具有混沌特性,因此近年来出现了基于混沌理论的人工智能VBR视频流量预测,首先对VBR视频流量数据进行相空间重构,然后采用神经网络对数据进行学习,建立VBR视频流量预测模型,获得较高的预测精度[4-5]。神经网络是一种基于经验风险最小化原则的机器学习算法,要求样本数量大,且存在一些自身难以克服的缺陷,如:网络结构复杂,收敛速度慢,易陷入局部极小,对VBR视频流量预测结果产生不利影响[6]。支持向量机(Support Vector Machine,SVM)是一种针对小样本、高维数的机器学习方法,泛化性能优异,解决了神经网络存在的缺陷,被公认为是较好的替代神经网络的非线性预测方法[7]。然而VBR视频流量具有多尺度特性,SVM仅在一个尺度上对样本数据进行预测,对VBR视频流量数据的逼近性能并不能令人满意[8]。
由于VBR视频流量具有时变、非线性和突发性等特征,单一的模型已经不适合预测这种复杂流量,小波核函数具有多尺度学习性能,可以描述多分形的VBR视频流量特性,为此,采用小波核函数来构造SVM的核函数,利用小波分析和SVM的优点,建立一种基于小波支持向量机的VBR视频流量预测模型(WSVM),并通过仿真实验测试WSVM模型的预测性能。
对于 VBR 视频流量时间序列:x(t),t=1,2,…,N,通过选择合适的嵌入维(m)和延迟时间(τ)就可对其进行重构,产生一个多维的VBR视频流量时间序列
式中,M=N-(m-1)τ。
设含有n个样本的VBR视频流量训练集:{(xi,di),i=1,2,…,n},xi∈ Rd是第 i个训练样本的输入列向量,xi=[x1i,x2i,…,xdi]T,di∈R为相应的输出值,SVM通过利用非线性映射函数φ(x)将输入数据映射到线性空间中进行线性估计
式中:ω 为权值,b为偏置项[9]。
通过对式(2)进行最小化估计,得到ω和b的值
式中:yi为SVM的输出;ε为不敏感损失函数。
通过引入松弛变量,找到ω和b的值
式中,ξi为松弛变量。
引入Lagrange乘子,式(3)的决策函数变为
式中:k(xi,x)为核函数;ai和a*i为Lagrange乘子。
小波分析是由一个母小波函数φ(x)通过平移和伸缩变换产生一系列小波函数的叠加。
式中:α是伸缩因子;b是平移因子[10]。
设母小波函数为ψ(x),那么满足平移不变核定理的小波核函数为
对于VBR视频流量预测问题,采用Morlet小波,即
因此,可以得到相应的小波核函数
综合上述可知,VBR视频流量预测的WSVM回归函数为
WSVM的VBR视频流量预测模型结构见图1,WSVM的结构具体为:1)第1层为VBR视频流量输入数据{x1,x2,…,xn},通过为m和τ重构而成的训练集;2)第2层为输入数据向量和SVM核函数计算;3)第3层为WSVM的输出结果。
图1 VBR视频流量的WSVM结构
1)收集VBR视频流量数据,进行预处理,并划分为训练集和测试集两部分。
2)根据互信息法和虚假最近临点算法计算VBR视频流量数据的m和τ。
3)采用m和τ对VBR视频流量的训练集和测试集进行相空间重构。
4)初始化WSVM参数,主要包括Lagrange乘子ai和、伸缩和平移因子α,b的初始值。
5)将训练集输入到SVM建立式(4)的VBR视频流量预测目标函数,然后采用SMO(Sequential Minimal Optimization)算法对其进行求解,得到最优的ai和a*i,b值。
6)将ai和a*i,b值代入式(10),建立VBR视频流量预测模型,然后采用测试集对模型性能进行检验。
7)计算测试集的预测误差,如果误差满足预先设定的阈值,则表示建立了最优VBR视频流量预测模型,否则返回步骤5)继续学习,找到更优的ai和a*i,b值。
8)采用建立的最优VBR视频流量预测模型对未来某一时刻的视频流量进行预测。WSVM的VBR视频流量预测模型工作流程见图2。
图2 VBR视频流量预测模型的工作流程
采用Berlin大学的MPEG-4视频迹(trace)数据库的“Silence of lambs”,帧速率为 30 f/s(帧/秒),连续采集280帧数据,前200数据作为训练集,最后80个数据作为测试集,数据见图3。在AMD 3.0 GHz CPU、2Gbyte RAM、Windows XP的平台上,采用MATLAB 2010a编写程序实现仿真实验。
图3 VBR视频流量数据
为了使WSVM的仿真结果具有可比性,采用径向基核函数支持向量机(RBF-SVM)、小波神经网络(WBPNN)作为对比模型,并采用平均相对误差(MAPE)和均方根误差(RMSE)以及训练时间作为模型性能的评价指标。MAPE,RMSE分别定义如下
式中:yi和yi分别为VBR视频流量的实际值和预测值;n为测试集的样本数。
WSVM对区间[0,1]的数据最为灵敏,为了提高WSVM的训练效率,对重构后的训练集进行归一化处理,具体为
式中:x和x'分别表示原始数据和归一化后的数据;xmin和xmax分别表示最小值和最大值。
采用互信息法计算VBR视频流量的τ,得到τ=1,用虚假最近邻点法计算最优m,得到m=5,然后根据τ=1,m=5对VBR视频流量数据训练样本集和测试样本集进行重构,得到多维的VBR视频流量时间序列。
将重构后的VBR视频流量训练集分别输入到WSVM,RBF-SVM,WBPNN进行学习,建立相应的VBR视频流量预测模型,然后对训练集进行拟合,拟合结果的绝对误差见图4。从图4可知,WSVM的拟合精度最高,拟合值与实际值最吻合,拟合误差远远小于对比模型RBFSVM,WBPNN,对比结果表明WSVM是一种有效、拟合精度高的VBR视频流量预测模型。
图4 各模型的VBR视频流量拟合误差对比
评价一个预测模型性能的优劣,主要考察其预测能力,为此建立VBR视频流量模型对测试集进行预测,均采用一步预测,具体方式:采用前200个VBR视频流量数据作为最原始的训练集,对第201个数据进行预测,然后采用滚动方式将第201个数据合到训练集,对第202个数据进行预测,依次类推,最后得到全部80个测试样本的预测结果,WSVM、RBF-SVM、WBPNN的预测结果见图5。各模型对测试集预测结果的MAPE、RMSE和训练时间见表1。
图5 各模型的预测结果对比
表1 WSVM和RBF-SVM,WBPNN的综合性能对比
从图4、图5和表1可知,在所有模型中,WSVM的综合性能最优,拟合精度最高,预测误差最小,其优越性主要体现在3个方面:
1)在所有模型中,WSVM拟合精度最高,与VBR视频流量值最吻合,拟合结果比较稳定,WBPNN模型的拟合精度要优于RBF-SVM,这表明,采用小波核函数的多尺度学习性能能够更加准确地对VBR视频流量变化趋势进行拟合。
2)WSVM的预测精度高于WBPNN和RBF-SVM,WBPNN虽然拟合精度高,但是其预测精度低,泛化能力差,这主要是由于WBPNN易出现过拟合现象,而WSVM训练实际上是一个二次凸规划问题,在有限样本情况下,可以建立全局最优的VBR视频流量模型。
3)训练速度。WSVM的训练时间为10.5 s,远远小于WBPNN、RBF-SVM的训练时间,提高了VBR视频流量训练速度。
由于受到多种因素的影响,VBR视频流量具有突变性、非线性等变化特点,传统方法难以建立高精度的VBR视频流量预测模型,本文利用小波核函数多尺度学习性能和SVM的优异的非线性预测能力,在分析VBR视频流量多重特性的基础上,提出一种基于WSVM的VBR视频流量预测模型,结果表明,WSVM提高了VBR视频流量的预测精度,加快了模型的训练速度,更加准确地刻画了VBR视频流量特性的变化特点,预测结果更加稳定、可靠。
[1]王升辉,裘正定.MPEG-4视频流量多重分形建模[J].通信学报,2006,27(10):44-50.
[2]王生辉,袭正定.基于多重分形的VBR视频流量多步预测方法[J].计算机研究与发展,2007,44(1):92-98.
[3]LEEM.Video traffic prediction based on source information and preventive channel rate decision for RCBR[J].IEEE Trans.Broadcasting,2006,52(2):173-183.
[4]王以宁,李兴华,迟学芬.基于神经网络VBR视频流量建模及预测[J].吉林大学学报:信息科学版,2008,26(5):509-513.
[5]苏晓星,常胜江,熊涛,等.用神经网络实现VBR视频通信量的在线预测[J].电子学报,2005,33(7):1163-1167.
[6]胡志刚,杨广全,乔现玲.基于小波支持向量机的电梯交通流预测模型[J].系统仿真学报,2009,21(19):6321-6324.
[7]AMIR F,MOHAMED A,ALEXANDER G.Sparse basis selection:new results and application to adaptive prediction of video source traffic[J].IEEE Trans.Neural Network,2005,16(5):1136-1146.
[8]赵露,白光伟,孙勇.基于小波变换的MPEG视频流预测模型[J].计算机工程与设计,2011,32(5):1531-1534.
[9]罗会兰,杜连平.一种SVM集成的图像分类方法研究[J].电视技术,2012,36(23):39-42.
[10]HUANG X,ZHOU Y,ZHANG R.A multi-scale model for MPEG-4 varied bit rate video traffic[J].IEEE Trans.Broadcasting,2004,50(3):323-334.