基于径向基神经网络的Web Service QoS属性值组合预测方法

2015-11-25 02:59:16刘宗磊张鹏程
计算机与现代化 2015年12期
关键词:灰色神经网络预测

刘宗磊,庄 媛,张鹏程

(河海大学计算机与信息学院,江苏 南京 211100)

0 引言

随着面向服务计算技术的日趋成熟,网络上出现了大量功能相同或相近而服务质量有很大差别的Web Service,其中QoS 成为评价和选择Web Service的重要依据[1]。而Web Service 是通过Internet 网络提供服务,QoS 会随着网络环境、服务器负载等因素的变化而变化[2-4]。通过分析历史QoS 观察值(通常通过监控服务执行收集[5]),可以在Web Service 发生失效前做出反应,选择出正确的候选服务或者对现有服务做出调整,从而防止这些失效发生或者减少它们带来的影响。

当前Web Service QoS 预测方法主要分为3 类:

1)基于相似度的QoS 预测方法。Shao[6]等在2007 年最早提出使用协同过滤法对用户未使用过的QoS 进行预测。该方法只考虑用户之间的相似度,而没有考虑Web 服务之间的相似度,使得预测效果不太理想;Zheng[7]等提出了一种基于混合协同过滤方法的QoS 预测方法。该方法设计了2 种信心权重,其中一种信心权重表示对基于用户之间相似度得到的QoS 预测值的信任程度,另一种信心权重表示对基于服务之间相似度得到的QoS 预测值的信任程度。

2)基于人工智能的QoS 预测方法。Liu[8]等提出了一种基于BP (Back-Propagation)神经网络的QoS预测方法。但BP 神经网络存在收敛速度慢、识别精度不确定和过学习等问题。Zhang[9]等提出了一种基于RBF 神经网络的QoS 短期预测方法。该方法具有结构自适应性、网络设计简单、训练时间短等优点,但该方法的训练神经网络的数据缺乏在线更新机制。

3)基于时间序列的QoS预测方法[10-12]。Amin[13]等提出一种基于线性非线性时间序列的自动预测QoS 属性值方法,该方法自动将数据区分为线性和非线性2 种类型,提高了精确度,但在确定部分模型参数时,该方法默认了相同值,不能很好地建立高精度预测模型。

针对以上问题,本文提出一种以RBF 神经网络方法作为基础的Web Service QoS 组合预测方法。首先进行数据处理,由于Web Service QoS 具有高动态性和非线性的特征,根据其具体数据特征,建立差分自回归移动平均模型(Autoregressive Integrated Moving Average,ARIMA)[14]或自激励门限自回归移动平均模型(Self-Exciting Threshold Autoregressive Moving Average,SETARMA)[15]进行建模预测;同时,利用灰色模型无需考虑变化规律、分布规律的优点,采用灰色等维新息模型[16]进行建模预测。最后建立RBF神经网络模型,将时间序列模型和灰色预测模型得到的结果作为输入源传递给RBF 神经网络模型,训练模型,并进行QoS 相关属性值的预测。

1 一种基于RBF 神经网络的组合预测方法

图1 组合模型构建

本文提出的Web Service QoS 组合预测方法,如图1 所示。该方法由3 部分组成:

1)时间序列模型。用时间序列预测模型从统计学角度进行数据分析,针对时间序列的线性和非线性特征,分别采用ARIMA 模型与SETARMA 模型进行预测。

2)灰色预测模型。通过灰色等维新息模型模拟出整个QoS 属性值发展趋势。对即使有数据缺失的情况,亦可建立高效的灰色预测模型进行预测。

3)RBF 神经网络模型。将模型1)和模型2)的预测结果输入,形成组合预测模型。通过综合利用各种方法提供的有用信息,有利于提高输入质量,以期组合预测模型在效率、质量上优于单一模型,产生更好的预测结果。

Web Service QoS 指标主要有响应时间(Response time)、可用性(Availability)、可靠性(Reliability)、代价(Cost)、带宽(Band Width)等,本文以服务的响应时间为例进行预测。

1.1 时间序列模型

对响应时间x(rt)进行时间序列建模。

1.1.1 数据预处理

1)白噪声检验,使用游程检验法进行,原假设H0表示时间序列为纯随机序列,当p-value <0.05 时则拒绝原假设,即序列不是纯随机序列,继续下一步骤,若p-value >0.05 则接受原假设,即为纯随机序列,无预测意义;

2)正太分布检验,当非正太分布时用Box-Cox[13]进行近似转换;

3)稳定性检测,使用ADF 检验法。对于非平稳序列,可以逐次作差分直至转换为平稳序列。

1.1.2 建立模型

1)ARIMA 模型。

Step1 通过序列的自相关系数(Autocorrelationfunction,ACF)和偏自相关系数(Partial Autocorrelation Function,PACF),确定参数q(移动平均模型阶数)和p(自回归模型阶数),其规律如表1 所示。

表1 AR/MA 模型识别方法

Step2 根据AIC 信息准则(Akaike Information Criterion,AIC)选择AIC 信息值最小的模型,公式如下:

其中k 是参数的数量,L 是似然函数。

Step3 对模型进行显著性检验,即为残差序列的纯随机性检验,使用Ljung-Box(LB)统计量(也称Q-统计量)进行检验,公式如下:

其中,rj是j 阶自相关系数,T 是观测值的个数。如不满足则返回Step2 重新选择。

2)SETARMA 模型。

通常选取门限空间个数l=2,此时门限值r 使用黄金分割搜索算法求得,即每次均以相同的比率0.618不断缩小极值点所在的区间。将x(rt)按升序排列,初始区间为[x(π*(n-1)),x((1-π)*(n-1))],其中π取值0.15,n 为样本数。对于门限变量和延迟参数,选取不同的延迟参数(取小于等于ARIMA 模型中p的所有非负整数),在各个门限区间分别建立ARIMA模型,采用改进的AIC 准则选取最小值确定,公式如下:

1.1.3 选择模型

对所求ARIMA 模型和SETARIMA 模型进行预测,选择相对误差均值(MSPE)和均方根误差(RMSE)较小的模型,并将预测结果yts(rt)传给RBF模型。

1.2 灰色预测模型

所述灰色预测模型中,即使某些数据信息缺失,依然可以采用GM(1,1)模型构建可信的预测过程。使用GM(1,1)等维新息模型,即每补充一个新信息的同时,去掉一个最老的信息。同样,以响应时间x(rt)作为原始数据。为减小波动性影响,以及与时间序列模型统一单位,同样对x(rt)做对数变换得xlog2(rt),以ygrey(rt)为预测输出。通过计算,可以得到t+1 时刻的响应时间,此结果将传递给RBF 神经网络模型作为输入。

1.3 RBF 神经网络模型

当时间序列模型和灰色预测模型建立好后,将得到的2 组数据(yts(rt),ygrey(rt))作为输入源传递给RBF 神经网络模型,同时以相同时刻的观测值作为输出值训练神经网络。利用训练好的RBF 网络进行QoS 预测,并可利用最新的样本集修正RBF 网络继续进行QoS 预测。

2 实 验

2.1 实验设置

本实验使用数据为近2 个月时间笔者收集的4个Web 服务(分别为Domestic FlightSchedule,TV List,Captcha Code,RMB Instant Quotation)的响应时间,分别使用文献[13]提出的基于时间序列模型的QoS 预测法,文献[9]提出的基于RBF 模型的预测法和本文提出的组合预测方法进行预测和分析。在建立模型之前,对所有数据做对数变换。

4 个服务为每日的8:00 到17:00,间隔15 分钟一次的记录值,各采集2 000 个数据,如图2 所示,其中1 900 个作为训练样本,其余100 个作为测试样本。时间序列模型中,以1 000 为滑动窗口;灰色预测模型中,由于数据波动性较大,使用灰色等维新息模型,调整不同大小的滑动窗口。将时间序列模型和灰色预测模型预测的900 个数据作为RBF 神经网络的训练样本。

图2 自测4 个服务的响应时间

2.2 实验结果与分析

2.2.1 实验结果

模型通过实验建立了Domestic FlightSchedule,TV List,Captcha Code,RMB Instant Quotation 4 个服务的基于RBF 神经网络的组合预测模型(RBFC)时间序列和RBF 模型,预测的结果见图3。

图3 4 组Web Service 的组合预测模型与时间序列模型预测结果

从图中可以看出,组合模型预测结果比RBF 模型预测结果有显著提高,在一定程度上比时间序列模型更加精确。由于灰色预测模型只适用于单调性样本数据,小窗口灰色等维新息模型的建立则可以弥补这一缺点,同时能够更加准确地刻画整体规律。

2.2.2 模型评估

根据预测结果对模型进行评估:

为了更直观地比较组合预测模型和时间序列模型的预测结果,对3 个指标(MSPE,RMSE 和Proerror<p)进行列表分析,计算结果如表2 所示。

1)相对误差均值(MSPE):

其中N 为预测结果的个数,yi为第i 个实际观测值,为第i 个预测值(以下N,yi,意义相同)。MSPE反映预测值偏离实际值的程度。

2)均方根误差(RMSE):

RMSE 不仅反映相对误差的大小,还反映预测结果的稳定性。

3)相对误差概率分布:

表2 自测4 个Web 服务预测结果指标比较

表2 中,提高值1 为组合模型较时间序列模型的精度提高,提高值2 为组合模型较RBF 模型的精度提高。从表中可以看出,组合模型与RBF 模型相比,在指标MAPE,RMSE 和下的预测结果均有显著提高;与时间序列模型相比,预测值的相对误差在0.01 以下均有所提高,但RMB Instant Quotation 数据集的组合预测模型的MSPE 和RMSE 值比时间序列结果略大,这可能是由于该数据集特征不适于灰色预测模型所致。

为了直观描述相对误差及相对误差分布情况,采用箱线图进行比较,如图4 所示。

图4 中,纵坐标表示相对误差绝对值,分别为4组自测数据使用时间序列模型与组合模型预测结果的误差分布。从图中可以看出,基于RBF 神经网络的组合模型误差分布的异常值均少于时间序列模型,且分布区间更加集中,这表明基于RBF 神经网络的组合模型预测结果更加稳定与精确。

图4 自测4 组数据误差分布箱线图

3 结束语

本文在前人研究成果的基础上,结合时间序列模型与径向基神经网络模型的优点,并加入灰色等维新息模型,建立了基于径向基神经网络模型的组合预测模型。与已有方法相比,在时间序列模型的建模过程中,并没有统一线性、非线性模型的参数p 和q 的值,并对SETARMA 模型的各个区间分别求解p 和q 的值,增加了模型的准确性。灰色预测模型与径向基神经网络模型均无需考虑规律变化,且径向基神经网络模型可快速建模。通过实验数据表明,组合预测模型在预测精度上有一定的提高。

本文仅根据线性和非线性2 种特征建立时间序列预测模型,但在对实际QoS 数据的分析过程中发现,其还存在波动性、周期性等特征,因此现有的方法在精度上仍可提高。未来将进一步研究时间序列模型中多特征识别,以及径向基神经网络模型的优化算法,同时,考虑加入协同过滤的方法,引入环境因素等的影响。

[1]马友,王尚广,孙其博,等.一种综合考虑主客观权重的Web 服务QoS 度量算法[J].软件学报,2014,25(11):2473-2485.

[2]华哲邦,李萌,赵俊峰,等.基于时间序列分析的Web Service QoS 预测方法[J].计算机科学与探索,2013,7(3):218-226.

[3]Tselentis G,Domingue J,Galis A,et al.Towards the Fu-ture Internet:A European Research Perspective[M].IOS press,2009.

[4]Álvarez F,Cleary F,Daras P,et al.Future Internet Assembly 2012:From Promises to Reality[M].Springer,2012.

[5]Papazoglou M,Pohl K,Parkin M,et al.Service Research Challenges and Solutions for the Future Internet:S-cubetowards Engineering,Managing and Adapting Servicebased Systems[M].Springer,2010.

[6]Shao Lingshuang,Zhang Jing,Wei Yong,et al.Personalized QoS prediction for web services via collaborative filtering[C]// IEEE International Conference on Web Services.2007:439-446.

[7]Zheng Zibin,Ma Hao,Lyu M R,et al.WSRec:A collaborative filtering based Web service recommender system[C]// Proceedings of the 2009 IEEE International Conference on Web Services.2009:437-444.

[8]刘克非,王红,许作萍.一种基于服务质量预测的Web服务选择方法[J].计算机技术与发展,2007,17(8):103-105.

[9]张金宏,宋杰.基于RBF 神经网络的Web 服务QoS 短期预测[J].辽宁工程技术大学学报(自然科学版),2010,29(5):918-921.

[10]Li Mu,Huai Jinpeng,Guo Huipeng.An adaptive Web services selection method based on the QoS prediction mechanism[C]// IEEE/WIC/ACM International Joint Conferences on Web Intelligence and Intelligent Agent Technologies.2009:395-402.

[11]Godse M,Bellur U,Sonar R.Automating QoS based service selection[C]// IEEE International Conference on Web Services (ICWS).2010:534-541.

[12]Cavallo B,Di Penta M,Canfora G.An empirical comparison of methods to support QoS-aware service selection[C]// Proceedings of the 2nd ACM International Workshop on Principles of Engineering Service-Oriented Systems.2010:64-70.

[13]Amin A,Grunske L,Colman A.An automated approach to forecasting QoS attributes based on linear and non-linear time series modeling[C]// Proceedings of the 27th IEEE/ACM International Conference on Automated Software Engineering (ASE).2012:130-139.

[14]Box G E P,Jenkins G M,Reinsel G C.Time Series Analysis:Forecasting and Control[M].John Wiley & Sons,2013.

[15]Tong H,Lim K S.Threshold autoregression,limit cycles and cyclical data[J].Journal of the Royal Statistical Society,Series B (Methodological),1980,42(3):245-292.

[16]石培基,胡科.等维灰数递补模型在人口预测中的应用[J].统计与决策,2008(6):12-14.

[17]王燕.应用时间序列分析[M].北京:中国人民大学出版社,2012.

猜你喜欢
灰色神经网络预测
无可预测
黄河之声(2022年10期)2022-09-27 13:59:46
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
浅灰色的小猪
神经网络抑制无线通信干扰探究
电子制作(2019年19期)2019-11-23 08:42:00
灰色时代
Coco薇(2017年2期)2017-04-25 17:59:38
她、它的灰色时髦观
Coco薇(2017年2期)2017-04-25 17:57:49
不必预测未来,只需把握现在
感觉
基于神经网络的拉矫机控制模型建立
重型机械(2016年1期)2016-03-01 03:42:04