摘要:现有Web服务器仿真流量预测由于对突发流量变化的适应性不足,存在相对偏差较大、置信水平较低等问题。文章提出基于改进Prophet模型的Web服务器访问流量预测方法。首先对Web服务器历史访问流量数据进行预处理,然后基于经验模态分解技术对数据进一步分解,提取频率特征明显的访问流量时间序列,最后应用改进Prophet模型分解访问流量时间序列,通过分量求和实现Web服务器访问流量预测。实验结果证明,应用该设计方法,相对偏差不超过0.1,置信水平不低于96%,可实现对Web服务器访问流量的精准预测。
关键词:改进Prophet模型;Web服务器;访问流量预测;经验模态分解
中图分类号:TP391.9" 文献标志码:A
0 引言
随着互联网的逐渐普及和广泛应用,万维网(World Wide Web,Web)服务器访问流量预测问题受到研究领域的重视与关注,众多学者开展研究并已经取得一定研究成果。如孟智慧等[1]提出基于堆叠的长短期记忆网络预测方法。该方法利用堆叠长短期记忆网络对流量数据学习,提取流量特征,根据特征预测未来某一时刻的流量值。田爱宝等[2]提出基于Transformer的预测方法。该方法利用Transformer模型通过自注意力机制自动提取输入流量序列中的特征,捕捉不同时间点之间的长期依赖关系,从而预测访问流量。以上方法在实际应用中存在相对偏差较大且置信水平较低等问题。针对上述研究的不足,本文开展基于改进Prophet模型的Web服务器访问流量预测方法研究。
1 Web服务器历史访问流量数据预处理与分解设计
在Web服务器日志文件中,每一条记录都包含有关访问活动的详细信息。为便于后续处理,在完成流量数据采集后,对其进行预处理,使其表示为x=(T,N,main)的形式。其中,x为预处理后的Web服务器历史日志数据;T为访问时间;N为Web服务器访问请求数;main为访问用户所在的区域。虽然经过预处理的数据已经较为干净和规整,但直接对其进行建模可能仍然面临挑战,现有线性模型难以准确捕捉其变化特征。因此,本文采用经验模态分解法完成流量数据分解。设Web服务器历史访问流量序列x存在局部极值特征,通过3次样条插值法构建Web服务器历史访问流量序列上包络线和下包络线,计算2条包络线均值,其表达式如下:
v(x)=[xmax(t)+xmin(t)]/2(1)
其中,v(x)为Web服务器历史访问流量序列上下包络线的均值;xmax(t)为流量序列上包络线;xmin(t)为流量序列下包络线[3]。然后,将均值从原始Web服务器历史访问流量序列中删除,得到一个分量f(t),其可表示为:
f(t)=x(t)-v(x)(2)
完成式(2)计算后,检查分量f(t)是否满足本征模态函数(Intrinsic Mode Function,IMF)分量的2个特定条件:第一,极端点数与过零点数相同或差一,过零点是曲线与纵坐标轴交点;第二,局部最大值与最小值包络线的均值在任意时刻为0[4-5]。如果满足,判断f(t)为一个IMF分量,从Web服务器历史访问流量序列中减去IMF分量,得到函数残差项r,以其为新流量序列。重复以上操作,得到最终Web服务器历史访问流量序列,可表示为:
x(t)=∑i=1f(t)i+ri(3)
其中,i为分解次数[6]。综上,完成Web服务器历史访问流量数据的预处理与分解,为后续流量预测奠定基础。
2 基于改进Prophet模型的流量预测
在得到Web服务器历史访问流量序列后,为解决传统Prophet模型对突发流量变化的适应性不足的问题,引入相关因素数据、历史相似数据进行改进,实现流量预测。将访问流量IMF分量输入改进Prophet模型,采用指数增长函数形式计算趋势项,可表示为:
y(t)=E1+exp[ef(t)-bf(t)](4)
其中,y(t)为Web服务器访问流量趋势项;E为改进Prophet模型容量;ef(t)为IMF分量中Web服务器访问流量增长率;bf(t)为IMF分量中Web服务器访问流量偏移率[7]。然后,通过傅里叶级数计算Web服务器访问流量季节项,可表示为:
c(t)=∑i=1R·f(t)/K(5)
其中,c(t)为Web服务器访问流量季节项;R为IMF分量中季节序列的周期;K为改进Prophet模型估计的系数参数。最后,通过指示函数计算Web服务器访问流量节假日项,可表示为:
h(t)=∑i=1Wf(t)k(6)
其中,h(t)为Web服务器访问流量节假日项;Wf(t)为节假日时间序列对应的IMF分量;k为节假日对访问流量的影响程度系数。将以上3个项相加,得到未来某一时间的Web服务器访问流量预测结果,可表示为:
p(t+j)=y(t+j)+c(t+j)+h(t+j)(7)
其中,p(t+j)为未来t+j时间Web服务器访问流量;j为预测时间量。通过以上步骤,完成基于改进Prophet模型的Web服务器访问流量预测。
3 实验论证
为验证所提基于改进Prophet模型预测方法的先进性,本文以某大学图书馆Web服务器为实验对象,收集服务器近1年内历史访问日志文件信息并将其作为数据样本,选取孟智慧等[1]提出的基于堆叠的长短期记忆网络预测方法、田爱宝等[2]提出的基于Transformer的预测方法,设置对比实验。应用3种方法进行未来1~8天Web服务器访问流量预测并与实际相比,计算其相对偏差及置信水平,多次测试取均值,得到统计结果如表1所示。
分析表1数据可知,本文设计的基于改进Prophet模型预测方法相对偏差不超过0.10,数值非常接近0,远低于孟智慧等[1]提出的基于堆叠的长短期记忆网络预测方法、田爱宝等[2]提出的基于Transformer的预测方法。应用本文设计的基于改进Prophet模型的预测方法,置信水平不低于96%,远高于孟智慧等[1]提出的基于堆叠的长短期记忆网络预测方法、田爱宝等[2]提出的基于Transformer的预测方法。由此可证明,本文设计的基于改进Prophet模型预测方法在预测精度方面具有优势,应用效果较好。
4 结语
为提高Web服务器访问流量预测精度,本文开展基于改进Prophet模型的Web服务器访问流量预测方法研究。通过本次研究可发现,这一方法在提升预测精度和稳定性方面取得了显著成效。该方法通过引入新的算法和技术手段对Prophet模型进行优化和改进,克服了原有模型在某些特定场景下的不足,使其更加适用于Web服务器访问流量预测任务,应用效果更优。
参考文献
[1]孟智慧,刘辉,刘伟信,等.基于堆叠长短期记忆网络的互联网流量预测[J].电信工程技术与标准化,2024(6):80-85.
[2]田爱宝,魏娇娇,肖军弼,等.基于Transformer的网络流量预测研究[J].信息技术,2024(4):156-160.
[3]郑佳芳,游贵荣.基于XGBoost和LSTM模型的高校招生网站流量预测研究[J].重庆科技学院学报(自然科学版),2023(5):45-50.
[4]陆勤政,朱晓娟.基于并行多尺度卷积记忆残差网络的物联网流量预测[J].廊坊师范学院学报(自然科学版),2024(1):33-41.
[5]蒋东浩,赵洪华,王真.基于EWT和Neural Prophet-MLP的蜂窝网络流量长期预测方法[J].现代信息科技,2024(6):52-57.
[6]马攀.基于ResNet-LSTM组合模型的网络流量预测研究[J].兰州文理学院学报(自然科学版),2024(2):45-50.
[7]刘洋,廉咪咪.基于深度学习的移动通信网络流量预测方法研究[J].长江信息通信,2024(2):90-92.
(编辑 王雪芬编辑)
Traffic prediction method of Web server access based on the improved Prophet model
LIU" Sujun, YANG" Guoying, DING" Jiayu, LI" Changsheng
(Lanzhou Petrochemical University of Vocational Technology, Lanzhou 730060, China)
Abstract:" Due to insufficient adaptability to sudden traffic changes, the existing Web server simulation traffic prediction has problems of relatively large deviation and low confidence level. Therefore, a Web server access traffic prediction method based on an improved Prophet model is proposed. The article first preprocesses the historical access traffic data of the Web server, and then further decomposes the data based on empirical mode decomposition technology to extract the time series of access traffic with obvious frequency characteristics. Finally, the improved Prophet model is applied to decompose the time series of access traffic, and the prediction of Web server access traffic is achieved through component summation. The experimental results demonstrate that the application design method can achieve accurate prediction of web server access traffic with a relative deviation of no more than 0.1 and a confidence level of no less than 96%.
Key words: improved Prophet model; Web server; access traffic prediction; empirical mode decomposition