基于时间序列的移动通信基站流量分析与预测

2021-07-30 02:38覃姜色张泽鹏靳宝霞
通信电源技术 2021年7期
关键词:残差基站噪声

覃姜色,过 锐,任 宇,张泽鹏,靳宝霞

(柳州工学院,广西 柳州 545000)

0 引 言

由于传统的数据分析、处理及预测方法已不能满足发展的需要,因此一种适合发展需要的研究方法应运而生。时间序列有3种重要形式,即AR、MA以及ARMA。实际计算表明,许多常见的时间序列可以用ARIMA序列来表示,而且从数学模型的角度来看,这些序列都是近似的[1]。在预测精度方面,对噪声进行了分析处理,只留下当前的白噪声。通过对噪声模型的详细分析和处理,不仅可以得到最优的线性预测,而且还可以得到各种概率情况的精确极限[2]。同时,利用该模型研究噪声的概率分布可以了解不同概率情况下的偏差大小,从而很好地解决随机干扰问题[3]。因此,时间序列模型被广泛应用于各种工程领域,如经济领域、通信领域、气象领域以及交通领域等[4]。

1 关于ARIMA序列的介绍

1.1 模型的描述

时间序列也称为动态序列,是通过按时间顺序排列某一现象指数值而得到的数值序列。时间序列分析可分为3个主要部分,即对过去的描述、分析规律以及对未来的预测[5]。根据时间和数字的性质分为时间序列和点时间序列。在时间序列中,数字元素反映了某一现象在某一特定时期内演变的结果。在点时间序列中,数字元素反映了某一现象在某一时刻的瞬时水平[6]。时间序列分析中使用季节分解、指数平滑以及ARIMA模型3种模型,并结合SPSS软件对时间序列数据进行建模。许多实际问题中所观测到的样本数据序列{Xt}(t=0,1,2,…)通常不是平稳序列,故本文进行了d次差分处理得到平稳的差分序列,从而可用平稳序列模型来进行研究[7]。

1.2 数据的预处理

本文数据来源2020年Mathor Cup大数据比赛所给的某地块2018年3月—4月通信基站流量数据。面对庞大的通信基站流量数据,首先利用Python对数据文件进行了分割。通过观察,发现所有的数据都是按日期组织的,但是一天中不同时间的数据是无序的。通过提取地块编号得到需要编列经费,用来记录的上游和下游的交通日期是2018年3月1日—4月19日,共50天,每天24 h。

2 模型建立与预测

2.1 模型的参数估计

对于满足ARIMA(p,d,q)模型的样本数据序列{Xt}(t=0,1,2,…)进行d次差分后,差分算子的阶数d通常取0或1,一般不超过2,便可以得到ARIMA(p,q)序列。数据经过转化之后,可以用ARMA模型的参数估计方法对处理后的数据进行建模[8]。

为了建立一个合适的ARIMA模型,首先要对模型进行初步识别。模型类别可以根据自相关函数和部分相关函数的延迟或截断来确定,然后应用BIC信息标准来确定订单。对于所采用的模型参数的估计可以使用残差分析和拟合度分析进行线性拟合。在时间序列模型建立之后,对该模型进行合理检验和预测,可以采用χ2统计检验法来检验,并确认拟合模型的残差是否为白噪声,如果是则该模型通过考核,否则需要重新对该时间序列模型进行识别估计[9]。

2.2 建立ARMA模型

2.2.1 定义模型

设d是非负整数,称Φ(B)∇dXt=Θ(B)εt是关于{Xt}的一个ARIMA(p,d,q)序列,其中Φ(B)和Θ(B)是两个分别次数为p和q的特征多项式(p、q均为正整数),表达式分别为:

式中,B是延迟算子,有:

∇d为d阶差分算子,有:

εt为高斯白噪声序列,服从W~N(0,σ2)分布。

2.2.2 残差分析

因为本文分析的模型是ARIMA模型,所以ACF和PACF都显示出重要的价值。ACF可用于估计MA部分(即q值),PACF可用于估计AR部分(即P值)。残差分析结果如图1和图2所示。

图1 残差的ACF分析图

从残差的ACF和PACF图形中可以看出,自相关函数呈现出典型的拖尾性,说明数据的自相关性随时间间隔下降,偏自相关系数也在两倍标准差范围内波动。据此可判断该序列具有短期相关性,进一步确定序列平稳。模型拟合的统计量中,决定系数R方为0.596,说明模型拟合效果较好,并且杨-博克斯得出的显著性系数为0.595,即统计量观测值显著,模型拟合效果良好。认为残差是白噪声序列说明时间序列中有用的信息已经被提取完毕,剩下的全是随机扰动,无法预测和使用。残差序列如果通过了白噪声检验,则建模就可以终止。因为没有信息可以继续提取,所以一元ARMA模型中的循环波动能够很好的识别本例中的移动通信基站流量数据。

2.2.3 模型的拟合度分析

贝叶斯信息准则(Bayesian Information Criterion,BIC)由Schwarz提出,它与AIC准则相似,也是用于模型选择。当增加参数k的数量时,就增加了模型的复杂度,似然函数也会增大,与AIC相似,也易导致过度拟合的现象。针对此现象,AIC和BIC的处理方式相似,都引入了与参数相关的惩罚项,但是BIC的惩罚项相对AIC而言会更大一点。通过考虑样本量,样本量较大时,就能有效解决由于模型精度过高导致复杂度也较高的问题[10]。

BIC的一般表达式为:

式中,k表示的是模型中参数的个数,L表示的是对数似然函数,n是样本量,kln(n)表示惩罚项。得到模拟拟合度及相关参数如表1所示。

表1 模拟拟合度及相关参数

根据分析可知,本文的正态化BIC是-8.271,在所有模型中它的值最小,说明拟合度比较好。平稳R方为0.596,说明模型解释的变化幅度适中,所以这个模型最适用。

2.3 模型的预测

对所建立的模型进行检验,用SPSS软件对模型参数进行估计后,其模型的残余量用统计检验,可以认为该模型的残余量是白噪声,所以该模型通过考核。本文只针对上层流量变化进行了分析,模型能很好地模拟仿真真实的基站流量,并对未来的预测也可以达到比较精确的预测效果,且预测的结果在可信区间范围内。

3 结 论

现实中一些对移动通信网络数据分析的相关工作中指出相邻基站之间并不是孤立的,而是存在着必要的联系。利用相邻基站的历史信息可以减少基站负载预测的不确定性,经过剔除趋势项和其他的影响因素后可以得到一个短时相关的随机流量时间序列。由于对短时相关随机流量时间序列的研究非常成熟和完善,因此通过该方法可以得到较为精确的宏观网络综合业务量的预测模型。用ARIMA模型分析移动基站流量可以从宏观上把握移动基站的发展轨迹、成长趋势以及在一定尺度下的流量特征。本文就是基于这种模型对移动基站流量进行模拟仿真,并且该模型可以实时预测未来流量,以提高基站管理员对流量监控管理的效率,从而达到提高服务质量的最终目的。

猜你喜欢
残差基站噪声
舰船通信中的噪声消除研究
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
5G基站辐射对人体有害?
基于深度卷积的残差三生网络研究与应用
5G基站辐射对人体有害?
汽车制造企业噪声综合治理实践
基于移动通信基站建设自动化探讨
可恶的“伪基站”