二元时间序列模型预测3G网络接通率

2015-05-05 07:21张丽翠黄丽平
吉林大学学报(信息科学版) 2015年2期
关键词:模糊化性能指标差分

王 喆,张丽翠,黄丽平

(吉林大学 a.通信工程学院; b.计算机科学与技术学院,长春 130012)



二元时间序列模型预测3G网络接通率

王 喆a,张丽翠a,黄丽平b

(吉林大学 a.通信工程学院; b.计算机科学与技术学院,长春 130012)

为提高对网络性能预判的准确度,提出了运用多元时间序列的相关性计算方法,时间序列的模糊化方法和模糊规则矩阵的构建方法,建立了一种基于二元时间序列的接通率预测模型,将拥塞率序列融入到对接通率的预测过程中。该方法克服了传统网络性能指标预测方法中,只考虑单一时间序列,不考虑其他变量与待预测变量的相关性的弊端。仿真实验结果表明,该模型能够实现网络接通率的有效预测,为网络性能综合预测提供理论基础和新方案。提高了预测精度。

接通率预测; 模糊时间序列; 二元预测模型; 3G网络性能

0 引 言

随着通信网络的发展,网络承载技术已不再是提高网络运营效率的关键,而网络性能管理越来越受到广泛关注。网络性能预测是网络管理的关键技术手段,常用的线性时间序列预测的预测模型有前馈型神经网络模型、马尔科夫链预测模型[1]和高斯过程回归模型[2]。这些预测方法没有考虑其他数据序列对预测的影响。时间序列预测方法被广泛地应用于金融领域,在网络性能领域中多应用于对网络流量的预测[3,4]。模糊时间序列预测模型能较好地适应网络状态参数高维、非线性等特点,可提高预测精度。但传统模糊时间序列预测方法都只针对单变量,没有考虑其他变量对待预测变量的影响。文献[5]中的ARIMA(Autoregressive Integrated Moving Average Model)模型,其计算精度随模型的阶数增高而增大,模型的阶数在3阶以上才能实现有效预测,即其计算复杂度是模型阶数的指数级。

笔者提出了基于模糊时间序列的二元预测模型,并可用于对3G网络性能的预测中,其计算复杂度与模型的阶数是线性关系。建立该模型主要包括以下几个步骤: 序列间相关系数计算;时间序列差分平稳化;序列模糊化;模糊关系建立;预测并去模糊化;由差分序列预测结果到待预测序列预测结果的计算。笔者提出的二元时间序列预测模型,考虑了其他性能指标对某项性能指标时间序列的影响,在O(n)复杂度下得到较高的预测精度。最后,通过仿真实验验证该模型对接通率预测的有效性。

1 二元时间序列相关性计算

受基于滑动窗口及局部特征的时间序列符号化方法[6]的启发,笔者利用符号化的统计向量空间法(SSVS: SAX Statistical Vector Space)求3G网络中不同性能指标时间序列的相关性。首先,采用SAX(Symbol Aggregate Approximation)方法[7]对时间序列进行符号化,得到符号序列。然后,对符号序列进行特征统计,得到对应的特征向量。最后计算两个特征向量的余弦距离,并作为对应的两个时间序列的相似度。3类统计特征结果分别是: 等概率区间的频数统计特征;相邻两个数据大小关系的统计特征;相邻3个数据大小关系的统计特征。针对第1类统计特征进行符号化的具体做法是: 先对样本中的数据进行等概率区间划分,设划分数为m,划分的区间记为I1,I2,…,Im,对时间序列中的每个数据用其所属的区间表示;然后统计等概率区间Ii出现的特频数。由3类统计特征得到符号化序列,特征向量长度为m+3+9,特征向量的表达形式为:I1,I2,…,Im,<,=,>,<<,<=,<>,=<,==,=>,><,>=,>>。设两个特征向量p,q长度均为n,其相关性由公式

确定。即两个向量的夹角余弦值越大,向量的相关性越大。

2 二元时间序列预测模型

2.1 平稳时间序列模糊化

对于非平稳时间序列S,采用差分方法对其进行平稳化预处理,得到平稳序列Q,其计算公式为Q(t)=S(t+1)-S(t)。

笔者采用FCM(Fuzzy C-Means)聚类方法对平稳时间序列进行模糊化,模糊化结果用模糊子集表示时间序列中的每个元素。设时间序列Q长度为n,最大、最小值分别为Dmax和Dmin,σ为序列的标准差,则定义论域U=[Dmin-σ,Dmax+σ]。聚类数

聚类得到的k个聚类的聚类中心,记为ci(i=1,2,…,k),和序列的最大、最小值按从小到大的顺序排序,构成序列Dmin,c1,c2,…,ck,Dmax。取相邻两个聚类中心的中点,记为c1,2,c2,3,…,ck-1,k,和序列的最大值最小值构成k个模糊区间Ci(i=1,2,…,k)。对序列Q进行模糊化,即对序列中的每个元素,用其所属的模糊区间表示,即得模糊时间序列。

2.2 模糊关系建立与二元时间序列预测

笔者的二元时间序列预测主要包括以下几个步骤: 序列间相关系数计算;时间序列差分平稳化;序列模糊化;模糊关系建立;预测并去模糊化;由差分序列预测结果到待预测序列预测结果的计算。

笔者使用二元时间序列预测,设平稳时间序列分别为Q1,Q2,模型为3阶,即任意预测点的值只与该预测点的前3个值有关。利用模糊化的序列建立模糊矩阵M,其中矩阵中每一行长度为7,前3位为序列Q1中的一组连续3个数据,第4位至第6位为序列Q2中对应时刻的一组连续3个数据,第7位为学习预测结果,矩阵行数为n-2。预测过程就是用待预测变量的模糊化变量与模糊规则矩阵进行匹配的过程,匹配公式如下

其中λ为常量常数。

采用重心法对预测结果去模糊化[8],得到Q1序列的预测值。设模糊区间Ci对应的模糊中心为ci,则预测结果如下

其中Pr(i)为匹配过程中模糊子集Ci出现的频数。利用差分序列预测结果计算原始序列S在时刻t的预测值,其计算公式如下

3 实验结果

实验数据来源于中国移动公司某分公司的TD-SCDMA(Time Division-Synchronous Code Division Multiple Access)网络运行接通率性能指标和拥塞率性能指标的历史数据。接通率和拥塞率样本空间大小为166,采集粒度为0.1 h,接通率和拥塞率样本如图1所示,对两个序列进行一次差分,其结果如图2所示。

图1 接通率和拥塞率时序图Fig.1 The switch rate and congestion rate timing diagram

图2 接通率和拥塞率差分结果时序图Fig.2 The switch rate and comgestion rate when search results timing diagram

图3 预测结果与原始值对比Fig.3 The prediction results with the original value of contrast

从图1可以看出,大多数情况下,接通率的极小值和拥塞率的极大值相对应,直观地反映了接通率和拥塞率两个变量之间的相关性。实验过程中,取λ=1,计算两个差分序列的特征向量相关系数为0.979。预测结果如图3所示,最大误差0.017,平均相对误差0.005 1,MMSE=3.569 9×10-7,RRMSE=0.000 597。

4 结 语

笔者通过研究时间序列的相关性计算方法,平稳化方法和模糊化方法,提出一种二元时间序列预测模型,并用于3G网络接通率性能指标的预测。克服了传统网络性能指标预测方法中,只考虑单一时间序列,不考虑其他变量与待预测变量的相关性的弊端。实验结果表明,笔者的预测模型能实现对接通率的有效预测,可以推广到其他网络性能指标的预测中,为3G网络性能预测方法提供了新思路。

[1]YAO Qifu,LI Cuifeng,MA Hualin.Novel Network Traffic Forecasting a Algorithm Based on Grey Model and Markov Chain [J].Journal of Zhejiang University: Science Edition,2007,34(4): 396-400.

[2]HUANG Liping,SUN Yongxiong,SHEN Chen.Applying Gaussian Process Based on Median Filtering in 3G Network Performance Prediction [J].Compter Engineering and Applications,2013,49(2): 126-129.

[3]ZHANG Bin,YANG Jiahai,WU Jianping.Survey and Analysis on the Internet Traffic Model [J].Journal of Software,2011,22(1): 115-131.

[4]WEN Xiangxi,MENG Xiangru,MA Zhiqiang,et al.The Chaotic Analysis and Trend Prediction on Small-Time Scale Network Traffic [J].Atca Electronica Sinica,2012,40(8): 1609-1616.

[5]ZHANG Ran,ZHAO Chenglong.Application Research on Network Traffic Predection Based on ARIMA [J].Computer Simulation,2011,28(2): 171-174.

[6]TAN Hongqiang,NIU Qiang.Symbolic Representation Algorithm for Time Series Based on Sliding Window and Local Features [J].Application Research of Computers,2012,29(1): 12-18.

[7]YANG Hui,MENG Fanxing.Application of Improved SAX Algorithm to QAR Data [J].Journal of Computer Applications,2012,32(5): 1484-1487.

[8]LIN Yupei,YANG Yiwen.Sock Market Forecasting Model Based on Fuzzy Time Series Model [J].Statistics and Decision,2010(8): 34-37.

(责任编辑: 刘东亮)

Connection Rate Prediction Method by Bivariate Time Series

WANG Zhea,ZHANG Licuia,HUANG Lipingb

(a.College of Communication Engineering; b.College of Computer Science and Technology,Jilin University,Changchun 130012,China)

In order to improve the accuracy of network performance pre judgment,proposes a prediction model based on time series connected to two yuan rate,congestion rate sequence into the prediction process of docking pass rate.The calculation method of correlation using multivariate time series,fuzzy time series method and construction method of fuzzy rule matrix.The method overcomes the disadvantages of traditional network performance prediction method,considered only a single time series,without considering the drawbacks of other variables and forecast variables correlation of.Simulation results show that,the model can efficiently predict the network connection rate,provides the theory basis and the new scheme for comprehensive prediction of network performance.

connection rate prediction; fuzzy time series; bivariate prediction model; performance of 3G networks

1671-5896(2015)02-0219-04

2014-09-09

王喆(1989— ),男,长春人,吉林大学硕士研究生,主要从事通信网理论研究,(Tel)86-18004302421(E-mail)wangzhe-wzwzwz@126.com; 张丽翠(1967— ),女,长春人,吉林大学副教授,硕士生导师,主要从事通信网理论研究,(Tel)86-431-85152013(E-mail)21c67961@163.com。

TP393

A

猜你喜欢
模糊化性能指标差分
([0,1],[0,1])-模糊拟阵的基和秩函数
数列与差分
沥青胶结料基本高温性能指标相关性研究
餐饮娱乐空间的“边界模糊化”态势探讨——餐饮娱乐空间设计专辑
三角模糊数去模糊化对VIKOR妥协解的影响研究
储热水箱分层性能指标的研究进展
WebGIS关键性能指标测试技术研究
基于差分隐私的大数据隐私保护
相对差分单项测距△DOR
磁共振成像仪主磁场计量性能指标的选择