基于曲线拟合的分组域业务分析模型及算法实现

2016-10-26 01:32黄海周灵
现代计算机 2016年23期
关键词:曲线拟合分组预测

黄海,周灵

(1.广东第二师范学院,广州510000;2.佛山科学技术学院计算机系,佛山528000)

基于曲线拟合的分组域业务分析模型及算法实现

黄海1,周灵2

(1.广东第二师范学院,广州510000;2.佛山科学技术学院计算机系,佛山528000)

对电信移动网络而言,分组域业务分析模型及算法研究是一个崭新的领域。基于曲线拟合研究分组域业务分析预测模型;并进行算法设计与实现。同时,利用移动分组域监控系统的实时测量数据,实现分组域业务分析预测原型,进行3G用户激活附着比、Gn口流量统计的分析和预测。结果表明,利用曲线拟合进行移动分组域的业务分析正确且有效。

分组域;曲线拟合;业务分析;实验测量;算法模型

1 移动分组域网络演化

随着移动通信新业务和IP技术的迅猛发展,数据通信和多媒业务在GSM移动通信中日益增多,甚至超过传统的语音话务量而成为移动通信网的主要承载业务。因此,国际通信标准化组织对电信移动通信网进行了扩展,在传统电路域(Circuit Switch,CS)的基础上引入了GPRS、EPC分组域(Packet Switch,PS)。相对CS域而言,GPRS分组交换实现了同一信道由几个用户共享,极大地提高了无线资源的利用率,数据通信可以实时在线并按流量计费;EPC系统则以GPRS分组交换技术为基础进一步演化而来,定位于构建高速率、低延迟、数据PS化、可移植、支持多种无线接入技术的3G移动通信系统新标准[1]。就体系结构而言,移动通信PS域包括2G/3G/4G分组域和EPC(LTE核心网)两个部分;其中,2G/3G/4G分组域网元包括:服务GPRS支持节点SGSN、网关GPRS支持节点GGSN、HLR、CG;EPC分组域的网元包括:MME、SAE-GW、PCRF、CG等。

传统GSM通信系统的业务分析离不开话务模型,设立话务模型的目的是统计、分析并预测话务量的现状和发展,进而进行相关容量等网络参数规划。PS域分组交换技术引入通信系统之后,“话务模型”概念改成“业务模型”概念,无法使用传统的经验公式或者爱尔兰查表法来确定PS域的业务量、设备容量和通信业务QoS之间的关系[2]。现有PS域业务模型的建模与规划,主要是通过实验室数据,并结合国内外运营商经验,确定用户业务模型关键参数,基本上是基于用户的模型,主要包括用户附着激活比、同时使用业务用户比例、每使用业务用户平均流量、用户平均数据包长等;与设备性能和接口流量无关。因此,分组域业务分析模型的建立与算法实现属于崭新的研究领域,没有成熟的方法和模式,这些新情况、新问题尚待研究。

本文基于曲线拟合研究了PS域业务分析预测模型;并进行算法设计和软件系统开发;同时,利用移动PS域监控系统的实时测量数据,实现PS域业务分析预测系统的原型;并对特定网元的3G用户激活附着比、Gn口流量统计进行了分析预测。

2 曲线拟合的业务分析预测模型

业务分析是PS域网络分析的重要组成部分。数学方面的分析预测方法有很多,进行数据分析预测应该根据应用的不同领域,还要根据当时的实际情况和不同的分析预测要求,在合理分析的基础上选择合适的分析预测模型;同时,还有充分考虑各种外围因素对预测效果的影响。曲线拟合通过建立一个自变量(例如预测对象)与相关随机变量(例如时间变量)的回归分析模型,来分析预测相关随机变量的未来值。如根据历史数据的观察与初步分析,寻求某两个变量之间的合理关系,进而对未来的趋势和数据进行预测[3]。

定义1给定数据点(xi,yi)(i=0,1,2,3,…,m),存在函数(φ为多项式函数类),使得:

则函数Pn(x)为拟合函数。当拟合函数为多项式时,称为多项式曲线拟合。

下面,我们将曲线拟合引入到移动PS域业务分析预测模型中,并进行业务数据预测。假设有实验数据系列(xi,yi),计算曲线拟合多项式函数时,可以先写出正规方程组,再求解多项式系数序列(a1,a2,…,an),从而得出多项式函数。正规方程组可以用矩阵形式表示如下:

根据移动PS域监控系统的实时测量数据,可以从后台的网管系统中获取一段时间内(例如1×24小时、7×24小时、1个月甚至1年内)的实验测量数据,记为:(xi,yi)(i=1,2,3,…,m),xi、yi表示任意一次的实验数据,m为实验次数,即样本容量。利用这些数据,根据曲线拟合的多项式最优解原理,可以计算拟合多项式的系数序列(a0,a1,a2,…,an)。

例如,假设一次拟合函数如下:

其中Y是预测对象,x是主要影响因素,a0、a1为回归常数,ε为回归余项,ε∝N(0,σ2);对矩阵正规方程进行化简,得到两个以a0、a1为参数的方程:

求解这个方程组可得系数a0、a1,表示如下:

3 算法设计与实现

下面给出算法设计与实现的主要内容,包括数据输入、输出、算法主要步骤以及算法实现的数据结构等关键问题。

输入:实验数据(xi,yi)(i=1,2,3,…,m),指定时间xi+1,xi+2,xi+3等;

输出:根据指定的时间值输出对应的预测数据yi+1,yi+2,yi+3等。

主要步骤如下:

步骤1:采集网络测量数据。包括附着用户数、激活用户数、Gn/Gi/GB/IuPS口流量、防火墙会话数等分组域系统运行的关键参数,以小时为粒度,从后台网管系统进行数据采集;

步骤2:数据预处理。将步骤1提取出的各关键参数对应的统计数据分别按时间先后顺序分别组成n个时间序列,并对时间序列进行异常数据、噪声点识别消除;

步骤3:获取预测所需的测量数据。从预处理后的数据表中获取预测所需的历史测量数据:(xi,yi)(i= 1,2,3,…,m);

步骤5:求解系数系列(a1,a2,…,an)。相对一次拟合而言,即求解a0、a1:

步骤6:计算确定拟合函数。根据步骤5计算的a0、a1,确定拟合函数Y=a0+a1x;

步骤7:进行数据预测。根据指定的xi+1,xi+2,xi+3等计算对应的预测值yi+1,yi+2,yi+3等。

步骤8:进行网络容量预测,并分析网络压力点。若达到网络压力点,启动相应设备扩容。

算法的实现涉及到一些软件系统设计与工程方面的问题,有的是软件系统开发方面的共性问题,在此不讨论;有一些是本PS域业务分析和预测算法设计特有的问题,主要有三个方面。

关于网络测量数据的处理。获取的历史测量数据为原始的网管数据集,导入到数据库中,按照系统功能需求,设计多个表,保存在数据库表中。不用按大小排序,只需按时间顺序保存即可,并进行数据预处理。

关于数据分析和预测的呈现方式,有两种情况。一是每天只预测业务量忙时的最大值;另一种是按照样本数据每小时进行一次预测,按照相同时间点的数据系列进行预测,数据误差相对较小。再从数据库或者变量中读取数据,在坐标区域用曲线标示[4]。

4 业务分析预测结果

从移动分组网监控系统获得的PS域业务数据,因为个体数据的敏感性,只获取两天的统计数据,且仅供本PS域网络分析预测研究使用[5]。从网管系统获得的历史数据内容和存储方式比较繁杂,经处理后主要包括:测量时间、网元名称、3G用户附着数、3G用户激活数、Gn口流量、GB口流量等。

以Java为开发语言,使用SQL Server作为后台数据库,实现了曲线拟合业务模型和算法。利用这个原型系统对PS域业务进行分析预测,主要进行了SGSN网元的3G用户激活附着比、Gn口流量统计两个方面的分析,具体实验结果如图1、图2所示。绘制的曲线图是PS域3天的网络分析数据(用红色虚线分开表示),横坐标的前两天(2×24小时)为历史数据分析,第三天(1×24小时)为未来数据预测。

从图1可以看出,3G用户激活附着比符合移动网络PS域的历史实际情况。在每天的凌晨3-5时为最小值,白天10-18时比较稳定,为全天的最大值;函数值全天在0.25-0.4之间变化,忙闲时规律明显,并根据前两天的历史测量数据预测了的第三天的3G用户激活附着比业务量。对于Gn口的流量统计,可以从图2进行类似分析。

图1 3G用户激活附着比图

图2 Gn口流量统计图

5 结语

本文研究了基于曲线拟合的PS域业务分析及预测模型;并进行了算法设计和软件系统开发。同时,利用移动PS域监控系统的实时测量数据,实现了PS域业务分析预测系统的原型,进行了3G用户激活附着比、Gn口流量统计的分析和预测。结果表明,利用曲线拟合进行PS域移动通信业务的分析与预测是有效的,应该进一步研究和在线实验测试。

[1]TS 23.401.General Packet Group Service(GPRS)Enhancements for Evolved Universal Terrestrial Radio Access Network(E-UTRAN)Access[S],LTE,2009,06.

[2]刘增基,鲍民权,邱智亮编著.交换原理与技术[M].人民邮电出版社,2014.8.

[3]袁野,孙迪科,张荣.网络融合背景下的移动分组域网络负荷指标关联模型研究[J].移动通信,2015.1.

[4]Ling Zhou,De-feng Zhang.Least Energy-Consumption Real-Time Routing Algorithm Based on Event Sensitive Node Set[J].Journal of Communications,2014,07.

[5]中国移动通信有限公司.2G/3G/4G融合核心网统一标准模型[S],2014.12.

Model and Algorithm for Capacity Analysis in Packet Switch Based on Curve Fitting

HUANG Hai1,ZHOU Ling2
(1.Guangdong University of Education,Guangzhou 510000;2.Department of Computer Science and Technology,Foshan University,Foshan 528000)

To the mobile telecommunications networks,capacity model and algorithm design for packet switch is a new research field.Studies the capacity analysis model for packet switch based on curve fitting and develops its prediction algorithm.At the same time,the prototype system for capacity analysis and data prediction is achieved by using real-time measuring data from monitoring and control system of mobile telecommunications networks.Analysis and prediction experiments are done about 3G subscriber ratio and rate of flow in Gn port. The experiment results show that it is correct and efficient to use curve fitting to design capacity model and algorithm for packet switch in mobile telecommunications networks.

Packet Switch;Curve Fitting;Capacity Analysis;Experiment;Algorithm Model

广东省教育厅青年创新人才资助项目(No.2015KQNCX109)

1007-1423(2016)23-0016-04DOI:10.3969/j.issn.1007-1423.2016.23.004

猜你喜欢
曲线拟合分组预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
基于MATLAB 和1stOpt 的非线性曲线拟合比较
浅谈Lingo 软件求解非线性曲线拟合
分组搭配
怎么分组
曲线拟合的方法
分组