空间信息网络业务建模*

2016-04-13 06:03:59张更新杨晗竹
通信技术 2016年1期

魏 伍,张更新,吕 晶,杨晗竹

(解放军理工大学 通信工程学院,江苏 南京 210007)



空间信息网络业务建模*

魏伍,张更新,吕晶,杨晗竹

(解放军理工大学 通信工程学院,江苏 南京 210007)

摘要:网络业务建模可用于进行业务的预测,对于卫星这种带宽受限的通信系统尤为重要。针对空间信息网络业务的特点,介绍了一种分形对数正态噪声(FLN)与Poisson模型相叠加的模型。该模型既具有自相似性也有短相关性。其中分形对数正态噪声(FLN)是分形高斯噪声(FGN)的转变,其统计特性可以根据流量和数据源特性进行任意的调节,比较精确灵活。Poisson模型作为最经典的业务模型,适用于短相关性,易于实现。

关键词:分形对数正态噪声(FLN);Poisson模型;空间信息网络

0引言

随着卫星技术的发展和日益增长的客户需求,卫星通信系统不仅承载低速的数据及话音(64kb/s以下)而且需要支持图像、声音、视频相结合的全新、高速率、交互式的宽带多媒体业务。很多学者提出了空间信息网络[1]的概念,由多颗不同轨道上、不同种类、不同性能的卫星形成星座覆盖全球,通过星间、星地链路将地面、海上、空中和深空中的用户、飞行器以及各种通信平台密集联合,以IP为信息承载方式,采用智能高速星上处理、交换和路由技术,面向光学、红外多谱段的信息,按照信息资源的最大有效综合利用原则,进行信息准确获取、快速处理和高效传输的一体化高速宽带大容量信息网络,即天基、空基和陆基一体化综合网络。

而空间信息网络重点强调天基与空基的网络传输。它是以多种空间平台(如同步卫星或中、低轨道卫星、平流层气球和有人或无人驾驶飞机等)为载体,实时获取、传输和处理空间信息的网络系统。其系统组成如图1所示。作为国家重要基础设施,空间信息网络在服务远洋航行、应急救援、导航定位、航空运输、航天测控等重大应用的同时,向下可支持对地观测的高动态、宽带实时传输,向上可支持深空探测的超远程、大时延可靠传输,从而将人类科学、文化、生产活动拓展至空间、远洋、乃至深空。

空间信息网络业务主要包括常规通信业务和一些特殊的通信业务。其中,常规通信业务流量与现今的Internet网络业务流量并无差别,呈现出一种自相似的特性。特殊业务包括短突发信息和不间断的通信业务。短突发信息呈现一种短程相关性;而持续不断的信息在统计特性上不会改变其余信息的特性。

综上所述,空间信息网络业务流量兼具自相似性与短程相关性,对此本文提出了一种叠加式的模型模拟空间信息网络业务。

1网络业务流量特性分析

1.1自相似性与长程相关性

1994年,Leland发现网络业务数据呈现出的特性[2]与以往电话网络流量数据具有非常大的差异,称之为自相似特性。这种特性描述了局部与局部,局部与整体在形态,功能,信息,时间与空间等方面具有某种意义的相似性。对于自相似性过程有如下定义[3]:

var[X(m)(n)]=m2H-2σ2

(1)

则称随机过程X(t)为Hurst指数是H的严二级自相似性。对于自相似序列0.5

(2)

则称随机过程X(t)为指数是H的渐进二级自相似性。

如果宽平稳过程X(t)的自相关函数r(k)在0.5

r(k)~ck-β,k→∞,0<β<1

(3)

即自相关函数下降缓慢,不可和。则称该过程是长程相关的。

在0.5

1.2非高斯的长程相关过程

为了计算网络流量包括IP包的到达过程,通常用{(tl,Al),l=0,1,2,…}来描述某个IP包,tl代表了lth包的到达时间戳,Al是该包的属性(包括负载,源端口,目标端口等)。长期以来,人们一直认为这种到达的过程不同于简单的标准泊松或更新过程。包到达时间的间隔并不是独立的显示出错综复杂的相关结构。它可以使用非平稳点过程或平稳的马尔科夫调制点过程建模。但是,鉴于数据包的数量庞大的这些模型将产生巨大的数据集。因此更倾向于使用比特或包的聚合计数过程[4],记作WΔ(k)和XΔ(k)。它们包括了在kth的窗口大小Δ内(即时间戳kΔ

从定义可知,XΔ(k)是正随机变量。而经典的正随机变量分布(单边)有指数,对数正态,Weibull或Gamma分布。由数据可知,Poisson与指数分布只适合于小聚合尺度Δ的边缘分布,而在大聚合尺度的情况下,高斯分布的拟合程度也不尽人意。这里日本WIDE项目中的MAWI与中国科学院计算技术研究所的出口链路数据,以及美国计算机协会的数据源进行分析。

(a)0.1 s

(b)0.4 s

(c)0.8 s

Distributionparameterμ/aσ/bMSELog-normal(0.1s)3.302020.4781716.104e-04Gamma(0.1s)4.588116.62919.408e-04Weibull(0.1s)34.41812.079480.0027Log-normal(0.4s)4.659070.3893661.275e-04Gamma(0.4s)6.6115317.24964.187e-04Weibull(0.4s)128.4842.408660.0010Log-normal(0.8s)5.340060.3554261.028e-04Gamma(0.8s)7.8465528.36232.541e-04Weibull(0.8s)249.8152.592965.965e-04

从上述的数据(http://ita.ee.lbl.gov/)可以看出实际的流量数据并不是高斯的,而更接近对数正态分布,由于这种性质,接下来提出一种分形对数正态噪声(FLN)时间序列。

2网络业务流量模型

自相似业务模型按模型产生方式分为物理模型和统计模型。物理模型是根据物理意义建模,模型在精度和灵活性方便没有在统计特性下建立的模型好,这类模型能够有助于我们理解网络产生自相似的原因。统计模型是根据分形理论,从流量统计特性下表现出的性质方面入手,建立进行仿真,这类模型比较精确和灵活,但没有明确的物理含义。目前应用中使用较多的是ON/OFF,分形布朗运动(FBM)[5],分形高斯噪声(FGN),FARIMA[6]等。

FBM是从一般布朗运动扩展而来,用来描述自相似随机过程,BH具有三个特性:①高斯过程;②增量过程是一个平稳的随机过程;③标度不变性。

FGN是FBM的增量过程,记作GH,

GH[i]=BH[i]-BH[i-1]

(4)

FGN是零均值,高斯,稳定的,所以它的自相关函数为:

(5)

σ2是FGN的方差。对于H>1/2,rGH[k]是非负的。由上文可知实际业务的边缘分布是对数正态分布,FGN是高斯的,所以可以将FGN直接转化为FLN(分形对数正态噪声)。

一个高斯离散数列,XG(n)可以转换为对数正态分布序列XL(n),需要用到下列关系:

XL(n)=eμG+σGXG(n)

(6)

μG和σG分别是高斯分布的均值和标准差。

(7)

式中,μL是对数正态分布的均值,cv=σG/μG是它的变异系数。这样从FGN变换到FLN,其Hurst值并没有改变。

这里使用一种循环嵌入(CEM)的算法构造FLN序列。步骤如下:

(1)R为N×N的FGN矩阵的自相关矩阵,Rpq=r[|p-q|]=r[k],k=0,1…,N-1。将其嵌入一个2M×2M的矩阵S,M=N-1。

s[k]=r[k],k=0,1,…N-1

(8)

s[2N-2-k]=r[k],k=0,1,…,N-2

(9)

(3)生成2(N-1)个复向量x=x1+ix2,其实部与虚部都服从N(0,I)。

(5)利用式(6)将FGN变换成FLN。

图2是用该方法产生的FLN序列。将数据进行R/S分析,图3中的斜率即为Hurst值,其值与95%的致信区间是0.86(0.8598,0.8612),显示该序列确定具自相似性,且程度高。图4为边缘分布的拟合图与拟合数据,表明FLN的边缘分布更接近对数正态分布。

图2 FLN图

图3 FLN的R/S图

SSER-squareAdjustedR-squareRMSERS0.0056430.99940.99940.007627

图4 FLN的边缘分布

Distributionparameterμ/aσ/bMSELog-normal0.00938220.06620660.0844Gamma227.2070.00445250.0937Weibull1.038969.673730.5901

在空间信息网络中,短相关业务也是不可或缺的,可以用泊松模型[7]来实现的,泊松过程如下式所示:

(10)

式中,A(t)代表0~t时间内包的到达总量,λ是包到达平均速率。该式的意思是0~τ时间段内包到达数n的概率。在泊松过程中,两个互不相交时间段内到达的个数(即随机数)之间是互相独立的。由泊松过程理论可知:假设第k个包到达的时间为t1,k+1个包到达的时间为t2,其相应的包到达时间间隔序列T呈复指数分布,即P{T

图5 Poisson模型

对数据进行R/S分析,其斜率与95%置信区间为0.503 2 (0.495 2, 0.511 2),已无明显的自相似性。

综上所述,空间信息网络业务可以用FLN与Poisson模型相叠加产生。

3结语

文章对空间信息网络业务的特性进行了阐述,通过数据说明了实际自相似业务一般不是高斯的,对于非高斯的边缘分布,数据显示其更近似于对数正态分布。而分形高斯噪声(FGN)模型的统计属性易于改变,且与对数正态分布有一定的数学转换关系,所以选择将FGN转变为FLN,并证明转变后自相似性并没有改变,边缘分布与对数正态分布的拟合程度较高,所以认为FLN是可行的。短相关模型可以用典型的Poisson模型实现。所以,空间信息网络可以用FLN与Poisson模型叠加产生,为下一步业务的预测[8]与带宽分配做准备。

参考文献:

[1]Bhasin K, Hayden J. Developing Architectures and Technologies for and Evolvable NASA space Communication Infrastructure[C]. The 22ndAIAA International Communications Satellite Systems Conference, Monterey,CA,2004.

[2]Ilow J, Leung H. Self-Similar Texture Modeling Using FARIMA Processes with Applications to Satellite Images [J]. IEEE Trans on Image Processing, Vol. 10, No. 5, pp. 792-797, 2001.

[3]Kihong Park and Walter Willinger. Self-Similar Network Traffic and Performance Evaluation[M]. New York: Wiley-Interscience, 2000.

[4]Scherrer A, Larrieu N, Borgnat P, Owezarski P and Abry P. Non Gaussian and Long memory Statistical Modeling of Internet Traffic. IEEE Transaction on Dependable and Secure Computing, Vol. 4, No. 1, pp.56-71, 2007.

[5]Mandelbrot B B, Van Ness. Fractional Brownian Motion, Fractional Gaussian Noise and Application[J]. SIAM Review, 1968, 10(10):422-437.

[6]Granger C W J, Joyeux R. An Introduce to Long-Memory Time Series Models and Fractional Differencing, Journal of Time Series Analysis, 1980,1(2):159-169.

[7]Bonald T. The Erlang Model with Non-Poisson Call Arrivals[J]. Acm Sigmetrics Performance Evaluation Review, 2006, 34(1): 276-286.

[8]魏伍, 张更新,吕晶.一种用于卫星网络的业务预测方法[J].通信技术,2015, 48 (11): 1285-1289.

WEI Wu,ZHANG Geng-xin, LV Jing. A Traffic Prediction Method for Satellite Network[J]. Communications Technology, 2015, 48 (11): 1285-1289.

魏伍(1991—),男,硕士研究生,主要研究方向为卫星通信;

张更新(1967—),男,教授,主要研究方向为卫星通信,卫星导航,卫星测控;

吕晶(1965—)男,教授,主要研究方向为卫星通信,卫星导航,卫星测控;

杨晗竹(1991—),女,硕士研究生,主要研究方向为卫星导航。

Spatial Information Network Traffic Modeling

WEI Wu, ZHANG Geng-xin, LV Jing,YANG Han-zhu

(College of Communication Engineering, PLA University of Science and Technology, Nanjing Jiangsu 210007, China)

Abstract:Network traffic modeling may be used for traffic prediction and is particularly important for satellite communication system with limited bandwidth. In accordance with to the characteristics of spatial information network traffic, a model based on superposition of FLN (fractional log-normal noise) and Poisson process is presented. This model is of self-similarity and short-range dependence. FLN is transformed from FGN and its statistical characteristics may be easily according to flow and data source properties, thus it is precise and flexible. Poisson process, as the most classic traffic model, is suitable for short-range dependence and easy to implement.

Key words:FLN; Poisson process; spatial information network

作者简介:

中图分类号:TP393

文献标志码:A

文章编号:1002-0802(2016)01-0073-05

基金项目:国家自然科学基金(No.91338201,No.91438109,No.61401507) Foundation Item:National Natural Science Foundation of China (No.91338201,No.91438109,No.61401507)

*收稿日期:2015-08-02;修回日期:2015-11-16Received date:2015-08-02;Revised date:2015-11-16

doi:10.3969/j.issn.1002-0802.2016.01.015