明 艳,李 强,孙瑞杰
(重庆邮电大学信号与信息处理重庆市重点实验室,重庆400065)
移动可视电话业务作为3G的特色业务,实现了移动用户端到端的音视频双向实时通信,给用户带来了全新的视听感受。因此,该业务备受电信运营商和手机制造商的青睐。移动可视电话业务在TD-SCDMA和WCDMA中是通过电路域来实现,而在EVDO(evolution-data optimized)中则是通过分组方式来实现的。在分组域中,可视电话业务的控制信息、音频数据和视频数据是通过3个不同的服务质量(quality of service,QoS)流进行传输[1],并且在传输数据之前,必须进行QoS流的激活。这个激活的过程包括了资源的预留、确定接入网和核心网接口的映射关系等。
业务模型的建立是分析网络性能、科学规划网络的基础。传统的电路业务主要是用泊松(Poisson)模型进行描述[2]。由于数据业务具有突发性,汇聚的业务流又表现出自相似的特点,因此有必要建立分组业务的源模型。本文根据EVDO网络分组域可视电话业务的实现方式和业务性质,对音频流和视频流分开建立源模型。首先,根据会话类业务用户行为的特点,用Poisson模型来描述会话层。然后,根据音频流和视频流的业务特性和传输特性,采用合理的参数对突发层和数据包层进行描述。最后,对模型参数及分布进行求取和拟合。
EVDO分组域可视电话业务属于实时会话类业务。该业务用户的呼叫到达过程可以用Poisson过程进行描述,即用呼叫到达间隔时间和单用户平均呼叫时长来描述。而这2个参数均服从指数分布[3],指数分布概率密度函数为
在EVDO中,由于可视电话业务的音频流和视频流采用了不同的压缩协议,具有不同的业务流性质,因此,本文对这2种多媒体流分开进行研究。
对于音频流,EVDO移动终端采用EVRC(enhanced variable rate codec)和EVRC-B(enhanced variable rate codec B)的压缩编码标准。EVRC编码器把一个经过8 kHz采样、16 bit量化的20 ms帧压缩成4种不同速率的输出码流:全速率8.8 kbit/s,1/2速率4.0 kbit/s,1/4 速率2.0 kbit/s和1/8 速率0.8 kbit/s。通常对语音压缩编码采用全速率或1/2速率编码[4]。由于人的语音通话可分为讲话期和听话期,即激活期和静默期。在激活期,音频源以固定速率发送数据包。而在静默期,没有数据包发送。因此,可以用ON/OFF模型对其进行描述。
对于视频信号,EVDO终端支持H.263,MPEG-4和H.264/AVC视频压缩编码协议。对于H.264/AVC编码分为 3个档次:Baseline,Extended和Main。Baseline主要用于实时的视频交互,如视频会议和可视电话等业务。Extended主要用于网络的视频流业务,如视频点播等。Main主要用于电子应用,如数字电视广播、数字视频存储等[5]。在Baseline中,只包含帧内编码I帧和单向预测帧间编码P帧,并不编码双向预测B帧。该档次虽提高了编码实时性,但视频质量一般。而在Extended和Main中,要编码B帧,虽提高了视频传输的抗误码性能,但编码实时性较差。在移动可视电话业务中,一般选择Baseline。视频帧之间虽然存在很大的相关性,但是,当图像背景发生变化时,如在移动中进行视频通信时,编码输出数据量较大,这时需通过缓冲和调整各帧量化参数来缓解编码速率的增大,以保持业务输出速率的恒定。
在传输音视频数据流时,EVDO采用了如图1所示的RTP/UDP/IP(real-time protocol/user datagram protocol/internet protocol)分层协议结构[6]。
图1 数据流传输分层协议结构Fig.1 Date stream transmission layer protocol structure
由于IPv4(internet protocol version 4)的固定头部占用20 Byte,UDP的头部信息占用8 Byte,RTP的头部占用12 Byte,而IP数据包的有效负荷长度不超过1 400 Byte。采用IPv4的RTP/UDP/IP协议总头部信息就要占用40 Byte,在传输音频数据时,一般每20 ms发送一个分组,这样包头的数据速率就达到了16 kbit/s,这严重影响了数据包的传输效率。因此,采用ROHC(robust header compression)协议对包头信息进行压缩,以提高带宽利用率。
对于音频流来说,考虑系统带宽的利用效率,采用把全速率20 ms的一个音频帧打包成RTP包的方式。这样在激活期,音频帧数据包就以固定的速率被发送出去,每个数据包的大小、发送每个RTP包的间隔时间也是固定的。
由于视频流的数据量较大,在IP层需进行分段,把超过1 380 Byte的 NAL(network abstraction layer)单元进行分片,把每个分片打包成一个RTP包,每个分片的RTP包的时间戳相同。把每个不超过1 380 Byte的NAL单元打包成一个RTP包,每发送一个此类RTP包,时间戳都增加相应的量。
下面选取300帧QCIF格式的视频测试序列salesman,用Baseline压缩档按照IPPPPPPPPP的压缩模式进行压缩,即每隔10帧编码一帧I帧。把压缩后的码流按照上述RTP打包方法进行打包和传输,用软件解析出的RTP包的具体信息如图2所示。从图2可以看出,无论是I帧还是P帧,都打包成6个数据包,并且每个RTP包的时间戳都不相同,说明压缩后码流中的NAL单元并没有进行分片。
图2 解析出的RTP信息Fig.2 Extracted RTP information
通过上述分析,对音频流采用3层模型进行建模。第1层用会话层来描述用户的行为,第2层用突发层来描述音频流的激活期和静默期,第3层用数据包层来描述激活期产生数据包的具体情况。模型结构如图3所示。对于视频流,由于用户会话期间一直有数据包的产生,采用如图4所示的2层模型对其进行描述。第1层和音频模型一样用来描述用户的行为,第2层的数据包层用来描述视频流具体数据包传送情况。
图3 音频源3层模型Fig.3 Audio source three-layer model
图4 视频源2层模型Fig.4 Video source two-layer model
分组可视电话业务源模型的建立,关键要选取合适的模型参数来描述每种业务流。本文根据各媒体流压缩标准以及传输协议,选取的参数如下。
1)用户行为:选取会话到达间隔时间和会话持续时间2个参数。
2)音频数据流:采用激活期平均占用时长、静默期平均占用时长、激活期数据包到达间隔时间和激活期数据包大小4个参数。
3)视频数据流:由于I帧和P帧编码后输出数据量不同,所以要对I帧和P帧分开进行描述。首先是帧率的选择,帧率一般都是定值;然后是I帧和P帧所包含的数据包个数以及所包含的数据包的大小;最后是视频帧数据包的到达时间间隔。
模型参数确立后,根据实际数据,统计和计算参数的取值范围,拟合出参数服从的分布。用户达到过程用Poisson模型进行拟合,会话到达间隔时间和会话平均持续时间都服从指数分布。对于音频流模型,可以参考VoIP源模型的参数取值和分布,即静默期和激活期都服从负指数分布,数据包大小为定值,数据包到达间隔时间为定值[7]。对于视频流模型,由于移动可视电话用户通话可能处在两种不同的场景下:静止场景和移动场景。因此,本文选择salesman和silent序列模拟用户在静止场景下的情况,选择carphone和coastguard序列模拟用户在移动场景下的情况。测试序列图像如图5所示。通过对RTP包的统计,得到这4个序列数据包大小的概率密度函数如图6-图10所示。
从图6-图9可以看出,对于不同类型的视频序列,P帧数据包大小所服从的分布基本上一致,均可用截断的Pareto分布[8]进行拟合,不同之处是概率密度函数的坡度不一样。因此,2种场景下的P帧数据包大小的分布函数可用不同特征参数值下的截断Pareto进行描述。从图10可以看出,对于I帧来说,由于采用帧内编码方式,输出码流与图像的细节信息密切相关。无论是静止场景还是移动场景,I帧数据包都可以用截断的正态分布进行拟合。经统计,I帧数据包的最小值取90 Byte,最大值取1 100 Byte。而数据包的达到间隔时间可用截断的Pareto分布进行拟合。分组域可视电话业务源模型参数取值及分布拟合如表1所示,两种不同场景下的P帧数据包大小的参数取值及分布如表2所示。
图5 测试序列图像Fig.5 Images of testing sequences
图6 salesman P帧数据包大小的概率密度函数Fig.6 PDF of P frame data package of salesman
分组域可视电话业务的源模型建立后,可根据模型参数及其取值,产生该业务源的输出。如果能得传输该业务的网络指标,如时延、抖动、误码率以及吞吐量等,即可分析系统的性能,估算出系统的容量。因此,该业务源模型可用于网络仿真。但在实际应用前,需对建网后的实际数据进行统计分析,并对该模型参数进行修正。
图8 carphone P帧数据包大小的概率密度函数Fig.8 PDF of P frame data package of carphone
图9 coastguard P帧数据包大小的概率密度函数Fig.9 PDF of P frame data package of coastguard
拟合的I帧数据包大小的概率密度函数曲线和2种场景下P帧数据包大小的概率密度函数曲线分别如图11和图12所示。
图10 I帧数据包大小的概率密度函数Fig.10 PDF of I frame data package
图11 I帧数据包大小的概率密度函数拟合曲线Fig.11 Fitting curve of PDF of I frame data package
表1 分组域可视电话业务模型参数及取值Tab.1 Parameters and their values for traffic source model of packet-switched videophone
表2 2种场景下的P帧数据包大小参数取值Tab.2 P frame data package parameters under two scenes
图12 2种场景下P帧数据包大小的概率密度函数拟合曲线Fig.12 Fitting curve of PDF of P frame data package under two scenes
本文通过分析EVDO分组域可视电话业务的实现,并根据分组交换业务的性质,建立了分组域可视电话业务的源模型。通过对用户行为特性的描述,提出了会话层的模型参数;通过对音视频源的压缩协议和数据传输协议的分析,提出了数据包层的模型参数;并通过对获取数据包的统计和分析,拟合出了各参数取值范围和分布。此模型对网络仿真和3G网络建设具有一定的参考价值。
[1]严斌峰,张智江,张范.基于cdma2000 1x EV-DO的可视电话系统的实现难点[J].电信技术,2006,16(9):102-105.YAN Binfeng,ZHANG Zhijiang,ZHANG Fan.Implement difficulties of videophone system in cdma2000 1x EV-DO[J].Telecommunications Technology.2006,16(9):102-105.
[2]李强,孙瑞杰.一种基于TD-SCDMA电路域会话类业务呼叫到达模型[J].重庆邮电大学学报:自然科学版,2012,24(2):164-168.LI Qiang,SUN Ruijie.A call arrival model of circuitswitched conversational services based on TD-SCDMA[J].Journal of Chongqing University of Posts and Telecommunications:Natural Science Edition,2012,24(2):164-168.
[3]李强,于游.TD-SCDMA集群系统语音业务模型分析[J].通信技术,2010,11(43):69-71.LI Qiang,YU You.Analysis on voice traffic model of TDSCDMA trunking system[J].Communications Technology,2010,11(43):69-71.
[4]KRISHNAN V,RAJENDRAN V,KANDHADAI A,et al.EVRC-Wideband:The New 3GPP2 Wideband Vocoder Standard[C]//IEEE International Conference on Acoustics,Speech and Signal Processing,Honolulu,Hawaii,USA:IEEE Press,2007:333-336.
[5]毕厚杰.新一代视频压缩编码标准-H.264/AVC[M].北京:人民邮电出版社,2005:87.BI Houjie.New Generation Video Frequency Compress Coding Standard-H.264/AVC[M].Beijing:The people post and Telecommunications Press,2005:87.
[6]THOMAS S,MISKA M,THOMAS W.H.264/AVC in Wireless Environments[J].IEEE Transactions on Circuits and Systems for Video Technology,2003,7(13):657-673.
[7]张锦春,胡谷雨.宽带多媒体业务的业务量模型[J].电视技术,2002.36(11):16-19.ZHANG Jinchun,HU Guyu.Traffic model of broadband multimedia service [J].Video Engineering,2002,36(11):16-19.
[8]LIU S G,WANG P J,QU L J.Modeling and simulation of self-similar data traffic[C]//Proceeding of 2005 International Conference on Machine Learning and Cybernetics,Guangzhou,Guangdong:IEEE Press,2005:3921-3925.