高 翔,林宏刚
(成都信息工程学院a.计算机学院;b.网络工程学院,成都 610225)
单向传输技术是一种基于信道单向传输数据的方法,具有传输速率快、资源占用少、效率高等特点,已在计算机的组播[1-2]、安全隔离与信息交换[3-4]、卫星通信[5-6]、海量数据的高速传输[7-8]等方面得到广泛的应用。然而单向传输技术仍然有一些亟待解决的问题与关键瓶颈,例如保证传输数据的可靠性,提高带宽的利用率,纠错编码的选取等,特别是较高的传输速率与高丢包率间的矛盾正成为单向传输技术中的瓶颈问题,因此对单向传输中丢包相关性的研究便显得尤为重要。
在单向传输中造成丢包的因素很多,本文重点研究高速网络中单向传输的丢包与传输速率、数据包负载间的关系。通过搭建测试平台,采集高速网络中单向传输的丢包数据,分别对丢包率与传输速率的相关性,丢包率与数据包负载的相关性进行统计分析;其次研究丢包间的相关性,针对丢失数据包间相关性提出丢包模型,并通过实验验证。本文研究成果可以应用于改善单向传输中的丢包问题,提高单向传输性能,以及为选择单向传输中纠错码提供参考。
搭建千兆网络测试平台(图1)作为测试环境,针对丢包率与传输速率的相关性,丢包率与负载的相关性,丢包间相关性的三方面进行相关测试。平台使用的服务器(CPU为I5双核,4G内存)采用双缓存机制发送和接收数据,因此可以忽略由于终端性能个体差异造成的影响。
图1 单向传输系统结构图
丢包率PLR(Packet Loss Rate)是指丢失数据包占全部发送数据包的比例,其计算方法为:丢失的数据包数量LossPacket除以发送的数据包数量SendPacket。计算公式表示如下:
传输速率指网络层单位时间内发送的数据量大小,单位为Mbps。
负载大小指网络层IP数据包的负载大小,单位为B(Byte),本文中负载大小单位均默认为B。例如以太网的物理特性决定了数据帧的长度为(46+18)~(1500+18),其中的18是数据帧的头和尾,也就是说数据帧的内容最大为1500(不包括帧头和帧尾),即MTU(Maximum Transmission Unit)为1500,除去头部,此时网络层数据包负载大小为1486字节。
丢包事件概率p指丢包事件发生次数PLN(Packet Loss Number)的接收到的数据包数RPN(Receive Packet Number)的比例,若一次连续丢若干数据包,只记为一次丢包事件。p具体计算公式如下:
本文使用实际测试得出的数据分析说明丢包与传输速率间相关性。为简化研究的复杂程度,仅将传输速率作为可变参数,研究在其变化下丢包率PLR的变化情况,并设计如下测试:使用图1中所构建的传输系统,通过专用单向传输软件,以不同的传输速率(200、300、350、400、480、500、600,单位:Mbps)传输1.5G、3G、5G、10G四种不同大小的文件,记录测试数据并根据式(1)计算不同传输速率下的丢包率PLR。因为在实际环境中大文件需要写入磁盘,不可能放在内存中,故将磁盘的写入速度上限600 Mbps作为测试最大值。为排除出IP数据包分片重组对PLR影响,负载选择了数据包分片的临界值1486字节,具体参数见表1。
表1 速率与数据丢包间的相关性研究参数
本文使用实际测试得出的数据分析说明丢包与数据包负载间的相关性。为简化研究的复杂度,仅将数据包负载作为可变参数,研究在其变化下丢包率PLR的变化情况,并设计如下测试。测试使用图1中所构建的传输系统,并选取不同的负载大小(512、1024、1331、1434、1486、2K、4K、8K、16K、32K、64K),通过专用单向传输软件以相同的传输速率(300 Mbps)发送1.5G、3G、5G、10G四种不同大小的文件。记录测试数据并根据式(1)计算不同传输速率下的PLR。因为IP数据包的包头只有两字节表示数据包长度,即IP数据包最大长度为216-1=65 535,所以负载大小只能测试到64K。为保证测试数据的可用性,我们将传输速率设定为300 Mbps,因为若传输速率过小,无论多大的负载都很少丢包,若传输过大,丢包率较大得出的测试数据区分性较小,故我们采用适中值300 Mbps。具体参数见表2。
表2 丢包与数据包负载间的相关性研究参数
在网络数据传输中丢包分为随机丢包与拥塞丢包。随机丢包是由于链路传输出错,造成数据包出现比特差错,上层协议将数据包简单丢弃,但其产生的丢包数较少(对于光缆传输系统,误码率通常在10-9~10-12之间);拥塞丢包是由于网络节点来不及处理达到的数据包,缓存将被耗尽,这时到达的数据包将被丢弃。单向传输属于网络数据传输中的一种,与传统网络数据传输使用的传输介质基本一致,故本节借鉴传统的丢包研究方法对单向传输中丢包间的相关性进行研究。
单向传输中随机丢包事件发生主要是由于链路或设备的错误造成的,丢包是相互独立的事件,故他们呈离散分布,相互间没有相关性。而拥塞丢包是由于网络拥塞造成的,网络节点使用的FIFO(先进先出)以及其“丢尾”性,使两个丢包间存在短暂的相关性。
为研究拥塞丢包中丢包间的相关性,设计测试如下:为保证发生的丢包绝大多数为拥塞丢包,故选用丢包率较高的实验环境,使用图1所示平台进行单向传输测试,利用测试所得数据根据式(2)计算不同参数下的p值。具体测试参数见表3。
表3 拥塞丢包测试参数
表4为丢包与传输速率相关性研究所得的主要数据,以及在此基础上的分析计算结果。表中的参数包括负载大小,数据传输速率数据包丢失数目以及PLR。
表4 丢包与传输速率相关性数据
分析统计各传输速率下的丢包数目等研究数据,通过式(1)得到了各传输速率下的PLR。将传输速率作为X轴,PLR作为Y轴得出了图2丢包率与传输速率间的关系图。
图2 丢包率-传输速率关系图
图2是负载1486 B下,PLR在传输速率0~600 Mbps间的变化图。结合表4与图2我们得出,传输速率在0~300 Mbps间PLR为零,即没有发生丢包;传输率在300~350 Mbps间发生丢包,PLR保持在10-9数量级;350~400 Mbps时PLR开始快速增长,由10-9数量级增长到10-6数量级,在传输速率400~600 Mbps间时PLR由10-6数量级增长到10-2数量级。综上所述,传输速率在350 Mbps之后随着传输速度的增加,PLR发生数量级式的增长。
表5是丢包与数据包负载的相关性研究所得的测试数据,以及在此基础上的分析计算结果。表中的参数包括负载大小,各负载大小下的数据包丢失数目以及丢包率PLR。
表5 丢包与负载数据包研究数据表
分析统计各负载下的丢包数等数据,通过式(1)得到各负载下的PLR。将负载作为X轴,PLR作为Y轴得出丢包率与负载间的关系图,如图3与图4所示。
图3是负载在0~64 KB的完整图(IP数据包最大为64K),图4是图3中负载在500~1486 B区间图,即图4是图3中的一段曲线。综合两图与数据表我们可以得出负载在0~1486间PLR都保持在10-8数量级,在负载1331时PLR达到最小。负载在0~1331间PLR随负载增长而减小,负载在1331~1486间PLR随负载增长而增加。在负载1486以后PLR随负载增长而成指数性增长,负载到8K时PLR达到极大值,然后PLR随负载下降。但总体来说负载大于1486时的PLR远远大于负载小于1486时的PLR。由于负载1486的数据包大小正好是IP数据包分片的数值。所以我们有理由认为IP数据包的分片重组可造成丢包率的升高。
根据测试数据我们可以知道当数据负载在1486以下,传输速率在350 Mbps以下时PLR保持在10-9数量级,丢包事件发生数极少,因为光缆传输系统误码率通常在10-9~10-12之间,所以我们认为此时发生的丢包为随机丢包,丢包呈离散分布,相互间没有关系。但是随着传输速率的增长PLR快速增长,此时拥塞丢包发生。
本文使用两种状态的马尔可夫(Markov)模型,即吉尔伯特(Gilbert)模型来对单向传输中的拥塞丢包进行研究。Gilbert丢包模型如图5所示。
图5 Gilbert丢包模型
图5所示是在单向传输中拥塞丢包的Gilbert丢包模型。随机变量X表示丢包事件,X=0代表没有丢包,X=1表示丢包;P01表示X由0转为1状态的概率p,即发生丢包事件的概率。P10表示X由1状态到0状态的概率q,即丢包事件占丢包总数的比例。P00表示不发生丢包事件概率1-p。P11表示发生连续丢包事件的概率1-q又记为CLP。根据模型p、q关系推理得出式(6)。具体计算公式如下所示,其中公式(3)~(4)中的参数都是可以由数据统计得知,而公式(5)~(6)是由图5所示Gilbert丢包模型推导出的结果。
表6是利用测试结果数据,分别根据式(1)、式(4)和式(2)计算不同测试环境下的PLR、CL P与p值。
表6 网络测试结果
表7是根据表6中的PLR与CLP参数值利用Gil- bert模型推导出的公式(6)计算出的p值。
表7 模型计算结果
比较两张表格p值,发现根据Gilbert模型计算得出的p值与实际测量结果基本一致,与文献[9]所得到结果相符。所以我们认为在单向传输中的拥塞丢包时,丢包间的存在如Gilbert模型表示的相关性,即当丢包发生时,很大程度上伴随着连续的丢包,发生连续丢包的概率为60%~90%,并且每一次拥塞增大到一定程度时就发生连续丢包,然后慢慢恢复到正常,进入一个非拥塞的时期,等待下一次拥塞的到来,这样周期性的重复。事件为离散事件,相互间无关联性;拥塞丢包时丢包间存在相关性可用Gilbert模型描述,当一个数据包发生丢失时,发生连续丢包的概率较大。这些结论可以用于单向传输的应用中,减少单向传输中的丢包,提高单向传输性能,以及单向传输中纠错编码的选择,具有重要的意义。
[1]Zhu B,Setia S,Jajodia S,et al.Localized multicast efficient通过对高速网络中单向传输丢包数据的分析,可以得到以下结论:丢包率与数据包的传输速率有明显的相关性,存在某传输速率(因硬件性能而定)当传输速率超过这一数值,丢包率随传输速率增加而急剧上升。丢包率与数据包负载有明显的相关性,IP数据包的分片重组对丢包率有影响;丢包分为随机丢包与拥塞丢包,丢包and distributed replica detection in Large-Scale sensor networks[J].IEEE Transactions on M obile Computing,2010,9(7):913-926.
[2]Nie PP,Yao Q Q,Lu JD.Desing and implementation of IP multicast video conferenncing system based on JAIN SIP/JMF[J].Computer Applications and Software,2008,25(12):189-192.
[3]Omella M,Polo V,Lazaro J,et al.10 Gb/s RSOA transmission by direct duobinary modulation[C]//Peter V D.Proc.of 34th European Conference on Optical Communication,Brussels,Belgium,September 21-25,2008:1-2.
[4]黄胜召,赵 辉,鲍忠贵.网间安全隔离技术分析研究[J].通信技术,2010,40(5):100-102.
[5]Louise D,M ichael F,A lexei L,et al.Satellite controlusing rational agent programming[J].IEEE Intelligent Systems,2010,25(3):92-97.
[6]Wang SQ,Hou Y.Key technique on satellite communication system and its future development[J].Modern Electronics Technique,2009,32(17):63-65.
[7]任勇毛,唐海娜,李 俊,等.高速长距离网络传输协议[J].软件学报,2010,27(7):1576-1588.
[8]Yang C T,Shih W C,Chen GH,etal.Implementation of a cloud computing environment for hiding huge amounts of data[C]//Wu C H.Proc.of 2010 International Symposium on Paralleland Distributed Processing with Applications(ISPA),Taipei,Taiwan,September6-9,2010:1-7.
[9]纪其进,董育宁.IP网络性能特征模型分析[J].通信学报,2003,24(3):151-159.