张 琪,李兴华,姜 华
(1.北京交通大学 电子信息工程学院,北京 100044;2.工业和信息化部电信研究院 信息网络部,北京 100037)
互联网是当代信息社会的重要基础设施,通过对互联网进行测量和分析,可以使行业管理者了解网络运行状况,及时发现和处理网络重大安全事件,对网间的互联互通方案进行设计和评价。
本文根据工业和信息化部电信研究院互联网优化平台项目所测量的相关数据,通过对大量网络性能数据的统计分析,发现了网络时延的性能特征和不同运营商的性能差异,以及网络互联互通存在的问题。
当数据包到达一个路由器,经过路由器的处理并发送到下一个路由器时,数据包经历的时延由具体的4部分组成[1]:传输时延,传播时延,处理时延,排队时延。
当相同时间间隔发送数据包时,在目的端收到数据包会出现不同时间间隔,即为时延抖动。时延抖动受很多因素影响,由于网络中的路由拥塞,并且瞬间拥塞的时间和长度变化,导致各分组数据包的处理时延不同[2],TCP窗口行为的变化,时延抖动也是反映网络负载特征的重要指标,网络中存在的平均网络负载周期性和非周期性变化会引起时延抖动,另外,路由更新也会引起时延抖动,即当路径发生变化并收敛到新的路由路径过程中,时延增加,会有大量的丢包,并伴随剧烈的时延抖动。
评估时延抖动有多个方法[3],有前后参考,首包参考,平均值参考。平均值参考不具有实时性,是在一段时间测量结束后计算完成,但是平均值参考使用简单,具有一定的代表性和普遍性。本文采用平均参考结合方差的计算,通过测得的往返时延,平均每6 h计算时延抖动。
本文实验的测量从全国范围内的11个监测点向93个分布在各省的运营商Ping和Traceroute,从测量数据中选取24552条往返时延和路由跳数,再根据时延值计算时延抖动。对于自治域的统计信息是,位于各省市的11个监测点分别属于AS4808,AS9808,AS23724,AS24400,AS17621,AS4812。我国向外公告196个AS,实验能够统计65个AS。
2.2.1 往返时延统计分析
Baek-Young Choi[4]等通过对Sprint US IP骨干网的点到点时延分析发现,数据包经历的最大时延并不能代表网络的性能;对经常发生路径变化和负载均衡的骨干网,时延的平均值和中值并不能很好的表示这方面的性能;最小时延在较小的时间内很稳定,最小时延的变化能够表示最短路径的变化。将时延统计数据做概率统计图如图1,并将时延指标值制表如表1。
图1 往返时延概率分布图
表1 往返时延指标值统计表(续)
从图中可以看出,网络时延状况较好,大多集中在40 ms~70 ms之间,只有一小部分时延超过150 ms,对于时延值超过200 ms~300 ms 之间的路由,经过对逐条路由分析发现,这些路由多数发生在跨网,并且目的节点在西藏和新疆地区,这2地区的时延明显大于其他地区,原因是由于我国西部的网络状况较其他地区差,实验的监测点设置相对西部地区较远。
由上表可以看出,各ISP内部的路由时延明显小于各ISP之间的路由时延,A网和B网之间的路由时延表现尤为明显,这2个ISP之间的时延方差值为63.34,时延波动较大,均值和中值分别为98.88 ms和78.83 ms,较其他跨网的时延指标值大。
2.2.2 跳数的分析
端到端的跳数是指测量的数据包从源点出发,到达目的地的过程中所经过的路由器个数[5]。跳数在一定程度上体现了某一路径的路由效率和传输质量。跳数的大小和路由选择策略以及物理距离有关,通常将跳数作为源点和目的点距离的一种体现。从测量数据中选择24552个跳数数据。将其进行跳数概率分布统计如图2。图的横坐标是跳数,纵坐标是跳数所占的比重概率。
图2 ISP网内跳数概率分布对比图
由于监测的目的点是分布在各省市的节点,因此ISP跳数之间的比较不存在距离远近的问题,由图2可知,最为Tier-1的A网和B网的选路策略较好,路由跳数集中在9跳和10跳,而C网内的路由跳数分布稍向后移,进一步对逐条路由分析发现,某些C网内的路由要经过A网或B网的骨干网节点进行传输,比如由上海C网监测点到北京C网目的点,中间需要经过B网骨干网节点进行转发。从网内和网间的角度分析,在ISP内部的路由选择策略较好,跳数集中在9跳~11跳,而在ISP之间的跳数则显著增加,集中在12跳~14跳。同样的,ISP内部和ISP之间的比较不存在物理距离的远近,那么影响跳数整体变大的原因是路由选择策略。对网络跳数进行整体统计可以看出,对跳数分布的影响主要来自ISP之间,因此,对于提高全国网络性能应加强各ISP之间的互联互通,优化跨网的路由选择策略。
2.2.3 跳数与时延相关性分析
路由是指数据包在网络传输过程中经过的网络节点的有序排列。路径是数据包从源点到目的点的所有路由的集合。通常用跳数来衡量源端和目的端的距离,跳数大的一般情况下物理距离也大,延迟也会相应变化。Aiguo Fei[6]等人通过对UCLA的主机随机选择3000遍布全世界的主机进行测量往返延迟和跳数分析,实验结果表明US内超过90%跳数是在18跳以内,90%的往返延迟小于153 ms,但是研究表明跳数和延迟之间没有很强的相关性,尽管是平均时延大小会随着跳数增加而增加。时延和跳数对比如图3。
图3 时延和跳数对比图
图3中的横坐标是路由跳数,纵坐标是某一跳数的时延分布,从图中可以看出,随着跳数的增加,时延会变大,但并不是很强的相关性,在11跳到15跳之间,时延呈现很大的分布。图中的红点表示固定跳数时延的中位值,从16跳开始,中位值不再呈单调上升趋势。基于以上2点不能单纯的由给定跳数来预测时延大小,时延大小不仅仅由跳数决定,还会依赖很多其他因素,包括物理距离,到骨干网的距离,链路容量和当时某一链路的流量状况,这也体现了网络的复杂性。
分析目的是AS间路径时延对整体时延的影响,由于平台使用的工具是Traceroute,返回的数值是往返时延,因此,采用的数据是链路往返时延。将每条链路时延比重算出,做出概率分布图如图4。
图4 AS间链路时延比重CDF图(intra-ISP)
对于出现在intra-ISP的跨域链路时延比重,C网和B网的AS间链路时延比重并没有占很多,在所有的路径往返时延中,C网90%的跨域链路只占其所在路径时延的不到10%,B网80%的跨域链路只占其所在路径时延的不到10%,对这2个ISP,占整条路径的大部分时延出现在自治域内部,逐条对路径时延分析发现,路径时延的主导时延链路大部分只有一条,也即端到端路径中大部分只存在一条瓶颈链路,根据上述分析结论,可以推断出瓶颈链路出现在AS内部。这符合过去的研究结论。对于A网,跨域的链路所占时延比重CDF图近似为一条直线,表明跨域间链路和域内链路的时延贡献值差不多,瓶颈链路不能武断的判断在AS内部[7]还是外部。
统计只采用8点和14点的时延抖动值做比较,8点的时延抖动是从2~8点的往返时延方差值,14点的时延抖动是从8~14点的往返时延方差值,2个IPDV都非常有代表性。通过3天取值来得到平均值,统计结果如图5。
由图5可知,从时间上,8点比14点的IPDV要明显小的多,这表明凌晨2点到上午8点的网络负载较轻,时延变化不大,比较稳定,符合网络的实际情况。而上午8点到下午14点的时延抖动值明显变大,这时网络负载较重,数据包往返时延不稳定,会经历排队时延,所以时延出现较大的波动。
图5 8点-14点时延抖动比较
通过对不同运营商的网络时延性能进行分析,从网内网间以及组成的整体性能等不同角度,对运营商之间的性能差异进行了评估。通过对时延性能进行深入的挖掘,发现和验证了时延的一些特性,证明了互联网发展的地域不平衡性。
[1]Jun-ya Kato, Atsuo Shimizu, Shigeki Goto. Active Measurement and Analysis of Delay Time in the Internet [C]. ICPP '99 Proceedings of the 1999 International Workshops on Parallel Processing, 1999.
[2]Pucha H, Zhang Y, Mao Z M, et al. understanding network delay changes caused by routing events [C]. In proceedings of the 2007 ACM SIGMETRICS international conference on measurement and modeling of computer systems, 2007.
[3]黎文伟,王俊峰,谢高岗,张大方. 基于包对采样的IP网络时延变化测量方法[J]. 计算机研究与发展,2004,41(8):1352-1359.
[4]Baek-Young Choi, Sue Moon, Rene Cruz, Zhi-Li Zhang, Christophe Diot. Practical Delay Monitoring for ISPs [C]. Proceeding 2005 ACM Conference on Emerging network Experiment and Technology, Toulouse, France, Oct. 2005.
[5]马建国,席明贤,等. 中国Internet路由级跳数测量与分析[J]. 计算机应用研究,2008, 25(7):2112-2115.
[6]Aiguo Fei, Guangyu Pei, et al. Measurement on delay and hop-count of the internet[C]. IEEE GLOBECOM'98 - Internet Mini-Conference. 1998.
[7]毕经平,吴 起,李忠诚. Internet延迟瓶颈的测量与分析[J]. 计算机学报,2003,26(4):406-416.