Ad hoc网络基于协同的可靠组播丢失恢复算法设计

2010-03-27 06:54黄梦洁张翼德
电子与信息学报 2010年9期
关键词:重传延时数据包

黄梦洁 冯 钢 张翼德

(电子科技大学通信抗干扰技术国家级重点实验室 成都 611731)

1 引言

在Ad hoc网络的应用中,当存在多个接收者需要同时接收数据时,使用组播技术进行数据传输是很有效的方式。虽然一些应用,例如一个实时的多媒体组播通信,因为无法容忍丢失恢复产生的延时,就容忍组播传输过程中不可靠网络带来的数据丢失或者错误;但是其它的应用,例如在单点对多点的数据组播传输或者是军事应用中,是无法容忍数据包的丢失的。因此要求组播传输需要具备可靠性。然而Ad hoc网络中节点的能量和网络的传输带宽有限,并且网络自身具有无结构性、节点频繁移动,以及无线传输信道环境高的误码率和信道衰落特性,都影响了组播传输的可靠性。

到目前为止,已经提出了许多可靠组播协议,其中的PGM组播可靠传输协议是一个著名适用于有线组播网络的可靠传输协议[1]。PGM适应于多个源端和多个接收端之间通信的可靠传输协议,它适用于组成员随时加入或离开,但对于分组丢失不敏感的应用。另一方面,也提出了一些适用于Ad hoc网络的组播传输通信协议[2−5]和基于Mesh网络的协议[6]。这些协议通过不同的方式提高了Ad hoc网络的组播通信可靠性。根据进行丢失恢复的不同位置,这些算法可以分类为:基于源节点的丢失恢复、基于接收节点的丢失恢复或者基于额外的恢复节点的丢失恢复。Gopalsamy等人提出的Reliable Multicast Algorithm(RMA)算法[2]是依靠发送节点进行丢失恢复,RMA算法通过发送端发送ACK来进行数据包确认。Chandra等人提出的Anonymous Gossip(AG)算法[4]则是在进行丢失恢复时随机选择一个节点作为恢复节点,但是在AG中随机选择的丢失恢复节点能否完成丢失恢复具有未知性。单纯的依靠源节点,或者单纯的依靠接收节点进行丢失恢复的设计,或者选择某几个节点作为恢复节点,都是将整个网络的丢失恢复集中在这几个节点上进行处理,这样就会增加这几个节点的处理负担,并且无法避免大量重传时恢复节点无法负荷而成为网络瓶颈的情况发生。选择划分本地组的方式[5]虽然在NAK抑制和避免产生瓶颈方面有较好的表现,但是面对Ad hoc中节点频繁的移动性,为了维护各个本地组的成员关系会增加很多的网络开销。

基于以上考虑,本文针对Ad hoc网络的特点和已有算法的优缺点,将协同的设计思想[7,8]引入到丢失恢复设计中提出了新的基于协同的可靠组播丢失恢复算法(CoreRM)。CoreRM算法是基于树状的路由结构的,例如可以采用Ad hoc按需距离向量组播路由协议(MAODV)[9],目前还有基于分层树状结构的丢失恢复算法[10]。CoreRM选择将一跳邻居节点、组播路径上游节点和发送节点协同进行恢复丢失。算法设计目标在于:各级协同,分散网络中的丢失恢复,将网络的丢失在最短的距离内得到恢复,最终增加Ad hoc网络中组播传输的可靠性。对于无线网络中的节点缓存控制和缓存管理我们已经有了一定的研究[11],因此在CoreRM算法的缓存策略设计上也提出了新的想法:节点上缓存的不仅仅是接收到的数据,还缓存了能够帮助节点进行丢失恢复的路径信息。应对重传恢复中可能出现的NAK风暴,CoreRM算法使用随机等待一定时间以后再发送NAK来避免竞争信道。针对Ad hoc网络中节点的频繁移动会造成拓扑结构的多变性,CoreRM算法通过周期性发送源路由信息(SPM),来及时获知组播树结构中的上一跳节点信息的变动。

2 协同可靠组播丢失恢复(CoreRM)

2.1 CoreRM算法概述

协同丢失恢复算法(CoreRM)是基于树型路由(如MAODV)、NAK确认丢失的可靠组播协同丢失恢复算法。为了避免在某个节点负担过多的丢失恢复处理,算法通过整个网络中的所有节点间相互协同提供丢失恢复,使得丢失在最小的范围内得到恢复,同时也使恢复负担分布化。所有的组播树成员节点(包括路由器节点和接收节点)在缓存中不仅存储了传输的数据包,还存储数据丢失恢复路径向量(Loss Recovery Distance Vector,LRDV),LRDV主要是记录进行丢失恢复的最短路径信息。通过接收到的NAK或者NCF中携带的发送节点的数据恢复路径信息DV向量(DV是LRDV的一部分)而得到此信息。由于LRDV中仅仅存储了数据恢复的路径信息,因此不会占用很大的空间。多播树上每一个节点即使不能直接对丢失提供恢复,也可以通过自己的LRDV里存储的恢复路径信息来帮助其他节点获得恢复路径来进行丢失恢复。

总的来讲,CoreRM算法的协同丢失恢复过程可概括为:

(1)单播恢复阶段: 节点的LRDV中存在丢失数据的恢复路径信息,直接单播发送NAK请求到该节点请求进行相应数据包的重传。

(2)本地恢复阶段: 对于无法通过LRDV进行单播恢复的丢失数据包,进入本地恢复阶段进行丢失恢复。广播NAK,DV附加在NAK包中进行传输。广播的距离是一跳,目的在于发现周围能够提供协同恢复帮助的最近邻居节点,接收到NAK请求的节点广播NCF并且检查缓存中是否存储了该丢失的数据包,如果能够提供丢失恢复就单播发送恢复数据包。否则超时后结束本地恢复,进入下一个丢失恢复阶段。

(3)单播恢复阶段:再次检索节点的LRDV中是否存储了丢失数据包的恢复路径,如果存储则直接单播恢复。因为在进行本地恢复的过程中,节点可能因为接收到的NAK数据包或者NCF数据包所携带的DV向量信息而获知丢失数据包的恢复路径,这样就可以再次通过邻居节点之间的协同帮助来进行丢失恢复处理。

(4)全局恢复阶段:对于仍然无法恢复的数据包,进入全局恢复阶段进行丢失恢复。沿着组播路径向上游节点发送NAK,缓存中存储了丢失数据包的节点广播就发送恢复数据包,接收到恢复数据包的所有下游节点都能够完成丢失恢复。如果所有的上游节点都无法提供协同恢复帮助,NAK数据包将最终被传递到发送端,发送端就针对丢失的数据包进行最终的丢失恢复重传。

2.2 数据包缓存策略

CoreRM算法选择在组播树的每一个成员节点上都缓存接收到的数据包和恢复路径信息。由于Ad hoc网络是无结构的,每个节点同时具有转发功能和接收功能。因此CoreRM算法充分发挥转发节点的作用,设计转发节点处也进行数据包的缓存。转发节点往往接近于发送节点,相对于远距离的接收节点出现丢失的可能性较小,当接收节点发生丢失请求恢复时,就可能在转发节点处得到丢失恢复,不再需要汇聚到源节点处进行丢失恢复。并且由于转发节点和接收节点的协同帮助,就将整个网络的丢失恢复进行分布式处理,分布式处理虽然需要每个节点都进行数据包缓存操作,但是可以避免整个网络由于某个节点处理能力有限而出现瓶颈。

接收节点者通过设立数据包接收序列来发现数据包的丢失。由于源端发送数据包是按序发送的,在规定的时间内没有正确接收到相应的数据包或者出现了接收空隙,都意味着传输中发生了丢失。接收空隙产生的原因是在规定的时间内数据包没有按序达到,在接收端建立最大接收序号累加算法,每当接收到按序达到的数据包时就递加接收端接收到的最大序号。如果接收到的数据包序号小于最大的存储序号则丢弃该数据包;如果接收到的数据包序号超过了接收端存储的最大接收序号加1时,表示出现空隙有数据包发生了丢失。

2.3 恢复路径信息缓存策略

在CoreRM中,每一个节点对于每一个组播组维护一个LRDV路由表用来存储数据包的恢复路径信息。每一个LRDV表具有表1的形式。

表1 LRDV数据包格式

Packet ID:数据包标识(数据包发送端的地址和序号),用于标识不同数据流中的不同数据包;Dst1:数据包的恢复节点地址;hops表示到达恢复节点的跳数;Ts是时间戳,在超过Tmax时间后LRDV中的内容被重设。同其他的距离向量算法一样,在LRDV表中每一个向量只保留了最优的恢复节点地址,最优的节点地址就是指距离丢失节点跳数最少,即最近的节点。如果是正确接收的数据包,那么该数据包的向量中Dst1是本节点地址,其余参数都是初始值。

在LRDV中的距离信息的传递是通过NAK或者是NCF的广播发送方式来传递的。每个NAK或者是NCF包的格式如表2所示。

TYPE是数据包的类型,NAK或者NCF;G是组播组地址;S是发送节点地址;RCV是接收节点地址,例如:NAK广播时是广播地址,NAK单播时可能是上游节点地址或者是恢复节点的地址;seqNo:请求重传/回复请求的丢失数据包的序号;[DV]是发送NAK/NCF节点的数据包接收情况组成的向量,存储了从丢失数据包序号seqNo开始向后的N个数据包的恢复路径信息,因为丢失可能是因为数据包的乱序导致的,这也意味着序号后面可能存在正确接收到的数据包,相对于序号前面的数据这些数据更有可能被其它节点请求重传。在[DV]中,[DV(i)]是数据包<S, seqNo + i>的向量。

表2 NAK/NCF数据包格式

LRDV中的信息在节点接收到DATA,NAK,NCF和RDATA时进行更新。

接收到数据包seqNo,节点A存储数据包,建立或者更新LRDV信息。

当接收到到NAK或者是NCF时,节点A就根据其携带的[DV]中的信息更新LRDV表。注意到[DV(i)]影响到了A的LRDV中的<S, seqNo + i>。如果接收到的NAK/NCF中携带的第i个向量的序号和A节点的LRDV中存储的序号相同,那么比较DV中的向量的hops和LRDV中的hops大小,如果DV小于LRDV,则将LRDV中的信息替换成DV[i]中的信息。如果接收到的同序号的DV信息在LRDV中仍没有建立向量,则按照DV中携带的信息建立相关向量。

2.4 SPM数据包帧格式设计

SPM数据包的设计是为了适应Ad hoc网络中节点频繁移动造成的组播树不断重建的问题。SPM包是源路径信息数据包。在发送数据包之前被广播发送,用来帮助各个节点建立组播树结构的上游节点信息;SPM在数据包发送间隔被广播发送,用来应对网络拓扑结构变动产生的上游节点变动。由于SPM仅仅用来监督网络拓扑的变化,数据包长度很小,因此在网络通信中也不会产生很大的网络开销。

SPM数据包的帧格式中包括:常用头部信息、IP报头信息和SPM报头信息3部分。常用头部信息包括4部分信息:Tsi,seqno,size和type。其中Tsi是数据包标识,因为网络中可能存在很多的数据流,因此根据Tsi就可以区分不同的数据流。不同的Type值区分不同的数据包类型。例如:SPM数据包的type值是:PT_SPM。IP头部信息(dst_addr)是存放数据包发送的目的节点地址。SPM头部信息主要是存储在spm_path中的源路由路径信息,也就是在组播树建立以后,节点的上游节点信息,这里通过节点地址来进行标识。源节点发送SPM数据包时,将spm_path地址设置成自己的地址,这样接收到SPM数据包的节点就获知上游节点是源节点。节点接收到SPM数据包以后改变spm_path为本节点的地址之后转发SPM。这样就通过发送SPM数据包,可以及时获知上游节点是否发生变化。

2.5 NAK抑制策略设计

CoreRM中NAK抑制算法设计主要是为了避免生成NAK风暴设计的。NAK风暴产生的原因很多,主要是:不同的节点丢失同时请求相同序号的数据包,所有节点同时发送NAK,等待RDATA的过程中不断发送重复的NAK。NAK风暴的出现很有可能导致整个网络的瓶颈链路断裂或者某个节点由于处理能力有限而瘫痪整个网络,因此NAK抑制算法的设计是CoreRM中设计的重点。如图1所示是CoreRM算法的状态机转换图。当节点发现丢失数据包以后,进入到NAK_STATE状态,随机等待一段时间以后发送NAK,并且进入到WAIT_NCF_STATE状态中等待接收NCF,在等待NCF的过程中节点停止重复发送NAK,只有当等待NCF超时以后再次进入NAK_STATE阶段时,才再次发送NAK;如果接收到NCF以后进入到WAIT_DATA_STATE阶段等待接收重传的数据包。否则当等待重传NCF的次数超过了MAX_NCF_RETIRES以后,或者等待RDATA的次数超过了MAX_DATA_RETIRES的次数以后结束本丢失恢复阶段对数据包的丢失恢复。

3 CoreRM性能分析

本节使用一个简化的网络模型对比分析CoreRM和PGM可靠组播丢失恢复的性能。考虑一个发送端多个接收端的组播传输模型,发送端为S。组播通信是基于树状的路由结构,网络中节点的密度为ρ,无线节点的传输半径为r,组播树成员节点到发送节点S之间的跳数为Hi。组播树成员节点MHi存储了数据包dj的概率为Pij。当组播通信需要进行丢失恢复时,如果丢失重传的请求无法被组播组成员节点满足就会一直传递到发送端。减少请求节点到提供丢失恢复节点之间的跳数Lj就能够减少重传的时延Tj,节约带宽和能量损耗,因为这样就会引入很少的成员节点到丢失重传的处理中。丢失恢复延时Tj:是指从发现丢失后发出丢失重传请求开始到接收到重传的数据包之间的延时。Tavg是整个组播丢失恢复过程中的平均丢失恢复延时。Lavg是整个组播丢失恢复过程中的平均跳数。由于CoreRM进行协同的丢失恢复时,经历了本地恢复阶段、全局恢复阶段和源节点恢复阶段3个阶段。每个丢失恢复阶段完成丢失恢复因为距离请求节点不同的跳数距离导致要经历不同的延时,本地恢复阶段的平均延时为Tz,全局恢复的平均延时为Tg,源端恢复的延时为Ts。CoreRM设计每次丢失恢复等待重传的最大延时为Tr。因此CoreRM算法的丢失恢复跳数和丢失恢复时延为

图1 CoreRM算法的状态机转换图

为了分析CoreRM算法和PGM算法的丢失恢复跳数和丢失恢复延时的性能,本文通过一个简单的例子来进行说明,例子的拓扑结构如图2所示。为了方便计算,假设每一条链路上的丢包概率p相同,每个节点上的存储概率P都可以根据该节点和发送节点之间的组播路径的链路丢包率p来确定。组播树上的每一个节点都对传输的数据包进行存储,并且节点的缓存空间为无限大。发送节点S一定能够提供请求数据包的重传恢复。请求重传的NAK和NCF数据包不会发生丢失。

图2 树形结构的组播树拓扑

使用PGM作为可靠组播通信协议:

图3所示的是在图2的树形拓扑结构下的丢失恢复跳数。虚线为CoreRM算法的平均丢失恢复跳数,实线为PGM的平均丢失恢复跳数曲线。图4所示的是在图3的树形拓扑结构下平均恢复延时曲线。由于PGM使用的是发送端重传,每次重传都需要发送端重传才能完成,并且根据传输链路上的丢包率,重传的数据包有可能再次发生丢失。从图3中可以看出,使用了CoreRM算法以后图2的拓扑结构中发生了数据包丢失的接收节点,理论上可以在两跳范围内完成丢失恢复,而使用PGM算法时重传跳数就已经超出了3跳。使用了CoreRM算法以后的丢失恢复延时曲线增长幅度随着链路丢包率的增长也要小于PGM,因此可以看出CoreRM算法的优势。

4 计算机仿真与性能评估

本文使用NS2作为Ad hoc网络的仿真平台来估计CoreRM的性能。使用MAODV组播路由协议产生组播树拓扑。仿真中,分布16个节点在670 m×670 m的范围内,选取一个节点作为源节点,通过CBR流量生成器产生整个网络仿真的数据,数据包长为210 Byte。仿真中使用MAODV组播路由协议作为路由层协议,802.11 作为MAC层协议。已有的PGM是针对有线网络设计的基于NAK的可靠组播协议,根据本文的仿真需要我们对PGM做了一定的改进,以适应于Ad hoc网络的传输环境。PGM协议具有丢失恢复功能;当组播组成员发生分组丢失时,向源节点发送NAK请求进行丢失恢复。

本文采用性能指标主要是网络的吞吐量和平均丢失恢复延时。

平均吞吐量:每个节点在单位时间内接收到的数据量。

平均丢失恢复时延:数据包丢失发现到数据包丢失恢复的时延。

图5和图6是存在信道损耗的静态网络中的性能仿真结果。图中横坐标表示的是传输丢包概率,也就是不同的信道损耗。图5所示的是网络的吞吐量曲线,图6所示的是丢失恢复延时曲线。由于CoreRM和PGM对于数据包重传次数做了限制,有些数据包可能因为超过了重传的最大次数而被放弃恢复,这些数据包不会被计入到丢失恢复重传延时中。由于UDP是面向无连接的传输协议,对于发生丢失的数据包不采取任何措施进行恢复,因此UDP的性能下降的最快。PGM协议的性能优于UDP协议,然而由于使用的是发送节点进行丢失恢复,PGM丢失恢复延时和吞吐量性能要差于CoreRM算法。CoreRM算法在不同的信道损耗情况下始终能够保持较高性能,因为CoreRM算法使用了最短距离的丢失恢复,将整个网络的丢失恢复进行了分布式处理,因此在信道传输情况变差时,仍然能够通过较短时间完成丢失恢复,保持较高的吞吐量。图7和图8所示的是在移动网络中的性能仿真结果。图7中显示的是网络的平均吞吐量曲线。图8中显示的是丢失恢复时延曲线。随着节点移动速度的加快,网络的拓扑变换更加的频繁,这样就增加的数据包丢失的概率,所以随着节点移动速度的加快,数据包请求重传的次数增加,整个网络的正确投递率也随之下降。由于PGM使用的是源端重传而延长了丢失恢复的时延,并且基于源节点的重传恢复增加了网络传输的控制开销,影响到整个网络数据包的正确投递和吞吐量性能,导致性能差于CoreRM。CoreRM算法使用了最短距离丢失恢复设计,丢失节点周围的邻居节点协同帮助恢复,使得丢失重传的数据包的传输范围缩小,避免了随着节点移动速度加快而产生的丢失恢复时延急剧增长。

图3 链路丢包率影响下的丢失恢复跳数

图4 链路丢包率影响下的平均恢复时延

图5 信道损耗影响下的吞吐量

图6 信道损耗下的丢失恢复延时

图7 移动速率影响的平均网络吞吐量

图8 移动速率影响下的丢失恢复延时

5 结束语

在本文中提出了一个适用于Ad hoc网络的可靠组播协同丢失恢复算法CoreRM。CoreRM是基于NAK确认的协同丢失恢复算法,邻居节点通过提供丢失数据重传或者是数据恢复路径信息,尽力而为地协同帮助丢失数据的恢复;组播路径上的上游节点和源节点在本地恢复无法完成丢失恢复时,提供丢失恢复帮助。CoreRM算法使用周期性发送SPM包来应对Ad hoc网络中拓扑的频繁变动,使用NAK抑制策略来避免NAK风暴。算法的设计主要目的是将Ad hoc网络中产生的丢失恢复在整个网络中分散处理,尽量使用最短的距离和最短的时间完成丢失恢复。 通过仿真各种Ad hoc网络环境,对比其它两种非协同式的组播传输协议算法性能,发现使用了协同恢复的CoreRM的性能在各种仿真环境中可靠性要高于非协同恢复算法。我们计划在未来的设计中,将基于窗口或者基于速度的拥塞控制机制引入到CoreRM算法中,进一步的提高算法的可靠性。

[1] Gemmell J, Montgomery T, Speakman T, Bhaskar N, and Crowcroft J. The PGM Reliable Multicast Protocol. IEEE Digital Object Identifier 10.1109/MNET.2003.Volume 17,Issue1, Jan-Feb. 2003: 16-22.

[2] Gopalsamy T, Singhal M, Panda D, and Sadayappan P. A reliable multicast algorithm for mobile ad hoc networks. 22nd International Conference on Distributed Computing Systems,Vienna, Austria, July 2-5, 2002: 563-570.

[3] Ouyang.B and Hong Xiao-yan, and Yi Yun-jung. A comparison of reliable multicast protocols for mobile ad hoc networks. Proceeding IEEE, SoutheastCon, 2005, April 8-10,2005: 339-344.

[4] Chandra R, Ramasubramanian V, and Birman K P.Anonymous gossip: improving multicast reliability in mobile ad-hoc networks. Distributed Computing Systems, Arizona,USA, 2001, April 16-19, 2001: 275-283.

[5] Fung Alex and Sasase Iwao. Hybrid local recovery scheme for reliable multicast using group-aided multicast scheme.WCNC2007, Hong Kong China, March 11-15, 2007:3478-3482.

[6] Koutsonikolas D, Hu Y C, and Wang Chih-Chun. Pacifier:high-throughput, reliable multicast without“crying babies”in wireless mesh networks. IFOCOM 2009. The 28th Conference on Computer Communications. Rio de Janeiro,Brazil. April 19-25, 2009: 2473-2481.

[7] Fen Hou, Cai L X, Ho Pin-han, Shen Xuemin, and Zhang Junshan. A cooperative multicast scheduling scheme for multimedia services in IEEE 802.16 networks. Wireless Communications, ISSN: 1536-1284, March 2009: 1508-1519.

[8] Alay O, Pan Xin, Erkip E, and Wang Yao. Layered randomized cooperative multicast for lossy data: a superposition approach.. CISS 2009.43rd Annual Conference,Baltimore, MD, March 18-20, 2009: 330-335.

[9] Zhu Yufang and Kunz T. MAODV implementation for NS-2.26. systems and computing engineering, Carleton University, Technical Report SCE-04-01, January 2004.

[10] Saikia L P and Hemachandran K. Reliable multicast protocol adopting hierarchical tree-based repair mechanism. ICACT 2009.11th International Conference, Gangwon-Do, South Korea, Feb. 15-18, 2009: 1969-1973.

[11] Feng Gang, Zhang Jing-yu, and Xie Feng. Efficient buffer management scheme for loss recovery for reliable multicast[C]. Proceedings of IEEE Globecom 2004, Dallas,USA, 2004: 1152-1156.

猜你喜欢
重传延时数据包
基于Jpcap的网络数据包的监听与分析
基于级联步进延时的顺序等效采样方法及实现
日光灯断电关闭及自动延时开关设计
SmartSniff
面向异构网络的多路径数据重传研究∗
Two-dimensional Eulerian-Lagrangian Modeling of Shocks on an Electronic Package Embedded in a Projectile with Ultra-high Acceleration
数据链路层的选择重传协议的优化改进
桑塔纳车发动机延时熄火
MPTCP中一种减缓缓存阻塞的重传策略
移动IPV6在改进数据包发送路径模型下性能分析