摘 要:随着网络日益的广泛化,人们对信息的需求量越来越大。在强大的信息冲击下,P2P适时地出现了,但对于任何一个可扩展的P2P网络而言,限制带宽和扩展节点两方面取得平衡是一个很重要的需求。本文讨论了P2P网络资源检索性能的带宽可扩展性,对几种优化资源检索的解决办法做了分析,并提出了资源优先检索的思想。
关键字:P2P;可扩展性;资源优先检索
1 前言
P2P(peer-to-peer),即对等网络或对等计算,网络的参与者共享他们所拥有的一部分硬件资源(处理能力、存储能力、网络连接能力、打印机等),这些共享资源通过网络提供服务和内容,能被其它对等节点(Peer)直接访问而无需经过中间实体。P2P体现在对等性,它是一种网络模型,由大量高度动态的节点组成。网络中的节点都是对等的,同时是动态的,可随时加入或退出,并具有相同的能力。与传统的C/S网络结构的本质区别是,整个网络不存在中心节点。
2 P2P动态网络中对等节点和资源检索
让对等节点发现和使用相互提供功能的技术,可能是P2P技术的最大特点之一,同时也是有别于C/S结构的网络技术的最为明显的标志之一了。目前,资源的定位一般采用的是"地址查询"的方法,即:每个资源有一个全局唯一标识符OID和一个包含其所在地址的指针P,系统将
2.1 集中目录式
在集中目录式(Central Index Server)中,有一个类似于服务器的节点集中提供资源索引信息,。当用户共享资源时,需将资源的
2.2 泛洪请求式
与集中目录式不同,泛洪请求式(Flooding Request)没有中央目录服务器,用户的请求通过所有连接的节点传递,这些节点或者响应该请求,或者在不能满足请求时,将该请求向与自己相连的其他节点广播,直到请求得到响应为止(泛洪)。Gnutella是泛洪的经典之作,Gnutella协议设置了三种机制来控制消息数量的指数增长。
机制一:消息生存时间(Time-to-Live简称TTL)
机制二:消息的唯一标识符(Unique Message Identification简称UID).
机制三:路径标识符(Path Identification)。
以上三个控制机制保证了消息在网络中不会被无限制的扩散,从而确保Gnutella网络可以正常的运行。
3 P2P动态网络带宽的可扩展性
对于任何一个可扩展的P2P网络而言,限制带宽和扩展节点两方面取得平衡是一个很重要的需求。尽管P2P网络具有节电可扩展的特性,但是随着节点扩展,相应的带宽会被更多的占据。对于资源检索,如何更好的利用带宽和提高检索效率是我们亟待解决的课题。目前的几种检索方式有:非结构化P2P网络中的搜索技术;结构化P2P网络中的搜索技术;基于兴趣局部性优化的P2P搜索。
3.1 资源检索过程的解决方案
对任何一个可扩展的P2P网络而言,在连接位于不同地理位置的节点和限制过多的消耗带宽两方面都取得平衡是一个非常重要的需求。目前存在几种可用于优化资源检索过程的解决方案,并对这些方案进行了分析:
使用路径的多样性来以更高的效率到达虚拟空间内更大范围内的对等节点上。使用路径的多样性,对于扩展带宽增加检索资源,具有很重要的作用。但是同时,增加了算法的复杂性,同时可能会带来检索延时。通过使用特殊目的的对等表产生路由表的方式来最小化路由表的尺寸。
路由表的大小可能会影响路径检索的能力,但是却提高了检索的效率,降低了带宽的消耗。但是基于P2P网络的动态性,在缓冲阵列发生较大变化时(这在P2P网络中非常常见),原有的URL和代理之间的对应关系可能发生改变,从而使得原有的配置文件失效。
禁止资源检索请求和最小心跳注册次数。心跳注册即每隔一段时间,与对等节点通信并注册节点信息,以便及时更新对等节点的资源信息。随着心跳注册次数的减少,在某种程度上可以减少带宽消耗。另外,禁止资源检索请求可以减少广播对带宽的吞噬,但在另一方面却不能够及时地更新资源,使得检索的效率降低。
3.2 资源优先检索
对于监控到的对等节点的资源使用情况,可以确定后面的查询和资源检索情况。对于带宽情况及响应相关参数值可以创建一个关于主题或资源检索的优先顺序列表。对于使用资源的情况,当某些对等节点具有这些资源的参数值很高,那么则优先查询这些对等节点,如果查询这些优先级高的节点失败的时候,才需要查询参数值较低的节点。
这种技术的主要优点是:对等节点组织成对等节点集群,形成能够满足某种类型信息的资源检索请求的对等节点组,使对等节点对资源的检索更有效率。此外,对等节点集群对限制节点所使用的数据包的数量有着全面的影响,从而对为获得某个对等节点所需的特定的响应消息所需的网络带宽有着全局性的影响。缺点是:对参数值较低的对等节点利用率较低,浪费一部分可用资源。
TCP协议主要是提高消息传输的可靠性,那么对于集中目录式的资源检索方式,基于TCP协议的消息传输无疑是最合适的选择。这种机制的安全性不高,集中的服务器必然是系统的瓶颈也会是系统的单一故障点。
Napster就是基于集中式目录机制的,并且是基于TCP协议的。
在泛洪请求式资源检索定位机制中,由于系统的冗余,任何的一个对等节点的失效都不会影响到整个网络,因此UDP协议很适应这种情况。UDP的传输效率非常高,很适合泛洪请求式资源检索机制。但是这种基于UDP协议的检索消耗了带宽,加长了信息的等待时间。而且UDP协议本身是不可靠的传输,所以对于信息检索的可靠性有待提高。
结束语
由于P2P技术的飞速发展,基于P2P的软件越来越多,应用越来越广。带宽可扩展性也成为研究的热点,人们对资源检索的研究也逐渐深入。
本文提出了资源优先检索的思想,在资源检索与带宽可扩展两方面求得一个相对的平衡。同时对资源检索过程的方案作了概括性的分析,综合一些方案我们能够在带宽可扩展性方面取得更大的突破。这是一项很有潜力也很有价值的研究,我们将一如既往地研究下去。
参考文献
[1].Tassiulas and A.Ephremides,Stability properties of constrained queueing systems and scheduling policies for maximum throughput in multihop radio networks.IEEE Transactions on Automatic Control,Vol 37,No 12,Dec.1992,pp:1936~1948
[2]Robert Flenner,Michael Abbott,Toufic Boubez.JAVA P2P 技术内幕.北京:人民邮电出版社,2003.
[3]Lv Q,Cao P,Cohen E,et al.Search and Replication in Unstructured Peer-to-Peer Networks.Proc 16th ACM Int'l Conf Supercomputing,2002.
[4]杨天路,刘宇宏等.P2P网络技术原理与系统开发案例.北京:人民邮电出版社,2007.
[5]Gribble S,Halevy A,Ives Z,et al.What can databases do for peer-to-peer.In:WebDB,California,USA,2001.
[6]罗杰文.Peer-To-Peer综述.中科院计算机研究所
作者简介: 曲志明(1972-),女 (满族),河北省承德市隆化县第一中学信息技术教研组,中学一级教师,主要研究方向:计算机应用。