论P2P文件共享系统的节点行为特征

2012-05-17 11:56唐晶晶张玉瑛黄自强
湖南人文科技学院学报 2012年2期
关键词:总数定义状态

唐晶晶,张玉瑛,黄自强,龙 佳

(湖南人文科技学院 计算机科学技术系,湖南 娄底 417000)

当今,Internet在人们生活中各个方面起着非常重要的作用,文件共享是目前Internet上最主要、最成功的P2P应用,可以说文件共享的需求直接引发了P2P技术的产生与开发热潮[1],而且文件共享应用已经成为当今互联网流量的重要组成部分[2-3]。因此,P2P文件共享系统的节点行为特征研究是整个网络通信领域研究的热点之一。P2P文件共享系统的节点行为特征研究需要解决的一个关键问题是如何准确地刻画文件的复制传播特性。文件复制传播特性的研究有两个方面的意义:一是加深研究对P2P文件共享系统的认识,包括定性和定量的认识;二是为P2P文件共享系统的流量分析和控制提供指导。

由于P2P文件共享系统中文件复制传播范围很广,而且具有突发性,通过在真实网络环境中观测来精确地研究其传播特征是不可行的。通过统计分析的方法来仿真建模是进行研究P2P文件共享系统中文件复制传播的一种重要的手段。文件复制传播模型是通过一组微分方程或者离散的递归表达式来描述文件在网络中复制传播的统计规律和动态过程。由于文件在网络中的复制传播与流行疾病在人群中传播有许多相似之处,因此,本文运用系统动力学方法提出基于SEIR的文件复制传播模型(以下简称SDFCM模型),从定性和定量两个方面来研究文件在网络中复制传播的过程。

一 SDFCM模型

(一)基本概念

定义1 S态是指用户节点在提出文件下载请求前,在文件共享系统中搜索和查找文件时的状态。集合S的元素总数记为s, 时刻t的S态节点总数记为s( t)。

定义2 P态是指用户节点在提出下载请求后,会进入下载队列等待下载完成的状态,相当于疾病传播模型中的潜伏期态。集合P 的元素总数记为p, 时刻t 的P态节点总数为p( t) 。

定义3 用户节点在提出下载请求后,进入下载队列等待文件下载的时间段记为π。

定义4 I态是指当用户节点下载文件完成后,可能会共享该文件一段时间的状态。集合I的元素总数记为i, 时刻t 的I态节点总数记为i( t) 。

定义5 Q态是用户节点在文件共享系统中搜索和查找文件后,对该文件不感兴趣,没有提出下载请求后的状态。集合Q 的元素总数记为q, 时刻t 的Q态节点总数记为q( t) 。

定义6 用户节点完成下载文件后并不共享该文件或者共享该文件一段时间后删除了该文件,此时的状态为R态。集合R 的元素总数记为r, 时刻t 的R态节点总数记为r( t) 。

用户节点状态之间的转移关系如图1 所示。

图1 SDFCM模型中用户节点状态转移关系图

(二)数学模型

在SDFCM模型中,我们给出两个基本假设:

1)我们分析的是用户节点的统计变化规律,使用在一个时间段上各种状态下用户节点的统计数目来描述其行为的变化,并通过微分方程来描述用户节点在文件传播过程中行为的变化。

2)环境封闭原则,即所研究的各种状态用户节点的总数量和没有发生变化,并假设所有用户节点的总数为N。

根据上面的两个基本假设和用户节点状态转移关系图,建立微分方程组。

S态的用户节点数量随时间变化的速度为:

(1)

其中α是单位时间内S态的用户节点对某种文件感兴趣,并提出下载请求的概率,设α=ω(1-p(t)/N)λ,一般情况下ω=0.5,λ=3[4-5];β是单位时间内S态的用户节点对某种文件不感兴趣,不会提出下载请求的概率,β=1-α。

P态的用户节点数量随时间变化的速度为:

其中δ是单位时间内P态的用户节点经过等待后下载完成并愿意共享该文件的概率,设δ=δ0(1-i(t)/N)λ/π。

一般情况下,δ0=0.8/N,λ=3,ε=1-δ[4-5]。

I态的用户节点数量随时间变化的速度为:

(3)

其中μ=K/Ts,Ts是I态的用户节点愿意共享该文件的平均时间,一般情况下K为一个经验值,可以根据实际情况而定。

R态的用户节点数量随时间变化的速度为:

(4)

Q态的用户节点数量随时间变化的速度为:

(5)

二 SDFCM模型仿真与分析

我们使用BitComet系统中记录用户节点上传和下载信息的日志文件来构造实验环境。

实验环境说明如下:

1)假设所有用户节点在会对其中的某些流行文件感兴趣,选取BitComet系统中MP3格式的流行度排名在前5名的文件,它们分别以A,B,…,E来表示,作为我们的实验数据。用户节点数是指系统注册号不同的节点。

2)由于系统中存在一些不上传文件的节点,设节点共享概率等于系统中既上传又下载的节点数量和所有下载节点的数量的比值。

3)平均下载速度定义为所有用户节点的下载量除以所有用户节点自进入下载队列排队到下载结束这段时间的商。平均下载速率除以文件长度即是单位时间的下载完成速率。

表1 实验结果

实验结果如表1所示。可以看出,用户日志记录的下载完成用户数据和实验结果相差不大,吻合性很好,说明我们的模型具有很好的实用性。

本文提出的SDFCM模型能够比较合理地刻画P2P文件共享系统中文件复制传播过程特征。该模型从定性和定量两个方面对文件复制传播过程进行建模,通过实验来验证了模型的合理性和实用性。如何对模型进行改进,使其能适用于P2文件共享系统规模动态变化等情况,是今后的研究工作之一。

参考文献:

[1]MOORE D,HEBELER J.对等网[M].苏忠,战晓雷,等译.北京:清华大学出版社,2003.

[2]AZURI C , IPOQUE.Internet study 2007:P2P file sharing still dominates the world wide Internet [EB/OL].http://www. ipoqpe.com,2007.

[3]The true picture of Peer-to-Peer file-sharing [EB/OL].http://www. cachelogic.com/researh/Cache-Logic_Analyst_Presnetation_july2004.Pdf, 2004.

[4]戴明强,李卫军,杨鹏飞.数学模型及其应用[M].北京:科学出版社,2007.

[5]马知恩.传染病动力学的建模和研究[M].北京:科学出版社,2004.

猜你喜欢
总数定义状态
状态联想
◆我国“三品一标”产品总数超12万个
生命的另一种状态
哈哈王国来了个小怪物
“一半”与“总数”
坚持是成功前的状态
成功的定义
修辞学的重大定义
山的定义
教你正确用(十七)