黄志威,王富章,阚庭明
(中国铁道科学研究院,北京 100081)
轨道交通信息系统
基于P2P技术的PIS大文件传输研究
黄志威,王富章,阚庭明
(中国铁道科学研究院,北京 100081)
多媒体文件分发是PIS中一个重要的部分。本文阐述了PIS中多媒体文件的传输方式,基于PIS网络结构对PIS文件传输模型进行了研究。运用P2P文件传输技术实现PIS大文件传输的负载均衡。
对等网络;乘客信息系统;P2P;BT;文件传输;负载均衡
现代化城市轨道交通系统中,乘客信息系统(PIS,Passenger Information System)以文字、音频和图像等多媒体形式为乘客提供了直观的乘车信息、丰富的媒体内容和便捷的出行体验。随着PIS的逐渐完善,系统内媒体资源更加丰富,媒体播放的画质更加清晰,PIS媒体文件从几百M增长到几G甚至几十G的大小,这些媒体文件分发对PIS的文件传输能力提出了更高的要求。
PIS依托于城市轨道交通线路的网络拓扑结构构建而成,主要由中心子系统和各个车站子系统组成。各车站的播放控制器从中心系统取得车辆到发信息、文字广播信息、媒体播放信息等资源,将这些信息整合成图像和音频输出到位于站台、站厅、出入口的LCD显示设备,呈现给乘客。城市轨道交通的线路控制中心设有该线路PIS的中心服务器。中心服务器由多个具有不同功能的服务器组成,这些服务器实现了PIS后台管理、设备控制、数据统计、计划编播等功能,管理视频信息,车辆到发信息,图片文字信息等内容,将这些信息发布到播放控制器。
PIS中心子系统的PIS媒体编辑与发布平台主要由媒体管理服务器、数据库服务器、文件服务器组成。媒体管理服务器完成PIS的文件上传、审核、发布以及播放计划编辑的工作。文件服务器存储PIS多媒体文件,提供媒体上传和媒体分发。PIS车站子系统由播放控制器组成,播放控制器按照媒体管理平台提供播放计划下载指定媒体资源。PIS媒体编辑与发布系统的结构如图1所示。
图1 PIS媒体编辑与发布系统结构图
传统PIS的媒体文件发布通常采用客户端/服务器模式(C/S模式)。这种模式基于PIS集中式管理的特点,一般使用FTP文件传输协议或者WebDAV协议。其媒体文件传输模型如图2所示。
图2 PIS C/S传输模型
这种模式下,PIS中所有播放控制器各自连接到文件服务器下载媒体文件。显然,随着PIS对媒体播放质量要求的提高以及城市轨道交通线路车站的增加,文件服务器端的网络传输压力会随之增加。整个系统中播放控制器的数量直接影响到PIS文件传输的性能。
由于C/S模型的传输特点,播放控制器数量增加对PIS的网络要求也会增加,导致PIS带宽固定时播放控制器不能随意增加,很大的限制了PIS对于不同轨道线路的扩展的灵活性。
因此,在播放器数量较多时这样的传输需求是无法实现的。这种模型下要改善PIS的传输性能就只能增加文件服务器以及网络交换机性能。但是这样增加了硬件成本,对传输性能的改善却很有限。
综上分析,基于C/S模式的文件传输,随着PIS播放控制器数量增加会使文件服务器的负担增加出现传输瓶颈。若播放控制器超过了限制,最终会导致下载速度过慢无法完成系统传输要求,长时间的占用网络资源还会出现网络阻塞甚至崩溃的情况。
在文件交换领域有一种新的网络传输模型,叫做对等网络(P2P,Peer to Peer)。其根本思想是处于网络中的所有节点是对等关系,某一节点不只可以从网络中任一节点获取资源,还要向其他节点提供已有资源。
观察PIS网络结构,每个播放控制器都是PIS网络中的节点,那么就可以采用P2P模型利用播放控制器组成对等网络。传统结构中播放控制器全部从文件服务器下载媒体文件,导致文件服务器的传输负担很大,但是播放控制器节点一端的网络带宽没有完全利用,甚至播放控制器的上传带宽一直是闲置状态,而文件服务器却出现了文件上传的传输瓶颈。通过对等网络,可以使播放控制器不是单一从文件服务器下载资源,允许网络中的播放控制器从对等网络中任意一个节点获取资源。每个播放控制器都能共享已下载的媒体资源同时利用了播放控制器上传的网络带宽,克服文件服务器端的传输瓶颈。
如图3所示,在基于P2P技术的分布式媒体文件传输中,所有节点是对等的关系,利用每个播放控制器节点的传输资源来分担文件服务器的工作,文件服务器只要把文件随机下发给一个或几个媒体播放器即可,不需要向每个播放控制器都传输媒体文件就能够完成所有播放控制器的传输,所以使得PIS的文件传输性能得到很大的改善。
图3 基于P2P的PIS传输模型
C/S模式的PIS中,播放控制器增加,传输速度变慢,改善传输性能往往通过投入更多的硬件资源,比如增加服务器或者增加文件服务器带宽来解决,但是对PIS文件传输时间的改善却很有限。基于P2P技术的主要特点在于充分利用分布在PIS网络中的边缘性网络资源,包括播放控制器的计算资源、带宽资源、内容资源等,以降低对文件服务器资源的消耗。这种结构随着播放控制器增多网络的资源节点增加,服务能力也增加,不需额外投入硬件,具有可扩展性。
4.1 树状结构模型
基于P2P传输模型的PIS将一个大文件分割成多个文件块进行传输,当一个播放控制器下载完一个文件块后,就可以将这个文件块传输给其他没有下载的播放控制器。播放控制器下载完所有文件块之后,将这些文件还原成完整媒体文件。
基于该模型,文件服务器将文件块传给某几个播放控制器,播放控制器接收完该文件块再传给其他的播放控制器,依次类推。这种结构类似于树形称为树状结构,如图4所示,分支度为2的树状结构中,根节点同时向2个播放控制器传输文件块,每个内部节点的播放控制器都有2个子节点。图中设传输带宽为B;一个完整文件的分块数是C;带宽B传输完整文件的时间是单位时间1。
图4 树状结构图
由这个树状结构图分析PIS媒体文件的分发过程:在时间点t= 0时,文件服务器同时向播放控制器□1和播放控制器□2传输第1个文件块,每个播放控制器的带宽是B/2。在2/C时间点,□1 、□2播放控制器接收完第1个文件块,分别向□3 、□4 、□5 、□6播放控制器提供第1个文件块的传输服务,同时文件服务器向□1 、□2播放控制器传输第2个文件块。依此类推,当t= 2时,文件服务器将完整的文件全部传给□1 、□2播放控制器,每层的传输延迟了2/C个单位时间。
若该树状结构的分支度为k,则根节点的文件服务器下有k个子树,每个子树中有N/ k个播放控制器(N为播放控制器数量),树的高度为,树中每层的延迟k/C,所以末端节点在的时间点完成整个文件的下载,树状结构的文件分发所需时间:。
从树状结构的分发时间的公式可以看到通过对播放控制器数量N取对数(即),大大减少了N对时间t的影响,同时调节分支度k可以调节文件的分发时间。并且随着传输媒体文件的增大,文件分块数C可以进一步降低N的影响。通过这个公式可以推算出基于该模型的PIS的理论传输时间。
4.2 树状结构的优化,并行树状结构
在上述分支度k=2的树状结构中,至少需要2倍时间才能完成下载;而且,播放控制器的带宽没有被充分利用,树状结构最末端的播放控制器没有上传文件,几乎占播放器总数的一半。随着k增大,这种不对等的情况会更加严重,没有充分体现P2P网络中节点平等的原则。
并行树状结构是对树状结构的带宽利用不均的改进,它是由k个延伸树所组成的树网,在每个树中,都包含所有的播放器节点,如图5是两个延伸树(k=2)的并行树结构。通过图5可以得出,并行树状结构有一个节点一直作为末端节点,其它节点都会在树的内部节点中出现一次,作为内部节点服务其它节点。
图5 并行树状结构图
分析图5的文件传送过程:首先将文件分成k部分,每部分交给并行树其中一棵延伸树分发,如图5中2个延伸树,则把文件分为两部分,每个树各负责其中一部分的传输。如果把文件分成C块,那么每个部分负责的文件块数就是C/ k块。
在C=4,k=2时,图5并行树传输分析如下:时间点0时,文件服务器将不同的两部分文件分发2个播放控制器(每个播放控制器占B/2的带宽)。第1部分文件的第1小块发给,第2部分文件的第1小块给。在时间点2/C时,、已经同时接收完第1个区块文件,各自将其分发给另外2个新的播放控制器(发给、,同时发给、),同时文件服务器发送第1部分文件的第2块给, 第2部分文件的第2块给。在时间点4/C时,、接收完两部分文件,、、、接收完各自文件,各自发给各自2个新的播放控制器,依次下去。从图中可以看到除了之外,其它播放控制器都在一棵树中做内部节点。
通过分析得出,外分支度为k的并行树模型,树的层数是logkN。每个节点的传输带宽是B/k,树中每一层的延迟是k/C,末端节点的时间点接收到文件。那么并行树结构的文件传输时间是
这种结构有效改善了树状结构带宽分配不均的缺点,通过比较这两个公式,播放控制器数量小于文件的分块数时,并行树结构的传输模型优于树状结构。PIS传输大文件时,文件分块数要远远大于播放控制器数量。所以在网络环境稳定的PIS中,并行树结构具有更好的数学模型。
观察公式可以得出,在k=e时,并行树结构的文件传输时间可以取得最小值。实际分支数k只能是正整数,所以k的最佳值是3。
当文件G=8 GB,文件分块大小在256 KB,分支度k=3时,播放控制器数量在100~500之间的并行树状结构传输时间如图6所示。随着播放控制器数量增加,传输时间的曲线变得更加平滑,500个播放器时并行树状结构的增加时间不超过万分之六。
图6 并行树状结构文件传输时间
基于P2P技术的PIS传输大文件时,文件分片块数C很大,播放控制器数量N相对很小,所以并行树公式可以近似看成TpTree(C,k,N)≈1。例如,播放控制器数量增加时系统传输时间增加小于万分之六,若文件传输为2 h,其万分之六的增加仅为4.32 s,可以忽略。
通过P2P理论模型分析可见,即使媒体播放器大量增加时,PIS的文件传输性能基本保持不变。因此基于P2P技术的PIS具有很好的可扩展性,播放控制器数量对系统的传输影响极小。
根据对P2P传输模型的分析,PIS中实际采用接近于并行树传输模型的BitTorrent传输协议(简称BT协议)实现PIS的P2P网络传输。BT协议是一套完善、成熟的基于P2P技术的文件传输协议。采用这种现有的成熟协议,可以节省PIS传输协议的开发成本,并且使系统更稳定可靠。
在媒体上传阶段,PIS媒体管理服务器根据上传到文件服务器的媒体文件生成扩展名为.torrent的“元文件”,该文件中记录着媒体文件的分块信息。媒体资源发布时,文件服务器的完整的媒体文件作为原始的seed(即“种子”),播放控制器从媒体管理服务器获取对应的.torrent文件。媒体管理服务器作为tracker服务器,帮助播放控制器互相寻找对方存储的媒体文件,对文件服务器和所有播放控制器的信息进行维护。当媒体管理服务器收到一个播放控制器的请求时,记录下该播放控制器的信息并将其他下载该文件的播放控制信息返回给它。播放控制器再根据这些信息与其他播放器建立连接下载文件片段。当一个播放控制器下载完成时,就成为一个种子,向其他播放控制器提供下载服务。所有的播放控制器自组织形成一个P2P网络。
在这样的网络中,文件服务器不需要为所有播放控制提供媒体文件下载。每个播放控制器在下载文件片段后成为下载服务的提供者。大量文件下载负担被均衡到所用参与下载的播放器中,随着PIS播放控制器数量增加,下载媒体文件的节点增加,能够提供下载的节点也增加了。播放控制器的增加使PIS中P2P网络整体的硬件能力也增强了。那么负载均衡以后,PIS播放控制器的数量几乎不会影响系统传输性能。基于P2P技术的PIS充分利用了系统用各个播放控制器的资源,使PIS的可扩展性有了本质的提高。
实际应用中需要注意的是:P2P文件传输时,每个节点网络带宽资源都被充分的利用,若BT不做限速,整体的网络负载在文件传输时大大增加,而影响到网络中其他系统。因此,为避免出现P2P网络占用全部的带宽资源,对P2P网络做限速优化设置是必要的。
另外,PIS的P2P传输模型可以在现有PIS上进行升级。在原有网络中构建P2P虚拟网络,只需要对软件的传输协议进行升级(例如将FTP或WebDAV改为P2P传输协议),不改变PIS的硬件设备,节省了系统升级的时间和成本,减小了系统升级对城市轨道交通运营的影响。
PIS的网络结构固定、硬件资源稳定可靠的系统特性使得其非常适合P2P技术的应用;播放控制器作为网络节点稳定地存在于系统网络中,消除了P2P文件传输中种子资源不固定情况。
本文结合城市轨道交通乘客信息系统现有的网络环境特征和P2P技术的网络结构特点实现了PIS超大文件的传输。通过在PIS的基础网络上构建P2P虚拟网络,合理利用边缘网络空闲的带宽和计算资源,充分利用播放控制器的网络资源,实现网络传输的负载均衡。PIS基于P2P技术的文件传输打破了以传统的C/S方式更新文件的思想,创新地将P2P技术应用于PIS的多媒体文件传输中,这种架构大大提升了PIS的文件传输能力和可扩展能力,并且降低了系统对网络带宽要求和网络硬件要求,节省建设PIS 的成本。同时在大文件传输方面,本文也可以为其它与PIS网络结构相似的系统提供参考。
[1] 管 磊. P2P技术揭秘[M]. 北京:清华大学出版社,2011.
[2] 阚庭明.城市轨道交通乘客信息系统技术发展趋势探讨[J].铁路计算机应用,2009(1).
[3] 张庆丰,李东琦,唐慧佳. 基于P2P分布式文件传输系统的研究[J].微计算机信息,2007(23).
[4] 丁树奎,陈忠兴,朱胜利,等.城市轨道交通乘客信息系统(PIS)技术[C].中国城市轨道交通新技术,2009.
[5] 朱渊萍, 陈素芬.基于P2P技术的文件分发结构的研究[J].南昌工程学院学报,2007(1).
[6] 赵 鹏, 刘明生. BitTorrent原理分析与建模[J].计算机科学,2009(4).
[7] 邢小良. P2P技术及其应用[M].北京:人民邮电出版社,2008.
责任编辑 王 浩
Large fi le transfer for PIS based on P2P technology
HUANG Zhiwei, WANG Fuzhang, KAN Tingming
( China Academy of Railway Sciences, Beijing 100081, China )
Multimedia files distribution was an important role in Passenger Information System(PIS). This paper expounded the transmission mode of the multimedia data in PIS, researched on the file transmission model of PIS based on its network architecture, implemented the load balancing of large fi le transfer for PIS based on P2P technology.
peer to peer network; Passenger Information System; P2P; BT; fi le transfer; load balancing
U231.7∶TP39
A
1005-8451(2015)10-0059-05
2015-01-30
黄志威,在读硕士研究生; 王富章,研究员。