信阳农林学院信息工程学院 潘 赟
新型数据中心网络的体系结构探究
信阳农林学院信息工程学院 潘 赟
【摘要】传统的层次结构数据中心网络已经不能满足新技术发展的需要,针对此类问题,文章介绍了PortLand、SecondNet和Jellyfish等几种新型的数据中心网络的体系结构。并总结了未来数据中心网络未来的发展方向,要对数据中心网络协议进行探索和改进,流量以及失效规律进行测量与建模,体现节能机制等。
【关键词】数据中心;体系结构;网络
传统的DCN(data center network)是利用网络中的分布在多处的大量服务器通过高速介质以及大量互连设备链接起来工作的。传统的体系机构利用分层划分的方式实现对整个网络的规范和管理。但是随着云计算和大数据技术的日益发展,传统的网络中心结构已经不能满足网络日益发展的需要,主要表现在以下几个方面:
1)现在的网络规模发展非常快,需要服务器的数量也是越来越多,就目前的网络规模而言,需要的服务器的数量最少也要几十万个。
2)现在的网络需要的流量也是越来越大,因为MapReduce和虚拟机迁移的应用非常广泛,这些技术都是带宽密集型的应用,这就要求数据中心内部的流量非常高[1]。这些流量占总流量的80%左右。
3)传统的网络结构只能用来辅助设计高效的路由算法,而现在很多新型的数据中心结构和传统的结构存在很大的差别。
4)现在数据中心应用最广泛的技术就是虚拟化技术,这样就要求数据中心网络必须要能够实现虚拟机的任意迁移和部署,同时还不能对应用层产生任何的影响。
5)现在的数据中心内有很多的服务器和交换机,在此情况下,数据中心网络还必须要即插即用。
6)就全球网络的资源而言,现在数据中心网络的能耗是最高的,同时数据中心的超过80%的链路负载非常轻。传统的数据中心网络结构的能耗更高。
在新型的数据中心网络的体系结构方案中,有一个重要的特点就是需要改变现有网络的互联方式和路由机制,文章选用3个代表新方案PortLand、SecondNet和Jellyfish。
2.1PortLand结构
PortLand体系结构如图1所示。该体系结构是由FatTree网络结构演变而来,传统的树形网络拓扑中,带宽是逐层减小的,树根处的网络带宽要远小于各个叶子处所有带宽的总和。而FatTree网络则更像是真实的树,越到树根,枝干越粗,即:从叶子到树根,网络带宽不减少,这一特点也是是其能架构支撑无阻塞网络的基础。
图1 AMAC与PMAC的映射
PortLand与FatTree网络两者最大的区别就是PortLand结构使用了一个重要的参数[2],此参数就是基本结构管理者(fabric manager),同时还通过层次伪MAC地址负责分组和转发。该体系结构在FatTree网络的基础上构建了第二层路由选择和转发的协议,但是PortLand需要升级原始交换机才能满足层次协议的要求。
2.2SecondNet体系结构
SecondNet体系结构如图2所示,此体系有个重要的特点,那就是引入了一种重要的参数,此参数是VDC管理者(VDC manager),此参数的主要任务是完成行VDC创建、调整和删除。同时通过此参数和交换机还可以实现系统的计算。此图中的虚线表示VDC 管理者的树形管理系统,此图中粗实线表示的是一条PSSR路径[3]。
图2 SecondNet 体系结构
2.3Jellyfish体系结构
此体系结构如图3所示,传统的网络结构在很大程度上限制了网络的扩展,为了得到更短的平均路径长度,同时实现减小网络耗费,学者才提出了此体系结构。次体系重要的一个特点就是可以在ToR交换机层上构建一个随机图,从而获得相对更短的路径长度,并相应的减少网络的功耗。
Jellyfish可以获得比FatTree更优化的路径长度,且能获得更大的带宽。但是网络拓扑结构的改变,网络拓扑更加随机,带了的是布线方式的挑战,特别是在连接Jellyfish集装箱数据中心的时候,如何使用光钎布线是一个突破点。另外网络中也要考虑如何进一步优化Jellyfish网络的路径选择机制。
图3 Jellyfish拓扑
前面论述了几个新型的数据中心网络的体系结构,未来数据中心网络未来的发展方向,必须要对数据中心网络协议进行探索和改进,流量以及失效规律进行测量与建模,体现节能机制等。
1)互联网络多采用分布式系统处理方式,目前,许多研究者也提出了很多的网络结构,新的网络产品和传输介质的不断更新,对于提出新兴网络结构的研究是很有意义的,但是也是需要经过长期的研究和实践的验证。
2)所有数据网络协议都要进行改进,包括从网际接口层到传输层的所有协议。新的网络设备的出现,改变的传统的网络体系结构层次的功能,以至结构和协议存在很大的区别,而在互联网覆盖面更加广泛的前提下,就更加迫切的要求对应协议的改进,以保证网络运行的安全性和有效性。
3)需要进行流量以及失效规律的测量与建模。在新型的网络中存在很多异构的网络,所有网络的流量模式也不尽相同。所以就必须要通过多种的架构进行处理,进行数据中心流量和失效特征进行深入的研究,并实现测量和建模分析。因为只有通过数据的分析才能更好的构架出科学的数据中心网络模型。
4)在整个网络运行中体现低能耗。现在全世界对设备能耗的的要求越来越重视,这就要求网络体现结构以及运行过程中使用到的设备要尽可能的低能耗。包括网络中设备的低能耗、路由转发时的低能耗,以及转发节点和虚拟机的低能耗等方面。
文章论述了讨论了传统的网络体现结构在新的网络环境下存在的缺陷及存在的问题。针对这些问题,文章着重论述了PortLand、SecondNet和Jellyfish等体系结构,以及在未来的发展过程中要涉及到的几个方面。
参考文献
[1]黎宏剑,刘恒,黄广文,卜立.基于Hadoop的海量电信数据云计算平台研究[J].电信科学,2012,(8):80-83.
[2]高明,金澈清,王晓玲,田秀霞,周傲英.数据世系管理技术研究综述[J].计算机学报,2010,33(3):373-389.
[3]宫学庆,金澈清,王晓玲,张蓉,周傲英.数据密集型科学与工程:需求和挑战[J].计算机学报,2012,35(8):1563-1578.
[4]郑亦梁.Web数据挖掘和个性化搜索孙擎研究[J].通讯世界,2016(3):240.
[5]任新社,陈静远.关于数据挖掘研究现状及发展趋势的探究[J].信息通信,2016(2):226.