“VMware可以解决私有云问题,Amazon AWS可以解决公有云的问题,而在公有云、私有云这两个方面都有一个完整、可靠的解决方案的,我相信只有我们能做好”。青云QingCloud CTO甘泉平静而坚定的话语掷地有声。
甘泉能够如此自信,源于QingCloud网络架构的SDN/NFV 2.0成功升级给QingCloud带来的几乎无限的水平扩展能力,以及由此给QingCloud带来的在公有云和私有云领域进一步巩固其领先地位的契机。
虽然基于SDN/NFV 1.0网络架构的QingCloud拥有众多用户,但是随着用户规模的逐渐扩大,QingCloud在运营的过程中发现,如果网络架构不做改变,未来将会面临非常大的挑战。
青云QingCloud CTO 甘泉
甘泉表示,QingCloud从2013年上线至今,经过两年多的发展,QingCloud的用户在规模上有了质的变化,而且从现在的用户规模发展的趋势来看,很快就会有超级用户落户QingCloud。这些超级客户可能会有上千台物理机的规模,从而使得虚拟机的规模达到上万台。而面对上万台虚机规模的部署,QingCloud现在的SDN/NFV 1.0网络架构就会遇到很大的挑战。
首先,青云QingCloud的SDN/NFV 1.0网络架构实现的虚拟网络是对物理网络的模拟。所以青云QingCloud的SDN/NFV 1.0网络是一种树状结构。树状结构在中小规模部署的时候没有问题,这是为什么QingCloud的SDN/NFV 1.0网络能够一直用到现在的原因。然而,当大规模部署成为现实的时候,这种树状结构就会导致节点之间的交互、延迟越来越高,整个系统的性能也会随之快速降低。这是QingCloud的SDN/NFV 1.0网络架构最根本的一个问题,除非对网络架构进行改变,否则无法从根本上解决这个问题。此外,对于私有云用户而言,他们通常会把虚机当作物理机来用。这样的话,用户将不能忍受IP的改变。因为对于物理主机而言,IP地址是这台机器的惟一标识,因此,在虚拟环境中,用户也需要每台虚拟机的IP地址固定,即使该虚机在虚拟环境中随意迁移。这在小规模部署的时候,矛盾并不突出,但在大规模部署时,面对成千上万台需要保持IP地址不变的虚机,这将是一个巨大的挑战。
其次,从功能性的要求方面来说,青云QingCloud的SDN/NFV 1.0虚拟网络架构和物理网络的架构并没有本质上的区别,整个虚拟网络与外部网络也是通过虚拟的交换机或者路由器来进行链接。这样虚拟网络中所有的流量最终都会集中在某一个虚拟路由器上,而这个虚拟路由器的性能将会对整个系统的性能产生巨大影响。所以,可以想象,当大规模部署发生的时候,这台虚拟路由器有限的性能将会成为整个系统的瓶颈。
因此,QingCloud必须对现有网络架构进行变革,搭建新一代的网络来适应用户未来的需求。
为了适应未来的挑战,青云QingCloud提出了新一代网络的三大目标:第一,新一代网络要能适应超大规模的部署要求;第二,新一代网络要有接近物理硬件的虚拟网络性能;第三,新一代网络要功能完善,适应各种组网的需求。
基于以上需求,Qing Cloud SDN/NFV 2.0应运而生。QingCloud SDN/NFV 2.0可以实现几乎无限的水平扩展,虚拟机可以在集群里任意迁移,而IP地址保持不变。同时,QingCloud大型的VPC能力,可以在保证性能的情况下,让多达6万台虚拟机实现可用。
甘泉表示,QingCloud SDN/NFV 2.0接近物理硬件的网络性能主要是通过将智能下移至Linux Kernel层来实现。通过在Linux Kernel层实现智能,使得虚拟机之间的网络通讯实现最优路径,摒弃了对软交换机和软路由器的依赖。同时,将所有智能控制集中在Linux Kernel层,大幅提升了网络的性能,并且不会随着规模的扩大而降低性能。
QingCloud SDN/NFV 2.0能够同时保证公网IP全网绑定。即公网IP不仅能够绑定基础网络的主机,也可以绑定私有网络内的主机。通过QingCloud SDN/NFV 2.0的支持,在QingCloud创建的任何一台虚拟主机都可以直接绑定公网IP,这样私有网络跟Internet之间就可以得到几乎无限的带宽,同时,这些私有网络之间还可以实现水平的扩展。此外,负载均衡器也一样可以做到全网直达,并且私有网络的每一台主机都可以绑定防火墙。
甘泉表示,实际上,青云QingCloud新一代的网络架构SDN/NFV 2.0相对于1.0从架构原理上来说没什么太大的变化,只是在实现细节上发生了变化。
首先,QingCloud SDN/NFV 2.0将QingCloud SDN/NFV 1.0的二层网由原来的树状结构变成网状结构,从而实现了所有的交换和通讯都是点对点的。即虚拟主机之间、控制器之间的通讯都是点对点的,不再通过第三方来实现,从而大大提升了通讯效率。
其次,QingCloud SDN/NFV 2.0将QingCloud SDN/NFV 1.0 的 VR(Virtual Router,虚拟路由器)拆分成了一个ER(Edge Router,边缘路由器)以及若干个DR(Distributer Router,分布式路由器),这些DR和一个ER实现了以前一个VR的功能。同时,在控制层面,将一个VPC的控制器分解成若干个分布式控制器,从而实现了系统性能的水平扩展。
第三,相对于QingCloud SDN/NFV 1.0,在 QingCloud SDN/NFV 2.0中,EIP、公网IP不仅可以绑定在ER(Edge Router)上,更可以直接绑定到VM上。这就使得整个网络的通道变得非常宽广,整个网络的效率也有了一个质的变化。
简单的讲,QingCloud的SDN/NFV 2.0版本相对于1.0版本的重要变化就是使用网状网络取代树状网络;分布式网关取代传统的集中式路由器,分散流量到每个计算节点;基础网络结合了物理网络和虚拟网络。
通过这些实现细节的改变,青云QingCloud获得了水平扩展的能力,从而给系统提供了近乎无限的性能扩展能力,解决了未来大规模部署遇到的难题。同时由于使用了分布式控制器,青云QingCloud将不需要用户拥有支持SDN/NFV 2.0的交换机或路由器,这就使得用户的网络变得灵活而具有弹性,并且不会依赖于任何厂商的硬件,从而在保护IT投资的同时又避免了厂商绑定。
甘泉透露,采用全新SDN/NFV 2.0架构部署的北京三区将会在近期对用户全面开放,北京三区不仅在内部的网络结构上有所变化,在机房结构上有了很大的变化,同时,还具备了更强的抗DDoS能力。青云QingCloud相信这个新的采用SDN/NFV 2.0网络架构的北京三区会对所有私有云用户具有非常强烈的吸引力。同时,从2016年起,青云QingCloud的私有云以及公有云都会采用新的SDN/NFV 2.0网络架构来部署。
甘泉最后表示,青云Qing Cloud之所以要做SDN/NFV 2.0,绝不是为了噱头,只是为了更好满足用户的需求,无论过去、现在和未来,青云QingCloud都将遵循这一理念继续的走下去。