雷波+解云鹏+王波
摘要:虚拟宽带远程接入服务器(vBRAS)已经成为电信运营商在IP城域网(MAN)引入网络功能虚拟化(NFV)的一个切入点,主要应用在一些小流量、常在线业务场景以及需要集中运营的业务场景。在vBRAS的性能评估方面,可以通过资源占用率等基本指标和稳定系数、均衡系数和无关系数等扩展指标来综合衡量。
关键词: NFV;vBRAS;性能评估
1 vBRAS形态及发展方向
城域网宽带远程接入服务器(BRAS)设备位于城域网边缘,是用户实现各种业务的入口,近年来运营商不断尝试“宽带中国”、智能管道的战略转型,BRAS的关键地位也进一步得到凸显。近年来在新业务、新流量模型的冲击下,传统BRAS的弊端也开始暴露,作为软硬件一体化的专用设备,传统BRAS这种控制与转发紧耦合的架构在一定程度上束缚了城域网的发展。
网络功能虚拟化(NFV)技术的出现,为传统BRAS设备的发展提供了新的思路,通过采用x86等通用硬件以及虚拟化技术,把原有必须通过专用硬件实现的网络功能,改由通用服务器实现,从而实现传统BRAS的软硬件解耦及功能抽象。基于NFV技术实现的虚拟化BRAS(vBRAS)有利于资源的灵活共享,满足业务的自动部署、弹性伸缩、故障隔离和自愈,以及新业务的快速开发和部署[1-4]。
根据控制面和转发面实现方式不同,目前vBRAS的实现主要有3种形态,如图1所示。
其中,形态1为基于通用x86服务器的一体化架构,控制面和转发面运行在单个虚拟机中;形态2为基于通用x86服务器转发的转控分离架构,由通用服务器硬件结合虚拟化软件的网络云资源池来实现转发面,并通过统一云资源池提高业务的集约化管理能力;形态3为基于专用高速硬件转发的转控分离架构,在通用x86服务器实现的控制面控制下,通过专用硬件实现高效而灵活的流量转发。
综合来看,vBRAS将向转控分离的形态(形态2和形态3)演进,形态2适合承载网络电话(VoIP)、虚拟专用拨号网(VPDN)等小流量业务;形态3适合承载宽带上网、高清视频、虚拟现实(VR)等大流量业务。形态1由于可能会导致控制面分散,难以实现集约化的管理,不是vBRAS的发展方向。
2 vBRAS的典型应用场景
基于vBRAS的特点和能力,现有vBRAS主要应用在一些小流量、多并发、常在线业务场景以及需要集中运营的业务场景中。
(1)分流小流量、大并发业务的场景。
目前,现网传统40 G平台BRAS转发能力一般支持100 000用户数,由于BRAS设备控制层面在用户会话性能存在瓶颈,为保障用户突发流量、宽带质量,通常要求并发用户数不超过30 000~40 000,该场景下可通过vBRAS分流现网VoIP等小流量大并发的业务,解决传统BRAS的会话处理能力不均衡问题。
如图2所示,发挥传统BRAS和vBRAS的特点,将占用BRAS控制层面资源,占用会话数,同时将流量要求小的业务(VoIP等)迁移至数据中心的vBRAS部署,宽带上网、交互式网络电视(IPTV)等业务流保留在传统BRAS进行认证及转发。虚拟化汇聚层可基于QinQ等方式区分用户及业务类型,构建到vBRAS的隧道,将不同业务分流到BRAS和vBRAS。
(2)公共Wi-Fi业务集中接入统一认证场景。
公共Wi-Fi业务是一种免费公用无线网络,手机用户在公共場所搜索到特定无线网络后,通过简单的认证流程即可免费使用。公共Wi-Fi业务资源池需要满足用户城域内的集中Portal认证,并根据接入位置推送定制化Portal页面的需求。
如图3所示,Portal认证采用vBRAS资源池部署,利用城域网汇聚交换机或者路由器设备构建虚拟可扩展局域网(VxLAN)大二层网络,形成公共Wi-Fi的Overlay承载网,实现城域网范围内的公共Wi-Fi业务流量的集中认证。
3 vBRAS性能评估的需求
NFV技术提出之后,就一直强调分层解耦、集约管控的原则,以期实现开放、合作、竞争的生态环境。因此NFV重点关注基础设施层、网络功能层和协同编排层之间的南北向解耦,主要包括以下3方面[5-6]:
(1)通用硬件与虚拟化软件的解耦;
(2)虚拟网络功能(VNF)与NFV基础设施(NFVI)解耦;
(3)NVF的管理和编排(MANO)解耦。
其中,为了满足VNF与NFVI的解耦,需要构建一套科学、合理的VNF性能评估方法,以便于同一套评估体系去衡量不同供应商的VNF以及不同专业的VNF。
以vBRAS为例,其业务处理能力与所消耗的硬件服务器资源没有绝对的线性关系,按照传统的通过堆叠测试仪表来测试网元设备最大处理能力的方法并不适用于vBRAS,主要有两方面问题:一是vBRAS的软件处理极限非常高,需要耗费大量的测试仪表资源,而目前的测试仪表价格昂贵,通常是普通网络设备的数百倍,很难在一般的测试环境中堆叠足够多的测试仪表;二是部分vBRAS提供方也没有在实验环境中测试出vBRAS的极限,无法提前计算和规划测试方案与测试资源。
因此继续沿用现有物理网元的测试方案,即简单地将vBRAS及相应底层系统NFVI解决方案放置到现有物理网元设备的测试环境中,按照现有物理网元设备的测试用例进行测试,难以准确测试出vBRAS的性能极值,我们需要找出一种新的性能评估方案。
4 vBRAS性能评估指标与验证
一般而言,对vBRAS性能评估可以通过固定环境下的性能测试和固定需求的性能测试来衡量,在相同业务情况下,系统对资源占用越少则越有优势,但这个问题也不是绝对的,还需要考察其他方面的内容。因此我们将vBRAS性能评估指标分成两类:一类为基本指标,主要是固定业务输入下的资源占用率;一类为扩展指标,通过vBRAS在不同时刻和不同平台上的测试结果综合进行考量。
(1)基本指标,指资源占用率指标,一般包括中央处理器(CPU)、内存、存储和网络等几方面指标,具体包括:
·虚拟机CPU(vCPU)性能的关键指标,包括vCPU使用率、系统调用开销、vCPU绑定率;
·内存(RAM)的主要性能指标,包括访问带宽和延迟;
·硬盘输入输出(I/O)的主要性能指标,包括连续/大块/小块读写的吞吐量;
·网络的主要性能指标,包括传输吞吐量、延迟、抖动和丢包率。
(2)扩展指标,用以衡量vBRAS在不同环境下的运行情况,包括稳定系数、均衡系数和无关系数等方面指标,具体包括:
·均衡系数,用以衡量存在多个相同类型资源时,各个资源占用率是否均衡;
·稳定系数,用以衡量持续测试一段时间后,各项性能指标是否会出现波动;
·无关系数,用以衡量vBRAS在不同NFVI平台上的表现是否一致。
我们假设:
·业务输入X,根据业务需求所制定的业务模型以及一定量的业务输入;
·观察指标G,利用测试仪表所检测的关键性指标,比如丢包率或时延等指标,用以衡量vBRAS是否处于正常工作状态;
·性能指标Y,vBRAS对NFVI平台的资源需求。
那么对于在一定的业务输入X时,当[G≤GH]时,记录此时所得到的性能指标[Y={Y1,Y2,…,YN}],其中[Yn,n=1,…,N]表示vBRAS需要占用多个资源,每个资源的占用率,比如vBRAS需占用多个vCPU,[Yn]表示每个vCPU的利用率。
此外还需要考虑在不同时刻和不同平台上的性能指标是否存在差异,因此还存在两个维度:
·时间维度t,即在不同时刻测试出的性能指标值;
·平台维度j,即在不同NFVI平台测试出的性能指标值。
我们即可以用[Y(t,j)n]表示在j平台上t时刻测试出的第n项资源的利用率。因此对于3个扩展指标可以分别表述如下:
·均衡系数。vBRAS其性能指标与研发能力、编程能力有密切关联,如果系统设计不够合理,就容易出现资源利用不均衡,同类资源的某些部分不够,而另外一些部分却空闲的情况,因此定义均衡系数[α],用以衡量存在多个相同类型资源时,各资源占用率是否均衡。
·稳定系数。由于vBRAS的软件特性,各项性能指标可能会随时间的变化出现波动,因此定义稳定系数[β],用以衡量持续测试一段时间后,各项性能指标的波动情况。
·无关系数。平台无关性是指当存在多个NFVI平台可选择的时候,vBRAS在不同的平台上占用相同资源所实现的业务处理能力接近。因此定义无关系数[γ],用以衡量vBRAS在不同NFVI平台上的表现是否一致。
我们在实验室对两个不同供应商的vBRAS网元进行了测试,两个vBRAS在架构上存在较大差异,vBRAS1采用单虚机模式,在一个虚机内完成管理面、控制面和转发面的功能;而vBRAS2采用多虚机模式,用不同的虚机分别完成管理面、控制面和转发面的功能,因此只通过vCPU利用率是无法衡量vBRAS1和vBRAS2的优劣势。因此我们利用文中提出的3个扩展参数进行了综合评估。
(1)均衡系数。对于vBRAS1占用8个vCPU,而vBRAS2则占用10个,每个vCPU的平均利用率如图4所示。
综合起来,计算出vBRAS1的[α=0.289],vBRAS2的[α=0.366],因此可以认为vBRAS1较vBRAS2利用资源更为均衡。
目前采用黑盒测试法,未区分这些vCPU是用于管理面、控制面和转發面。显然用于管理面和控制面的vCPU的利用率会明显低于用于转发面的vCPU,因此将不同用途的vCPU放在一起比较,会导致评估结果产生一定的偏差。未来可以考虑借助灰盒测试法,区分vCPU的用途,分别比较用于管理面、控制面和转发面的3类vCPU资源利用情况,得出更为全面的比较结果。
(2)稳定系数。对于不同时刻的两个vBRAS的平均利用率情况如图5所示。
综合起来,计算出vBRAS1的[β=0.008],vBRAS2的[β=0.016],因此可以认为vBRAS1较vBRAS2更加稳定。
(3)无关系数
由于vBRAS1厂家自己也提供NFVI平台,vBRAS1在自家的平台上的性能更优,但运行在第三方平台上时,性能会有所下降。vBRAS2厂家不提供NFVI平台,可运行在不同的第三方NFVI平台上。
此时,vBRAS1的[γ=0.022],vBRAS2的[γ=0.009],因此可以认为vBRAS2较vBRAS1与平台的无关性更好。
因此如果要综合比较vBRAS1和vBRAS2的优劣势,需要对这几个参数进行综合评估,给每个参数给出一定的权重,比如按照层次化评估法进行综合评估,限于篇幅,不再赘述。
5 结束语
作为IP网络领域虚拟化的代表之一,vBRAS已经成为运营商在IP城域网入NFV的切入点。在vBRAS的评估方面,可以通过资源占用率等基本指标和稳定系数、均衡系数和无关系数等扩展指标来综合衡量。可以预见的是,随着NFV应用规模的逐步扩大,后续对VNF性能的系统评估方案以及自动化评估工具等方面的需求也将会越来越明确。
致谢
本期实验工作是在北京研究院-惠普联合实验室完成的,王旭亮、谷欣、许一亮等工程师承担了大量的试验,对他们谨致谢意!
参考文献
[1] 蒋铭,于益俊. NFV与VNF架构演进与网络架构未来[J]. 信息通信技术, 2016(1): 45-51
[2] 杜鹃.VNF在移动网络中的应用初探[J].内蒙古科技与经济, 2015(16): 62-63
[3] 周宇翔.NFV走向商用面临六大问题[N]. 通信产业报,2014-09-01(25)
[4] 周振勇.NFV技术进展及其应用探讨[J].电信网技术,2016(7):41-45
[5] 李晨,谷欣,林群阳,等. NFV网络加速技术探讨及实践[J].电信网技术,2016(6):25-32
[6] 思博伦通信.完整验证NFV的性能[J].电信网技术,2015(6):63-71