许航天,梁雪梅,方晓农
(江苏省邮电规划设计院有限责任公司,南京 210019)
基于NFV的核心网重构研究与探讨
许航天,梁雪梅,方晓农
(江苏省邮电规划设计院有限责任公司,南京 210019)
运营商正在通过引入IT基因来重构网络,以应对互联网企业的竞争。其中核心网的重构将是整网重构的切入点,而网络功能虚拟化(NFV)则是实现重构的重要手段。本文首先分析了核心网基于NFV进行重构的背景,然后介绍了核心网重构的目标架构和虚拟化相关的关键技术,最后探讨了核心网重构的相关策略。
网络功能虚拟化;核心网;重构;管理和编排
当前大量数字业务爆发,网络数据流量激增,运营商却发现这并没有带来相应的收益。究其深层次原因,当前IT技术的通用化、标准化、组件化的发展理念在实践中得到了广泛应用,其高效和灵活的基因极大地推动了互联网业务的发展。而回顾过去十年核心网的发展,它虽然进行了承载及接口协议等外在通信方式的IP化,但诸如网络柔性、业务快速部署、基础设施通用化和自动运维等关键能力,都无法与互联网相提并论。
在未来的数字化进程中,运营商传统语音业务被数据业务侵蚀已经成为不可逆转的趋势,运营商的收入将与数字业务更加密切相关。不甘心沦为数字管道、希望在未来数字业务中占据一席之地的运营商,正在努力通过对网络的重构,以便在即将到来的全连接、全数字化的时代能够应对互联网的挑战与竞争。作为通信网络控制中枢的核心网,对其引入IT基因进行重构,已经成为运营商当前实施整网重构的重要抓手;而网络功能虚拟化(NFV)则是实现这一重构的重要手段。
NFV的目标是通过研究和发展IT的虚拟化技术,构建一种基于x86通用服务器的全新架构,将网络功能从专用硬件中剥离出来,网元以软件形式部署,从而实现网络能力的灵活配置,提高网络设备的通用化和适配性,加快网络部署和调整的速度,降低业务部署的复杂度。
为了更快推动NFV理念的推广和产品的实现,2012年10月,13家运营商发起在ETSI(European Telecommunications Standards Institute,欧洲电信标准化协会)组织下正式成立网络功能虚拟化工作组,即ETSI ISGNFV,致力于实现网络虚拟化的需求定义和系统架构制定。基于ETSI虚拟化工作组提出的NFV概念,核心网目标网络架构如图1所示。
NFV基础设施(NFVI)提供虚拟网络功能的运行环境,包括所需的硬件及软件。硬件包括计算、存储和网络资源;软件主要包括Hypervisor、网络控制器、存储管理器等工具。物理资源被虚拟化为虚拟资源,并进行池化,以资源池形式供上层虚拟网元使用。在资源池化的过程中,使用了云计算相关技术。虚拟化技术实现了软件与硬件解耦,使得资源的供给速度大大提高,网元部署从数天缩短到数分钟,为新业务的快速上线创造了条件;云计算技术对虚拟资源进行管理,实现网络的弹性伸缩,增加了网络的柔性,使资源和业务负荷相匹配,提高了资源利用效率。
图1 基于NFV概念的核心网目标网络架构图
虚拟网络功能包括两部分:虚拟网络功能(VNF)和网元管理系统(EMS)。虚拟网络功能对应的就是目前电信网元,每个物理网元映射为一个虚拟网元的VNF(如图1中vIMS、vEPC即为VNF的实例)。VNF所需资源需分解为虚拟的计算/存储/网络资源,由NFVI来承载。VNF之间的接口依然采用传统的信令/媒体接口,VNF的业务网管依然采用NE-EMS-NMS体制。
管理和编排(MANO)由3个功能模块构成。虚拟基础设施管理器(VIM)是NFV基础设施的管理模块,其计算模块通常运行于对应的基础设施节点中,主要功能包括:资源的发现、虚拟资源的管理分配、故障处理等,为VNF运行提供资源支持。虚拟网络功能管理器(VNFM)主要负责对VNF的生命周期(实例化、配置、关闭等)进行控制。NFV编排器(NFVO)是对NS(Network Service)生命周期的管理模块,同时负责协调NS、组成NS的VNFs以及承载各VNF的虚拟资源的控制和管理。
BSS/OSS可以沿用现有运营支撑系统,随着后续网络的发展,必要时可以为虚拟化进行必要的修改和调整。
综上所述,虚拟化的架构对如IMS网络、EPC网络等核心网网元功能、接口的技术要求并未改变,但由于基础设施平台的改变、网元形态的变化,必然导致电信核心网各层面发生根本性的变革。
基于NFV的核心网重构在实际部署中,将面临一系列问题,如接口标准化、可靠性、性能、网络资源调度及协调编排、运行维护方式的转变等问题,其中性能问题和可靠性问题将是影响网络是否能够满足电信要求的最基础性的问题,是需要产业链各方都深度思考参与的问题。
2.1 性能提升技术
为了支撑电信业务的低时延、高带宽的需求,NFV架构需要对虚拟化内核进行针对性的优化。目前业界主要从虚拟计算能力和虚拟网络转发能力两方面出发,提出了各种方案进行性能提升。
2.1.1 虚拟计算能力优化
(1)CPU绑定隔离:为了防止虚拟机对物理CPU的无序竞争和抢占,虚拟机和物理CPU绑定,保证一些关键电信业务不受其它业务的干扰,提高这些电信业务的性能和实时性。
(2)NUMA(Non-uniform memory access):非统一内存访问技术,将全局内存打碎分给每个CPU独立访问,避免多个CPU访问内存时造成的因资源竞争而导致的性能下降。云平台在对虚拟机进行部署时,应尽量将其虚拟CPU与内存部署在一个NUMA节点内,避免虚拟机跨NUMA节点部署,从而充分降低内存访问时延。
(3)巨页内存:虚拟机使用内存巨页,从而减少用户程序缺页次数,提高性能。
2.1.2 虚拟网络转发能力优化
(1)DPDK(Data Plane Development Kit):Intel提供的x86平台报文快速处理的库和驱动的套件,通过采用用户态分组处理增强机制替代内核处理来提高转发性能。
(2)SR-IOV(Single Root I/O Virtualization):基于硬件的网卡虚拟化方案,将虚拟机直接连接到物理网卡,获得等同于物理网卡的I/O性能和低时延。
(3)OVS(Open vSwitch):基于软件实现的开源虚拟交换机,提供对Open Flow协议的支持,可与众多开源的虚拟化平台相整合,传递虚拟机之间的流量,以及实现虚拟机和外界网络的通信。
2.2 可靠性增强技术
虚拟化的核心网硬件设备基于通用服务器,通用服务器与传统的电信硬件相比在可靠性方面有所下降。为了保证实现电信网络及业务电信级的可靠性,除了硬件可靠性提升之外,还需要其它机制予以保证,其中故障自愈和地理容灾是最为重要的两个手段。
2.2.1 故障自愈
故障自愈是网络在发生故障时,无需人为干预,即可在极短时间内从失效故障中自动恢复,其过程为:
(1)设置物理资源、虚拟机或VNF等为监控对象;
(2)当VNFM或VIM模块监测到监控对象发生异常或故障时,将把故障上报至故障决策点;
(3)故障决策点(架构中为EMS或NFVO)调用故障恢复策略,并下发给故障恢复执行体;
(4)故障恢复执行体执行故障恢复动作,例如硬件资源的故障,VIM将在另外的节点进行虚拟机重生的动作;虚拟机或VNF的故障,VIM将启用备用虚拟机并且对虚拟机进行重启动的操作。
2.2.2 地理容灾
地理容灾是保障网络在各种灾难下快速恢复的机制,需要网络各层协同来实现。
(1)NFV基础设施(NFVI):以冗余方式部署,跨DC部署时,DC之间的二层链路需要满足IP承载网链路的要求;
(2)虚拟网络功能:继承传统网元的地理容灾方式;
(3)管理和编排(MANO):需要新建相应模块,并进行1+1主备方式部署。
3.1 重构原则与切入点
基于NFV的核心网重构的原则是兼顾效率和技术成熟度,由简入手逐步推进。
核心网元数量少且集中化,率先基于NFV重构有利于业务创新,能够以较小代价积累NFV经验。核心网内部,业务和控制面对新功能需求强烈,具有计算敏感性,适合先行部署,而媒体转发面流量大,性能要求高,影响业务感知,待技术逐渐成熟后部署。业务部署角度,首先从新业务领域引入NFV,有利于提前获取NFV红利,并且能够减少对现网成熟业务的冲击。由图2分析可知,目前基于NFV进行VoLTE网络的IMS部署,将是核心网重构的最佳切入点。
图2 核心网NFV切入点分析图
3.2 部署策略
从业务层面看,NFV网络归属电信云范畴,通过表1对比可以发现,基于NFV的电信云和IT云对网络需求存在很大差别,表现为对虚拟化层软件和云平台软件的要求也更高。因此电信云和IT云独立部署是现阶段普遍认可的选择,未来随着云技术的发展,可以再考虑电信云和IT云是否可以融合。
3.3 解耦策略
NFV架构是一个开放架构,原则上可以由不同的厂商分层提供相应的软硬件产品。但由于目前的标准对各层之间接口的定义还不甚清晰,因此在业界的实践中,运营商会根据自己的实际能力选用图3中某一种方案进行核心网的重构。
图3 分层解耦方案图
虽然方案3各层全解耦符合NFV的初衷,网络不再被某一厂商的设备绑定,但是方案3对运营商的集成能力和接口标准化能力都是非常大的挑战,同时不同厂家的上层虚拟网元对下层异厂家的虚拟化层的要求如果得不到满足,系统的性能将会大打折扣。而采用方案1,虽然形式上进行了分层解耦,但是实质上与之前的单厂家提供专用硬件无异。在现阶段,作为一种折衷方案,方案2硬件的独立得到了大多数运营商的接受。后续在接口标准成熟、产业链更加完善、运营商的IT集成能力增强的情况下,可以考虑采用方案3的全解耦方式。
3.4 网管策略
基于NFV的核心网重构使得原来统一的网管系统演进为网元管理和基础设施资源管理两部分,一个北向管理接口演进为两个北向管理接口。虚拟化平台上的虚拟资源、硬件资源的KPI指标由VIM节点负责采集;虚拟网元相关的KPI指标由VNF节点负责采集。
网元传统的配置、计费、性能和安全管理,由VNF上报EMS,但是对于网元故障管理,需要对将VNF告警和NFVI告警进行关联和展示,在关联和展示点的选择上有3种方案,如图4所示。
方案1在VNFM进行告警关联和展示,该方案的优点为新增功能在VNFM实现,对现有网管不会有任何改动;缺点是VNF的KPI值上报EMS,VNFM关联的告警中缺失关联的VNF的KPI值。方案2在EMS进行告警关联,沿袭了传统的告警运维习惯,在告警信息中可以看到业务告警与虚拟资源、物理资源的关联关系,便于故障快速定位;缺点是为了适配EMS的变化,需要对OSS进行升级。方案3是EMS、NFVO直接转发告警信息,由OSS进行关联,在OSS能够查阅全网多个设备厂家的告警关联关系,这样可以从全网角度快速定位故障并下派工单,迅速解决故障;缺点是NFVO和OSS之间的接口目前没有标准化,接口不够成熟,同时接口较为复杂,不可控因素较多。
表1 IT云和基于NFV的电信云比较表
图4 告警关联点方案示意图
从后续整体运营的角度看,方案3无疑是运营商的最优选择,但选择该方案也将考验运营商的网络规划能力和OSS的集成与运维能力。
电信网络IT化已经是通信业发展的趋势,核心网基于NFV进行重构也是业界研究的热点问题之一。本文就核心网重构的目标、关键技术及相关策略进行了初步探讨。基于NFV的核心网重构将是对核心网架构的革命性演进,但这种演进无法一蹴而就,仍需要业界产业链上下游共同探索。
Research and discussion on re-architecting core network based on NFV
XU Hang-tian, LIANG Xue-mei, FANG Xiao-nong
(Jiangsu Posts & Telecommunications Planning and Designing Institute Co., Ltd., Nanjing 210019, China)
Operators are re-architecting the network by introducing IT genes to confront the competition from Internet companies. Re-architecting core network is the breakthrough point of the whole network's process, and NFV (Network Functions Virtualization) is the important means to realize it. The background of rearchitecting core network based on NFV is analyzed fi rstly. The target architecture of core network and the related key technologies are introduced. Finally, the relevant strategies to re-architect core network are discussed.
network functions virtualization; core network; re-architecting; management and orchestration
TN915
A
1008-5599(2016)11-0040-05
2016-06-07