如果说X86CPU铸就了英特尔辉煌的过去,那IPU则成为英特尔打开未来世界的钥匙。
英特尔宣布推出基础设施处理器
日前,在Six Five峰会上,英特尔公布了其对基础设施处理器(IPU)的愿景。IPU是一种可编程网络设备,旨在使云和通信服务提供商减少在中央处理器(CPU)方面的开销,并充分释放性能价值。利用IPU,客户能够部署安全稳定且可编程的解决方案,从而更好地利用资源,平衡数据处理与存储的工作负载。
英特尔数据平台事业部首席技术官Guido Appenzeller表示“IPU是一种全新的技术类别,是英特尔云战略的重要支柱之一。它扩展了我们的智能网卡功能,旨在应对当下复杂的数据中心,并提升效率。在英特尔,我们致力于携手客户及合作伙伴构建解决方案、创造新型技术,而IPU就是这种合作的典范。”
在物联网时代,我们已经看到了太多以“xPU”命名的处理器,无论是英伟达的DPU还是谷歌的NPU与TPU,作为处理器领域的领军者,英特尔这样一次推出的IPU又剑指何处、会为市场带来怎样的改变呢?
剑指数据中心
在具体解析英特尔IPU技术路线及各项规格以前,不妨从其市场定位入手,进而对IPU形成一个整体认知。
按照英特尔官方的介绍,推出面向基础设施应用的IPU处理器是为了满足数据中心和云服务提供商的最新需求。据悉,IPU全称为“Infrastructure Processing Unit”,官方描述为一种可编程网络设备,旨在帮助云与通信服务提供商减少相关任务对中央处理器(CPU)的资源开销需求,并进一步释放相关平台的性能潜力。
X86时代,英特尔原本在数据中心市场拥有绝对的话语权,但随着5G、AI、云计算等新兴技术的崛起以及数据中心自身技术的更迭和应用的变化,大量ASIC芯片、FPGA芯片逐步渗透进入市场,大有动摇英特尔在数据中心市场地位的态势。
面对市场的变化,英特尔这一次选择了积极拥抱改变1PU处理一经亮相,很多人就直接将其放到了DPU处理器“死对头”的位置,极为相似的市场定位也预示着数据中心即将迎来一轮“芯”的战役。当然,除了相似的市场定位,英特尔IPU在功能设计和产品性能上却明显具备后动优势,其产品设计明显能更好地满足数据中心、云计算领域应用需求的变化。
揭开IPU神秘面纱
了解了IPU市场定位和“潜在”竞争对手后,我们再回过头来看IPU的工作原理。
在英特尔官方的描述中,基础设施处理器(IPU)是一种网络设备,可将CPU或xPU连接到网络,加速主机基础设施功能,并适用于现有和新兴基础设施用例,包括安全性、虚拟化、存储、负载平衡,以及虚拟网络功能和微服务的数据路径优化。IPU增强了基础NIC 中丰富的以太网网络功能,通过高度优化的硬件加速器和紧密耦合的计算引擎的组合处理任务来实现加速。适应性是通过标准且易于使用的编程框架实现的,该框架结合了硬件和软件功能。
通俗来讲,IPU(基础设施处理器)是一个网络设备,可以安全地加速和管理数据中心的基础设施功能与可编程硬件。
IPU可以提供的能力包括:
·通过专用协议加速器来加速基础设施功能,包括存储虚拟化、网络虚拟化和安全。
·通过把软件中的存储和网络虚拟化功能从CPU转移到IPU,从而释放CPU核心。
·允许灵活的工作负载分配,提高数据中心利用率。
了解IPU的工作原理和能力后会发现,英特尔IPU在“释放CPU核心”“智能网络”等应用方向上同当下DPU甚至英特尔自己的SmartNIC的确有很多相似之处,而进一步的对比,则让我们更好地了解IPU。
SmartNIC的进阶产物
大数据、云计算等新兴技术的崛起,对IT基建提出新的需求,由此也拉开了网络“芯”基建的序幕,而在IPU以前,英特尔N3000SmartNIC等经典产品便一直是市场上的人气网红。以往,普通NIC定位于高效迁移服务器的网络数据包,通常包括不同程度的为优化性能而设计的传统卸载。SmartNIC整合了多方面的附加计算资源,但是这些架构就像雪花一样各不相同,英特尔的FPGA具有115万个可编程逻辑元件和两组4GB DDR4存储器,每组都有足够的空间来处理SmartNIC任务,例如:
·虚拟宽带网络网关(vBNG)
·分层服务质量(HQoS)
·数据包分类、管制、调度和成形
·虚拟化演进分组核心(vEPC)
·5G下一代核心网络(NGCN)
·互联网协议安全(IPSec)
·IPv6的分段路由(SRv6)
·矢量数据包处理(VPP)
·虚拟无线电接入网(vRAN)
英特尔已针对N3000平台实现了上述工作负载,从英特尔N3000SmartNIC我们也可以看出,SmartNIC的主要目的是安全地加速网络和存储基础设施,而IPU是SmartNIC的进化。除了通过专门的协议加速器安全地加速存储和网络虚拟化之外,IPU将成为云或通信服务提供商管理系统级基础设施资源的控制點,以最大限度地减少资源的滞留或过度使用。
此外,我们需要注意的是基础NIC虽然能够承受以太网密集的工作负载,但是是不可编程的,而可编程恰恰是英特尔IPU的一大特色。
后动优势明显的IPU
初步了解IPU后,很多人脑海里都会浮现“数据处理单元(DPU)”的形象,的确,从市场定位到产品功能,英特尔IPU同DPU有很多相似之处,在英特尔IPU面世以前,NVIDIA、Marvell、Broadcom、VMware等其他网络硬件制造企业就已经推出过多代DPU产品了。
DPU的出现,源于CPU面对超大规模数据处理的需求,当CPU算力出现瓶颈且无法在执行数据中心敏感任务的同时不可能给更多任务单独分配加速卡,DPU就能在这个时候率先完成基础的工作任务,构建强大的基础设施层,让上层的CPU和GPU来完成其他更有价值的工作。
DPU是一种新型的可编程处理器,DPU是一种片上系统或SoC,它结合了3个关键因素:(1)行业标准、高性能、软件可编程的多核CPU,通常基于广泛使用的Arm架构,与其他SoC组件紧密耦合。(2)一种高性能网络接口,能够以线速或网络其余部分的速度解析、处理和有效地将数据传输到GPU和CPU。(3)一组丰富的灵活可编程加速引擎,可为AI和机器学习、安全、电信和存储等卸载并提高应用程序性能
从这个角度看,DPU在数据中心领域已经算是相当不错的存在,奈何英特尔多年来一直与超大规模云服务提供商合作,并了解正在加速的功能。IPU 基础设施处理器作为基础设施提供者的控制点,更好地抓住了这些功能的本质。谷歌和Facebook都发表了论文,讨论与管理微服务的开销相关的“数据中心税”,IPU用于加速基础设施功能,能更准确地实现如网络虚拟化、存储虚拟化、安全隔离和提供信任根。
而“数据处理单元(DPU)”是一个非常概括性的术语,因为所有处理器都在处理数据,所以这个名称并不提供任何实际的信息。市面上有许多xPU,根据工作负载的不同,处理“数据”的合适的xPU可能是GPU、CPU、FPGA或ASIC。当然,不少人会将IPU对DPU的优势理解为后动优势带来的好处,可实际上,英特尔早已是全球最大的DPU供应商了,IPU的出现,更像是自身生态的延伸和产品的自然更迭。
全球最大的DPU供应商
DPU本身是一个很“泛”且有些模糊的概念,丹霞DPU由Fungible、Nvidia、Pensando和Nebulon等供应商从特定的CPU芯片、FPGA和/或ASIC构建而成。这是一个快速发展的领域,设备类型包括原位处理器、智能网卡、服务器卸载卡、存储处理器、组合集线器和组件。
英特尔执行副总裁兼数据平台事业部总经理Navin Shenoy在六五峰会上表示,英特尔已经开发并销售了它所谓的基础设施处理单元(IPU)——其他人都称之为DPU。英特尔设计它们的目的是让超大规模客户能够减少服务器CPU开销并释放周期,让应用程序运行得更快。
英特尔数据平台集团首席技术官Guido Appenzeller在一份声明中表示:“IPU是一种新型技术,是我们云战略的战略支柱之一。它扩展了我们的SmartNIC功能,旨在解决现代数据中心的复杂性和低效率问题。”
Guido Appenzeller表示,IPU使客户能够平衡处理和存储,而英特尔的系统具有专用功能来加速使用基于微服务的架构构建的应用程序。这是因为英特尔表示,微服务间通信可以占用主机服务器CPU周期的22%到80%。
英特尔数据平台事业部副总裁兼以太网产品事业部总经理Patty Kummrow提出了这样的想法:“由于英特尔与大多数超大规模厂商的合作,英特尔已经凭借Xeon-D、FPGA 和以太网组件成为IPU市场的销量领先者。英特尔第一个基于FPGA的IPU平台部署在多个云服务提供商,我们的第一个ASIC IPU正在测试中。”
快速增长的算力
据IDC统计,近10年来全球算力增长明显滞后于数据增长。全球算力的需求每3.5个月就会翻一倍,远远超过了当前算力的增长速度。而算力源于芯片,业内人士预测,DPU将成为继CPU和GPU之后重要的算力芯片。
面对庞大的数据,CPU需要“帮手”完成基础数据的处理,而IPU则很好地扮演了这个角色,未来所有的服务器都会配备1-2块IPU卡”。IPU作为算力新型基础设施中的新物种,将在数据传输、存储、运算等方面扮演越来越重要的角色,算力时代IPU可以让不可能成为可能。
而随着5G应用的落地,万物互联时代的到来,边缘数据中心的崛起则会给数据中心产业发展带来全新的变化。
以最新数据为例,截至3月底,全国已经建成5G基站近20万个。伴随着三大运营商5G集采产品的落地与交付,中国将建成全球规模最大、覆盖最广也最为领先的5G网络,随之而来的像智慧交通、新零售、自动驾驶、工业互联网等边缘应用场景的大量诞生,以及大量物联网设备入网和更大规模海量數据的诞生、流动与应用,这无疑将驱动着边缘数据中心的大量诞生。
超大规模数据中心更像是核心交通枢纽,而各色各样的边缘数据中心就像一个个星罗棋布的小枢纽,不仅需要适应各种运行环境,还对设备功耗、成本、空间、软硬件集成与优化、自动化部署与运维有着极高要求。
除了满足边缘计算需求外,IPU本身更可通过AI学习实现部分数据的处理,为CPU核心减负的同时,提升整个网络数据处理效率。
数据中心的效率悖论
在19世纪后期,一位名叫威廉·斯坦利·杰文斯的经济学家观察到,提高煤炭使用效率的技术进步最终导致了广泛行业的煤炭消耗量增加,这被认为是一个悖论,因为人们在当时通常将效率与使用量的减少联系起来,而实际上恰恰相反,更高的效率会导致更低的成本,并创造更多的使用量。当然,这也适用于技术行业,以数据中心行业为例,自90年代推出标准大容量服务器以来,服务器市场不断增长,直到2000年代初,在那个时间段内我们看到了虚拟化的发明,vmware为x86服务器创建了这个概念,它们通过将更多机器虚拟化到一台机器上来,使IT专业人员能够更好地利用物理资源,这当然有助于减少停机时间,并提高控制和安全性。
但业内一些人开始怀疑服务器市场是否处于高峰期,事实上,当你看到这张图表时,你可以看到市场确实开始停滞不前,这部分是因为互联网泡沫破灭,但这也是因为随着服务器的虚拟化,IT部门不需要购买那么多的服务器,所以效率和利用率提高了,在一段时间内我们确实看到了消费减少,但杰文斯的悖论最终成立——效率提高导致为了更多的消费。
AWS、Azure等服务商的崛起,通过软件和算法使得硬件计算效率更高,但数字时代各行各业大规模增长导致工作负载越来越多样化,数据中心越来越大,这给底层基础设施带来了压力。
今时今日,集中式数据中心已经难以满足差异化计算需求,海量碎片化数据极大降低了集中式数据中心效率,而软件行业率先针对这类问题进行了调整。应用程序被分解为更小的面向服务的组件,这些组件在称为微服务的容器中运行。每个微服务本身都包含自己的负载均衡器,它们高度分散,具有分解的架构。这种方法的好处包括更容易从软件崩溃中恢复。当容器中的一个函数失败时,它的工作负载可以重定向到不同的容器或微服务继续运行,对整体服务的影响很小,或者如果单个微服务对资源的需求很大,系统可以适当地请求更多动态自动增加计算资源内存,以支持该特定微服务,因此所有这些高度复杂的可扩展和高性能微服务都要求并产生对高效编排的需求。这些服务需要以有效的方式转移。
以Facebook为例,人们日常关心的各种工作负载的大部分计算实际上都用于日常工作负载,例如移动内存或散列和压缩。从前,IT技术人员认为数据中心主要工作负载在通用处理器上运行,而上面的例子意味着人们以前看待计算的方式其实只是云中整体计算的一部分而已。这张图的深色部分(application logic)占手头整体任务的比例较小而这张图的浅色部分(orchestration)则占较大比例,显然必须解决这个“税收”问题。
为了解决这个以及这类问题,人们需要硬件解决方案作为整个云基础设施的控制点,以加速日常工作负载,也就是基础设施功能。在这样的行业大背景和企业刚需推动下,英特尔IPU本身可以理解成应运而生的产物。
快速落地的IPU
凭借在数据中心领域多年的耕耘与积淀,深谙数据中心企业需求并洞察行业发展的英特尔1PU产品从设计、生产到推出,每一步都能看到合作伙伴的身影。当前基于Intel FPGA的IPU已经导入多个云端服务商目前也着手测试第一款采用ASIC的IPU产品;Intel也强调接下来将会推出更多基于FPGA的IPU与专用ASIC,为新世代资料中心带来更具弹性、安全与效率的XPU架构。
百度主任系统架构师王雁鹏表示:“百度和英特尔在IPU领域展开全面合作,基于英特尔的IPU解决方案,百度自研智能网卡实现裸金属、虚机、容器多种算力在网络和存储功能的全面卸载和统一,极大地赋能了百度云主机产品。”而谷歌和Facebook 的研究表明,微服务通信开销可消耗22%到80%的CPU性能。
让客户参与进来,使得IPU能更贴合终端市场需求,在量化生产的同时,满足个性差异化需求,进而赢得未来的数据中心市场。
成长中的IPU生态
英特尔在数据中心领域多年来的积淀,让IPU一经推出就得到众多合作伙伴的鼎力支持,一系列适用于企业和云、网络的IPU案例和解决方案快速在终端市场展开,有力推动了IPU生态的成长。
Silicom FPGA IPU N5010作为首款硬件可编程4x100GE FPGA加速IPU适配器,具有适用于5G核心(UPF)等的性能和规模;Inventec FPGA IPU C5020X则是基于FPGA的IPU,采用英特尔?至强?D SoC实现硬件可编程数据路径并提高内核利用率——基于面向云的英特尔?FPGA IPU 15000X-PL平台。
而在适用于企业和云的IPU阵营,使用英特尔?FPGA实现数据中心加速面向云服务提供商的采用英特尔?FPGA的IPU有助于充分利用网络功能并帮助提高基础设施投资的收入;英特尔?IPU为VMware下一代基础架构提供动力英特尔技术使VMware能够为客户提供对虚拟机、容器和裸机环境的统一管理;Monterey项目则重新定义混合云架构,英特尔?IPU创新为边缘节点、网络基础设施和数据中心计算提供了更高的性能。
此外,在网络IPU领域,用于电信的英特尔?IPU基于英特尔?FPGA的IPU可以帮助优化融合无线有线网络的效率和性能;FPGA虚拟化无线电接入网络(vRAN)则借助英特尔广泛的网络加速器产品组合,结合Altiostar的5G就绪开放虚拟化无线电接入网络(Open vRAN)软件解决方案,解锁新用例并提高网络效率;英特尔、Kaloom创建P4可编程网络解决方案采用P4编程语言和英特尔?Tofino系列以太网交换机ASIC的高级网络系统。
再造一个英特尔
大众对于英特尔的认知源于个人消费市场的CPU产品,可创立于1968年的英特尔本身是一家半导體行业和计算创新领域的全球领先厂商,如今,英特尔正转型为一家以数据为中心的公司。英特尔与合作伙伴一起,推动人工智能、5G、智能边缘等转折性技术的创新和应用突破,驱动智能互联世界。
英特尔的转型并非愿景或期许,其产品研发及市场策略一直围绕这个目标进行调整,而从终端市场数据看,英特尔这些年的重心转移更为明显。2019年Q4英特尔的数据中心业务超越PC业务,成为其收入的主要来源;而在2020年,英特尔对其技术组织和执行团队的重组,也被外界视为全面转型数据中心业务的开始。数据中心业务对于英特尔来说,也正在成为其最核心的业务组成。
IPU不仅是英特尔数据中心战略极为重要的组成部分,不断演进的数据中心更需要一个全新的智能架构。这一架构内,大规模分布式异构计算能够协同工作,无缝连接,形成一个独立的计算平台。这种新架构将有助于解决当今资源搁浅、数据流拥堵和平台安全不兼容的挑战。这种智能数据中心架构将拥有三类计算单元——用于通用计算的CPU、用于特定应用或特定工作负载加速的XPU以及用于基础设施加速的IPU——它们将通过可编程网络相互连接,从而有效利用数据中心资源。
写在最后:
DPU领域没有基准,因此比较不同供应商之间的性能将很困难,而每家企业都想争夺DPU市场话语权,让整个DPU市场变得混乱,可由英特尔主导的IPU市场就大不一样了,除英特尔会推出IPU产品外,更将生产更多基于FPGA的IPU平台和专用ASIC,他们将伴随一个软件基础来帮助客户开发云编排软件,为用户提供周全服务的同时,也为IPU产品及应用打造了庞大的生态,并凭借生态力量,掌控未来数字世代的话语权。