刘向红,张时光,李隐峰
(鸿富锦精密电子 天津300462)
IBM POWER8核心处理器
刘向红,张时光,李隐峰
(鸿富锦精密电子 天津300462)
随着云运算和大数据产业的迅猛发展,数据处理和存储技术的发展如火如荼。IBM 作为服务器行业的先行者,不甘心Intel一枝独大,在2015年3月对外部客户推出开放型平台POWER8。为使服务器开发者和用户快速了解该系列处理器,整理了POWER8的技术特点和产品特性,以利于快速比较和选型。
大数据 服务器 核心处理器 IBM POWER8
2013年8月26日,在斯坦福大学举行的第25届HotChip半导体大会上,IBM发布了新一代服务器处理器POWER8。POWER8采用22,nm SOI工艺,芯片核心面积为650,mm²。性能方面,POWER8采用超标量体系架构,对称型超线程设计 8-WaySMT,最大支持同时执行 96 个线程。该产品可联系OpenPOWER基金会进行许可注册并开发设计,这是IBM第1次对外开放如此高端处理器的开发许可。
POWER8 最大支持12核心芯片多线程设计,每个核心能同时处理 8个硬件线程,执行高速运算,总共可同时执行 96个线程运算任务。处理器使用了大量的开关芯片 eDRAM 作为缓存,内存控制器在eDRAM开启状态,可以为内存和系统I/O打开很大的带宽。对于大多数工作负荷,据说缓存芯片可达到POWER7两到三倍的计算速度。
在 POWER7及以前的处理器系列,使用 GX+外部通信总线,POWER8 删除了这一设计并取而代之以 CAPI端口。CAPI端口用于连接一些专业的辅助处理器,如GPU、ASIC和FPGA。这些通过CAPI总线外加的处理单元可以与CPU使用相同的内存地址空间,从而减少了计算路径长度。在2013年ACM和IEEE超级计算大会上,IBM和Nvidia宣布了一项合作工程,在未来的 HPC系统中,Nvidia GPU将与POWER8系统高度集成且已明确应用于第 1款POWER系统S824L。
POWER8还包含1个OCC,即所谓的集成于芯片上的控制器,也就是基于PowerPC 405处理器的电能和热能管理单片机。它有两个通用卸载引擎(GPE)和 512,KB的嵌入式静态随机存取存储器(SRAM),通过OCC可直接访问主存——运行中的一个开源固件。OCC管理 POWER8的运行频率、电压、内存带宽、热控制处理器和内存,它可以通过 1,764个位于Fly之上的集成调节器调整电压。OCC也可以被编程用于超频POWER8处理器或降低其功耗降低工作频率(类似于一些 Intel和 AMD处理器中的可配置的TDP)。
POWER8已有4、6、8、10和12核等不同版本,每个版本都采用 15层金属处理的 22,nm的绝缘硅(SOI)单元制造。12核心版本由 42亿个晶体管构成,大小为650,mm2,6核版本大小仅为362,mm2。
POWER8芯片的存储器控制器设计为可使用DDR3或 DDR4内存。而作为一个存储缓冲区、L4高速缓存芯片和实际存储器,被配对至外部原件Centaur,设计为永不过时技术的内存控制器。当前,Centaur芯片采用 DDR3内存,但未来版本可以使用DDR4或一些其他存储器技术,而不需要修改POWER8芯片本身的设计。
每一个 Centaur由 3条高速连接方式连接到POWER8(2读 1写),运行带宽 9.6,GB/s,总运行带宽 28.8,GB/s,具有 40,ns的时间延迟。Centaur包含有 16,MB的 eDRAM,可用作 L4高速缓存。每个POWER8的每个Socket可以链接最多8个Centaur芯片,合计每 Socket最多允许链接高达 1,TB,带有128,MB的L4高速缓存和230,GB/s的持续存储器带宽,32,GB DRAM的接口以及410,GB/s的峰值内存带宽。Centaur芯片最终被集成到 DRAM的 DIMM模块中。存储控制器 Centaur 芯片采用与 POWER8一样的制程技术。
每个 POWER8核心拥有 64,KB的 L1数据和32,KB的L1指令缓存。每个核心的每个循环可以向16个执行通道发出10条指令并分派8条指令:2个固定点的通道,2个加载/存储通道,2个加载通道,4个双精度浮点通道,也可以充当8个单精度浮点运算通道,2条VMX通道,1个加密通道,1个十进制浮点通道,1个条件寄存器通道和 1个分支执行通道。
它有一个更大的4×16问题处理队列入口,能提高分支任务预测,处理多达两倍的高速缓存缺失。每个核包含8路硬件多线程,可被动和自动分配到具有1个、2个、4个或所有 8个线程的运算。POWER8还增加了对硬件事务存储器的支持。IBM估计,其每个内核是 POWER7 单线运算速度的1.6倍。
POWER8 处理器由 12 颗芯片设计而成,可能由4、6、8、10或12 颗芯片集合构成,其中1组芯片集包括1颗核芯,SRAM 512,KB 的L2 高速缓存总线(是上一代产品的两倍)和eDRAM 8,MB的每颗芯片集的芯片之间的 L3共享缓存。因此,6核芯处理器将有48,MB L3的eDRAM缓存,而12 核芯处理器将总共有 96,MB 的 L3,eDRAM 缓存。该芯片还可以利用1个高达128,MB的 eDRAM 缓存 L4 采用Centaur 配套芯片。集成于芯片上的内存控制器可以处理 1,TB RAM 和 230,GB/s 的持续内存带宽。这些内核设计用来处理2.5~5,GHz的时钟速率。
POWER8的6核版采用的是IBM安装在双芯片模块(DCM)对向外扩展的服务器。在大多数配置中,并不是全部的核心都可以被激活,因此出现了各种实际核心数量的不同配置。 12核心版本直到 2014年5月还没有发布到任何系统。
IBM的单芯片POWER8模块被称为Turismo,双芯片变种被称为 Murano。PowerCore 的修改版本被称为CP1。
2014年1月19日,苏州Powercore技术公司宣布,他们将加入OpenPower基金会并注册POWER8核心应用,为客户定制设计大数据和云计算。
IBM Murano——双6核的12核处理器。扩展型处理器在某些核心关闭的情况可以启用。
IBM Turismo——单芯片的12核处理器。替换型处理器在市售和注册时可以带有被关闭内核配置。
PowerCore CP1——POWER8是修订安全特性后的一个变种,由于美国和中国之间的出口限制,将在纽约East Fishkil的Global Foundries(IBM之前的工厂)生产。该产品已在2015年发布。
针对该款功能强大的服务器平台,全球多家知名系统开发商在解决方案发布之初就已经开始投入巨资开发自己的 POWER8系列产品,在服务器市场抢占先机。其中启动比较早的有以下公司及其产品:
6.1 IBM开发的3大系列产品线
6.1.1 扩展型服务器
支持双芯片模块的1个或2个插座有2个6核处理器的 POWER8。“L”版本只运行 Linux,而其他版本运行AIX、IBM i和Linux。典型机型如:
①Power Systems S812L:1×POWER8,DCM(4、6或 8核心),2,U;Power Systems S814。②1× POWER8,DCM(6或8核心),4,U或tower。③Power Systems S822 和 S822L:1×(2×)POWER8 DCM (6、10、12或 20核心),2,U。④Power Systems S824和 S824L:1×(2×)POWER8 DCM(6、8、12、16或24核心),4,U。
6.1.2 企业级服务器
支持节点具有4套处理器插槽,各载8、10或12核心模块,最多的16套处理器插槽,128个内核和内存 16,TB。这些机器能够运行 AIX、IBM i或 Linux操作系统。
①Power Systems E850,2×POWER8、3×DCM或 4×POWER8 DCM(8、10或 12核心),4,U;②Power Systems E870(见图1),1×5,U或2×5,U节点,4套处理器插槽,8~10 核心,POWER8一体化芯片设计,最高支持到 80核心;③Power Systems E880,1×5,U、2×5,U、3×5,U或4×5,U节点,每节点4套处理器插槽,8~12核心,POWER8一体化芯片设计,最高支持到192核心。
图1 IBM Power E870Fig.1 IBM Power E870
6.1.3 高性能计算机
典型机型如:① Power Systems S812LC(Open-Power),1×POWER8,SCM(8或 10核心),2,U;②PowerSystems S822LC“Firestone”(OpenPower),2×POWER8,SCM(8或 10核心),2,U,由制造商Wistron 为 IBM制造,两颗 Nvidia K80,GPUs和达1,TB容量的自由选配DDR3,RAM。
6.2 泰安电脑
①SP010GM2NR,集成POWER8一体化芯片设计,ATX 架构的主板;② Palmetto GN70-BP010 (OpenPower参考设计用的主板),2,U,4核心POWER8 SCM,4,RAM插槽,基于泰安设计的主板;③Habanero TN-71-BP012.2,U,带有8核心POWER8 SCM,32 支RAM插槽。
6.3 谷歌
谷歌曾展示过内部使用的设计方案,带有两套处理器插槽。
6.4 浪潮电子信息
浪潮已经与IBM达成协议,采用POWER8平台和相关技术,开发服务器硬件。产品定型为:4,U服务器,两套 POWER8处理器插槽。
6.5 Cirrascale
RM4950:4,U,4核心POWER8,SCM带有4颗Nvidia Tesla K40加速器,基于泰安电脑的主板方案。
6.6 ,ZoomNetcom
①RedPOWER C210和C22,2,U和4,U,服务器带有两套POWER8处理器插槽和 64支RAM插槽;②RedPOWER C310和C320,2U和4U,服务器带有两套CP1插槽。
6.7 Rackspace
Barreleye:1,U,双处理器插槽,32支 RAM 插槽,基于Rackspace的开放平台及其OnMetal服务。
另外还有创和 OP:1,X(1,U,单处理器插槽,32支RAM 插槽)等产品已经开发成功。
包括纵向扩展型(Scale-up)和横向扩展型(Scaleout)两种方案,如图2所示。
图2 纵向扩展型和横向扩展型方案示意Fig.2 Schematic of Scale-up and Scale-out solutions
纵向扩展型,就是当旧方案已无法满足应用需求时,重新采购新方案,切换到新方案后,淘汰旧方案。横向扩展型,就是当旧方案已无法满足需求时,在保留原有旧方案基础上,增加新方案投资,新旧方案同时运行。
关于系统架构选型,用户在采购之初很难准确预测未来数据增长的速度和总量,因而往往不得不采购比自己目前实际需求容量更大的存储,这就导致两个问题,一是预算的浪费,很多存储空间都是为未来数据增长采购的,花了 10,TB的钱,但是可能只利用了5,TB,另外5,TB的资金白白闲置。另一个问题是,随着时间推移,数据增长,数据量超过了 10,TB。按照过去Scale-up的理念,解决方案就是购买更大容量的存储,则难免面临数据迁移的问题,用户必须停机迁移数据,意味着服务的中断。而Scale-out架构解决了这个矛盾。用户按需采购存储,一旦容量不够了,再购置一台接到原有存储上即可,所以横向扩展型方案对于连续运行型需求有绝对优势。■
[1] IBM Announces POWER8 with OpenPOWER Partners[EB/OL]. http://www.moorinsightsstrategy.com/wpcontent/uploads/2014/04/IBM-Announces-POWER8-with-OpenPOWER-Partners-by-Moor-Insights-and-Strategy. Pdf.
[2] IBM POWER8[EB/OL]. http://komplex-it.dk/media/ 128719/ibm_power8. pdf.
[3] POWER8[EB/OL]. https: //en.wikipedia.org/wiki/ POWER8.
[4] Life at the Intersection:OpenPOWER,Open Compute,and the Future of Cloud Software & Infrastructure[EB/OL]. http://openpowerfoundation.org/blogs/lifeat-the-intersection-openpower-open-compute-and-thefuture-of-cloud-software-infrastructure.
[5] IBM to help China's Inspur to design servers [EB/OL]. https://www.yahoo.com/news/ibm-help-chinas-inspurdesign-servers-123642000--finance.html?ref=gs.
A Brief Introduction of IBM POWER8
LIU Xianghong,ZHANG Shiguang,LI Yinfeng
(HongFuJin Electronic Precision,Tianjin 300462,China)
With the rapid development of cloud computing and big data industry,data processing and storage technology are also growing vigorously.IBM,as a pioneer of server industry,is not willing to let Intel occupy the data processing market,therefore it launched POWER8,an open platform,for external customers in March 2015.To give server developers and users a quick overview of the series processors,this paper analyzes technical features and product characteristics of POWER8 to offer reference for rapid comparison and selection.
big data;server;core processor;IBM;POWER8
TP368.5
A
1006-8945(2016)07-0012-04
2016-06-02