Memoir Systems:开创存储器变革新篇章

2012-08-08 12:48:32黄俏丹
电脑与电信 2012年12期
关键词:存储器内存端口

特约通讯员 黄俏丹

当前,存储器发展的一个方向是朝着“利用新的物理规律,研发新的存储器结构”迈进,如相变存储器,电熔断存储器,阻抗存储器,磁性随机存储器MRAM等等,这一方向极大地丰富了现有存储器的种类,展现了繁多的存储器特色,但有两个缺陷是致命的:与CMOS工艺兼容性,生产效率。最近有一个新的趋势渐渐浮出水面,那就是算法存储器(Algorithmic Memory)。这是一种新的思路,这种思路源自对微处理器(CPU/MCU)体系结构的发展与现有存储器通讯时的瓶颈这一问题的思考得出的。处理器经过多年发展无论在速度、性能、数据吞吐量等方面有了很大的提升,但存储器在这方面似乎没有跟上CPU的发展。举例说明一下,4核的CPU+2G内存的机器上跑一个多线程软件,在8核的机器上可以提速到2倍,但在16核的机器上就只能获得将近2.5倍的提速,而不是期望的4倍,这就是CPU与内存之间通讯带宽的限制。

这种Algorithmic MemoryTM源自一家初创公司Memoir Systems的专利技术,他们在存储器芯片内部采用了缓存(caching)、虚拟机制(virtualization)、管道 (pipelining),以及数据编码等技术,然后将它们“编织成数据流”进行无缝地操作,这种存储器还提供了多个接口支持数据并发访问,极大地提升了访问性能。

Memoir Syst ems:书写存储性能新篇章

Memoir Systems公司于2009年3月由Sundar Iyer(CTO)and Da Chuang(COO)共同发起成立,由光速创投公司投资支持。Adam Kablanian是Memoir的首席执行官(CEO)。公司总部设在美国加州硅谷,Memoir Systems是全球领先的提供存储器性能解决方案的半导体供应商,入选2012 Red Herring北美100强科技公司。Memoir关于存储器设计方面的革命技术——Algorithmic Memory,大大缩短了设计开发时间,提高了每秒存储操作(MOPS)访问性能。该公司的Renaissance系列产品为多接口嵌入式存储器模块提供了即插即用的一种替代。在不牺牲性能的情况下,也能减少芯片面积和降低功耗。此项技术的特点是线程、节点、Foundry之间相互独立,并且能无缝集成到各种SoC片上系统。

因为它是进程独立的,所以Memoir此项技术对先后进程结点同样适用,并且可以集成到各种SoC系统 , 包 括 ASICs,ASSPs,GPPs and FPGAs。这些设备要求具有很高的MOPS才可以使存储性能得到提升改善。

公司创始人兼首席技术官Sundar Iyer表示:“Algorithmic MemoryTM技术在半导体行业是独一无二的。我们的设计方法是引入一个新的概念‘chisel’,这不同于在存储器集成电路上使用的传统方法‘hamma’,我们从一个更高的抽象层面来解决这个性能瓶颈。新方法在集成电路技术上得到了补充,并且填补了processor-memory之间的鸿沟。”

Memoir技术总概

Algorithmic Memory技术对存储器模块的性能提升表现在以下5个方面:

·10X每秒存储操作(MOPS):Algorithmic Memory通过“在存储器芯片内部采用了缓存,虚拟机制,管道,以及数据编码等技术,然后编织成数据流进行无缝地操作”提升现有嵌入式存储器模块的性能。

·100X缩短设计开发时间:存储器模块开发通常需要6到12个月的时间,但是Memoir技术可以把开发时间缩短到以天计算。

·1000X加快存储器架构分析时间:分析一个自定制的存储器模块通常要花费一周时间,但是利用Memoir可以在10秒内搭建和分析一个存储器模块。

·低芯片面积,低功耗:Memoir可以把一块面积功率比较低、性能较差的内存合成为具有较高性能的存储器模块。Algorithmic Memory通过改变集成电路使存储器模块具有较高性能,还降低了芯片面积和功率消耗。

·方便地与现有的各种存储器相兼容配置:通过简单配置,可以快速地集成到不同的系统中去。

Al gor it hmic Memor y:为网络和多核SoC提供突破性技术支持

由于Algorithmic Memory技术可以为嵌入式存储性能提供一个数量级的增加,该公司的初始产品应用主要专注于各种SoC系统设计 (例如,ASICs,ASSPs,GPPs and FPGAs)和网络交换器(Network Switches)、存储局域网(SAN)交换器设计。

Memoir的CEO Adam Kablanian解释说:“我们为嵌入式存储世界开创了一个全新的篇章。如此通用和强大的技术可以为系统架构师和SoC设计工程师提供下一代卓越的存储性能。我们相信,网络和多核计算这两个产品领域可以最初地从我们的解决方案中受益”。

嵌入式存储性能已成为SoC设计中整个系统性能的限制因素。Memoir用它的专利技术解决了这个瓶颈,最大化了算法效率。Algorithmic Memory以软RTL IP的形式提供,可以快速地集成到不同的系统中去。它还提出多个接口并发访问,提供10倍快的每秒内存操作。

光速创投 (Lightspeed Venture Partners),一家全球领先的风险投资公司,是Memoir Systems的一个主要投资者。光速创投的总经理Barry Eggers说道:“我们投资Memoir Systems主要有两个关键原因:首先,Memoir团队在存储算法领域拥有世界一流的专业知识;其次,它独特的专利技术可以跨越当前和未来的存储应用技术。我们相信,这种团队和技术的实力组合将来能把Memoir推向一个更重要的地位,在某些市场领域占有更大的份额。”

Memoir公司创始人兼首席技术官Sundar Iyer指出:“通过Memoir的Algorithmic Memory技术,存储器访问性能可以被视为一个可配置资源实体。系统架构师和设计师只需要通过一个简单的按钮接口就能配置他们所需的存储模块性能,例如,设定读写接口的数目,时间操作频率,以及其他关于芯片面积和功耗优化方面的特制需求。”公司创始人和首席运营官Da Chuang解释说:“Memoir的综合方法平台可以从存储IP库中自动选择合适的模块,并将我们的存储算法综合到新定制的目标应用程序中。”

嵌入式存储器模块性能在网络SoC设计应用中是一个主要的限制性因素。随着网络传输速度日益增加,交换机的架构师发现越来越难跟上数据报文处理速度以避免缓冲区溢出。例如,在一张4*100 Gb/s的线卡上,新数据包每1.6纳秒到达一次系统,此外,数据包处理系统支持广泛的报文头分析——比如,查找技术、网络即时流量统计、计数器、流量管理等等,和支持有效载荷处理应用程序——比如,指令检测、基于内容的负载平衡、病毒扫描,这些导致对于每次数据包的到来都要产生数次的存储访问。仅是加快处理器的速度是不能提高网络性能的,除非增加总的每秒存储操作(MOPS)。这里,Memoir的 Algorithmic Memory技术能为系统架构提供更快的MOPS,并且能自定义存储容量、提供多个读写接口。

高速多核处理器改变了桌面、服务器应用和嵌入式计算世界的游戏规则。然而,因为争用共享存储资源(比如,二级缓存或三级缓存),SoC系统的整体性能也会有所拖延。如果可以避免这些存储方面瓶颈,系统架构可以发挥更好的性能。

Renaissance 4X:革命性的商业产品

Renaissance 4X是Memoir Systems公司继Renaissance 2X推出的第二代商业产品。基于Memoir的Algorithmic Memory技术,Renaissance 4X相对于传统多端口系统,它引进了一项革命性的技术,不仅提升了存储器性能,也节省了功耗和芯片面积,缩短了产品上市时间,而且不要求进行Silicon Validation(硅片物理验证)。如同所有的Memoir产品,Renaissance 4X利用“把算法综合到固件”方法来提升现有嵌入式存储器模块的性能。它以软RTL IP的形式交付,能快速地集成到不同的系统中去,并且线程、节点、Foundry之间相互独立。Memoir提供的就像是一个标准的嵌入式存储器模块,并且可以方便地集成到现有的标准SoC设计流程。Renaissance 4X提供6个独立的内存生成器:一个3端口的2R1W,一个3端口的1R2W,一个4端口的3R1W,一个4端口的2R2W,还有专门设计的3Ror1W、4Ror1W内存生成器。

IBM Microelectronics是Memoir的首批客户之一,IBM高级工程师Robert Busch说:“一系列创新技术(例如,IBM的嵌入式DRAM技术)正在推动着片上系统设计性能的发展。通过与Memoir合作,我们能给芯片设计师设计SoC系统提供一种很高效的存储子系统,可以改进系统吞吐量并且加快复杂产品上市时间。”

Renaissance 4X可以缓解存储解决方案定制的需求,并且它可以创建一个能提供6个多端口内存生成器的通用存储组合,这样的通用组合能满足不同的存储和应用需求。Memoir的产品使用标准6T BIST(内建自修复)和DFT(诊断功能测试)测试方法,它包含的RTL级已使用正式方法详尽验证过,不再需要硅片物理验证。通过上述各种优势的组合,Renaissance 4X提供了一个重要的投放市场的时间优势,降低了产品开发成本和减少了风险。有了Renaissance 4X,顾客的选择灵活多种,不用再拘泥于自定制的解决方案。例如,内存复制,它的工作方式是以大功耗去换取较高的读性能。再者,定制多接口芯片会造成更高的成本和风险,并且产品投放市场的时间也比较长。这意味着一般不能通过第三方IP核供应商提供通用接口IP核。

“所有传统的多接口设计都有一些很大的缺点,”Adam Kablanian解释说,“它们都有成本高、风险高、开发时间被硅片验证拖延等缺点,但是有了Renaissance 4X,我们就能交付一个高性能、实惠、方便、通用多端口存储器解决方案,可以解决整个行业的大部分需求。”

从应用程序的角度看,Renaissance 4X满足下一代应用于网络和通信子系统的SoC系统设计的数据处理要求,这种数据要求传输聚合速度超过400 Gb/s。这意味着,Renaissance 4X可以为存储器在一个周期内多次访问提供广泛的适用性,例如,包缓冲区、计数器、即时流量、链表、调度器、表查找等等。另外,Renaissance 4X为多端口存储器提供二级、三级缓存共享结构,为多核SoC设计提供高访问性能。

参考资料:www.memoir-systems.com

猜你喜欢
存储器内存端口
静态随机存储器在轨自检算法
一种端口故障的解决方案
科学家(2021年24期)2021-04-25 13:25:34
“春夏秋冬”的内存
当代陕西(2019年13期)2019-08-20 03:54:22
端口阻塞与优先级
初识电脑端口
电脑迷(2015年6期)2015-05-30 08:52:42
生成树协议实例探讨
职业·中旬(2015年4期)2015-05-30 05:54:49
存储器——安格尔(墨西哥)▲
环球时报(2014-06-18)2014-06-18 16:40:11
基于Nand Flash的高速存储器结构设计
基于内存的地理信息访问技术
上网本为什么只有1GB?