寒武纪:独创AI指令集 云、端战略并行

2018-05-15 09:02孙永杰
通信世界 2018年13期
关键词:指令集寒武纪处理器

本刊记者 |孙永杰

作为AI芯片领域的独角兽,寒武纪在2016年推出全球第一款商用终端智能处理器IP产品—Cambricon-1A,该产品已经被应用于华为Mate10、P20、荣耀10等千万级销量的智能终端中,标志着其AI芯片应用已经落地。

2008年,寒武纪的创始团队起初主要是对处理器的架构和人工智能展开交叉研究。2011年,寒武纪与南京大学的LAMDA研究组合作,将人工智能用于对处理器的架构进行优化。2014年,寒武纪与Inria合作并提出首个深度学习处理器的架构DianNao。2015年,寒武纪研发首款深度学习专用处理器芯片。

芯片落地 软硬结合

作为AI芯片领域的独角兽,寒武纪在2016年推出全球第一款商用终端智能处理器IP产品——Cambricon-1A。该产品作为寒武纪的第一代终端智能处理器IP产品已经被应用于华为Mate10、P20、荣耀10等千万级智能终端中。去年11月,寒武纪发布了三款全新的智能处理器 IP 产品,即面向低功耗场景视觉应用的寒武纪1H8、拥有更广泛通用性和更高性能的寒武纪 1H16以及可用于终端人工智能产品的寒武纪 1M。

据介绍,1M 采用 TSMC 7nm 工艺生产,8 位运算效能比达 5Tops/watt(每瓦 5万亿次运算),提供三种尺寸的处理器内核(2Tops/4Tops/8Tops)以满足不同场景下不同量级智能处理的需求,并可通过多核互联进一步提高处理效能。另外,1M不仅延续了前两代IP产品1H/1A的完备性,单个处理器核即可支持 CNN、RNN、SOM 等多种深度学习模型,1M还支持SVM、k-NN、k-Means、决策树等经典机器学习算法。

人工智能的硬件实现只是一方面,软件与硬件的协同工作也十分关键。为此,寒武纪从 2016 年起逐步推出了寒武纪 NeuWare 软件工具链,可以实现对tensorflow、caffe 和 mxnet 的 API 兼容,同时提供寒武纪专门的高性能库,可以方便地进行智能应用的开发,迁移和调优,并通过了千万量级用户大规模商用的检验。

云、端战略一体化提升体验与效率

寒武纪的AI芯片发展战略分为三个阶段。第一阶段,首先要使终端具备更为强大的本地处理能力,比如寒武纪1A率先进入麒麟970,1H16和1H8将来也能够提供更好的性能和服务;第二阶段,终端指令集与软硬件兼容的云端智能芯片,寒武纪已经基于这个思路去规划和研发,其终端和云端指令集是一致的,软件平台也是无缝移植的;第三阶段,希望能够做到端云协同,为端云应用提供最佳的应用体验。最终寒武纪会克服所有的缺点,在云端和终端之间灵活的调度和分配任务,让整个端云作为一个共同的整体更好地发挥效能。

自有与授权商业 模式并举

为达到上述战略目标,寒武纪采取两种商业模式,针对终端产品,将复制与华为的合作,依靠IP授权的方式扩张,而针对服务器端,寒武纪则计划推广自有品牌芯片。

2017年,集成了寒武纪芯片的华为Kirin970手机芯片和Mate10手机全球发布,实测结果表明寒武纪与华为的联合研发成果在图片识别速度上超越了搭载A11芯片的iPhone X。

中科曙光推出了基于Cambr icon MLU100智能处理卡的服务器产品系列“PHANERON”,性能更为强劲,可以支持2~10块寒武纪MLU处理卡,灵活应对不同的智能应用负载。以升级版的PHANERON-10为例,单台服务器可集成10片寒武纪人工智能处理单元,为人工智能训练应用提供832T半精度浮点运算能力,为推理应用提供1.66P整数运算能力,典型场景下的能效提升30倍以上。

猜你喜欢
指令集寒武纪处理器
基于Kubernetes的RISC-V异构集群云任务调度系统①
3DNow指令集被Linux淘汰
清江生物群——探索寒武纪生命大爆发秘密的新窗口
寒武纪:怪物元年
基于Dais—CMX模型机的斐波那契数列指令集设计
ADI推出新一代SigmaDSP处理器
什么是AMD64
5亿年前的奇异生物
火线热讯
AItera推出Nios II系列软核处理器