AI芯片细分领域中积极进取的Graphcore

2021-02-07 02:53张帅
数字商业时代 2021年1期
关键词:专用神经网络架构

张帅

有这样一个你可能熟悉却又不清楚的数据:全球关于AI方法的论文数量自2017年起,每年增长50%,2020年我们可能会看到超过21000篇AI领域的新论文。

在AI算力呈现爆炸式增长的过程中,有一个2012年广为人知的英伟达GPU故事,一个来自多伦多大学的Alex和他的团队设计了AlexNet的深度学习算法,并用了2个英伟达的GTX580 GPU进行训练后,打败了其他所有计算机视觉团队开发的算法,成为那一届ImageNet冠军。

此后,在计算机视觉和自然语言处理领域,GPU的高并行计算能力得到了充分的发挥,英伟达的GPU也随着AI第三次浪潮的崛起而迎来井喷发展。与此同时,更多为机器学习而专门定制的专用芯片开始出现,比如专用集成电路(ASIC)的张量处理单元TPU、神经网络单元NPU以及半定制芯片FPGA等等。

随后AI热度不断攀升,与AI相关应用也在急剧增长,这引发了市场对超大型数据中心的强劲需求,仅构建于英伟达平台上的AI创业公司,全球就被估计有3000家。而GPU只是AI领域中的一条技术路线。

2018年,英国一家名为Graphcore的创业公司推出了一种专门应用AI计算的处理器芯片IPU(Intelligence Processing Unit)。IPU一經问世,就受到AI界越来越多的关注。ARM创始人,被称为英国半导体之父的赫曼·豪瑟曾为Graphcore的IPU给出很高评价,将其誉为“计算机史上三次革命中,继CPU和GPU之后的第三次革命”。

IPU究竟为何物?

IPU被行业内称为一种新的技术架构,与 GPU有着非常大的差异。比如GPU只是为大块密集的连续数据设计,而IPU则是针对未来学习趋势的高性能/高效率。简单来说GPU像是一个齿轮,可以连续不断的运作数据,而IPU则像是工业大厂,涵盖GPU了的工作,且可以并行运作多个工作项目。

所以行业人士更多地将IPU视为一个标准的神经网络处理芯片,可以支持多种神经网络模型,因其具备数以千计到数百万计的顶点数量,远远超过GPU的顶点规模,所以可以进行更高潜力的并行计算工作。此外,IPU的顶点的稀疏特性,令其也可以高效处理GPU不擅长的稀疏的卷积计算。其次,IPU也支持了模型参数的复用,这些复用特性可以获取数据中的空间或时间不变性,对于训练与推理的性能会有明显帮助。

2020年,Graphcore与马萨诸塞大学、Facebook一起使用近似贝叶斯计算的方式做流行病的模型分析,在研究领域也取得了一些进展。Graphcore高级副总裁兼中国区总经理卢涛表示:“与CPU相比IPU速度提高了30倍,与GPU相比提高了7.5倍。除此之外IPU也能做许多通用计算,比如布里斯托大学使用IPU,攻克粒子物理中的HPC挑战。伦敦帝国理工学院在IPU上,加速了经典计算机视觉的一些问题。”

而根据最新的训练报告来看,相比1个DGX-A100,BERT-Large(BERT模型,具备3.4亿个参数)能在IPU-POD64上实现5.3倍的提升,相比3个DGX-A100,能够实现1.8倍的提升。“1个IPU-POD64和3个DGX-A100的功率和价格基本相同,但却能够实现接近两倍的性能提升,这就是非常显著的性能优势。”Graphcore中国工程总负责人、AI算法科学家金琛如是说道。

还在路上有待努力

12月29日,Graphcore宣布,其已在E轮融资中筹集了2.22亿美元,增资后公司的估值为27.7亿美元。这是一家用四年时间快速成长起来的科技公司,早在2018年12月份,Graphcore从微软、宝马、三星和红杉手中融资2亿美元,成为英国估值最高的初创企业之一。

在融资方面,卢涛给人一副十分自信的感觉,他表示:“在融资的架构组合上,Graphcore是非常好的,其中的战略投资人涵盖企业应用、云计算、汽车等不同的垂直领域。在VC方面,投资方有来自世界知名的红杉资本,而投资方是Graphcore积极发展的重要信心来源。”

我们知道,AI芯片既要具备一定的灵活的可编程性(通用性),又要具备专用的高效性能优势。比如专注于图像渲染崛起的英伟达GPU,也随着游戏、视频渲染以及AI加速而向GPGPU(General Purpose GPU)的方向演进。当然,这也并非一件坏事,或许IPU能够找到一个新的细分市场,介入GPU无法很好发挥效能的神经网络模型,同时又避免专用AI芯片的不可扩展性,能够部署在更大规模的云计算中心或超算中心,对新算法模型保持足够的弹性计算空间。

但是,今年AI芯片产业正在遭遇洗牌期,例如美国某AI芯片公司在春季就黯然退场,中国区工程全部关闭。也许这并不意味AI计算将会遭遇寒冬,因为一个AI芯片从产出到大规模的应用,需要经历一系列的中间环节,比如主流算法架构的软件库、工具链、用户生态等。所以回头来看,GPU已经形成了一个非常完整的AI算力生态链,而IPU仍在路上,是否真的能够崛起,我们还需要看整个AI产业和应用研发的选择。

猜你喜欢
专用神经网络架构
沁人心脾的“香”
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
基于云控平台雾计算架构的网联汽车路径控制
基于自适应神经网络的电网稳定性预测
德里女性专用车厢受青睐
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
VIE:从何而来,去向何方
数学达人专用时钟
企业架构的最佳实践