丁海骜
Graphcore公司中国总部最近搬了新的办公室,一处拥有众多IT行业知名企业的写字楼群。其中一座写字楼上,悬挂着另外一个芯片厂商名字。已经装修完的Graphcore新办公室,据说与其英国总部保持了同样的风格,而且很多办公设备都是从英国运来的。最有趣的是:新办公室的名字:哪吒、女娲、木兰……都是中国传统意义上,挑战权威,打破惯例,具有典型开创型色彩的人物。这种无意的设置,与大楼外悬挂的巨大LOGO形成了一种有趣且微妙的呼应:因为身处一个AI应用越来越深入广泛的时代,Graphcore作为后来者,事实上就是整个芯片行业的一个秩序挑战者。
“今天AI计算的主流:一部分在CPU上,还有不少业务在GPU上,IPU是另外一部分。三者之间的关系可以理解为三个互相交叉圆:中间有交错的部分——长期来说,IPU和GPU是很不一样的,他们彼此之间应该有各自覆盖的范围,有自己的领域。”卢涛,Graphcore大中华区总裁兼全球首席营收官在任何场合都会首先强调IPU并非是为了取代CPU或GPU,因为他们之间有“很大的不同”。
IPU,Intelligence Processing Unit,智能处理单元,是一类专司AI的芯片处理器,也是Graphcore诞生的起点:作为一家成立于2016年的年轻公司,Graphcore公司创始人Nigel Toon和Simon Knowles之前曾经共同创建了一家专注于打造3G modem芯片的Icera公司。之后,这家公司在2011年被英伟达以3.7亿美元的价格收购——Graphcore是两人再度联手创建的第二家公司,而且直接将目标锁定在打造一款专为机器学习工作负载而设计的处理器——IPU。
“我们设想中未来一个大规模数据中心有三部分构成:CPU、存储和AI计算。”在卢涛看来,IPU与传统的CPU芯片之间的关系,是平行且解耦的,“AI计算并不一定是要附在CPU上面,它和CPU是并行的:两者之间的关系是动态可调配的。”
而对于业界经常拿来做对比的IPU和GPU,卢涛认为两者之间从芯片架构上就有这巨大的差异。“第一,从计算核心的角度,IPU有1400多个处理器核,每个内核可以运行6个线程;第二,从存储架构上,GPU用显存或者HBM,是片外的大存储;IPU采用的是片内的分布式架构,如GC200就拥有900MB处理器内存储;第三,从通信角度看,两者在跨芯片多核通信调度的时候也是不一样的:GPU内的SM核是多核多线程呈现给开发者,因此程序员需要关注彼此的线程,以及随时处理通信过程中的数据同步问题;IPU则是采用一套BSP(Bulk Synchronous Parallel)的软硬件结合算法,让一个芯片一千多个核,甚至多个芯片跨IPU连接。”他进一步解释:“打个比方,有一万个人在排队,IPU的做法是把队伍整理好了,再往前走,到下一个集合点再把队伍整理好,再往前走。这样做的好处在于:当系统进行大规模并行时,就不再需要把系统的复杂性显示给程序员和开发者。”
技術的后发优势,以及其架构理论的先进性,让Graphcore的IPU从一开始就得到了整个IT行业的普遍关注:不仅投资者几乎涵盖了整个IT行业内的知名企业和知名投资机构,而且还被ARM公司联合创始人、英国半导体之父赫尔曼·豪瑟认为是“第三次运算架构革命”。因为在他看来,代表着“传统”的CPU和GPU,都是在AI技术突飞猛进之前出现,因此这些芯片架构都不能适应AI对于芯片的需求,“AI和机器学习正在因为硬件受限而阻碍发展,应该针对此技术发展相应的处理器”。
而Graphcore也的确没有让业界失望。在成立的第二年,2017年7月,Graphcore就宣布推出了他们的第一个芯片Colossus GC2,并且在2018年正式上市。此后,Graphcore进入高速迭代期——不仅是技术和产品,而是整个业务模式都在不断成长和迭代——2020年7月Graphcore对外公布了其第二代IPU GC200,对产品形态进行了重大调整的,第二代的Graphcore AI芯片不再是PCIe形态的“半成品”,而是通过将其整合成一个产品,直接交付给终端用户,从而加快了IPU进入市场的周期,实现了从技术到产品,再到实现商业价值的完整通路。
而如何将这种理论上的商业模式变成真正得到市场验证的竞争优势,则可能成为Graphcore下一个阶段最关键的核心。就在不久之前,卢涛的职位发生一些改变:其职务从中国区总经理变成了大中华区总裁,且兼任全球首席营收官——也就是说,摆在Graphcore面前的商业逻辑实践之路,将由其负责开拓。
“营收,包含了很多东西:例如全球的销售组织、商务拓展组织、技术支持组织,AI应用开发的组织……不是一个简单的纯销售团队,销售组织占中间很小一部分。”卢涛强调,在其规划中,Graphcore的商业逻辑,应该从扩大用户数量开始:“我在很早就与公司CEO谈起过:对于Graphcore而言,第一个优先级的问题,是要有人用我们的产品;第二,是有人用了这个产品并真正服务于他的业务;第三才是业绩;第四是利润——先后顺序不能弄错。这就需要我们的策略制定,眼光要长一点,久一点,之后自然就会有大的进展。”
而这一“大发展”的短期目标,卢涛认为是在2022年,Graphcore希望从以往的市场霸主挑战者,成为“多个维度的市场领导者”。
在卢涛看来,2022年,对于整个AI芯片产业而言,将是竞争更加激烈,但是市场区分也会逐渐清晰的一年。凭借以往在技术、硬件、软件、生态建设、部署合作、OEM合作等方面所作出的努力,Graphcore将在2022年赢的更多的优势:“假如说,今天的巨头是在珠穆朗玛峰上,从下向上需要经过七个台阶进行追赶:第一个台阶是组建团队,第二个台阶是宣讲理念,第三个台阶是有芯片产品,第四个台阶是有芯片且能够给客户送样品做测试,第五个台阶是有产品且有落地的应用,第六个台阶是有产品且有很多落地的应用,第七个是有很大的市场份额。那么,我认为Graphcore目前处在第五至第六个台阶的阶段。”换句话说,距离峰顶,Graphcore也许只有一步之遥。
技术的趋势可以预测,但是市场的竞争态势却无法预知。没人能知道Graphcore是否能如愿登顶,我们能感受到的,是其表现出来的整个IT领域已经许久未见的勃勃生机:从入场到挑战权威,再到立志成为领导者,Graphcore只用了5年时间。
采访过程中,卢涛谈到Graphcore在2021年下半年在中国市场的几个成功过案例:与安捷中科合作,利用IPU进行气象预测、精准灌溉、防灾减灾;与升哲科技合作打造基于IPU的城市ESG方案;与深势科技合作,完成分子动力学模拟软件DeePMD-kit向IPU硬件的迁移,将分子动力学应用于新药的研发、新材料的研发等。也谈到了在2021年12月,Graphcore和百度飞桨宣布全面支持IPU在百度飞桨上进行训练和推理。
“2022年,我们会有与国内公有云厂商的IPU产品发布,也会有新的硬件产品的发布。同时,我们会持续深耕本地的合作伙伴,拓展更多AI平台的合作。另外,在相关AI应用领域中也会进一步加深,如AI辅助科研、自动驾驶等领域,都将是Graphcore在2022年AI应用或垂直领域中比较重要的方向。”卢涛说。