向治霖
9月的开始,美国芯片大厂英伟达,卷入了大麻烦。
据外媒9月1日报道,美国官员命令英伟达,停止对中国出口两款顶级计算芯片,A100和H100。另外,英伟达的竞争对手AMD,也被要求停止对中国出口MI250芯片。
英伟达和AMD两大巨头,牢牢占据着全球独立GPU的市场。这也意味着,美国对中国的前沿、高端领域,再一次升级“追杀令”。
长远影响暂且不提,然而英伟达,率先绷不住了。
受到上述消息影响,一夜之间,英伟达的股价一度暴跌11%,股票市值蒸发了约400亿美元。另有数据显示,美国半导体公司的股价集体下挫,损失超过1000亿美元。
美国推行的技术封锁,由于逆全球化的趋势而行,“损人不利己”并不奇怪。但是这一次,市场的波动为何如此之大?
原因至少有两个方面:
一方面是,限制高端GPU(图形处理器)对中国出口,直接影响到了英伟达等公司的业绩。中国一直是英伟达、AMD等众多芯片企业的排名前三大市场。英伟达透露,新的限制政策,让公司可能在本季度损失4亿美元的销售额。
限制消息放出的当天,英伟达创始人黄仁勋“紧急公关”,第一时间发信称“:将立即与中国客户合作,以我们最好的替代品满足客户需求,或是以申请许可证方式协助。”
不过,黄仁勋也承认,替代品比起A100,表现会有明显的差距。
另一方面,市场的震荡也因为,美国的技术限制“超出了以往的打击范围,从消费电子开始,现在扩散到最前沿的领域”。这就造成不确定性的加强,市场信心被打击。
或许是因为英伟达“跌得太惨”,9月2日,美国政府打了个“补丁”。
据英伟达9月2日公告称,公司已经得到批准,可以继续为中国出口A100芯片(明年3月前),也可以继续履行A100和H100的订单(明年9月1日前)。不过,时间受到了限制。
政策改过去、改回来,信心就能恢复吗?
或者,我们更应该关注的是,朝令夕改的表象间,有什么东西永远地变了?
“我们也是(新闻发出的)这一天才知道的,其实也挺意外。”9月1日晚,董超告诉南风窗。
董超是AI领域的学者,曾就职于商汤科技。2021年,他被斯坦福大学评选为世界前2%顶尖科学家。现在的他,是中国科学院深圳先进技术研究院数字所副研究员、博士生导师,同时,他也在上海人工智能实验室担任职务。
董超告诉南风窗,A100的“断供”没有先声,发生得突然,“我们前一段时间,才刚到货了一批,已经预计了还有多少要到。我们的规划,是规划到了2025年的,然后一下子停了”。
“这个(政策生效的话)影响将会很大。”董超坦言。
以他从事的AI领域为例,目前国际竞争主要在通用大模型上,这也是 AI领域中最顶级的一块。董超说,一旦顶级的显卡被限制了,我们再做大模型的竞争,可能就很困难,“相当于未来的通用人工智能的趋势,可能就都掌握在他们手里了”。
被限制的3款GPU,无疑就是目前最新、最先进的3款。
3款GPU中,目前最多用到的是A100。董超介绍,A100的价格在一款8万元左右,只有非常大型的公司和研究院用得起,他所服务的上海人工智能实验室中,主流芯片基本换成了A100,这已经是最高级别的GPU了。
對GPU的评价指标是多样的,仅以显存为例,董超介绍,A100的显存最高可达80个G,而上一代产品中,能达到40G的就非常高了,普通产品的显存一般在20到40G之间。
A100这样顶级的芯片,对尖端研发来说,属于不可或缺的硬件。
顶级的性能只是一个方面,另外需要注意的是,高端GPU的迭代速度也很快。
仍然以AI中大模型的训练为例,“这些模型的特点,就是它的规模非常大,是有亿级以上的参数”,董超说。
十亿级甚至百亿级的数据量,对于显存要求非常高,“即便是A100这样的显卡,可能都需要32块同时进行计算”,董超说,如果说没有这种顶级显卡,那么我们可能要付出相当大的代价。
顶级的性能只是一个方面,另外需要注意的是,高端GPU的迭代速度也很快。
“大概半年多、一年间,GPU就会有一次升级。每出一款新的,相应的人工智能算法,也就会提升一大步。迭代方面,算法与显卡是相关联的。”董超介绍。
这意味着,在高端GPU彻底断供后,只需要半年一年的时间,尖端领域的差距就会体现出来。
而这一次,美国官方所针对的,自然就是AI、超算等“主战场”。
中国是美国在AI领域的主要竞争对手。早在2019年,联合国下属的世界知识产权组织(WIPO)公布了一份研究报告,认为在全球人工智能领域的竞争中,中国和美国处于领先地位。
到了2021年,斯坦福大学发布的《人工智能指数报告》显示,中国在专利申请、会议出版物、期刊发表和期刊引用等四项指标上已经领先于美国,跻身世界第一。
对待激烈的竞争,美国给出了行政干预手段。董超告诉南风窗,禁掉高端的GPU,对消费级市场影响不大,普通人很难有感知,但是“对于AI的国际竞争,这相当于釜底抽薪”。
对此,外交部发言人汪文斌9月1日表示,美方的做法是典型的科技霸权主义,美方一再泛化国家安全概念,滥用国家力量,企图利用自身科技优势,遏制打压新兴市场和发展中国家发展,此举违反市场经济规则,破坏国际经贸秩序,中方对此坚决反对。
美国官方的动作频频,今年7月,美国政府扩大了芯片制造设备的限制范围,14nm以下的设备出口中国受到限制。8月,“芯片法案”出台、限制高端EDA。再到这次限制高端GPU,动作一气呵成,环环相扣。
受到影响的,自然不只有AI。
“(先进GPU)主要用在高性能计算领域,比如高端的AI训练、数据中心、超级计算、智能计算。”芯谋研究分析师商君曼对南风窗表示。
在应用层面,受此影响的主要是科研、医疗、自动驾驶、AI等等。
GPU为何拥有如此之多的用途?我们不妨简单了解一下它的发展。
其实,GPU早期最大的用途,只是作为电脑游戏的显卡,用来对图像进行渲染。
GPU相比CPU,在图像处理上具备优势。比如一张4k的图像,如果用CPU来处理,是串行处理的,从第一个像素处理到最后一个像素,它的速度再快,也得处理完前一个才能处理后一个。
但是,GPU拥有并行处理的能力,这相当于,GPU在工作时要开非常多的计算单元,每一个计算单元,相当于一个很小型的CPU。然后,GPU就可以把这些像素同时处理。
并行计算的特点,使得GPU能够快速处理和响应。这一时期,GPU为CPU“打下手”,处理一些特定的工作。
2012年,深度学习成为火热的赛道。在原理上,深度学习与渲染很类似,这迅速带动了GPU的发展。
董超回忆说,2012年,他还在香港中文大学。“那个时候,我们决定进入深度学习领域,第一件事情就是要开始买显卡(GPU)。”
随着深度学习越来越火,董超发现,做人工智能算法的实验室,如果不用深度学习来做,可能就达不到最好的性能。这再一次助推了GPU发展。
而英伟达瞄准了这股趋势,“英伟达很聪明的一点就是,瞄准了计算能力、做计算卡,一下子就起来了”。
英伟达的奇迹,造就了“黄氏定律”。英伟达首席科学家Bill Dally 曾总结说,从2012年的K20X到2020年的A100,GPU的推理性能提高到原来的 317倍。这就是“黄氏定律”,发展速度比“摩尔定律”还快。
董超回忆说,十年前的GPU赛道上,产品很多,然而GPU成为通用芯片的时代到来,英伟达崛起,很少听到别的厂商了。
竞争对手少了,但市场“蛋糕”越来越大。商君曼表示,随着大数据时代、AI时代的来临,我们需要处理的这种图形信息、数据信息,增长的速度非常快,“顺势而为地,GPU受到越来越多的关注”。
在讲求“厚积薄发”的芯片领域,“巨人”的断供,无疑也带来巨大压力。
GPU赛道的火热,自然也引起了各国重视。
董超表示,在中国,不是没有自己的GPU,也不是没有自己的高端显卡,但是,我们没有一个完整的生态。
“中国现在已经有很多企业进入了GPU赛道,目前来说,国产GPU还处在一个发展比较初期的阶段。”商君曼称,其中的差距是比较明显的。
而在董超看来,美国此次的技术限制,最“诛心”的是,一方面,它针对尖端科技进行打压,另一方面,它依然“压着”国产GPU的发展。
董超解释,美国只禁了高端、不禁低端,这就意味着,你还可以买它的低端显卡,这就不影响它的整个销量。
而且,这在中国市场的占有量其实仍然很大。因为在A100之外,英伟达和AMD的低端显卡,在中国仍然很难有国产显卡替代。
“如果说,政策是对全部的GPU进行限制,那反而是件好事。”董超说。
这就意味着,我们必须选择国产GPU。董超表示,在中国,不是没有自己的GPU,也不是没有自己的高端显卡,但是,我们没有一个完整的生态。
对于显卡,除了要有计算能力,其实还要有配套的一些软件,相应的一些代码库等等。这些配套的东西,会形成一个生态。
一个成熟的生态,意味着使用的人很多、教程很多,解决方案都是现成的。
如同拥有“苹果全家桶”的人,在转向安卓手机后,学习和使用的成本就会上升。这正是国产GPU面临的桎梏。
这些成本包括,“它的使用非常麻烦,要求用户重新学习,而且它的里面的那些流程一旦出了问题,没有人帮你解决”,董超解释。
因此,假如我们不得不用国产GPU,那就意味着,国产的生态就可以建立起来,大家强制性地进行学习。这样,国内的GPU可以借机发展起来,国内的生态也可以发展起来。
“如果大家都用起来的话,我觉得,其实也挺有希望(突破)。”董超说。
然而,美国官方的政策“只限高端,不限低端”。在技术的壁垒和生态的加持下,哪怕是最高端的国产GPU,在对标别人的次旗舰产品时,仍然缺乏优势。
不过,层层推进的美国政策下,不切实际的幻想早该抛弃。
董超告诉南风窗,科技水平的评价,标准在于最尖端领域。国际竞争当中,如果人家已经稳操胜券、稳居第一,这个对我们是很危险的。
“相当于倒逼了,我们的国产化,技术要继续往上提升。”商君曼表示。一個中国版的“英伟达”出现,并非不可能。只不过,这一切还需要时间。