英伟达GTC大会要点解读:见证AI的变革时刻

2024-04-16 03:31刘高畅
股市动态分析 2024年6期
关键词:架构芯片机器人

刘高畅

3月19日,英伟达公司(NVDA)创始人兼首席执行官黄仁勋在年度GPU技术大会(GTC)上发表主题演讲《见证AI的变革时刻》,正式拉开2024年GTC大会的序幕。在两个小时的演讲中,黄仁勋围绕五大板块,介绍了英伟达的最新研发进展:Blackwell 平台、创新软件NIMs、AI 平台NEMO 和AI工坊(AI foundry)服务,以及仿真平台Omniverse 和适用于自主移动机器人的Isaac Robotics 平台。

“世界上最强大的芯片”

时隔两年,英伟达了推出全新Blackwell架构GPU。Blackwell得名于美国数学家David Harold Blackwell,主要用于数据中心,针对当前火爆的AI大模型优化,训练、推理性能和能效均大幅提升,与Grace CPU、新一代网络芯片等产品一起,面向生成式AI共同组成完整解决方案。

黄仁勋表示,Blackwell GPU 是“世界上最强大的芯片”,将为“计算的新时代”提供动力。Blackwell 拥有六项革命性技术,共同支持AI训练和实时LLM推理,模型可扩展至10万亿个参数。基于Blackwell的处理器与其前身Hopper相比,具有5倍AI性能,4倍片上存储,而功耗显著降低至四分之一。黄仁勋还特意称,Blackwell 不只是芯片,而是一个全新的平台。

随着Blackwell架构GPU发布,英伟达顺势推出了“Grace Blackwell”GB200 超级芯片。从架构上来看,GB200 通过900GB/s 的超低功耗NV?Link将两个Blackwell B20连接到一个Grace CPU。其中最为关键的B200 芯片拥有2080 亿个晶体管,采用台积电定制的4NP 工艺制造,Die 之间的通信速度可以达到10TB/ 秒。在此基础上,一个GB200 加速卡结合了两个B200 GPU 和一个独立的Grace CPU,将能够使大模型推理工作负载的性能大幅提升,在拥有1750亿参数的GPT-3大模型基准测试中,GB200的性能是H100 的7 倍,训练速度是H100 的4倍。此外,GB200 是NVIDIAGB200NVL72的关键组件。GB200 NVL72作为单个GPU 运行,具有1.4 exaflops的AI性能和30TB的快速内存,用于LLM推理工作负载,并将成本和能源消耗降低多达25倍。

发布生成式AI微服务(NIM)

图一:Blackwell 与Hopper 性能对比

资料来源:英伟达,国盛证券

OpenAI 在2022 年推出ChatGPT后,这项新技术在几个月内吸引了过亿用户,并促使几乎所有行业的开发活动激增。进入2024年,企业开始将重点转向全面的生产部署。黄仁勋表示,未来的公司会将精力放在组装AI模型,赋予它们任务,给出工作产品示例,审查计划和中间结果,而不是编写软件。为此,英伟达推出了推理微服务,即NVIDIA NIM。该服务作为NVIDIA AI企业版的一部分,将以每年每GPU 4500 美元、或云端每小时每GPU 1美元的价格,为开发AI驱动的企业在应用和部署AI 模型上提供了一条简化的路径。

NIM支持许多AI模型,包括大型语言模型(LLM)、视觉语言模型(VLM)以及语音、图像、视频、3D、药物发现、医学成像等模型。NIM 微服务通过打包算法、系统和运行时优化并添加行业标准API简化了AI模型部署流程,使开发者能够将部署时间从几周缩短到几分钟。

英伟达同时新发布了数十种企业级生成式AI微服务,企业可以使用这些微服务在自己的平台上创建和部署定制应用程序,同时完全拥有并控制其知识产权。黄仁勋表示,现有的企业平台拥有可以转化为生成式AI 辅助的数据宝藏;这些与英伟达的合作伙伴生态系统共同创建的容器化AI微服务是每个行业的企业成为AI 公司的基石。

AI人形机器人是下一波浪潮

在GTC大会上,英伟达还发布了人形机器人基础模型“GR00T 項目”,黄仁勋称这是人工智能和机器人技术的“下一波浪潮”。

GR00T是一个通用的人形机器人基础模型,旨在推动其在机器人技术和具体化人工智能方面的突破。由GR00T 驱动的机器人将被设计为理解自然语言并通过观察人类行动来模仿动作,包括快速学习协调、灵巧等技能,以便在现实世界中导航、适应和互动等。在GTC主题演讲中,黄仁勋展示了几种这样的机器人完成各种任务。

作为Project GR00T的一部分,计算机Jetson Thor同步推出。专为人形机器人设计的Jetson Thor是一款新的计算平台,能够执行复杂任务,并与人类和机器安全、自然地互动。它采用了为性能、功耗和尺寸优化的模块化架构。同时,Isaac机器人平台也进行了重大升级,包括生成式AI基础模型以及用于仿真和AI 工作流程基础设施的工具。新的Isaac平台能力预计将在下一个季度可用。

DRIVE Thor定义自动驾驶

DRIVE Thor 是一款为生成式AI应用设计的车载计算平台,随着专为LLM 和生成式AI 工作负载而设计的Blackwell架构的推出,DRIVE Thor 将与Blackwell架构整合,预计最早在明年的生产车辆中使用。

英伟达汽车业务副总裁吴新宙表示,加速计算带来了包括生成式AI在内的变革性突破,而这正在重新定义自动驾驶与全球交通运输行业。DRIVE Orin 依旧是当下智能车型的AI 汽车计算机首选,但现在越来越多的领先车企已经开始将新一代的DRIVE Thor 放进了他们对下一代AI车辆的规划中。

英伟达宣布与多家中国车企加强基于DRIVEThor 平台的合作,包括比亚迪、小鹏汽车、以及广汽埃安旗下的Hyper品牌。在此之前,理想汽车和吉利旗下的极氪汽车均宣布将采用英伟达的DriveThor技术。

相关投资标的

算力侧:中科曙光、浪潮信息、海光信息、利通电子、高新发展、中际旭创、新易盛、工业富联、寒武纪、神州数码等。

自动驾驶:江淮汽车、赛力斯、长安汽车、北汽蓝谷、德赛西威、中科创达、华依科技、万马科技、阿尔特、菱电电控等。

机器人:三花智控、鸣志电器、拓普集团、绿的谐波。

AI 相关:金山办公、大华股份、海康威视、昆仑万维、科大讯飞、润达医疗、中广天泽、漫步者、紫天科技、万兴科技。

图二:Project GR00T 逻辑图

资料来源:英伟达,国盛证券

猜你喜欢
架构芯片机器人
基于FPGA的RNN硬件加速架构
功能架构在电子电气架构开发中的应用和实践
LSN DCI EVPN VxLAN组网架构研究及实现
芯片测试
多通道采样芯片ADS8556在光伏并网中的应用
机器人来帮你
认识机器人
机器人来啦
一种基于FPGA+ARM架构的μPMU实现
74HC164芯片的应用