GP100率最新Ouadro Pascal家族亮相，NVIDIA高端显卡剑指制造业应用

2017-10-11 17:16齐健

智能制造 2017年5期

齐健

2017年4月12～14日，NVIDIA携全新发布的Pascal架构Quadro新品，亮相InfoComm China 2017展会。在展会首日，NVIDIA在国家会议中心的大会现场召开媒体发布会，公开展示了GP100、P6000、P5000等全新Quadro Pascal架构高端专业级显卡。会上，NVIDIA专业可视化业务高级总监Sandeep Gupte及英伟达中国区销售总监何犹卿向记者展示了全新Quadro显卡家族的强大性能和多种应用场景。

Pascal架构的Quadro显卡主要定位于专业级工作站，完成包括仿真分析、VR模拟以及视频渲染等工作。与上一代相比，全新Quadro产品的运算速度提升了两倍（基于SPECviewperf 12基准的计算结果），且具有超快速内存。新NVIDIA专业可视化业务高级总监Sandeep Gupte说：“NVIDIA的愿景是希望用户凭借Quadro产品家族的这些新产品，简化设计的工作流程，从传统的工作站与工作方式中解脱出来，把工作站打造成个人的超级计算机。”

全新Ouadro旗舰显卡GP100

Sandeep Gupte对Quadro家族的旗舰产品GP100进行了重点介绍。GP100基于Pascal核心，单精度CUDA核心数3584个，双精度CUDA核心数1792个，具有16 GB HBM2高带宽显存，半精浮点运算性能达到20.7TFLOPS、单精浮点运算性能为10.3 TFLOPS、双精浮点运算性能为5.2 TFLOPS。同时，支持4K、5K以及VR显示。

GP100具有以下特点：

◎统一仿真、HPC、渲染和设计：GP100将双精度性能（5 TFLOPS以上，比Quadro K6000快将近3倍）与16GB的高带宽内存（HBM2）相结合，因此用户可以在设计过程中进行仿真，并以前所未有的速度采集逼真的多物理场仿真。客户能够将两个GP100 GPU与NVLink^TM技术相结合，并扩展到32GB的HBM2，以在单一工作站上创建庞大的可视化计算解决方案。

◎探索深度学习：GP100提供超过20 TFLOPS的半精度计算（单精度（FP32）性能为10 TFLOPS，以半精度（FP16）模式运行可使吞吐量翻倍至20 TFLOPS），可谓在Windows和Linux环境中进行深度学习的理想开发平台

◎将VR集成到设计和仿真工作流程中：VR认证的Quadro GP100和P4000具有创建详细、逼真、沉浸式环境的能力，能够大规模实现更加宏大、更加复杂的设计体验。

◎尽享照片级真实感设计的优势：基于Pascal^TM架构的Quadro GPU渲染照片级真实感图像的速度为CPU的18倍（基于采用Iray渲染技术的内部测试，在720p场景中，比Intel Xeon E5 2697 V3 2.6 GHz 14核CPU快18倍）。

◎创建广阔的可视化工作区：可在多达四个5K显示器上以高分辨率和HDR颜色显示数据。

◎经济高效地构建超高分辨率及多显示屏配置：通过将多达8个P4000 GPU和两个Quadro Sync Ⅱ显卡（Quadro驱动程序目前支持使用单个Sync Ⅱ显卡配置多达16个4K显示器。未来驱动程序更新中还将添加配置多达32个4K显示器的功能）相结合，可通过单一机箱实现多达32个4K显示器的配置。

GP100在仿真与渲染领域的应用

GP100在CAE方面表现突出，可以帮助工程师快速完成包括结构力学、流体动力学和电磁学等方面的双精度计算。同时，GP100可以兼顾设计与仿真工作的需要，在同一个工作站中一卡两用。Sandeep Gupte介绍说，在Simulia和ANSYS的CAE分析过程中，利用GP100加速比之只使用CPU进行运算仿真效率得到了大幅提高，Simulia的仿真速度提高了3倍，ANSYS则提高了2倍。除了性能提升之外，GPU加速还可以在软件许可采购方面帮助用户节省开支，用户可以利用GPU取代部分CPU运算，从而减少在软件多核节点方面的开支。

在软件应用方面，NVIDIA与达索系统、西门子PLM、PTC等多家软件公司合作，在软件中开发专门针对GPU加速的功能。例如，NVIDIA与达索系统的深度合作，在CATIA的渲染模块中，采用了Iray技术，在SOLIDWORKS Visualize中，也可以应用GPU加速，把渲染时间从5小时缩短到30分钟。

Sandeep Gupte表示，NVIDIA在全球组建了一个由软件工程师组成的技术团队叫做Def Tech，他们的工作就是与本地企业的软件工程师开展技术合作，确保用户的应用软件可以在硬件上流畅运行。

Quadro显卡在娱乐影音渲染方面的应用更为广泛，英伟达中国区销售总监何犹卿表示，GPU加速对电影渲染来说非常重要。他以《变形金刚3》的一帧4K画面为例比较，只用双核CPU渲染需要288个小时的画面，GPU加速大概只需要3个小时。

QUEST计划

在本次媒体会上，Sandeep Gupte还提到了NVIDIA的QUEST（Quadro Embedded System Program）计划，即基于Quadro的嵌入式系统计划。目前，NVIDIA已经面向全球开放了针对高性能嵌入式系统的开发者计划，开发企业可以申请加入此项计划，与NVIDIA共同设计适用于不同软件解决方案的GPU。除此之外，NVIDIA还为这些开发者提供设计包（Design Kit）、SDK、样本代码以及培训课程等。

Sandeep Gupte强调说：“要打造嵌入式的解决方案，对品质、可靠性和性能的要求都非常高。因此我们关注的焦点是找到能够在不同行业中实现这三点的合作伙伴，不拘数量。QUEST计划不收取费用，但是我们在遴选合作伙伴的時候也会认真考虑，因为我们在技术团队方面要与这些企业开展密切地合作。因此，我们要针对目标市场选对合作伙伴。”endprint