GTC CHINA 2016开启人工智能黄金时代

2016-11-07 02:30供稿NVIDIA

智能制造 2016年9期

供稿/NVIDIA

供稿/NVIDIA

2016年9月13日，GTC CHINA 2016（GPU技术大会）在北京召开，NVIDIA联合创始人、总裁兼首席执行官黄仁勋出席大会，深度阐释了GPU计算产品与解决方案平台将如何拓展人工智能发展的想象空间，加速人工智能改变未来的进程。同时，NVIDIA全球首发了两款深度学习和自动驾驶最新产品，宣布了与京东等领先企业的合作项目。

GTC由全球视觉计算技术的行业领袖及GPU的发明者NVIDIA公司主办，每一届GTC都汇集了数千名致力于通过GPU来解决重大计算难题的科学家、工程师、研究员、开发者乃至整个生态系统的企业代表的参加。在过去两年，参会人数增长了4倍，而NVIDIA开发者增长了3倍达到400，000人。作为深度学习开发标准，使用NVIDIA GPU的人工智能开发者增长了25倍。本次GTC CHINA 2016吸引了国内外近3000名行业精英参加，共同探讨GPU在人工智能、深度学习、大数据、高性能计算，虚拟现实以及自动驾驶等前沿技术领域的应用和前景。

黄仁勋表示：“有史以来，计算机和软件在视觉和听觉这两种人类最基本的感官上，第一次达到了超越人类的水平。将GPU应用于深度学习至关重要，如今我们有了突破性的科技能在未来数年中用于加速人工智能的发展。人工智能计算将解决许多其他软件无法解决的问题，引领交通、医疗和社会生活中各个方面的人工智能革命。”

人工智能引领第四次工业革命，深度学习成为全新计算模型

数据显示，到2025年，人工智能市场将达到360亿美元的规模，人工智能将成为IT领域中发展最快的部分，或将引领继蒸汽机、电力和计算机之后的第四次工业革命。人工智能是GPU计算的终极挑战。来自谷歌的Jeff Dean说，深度学习将通过“更多数据、更大的模型、更多的计算”来优化；微软的ResNet增加了网络的复杂性，它比AlexNet模型复杂16倍；百度的DeepSpeech，在一年中增涨了4倍模型尺寸、2倍数据，以及10倍的计算能力。

深度学习作为全新的计算模型，正在改变计算的方方面面，不仅改变了软件开发的方式、开发地点和运行方法，还在改变着服务器架构、数据中心和智能设备。在深度学习的训练方面，网络的设计和训练都需要数万亿次的运作，而GPU使其切实可行，可训练更有深度更准确的模型，加速产品上市时间。在数据中心推理方面，对于云服务来说，网络将运行在数据中心里，每天经历数以万计的图片、声音和视频的查询，而GPU推理可快速回应，实现数据中心吞吐量最大化。在设备推理上，即使面对数十亿智能设备的运行规模，GPU也能做出实时精确响应。

深度学习最苛刻的部分是训练，而NVIDIA专为深度学习设计的PASCAL架构，助推深度学习加速高达65倍，并且能够支持每个主要的深度学习框架。在此架构基础上，NVIDIA创造了专为GPU深度学习所设计的超级计算机DGX1。

全球首发两款新品，打造新一代计算平台

在本次大会上，NVIDIA全球首次发布了最新深度学习推理加速器Tesla P4/P40和自动驾驶汽车专用人工智能超级计算机DRIVEPX 2。

Tesla P4和P40是专门为深度学习推理设计的加速器，可以使用经过训练的深度神经网络来识别语音、图像或文字，以响应用户和设备的查询。其中，P40专为最大吞吐量而设计，并能将CPU推理加速40倍；为加速1U OCP服务器而设计的P4，功率仅为50瓦。鉴于一个现代化的网络可能有上百层和数以万计的参数，网络的复杂性增加了多样性和准确性，但也降低了推理性能，因此NVIDIA发布性能优化推理的引擎TensorRT，不仅将复杂性减少2倍甚至更多，而且不通过融合操作，移除低贡献的权重，降低FP16或INT8精度，以及许多其他影响性能的技术。未来，在今年美国GTC上发布的超大规模数据中心加速器Tesla P100将与全新Tesla P4/P40在深度学习的训练和推理两端，为数据中心带来端到端的深度学习平台。此外，本次大会上，IBM还发布了配置有Tesla P100和NVLINK高速互联技术的全新POWER8服务器，将为人工智能企业提供领先高效的计算能力。

同场发布的还有针对汽车自动巡航功能的人工智能计算机DRIVE PX 2，这款只有手掌大小的超级计算机采用新型单处理器配置，功率仅为10瓦，可以利用深度神经网络处理来自多个摄像头和传感器的数据，通过实时了解周边环境、在高清地图上精确定位，以及规划安全行车路线，实现安全的自动巡航。DRIVE PX 2将帮助汽车制造商为自动化无人驾驶汽车的驾驶和制图功能提供支持，更快更顺利的把研发成果应用于实际产品中。

至此，NVIDIA在人工智能和自动驾驶领域，形成了以Tesla P100和DGX-1为核心的训练体系，以P4/P40和Tensor-RT为核心的数据中心推理体系，以及以Jetson TX1与Jetpack 2.3、DRIVE PX 2与Driveworks为核心的智能设备体系。NVIDIA在上述领域从硬软件到解决方案上都进行了全面布局，构建了端到端的深度学习平台。

深化与中国企业合作，同创人工智能未来

在深度学习与人工智能领域，NVIDIA与中国企业的合作由来已久，许多知名互联网企业利用NVIDIA的GPU计算技术与解决方案，不断推动自身人工智能战略的全面发展。比如基于双方合作，阿里巴巴的淘宝得以不断加速优化商品推荐，阿里云成功构建中国首个基于GPU的云上高性能计算平台；百度宣布启动从云端到汽车的自动驾驶平台开发；科大讯飞进一步提升语音识别的速度和精准度。本次大会上，NVIDIA还与京东达成战略合作并共建联合实验室，将在人工智能技术研发领域展开更深入的合作，从而助力京东在深度学习、VR/AR等人工智能战略的推进。未来在中国，人工智能还将成为搜索、电商、物流和医疗等多个行业变革的核心动力。

在“大众创业、万众创新”和中国制造2025的国家战略指导下，巨大的用户和数据基础，丰富的应用场景，浓厚的技术创业氛围和充满创新能力的企业，都推动中国走在了深度学习和人工智能领域发展的前列，而中国的初创企业也正在成为改变全球人工智能的生态和行业的重要力量。蓬勃发展的技术性初创企业，通过利用GPU在性能上的突出优势，应用NVIDIA的端到端深度学习平台，正在AR/VR、无人机、机器人、图像识别、人脸识别、医疗成像和天气预测等多个领域，抢占技术创新和应用市场的先机，颠覆行业传统。

扩大技术应用领域，为社会与生活赋能

伴随着深度学习、人工智能技术的高速发展，这些技术将可预见的被应用到更多与人类生活和社会发展息息相关的各个领域。比如在自动驾驶领域，从高清地图到车辆的实时感知，从精确定位到安全的自动驾驶，所有一切都建立在先进的人工智能算法和性能优越的超级计算机上。NVIDIA拥有Tesla P系列加速器，以及全新DRIVE PX 2人工智能超级计算机，将在自动驾驶领域打造完善的技术生态体系。NVIDIA与百度深度合作引领自动驾驶汽车未来，自动驾驶的端到端架构包含人工智能车载超级电脑、搭载操作系统的高性能传感器、人工智能算法和云端高清地图。不久前，李彦宏和黄仁勋先生在百度世界大会宣布的合作将共同开发出业界第一个端到端架构，由NVIDIA DRIVE PX 2驱动百度无人车，同时，开放平台可整合到所有OEM厂商汽车中。

此外，利用智能视频监控系统打造“人工智能城市”也将是一场人工智能的革命。基于端到端的深度学习技术，视频监控未来将从简单的反馈，到实时响应，甚至实现预测响应，为城市和社会的安全，提供更加全面智能的保障。而NVIDIA的Tesla加速器、DGX-1超级计算机、Jetson TX1嵌入式系统和Jetpack 2.3嵌入式平台软件包，将深度加速相关深度学习的训练和推理的进程。本次大会上，NVIDIA宣布与海康威视、大华和宇视科技3家中国智能视频分析公司合作，利用通过网络训练和IVA服务器的NVIDIA人工智能计算平台构建中国的“人工智能城市”。

众多行业领导者与NVIDIA合力创建人工智能解决方案，未来，人工智能将应用在各行各业，带来更智慧、更安全的城市，实现自动驾驶。人工智能将服务所有人，人工智能也不再是科幻，正是GPU深度学习突破性的计算模式推动着人工智能革命。作为人工智能计算的代表性企业，NVIDIA致力于加速推进相关领域的发展，并将人工智能的魔力带给世界。

HPC里程碑：IBM POWER8服务器通过NVLINK与Tesla P100互联

2016年9月21日，在GTC CHINA 2016大会上，NVIDIA与IBM共同宣布：全新POWER8家族将通过NVLINK与NVIDIA Tesla P100实现强势组合。NVIDIA黑科技加IBM服务器，能加速人工智能、深度学习和数据分析这类高度融合的工作，加速人工智能的企业化应用。

近年来，数据中心的工作负载在不断发生变化，加速数据中心的需求也在不断增强。不久之前，这些系统主要用于处理存储和提供网页，而现在它们越来越多地负责人工智能领域的工作，比如理解语音、文字、图片和视频，或者分析大数据以提供决策反馈。消费者层面希望快速获得问题的答案，企业则需要分析激增的数据来更好地满足客户需求。这些问题都将由数据中心提供解决方案。

作为服务器系统领域的领导者，IBM在几年前便注意到了这种趋势，并与NVIDIA合作，加快新数据中心工作负载的处理速度。经过四年的研发，备受关注的POWER8服务器联合了NVIDIA的Tesla P100 GPU和NVLink互联技术，实现了更高的数据性能分析，提升了深度学习能力。

IBM Power System S822LC系统使用两个IBM POWER8 CPU和四个NVIDIA Tesla P100 GPU，并通过NVLink高速接口使其互联互通。这是一款定制的GPU加速器服务器，其中NVLink接口集成在主板路由上，并且使用NVIDIA的TeslaP100 GPU。IBM和NVIDIA的技术融合，使数据流动速度比PCIe快了5倍。

据悉，IBM已经收到多个客户的订单，其中包括一家大型跨国公司和美国能源部橡树岭国家实验室（ORNL）、劳伦斯利福摩尔国家实验室（LLNL）等研究机构。ORNL和LLNL将把新系统用作开发平台，以充分利用NVIDIA NVLink技术。这些系统将作为新一代超级计算机Summit和Sierra开发应用的试验台，IBM公司预计将于2017年把Summit和Sierra分别交付给ORNL和LLNL。