丁海骜
如果有一天,上门送货的不再是快递小哥,而是一台能够识别人脸的机器人,你将作何感受?甚至又或者,送货的是一台航速每小时100公里的无人机,将重达200公斤的货物放在你的天台,你是否会觉得震撼?
这些应用场景有些已经成为现实,有些即将成为现实。
这是在9月底举办的GTC 全球巡回北京站,NVIDIA创始人兼首席执行官黄仁勋演讲当中谈到的一个正在开展的合作项目:NVIDIA与京东创新实验室京东X合作的JDrone无人机和JDrover机器人——同样利用NVIDIA Jetson 超级计算机模块驱动的智能机器——号称正在将人工智能引入物流与配送领域。
AI火到什么程度?有人开玩笑说:如果哪家公司的产品跟AI无关,那这个公司一定没有前途,产品将很快被淘汰。
“AI 是就是计算的未来,可以让我们重新思考各种服务、软件、计算机和设备。在未来,我们可以制造各种各样新的产品,而且我们会重新思考全世界现在已有的产品未来变成什么样子。”黄仁勋在演讲中强调,AI技术是继互联网和云计算以后,又一个最有可能改变人类现状的IT技术应用。
NVIDIA的AI技术思路
作为AI从技术到应用的最主要技术推手,曾经是一家专业的图形处理芯片公司的NVIDIA在最近几年全面转型主攻AI,在很短的时间内,成为对AI应用最具话语权的技术公司和最基础技术的提供者。“NVIDIA致力于构建一个架构,用这个架构创造软件平台,而后全世界都可以在软件平台上去做创新。这一平台适用于各种场景:大到超级计算机中心,小到PC、机器人等。”黄仁勋提到的NVIDIA架构实际上已经成为众多AI应用的开发平台。
GPU是NVIDIA整个AI基础框架和平台的基础。
GPU这一概念是NVIDIA在1999年发布GeForce 256绘图处理芯片时首先提出的概念—— graphics processing unit(图形处理器)——在此之前,电脑中处理图形图像输出的显示芯片,通常很少被视为是一个独立的运算单元。而GPU的提出,不仅使得计算机对图形图像的计算,减少了对CPU的依赖,而且还分担了部分原本是由CPU所承担的计算工作。这也使得GPU从一开始,就与CPU保持了一种既互相配合又常常被拿来做比较的微妙关系。
正是基于GPU和CPU的这种关系,2007年,NVIDIA正式推出了CUDA(Compute Unified Device Architecture,统一计算架构)的框架策略来完整定义GPU发展的基础逻辑。
“什么是CUDA?其实就是CPU+GPU。”黄仁勋面对这样的问题总是会首先强调,GPU不会替代CPU,而是携手与CPU共同工作:GPU专注于执行高度线程化的并行处理任务(大规模计算任务),而更具通用属性的CPU,则负责逻辑性强的事物处理和串行计算。用黄仁勋的话说:“CPU是通用型的,什么场景都可以适用;GPU的性能要比CPU超过10倍,50倍甚至百倍,所以通常用在解决一些专门的问题。”
事实上,CUDA也全面奠定了NVIDIA向AI应用的框架基础。因为从概念上,NVIDIA所定义CUDA为GPU自身的发展规划提供了更多空间:作为整合技术,CUDA是一个建立在GPU基础之上的通用计算开发平台,利用这种软硬件结合的架构技术,程序開发者可以可以利用GPU作为C-编译器的开发环境,直接对所进行的计算进行分配和管理,从而使GPU更能发挥作用的架构基础。
基于CUDA,2013年,NVIDIA在GPU技术大会上发布了GPU新的架构Volta。“NVIDIAVolta的GPU,我用了三年的时间,研发经费达到了30亿美元。”在此次GTC中国站的会议上,黄仁勋再次向中国听众展示了刚刚不久前刚刚在GTC 2017发布的NVIDIA Tesla V100——这款据称是史上规模最庞大的GPU,核心面积达到了创纪录的815平方毫米,内置了5120个CUDA单元,拥有超过210亿个晶体管,是上代NVIDIA Pascal架构P100 GPU的1.37倍,性能是P100 GPU提升了 5 倍,同时可提供相当于 100 个 CPU 的深度学习性能。
在此次中国站的GTC上,黄仁勋在 GPU 技术大会上发表演讲时宣布,阿里云、百度和腾讯正在将NVIDIA V100 GPU运用到其数据中心和云服务基础架构中。“人工智能是当前时代最为重要的技术发展,具有造福社会的巨大潜力。随着全球领先的云服务提供商相继采用Volta GPU和NVIDIA的软件来部署全球最佳的人工智能平台,我们将看到来自医药、自动化交通、精密制造、乃至更多领域的惊人突破。”或许这正是NVIDIA对推动人工智能普及应用的价值所在。
AI,重要的是应用场景
如果说基于Volta GPU为NVIDIA的AI应用提供了足够的硬件基础,那么围绕AI应用所开发的软件系统,则进一步定义了NVIDIA在AI应用领域的应用场景——在更容易的范畴率先发挥AI的作用和价值,对整个技术领域是一种莫大的支持。
在中国站的GTC上,黄仁勋发布了TensorRT3 AI 推理软件。
“一个GPU的架构是非常复杂的,它的能力非常强大。但是还是需要一些比较特殊的编译器。”他尤其强调的一点是,NVIDIA TensorRT是全球首款可编程推理加速器,借助NVIDIA Tesla GPU加速器的可编程性能够所有的框架、为诸如图像和语音识别、自然语言处理、视觉搜索和个性化建议等人工智能服务提供超快速且高效的推理,速度可达到CPU 的40倍,而相较于基于CPU 的解决方案,成本仅为其十分之一。“搭配Tesla V100 GPU 加速器的TensorRT每秒能够识别多达 5,700 张图片,而如今所用的CPU则每秒仅能识别 140 张图片。”
而这是人工智能走向应用的最基础、最普遍和最规范化的应用模块,是所有深入应用AI的最基础功能。据NVIDIA公布的数据显示,目前采用其推理平台的用户,包括亚马逊、微软、Facebook和谷歌、以及阿里巴巴、百度、科大讯飞、京东、腾讯等超过 1,200 家来自各行各业的公司。
不仅如此,为了向更深入推进AI的应用,此次除了最新的TensorRT 3,黄仁勋还发布了能够实现 AI 加速的其他软件:包括能够大规模提供实时、低延迟视频分析的 DeepStream SDK、以及能够加快 HPC 和深度学习应用速度的加速计算软件平台 CUDA 的最新版本:CUDA 9。
具体到实际应用场景,智慧城市、自动驾驶、无人机器等都是NVIDIA目前和未来投资最多,也是最为关注的领域——这不是计划,而是切切实实的投入。
黄仁勋宣布了几个最近在中国的AI应用投入。
首先,基于NVIDIA人工智能智慧城市的Metropolis平台,NVIDIA在中国新增了两个重量级用户:阿里巴巴与华为。“我们不要总是认为国外的公司更领先,实际上到了现在的阶段,我认为中国的公司更具有创新能力和实践的动力。”作为5月份首次发布的Metropolis,是一个包含各种工具和技术从终端到云端的视频分析平台,以构建覆盖交通与停车管理、执法、城市服务等各个方面更智能、更快速的AI赋能应用。这次发布的新版本,增加了NVIDIA DeepStream SDK (软件开发套件)——开发者可以使用DeepStream来实时处理、理解并归类视频帧,以满足最严苛的吞吐与延迟的需求。因此对于华为和阿里巴巴来说,他们针对深圳警用的视频监控和阿里云杭州“城市大脑”,都具有了近一步实践的更大空间。
其次,本文最初提到的与京东的合作,则将关注的焦点放在人工智能物流和配送领域:利用基于NVIDIA Jetson 超级计算机模块驱动的智能机器人,可以通过识别人脸,行人,交通灯,标志等来轻松地穿过拥挤的街道,将包裹配送给从京东网上商城购买书籍、零食和电子产品等商品的顾客。随着更多的数据收集和算法优化,京东X预计将在中国更复杂的场景中部署无人车。
第三,是无人汽车领域。不久前,NVIDIA GPU Ventures参投了由中国风险投资公司启明创投领投的中国初创公司景驰科技投资项目。该项目总计投资5200万美元。而景驰科技正是使用NVIDIA GPU和NVIDIA DRIVE PX 2来开发自动驾驶汽车。“交通行业是全世界最大的一个行业之一,它在全世界城市的设计、医院、保险、生命的价值等都会有影响。NVIDIA DRIVE自动驾驶平台会为交通行业带来革命性改变,我们创造NVIDIA DRIVE平台,并开放这个平台,那么全世界的公司——不管是大的车企、是出租车公司,还是汽车共享平台、快递公司,或者145家初创企业,都可以用NVIDIA DRIVE平台展开创新。”事实上,在过去一年里,NVIDIA已经在全球5个国家投资了10家公司,足见NVIDIA对这一领域的看好。
写在最后
事实上人工智能到底能在多大程度上真正影响未来,一方面取决于相关的技术(包含硬件架构和软件系统)发展的进度,另外一方面,很大程度上取决于首先从哪些行业入手,并获得更直观的效益——这方面NVIDIA不仅具有技术的话语权,而且也由于其掌握足够的主动权,因此也对具体行业应用AI具有相当的推动作用。这也许就使得AI与NVIDIA之间存在相对比较特殊、彼此推动的微妙关系。这一点,从GTC會场火爆的场面可以有所感受,也能够从此次黄仁勋几个重要的发布当中体会出。
AI,绝对是所有人都想到达的地方,无论轨迹如何曲折,都必须实践。