把话题起得博大一点,人类文明的发展一直与能源变革密切相关。从百年前电力的大规模应用完成了第二次工业革命,到以2G、3G、4G为代表的通信技术驱动了第三次工业革命,人与人之间的联结已经变得非常紧密。现在我们一直说,以5G、AI、云等为代表的创新ICT技术正在驱动第四次工业革命,5G高速率、低延迟、大容量的特性实现了万物互联,AI高算力、
低功耗、全场景的特性实现了万物智能,云虚拟化、超大规模和高扩张性的特性实现了万物共享。5G、AI、云使能所有行业,构建了数字世界基础,而AI在5G时代的算力化考量,就变得很有迫切感了。
AI是又一次工业革命
17世纪后期,英国采矿业特别是煤矿已发展到相当的规模,单靠人力、畜力已难以满足排除矿井地下水的要求,而现场又有丰富而廉价的煤作为燃料。现实的需要促使人们致力于“以火力提水”的探索。1769年英国人詹姆斯·瓦特制造了蒸汽机,引起了18世纪的第一次工业革命。100年后,美国人发明和实现了电力的广泛使用,引领了19世纪的第二次工业革命。1946年,世界第一台二进制计算机的发明,人类在20世纪进入了第三次工业革命,信息技术的发展尤其是移动互联网的普及极大地改变了人类的生活。进入21世纪,人类正在迎来以智能技术为代
表的第四次工业革命,人工智能、物联网、5G以及生物工程等新技术融入到人类社会方方面面;驱动全球宏观趋势的变化,如社会可持续发展,经济增长的新动能,智慧城市、产业数字化转型、消费体验等。
人工智能是一系列新的通用目的技术(GPT),包括自然语言处理、图片识别、视频分析等。人工智能是信息化进程的新高度,信息技术带来了效率的提升,人工智能则带来生产成本的变化。行业+A,I人工智能将会改变每个行业、每个职业、每个组织、每个家庭和每个人。
可以说,时代又仿佛回到了对采矿行业非生物动力需求极大的17世纪,进入21世纪,人工智能也对算力提出了强劲的增长需求。AI算力需求的急剧增长与传统CPU算力缓慢提升(每年10%)之间存在巨大矛盾,全球掀起造芯运动,加速算力成本降低和AI应用普及。
AI的根本难题在哪里
我们知道,人工智能的支撑要素包括算力(工业云计算和边缘计算)、数据(工业大数据)和算法(工业人工智能),在中国,基于人口规模和经济的发展程度,在数据和行业应用都在全球处于领先地位。但是AI算力资源却很稀缺而且昂贵,各行业应用需要越来越强劲的AI算力。
但是我们也看到,算力价格贵、使用难和资源难获取是目前AI发展的三大瓶颈。比如,现在人工智能整个训练的过程,譬如训练人脸识别、交通综合治理、自动驾驶,模型的训练成本非常高昂的;又比如,缺乏一个统一的开发框架,无法适配从训练到推理,从公有云到私有云、边缘、终端的多种应用场景,开发、调优、部署的工作量巨大;再比如,业界用于AI计算的GPU供货周期长,限量供应等,导致硬件资源不易获取。
业界开发大规模AI训练芯片的主要厂家,比如英伟达、谷歌和华为都推出了自己的AI训练芯片。英伟达Tesla V100 GPU最高提供125 Tera FLOPS深度学习性能,最大功耗为300 W。Google I/O 2018开发者大会上,Google推出了第三代TPU 3.0,最高提供90 TeraFLOPS深度学习性能。华为早在去年10月的全联接大会上发布了针对AI训练场景的昇腾910AI处理器。昇腾910AI处理器,是当前计算密度最大的单芯片,适用于AI训练,可提供256 TeraFLOPS的算力,最大功耗为310W。
很显然,AI训练的耗时与模型的复杂度、数据集和硬件资源的配置是强相关,在天文研究、自动驾驶训练、气象预测、石油勘探等大规模训练时,硬件资源尤其显得重要。人工智能的快速发展,得益于硬件和云计算技术的提升,更得益于各个行业数字化带来的大量的数据来训练模型。开发平台要求从原始数据到标注数据、训练数据、算法、模型、推理服务,实现千万级模型、数据集以及服务对象的全生命周期的管理。
同时,无智能不成云,全栈发展走向纵深,AI已经成为云的基础业务,实现云端训练和推理。在云上部署,支持在线和批量的推理,满足大规模并发的复杂场景需求。云、AI、IoT协调使能蓝海市场,在智慧家庭、物联网和车联网等场景,构建云+AI+IoT的綜合解决方案,开拓新的人工智能市场。
如上,这其中最值得一书的就是华为昇腾系列AI处理器。昇腾采用了面向张量计算的达芬奇3D Cube架构,该架构面向AI的全新突破性设计,为昇腾AI处理器提供了超强的AI算力,使得芯片具有高算力、高能效、可扩展的优点。基于统一的达芬奇架构,华为可以支持Ascend-Nano、Ascend-Tiny、Ascend-Lite、Ascend-Min、i Ascend-Max等芯片规格,具备从几十毫瓦IP到几百瓦芯片的平滑扩展,天然覆盖了端、边、云的全场景部署的能力。
正如华为轮值董事长徐直军所述,达芬奇架构可大可小,从Nano一直到Max、从穿戴设备一直到云,可以全场景覆盖;我们推出MindSpore的目的就是协同达芬奇架构来面向全场景的。也就是说,在端、边缘、云都可以训练和推理,还可以进行相互协同,这是现在其他的计算框架所做不到的。
后续
可以预见,5G与AI、云计算等技术融合,有助于打造智能机器人云端大脑,突破单个机器人自我学习的局限,赋予终端设备更加强大的智能,极大拓展智能机器人的应用场景,加速智能机器人规模化发展。目前,我们的运营商把5G智能工业产品通过5G厂内专网切片实现实时通信就是AI在5G时代算力化考量的一个明显表现。管中窥豹,想到的比看到的多,这就是现实。