人工智能核心产业是基于人工智能技术本身,由对外提供的产品和服务所构成的产业,主要包含对外提供的产品、以平台的方式对外提供的服务、人工智能解决方案和集成服务三种类型,也是人工智能技术最直接的落地形式。人工智能应用带动产业是指人工智能技术与其他传统产业相结合,在传统产业基础上打造的新一代的智能产业,人工智能应用带动产业更多体现了人工智能的带动性。
人工智能技术内涵
(一)人工智能的定义
马文·明斯基:将人工智能定义为让机器做本需要人的智能才能做到的事情的一门科学。
约翰·麦卡锡:人工智能就是要让机器的行为看起来就像是人所表现出的智能行为一样。
美国麻省理工学院温斯顿:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”
这些说法反映了人工智能学科的基本思想和基本内容,即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。
(二)人工智能的主要理论范式及技术演进
1.人工智能的发展的早期理论背景。上世纪40年代主要的理论包括:M-P模型,冯·诺伊曼自动机理论,维纳控制论。其中,McCulloch和Pitts在人工神经网络方面做出了突出贡献,发表了《神经系统中所蕴含的思想的逻辑演算》,提出了形式神经元的数学描述和结构方法,建立了神经网络最早的M-P模型。冯·诺依曼从上世纪40年代开始直到去世之前,一直是计算机和人工智能的领导者。当时,冯·诺伊曼在 Princeton大学聚集了一批计算理论、博弈理论、智能理论和机器人理论的未来领袖,包括麦卡锡、明斯基等,这些人后来成为人工智能的主要领导人物。
1953年,麦卡锡和香农在编辑《自动机研究》一书时与香农相互争论。1956年,麦卡锡提出人工智能的概念,现在大部分认为人工智能的起源是1956年的达特茅斯会议,它是第一个以人工智能为名的会议,是在冯·诺依曼的支持下,明斯基和麦卡锡等人召开的。
20世纪50年代,真正重要的会议是美国东西部的计算机大会。分别由MIT和UCLA领导。早期,在M-P,冯·诺伊曼和明斯基的理解中,符号主义和联结主义是统一的,但因为工程角度很难,线性异或问题很难发现,研究的领域越来越狭窄,人工智能发生了研究范式的分化。
2.人工智能的兩种范式的发展。符号主义和联结主义平行发展,但在不同的历史时期,两种主义相继占据主流地位:
第一代人工智能:符号主义,又称逻辑主义和物理符号系统假设。符号主义是以逻辑作为工具,发展起来的人工智能一派理论。符号主
义在刚开始占据主流地位,是因为联结主义所需要的算法算力数据三
大条件不具备。1969年明斯基和Papert在Perception当中,提出一个重大困难,即单层的MP模型解决不了异或(XOR)问题,造成了人工智能的第一低潮。在该时期,基于符号主义的专家系统,如深蓝(Deep Blue)成为当时人工智能发展的典型代表,该系统是一个基于两人零和组合博弈的人工智能系统,该系统的核心技术是麦卡锡发明的Alpha-Beta剪枝术和专家系统,在1997年战胜了世界象棋冠军卡斯帕罗夫。
符号主义没有产生跟联结主义一样强大的工具,因为没有联结主义灵活。所以只有专家系统和深蓝。而专家系统是在解决让计算机认识世界的过程中遇到很多困难。第二代人工智能:联结主义,是一种基于神经网络及网络间的连接机制与学习算法的智能模拟方法,核心是神经元网络与深度学习,仿造人的神经系统,把人的神经系统的模型用计算的方式呈现,用它来仿造智能,目前人工智能的热潮实际上是联结主义的胜利。研究重点侧重于模拟和实现人的认知过程中的感觉、直觉过程、形象思维、自学习过程。
联结主义是以统计方法为基础发展起来的人工智能一派理论。1986年,通过反向传播(Back Propagation)的方法来训练,多层感知机解决了单层感知机解决不了的问题,但由于算法、算力和数据三大条件依然均不具备,联结主义的发展经历了漫长的复兴。上世纪90年代中期,由于核方法和图模型的效果好于人工神经网络(ANN),再加上基于ANN的创业公司无法实现其宣称的预期效果,联结主义进入第二次低潮。
2006年,Hinton发明了深度训练网络,使用的技术是贪婪逐层预训练,起到了普及了深度学习的概念。深度学习复兴了联结主义。在2012,Hinton小组拿到了李飞飞创办的ImageNet比赛的第一名。深度学习爆发了,联结主义回归。当时,算法、算力和数据得到极大发展,深度学习迎来了春天。2016年AlphaGo战胜李世石,其核心技术是随机二人零和组合博弈。其中的神经虚拟自我学习(NSFP),深度强化学习(DRL),蒙特卡洛树搜索(MCTS),开启了人工智能发展的新时代。
3.人工智能发展的技术约束条件:算法、硬件算力和数据。算法、数据和硬件算力组成了人工智能高速发展的三要素。三要素缺一不可。人工智能到最近才开始呈现爆发的主要是因为直到今日,人工智能的算法、数据和硬件才满足了人工智能的基本需求。
第一个是优秀的算法,比如现在最流行的深度学习算法,就是近期人工智能领域中最大的突破之一,为人工智能的商业化带来了希望;第二个是大量高性能硬件组成的计算能力,以前的硬件算力并不能满足人工智能的需求,当GPU和人工智能结合后,人工智能才迎来了真正的高速发展;第三个是被收集的大量数据,数据是驱动人工智能取得更好的识别率和精准度的核心因素。以人脸识别为例,在2013年深度学习应用到人脸识别之前,各种方法的识别成功率只有不到93%,低于人眼的识别率95%,因此不具备商业价值。而随着算法的更新,深度学习使得人脸识别的成功率提升到了97%。这才为人脸识别的应用奠定了商业化基础。
算法方面,随着深度学习理论和工程技术体系的成熟,包括通过云服务或者开源的方式向行业输出技术,先进的算法被封装为易于使用的产品和服务,越来越多的人和公司能够开始使用这些算法。人工智能相关的技术包括了水平层和垂直层的技术,水平层面上主要体现在算法方面。进入互联网时代后,才出现了大数据的高速发展与积累,这为人工智能的训练学习过程奠定了良好的基础。比如,在AlphaGo的学习过程中,核心数据是来自互联网的3000万例棋谱,而这些数据的积累是历经了十多年互联网行业的发展。所以直到今年,基于深度学习算法的 AlphaGo 才取得突破性进展。离开了这些棋谱数据的积累,机器战胜人是无法实现的。
算力方面,云计算的兴起起到了非常关键的作用。因为深度学习是极其消耗计算资源的,而通过云计算就可以以低成本获取大规模的算力,动态地获取几千个CPU,甚至上万个CPU的算力都很轻松。除了云计算之外,GPU计算的进步对深度学习也有很大的推动作用,它能够加速深度学习中的计算速度,有些情况下甚至成百上千倍的提高。例如,现在深度学习的算法涉及到了大量可以并行化的矩阵运算,而GPU的工作方式就是多核并行计算流的方式,这个特点特别适合于人工智能领域中的计算。此外,一些面向人工智能的专用硬件架构也开始出现,比如说用FPGA去做专用的人工智能加速芯片和加速的基础设施,微软的数据中心就大量运用了FPGA技术。在二十年前,一个机器人,当时是用32个CPU, 达到120MHz的速度。现在的人工智能系统使用的是成百上千个GPU来提升的计算能力。这使得处理学习或者智能的能力得到比较大的增强。之前用CPU一个月才能出结果,然后再去调整参数,一年只能调整12次,也就是有12次迭代。 GPU产生后大幅提升了计算量,现在用GPU可以一天就出结果,这样可以迭代得更快,这是技术大幅发展的条件。
数据方面,近年来由于移动互联网的爆发,积累了大量的数据,同时物联网也极大的扩展了获取数据的数量和类型。事实上,相比较于算法和算力,数据的获取会更难一点。因为它是建立在已有业务基础上的,以往我们都是先通过非人工智能的方式积累大量的数据,而现在初创企业要去获得它就需要一些巧劲。每个时代都要解决不同的问题,今天人工智能公司也一样需要去解决问题,就怕打着人工智能的旗号,做一些不接地气的事,不能够为用户解决实质性问题。进入互联网时代后,才出现了大数据的高速发展与积累,这为人工智能的训练学习过程奠定了良好的基础。
只有当以上三方面都做好准备的时候,人工智能时代才能真正地到来。而现在是三个要素刚刚开始具备的起点。
人工智能核心产业的定义
人工智能核心产业是基于人工智能技术本身,由对外提供的产品和服务所构成的产业,主要包含对外提供的产品、以平台的方式对外提供的服务、人工智能解决方案和集成服务三种类型,也是人工智能技术最直接的落地形式。其中,对外提供产品包络软件产品和硬件产品,比如语音输入法、机器人等;以平台的方式对外提供服务,例如深度学习平台;人工智能解决方案,通过解决方案的形式,对传统产业进行升级,例如,在汽车中加入无人驾驶方案构成无人驾驶汽车。
人工智能应用带动产业是指人工智能技术与其他传统产业相结合,在传统产业基础上打造的新一代的智能产业,例如人工智能与汽车相结合,形成智能驾驶汽车产业,人工智能技术与制造业相结合,形成智能制造产业,人工智能技术与传统的家电家居行业结合,形成智能家居产业等,人工智能应用带动产业更多体现了人工智能的带动性。
人工智能核心产业统计口径
支撑层主要包括GPU/TPU/FPGA 等计算芯片,人工智能专用芯片和传感器,其中传感器占据较大产值。
软件产品主要包括语音识别平台、机器视觉系统、机器学习平台等产品。统计API调用、SDK、解决方案等产值。
硬件产品主要包括智能工业机器人、智能特种机器人、服务机器人,仅统计机器人产值中智能模块和解决方案部分。
无人/辅助驾驶仍然以辅助驾驶为主,其中,ADAS相关软硬件占据大部分产值。
智能无人设备包括智能家电、智能可穿戴设备、智能无人机等产品,统计具备人工智能的模块和解决方案部分。
2017年,中国人工智能整体产业规模超过4000亿元。其中人工智能核心产业规模达到708.5亿元,人工智能应用带动产业规模超过3200亿元。
预计2020年,中国人工智能整体产业规模将超过1万亿元,其中人工智能核心产业规模将超1600亿元,由人工智能应用带动相关产业规模接近9000亿元。
2017年,人工智能核心產业规模达到708.5亿元。其中硬件占比最大,达到总产值的55%,软件规模最小,总产值89亿元,占比为14%。由人工智能芯片和传感器构成的支撑层产业规模为141.8亿元,占比31%。在传统硬件行业中,机器人和家电产业体量大,但人工智能技术在此类行业的渗透率仍然偏低。
人工智能产业链分析
基础层
1.基础层的构成与特点。基础层主要包括智能传感器、智能芯片、算法模型,其中,智能传感器和智能芯片属于基础硬件,算法模型属于核心软件。随着应用场景的快速铺开,既有的人工智能产业在规模和技术水平方面均与持续增长的市场需求尚有差距,促使相关企业及科研院所进一步加强对智能传感器、智能芯片及算法模型的研发及产业化力度。
2.国内外基础层发展情况。芯片方面,近十年来,人工智能的通用计算GPU完全由英伟达引领,该公司2016年收入69亿美元,市值1000亿美元。AMD也在逐步进入该市场。除了传统的CPU、GPU大厂,移动领域的众巨头在GPU 的布局也非常值得关注。ARM也开始重视GPU市场,其推出的MALI系列 GPU 凭借低功耗、低价等优势逐渐崛起。苹果也在搜罗GPU开发人才以进军人工智能市场,目前苹果A11提供自主设计GPU,性能比上一代A10提升30%。