金珺,朱晨希,赵苑婷,吴敏仪
(1.浙江大学管理学院,杭州 310058)
2020年初,人工智能被国家纳入“新基建”范畴,进一步助推人工智能产业发展。随后,《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》指出,要瞄准人工智能等前沿领域进行重点布局。因此,预测人工智能技术的未来,找准我国在全球人工智能产业中的定位,发挥优势,对发展人工智能的重点城市而言显得尤为重要。
NeurIPS 是人工智能领域的顶级会议论文,通过NeurIPS(2021)收录论文主题分布中可以总结人工智能领域的技术热点(如图1):计算机视觉和人类语言技术两大人工智能主要技术任务合计占比约30%,而机器人与自动化技术任务以及人工智能相关的基础设施、数据智能以及前沿智能技术合计仅占约5%左右的论文份额[1]。
图1 2021年人工智能期刊收录论文主题分布
综合所有人工智能相关技术,趋势指数排名前10 的分别为:语音识别、卷积神经网络、云计算、GPU、深度学习、推荐系统、机器翻译、定位、大规模预训练模型及情感分析。从近3 年的变化来看,综合对比增幅最大排名前5的技术分别是语音识别、文本分类、数据挖掘、物体识别以及 GPU 技术。
从人工智能技术应用来看,根据2021 年国际数据公司IDC 针对企业对于人工智能技术的应用现状调研的结果,计算机视觉目前仍为最主要的应用技术类型,视频监控、图像识别、智能摄像头、人脸识别以及图像处理等企业应用率位居前列(如图2)。
图2 2021年企业已部署的人工智能场景
在人工智能技术开发和使用方面处于领导者的国家将塑造人工智能的未来,并显著提高其经济竞争力,而落后的国家则面临在该关键行业失去竞争力的风险[2]。我们选择以中国、欧盟和美国为研究对象,因为它们在绝对类别中表现普遍优于其他国家。到目前为止,美国已经成为人工智能领域的早期领先者,但中国正在挑战其领先地位。欧洲持续落后,但在努力追赶。本报告从科研、硬件和领先企业3个方面衡量美国、欧洲和中国人工智能技术发展的能力[3]。
本节从中国、欧盟和美国的人工智能学术论文数量、论文质量和专利情况3个方面进行研究,以评估美欧中三者在科研方面的实力。
2.1.1 论文数量
一个地区每年发表的人工智能研究论文的数量是衡量其研究能力的一项指标。该指标追踪了由Scopus搜集的2021 年每个地区发表的人工智能论文的数量,该数据库包含了来自数千份同行评审期刊的数百万份文档。根据《美国数据创新中心2021 年中美欧人工智能领跑报告》,中国在2021 年发表的人工智能论文数量(24929 篇)领先了欧盟(20418篇)和美国(16233篇)。
自2015 年以来,欧盟占全球人工智能论文的份额一直在下降,当时欧盟发表了人工智能论文的近29%。自那以后,欧盟论文份额在 2019 年(26.3%)、2020 年(25.5%)和2021年(23.1%)均有所下降。如果不把英国包括在内,欧盟在2021 年的份额将会下降到19%——英国仅略高于美国的份额(18%)。在同期(2015—2021年),中国的研究论文份额从23%以下增加到28%以上(如图3)。
图3 2000—2020年按地理区域展示的AI期刊出版文献
2.1.2 论文质量
论文质量通常会用被引次数来衡量,也就是跟踪每个地区的FWCI(领域加权被引)。这个数字衡量了每个地区的出版物与世界各地类似出版物相比被引用的频率。根据《美国数据创新中心2021 年中美欧人工智能领跑报告》,2021 年美国以 1.4 的 FWCI 值领先于欧盟(1.1)和中国(0.8),这意味着其论文的被引用率比世界平均水平高出40%。相比之下,欧盟的FWCI 自2015 年以来一直在上升。因此,尽管欧盟在全球人工智能论文产量中所占的份额正在下降,但其出版质量却在不断提高。相比之下,中国的FWCI从2017年(0.6)到2021年(0.8),稳步上升。
2.1.3 专利情况
在世界领域,2012 年至2021 年这10 年间,中国的人工智能专利申请数量(695630 件)最多[4],占全世界申请总量的52%,呈现压倒性优势,远超过美国、日本和欧洲(如图4)。美国这十年间的人工智能专利数量占全球的19%。只比较中美两国的人工智能专利,则可看出,在2012 年,中国和美国的人工智能专利申请数量还较为接近,分别为16463件和11584件;而在2021年,中国和美国的人工智能专利数量差距拉大,中国(136885 件)已经高出美国(22943 件)一个数量级。欧洲的人工智能专利数量只占全球范围内的5%,落后于美国和中国。
图4 世界人工智能专利申请数量占比
计算能力对人工智能来说正变得越来越重要。例如,自2012年以来,训练最大的人工智能系统的计算能力每3—4 个月就增加一倍。本小节分析了半导体销售、半导体研发支出、按性能排名前500 的超级计算机数量,以及在中国、欧盟和美国的超级计算机的总系统性能。现有的最新数据显示,美国在硬件方面领先(6.3 分),其次是中国(2.3 分)和欧盟(1.4 分)。在劳动力规模的控制下,美国(7.7分)领先于欧盟(1.5分)和中国(0.8分)。
2.2.1 半导体芯片
美中两国之间的贸易争端等事件的存在,可能会使一个国家面临包括人工智能芯片在内的半导体产品供应风险。此外,一些公司还发现,明确设计用于训练和运行人工智能系统的芯片可以提高这类系统的性能。根据《美国数据创新中心2021 年中美欧人工智能领跑报告》,到2021 年,美国至少有62 家公司在开发人工智能芯片,中国有29家,欧盟有14家。
2.2.2 按性能排名前500的超级计算机数量
越来越多的研究人员认为,计算能力对人工智能系统的发展至关重要。根据每秒可以执行多少浮点计算,能评选出性能方面排在前500名的超级计算机。根据《美国数据创新中心2021年中美欧人工智能领跑报告》,中国的超级计算机数量为214台,高于美国的113台和欧盟的91 台。如果没有英国,欧盟有79 台超级计算机排名前500。在过去的10年里,中国在这一指标上经历了显著的增长。2012年,中国只有68台电脑进入了前500名,美国有252 台。然而,中国只用了4 年时间就超过了美国,进而迅速发展至超过美国100多台。
2.2.3 总系统性能排名前500的超级计算机数量
另一种评估一个国家超级计算机实力的方法是衡量其顶级系统的总性能。该指标跟踪在每个地区排名前500的超级计算机的总系统性能。根据《美国数据创新中心2021 年中美欧人工智能领跑报告》,2021 年,综合系统性能排名前500 强的计算机中,美国占比27.5%,领先中国的23.3%和欧盟的16.8%。如果没有英国,欧盟的数据则为15.4%。2021 年,由于日本企业的崛起,中国和美国在前500 个系统中所占的比例都低于2020 年。日本从2020 年占总系统性能的8%以下增长到2021 年的24%以上。日本现在拥有世界上最快的系统,超级计算机Fugaku,其最大性能几乎是第二快的超级计算机的3倍。
没有足够资金的人工智能公司不太可能开发创新的人工智能产品或服务。因此,衡量每个地区有多少公司有足够的资金来对人工智能产生影响是很重要的。该指标关注了人工智能行业中获得至少100 万美元联合资金的公司数量。根据《美国数据创新中心2021 年中美欧人工智能领跑报告》,美国以2130 家企业数量,远远领先欧盟的890家和中国的398家。
在过去几年中,大多数算法由美国的 Facebook、谷歌、微软等大型科技类公司发现和开创。例如,Deep-Mind 通过 Alpha Zero 在人工智能强化学习方面取得了独特的进展,实现了完全基于“自我游戏”的学习,没有涉及实际数据。此外,美国公司还开发了主要工具箱和软件框架,例如 TensorFlow、Pytorch、Caffe,被世界各地的工业界和学术界广泛应用于人工智能的研究。这些平台的突出地位有助于美国在人工智能方面的核心领导地位,包括在数据积累方面取得优势。
相比之下,中国在塑造人工智能的核心技术工具方面仍然落后。但是,中国在计算机视觉、语音识别和自然语言处理方面拥有世界领先的公司,如商汤科技、Unisound、科大讯飞和 Face++等[5]。
欧洲由于没有互联网巨头公司,能够接触到的数据量相对于中美的公司少很多。现在最火的机器学习算法,比如神经网络,都是基于大数据的分析和处理。“人工智能”概念除了机器学习,还包括了计算机视觉、自动驾驶等很多概念。欧洲在这方面有一定实力。慕尼黑工业大学、马克斯·普朗克研究所(Max Planck Institute,MPI)等都有一些世界领先的人工智能成果。在自动驾驶领域,奥迪是第一家在量产车上推出Level 3自动驾驶系统的(搭载在最新一代奥迪A8上)[6]。
通过中国和美国、欧盟人工智能实力的比较可以发现:美国科技巨头对人工智能相关技术的研究起步早,投入高,人才、芯片及算法都走在中国前面;欧洲在人工智能方面长于理论研究和实验室技术,但缺乏科技巨头企业,难以转化为市场力量;中国虽然在人工智能创新企业数量和规模方面和美欧存在差距,在智能传感器、高性能中央处理器、智能芯片等方面与美欧也有较大差距,但中国具有人口及市场优势。我国人工智能产业发展具备庞大的数据源及应用场景,有较好的发展前景。
人工智能是引领新一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。因此,预测人工智能技术的未来、提早布局显得尤为必要。
技术成熟度曲线是企业用来评估新科技的可见度,利用时间轴与市面上的可见度(媒体曝光度)决定要不要采用新科技的一种工具。此曲线由著名国际咨询公司Gartner(高德纳咨询公司)于1995 年开始分析预测与推论各种新科技的成熟演变速度及要达到成熟所需的时间。参考高德纳“2021 人工智能技术成熟度曲线”,可以预测人工智能技术未来的趋势。处于技术萌芽期的主要是实验室内的人工智能技术,包括模型运维、神经形态硬件等技术;处于期望膨胀期的主要是行业领先者开展小规模实验和部署的人工智能技术,包括知识图谱、智能机器人、决策智能等技术;处于泡沫破裂低谷期的主要是技术能力及相关基础设施开始发展的人工智能技术,包括机器学习、自然语言处理、计算机视觉、自动驾驶和深度学习等技术;处于稳步爬升复苏期的主要是经过验证、经过商业化的但能力发展不大的人工智能技术,包括语义搜索等技术[7]。
参考高德纳“2021人工智能技术成熟度曲线”可知全球人工智能即将步入生产成熟期的技术有计算机视觉、语音识别、机器学习等,这些技术的预计成熟时间为2—5年,意味着未来5 年内将十分有望普及市场并广泛应用。其中还有8项技术显示未来需5—10年达到成熟期,包含机器学习中的深度学习、智能机器人、数字伦理、自然语言处理等技术,这些技术赛道属于人工智能产业未来重点发展方向,目前正处于“期望膨胀期”,表明世界对人工智能的最高期待(如图5)。
图5 2021人工智能技术成熟度曲线
另外,前沿智能技术领域前景比较广阔的当属可穿戴、沉浸式技术以及脑机接口这3个比较接近的技术领域门类(如图6)。一方面,可穿戴智能设备的形态越来越多样化,应用领域也不断扩展,表现出广阔的潜力;在未来,可穿戴设备的针对性和目标性会更强,伴随着 VR、AR 等沉浸式技术的逐渐成熟,可穿戴设备将成为人工智能技术普及的一大重要方向。而脑机接口作为神经工程与可穿戴技术的交叉领域,在技术进步、成本降低以及相关的道德隐私安全等方面还有诸多问题与挑战需要解决[8]。
图6 前沿智能技术领域热门技术词云图
从人工智能单点技术应用来看,根据 2021 年 IDC针对企业对于人工智能技术的应用现状调研的结果,预计未来3 年,企业在持续增加计算机视觉应用的同时,也会加深语音识别、自然语言处理等技术场景的应用(如图7)。
图7 未来三年企业将部署的人工智能场景
人工智能已成为引领新一轮科技革命和产业变革的重要驱动力量和战略性技术。通过本文的分析可知,中国在人工智能领域全球竞争中的短板和优势。中国在人工智能创新企业数量和规模方面和美欧存在差距,在智能传感器、高性能中央处理器、智能芯片等硬件方面与美欧也有较大差距,但中国具有人口及市场优势,可以为人工智能提供庞大的数据源及应用场景,发展势头很好。在未来,中国如果想要在人工智能这轮科技革新中占得先机,就需要加强技术预判,提早部署,特别是在一些基础性、突破性的领域精准布局,加大对人工智能相关软硬件的研发投入,提高核心技术的自主能力[9]。本文依据2021年人工智能技术成熟度曲线并结合人工智能技术的发展现状预测,在下一个10年,深度学习、智能机器人、数字伦理、自然语言处理等技术都属于人工智能产业未来重点发展方向。在未来几年,这些技术的成熟和商用化将会进一步影响产业发展、社会发展和人们的生产生活。