张桐赫, 何海燕, 郑华峰, 常晓涵, 何 阳
(1.北京理工大学管理与经济学院, 北京 100018; 2.长江科学院, 武汉 430010)
Open AI(开放人工智能)的生成式预训练模型(generative pre-trained transformer,GPT)火爆全球,再一次推动了人工智能技术变革。生成式人工智能现象级产品GPT模型的诞生依赖于新一代人工智能算力平台的突破式发展[1]。人工智能生成内容(artificial intelligence generated content,AIGC)开创了机器主导内容生成的时代,催生了全新的科技革命系统[2]。已有多国将如何赢得人工智能(artificial intelligence, AI)技术竞争作为科技战略的重要议题,针对关键核心制高点的竞争成为焦点[3]。创新是解决中国科技“卡脖子”问题的重要手段[4]。人工智能的发展一直是一个快速变化和持续演进的过程,高度集成了不同学科的创新成果,近年来在该领域不断出现的关键核心技术突破显著推动了技术发展[5]。当前,AI技术已经不再是孤立的技术领域,其与不同学科的交叉融合深度影响着未来科技进步的方向。人工智能的发展离不开算力,算法和算料(数据)3个基本面支撑,核心竞争方向不断聚焦于算力平台的建设,并且已经成为人工智能学科发展的基础设施。
在人工智能领域中国已有众多战略部署。2017年国务院《新一代人工智能发展规划》印发于 AI技术发展迎来重大战略机遇期,之后随着技术的不断发展,算法的不断迭代,人工智能的发展正在全面进入加速期。AI对于数学、物理、化学、天文等基础学科关键问题解决起到显著的促进作用。2023年中国科技部会同自然科学基金委近期启动了“人工智能驱动的科学研究”(AI for Science)专项工作,促进人工智能与科学研究深度融合,在未来科技竞争中充分调动人工智能技术、数据和算力资源优势,推动前沿科学研究的新模式,加速科学研究新范式,突破关键核心技术,实现高水平科技自立自强,分析国际主要国家AI技术优劣势,识别出中国人工智能技术的机会与挑战。同时从产业发展的特征出发,将有限的创新资源在技术领域进行合理分配,使得创新资源形成最有效的研发支持,对中国人工智能产业的关键技术突破以及提升产业的技术安全具有重要意义。
没有强大的算力芯片平台支撑,AI模型的训练效果将严重受限[6],专利信息能够成为主要载体反映技术特征[7],而专利动态竞争态势则反映国际产业竞争格局[8]。基于专利信息的技术竞争态势研究主要分为外部指标分析和构建评估模型两种。直接使用指标的方法从专利总体申请授权情况、时间分布、分类领域、专利引证等角度进行技术格局分析[9-11]。另一种基于专利数据库的技术竞争态势研究构建单一或多个评估指标对竞争情报进行建模分析[12-14]。
基于态势感知理论的研究主要通过构建态势感知框架进行解构,通过构建子系统实现调研与流程分析[15-16]。整合态势感知理论构建基于专利信息的技术竞争态势研究框架目前仍较为缺乏。本研究基于专利数据库深度挖掘专利外部指标与网络结构,将态势感知通过主要理论分解为态势觉察、态势理解与态势投射3个方面,构建集成分析框架,对当前人工智能专利芯片的技术竞争态势进行量化分析,将专利外部指标与网络节点特性解构实现竞争态势的全流程感知,以期为技术堵点发现与加速关键核心技术突破提供理论分析框架与数据支撑,进而从技术、市场、监管3个层面为促进中国形成国际领先的人工智能算力平台发展建设提出政策建议与决策参考。
采用智慧芽PatSnap专利数据库作为专利检索数据,结合EI Compendex数据库中有关人工智能芯片及算力的关键词表,选取人工智能芯片的相关词和下位词,结合当前人工智能芯片主要构架模式与数据库人工智能主题词表制定的检索式为:TA:(artificial Intelligen* OR AI OR brain like OR neural network OR Deep* learning OR graphics process* OR tensor process*) AND (Chip* OR Unit* OR gate array* OR FPGA OR GPU OR ASIC)。检索范围为2003年1月至2023年1月近20年专利数据,检索时间为2023年5月10日。共检索到相关专利60 325条,去除异常项与残缺条目共计保留专利数据59 347条。对其当前专利权人国别进行统计,存在专利权人国别共现条目为两国及以上专利权人合作的专利条目在本文第3节进行分析。进行国别统计时以专利优先权进行计量,其中包含中国专利8 776件,美国专利33 924件,韩国专利6 793件,日本专利3 357件,4国专利占整体专利数量比例超89%,为人工智能芯片技术主要大国,研究主要聚焦4国专利数据库进行分析。
结合信息学、情报学理论构建关键核心技术竞争态势感知集成分析框架,对Endsley[17]提出的态势感知概念进行解构,结合关键核心技术竞争特征并以中国战略科技力量建设为导向进行研究设计,将态势感知分解为态势觉察、态势理解以及态势投射3个方面,分别对应于关键核心技术的平行竞争数据分析、网络模型构建以及技术布局。
核心态势感知模型构建首先针对外部要素信息进行觉察,将数据清洗后的本地专利数据库对象进行精炼,提取专利三维度外部指标,形成专利基础信息数据库构建四类别分析以实现国别、企业和专利类别的要素觉察。其次在态势理解模块进一步挖掘要素信息间的内在联系,引入社会网络分析法进行主题特征的深度比较。之后在态势投射部分将技术类别与主题特征进行整合,构建以实现专利热点趋势、风险识别、堵点发现为目标的分析、预测、评估一体化框架,最终实现竞争情报的整体性、全局性的感知。
研究模型面向国家需求最终形成决策层输出,构建的集成模型通过数据采集、信息处理可以实现对现有数据的充分利用。通过深度挖掘网络模型数据与多元节点指标实现态势理解,基于竞争态势下进行技术投射,实现对未来技术研发走向的研判和技术布局的定量分析。研究模型构建如图1所示。
图1 竞争态势感知模型构建
在研究技术竞争态势觉察的过程中,根据Endsley[17]建立的情境意识(situation awareness, SA)模型首先是对环境中各成分的感知,以国别优势、热点专利布局、国际专利分类(International Patent Classification,IPC)的比较为导向。首先通过提取专利基础信息进一步提取数据库中对不同国别、不同技术竞争领域专利进行信息觉察。主要针对各国专利技术现状进行整体统计分析,包括时间趋势分析、引用被引用分析、专利权人分析与重点领域分析4类,对研究领域技术竞争整体格局与主要国别进行觉察,实现模型的初步感知。
2.1.1 专利授权总体情况分析
通过数据检索与整理部分建立的专利数据库中,人工智能算力芯片主要专利授权国家有中美日韩4国。图2为中美日韩专利授权趋势图。
图2 2003—2022年中美日韩专利授权趋势图
根据图2结合人工智能技术发展重要时间阶段与代表性事件,近20年全球人工智能芯片专利授权量变化大体分为3个阶段。第1阶段为2013年之前,人工智能专利全球授权数量整体较少,仅美国有少量的专利积累,中央处理器(central processing unit,CPU)、图形处理器(graphics processing unit,GPU)、可编程阵列逻辑(field-programmable gate array,FPGA)等主要神经网络芯片构架在美国开始出现并应用形成了相关专利。第2阶段为2013—2019年,为全球专利授权量高速增长阶段,2013年深度学习与强化学习算法取得了突破,次年Google公司的Alpha GO机器人战胜了人类围棋冠军柯洁,凸显了深度增强学习算法在处理复杂决策问题上的优越性,基于深度学习算法设计的AI芯片受到了学术界与产业界的极大关注,人工智能芯片专利数量迅速增长并于2019年达到了最高峰。中国在2017年之前仍是4个主要专利国家中授权数量最少的,随着《新一代人工智能发展规划》等多项指导性政策出台后中国进入了自身授权专利快速增长与绝对数量积累阶段,于2018年超过日韩成为继美国之后的世界第二大人工智能芯片专利授权国家。第3阶段为2019—2022年,全球授权数量逐渐回落至初期稳定水平。
在已授权专利中专利的平均引用数量是评估专利影响力的一个重要指标[18]。图3为中美日韩专利平均引用数量,图4为中美日韩专利平均被引用数量。
图3 2003—2022年中美日韩专利平均引用数量
图4 2003—2022年中美日韩专利平均被引用数量
美国整体专利引用与被引用数量高于其他3国,引用数量趋势近几年处于稳定状态,平均为50件左右,被引用数量下降趋势明显,与人工智能芯片近年的技术壁垒与国别保护直接相关,相关技术壁垒受到美国设限与技术孤岛效应,相关授权专利引用数量逐渐接近零值。
美国专利权人占比也更为集中,主要专利权人占据大量专利,人工智能AI算力芯片呈现出头部个别企业的垄断特征。前10位专利权人中有美国企业7个,中国日本韩国企业各1个。整体呈现出美国大企业垄断相关专利的格局。图5为主要专利权人授权专利数量。
图5 主要专利权人授权专利数量
2.1.2 专利授权重点领域分析
专利分类号IPC作为国际通用的专利分类与检索工具,每个专利被分配1个或多个IPC分类号,通过IPC分类号的预先设定可以推出专利文献的主要研究方向与技术主题,当专利包含多个IPC分类号时,其中第一个分类号为其主分类号,作为代表发明类别信息分类号。针对数据库中专利主分类号进行国别重点领域分析结果见表1。
表1 4国人工智能算力芯片授权前10位主IPC
中美两国IPC大类组主要方向基本一致,美国相关专利分类更为集中,IPC大类分类号前10专利占比美国更加集中,占比超过30%,中国专利方向则相对分散,占比为12.8%。
在动态竞争环境下,技术竞争结构不断演变。根据已经建立的SA模型完成态势觉察后进入竞争态势理解模块,以主体特征比较为导向,根据已经提取的专利基础信息数据库进行网络建模分析,采用社会网络分析法(social network analysis,SNA)针对专利节点进行网络属性及其关系结构的量化分析,分别构建IPC专利方向共现与专利权人共现网络,建立宏观总体数据描述与微观数据结构的关联分析,在对整体进行统计分析后进一步实现挖掘专利数据库中存在的研发热点、关键专利方向与节点网络关系。形成竞争态势理解模型,实现主体特征的深度挖掘。
2.2.1 专利IPC共现网络分析
在专利重点领域分析中使用IPC主分类号代表专利发明类别方向,一个专利包含多个IPC分类号的情况说明该专利隶属于多个IPC大类组。通过对构建的专利样本数据库进行统计,IPC共现在数据集中较为普遍存在,共53 058件专利存在IPC共现,整体占比超89%,中国占比为84.3%,美国为90.5%,日本为80.4%,韩国为93.5%。对其进行社会网络建模分析可以数据库中专利IPC节点关系,其中节点中心性是对节点指标的定量描述,在无向网络中节点的中心性指标主要有度中心性、介数中心性、接近中心性、特征向量中心性等[19]。使用中心性的最直接刻画指标点度中心性(degree centrality)对专利IPC网络进行分析,根据Wasserman和Katherine[20]的研究,一个节点的度越大就意味着这个节点越重要。N节点无向网络中节点的度定义为与节点直接相连的边的数目绝对点度中心度计算公式为
(1)
式中:DCi为节点的点度中心度;kij为节点与处自身外节点的联系数量。其数值表示节点i与网络中其他节点的联系数量,值越大表示节点在网络中与其他节点的联系越密切,其重要性越高。图6为中国专利IPC共现网络,图7为美国IPC共现网络,表2为中美日韩4国IPC网络点度中心度前10节点。
表2 4国IPC网络点度中心度前10节点
图6 中国专利IPC共现网络图
图7 美国专利IPC共现网络
结合图6、图7对比表1、表2,美国专利绝对数量更多,节点网络更加密集,在相同权重下核心节点数量更多,由图6、图7可见,两国均以G06K、G06N、G06F为主要核心节点,中国H04L、H04N、H04W类专利共现紧密,美国此类专利穿插出现在G06专利周围呈现紧密的共现链接关系。IPC授权数量与点度中心度并无直接关联关系,授权量并不能直接体现其IPC分类方向在专利网络中的重要性。中美韩授权量第1位的G06K9/00专利IPC,为图形读取或机械参数识别的方法或装置,在日本授权量中为第6,其共现网络中占据中心度节点最大值,中国G类专利为主要节点,美国H类专利占据最主要节点,其中H04L29/06为以协议为特征的数字信息的传输设备,H04L29/08为传输控制规程与数据链级控制规程,该类专利整体授权量不高但共现核心节点作用明显。中美日韩4国在专利共现网络高中心度IPC方向存在差异,美国韩国在H04L类专利,数据通信传输与基站的无线链路的设备具有技术优势。
2.2.2 专利权人共现网络分析
专利权人共现是一件专利出现两个及以上专利权人的情况。专利权人的共现可以视作合著专利,对其进行分析能够反映不同专利权人之间的合作关系。由于专利权个人重名和合作网络的精确性问题,研究分析企业专利权人共现情况,对构建的数据库进行样本清洗得到图8~图11,分别为中国、美国、日本、韩国人工智能算力芯片专利权人共现网络。
图8 中国人工智能算力芯片专利权人共现网络
图9 美国人工智能算力芯片专利权人共现网络
图10 日本人工智能算力芯片专利权人共现网络
图11 韩国人工智能算力芯片专利权人共现网络
由图8~图11可知,人工智能算力芯片专利在4个主要专利授权国家中合作并不常见,绝大多数为本国企业与其他科研机构的合作,大规模、高强度的跨国合作数量极少,这不仅与专利权天然的垄断性、排他性以及自身保护性有关,也与人工智能算力芯片的竞争态势有直接关系。主要专利国家在优势专利方向上占据形成垄断。美国呈现出科技独角兽公司占据专利绝对数量与合作主体地位,日本合著专利多为企业内部合作并且存在少量与美国合作专利。韩国呈现出三星电子的寡头垄断情况,其在专利绝对数量、合作主体节点和国际合著中成为网络最核心节点。中国在专利权人共现网络中呈现出多主体协作态势,未出现个别节点垄断地位,专利绝对数量同样呈现不同主体相对平均分布格局。
通过竞争信息的觉察与理解,技术竞争态势感知SA模型进入第3阶段技术投射模块,对技术未来竞争态势变化与技术方向的研判并生成有价值的结论投射至决策层加以利用。通过前期模型整合分析、评估与预测,构建一体化动态模型实现数据支撑下的科学决策。
投射模块中分别实现了专利趋势预测、风险识别与堵点发现3部分内容。其中趋势预测针对专利主题技术领域未来研究走向进行预测,分析国际国内未来研发趋势,预测其他国家科技发展、重点研究方向;风险识别部分对专利网络中的风险节点进行评估与分析,挖掘网络风险专利点;技术堵点发现部分结合国际竞争格局下的受限技术,识别中国在相关专利布局中的关键核心技术堵点。研究整体为中国科研机构、管理部门提供数据情报支撑,为优化专利布局提升技术竞争力提供决策参考。
从人工智能芯片专利全局信息出发分析世界主要技术国别竞争态势,从总体申请授权情况、重点IPC领域、IPC与专利权人共现分析等构建专利竞争态势觉察与竞争态势理解模块。已有研究往往基于技术竞争态势分析进行对比与技术定位,缺乏态势感知的全局化与模块化分析构架,关于相关产业的研究更多集中于政策与产业链分析,并未充分引入技术竞争格局、关键核心技术攻关和技术堵点识别等现实问题。
将技术竞争态势分析通过Endsley的态势感知思想进行解构,将不同阶段的竞争态势分析拆解为觉察、理解与投射模块,实现投射模块的趋势预测、风险识别与技术堵点发现,得到如下结论。
在趋势预测部分,人工智能芯片专利授权数量在2022年相对低点之后可能进入底部拐点,中美日韩等世界主要国家相关专利授权量可能逐步增加,与2013年深度学习与强化学习算法取得了突破至2019年授权数量达到高点相似。2023年生成式人工智能技术的突破使人工智能芯片专利的申请授权量再次进入上升周期。美日韩主要专利权人垄断情况将持续,技术竞争格局将进一步加剧专利的排他性与垄断性。中国在控制垄断中有相对的优势,更有学科交叉融合、联合多元主体进行协同研发与攻关的趋势。
在风险识别部分,中国企业整体专利授权数量与头部主体占比仍与美国有较大差距,共现网络图相较美国密度较低,多学科类别交叉专利数量不足,主要风险在于IPC方向为H04L类关键核心技术领域的专利研究存在缺失,且为在共现网络中占据高中心度的主要节点位置。
在技术堵点发现部分,美国在H04L29/06、H04L29/08:协议特征数字信息传输及传输规程中有较多交叉学科类别的专利,在G06N5/04:基于特定计算模型的计算机系统推理方法或设备中有专利绝对数量与技术交叉共现优势。韩国在G10L15/22:语音识别、人机对话过程中使用的程序中有专利优势。日本在G06K9/00:语音、图像或视频识别模式的方法或装置中有技术交叉共现优势。结合生成式人工智能技术特点与技术发展趋势,中国在此类专利方向上没有绝对的专利数量优势与技术交叉专利,在技术竞争格局下可能成为未来的技术发展瓶颈,形成关键核心技术堵点,影响人工智能芯片技术整体的发展速度。
根据以上研究结论,从中国现有优势出发,借鉴美国人工智能产业发展经验,在技术、市场、标准与监管3方面尽快整合资源,形成竞争优势。在当前的技术机遇期加快人工智能算力的发展建设,构建国际领先的人算力平台。为制定实施符合中国国情的人工智能算力平台产业发展战略提出以下对策建议。
充分发挥社会主义市场经济条件下的新型举国体制优势,集中优势突破关键核心技术。发挥中国应用端庞大市场的需求侧牵引作用,构建好自主的平台生态。行业龙头企业加大投入,联合高校科研院所等优势力量协同攻关,提前布局前沿技术领域,形成专利后主动占位,稳步构建在人工智能芯片颠覆性技术中的优势,引领技术革命的出现[21]。在技术机遇期推动突破人工智能算力平台关键核心技术,实现该领域核心技术的突破式发展。
人工智能领域是涉及更广、影响更大的复杂系统工程,涉及多学科及其交叉融合,如芯片、操作系统等软硬件系统,复杂的开源平台、海量数据资源和标准体系建设,技术与经济社会各行业应用的互动等,应充分发挥新型举国体制建设优势引导形成数据可控开源、基础层技术自主可控、政策监督管理体系领先、具有国际市场竞争力的国家级人工智能算力开源平台。
随着人工智能发展引起科学界的普遍担忧,中国国家网信办发布了生成式人工智能服务管理办法,针对人工智能可能带来的安全风险,包括技术伪造、人工智能伪造信息等,中国应加快构建更加包容审慎的国内监管体系,同时也需要力争在相关国际规则制定中掌握更大话语权,引导推动国际技术标准制定。