姚 叶,张 容
(中南财经政法大学知识产权研究中心,湖北 武汉 430073)
人工智能技术的出现改变了人们的生活,其高效快捷的运作模式提高了生产的效率,极大地推动了经济的发展。随着人工智能技术的发展与完善,在其基础上产生的新技术与新服务进一步改变着人们对周围世界的感知和日常生活方式,人工智能正在像蒸汽机和电力一样彻底改变世界。进入信息技术时代,知识产权已经成为企业技术创新和市场竞争的工具,也成为国家之间科技、经济竞争的合法贸易壁垒[1]。专利是科技成果的重要体现,随着科技的发展而不断出现了新的发明创造类型,需要有专利制度为其保驾护航,以促进相关产业的发展[2]。2020年,美国发布了《人工智能发明:追踪美国人工智能专利扩散报告》[3](以下简称“报告”)。报告指出,在进一步评估人工智能的潜在影响时,可以通过研究其在专利中的运用来确定。一方面,统计专利申请数据能够直接得到涉及人工智能专利数量上的变化,其数量的增加体现了投资者与创新者对人工智能技术领域的关注,揭示了人工智能时代蓬勃发展的态势;另一方面,研究专利申请文献还能了解人工智能技术在各技术领域、发明者与所有人、地域之间的发展传播程度。报告通过机器学习人工智能算法确定了美国1976—2018年专利中人工智能技术所占的数量、性质、演变过程及其内容,全方位分析了人工智能技术的发展潜力。我国对于人工智能专利的相关状况研究较为零散,人工智能专利的分布情况也与美国有所差距。鉴于此,有必要对报告采取的方法与结论进行总结,为我国人工智能专利的发展方向提供借鉴。
美国国家标准技术研究所(NIST)将人工智能技术和系统解释为一种硬件或软件,它可以学习解决复杂问题、做出预测、承担需要人类感官的任务(如视觉、言语和触觉),并且可以感知、认知、计划、学习、交流以及进行同人类相似的身体活动。报告认为,尽管这个定义概括了人工智能的特点,但在进行专利层面的分析时,该定义仍然不够具体。结合专利的申请与审核,其将人工智能技术分为八个组成部分,它们并非对立存在,而是可以共存于一个专利申请中。①知识处理技术。知识处理技术领域主要负责揭示和推导事实,并在自动化系统中使用这些信息。②语言技术。语言技术包括语音识别技术,是指能够通过人类一连串的声音信号获取信息的技术。③人工智能硬件。现代人工智能算法需要相当大的计算能力。人工智能硬件所需的物理计算机组件必须通过提高处理效率和速度来满足这一要求。④进化计算技术。进化计算包含了一系列使用自然方面,特别是进化的计算程序。⑤自然语言处理技术。理解和使用书面语言编码的数据是自然语言处理的领域。⑥机器学习技术。机器学习领域包含了大量从数据中学习的计算模型。⑦视觉技术。计算机视觉从图像和视频中提取和理解信息。⑧计划和控制技术。计划和控制技术的实施包含识别、创建和执行活动以实现特定目标的过程。
传统上,运用专利地图时需要依赖于关键字、专利分类和引用等查询来识别相关专利。Abood和Feltenberger(2018)开发了一种自动化的专利景观分析方法,该方法使用机器学习来降低成本并提高准确性[4]。美国专利商标局对该方法进行进一步调整,在其后增加手动验证步骤以检验模型的准确度。其先从专利文件中随机抽出800份文件,再由两名经验丰富的审查员进行审查并判断它们分别属于何种人工智能技术分类。随后向审查员提供关于人工智能技术分类标准的培训材料以及相关例子。若两位审查员持否定意见,则需由第三位有经验的专利审查员做出裁决。该验证过程提供的黄金标准可以作为对照其他人工智能地图评估该模型的依据。经过验证,该分析方式准确率较高,其结论具有参考价值。
人工智能在申请数量、跨技术领域传播、跨发明专利者和专利所有人传播以及跨地域传播的趋势表明,人工智能越来越重要。人工智能是否像电或半导体一样具有革命性,部分取决于创新者和公司是否有将人工智能发明成功融入现有以及新的产品、流程和服务的能力。报告表明,人工智能具有这种潜力。
1.3.1 申请数量。新技术有价值的一个重要标志就是专利申请数量的增加,人工智能专利在过去40年间一直呈现上升态势。图1显示了1976—2018年公开人工智能专利申请量的增长趋势及其在所有公开专利申请中的份额。由于美国发明者保护法(AIPA)在1999年年底及其实施期间(图1中的灰色区域)进行了修改,所以2002年以后的趋势所体现出的信息更有分析意义。2002—2018年,人工智能专利申请的数量和份额普遍增加。2002—2018年,人工智能专利的年申请量增加了1倍。虽然在此期间,美国专利商标局的所有专利申请都有所增加,但人工智能专利占同期全部专利的份额也呈现显著增长,其占比从2002年的9%增长到了2018年的近16%。
图1 1976—2018年公开人工智能专利申请的数量和份额
尽管人工智能专利申请的总体趋势呈现大幅增长,但它并没有揭示所涉及的人工智能的本质。如前所述,一项专利可能属于八项技术中的一项或多项。例如,标题为“利用纳米技术的物理神经网络液态机器”的美国专利第7392230号根据上述分类规则被划分为机器学习和人工智能硬件组件技术。
图2显示了1990—2018年各组件技术的公开人工智能专利申请数量。2000—2002年《美国发明人保护法》实施期间,各组件技术的公开人工智能专利申请数量都有增长的趋势。但是在2007—2011年期间有小幅度回落。排名在前两位的规划控制技术和知识处理技术始终保持领先地位,紧随其后的是人工智能硬件和视觉,排名在最后的是机器学习、自然语言处理、语音和进化计算。
图2 1990—2018年人工智能各分类下的专利申请量
1.3.2 跨技术的人工智能传播。对于每一项专利申请,美国专利商标局审查其技术内容,并根据共同的主题将申请分配给特定的技术组。目前的系统有600多个子类,涵盖了大量的主题,包括化学、电子、机械和材料等。图3显示了从1976年开始的人工智能跨技术的扩散,就像人工智能专利申请总量的增长一样,人工智能技术正在向更大比例的技术子类扩散。1976年,包含人工智能技术的专利仅占所有技术子类的9%,在2018年该比例增长到42%。
图3 1976—2018年人工智能跨技术子类的传播
人工智能组件技术显示了具有不同扩散率的三个不同集群。第一个集群是知识处理和规划控制技术,其在专利技术类别中扩散最快。这种状态反映了这些人工智能组件对各种技术领域的普遍适用性。第二个集群(视觉、机器学习、AI硬件)的扩散速度虽然较慢,但仍在增加。第三个集群(进化计算、语音和自然语言处理)的扩散最慢,在20世纪90年代末徘徊在5%左右,直到最近才扩展到所有技术子类的近10%。
1.3.3 人工智能在发明者和专利所有者之间的传播。许多发明家、公司和其他组织在其发明和生产过程中使用人工智能。每年获得人工智能专利的发明人和组织的百分比增长是扩散的重要指标。这一指标可以用授权专利上出现的发明者和组织的名字来计算。然而,使用原始专利数据会对发明者和组织进行错误计数,因为名称记录方式有多种变化。例如,“国际商业机器”和“国际商用机器公司”将被视为两个不同的组织。为了克服这个限制需要再次依赖于专利景观,为发明者和以专利命名的组织提供唯一的编号。
图4显示了美国1976—2018年拥有人工智能的专利权人占专利权人总数百分比及拥有人工智能的发明专利权人占发明专利权人总数百分比的年度增长趋势。人工智能发明专利权人的扩散趋势从1%开始,到2018年增加到25%。即2018年所有发明专利权人中,有1/4的专利权人在其授予的专利中使用了人工智能技术。
图4 1976—2018年拥有人工智能专利的专利权人和发明专利权人年度百分比
表1展示了1976—2018年持有人工智能专利数量排名前30的美国公司。其中,前三家公司持有的人工智能专利数量差距较大:排名第一的是美国国际商用机器公司,专利数量为46 752件;排名第二的是微软公司,专利数量为22 067件;排名第三的是谷歌公司,专利数量为10 928件。
表1 1976—2018年授予美国人工智能专利的前30名所有者
1.3.4 人工智能在地域之间的传播。图5展示了1976—2000年美国人工智能发明专利权人的分布地域。美国的人工智能发明专利权人主要分布在东、西海岸,中部相对较少。其中,在加利福尼亚州、马萨诸塞州、康涅狄格州以及新泽西州分布最为广泛。
图5 1976—2000年按发明专利权人所在地分布的人工智能专利数量
从2001年以来人工智能发明专利权人的位置表明,人工智能技术在美国各州和县都广泛传播(图6)。例如,缅因州和南卡罗来纳州在数字数据处理和适用于商业的数据处理方面非常活跃。俄勒冈州的发明专利主要应用于健身训练和设备中。在蒙大拿州,人工智能被纳入分析材料化学和物理特性的发明中。美国中西部也在采用人工智能技术,尽管数量要少得多,但其发明专利权人正在研究人工智能进行数字信息传输、图像处理以及数据识别和呈现。威斯康辛州在医疗器械和诊断、手术和鉴定流程方面领先,其次是俄亥俄州和堪萨斯州。在爱荷华州、堪萨斯州、密苏里州、内布拉斯加州和俄亥俄州,人工智能技术正在为电话通信的发明做出贡献。而应用于农业相关的人工智能技术是北达科他州的一个重点。例如,通过人工智能技术对作物样品进行成像,识别单个籽粒并确定籽粒是否完整。
图6 2001—2018年按发明专利权人所在地分布的人工智能专利数量
人工智能硬件(处理器/芯片)、机器学习技术、自然语言处理和计算机视觉技术是美国人工智能创新的主导领域。但是,尽管在语音识别技术、自然语言处理技术和特征识别产品方面发展迅速,美国在深度学习、知识图谱产品、计算机视觉产品、智能运载、智能机器人和智能设备六个领域却表现出劣势。根据人工智能产业层面及产业领域的划分,美国人工智能发展的区域主要在基础层与技术层,在应用层的分布较少。基础层是资金相对消耗大、发展潜力高的领域,能够为人工智能技术的实现和人工智能应用的落地提供基础后台保障。这种分布显示了美国在人工智能领域巨大的投入和发展潜力(表2)。
表2 人工智能产业层面及产业领域[5]
值得注意的是,美国的研究也体现出了技术相关性。言及重点技术领域,2012年以来,美国图像识别、机器学习领域以及深度学习领域的人工智能专利显著增加。AlexNet是2010年Ima⁃geNet大规模视觉识别挑战的一部分,也是一个分水岭,它改变了图像识别和机器学习的技术轨迹。人工智能硬件,包括计算机处理器加速器和专用内存的专利申请随着计算机视觉的专利申请而增加。这两种技术中应用程序之间的紧密联系反映了图像识别的进步与计算能力和性能的需求之间的相互作用。规划控制技术和知识处理技术之间的合作也助推了知识处理技术的发展。机器学习、自然语言处理、语音和进化计算呈现集群式发展,可见机器学习技术和进化计算的结合为自然语言处理和语音的发展助力。
从人工智能专利的领域布局看,1967—2018年美国企业在信息和通信技术领域的发明势头强劲。报告显示,1976—2018年,持有人工智能专利的前30家美国公司拥有所有人工智能专利的29%,前30强公司大多在信息和通信技术领域,如美国国际商用机器公司、谷歌公司、英特尔公司、甲骨文公司、苹果公司、脸书公司、威瑞森通信公司、微软公司、惠普公司、朗讯科技公司等。但也有一些明显的例外,如通用电气、波音和美国银行等。近年来,通用电气坚持在制造业中发展人工智能产业,在机械产品的制造中融入人工智能技术。
美国大型公司的专利申请量极大,占据世界前列,呈现“大型公司引领、主导”的发展态势。使用德温特创新索引数据库,对人工智能专利进行检索可发现,2016—2020年,人工智能专利总量前5名中除惠普以外的其他公司——美国国际商用机器公司(IBM)、微软公司、谷歌公司、英特尔公司,也是2016—2020年世界范围内人工智能领域专利总量前15位机构的成员。值得强调的是,2016—2020年,微软公司与美国国际商用机器公司(IBM)的人工智能专利总量不仅占据美国本土的前两位,也是世界范围内的前两位。
从2016—2020年的研发活跃度看,美国大型企业在人工智能领域的研发活跃度极高。通过对全球人工智能领域主要国家/组织的研发活跃度进行分析可以发现,2016—2020年,人工智能专利研发活跃度前5名中英特尔公司、谷歌公司、美国国际商用机器公司(IBM)分列第二、三、五位。前15名中,美国独占5个名额(表3)。可见,美国企业整体的研发活跃度处于世界前列。美国企业的人工智能专利数量不仅数量巨大,也将在未来一段时间里凭借优越的研发优势持续增加。
表3 全球人工智能领域主要国家/组织的研发活跃度[6]
从报告可以提炼出美国专利申请地域分布的特征。①普遍性。1976—2018年,美国各州的人工智能发展水平都在稳步提升,且分布广泛。②差异性。美国各州都形成了特色的优势技术,分别在商业数据处理、健身设备、材料化学与物理特性分析、医疗诊断与手术、电话通信等领域。③中心辐射性。人工智能发明专利权人往往集中在较大的城市和已建立的技术中心,如加利福尼亚州硅谷。这些位置具有资源优势,能够更容易地应用人工智能。例如,技术中心已经是成功企业的所在地,这些公司的员工拥有理解和实施人工智能技术所需的专业知识。这一优势也延伸到拥有主要研究型大学的地区。
报告使用专利景观的分析方法,剖析了本国人工智能专利的领域分布、专利发明者与专利所有者之间的技术转移状况、人工智能专利领域的技术相关性和地域相关性。通过对报告的分析,为我国人工智能的发展提供一定启示。
传统的专利分析方法耗费时间长、效率低、可视化程度差,对于分布于各领域的人工智能专利的分析也具有局限性。专利景观(Patent Land⁃scape)提供了特定技术中专利情况的快照,它可以识别空白并发现技术趋势,也可根据有关数据分析专利的有效性,对数据进行分析并以可视化方式呈现,进而对发现的专利数据进行解读。专利景观可以提供包括但不限于技术领域中的主要参与者、最活跃的专利公司、可能的专利空白、全球范围内专利情况等。报告采取了Abood和Felten⁃berger在2008年开发的一种半监督机器学习方法,用于自动生成专利景观。它能够提高检索的数量与准确度,专利景观的重点是识别与主题相关的大量专利。根据检验,这种自动专利和制图方法得到的结论与专家的结论一致,可见专利景观的精确度已经达到了一定程度。故而,Abood和Feltenberger提供了一种可重复的、准确的方法,以最少的人力资源生成内容丰富的专利景观。
我国学界目前对专利景观方法的使用并不多见,在知网上以“专利景观”为主题进行检索,共得到10篇相关论文,分别是对护理机器人[7]、无人驾驶汽车[8]、动力电池产业[9]、老年福祉[10]、玉米生成育种技术[11]等领域的技术进行分析,且其中有五篇文章的作者属于同一机构。可见,为了与世界范围内的人工智能专利发展趋势契合,有必要更新我国的专利分析工具。
与美国相比,我国在基础层的人工智能发展水平滞后,但是在应用层发展迅速。一方面,这种趋势代表着我国人工智能专利的发展潜力巨大。我国人工智能关键核心技术创新能力逐年增强,创新主体数量、企业研发资金、算法等成为主要影响因素[12]。不仅如此,海量的数据也为我国基础层的算法训练提供必要的条件。我国在数据管控上较欧洲而言较为宽松,这为我国企业获得数据并对其进行研究提供了十分有利的发展环境。自有数据、第三方数据、业务合作方数据的流转能够为机器学习、深度学习提供养料。另一方面,也意味着我国人工智能的发展很可能受到基础层专利的制约[13]。我国目前的人工智能应用层主要集中于三个场景,即金融、交通、制造领域。在金融领域,可运用语音识别、生物识别技术开发投资顾问与自动审核系统,降低审核成本并能够为用户提供定制服务;在交通领域,可使用计算机识别、传感器实现无人驾驶,以减少驾驶危险;在制造领域,可以使用计算机视觉技术检测商品,运用人工智能进行劳动。如果语音识别、自然语音处理、计算机视觉技术、芯片技术难以发展,那么应用层的开发也是无水之源。因此,我国也应当增强企业在基础层的研究实力并提升人工智能专利国际竞争力。在我国专利申请量排名前10的企业或机构中,只有百度公司能够在世界专利申请量前15名中获得一个席位。可见,近年来我国人工智能专利发展虽然迅速,但是在基础专利申请总量上仍然无法与美国、日本、韩国进行竞争。我国应当加强人工智能基础层的专利布局,提升国际竞争力。
《2019人工智能发展报告》规划了13个我国重点发展的领域,其中包括机器人、图像识别技术和自然语言处理技术等。在应用层,智能驾驶、机器人有赖于规划控制技术,特斯拉汽车开创了智能驾驶的先河。计算机视觉相关的应用有百度识图、医学图像分析、警用罪犯识别等技术。自然语言处理是让机器理解人类语言的一门技术,就是将文本处理与机器学习技术相结合。目前的应用有苹果的语音助手siri、百度旗下的“小度”和小米旗下的“小爱同学”[14]。正如报告所分析的那样,规划控制技术依赖于知识处理技术,计算机视觉的发展依赖于人工智能硬件的发展,自然语言处理则依赖于进化计算等基础层的人工智能专利。可见,报告为我国人工智能发展的具体实施指明了方向。
美国各州人工智能专利呈现特色化的发展趋势,实现了人工智能专利的差异化布局。反观我国,人工智能专利呈现地域性、集群性趋势,且中西部集群与东南沿海及京津冀城市群差距较大。中国的人工智能专利地域分布上呈现出两个特征:①集群性。五大城市群人工智能产业发展布局在整个国家人工智能产业结构中占据极为重要地位。②地域性差距。当前五大城市群人工智能专利申请主要集中在技术层与应用层,基础层专利申请数量相对较少。从五大城市群各自技术专利的分布情况来看:长三角城市群在五大城市群中专利优势最为明显;京津冀城市群在电子数字数据处理技术专利等方面形成了特色性优势;珠三角城市群虽然与京津冀城市群有一定的差距,但是在语音分析合成技术专利方面占有相对优势(见表4)。与上述三个城市群相比,成渝城市群与长江中游城市群在技术专利申请数量方面与其他三个城市群存在较大差距,二者的专利申请数量之和与珠三角城市群仍存在差距,创新实力偏弱且缺乏特色优势[15]。
表4 五大城市群人工智能专利申请数量分布情况
可见,不同地域有不同的发展态势和特点,我国政府应当引导企业根据本地区的优势产业发展不同领域的人工智能。但同时,也要注重区域的协同发展,避免较大的创新能力差距。
人工智能专利呈现高速发展态势,各国纷纷制定人工智能发展战略,并对人工智能的相关情况进行研究。我国也通过颁布《中国制造2025》《新一代人工智能发展规划》等相关政策,刺激技术创新并推动产业发展。人工智能已经发展成为战略性产业技术,成为新一代产业变革的核心技术。谁能够在人工智能时代占据技术的领先地位,谁便能够在国际竞争中占据有力的地位,并能够主导全球技术标准化的制定。美国是我国长期以来的战略伙伴,也长期在人工智能领域占领技术高地。美国的人工智能发展状况以及趋势是全世界国家的焦点,近期,美国发布的《人工智能发明:追踪美国人工智能专利扩散报告》从美国视角提供了人工智能专利申请的基本现状。将这种情况与我国人工智能专利的发展现状进行对比,可以发现:我国人工智能专利的分析工具较为基础,不仅掣肘人工智能技术的分析并使其落后于发达国家,从长远来看影响我国对于人工智能分析的先进性;我国人工智能的投入不足使得基础层研发无力,出现如芯片研发自主性较低等致命问题,造成应用层产出无力的产业发展问题;技术垄断使得人工智能整体研发活跃度不高,小公司因为技术门槛而难以发展;我国各地区人工智能发展水平不均衡使得人工智能地域差距明显,东南沿海以及北京、上海、广州等在人工智能领域具有领先优势,但难以将此优势向全国普及。在未来的发展中,我国应该更新专利分析工具而避免因分析方法的落后而影响专利布局,也应当始终保持在应用层的技术优势并发展基础层的人工智能专利,以不断强化人工智能专利发展的独立性。与此同时,我国也应当因地制宜发展人工智能产业,减少地域差距与行业差距。