姚 叶
(1.中南财经政法大学 知识产权研究中心,湖北 武汉 430073;2.马克思普朗克创新与竞争研究所,德国 慕尼黑 80539)
算法分析和决策越来越多地被用于各个部门,包括政府。它们被用来确定贷款利率,雇用和解雇员工,跟踪、标记、预测人类行为。由于人工智能算法具有技术属性,企业试图通过申请专利的方式对其进行保护与利用,如谷歌公司的Dropout专利就是一种人工智能算法。在世界范围内,诸多国家通过修改专利法和案例裁决承认人工智能算法的专利客体地位,并为其修改审查规则。现有研究对于人工智能算法的“可解释性”“可问责性”研究较多,但是,对于什么是人工智能算法往往避而不答。诸多国家和地区已经颁布人工智能算法专利审查细则或具体应用指南,但鲜有学者深度解析人工智能算法授权是否符合专利法宗旨。我国《专利审查指南》中明确了具有算法特征的技术方案可获得专利,并颁布了具体规则,但是,条文设置是否逻辑通顺值得探讨。鉴于此,本文针对上述问题展开论证,并提出我国人工智能算法专利应对方案。
算法一词由来已久,是9世纪波斯数学家Khwarizmi的名字,后来指求解问题应当遵循有条理的步骤。Woodrow Barfield等(2020)认为,从法律角度来看,作为自然过程的算法、程序员编写的算法与从机器学习技术衍生出来的算法有着本质区别,这些差异主要包括算法设计目的,以及使用独立于人类输入和控制的算法的法律后果。算法在法律中最早出现时,被定义为“自然过程”。在Gottschalk v. Benson案中,法院将算法定义为解决给定类型数学问题的程序,并认为其是自然现象且不可申请专利。随着计算机中算法的普遍应用,算法被认为是一组数学指令或规则,以软件程序的形式指示计算机硬件执行特定任务。在我国,从著作权意义上讲,计算机软件内容包括计算机程序和文档两部分。文档由程序设计、编程人员和测试人员编辑的文字、符号或图片组成,计算机程序又分为源程序与目标程序。算法通常用源代码编写并构成源程序,源代码通常被计算机翻译成机器可读的目标代码并形成目标程序。随后,算法发展成为人工智能算法,即“从机器学习衍生出来的算法”。
从人工智能发展史来看,人工智能主要分为两个流派:符号或经典人工智能、连结人工智能。对于符号或经典主义人工智能而言,人工智能为计算机软件创造其应当遵循的规则,对机器的决定进行事先安排,若发生特定事件则执行特定操作。连结主义人工智能通过在简单甚至统一单元(如人工神经元)相互连接的网络中学习规则,产生智能行为。在连接人工智能主义中,计算机可以从材料中学习并生成自己的规则,特别是从大型数据集中学习并生成对数据的理解[1]。由于大数据以及算力的发展,连结主义人工智能逐渐发展起来,机器学习算法和深度学习算法等均是连结主义人工智能发展的产物。从普遍意义上讲,计算机软件是符号或经典人工智能的产物,其产生逻辑是匹配既有规则与特定情形并产出结果,而深度学习算法、机器学习算法则是从数据中学习规则(见图1、图2)。
图1 符号主义人工智能运行中数据、规则与答案之间的关系Fig.1 Relationship between data, rules and answers in the operation of symbolic AI
图2 连结主义人工智能运行中数据、规则与答案之间的关系Fig.2 Relationship between data, rules and answers in the operation of connectionist AI
从“符号主义”到“连结主义”的算法生产方式变革,不仅意味着算法运行逻辑发生改变,而且意味着数据这一生产要素能够对人工智能算法的归属、披露规则产生较大影响力。数据会影响算法运算,故而人工智能算法的公开必须考虑对训练数据进行披露。一个人工智能算法的形成,首先需要选择一个合适的模型,将数据“喂”给模型,然后形成算法。有一个经典的对算法与数据间关系的论证是“偏见进,偏见出”,即当人工智能算法被“喂养”的是带有偏见的数据时,人工智能算法也是具有偏见的。传统计算机算法的形成主要依赖程序员的代码,相关发明的公开必须公开算法的原始代码与目标代码,因而人工智能算法的公开也应当考虑公开算法的训练数据。美国专利商标局发布题为“人工智能和知识产权政策公众观点”的报告,参与讨论的专家和机构一致认为,在专利领域人工智能发明判断的非排他性要素主要包括:用于训练人工智能并在系统上运行的数据库结构、用于训练算法的数据等[2]。人工智能算法审查规则与披露规则难以应对这种转变,故而应适时对这些规则进行调试。人工智能算法由数据训练而得,因而算法权属也应再作考量。根据朴素的“劳动价值理论”,为人工智能算法提供数据的主体在人工智能算法形成过程中贡献较大,获得专利权较为合理。从风险控制理论来看,算法生成中数据主体对算法的控制能力更强,数据生产者、控制者也能获得部分权益。可见,人工智能算法与数据间关系会导致算法权属变革。
尽管人工智能算法的学习逻辑与传统算法不同,但其需要使用计算机完成,故而仍然属于计算机程序算法,受到既有计算机程序算法相应法律、法规、规章的规制。
2021年开始实行的新版《专利审查指南》在第二部分第九章第6节,增加了包含算法特征或商业规则和方法特征的发明专利申请审查规定。本次《专利审查指南》修改旨在防止审查人员对技术特征与算法或商业方法特征的割裂,致力于客观评价发明的实质贡献,保护真正的发明创造[3]。第九章内容主要是“关于涉及计算机程序的发明专利申请审查的若干规定”,具体审查规则主要在第6节。一是强调对权利要求的“整体考虑原则”,明确包含技术特征与算法特征的技术要求不应当被排除在可专利性外,审查时应当将权利要求的所有内容作为一个整体看待。二是明确客体相关法律条款审查顺序,先判断其是否构成不属于排除获得专利权的情形,再考察权利要求中技术方案的技术手段、解决的技术问题和获得的技术效果。如果权利要求记载了对要解决的技术问题采用了利用自然规律的技术手段,并由此获得符合自然规律的技术效果,则构成专利法认可的技术方案。对新颖性和创造性进行审查时,采取“关联考虑原则”,考虑权利要求书中的全部特征,即技术特征和算法或商业方法本身特征,如果上述特征在“功能上彼此相互支持、存在相互作用”,共同构成技术手段并获得技术效果,则符合新颖性和创造性要求。应用于具体领域并解决技术问题以及技术手段调整或改进,都被认为是“功能上彼此相互支持、存在相互作用”。
从以上规则可知,中国《专利审查指南》将具有算法特征或商业规则和方法特征的发明置于对“计算机程序”相关发明的审查规则之下。这具有两重含义:其一,人工智能算法和商业方法是计算机程序相关发明;其二,如果人工智能算法符合“是一种方法、由计算机实施并且具有算法特征”的条件,则可以选择人工智能算法、商业方法、计算机程序中的一种申请专利权。
对于专利客体,欧盟审查指南规定“一个发明需要是新的,包含发明步骤,可以工业应用”。对技术方案是否具有技术特征进行检验,即对技术领域、技术问题、技术特性进行检验。规定了本身不具有可专利性的客体,如发现、科学理论、数学方法与审美创作。上述内容虽本身不具有可专利性,但是,在某些情况下也具有可专利性,如计算机实施的发明和人工智能[4]。
《欧盟专利审查指南》进一步细化了人工智能算法审查步骤,并将“人工智能和机器学习”放在专利例外名单中。指南指出,人工智能算法与数学方法有关,原因在于人工智能和机器学习是基于分类、聚类、回归、降维的计算模型与算法,如神经网络、遗传算法、支持向量机、K-均值、核回归和判别分析技术,这类计算模型和算法本身具有抽象的数学性质,无论它们是否可根据数据进行“训练”。
《欧盟专利审查指南》规定,一个数学方法如果具有以下特点,则可能被认为具有技术特征:一是产生技术效果并因此被认为是技术目的;二是被应用于一个技术领域或开展技术性实施。判断人工智能算法是否具有技术特征时,须考虑其技术目的与技术实施。指南规定,须将申请人所申请的客体作为整体进行审查,考察某一算法是否使用技术手段。首先,对于技术领域与技术应用,人工智能和机器学习在各个技术领域都有应用。指南指出,心脏监测设备中使用神经网络识别不规则心跳就属于技术贡献。基于低级特征(例如图像边缘或像素属性),对数字图像、视频、音频或语音信号进行分类是分类算法的进一步典型技术应用。当然,如果人工智能算法符合其它传统的使得数学方法具有可专利性的技术应用,则其也能够符合指南要求。其次是关注技术目的。仅根据文本内容对文本文件进行分类不是技术目的,而是语言目的。对抽象数据记录或“电信网络数据记录”进行分类而没有任何技术用途的结果分类也不是技术目的,即使分类算法可能被认为是具有有价值的数学特性(例如鲁棒性)。指南特别指出,某一算法生成训练集和训练分类器的步骤被认为是一种技术特征。
可见,欧盟在审查人工智能算法是否具有可专利性时,不认为人工智能算法具有与以往技术完全不同的特征,致力于采取统一规则对包含“数学方法”的技术方案进行检验。
在Alice v. CLS Bank 案中,法院结合Mayo v. Prometheus案形成了“两步测试法”。步骤1:确定该权利要求是否涉及工艺、机器、制造、物质组成;步骤2:首先,确定该权利要求是否针对自然法则、自然现象或抽象概念(步骤2a),然后,确定该权利要求是否叙述了显著超过“司法例外”的额外要素(步骤2b)。尽管美国并没有为人工智能相关发明提供独特的审查指南,但其已经意识到发布相关指南的必要性。2018年美国专利商标局局长安德烈·扬库 (Andrei Iancu)指出,算法(包括构成人工智能基础的算法)是人类独创性的结果,其与仅代表自然发生现象的数学方程“非常不同”。
2019年美国专利商标局发布《专利客体资格指南》[5],明确“抽象思想”包括数学概念、组织人类活动的某些方法和心理过程。其中,数学概念包含数学关系、数学公式或方程、数学计算,组织人类活动的某些方法包括基本的经济原则或做法、商业或法律互动、管理个人行为或人与人之间的关系及互动。心理过程是指人类头脑中进行的概念,包括观察、评估、判断、意见。步骤2a又细分为两条:第1条是确定要求的发明是否针对司法例外,即自然法则、自然现象或抽象概念,如果是,那么进入第2条;第2条是确定所要求的发明作为一个整体是否将司法例外纳入实际应用。审查员要确定所要求的发明是否包括不属于司法例外的其它元素,并评估该元素是否将司法例外纳入实际应用中。如果不是,那么进入步骤2b。
美国对于人工智能算法相关发明的审查具有先进的技术视野,不是针对人工智能算法等含有抽象思想特征的技术进行单独立法,而是为审查人员提供清晰的审查指南。这种做法在技术发展的同时有更多解释空间,但是,难以适应大陆法系国家需要。
授予专利权是为了鼓励创新。专利权建立在许多理论基础之上,如精神权利、回报理论或分配正义,但事实上它们无法为专利法具体内容如保护范围、短时期保护等提供理论支撑。德国马克思普朗克创新与竞争研究所的Hilty所长等[6]认为,自然权利理论如洛克的财产价值理论与黑格尔的精神理论在技术发展过程中已经被淘汰。专利法理论具有产业性,前景理论适用于制药业,因为在药品投放市场之前,该行业有大量投资;竞争性创新理论可以很好地映射到商业方法行业,因为即使没有专利保护,公司也有充分动机开发商业方法;积累性创新理论在软件行业非常有效,因为创新过程需要许多工人,每个人都在其他人工作基础上进行创新;此外,反公地和专利丛林理论在相关领域也很重要。找到或创造一个证明人工智能算法专利合法性的理论,是确保专利法理论连续性的重要环节[7]。
发明者通常从发明新的工艺或产品中获得回报,他们也会对相关信息进行保密以防止被迅速模仿。创新披露理论指出,为发明申请专利会诱使发明者公开相关信息。专利不是激励发明的必要条件,专利鼓励公开,为快速和广泛传播新发明中技术信息提供了一个制度工具[8]。创新披露理论不仅能够在广泛意义上促进专利技术公开,而且可以为人工智能算法获得专利权提供一步论证。人工智能算法是人工智能的核心,算法进步直接推动人工智能技术进步。例如,卷积神经网络、迭代算法等的发展使得人工智能发展至斯。人工智能的不透明问题来自于从符号人工智能到连结主义人工智能的转变。深度学习依靠大量人工神经网络,这些神经网络被比喻为人脑“神经元”,它们的形成需要大量节点,这些节点构成大量“层”,每个人工神经元处理一小部分数据(特征)[9]。每个节点的权重不同,根据不同数据点间关系强度与其它节点连接。也就是说,深度学习算法将以往算法的因果关系逻辑发展到相关性关系逻辑。尽管有学者认为在技术层面人工智能算法“黑箱”具有破解之道[10],但其缺乏对现实障碍的充分考虑。连结主义人工智能的训练原料是数据,工具是模型,不同数据、模型决定算法训练结果不同。对数据、模型和算法逻辑进行披露,需要专利制度予以激励。
有学者认为创新披露理论的逻辑是发明者在公开相关信息的条件下获得专利等独占权,但是,长时期独占可能遏制企业创新能力提升。鉴于人工智能发展速度较快,专利法可以通过专利期限改革提高信息使用效率。促进信息公开可以增加社会知识,激励企业公开外界难以获知的信息,这对于被看作是“黑箱”的算法而言十分必要。
一个产品的产生不仅仅来源于最初的发明,也源于在此基础之上的一次或多次创新。专利权固然很重要,但不应在其上赋予无限独占权,因为给予在先发明人独占控制权是没有效率的(Burk等,2003),毕竟通过在先发明人授予在后发明人许可进行权利流转需要耗费时间与精力。Merges是这一理论的支持者,他列举了累积创新在诸多产业中发挥功效的实例。软件行业是这一理论有效性的有力证据,而人工智能行业在本质上与软件行业有着类似的经济特点:首先,软件行业有相对较低的固定成本和较短上市时间,创新成本与后续竞争成本的比率不算特别高。克隆他人的程序比从头开始设计自己的程序花费更少,而且差别并不大。在数据高速流转的当代,依赖有效模型就能产出不同算法,而且一旦数据相同,产出相同算法也不是难事。其次,软件行业创新具有快速、渐进式特点,而人工智能产业发展也是一代一代编程人员不断摸索出来的结果。一项人工智能算法技术方案涵盖多种算法,是算法的集合。最后,快速发展的软件行业创新具有低水平特性[7],大量软件专利曾因过于宽泛的知识产权政策而获得授权。人工智能算法技术方案可能因为数据改进而产出大量方案,也可能通过使用专门词语替换技术产生诸多没有实际功能但可通过专利审查人员测试的算法。累积创新理论在催生诸多发明的同时,可能促使或加剧在后专利对在前专利的侵权。尽管如此,也不能因噎废食,专利法可通过专利审查标准的设定阻断低质量专利的产生,也可在司法实践中通过较高的侵权成本对侵权行为产生威慑,达到促进技术方案发明和控制侵权专利泛滥的目的。
总之,人工智能有较多难以预测的负面效应,且前人经验对后人来说至关重要。创新披露理论、累积创新理论均能够为人工智能算法寻求专利法承认提供理论支撑,人工智能算法专利并非无源之水、无本之木。
《中华人民共和国专利法》第二章第22条和第25条规定了专利客体资格及其审查内容。第22条排除了科学发现、智力活动规则和方法、疾病诊断和治疗方法、动物和植物品种、用原子核变换方法获得的物质以及主要起标识作用的设计,第25条则规定具有新颖性、创造性与实用性的技术方案方具有可专利性。上述条款和《专利审查指南》共同构成我国人工智能算法技术方案审查的系统性规定。其中,新颖性强调“新”即不属于“现有技术”;实用性强调技术方案必须能够被反复应用且具有正向效益;创造性则要求与现有技术相比,技术方案具有突出的实质性特点和显著进步。
我国实务界将人工智能算法专利分为3类:第一类是常规意义上的人工智能算法,如神经网络改进;第二类是人工智能算法功能性应用,如计算机视觉、语音处理等;第三类是人工智能算法行业应用,如智慧城市、无人驾驶等[11]。在我国,单纯的人工智能算法不构成专利,但是,人工智能算法改进可以获得专利权。哈尔滨工业大学大数据产业有限公司申请了“一种基于深度学习的缺失值填充方法及系统”[12],申请人称这一发明解决了数据库缺失值填充问题,达到准确度更高、速度更快的效果,能更真实快速地还原缺失数据。具体而言,这一专利主要的技术贡献特征在于通过模拟数据缺失,反复训练卷积神经网络进行数据填充,将填充结果与测试样本集进行比对,直至卷积神经网络结构满足精度要求。这一技术方案属于人工智能算法改进,并未涉及具体传统技术特征,其于2018年4月13日获得专利权。人工智能算法与技术特征结合获得专利的典型案例如下:作为一种功能性应用,一种基于卷积神经网络的车辆检测方法在我国获得专利,这一专利基于卷积神经网络算法,提出一种离线优化方案,对训练完成的卷积神经网络进行优化,在检测阶段采用先进行特征提取再扫描窗口的策略,避免了重复计算特征,提高了系统检测速度[13];作为一种产业性应用,一种基于深度学习的无人驾驶物流车获得专利。这一发明中包含深度学习算法,可对道路周围环境进行感知与理解,实现物流车无人驾驶功能[14]。
一言以蔽之,我国并不排除人工智能算法自身改进或与技术特征相结合获得专利权的可能性,而是采取较为宽松的态度。但是,人工智能算法审查过程中仍然存在许多困难,亟待专利法从根本上加以解决。
(1)算法黑箱。“算法黑箱”被定义为“输入和输出对于用户是可见的,但是,内部过程对用户不可见”。例如,有人认为ANN算法是一种“黑箱”。算法黑箱又称为“有限的可解释性”以及“缺乏预测性”,前者是指人工智能行为不能总是得到解释,人们可以确定人工智能做了什么,但不能确定它如何或为什么这样做;后者是指人工智能算法可以从事其原始程序员可能不打算从事的活动。人工智能算法运行原理的不透明性是算法不透明的主要原因。第一,人类对自己设计的算法有时并不能理解,更不用说具体描述。例如,由于人工智能机器人能够以人类不懂的语言进行交流,Facebook工程师紧急关闭了发明语言的程序[15]。第二,算法集合性使用加剧了算法理解障碍。算法不一定单独使用,实际上为了便于在不同工业领域应用给定数据集,集成算法得到广泛应用。多个算法被用于分析一个数据集以确定最佳解决方案或解释,如信用评分、网飞公司排名[16]。第三,算法不可知性不仅源于算法结构复杂性,也源于算法在大数据环境下的结构性位置。算法不是独立运行的,而是作为大数据分析系统的一部分,执行部分分析功能,而且前一环节产生的数据或信息结果作为后一环节的输入内容。从这一角度而言,对算法内容本身的研究只能反映后一环节中算法所应用的逻辑,而不能解释前一环节所应用的逻辑。
(2)实用性。除公开性要求外,专利法也要求申请人技术方案具有实用性、创造性、新颖性。其中,实用性是首要考虑要素,若技术方案未通过实用性审查则后续审查实无必要。《专利审查指南》规定,可再现性、可实施性、能够产生积极的社会效果是实用性的3个要求。但是,困难在于:第一,人工智能算法的可再现性不明,导致其通过实用性测试难度加大。人工智能算法从数据中学习,根据数据间相关性产生决策,并可能采取多种算法结合的方式形成某一特定算法,而随机算法选择和数据集的微小偏差都会使其产生不同决策;第二,人工智能算法可实施性有待考证。例如,采取人工智能算法的软件Colem能够自动生成专利文本,原理在于词汇替换功能,其本身不对所生成方案的实用性、新颖性、创造性进行考量,故而这种算法是否具有可实施性值得怀疑;第三,人工智能算法是否产生积极社会效果也需要考量。人工智能算法技术方案第一重隐忧是其可能产生有偏见、歧视性、错误的决策,专利算法决策反映程序员设计之初的价值观和使用算法的环境与手段(Eaglin,2017)。建立风险评估算法过程中存在许多人为选择,若被部署,则该算法可能产生一种抽象的种族差异测量,而与司法自由裁量权相结合时,可能产生完全不同的测量(Ananny,2018)。一个经典的案子是COMPAS软件,这一软件被美国威斯康星州某法庭用作量刑软件,但最高法院最近拒绝认定一个审判法庭的决定,并重申应当在庭审中保护被告的正当程序权利。第二重隐忧是算法产生决策的理由可能是社会所不能接受的,甚至非法的。人工智能算法产生的决策可能基于相关性,因而可能发现一个人鞋子颜色与其还贷可能性之间有很强关联性。但从规范意义上讲,人们并不希望银行根据鞋子颜色作出贷款决定。
(3)创造性。创造性审查被认为是专利制度“守夜人”,而创造性高度的问题长期困扰国内外实务界与学术界。我国《专利审查指南》规定,一项技术方案须具有实质性特点和显著性进步才能通过创造性测试。实质性特点是指针对本领域一般技术,发明相对于现有技术而言并非显而易见;显著性进步是指发明与现有技术相比能够产生有益的技术效果。首先,确定技术领域存在困难。随着人工智能算法的进一步发展,人工智能算法与人类思维越相似,越可能横跨某一或某些领域,确定人工智能算法技术领域就越困难,毕竟人脑思维是不具有领域限制的,进而导致确定“所属技术领域的技术人员”拟制标准也成为难题。其次,判断技术方案是否具有积极进步存在困难。人工智能算法搭配强大算力呈现出优秀的数据库检索和整合能力,基于现有技术审查标准和数据库,极容易被认为具有创造性[17]。创造性高度的判断是抽象的,也涉及价值取向问题,而现阶段人工智能技术人员并不具备这种价值分析能力[18]。
(4)新颖性。新颖性审查要求所申请的技术方案不属于现有技术,没有任何单位或个人就同样的发明或者实用新型在申请日以前向专利局提出过申请。专利审查人员往往被某些仅仅看似具有新颖性的技术方案迷惑,人工智能算法依靠关键词替换技术完全有可能生成与原算法本质上一致的算法,依靠反义词、相关词替换生成围绕既有专利的看似新颖的技术方案。对审查人员而言,这完全具有新颖性,但这些技术对人类社会无所增益。另外,新颖性审查需要专利审查部门将数据库与检索方式相结合,人工智能算法的算力与数据存储量使得其完全有能力避开审查人员数据库或检索方式而“欺骗”审查机构[17]。
(1)《专利审查指南》中部分条文需作适当修正。一方面,“含有算法特征”“商业规则和方法特征”并列置于《专利审查指南》第六章“计算机程序”相关发明审查规则之下,这是缺乏严密逻辑的。含有算法特征与含有商业方法特征的技术方案共同之处是包含“抽象的思想”,将商业规则或方法视为一种计算机程序缺乏相应支撑。另一方面,条文设置缺乏技术发展性眼光。计算机程序须基于计算机这一工具的存在才能申请专利,而在未来技术发展中,含有算法特征或商业规则和方法特征的技术方案不一定依赖计算机。同时,“含有算法特征或商业规则和方法特征的发明专利”这一概念无法囊括人工智能、互联网+、大数据及区块链技术发展中形成的相关专利。相比之下,欧盟专利审查指南在条文设置上更具合理性,也更具操作性。中国《专利审查指南》应取消“计算机程序”“含有算法特征或商业规则和方法特征的发明专利”概念,使用“含有抽象思想的技术方案”,如此便扩张了上述概念,既避免概念重合,也避免逻辑不周延。
(2)更新披露规则。算法黑箱形成的首要原因是人工智能算法具有“自身不可解释性”,深度学习是一个端到端的黑箱,人类无法获知其决策过程与原因[19]。算法黑箱不是真正意义上的黑箱,只是比较复杂而呈现出类似黑箱的特点。内部过程可视性并不是问题,因为数学编程算法能够存储为数据并被检验。可解释性的问题归根结底是输入与输出之间的关系,只要将每一个因素的权重解释明白,算法原理就会很清楚[10]。美国相关专家学者要求公开人工智能算法3方面内容:一是人工智能模型基本结构。简单的图表就能告诉技术人员该模型具有多少层和如何配置每一层,人工智能模型编程库还开发了定义模型的便捷简写,可用于专利申请中公开模型结构,如Keras网站提供这一服务;二是对模型训练方式的描述,包括训练数据引用、模型的每个学习因素或权重;三是训练数据。训练数据包含可用数据与特定领域数据,公开训练数据的缺点是说明书中披露的数据量可能相当大,同时,某些数据可能因为涉及商业秘密或个人隐私而无法公开。对此,有学者建议引进微生物发明审查相关规则。一项生物技术发明可能利用某些微生物生产有用的物质,就像人工智能发明可能利用经过训练的人工智能模型,根据输入数据作出有用的预测。对于微生物,有一个类似问题,即如何让公众获得这些微生物。1977年《布达佩斯条约》规定了生物材料存放制度,类似地,人工智能训练数据存放制度可使公众获得用于研究的专有数据,同时,保障申请人利益[19]。
(3)专利法中“专利三性”标准应当在合理范围内进行调试。
第一,实用性审查应当审查技术方案实施效果并在合理、合法范围内公开人工智能算法模型与训练数据。首先,“积极效果”不是一成不变的,而是因时而动。因此,审查时不需要明确积极效果清单,但须设立底线[20],避免不道德、违反伦理和危害社会公共利益的人工智能算法与发明获得专利[17]。其次,人工智能算法虽然具有技术中立性,但如果缺乏必要监管方式就可能对社会产生负面效果,故而审查时应考虑其可能产生的负面影响。有学者指出,应将“人类介入”因素作为判断标准(邓建志,2019)。通过事前监督、及时中止、及时审查等,严格审查实用性要件之实施效果。最后,应根据我国专利法“公开描述要求”,结合法律、法规规定要求申请人对数据、算法、模型等进行披露。
第二,创造性审查应关注“所属技术领域”“本领域普通技术人员”“现有技术”3个概念。首先是所属领域,随着人工智能技术继续发展成熟,理应在所有技术领域(而非特定技术领域)拟制普通技术人员[21]。其次是普通技术人员标准,有学者指出应提高“普通技术人员”标准,以反映现实条件中“一般技术水平”(刘强,2018),亦有学者提出普通技术人员应被所属技术领域“人工智能”代替(马忠法,2019)。欧盟最高法院并不同意由人工智能代替人的观点,早在Diamond v. Diehr中法院就认定“本领域的普通技术人员”是“具有普通创造力的人,而不是机器人”。有学者着眼于人工智能相关专利特征,提议将审查人工智能发明与人为发明的标准进行区分,建立人工智能专利跟踪模型,并将本领域普通技术人员修改为“使用本领域普通人工智能工具的技术人员”。Ryan Abbott认为,积极工作者所使用的技术与积极工作者技能高度相关。发明性机器越来越多地被用于研究,一旦使用这种机器成为标准,本领域技术人员就应该是使用发明性机器的人,或者只是发明性机器。如果将本领域普通技术人员推定为了解所有相关现有技术,那么其应该知道如何使用一个普通的人工智能工具[22]。最后是现有技术范围,我国审查人员关注的技术领域是申请人在专利申请说明书中填写的技术领域[20]。审查人员选择现有技术范围时,为了找到尽可能接近或相同的技术,会尽量缩小这一范围。以申请人提出的范围为基础,向内缩小或向外扩张的行为方式不会因为“人工智能特性”而受影响,因此,确定现有技术范围的审查方法无需修改。
第三,新颖性测试应适当拓宽现有领域,扩大检索范围,并使用人工智能进行专利审查。我国对专利进行新颖性审查时,一般会考察检索范围、检索主题、检索时间界限、检索技术领域。在事前控制层面:首先,审查人工智能算法的专利行政部门对现有技术的检索,不应拘泥于申请日以前在国内外为公众所知晓的某一特定技术领域,而应对现有技术进行缩小解释,排除仅靠词语替换生成的海量技术方案等[17]。其次,应适当拓宽检索范围。根据我国《专利审查指南》,专利审查人员实际审查时引用的对比文件主要是公开出版物,但某些非专利文献并未全部收集到大型、权威文献数据库中[20]。实际审查资料可能小于真正的现有技术范围,因此应适当拓宽检索范围。最后,可采取自动分类工具对专利进行分类,并采取基于人工智能技术的搜索系统进行现有技术检索。美国专利商标局2021年公布其使用人工智能工具进行现有技术审查,并称这一检索系统已经取得显著成就。这一检索系统以专利商标局建立的人工智能模型为基础,向审查人员学习并自动获取反馈数据不断改进。为使审查过程更透明,专利商标局会解释检索系统运行逻辑。同时,美国开发的专利自动分类工具会利用机器学习使用合作专利分类系统对专利文件进行分类[23]。
我国也应将审查标准这种“事前控制”方法与“事后检验”相结合。在事后控制层面,应加快“专利无效宣告程序”处理速度。现有技术文献浩如烟海,基于行政效率考虑,审查人员无法穷尽所有资料,因此,将本不应授权的专利申请授予专利权在所难免。专利权具有推定性质,该权利是否应当获得尚有待检验[24]。我国《专利法》第45条中规定了专利权无效宣告程序,专利无效宣告程序效率的提高能够解决新颖性审查遗漏问题,不失为一个调试方向。
将人工智能算法置于专利法中加以保护虽然具有合理性也逐渐被接纳,但是,人工智能算法由基础代码构成,可能由投资人获得与控制,人工智能算法可能作为著作权法对象或商业秘密保护客体。对人工智能算法专利的保护不能磨灭其在其它法律系统中保护的可能性,但是,基于人工智能算法对人类世界的贡献及其不易披露的事实,将人工智能算法作为专利客体进行保护更加符合公共利益需要。