( 河南师范大学 法学院,河南 新乡 453002)
人工智能是制造智能机器、可学习计算程序和需要人类智慧解决问题的科学和工程。2017年7月我国出台《新一代人工智能发展规划》提出:“人工智能是引领未来的战略性技术”,并认为:“人工智能成为经济发展的新引擎……,催生新技术、新产品、新产业、新业态、新模式,……能实现社会生产力的整体跃升” ,人工智能技术与行业的结合可以提升效率,降低成本,促进决策科学化。作为国家发展战略的重点,知识产权领域对高新科学技术的发展最具敏感性,连接最为紧密,对人工智能技术亦不例外,例如,日本于2017年5月16日公布了“2017年度知识产权推进计划”,提出建立作为第四次产业革命(Society5.0)基础的知识产权系统,通过促进数据·人工智能(AI)的利用,构建用于强化产业竞争力的知识产权制度[1],这点可以通过两个层面予以反映:其一,对人工智能技术所涉及知识产权的保护;其二,如何利用人工智能技术对知识产权进行保护。其中,对于后者的理解包括:第一,“知识产权是一种制度创新与科技创新和技术进步之间形成一种共生互动的逻辑关系,两者互相影响互相作用”[2]34-38,这种逻辑关系除了利用知识产权对科技成果进行保护外,当然应当包括利用创新科技对知识产权保护方式进行提升与优化的反哺效应。第二,伴随社会主体对知识产权的日趋重视,知识产权保护已经从被动的“侵权—反馈”模式向主动“预防—介入”模式转变,知识产权保护必须做到敏捷、高效、精准、时时,客观上对保护方式、手段和技术提出更高要求。第三,经济学家的研究表明,对发展中国家而言,知识产权的保护力度以维持保障创新回报与防止资源配置失衡之间的平衡为主,与之对应的方法是 “政府应通过资助研究开发活动、建设公共创新平台和信息平台、完善融资和中间服务市场体系等”[3]124-134。这种平衡的把控主要体现在对知识产权申报、管理、成果转化与效益产出的各个阶段进行整合、关联,而不再是单一阶段的干涉。第四,信息社会对知识产权保护方式的影响越发体现在相关数据的汇总、分析,进而形成对结果的预测,并且在知识产权保护平台创建、运行以及建立高效的市场联系间发挥重要作用。第五,涉及知识产权保护的内容日趋丰富、复杂。它包括:文件审阅管理、案例管理、知识产权尽职调查、法律文件起草写作、知识产权检索(研究)、知识产权价值分析和策略、客户咨询服务、知识产权预警、知识产权诉讼、行政管理等,亟需新技术手段的支撑。
然而,传统的知识产权保护方式在应对主体日益苛刻的要求时却存在以下问题:第一,数据分割、阻断无法共享。我国现阶段的知识产权大数据模式,还停留在各自为政的阶段,与知识产权相关的机构,如行政管理部门、司法部门、社会服务机构、企事业单位等所有的数据没有相互关联,缺少“有效整合各类型知识产权数据资源,建立一个联合性或统一性的大数据管理平台”[4]89-93。第二,分析结论滞后。知识产权是时效性极强的领域,特别对于知识产权服务和管理机构而言,及时发现、预警存在的问题进而做出回应可以有效降低知识产权保护成本。这意味着需要对“不同来源的数据要去伪存真,异构的数据要识别和定义,不同维度的数据要关联和交互”[5]29-32。传统手工数据输入、检出由于无法保证数据的全面与时时更新,经常导致分析结果滞后。第三,效率相对较低。时至今日,大量的知识产权信息依然依靠简单手动输入和检索,这种方式耗时长,占用相当多的时间和成本,并很容易导致数据处理错误(世界知识产权组织估计四分之一的专利信息是错误的)。然而,对于很多市场主体而言,知识产权作为重要资产之一,一个简单的错误或者效率损耗就可能带来巨额损失。作为应对,基于数据基础具有信息自主存储、分析能力的人工智能技术具有迅速有效地处理大量数据,识别发展模式和分析最佳解决方案的能力,可以在知识产权保护领域发挥如下作用:基于图像、文字的知识产权创新性信息搜索与比对; 通过大数据增强推荐引擎功能,优化知识产权管理; 知识产权产品评估和定价优化;完善知识产权预警机制,提升预警敏感度;提高知识产权法律保障能力。具体分析如下。
不论是专利、商标还是著作,主体权利取得的公权力认可都来自于权益申报与认定,这是知识产权保护的初始阶段,而权益申报认定标准中的重要指标如新颖性、创新性、独创性或显著性则全部基于对已存在相关同类对象的比对与测定。这就意味着,伴随时间推进,在同一领域内所需对比的数据会急速增加,同质性增强,对比难度增大。以专利为例,据WIPO统计,2014年至2015年间,专利申请量增长了7.8%[6]。申请的上升趋势持续了20年,知识产权文件和资源持续叠加,而传统搜索方式仍然是以手动为主的静态搜索。以专利检索为例,我国现有主要的检索平台包括:国家知识产权局专利检索与查询系统、中国知识产权网、专利之星检索系统、SooPAT 专利搜索引擎等,这些检索平台提供的是较为常规诸如表格检索、专家检索、常规检索等方式,其中专利之星声称提供“智能检索”模式。这些方法“难以全面分析出某些信息之间,特别是关键字段不明显的信息间的联系,造成申请人在申请前的检索阶段无法全面检测已有信息。而遗漏任何信息都有可能造成侵犯他人在先权利”[7]35-38。同时,由于一些知识产权审核人员缺少充分接触、利用数据的路径和方法,致使分析效率与技术进步、商业机会的发展速度脱节,造成许多专利、外观设计、商标等在尚未授权的审查期间已经被淘汰。
此外,即使是现阶段既有的所谓“智能搜索系统”,如Patentics智能检索系统,经学者测试后认为:“申请人多以个人的习惯用语对技术进行表述从而给系统在语义理解及模型设计上带来困难……智能检索还不能作为专利检索的主要工具”[8]53-55,这说明 “智能检索系统”智能化程度不高,主要原因是:第一,申报文件的跨国家、多语种特征。从事检索工作的人员可能面对诸如英、法、德、日等语言文字。第二,专利文献(特别是中文文献)充斥大量自然语言或专业术语,并且由于书写习惯、语言结构等不同致使文献内容在关联性和隐含语义方面存在歧义、模糊和误差。
在引入人工智能技术后,通过建立大数据人工智能检索软件基础平台,利用自主学习和机器翻译,不仅可以自动化搜索巨大数据库,还可以存储和使用已储备的数据,针对不同的分析对象,将统计学、语议学、关联学、分类学等方法进行综合建模,以提高未来搜索的精准度。同时,在权利申报阶段,通过人工智能助理系统提交申报数据,并为每一个IP项目自动生成唯一的标识符,部署AI引擎来识别相应的相关信息。这样,来自各个专利管理部门或者代理服务机构的搜索请求可以根据需要进行智能分类和搜索,从而获得更高效、准确的结果。更为重要的是人工智能所具有的自主学习能力,“对于搜索引擎来说具有自我完善、纠错功能,随着使用量的增加,时间的积累,引擎中的算法在不断改进和学习”[8]53-55, 获取的数据越多,其应用程序就越准确和更广泛,应用文本挖掘,解决人类语言的歧义问题,真正做到搜索智能化,既有的实际利用例如据报道,澳大利亚知识产权局为其商标审查员引进了“认知计算工具”,在全世界范围内首次采用机器人工智能技术。该工具包具有“智能检索”功能,其会自动将新的纯文字商标申请与先前已注册的商标进行对比,以根据商品和服务的相似程度来制作一份目标清单。该工具包还具有“文字分析”功能,其将识别出一个标志里所包含的任何有问题的词语(包括那些可能包含令人不快的问题的词语)以及该标志的所有权信息[9]。
知识产权管理是知识产权保护的重要内容,负责管理工作的律师事务所、企业知识产权部门等可能需要在数个不同法域内收集数以万计的产品、合同和案例信息,这个过程缓慢而精细,是知识产权时代最繁琐与危险的领域之一,也是一直以来被我国很多市场主体所忽略的对象。一旦发生问题,会成为企业发展与扩张的严重隐患。
随着我国创新型市场的形成,越来越多的市场主体偏爱利用知识产权分析的手段了解行业态势,预估侵权风险,预测技术发展。以专利为例,在评估领域,需要考虑的问题包括:专利的效用、许可收入最大化选择、专利政策国家选定、价值与续展成本比对等,而现有方法大多基于手工处理,存在:准确性低;缺少公认标准;评估方法通用性不强;计算模型多变等缺陷[10]78-83。在尽职调查领域,特别是海外调查,应关注的风险包括:目标方知识产权的所有权归属与许可、侵权涉诉或涉诉威胁、商业目的相容性 、已知的重大的开发技术障碍、权利瑕疵等。涉及的内容更广泛、复杂、多变,涵盖目标对象的“产权号、保护地域、发明人及其雇主、权利人及其变更情况、申请日期、授权日期、专利法律状态、关键日期(比如优先权日期)、专利缴费情况、专利实施/许可情况、专利挖掘流程、竞争对手相关专利分析情况、专利技术是否关系目标公司当地国家安全利益等信息”[11]28,数据量大,信息构成复杂,人工成本高,效率低,风险防控压力大。
在预警领域,我国的专利预警数据的活动主要通过专利数据统计年报获得,各项专利预警往往“只根据专利数据本身给出,没有系统深入联系国家经济产业政策,没有主动跟踪当前和规划未来”[12]85,造成提供的决策融合度低,滞后性突出。而事实上有效的专利预警具有系统性、复杂性和时效性,需要整合数据、工具和人力资源等因素,所涉信息包括行政管理信息、市场交易信息、执法信息、诉讼信息、贸易信息和产业信息等,所涉部门涵盖市场主体、知识产权管理机构、司法系统和海关等,大量数据需要时时进行分析、评估和提示,依靠人力或简单的程序已经无法胜任。
人工智能技术的使用可以将管理人员从日常重复性较强的工作中解脱出来,解决知识产权分析工作存在 “分析成本高、滞性价值挖掘少、可视化度低、可推广性差等问题”[13]108-112。第一,通过关联、融合各类型主体的知识产权大数据,建立集成化分析、预警和评定自主智能平台,并通过与市场动态信息结合,进而向企业提供不同国家、法域以及横向、纵向市场间的优、劣势交叉比对,形成多层次、多角度、预见性的价值评估报告并择优推荐。“借助对丰富的、多维度的信息参考,专利的商业价值评估也将变得更为轻松和准确,专利分析的结论将更具决策力和洞察力”[5]29-32。第二,人工智能化预警体系,可以根据保护主体需要,自动跟踪在企业生产、国家安全等领域内通过敏感度设定诸如专利技术、版权信息、商标注册等内容,并自主汇总、分析数据,动态推送,及时、准确、全面的对竞争对手的信息进行预警性报告 。第三,尽职调查。传统产权尽职调查模式的缺陷,主要来自于法律、语言、信息等障碍,人工智能技术在自然语言处理、法律文献、案例分析、关键、关联信息收集方面所具备的能力,可以根据服务对象需求,自动设置调查内容参数,突破信息壁垒,为尽职调查工作提供全面的信息比对结论。
其内容包括:知识产权的行政监管;知识产权司法审判;其他知识产权法律服务。需要解决的问题包括:第一,知识产权涉法数据的快速累积、叠加引发的信息分析滞后。知识产权纠纷数量的快速递增,法律规定、法律文本、裁判文书等法律资料的迅速叠加和量级增长,支撑起规模巨大的数字化法律数据资源。但现有法律数据检索一般基于传统的关键词检索,这些方式成本高、效率低。第二,对法律服务的多样化需求应对缓慢。现阶段,不论是市场化或非市场化的知识产权法律服务要求逐年提升,但现有的法律服务却存在成本高效率低、对象面窄的问题,大量的个人、中小企业等在遇到知识产权法律问题时不知如何或者无力诉诸法律帮助,产生正义可得性危机。第三,司法成本控制压力增大。传统司法审判系统的低效率、程序拖沓等问题历来为人所诟病,特别是在面对新兴技术作为特征的知识产权所带来的新形态、高科技纠纷案件时,存在的成本高昂问题更为凸显,处理机制的革新势在必行。第四,知识产权行政治理的现代化要求。在我国,知识产权的行政监管是知识产权保护的重要手段,该领域呈现出知识产权综合治理情况复杂、新型侵权、犯罪形态迭出的特征,保护形势日趋严峻,传统的技术手段在效率、精准度等方面无法满足需要。
第一,知识产权案例检索。伴随知识产权法院的建立,社会主体知识产权保护意识提升,知识产权案件逐年增加,大量的法律文本、裁判文书等法律资料逐步数字化,形成量级巨大的法律数据库资源,传统的关键词检索技术已经无法满足需要,通过人工智能的自然语言处理和深度学习功能,智能检索系统不再简单的呈现结果,可以自动理解法律事实,完成检索并提供精确的、特定的、结论性的法律信息。第二,知识产权法律文件自动化。在调查取证、尽职调查等领域,基于NLP、TAR(技术辅助审阅)、预测性编程技术的人工智能系统可以自动完成文献资料——特别是合同审阅——以发现证据材料,并格式化起草法律文件,如合同、起诉书等。同时,这个过程可以在数据积累的基础上,与法院、行政机构的判决、处理结果等信息相关联,并通过机器学习的方式自我完善,确保法律格式的动态更新。第三,知识产权智能综合审判。国务院 “十三五”国家知识产权保护和运用规划中要求:“形成资源优化、科学运行、高效权威的知识产权综合审判体系”,2016年7月发布的《国家信息化发展战略纲要》明确提出:“建设智慧法院,提高案件受理、审判、执行、监督等各环节信息化水平。”人工智能在促进审判工作优化、高效、科学方面具有明显优势,在涉及诸如专利新颖性、商标显著性、著作独创性等需要进行侵权比对、责任认定、赔偿数额计算等复杂法律问题的研判领域,通过建设集审判、人员、数据应用、司法公开和动态监控于一体的智慧法庭数据平台,法务智能服务网络,实现法院审判体系和审判能力智能化。同时,由于人工智能裁判系统受人类情感和主观因素影响较小,可以在案情近似度高的前提下保证审判结果基本一致,减少冲突,促进同案同判,化解审判矛盾。第四,知识产权法律服务标准化、低廉化。知识产权法务咨询服务市场规模逐年递增,大部分服务内容具有高重复性特征,尤其是在专利、著作、商标申请、侵权认定、知识产权文件审查、案情预测等方面。利用人工智能案例、文件的数据分析和自然语言处理功能,通过构建模型向服务对象时时提供咨询意见,反馈提问结果,辅助预测案件走向,帮助服务对象形成有效的诉讼应对策略,减少服务成本,提高服务效率。第五,知识产权行政管理。在我国,行政管理是知识产权保护模式中最为重要的组成部分,在权利认定、流转、侵权处罚以及职能服务等方面发挥关键性作用。但是,由于知识产权行为具有涉及面广、专业性强、危害性相对隐蔽等特征,知识产权行政管理面临执法能力不足、成本高、反应滞后等问题,这些问题又会导致被管理对象对管理部门的公信力产生质疑。通过利用人工智能技术开发适于知识产权监管与决策的开放型人工智能平台,加强知识产权监管部门信息资源整合,打通政府部门与知识产权主体的交互通道,在公共需求的精准预测、风险预警、证据收集、侵权认定等方面减少人为因素干扰,实现行政管理智能化、高效化、公证化、透明化。
人工智能在知识产权保护中的运用于2018年进入实验高峰,2018年8月,世界知识产权组织(WIPO)发布各国家和地区知识产权局询问人工智能和机器学习软件在知识产权局管理中的运用情况。其中,加拿大知识产权局(CIPO)使用美国国际商用机器公司(IBM)的Watson社交媒体软件与客户互动,并研究通过机器学习回答知识产权政策问题的可行性;美国专利商标局(USPTO)正在可专利性的确定以及专利审查历史的分析几个领域中使用机器学习;欧盟知识产权局(EUIPO)已经启用基于机器学习的文件机器翻译软件以及名为TMvision的人工智能图像搜索系统,审查员和公众可以将其用作视觉搜索引擎[14]。由此可见,当前世界范围内人工智能的运用可以归纳为:自动专利分类、商标申请中商品和服务类别自动推荐、现有技术检索和分析、商标图像检索、商标整体审查、知识产权管理中的常规管理任务、外文文件的翻译以及经济研究的数据分析等。
除此之外,利用人工智能技术对知识产权保护进行保护,必须考虑以下几点:第一,对于知识产权保护主体,由于数据是人工智能的核心,利用人工智能建立新型的知识产权保护模式必须在政府主导下搭建数据拥有机构与搜寻数据发展AI的研究机构的共享机制,创设数据利用契约,建设面向人工智能的公共数据资源库、标准测试数据集,建立人工智能算法与平台安全性测试模型及评估模型,研发人工智能算法与平台安全性测评工具集,确保公共资助的研究应该以机器可读的格式发布基础数据,并提供明确的权利信息以及开放标准,提升人工智能系统数据可用性。第二,知识产权主体对人工智能技术应当保持应有的关注和积极的融入态度,需要提前考虑自身所涉工作中可以借助人工智能手段予以辅助完成的部分,如是否涉及大量的数据整合、筛选和分析,是否涉及重复性较高的互动活动,是否处于辅助决策地位。第三,除了技术本身,知识产权保护分析结果的呈现过程需要摆脱传统的复杂形态,应当更加直观、简单、便于理解,人工智能本体与使用者的无碍沟通至关重要,即处理过程的交互化,结果的可视化,这需要构建全新的人机关系。
总之,作为面向未来最为重要的科学技术,人工智能具有快速高效地处理大量数据、语义、文本识别和快速分析图像和视频的能力,这些功能在大数据和实时决策时代为知识产权检索、监测、尽职调查、预警、审判、服务等保护活动提供新的也是最好路径选择。而且,不论是否承认,人工智能技术已经开始对传统知识产权保护模式产生影响,这种改造的“规模和速度将不仅仅取决于技术发展和进步步伐,而且取决于整个法律共同体对于新技术和新模式的接纳程度,而这需要政策支持和发展导向”[15]。