卞静,邓丹云,孙寅木,胡锦浩
(1.中山大学计算机学院,广州510006;2.广州互联网法院,广州510335;3.共道网络科技有限公司,杭州311100;4.广东财经大学智慧法治研究中心,广州510320)
开展知识产权保护、提高知识产权保护的法治化水平,是新时代对我们提出的工作要求,尤其是要提高知识产权审判质量和效率[1]。最高院于2017 年4 月发布《中国知识产权司法保护纲要》,明确了知识产权案件的审理程序,做到简案快审、繁案精审;于2019 年1月印发《民事诉讼程序繁简分流改革试点方案》,新一步推进案件繁简分流,提高审理效率,满足人民群众多元化诉讼需求。
随着当前我国社会经济结构的不断调整,产生越来越多的创造和创新活动,凸显了知识产权的价值属性,企业和个人对知识产权的保护意识在逐步提升。同时,互联网的便捷也使一些作品的创作门槛降低,传播速度加快,导致知识产权纠纷频发,法院审判案多人少的矛盾日益突出。此类案件具有以下特点:①数量逐年增大。最高人民法院院长周强在两会工作报告中指出,2020 年人民法院审结一审知识产权案件46.6 万件,同比上升11.7%,知识产权案件判赔金额同比增长79.3%[2]。②诉讼周期长、专业难度大、涉案范围广,对法官的审理能力提出更高要求。③案件事实简单,可通过自动化流程明晰侵权属性,符合要素化审判。④具备波动性。借助网络技术和信息化处理技术,知识产权侵权成本降低,同一产品可能会被多次侵权,造成同一原告向多名被告提起诉讼,引起法院接案数量波动,办案资源紧张。
如何解决案件多、审限长的现状,平衡法院资源,充分满足知识产权类案件的诉讼、审理需求,高效、科学地处理知识产权类案件,成为各法院的一个难点。随着国家信息化能力建设的不断提升,人工智能技术的不断发展,机器学习和深度学习在各个领域的不断应用,司法领域的人工智能应用研究也在不断推进。是实现“让信息代替人民群众跑腿”,减轻人少案多矛盾的重要选择[3]。司法领域引入人工智能技术,能极大提高审判体系和审判能力,推动智慧法院建设,在国内外得到高度重视。美国丹尼尔·卡茨团队通过机器学习方法,使用历史数据,对1816 年到2015 年间美国最高法院的判决结果进行预测,准确率高于70%[4]。在我国,陆续建立了“中国法律应用数字网络服务平台(法信)”、“智慧法院导航系统”、“类案智能推送系统”。
作为人工智能的知识大脑,知识图谱在要素智审系统中发挥着不可替代的知识补给作用,也是未来人工智能在司法领域向更高水平发展的核心技术。知识图谱由实体、概念、属性、关系等元素构成,是一种揭示实体之间关系的大规模语义网络,能够提供从“相似度”角度分析问题的能力,通过知识抽取、知识融合、知识推理,以及不断的迭代,把人类对客观世界的认知映射到计算机世界中,按照机器语言描述客观世界的对象、对象属性及对象关系,具有客观、高效、准确、公平的特征,非常适合于要素化案件审理。
广州互联网法院基于知识产权知识图谱构建,根据涉案知识产权纠纷具有案件数量大、符合要素式审判,案件高度相似、批量化等特点,结合现代技术手段,借助互联网、区块链、人工智能和5G 等技术与网络著作权司法保护深度融合,将审判要素化,打造审判知识图谱,通过分解要素,设计完成了一套知识产权要素化智能审理系统,建立了知识产权案件由立案、受理、举证、文书送达到法官审理和判决文书一键生成的新型智能协同审判模式,提高了知识产权立案速率和审判效率。该系统充分利用前沿科技强化知识产权保护,破解了“举证难、周期长、成本高、赔偿低”的传统难题,是保障网络文化产业健康发展的重要成果,在引领法院数字化新常态工作中进行了有益的探索。
要素式审判,是在总结类型化案件所具有的共性基础上,梳理事实依据、提取审理的法律要素,按照逻辑推断关系,简化无争议要素审理程序,重点审理争议要素一种审判工作方法[5]。这种审判机制能优化诉讼流程,并能在一定程度上克服传统司法数据在人工智能系统中的应用难题。要素式审判从司法数据源头上实现了数据的系统优化和科学归纳,既有利于人工智能对要素式法律文书进行共性提炼和机器学习,也与知识图谱运用自然语言处理对司法数据进行抽取、融合、加工的算法逻辑高度契合。
知识图谱是一种大规模语义网络,于2012 年由Google 正式发布。知识图谱包括节点-实体、节点、节点值和边缘组成[6],分为数据层和模式层,数据层以“实体,关系,实体”或“实体,属性,数值”的三元组形式呈现,模式层基于数据层完成数据提炼、加工和处理,形成实体、属性和关系之间的规范联系,进而为知识推理提供决策信息。如把数据层的“张三—剽窃作品—李四”映射到模式层,便是“侵权人—民事侵权关系—被侵权人”。惠普实验室开发了Jena 知识图谱管理系统[7],可以构建语义网和链接数据应用,现已由Apache 管理。知识图谱的技术架构主要包括知识抽取、知识融合与知识推理。知识图谱可以深度剖析涉诉作品基本信息,辅助法官决策;可以从海量的知识产权判决书中不断提炼关键数据,完成迭代学习,完成高质量司法知识图谱的衍化,是智审系统的知识支撑。
广州互联网法院研发的要素智审系统针对知识产权案件的案情特点和规律,通过对类案解构,整理案件的知识图谱,提取权利人的起诉要素和侵权人的答辩要素,借助智能化数据建模手段,自定义“元数据”模型,构建案情要素模型、页面采集模块、存储模块、计算处理模块和要素展示模块,不断迭代重复,形成完整链条。通过当事人的要素化起诉、要素化答辩和法官的要素化审判,最终实现要素化的智能裁判。
系统构建了支持法律建模人员在平台上以约定的形式对已有的法律知识、案情推理规则、关键案件要素进行规范化录入;完成在线知识图谱绘制、算法协同的图谱工厂,共覆盖375 个不同的内容节点,其中不同类型的计算节点共78 个,要素节点168 个,其他逻辑节点129 个。图1 给出图谱工厂工作示意图,通过将法官的专业法律知识存储成机器能理解的代码逻辑,对输入的各种证据要素自动进行逻辑推断和计算,自动生成审判结果。这里的推理能力是一种通用化的逻辑推理能力,可复用到任何通过输入数据推导结果的场景。
图1 图谱工厂工作示意
图谱数据主要来自基于爬虫技术对网络知识库搜索引擎进行抽取的领域数据;国家法律法规数据库、国家裁判文书网和各级法院内部所保存的司法案例、法律规范和司法案件等文本信息,如证据材料、庭审答辩、案件信息[8]。图谱工厂主要由元数据、交互界面和解析推断引擎部件组成。在图谱工厂中,元数据层提供不同的数据模型定义和存储能力,包括数据类型、数据结构、数据模型间继承引用关系等。在应用端通过与前端控件的配合,可实现页面跟随数据结构自动适配渲染的能力。交互界面主要由节点和线组成。操作符节点可定义不同类型的计算逻辑单元,结果节点用于存储各个步骤的计算结果。图2 展示了运用元数据、解析推断引擎,操作符完成智能审判推断的过程。
图2 智能审判计算示意
案件审理流程包括:①根据预设要素表进行要素建模,得到多种案件类型分别对应的模型;其中,预设要素表包括多种案件类型中每一案件类型对应的一个或多个案件法律要素,以及每一案件法律要素对应的属性信息和规则信息。②根据每一案件类型对应的模型,生成每一案件类型对应的要素值采集页面。③采集案件当事人在要素值采集页面输入的要素值。④获取采集的每一要素值对应的案件法律要素的对象映射关系和存储方式,并根据对象映射关系和存储方式,将每一要素值存储至数据库。⑤根据需要进行审理的案件信息从数据库中获取案件信息对应的要素值,并根据案件信息对应的要素值生成要素展示页面,并输出要素展示页面。根据知识产权案件的审理流程、案件要素、知产保护法规等,提取知识产权中的核心概念和相关属性,以及概念之间的关系,构建出层次结构较强、冗余程度较小的知产图谱。如图3 所示,知产图谱的模式层由权利客体、权利归属、侵权事实三个核心要素以及它们之间的关系和属性构成。
图3 知识产权图谱
图谱数据层的构建包括知识抽取、知识融合、知识更新三个部分。通过知识抽取,可以从半结构化、非结构化的数据中提取出实体、关系、属性等知识要素。智审系统从知识产权的历史案件中抽取知识,对于已规范记录在系统中的半结构化数据,只需简单的转化便能完成抽取,对于一些记录缺失的案件或者纸质文件等非结构化数据,则需要通过编写特定的规则才能完成知识抽取。由于案件记录一般较为规范,通常能够高效且准确地对案件中的数据完成知识抽取。通过知识融合,可消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识库。知识产权案件记录存在同一实体描述差异的情况,为了解决这一问题,智审系统通过自然语言处理技术,计算文本相似性,补全文本缺失的描述,合并指代相同的实体,而对于无法自动化融合的知识,转由人工处理。通过知识更新,可以在知识图谱应用的过程中对其中的知识进行时效性检测、正确性修正,保障知识库中知识的质量。由于知识产权的新型和复杂案件层出不穷,法规政策、审理流程不断改进完善,知产图谱需要持续地更新,以保证知识的有效性。新增的案件还有可能存在当前模式层中不曾定义的概念,对此需要进行模式层的更新,即针对案件新要素、法规新条例进行知识组织结构的更新,包括文本类型、实体类型、关系类型等。模式层更新的同时数据层也需进行相应的更新,采用增量更新的方式[9],对新案件进行知识抽取和知识融合后加入到原有的图谱中。此外,数据层的更新还包括对知识的质量、有效性、时效性进行检测,及时删除错误、失效的知识,这部分工作由计算机辅助专业人员完成。
图4 给出知识产权要素化智能审理系统模块图。该系统基于知识图谱技术,以及元数据模型驱动开发、区块链、深度文本相似度匹配算法、Query 理解和机器人NLU、电子证据智能比对等技术,实现了知产案件快速智能化审理过程;通过智能组件技术,实现了诉讼风险评估、类案推送、法条推送、证据分类、图片对比、文书纠错等。建立了知识产权案件由立案、受理、举证、文书送达到法官审理和判决文书一键生成的新型智能协同审判模式,提高了知识产权立案速率和审判效率。
图4 知识产权要素化智能审理系统应用架构
广州互联网法院组织法官团队和技术团队,对涉网知识产权案件的主体类型、作品权属、侵权事实、赔偿请求等要素进行了逻辑梳理和归纳,构建了超过1500 个要素的审判知识图谱模型[10]。图谱模型结合了法官对网络著作权类案的审判经验及相关法律法规,按照审判要素总结归纳成思维导图,并转换为机器可以识别的知识图谱,从而建立起网络著作权审理知识体系,并在不断总结审判经验中丰富完善。图5、图6、图7 分别给出答辩时的争议焦点页面、法律证据对比中的文章比对分析和图片比对分析页面。在计算结果页上可见两篇文章对比重复字数、重复段落数、重复句子数等统计字段。还有相似片段分布情况。在正文中,重复的内容会标红提醒法官。文章底部统计文章的基本信息,如文章的总字数、句子数、段落数等。
图5 争议焦点页面
图6 文章比对分析
图7 图片比对分析
智审系统通过引入文字、图像、视频智能比对技术,实现了对简单侵权行为自动判断及侵权程度的自动计算,以直观分值的形式,辅助法官判明侵权事实;引入在线技术官,通过在线勘验的方式,协助法官判明侵权事实;基于NLP 自然语言处理技术,通过对法官已有判决文书的学习,在知识图谱的驱动下,生成个性化的裁判文书。信息库的相关信息智能地进行案件繁简筛选分析,针对简易速裁案件,批量生成要素式裁判文书;针对新型复杂案件,通过深度分析案件要素,比对类案大数据,自动生成裁判说理部分,判决书完整度高达95%,和以往审判相比,极大程度提升了审判效率。
科技创新与司法结合,能够充分彰显科技赋能司法的效率价值。在司法审判机制改革和人民法院信息化建设浪潮的双重推动下,要素式智能审判系统成为“人工智能+要素式审判”耦合的集大成者,对智慧法院的建设具有繁简分流、挖潜增效的应用优势。作为人工智能的知识大脑,知识图谱在要素智审系统中发挥着不可替代的知识补给作用,也是未来人工智能在司法领域向更高水平发展的核心技术。广州互联网法院通过运用知识图谱及其他人工智能处理技术,设计完成了一套知识产权要素化智能审理系统,建立了知识产权案件由立案、受理、举证、文书送达到法官审理和判决文书一键生成的新型智能协同审判模式,对知识产权类案件实现繁简分流、优化法院审判资源配置、破解法院人案矛盾、提升诉讼质量和办案效率具有重要实践意义。面对知识产权等新型案件类型层出不穷、诉讼数量急剧攀升的司法现状,各级法院应积极探索科技司法的新模式,深化理念创新、技术创新、制度创新,不断推动网络空间审判体系和审判能力的现代化建设。