类案推送嵌入“智慧法院”办案场景的原理和路径

2018-09-10 01:03陈琨
中国应用法学 2018年4期
关键词:类案裁判检索

陈琨

党的十九大报告提出,要深化司法体制综合配套改革,全面落实司法责任制,让人民群众在每一个司法案件中感受到公平正义。随着司法责任制改革全面纵深推进,如何依托智慧法院建设,完善法律统一适用机制,确保类案同判,成为关系改革成效评价的重要问题。2017年10月26日,中共中央办公厅印发的《关于加强法官检察官正规化专业化职业化建设 全面落实司法责任制的意见》,要求依托大数据技术,完善智能辅助办案系统的类案推送、结果比对、数据分析等功能,促进法律适用统一。此前印发的《最高人民法院司法责任制实施意见(试行)》也提出,承办法官在审理案件时,应对本院已审结或正在审理的类案与关联案件进行全面检索,制作类案与关联案件检索报告。“类案检索”和“类案推送”正式从试点探索、政策倡导走向制度要求层面。

从逻辑关联上看,类案检索是类案推送的前提,只有在检索基础上的分门别类、确定标记、匹配嵌入,才有可能识别“类案”、精准推送。因此,本文将“类案推送”作为讨论重点。事实上,作为人工智能切入司法领域的重要场景,各种以“类案推送”为核心功能的衍生产品已见诸市场,形成规模效应和话题效应。本文无意比较、臧否市面上各种“类案推送”产品,仅从应用场景维度,探讨类案推送嵌入“智慧法院”法官办案场景的基础原理和操作路径。

一、需求场景:类案推送的现实意义

“场景”原是影视剧创作中的概念,是指在一定时间、空间内发生人物行动或具体画面。〔1〕沈贻伟:《影视剧创作》,浙江大学出版社2012年版,第162页。随着互联网产业蓬勃发展,场景化思维逐步成为产品开发设计的重要因素。所谓场景化思维,是指在设计产品时,应先考虑基础场景,不断打磨优化环境场景,通过反复交互反馈,使产品充分适应需求场景。对需求场景的分析,决定了产品开发的方向,也是衡量产品价值的重要指标。从性质上看,类案推送可以视为人工智能辅助办案场景下的互联网交互产品,场景化思维也必然贯穿其开发和应用的全过程。

(一)类案推送的基础场景

类案推送的基础场景,包括应用者的身份、目的和路径。具体而言,就是要考虑法官基于什么目的,需要什么样的类案推送服务。实践中,主要可概括为以下几个方面:

一是促进司法公正的需求。通过司法责任制改革,“让审理者裁判,由裁判者负责”成为常态,院庭长不再审核自己未参与审理案件的裁判文书,但“法官是喜爱和厌恶、偏好和偏见、本能、情感、习惯和信念的复合体”。〔2〕〔美〕本杰明·卡多佐著:《司法过程的性质》,苏力译,商务印书馆1998年版,第22页。加之不同地域、审级、经验的差异,“类案不同判”现象有时发生,影响到司法权威和公信力。类案推送通过呈现相似案件的既往裁判思路和结果,为法官审判提供可资参考的推理逻辑和评价标准,有利于防止自由裁量权的滥用。

二是提升办案效率的需求。面对繁重的办案任务,加之辅助人员短缺,法官没有时间、精力将每一起案件放到浩如烟海的判例中比对。类案推送能够通过精准匹配、合理筛除,直接快速地向法官呈现权威度最高、关联度最强、相似度最大的既往判例,极大缓解法官的办案压力和工作负担。

三是健全智识结构的需求。经济社会迅速发展,思想文化交融互通,促使法律关系不断复杂化,对法官的智识结构提出更大挑战。类案推送的前提,在于通过体系化梳理,形成“穷尽而不重复”的法律知识图谱,促使法官不断查漏补缺、补齐短板。

(二)类案推送的环境场景

环境场景聚焦时间、地点和周围条件。具体来说,就要考虑法官在何时何地何种情况下需要使用类案推送。结合审判实践,可以概括为以下几类:

一是庭前准备阶段的使用动因。类案推送可以在庭前准备阶段,为法官提供审理要点参考。纠纷解决通常围绕争议焦点展开,为保障庭审流畅,法官在庭前需要整理庭审审理要点,对于部分法律关系复杂的案件,审判要素认定和裁量相对复杂,业务标准尚不统一,导致审理要点整理慢、精准度低。而类案推动可通过要素匹配,解构所推送案例的事实、法律争点,使法官在庭前准备阶段,就能熟悉类型化案件的审理思路。

二是审理阶段的使用动因。类案推送可以在案件讨论中为法官提供专业意见参考。案件审理期间,法官在主持庭审、参加合议、参加专业法官会议、列席审判委员会时,都可能就法律适用、证据认定问题与他人探讨或争论。通过类案推送,有利于法官形成内心确信,并据以说服他人。

三是结案阶段的使用动因。类案推送可以为法官裁判文书说理、提炼审判经验提供参考。法官既是“类案”的参考者、使用者,也是生产者、提供者。类案推送系统的研发过程,也是广大法官贡献智识的过程,使法官基于个案的思考和研究摆脱地域和时间的桎梏,形成规模效应。

综上,类案推送的场景化思维,就是要结合基础场景和环境场景,从法官的实际使用角度出发,将各种场景元素综合起来的思维方式。基础场景和环境场景的结合将产生不同的需求场景(见表1),这既是类案推送的功能设计导向也是场景落地的检验标准。从需求场景就可看出,类案推送是一系列包含筛除、判断、识别、归类、推送的复杂综合行为,只有人工智能技术才足以支持。

表1 类案推送的需求场景组合

二、概念澄清:基于人工智能的类案推送

近两年,由于商业应用进入新领域、新阶段,人工智能再次成为热点话题。〔3〕参见邓洲:《人工智能:昨天、今天和明天》,载《中国改革》2017年第9期。类案推送是人工智能在司法领域的重大运用,理解类案推送的人工智能属性,有助于开拓类案推送完善方案的视角,同时找准升级推进的正确途径。

(一)推送与检索的概念区分

推送与检索是两个不同的概念,准确区别推送与检索是保证类案推送符合设计原意的根本前提。二者的区别主要包括:

一是语义差别。检索指从文献资料、网络信息等信息集合中查找所需资料或信息的过程。推送则是指将经过整理的信息资源发送给用户,满足用户的多层次需求,使用户能够自己设定所需要的信息类别,并直接在用户端接收定制信息的实现方式。从语义上看,检索相较于推送,是被动结果到自主结果的转变、资讯繁杂到信息精细的转变、机械回应到智能操作的转变。

二是行为差别。检索行为通常由信息获取者发出,检索主体的一次行为方式包括输入、浏览、判断、筛除,通过反复的检索行为,进入信息集合的更深层子目录,从而定位到有效信息,这一过程反馈主体始终保持机械回应。推送行为通常由信息系统发出,而信息获取者是推送的接收主体,推送接收主体的一次行为方式只包括输入和反馈,输入行为使系统获取条件,进行精确匹配,并自动进行浏览、判断、筛除、输出;反馈行为则对系统输出内容进行正误判断,进而使系统依据新的反馈指令对输出内容进行完善和修改,全部取舍过程由系统自动完成。可见,检索主体的行为模式相较于推送接收主体而言更为复杂。

三是结果差别。检索结果取决于关键词的准确性,而不论关键词多准确,也无法避免同义词和关键词不唯一导致的信息反馈疏漏或过盛,即结果无法做到精确定位。推送结果是基于用户定制,实际上是对用户行为习惯的画像和输入语义的理解,因此信息反馈围绕理解和习惯展开,输出结果在精确度和全面性上都远胜检索。

为更直观展示检索和推送的区别,以三个实践案例为例:

【案例1】甲未经乙公司同意,以乙公司名义在网上开设乙公司旗舰店,并出售乙公司产品,获得利润,乙公司产品不涉及特许经营,甲出售产品不涉及假冒伪劣。乙公司得知后起诉法院,认为甲损害了自己的合法权益,案由为侵权。因立案登记制,法院受理该案,承办人收到案件后,认为该案应变更案由,但由于经验不足,遂希望通过信息查询获得答案。

方式一:类案检索

结果:因无法准确定位关键词,在裁判文书网上将无法快速搜索出类似案例,因此无法判断案由。

方式二:类案推送

结果:直接输入起诉书事实,系统自动匹配案情,在海量裁判文书中筛选相似案情案例,并以匹配度为标准,从高到低排列输出案例。

【案例2】法官A近日新收一起重大疑难复杂未成年人共同犯罪,审理中合议庭出现分歧,希望通过类案提供审判参考。

方式一:类案检索

结果:输入案由,结果反馈上百份同罪名裁判文书,但在查看过程中发现案情并不匹配,在翻阅了几十份裁判文书后,终于找到类似案例,但由于裁判结果没有说理,参考价值并不大,只能继续翻阅,试图通过定量分析,了解裁判趋势。

方式二:类案推送

结果:导入案件卷宗,系统通过案情匹配,自动筛选相似案例,根据相似度、同类判决两个因素进行排序,结果反馈为案情相似度降序和同类判决集合,进而通过定量分析,了解裁判趋势。

【案例3】兄弟二人共同故意杀人,基于传统“存留养亲”的刑事政策,承办法官想寻找类似案例,支持只判处一人死刑的判决依据。

方式一:类案检索

结果:输入“存留养亲”,出现文书样本有限或无匹配结果。

方式二:类案推送

结果:输入“存留养亲”,系统自动根据在先标签定义,推送相似案例,并按照审级进行排序。

(二)类案推送的人工智能属性

上文三个案例也许不能涵盖检索和推送的全部情况,但较客观反映了实践中检索与推送的差异。在应用场景中,类案推送的智能属性就在于做到了“照我说得做”到“自己看着办”的转变,主要表现为以下三个基本方面:〔4〕李智勇:《终极复制:人工智能将如何推动社会巨变》,机械工业出版社2016年版,第32-42页。

一是自动化的再升级。1946年,美国福特公司的机械工程师D.S.哈德提出了“自动化”一词,此后各种提高自动化程度的技术层出不穷,但就和传统软件一样,过去的自动化更多是处理能清楚界定边界的工作,对于边界不清晰、环境特别复杂的情形,则力不从心。在司法领域,类案检索系统也符合技术的自动化,具体表现为对关键词识别后的自动查询,但同自动化机械一样,这种自动查询的准确性同样依赖被清楚界定的关键词,否则无法实现目标结果的输出。而类案推送中的自动化要更加高级,系统的结果反馈并不依赖明确的指令,而能够通过对案情的识别,自主生成“主旨大意”,再以此精确匹配对应案例,最后输出目标结果。

二是大数据的分析挖掘。随着互联网、智能硬件的发展,司法领域的数据化程度也将越来越复杂,随着数据化程度加深,数据的不规则程度也将加深。庞大的数据量,不规则的数据格式,使信息整合成为人力不能及的复杂工程。相比于法官依据检索结果进行的样本数据分析,类案推送不仅能够对图片、文字、声音等数据进行识别,还能够进行超强的全数据处理,并基于技术和算法,从不规则的数据中挖掘有效信息,使输出的反馈结果与输入信息条件完全匹配。这一结果与检索最大的差别,就在于类案推送的语义理解机理,其中暗含的是交互技术、庞大数据和机器训练。

三是个性化定制。类案推送的个性化特征以自动化和数据分析挖掘为前提。个性化类案推送通过沉淀归纳与法官的交互数据,获取与法官相关的特征信息,构建用户模型,并根据用户自定义需求,在每次反馈结果时充分参考这些特征信息,使输出更加符合法官个人喜好和习惯,进而使法官获得更好的使用体验,同时类案推送引入的反馈流程可以及时调整修改法官偏好,〔5〕张德:《自然语言处理技术在司法过程中的应用研究》,载《计算机工程应用技术》2017年第7期。进而使类案推送的运用界面更加友好。

总而言之,类案推送与类案检索不同,是相比于类案检索更高级的形态,超级自动化、对数据的分析挖掘、个性化定制是它的基本功能。

三、应用现状:类案推送的现实障碍

2017年7月20日,国务院公布《新一代人工智能发展规划》,新规划提出促进人工智能在证据收集、案例分析、法律文件阅读与分析中的应用,实现法院审判体系和审判能力智能化。在这样的大趋势下,国内法律科技市场开始从“互联网+法律”向“人工智能+法律”转变,各地法院也开始积极布局人工智能法律科技,类案推送是其中重要部分。虽然目前多地法院都推出了基于人工智能的类案推送产品,但实践中却面临使用率不高、关联性不强、认同度不够等问题。制约类案推送运用的主要障碍是:

(一)传统办案理念中的法条依赖

我国属于成文法国家,尊重法条和司法解释已成为长久以来的审判传统,加之我国地域辽阔,人文传统各异,各地经济社会发展不平衡,审判活动往往结合当地实际展开,才能使裁判结果最大程度得到认可。推行已久的案例指导制度之所以效果不彰,〔6〕左卫民:《中国特色案例指导制度的发展与完善》,载《中国法学》2013年第3期。所面临的适用困境与类案推送有部分相似之处。但与案例指导制度不同的是,类案推送是各地主导研发的审判辅助产品,具有更强的灵活性,也就有更大的改善空间。

(二)司法需求场景的定位不清

通俗讲,产品是否畅销,很大程度取决于对场景的满足程度。实践中,大部分类案推送产品还很难满足法官的基本需求场景,主要原因在于没有在需求场景中合理考量法官的主观意愿,具体可以概括为以下三个方面:一是对类案推送期许过高,甚至认为可以成为法官办案的“替代品”;二是推送案例的关联度不够,海量裁判文书数据没有进行标签化处理,无法形成符合要求的“类案”样本库,对案件的匹配无法做到最大相似;三是推送案例的权威度不足,忽视审级、地域对裁判的影响,在同等情况下,没有做到优先推送本院、所属上诉法院的关联判决。

(三)人工智能技术瓶颈仍然存在

直至目前,不少法院都声称推出了基于大数据和人工智能的类案推送产品,但实践中,大部分法官并没有感受到类案推送有别以往审判模式的新颖和红利,人工智能的概念还停留在只有人工没有智能的层面,诸多类案推送产品,总体可以归纳为以下三种样态:

一是进阶版本的“类案检索”。具体表现为细分案由和拆分关键词,系统自检索时实际无法做到匹配具体案情,推送结果只能说是更“精确”的案件集,〔7〕实践中,多数法院开发的所谓“类案推送”系统就属于此种情况,功能作用并不比裁判文书网、北大法宝等数据库搜索更智能便捷。法官仍然需要通过人工筛查的方式,比对与承办案件的相似程度,导致实践中使用率不高。

二是弱人工智能下的初级推送。具体表现为卷宗数字化推进较慢,裁判要素提炼还需反复推敲,图像识别、语义理解技术无法准确抓取案件要素,因此类案推送仅能满足规范化、标准化操作程度高的部分简单案由,且在匹配过程中准确率并不高。

三是交互设计频繁的推送系统。类案推送设置的前提条件过于复杂,层级过多,法官需要不断细化筛选条件,对输出结果进行反馈,修正检索参数,多轮交互对话可能使结果更加精确,但也可能在每一次交互修正中都使关键词与原意产生偏离,最终导向完全不合格的输出结果。

综上,类案推送如果缺乏人工智能助力,就只能是类案检索的优化,筛选、比对的压力仍然要由法官承担,若想实现真正意义上的人工智能推送,必须突破识别、匹配上的技术壁垒。

四、推进思路:场景、数据、计算和人才

实现“人工智能+类案推送”,还需要解决很多问题,而场景、数据、算力和人才都是关键的突破口。

(一)场景:从问题需求到解决方案

“很多时候,人们喜欢的不是产品本身,而是产品所处的场景,以及场景中自己浸润的情感”。〔8〕吴声:《场景革命》,机械工业出版社2017年版,第10页。对司法工作者而言,无论何种辅助产品,一旦不能满足司法实践需求,就很难推广并发挥作用。目前的类案推送即面临这样的问题。将需求场景作为前提,明确类案推送需要满足的司法需求,才可以避免这一产品的研发陷于盲目。

办案场景的嵌入,就是要聚焦深耕类案推送场景和数据处理背后的整体方案,主要包括以下步骤:

1.细分需求场景。开发者应将视线不断下沉,从基层获取变革动力,场景是最真实的以人为中心的体验细节,因此在构成上要非常细致,时间、地点、人事、事件、连接方式等等,都是构成明确具体场景不可或缺的因素。

2.突出基础场景。类案推送应紧紧围绕身份定位、目的功能和正确途径展开,以法官为开发视角,产品使用应简单明快,符合司法规律和司法习惯。

3.健全环境场景。单点技术本身无法构成完整的应用产品,而需要与其他产品结合。类案推送是一系列行为的复合结果,技术突破固然重要,但数据分析加签工作同样重要,此外,为类案推送可持续发展而建立的规范、化标准化办案流程等,也是类案推送环境场景追求优化的方向。

(二)数据:从海量无序到清洁有效

需求场景为产品开发优化指明了道路,数据则为产品落地提供了前提。类案推送最终向法官呈现全面、精确、有效的相似案例,背后运作的则是一套在海量案例中进行全量检索的逻辑。因此,没有庞大案例库的支持,类案推送将无法实现精准。目前各地法院都在推动电子卷宗同步生成项目,然而电子卷宗是否意味着有效的数据呢?

众所周知,计算机对于数据的提取基于识别,而识别的前提是规范化和标准化。电子卷宗同步生成产生大量结构化数据、半结构化数据、非结构化数据、复杂结构化数据,千差万别的数据又给识别带来了新的难题。数据质量差是当前类案推送面临的重要难题。

提高数据质量,至少应做到以下五个方面:(1)标准化。对数据元素的定义和理解必须一致。(2)完整性。所有必须的数据都要存在并且录入。(3)精确性数据应缺地代表现实情况并且来源可靠。(4)有效性。数据的价值应处在可接受的范围内。(5)唯一性。数据不能多次重复出现。拥有高质量的数据,才能有大数据分析的基础,否则,数据非但无法发挥作用,反而会变成一项危险的累赘。

在提高数据质量的前提下,分析统计的科学精准依赖标签体系的完备,而在目前技术下,裁判文书的标签体系仍需历经人工标签、专家经验、实践反馈、数据迭代、标签优化的循环流程,才可能实现数据清洁有效。

(三)计算:从信息提取到知识图谱

个案裁判结果受利益和情感影响,法官的审判逻辑通常在不同情形下有微妙调整,类案推送如果只以表面审判活动的统一性为设计思路,将很难对辅助审判起到实质性作用。清洁有效的数据为类案推送提供了机器学习的前提条件,而如何通过机器学习实现信息提取到通用知识图谱的构建,关键在于认知技术的突破。

当前类案推送在“智能”领域最大的缺陷集中于理解、识别案情等“认知”行为。这种“认知”反映到类案推送的技术层面主要包括图像识别和语义理解,而不论是理解还是识别都应先解决三个基本问题:(1)识别能力。即裁判文书的可识别率,这一要求依赖对数据的清洁和标准化。(2)识别什么。即裁判文书中哪些因素是司法裁判的考量因素,例如案件事实、法律法规以及隐藏在裁判文书背后法官隐形的智慧和经验。(3)如何排列。即识别出了影响裁量的因素后,如何排列这些因素的权重,如何通过综合模拟,形成合乎一般司法审判逻辑的输出结果。

这就要求类案推送能够将裁判过程精确模型化,第一层次的图像识别需要能够真正抓取重要因素,进行拆解标注,进而在第二层次的语义理解和深度学习实现对不同情节案件乃至裁判法理的智能化区分和推送。当前,司法领域数据开放和整理的步伐相对缓慢,基础数据的不规范和算法对复杂理解能力的局限性,很大程度影响了数据分析的精确性和有效性,因此,目前仍旧需要人力与人工智能的结合,即由人设定方向,利用某种机器智能算法来获得结果,和目标进行匹配,并人工进行标注。可以预见,这一过程可能还需要迭代多次,才能达到最终目的。

(四)人才:从实际场景到目标场景

类案推送是基于法官需求场景而出现的职能产品,而场景设计本身是一个循环流程。(见图1)

图1 产品设计流程图

场景完善和切换关键在于有效反馈,然而目前类案推送在反馈完善机制上存在明显的不足,这一点深刻暴露出仅依靠技术专家推进系统研发工作的局限性以及研发与应用在互动互补上的有限性。这种缺陷使类案推送的应用场景无法向前更进一步:基于现有需求场景的类案推送研发,由于缺乏司法工作者的深度参与,无法真正满足实际需求,再加之研发与应用之间反馈机制的不完善,进一步导致类案推送的应用场景无法真正落地。

解决这一问题首要就是要解决好人的问题,而目前最为缺乏的是三类人才:

1.司法与技术的连接者。即能够解释供需双方各自期待的人,能够代表技术公司解释服务内容,能够代表司法机关向技术公司描述具体需求和场景。

2.法律与技术的跨界者。即了解人工智能技术原理,同时也理解司法裁判过程原理,并且能够利用目前技术,将法律文本拆解成机器训练所需知识的专门人员。

3.研发运用的反馈者。即在类案推送研发各个阶段,充分参与使用,并精准反馈使用体验和改进建议用户,类案推送必须坚持以应用开路,不断更新迭代,才能促进系统不断升级。

结语

场景思维、数据处理和科技进步使我们相信,在不远的未来,人工智能将与司法审判实现深度融合,诸如类案推送等由机器深度学习发展而来的人工智能产品,深嵌于智慧法院办案场景,并在每一次数据标准化、精准化、标签化的迭代中,促进司法能力和司法品质加速飞越,进而推动司法体制向着更加公平正义高效权威的方向不断迈进。正如雷·库兹韦尔在《奇点临近》一书中写道:“人类技术一直在加速进步。总有一天,我们人类一秒钟所造成的技术进步和对文明的贡献,将超过之前上万年所做的一切。”

猜你喜欢
类案裁判检索
类案检索制度在司法实践中的应用研究
牙医跨界冬奥会裁判
刑事案件类案检索机制研究——由解释学检视展开
裁判中存在“唯一正解”吗*——对《司法裁判中的道德判断》的批判性研读
类案同判的司法裁判方法分析*——以“类比的运用”为考察点
法官如此裁判
法官如此裁判
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
基于多尺度投影的相似颅骨检索