面向法律文书的自然语言理解

2022-09-28 10:24:34安震威来雨轩冯岩松
中文信息学报 2022年8期
关键词:法律文书罪名检索

安震威,来雨轩,冯岩松

(1. 北京大学 王选计算机研究所,北京 100871) (2. 国家开放大学 计算机学院,北京 100039)

0 引言

随着我国依法治国方略的实施,社会法治进程稳步前进,通过法律手段维护社会公平正义、维护个体权益已成为社会日常生活的重要组成。随之而来的,则是法律领域从业人员需要处理的案件量显著提升。据统计,我国各级人民法院一年受理诉讼案件总数已超过3 000万件[1],这对司法系统的稳定运行提出了巨大挑战。法律人工智能将人工智能技术应用于法律领域,可以在案件处理过程中为法律从业者提供智能化服务,提升其工作实效。因此,近年来法律人工智能技术受到学术界与产业界的广泛关注。

法律案件审理过程的各个环节记录都会用文字归档,相关法条法规及司法解释等官方文件也通常以文本形式呈现。这些以文本形式呈现的法律相关文档统称为法律文书。法律文书是实施法律的重要手段,忠实地记录着各类法律活动。在法律人工智能中,面向法律文书的自然语言理解技术有着较高的研究价值与广泛的应用前景。

自然语言理解技术在法律文书上有丰富的应用场景,如类案检索、智能辅助司法裁判以及司法问答系统等。

类案检索系统通过提供智能化的关键信息抽取服务和文书检索服务,减轻了法律从业者在处理法律文书方面的工作量,提升了整个司法环节的效率。不同于基于浅层文本匹配的文书检索系统,智能文书检索系统利用深度学习模型,引入法律要素、争议焦点等法律知识,理解法律文书的深层语义信息,能够提供更为准确和个性化的检索结果。

在司法裁判过程中,智能辅助系统可以提供包含推理过程、可解释的判决预测结果,并附上相关统计分析数据,为法官提供有价值的参考信息,提高其工作效率,维护司法公正。

司法问答系统可以为更广泛的人群提供法律咨询服务,让普通群众无须掌握专业的法律知识,也无须支付高昂的法律咨询服务费用,依然能够便捷地了解和学习法律知识,同时也降低了普通群众运用法律维护自身权益的门槛。

自然语言理解技术在法律文书上的应用场景主要涉及法律文书信息抽取、类案检索、司法问答、法律文书摘要和判决预测五个任务。本文在第1节系统地介绍了这些任务的形式,研究现状及难点。在第2节中,本文针对处理法律文书面临的主要技术挑战展开了深入分析和讨论,指出目前主要的挑战包括: ①处理法律文书中的语言与日常生活语言间的表述差异性; ②建模法律文书中特有的推理与论辩内容; ③将法条、推理模式等法律知识融入自然语言理解模型的学习和预测过程。

法律文书一般指具有普遍约束力的规范性法律文件(法律法规等)以及由国家司法机关、律师等依法制作的具有法律效力的文件。表1展示的刑事案件判决书就是一种常见的法律文书。不同于日常生活中常见的文本,法律文书通常为半格式化文本,具有一定的结构。例如表1的案件判决书包含案情描述、法庭判决、相关法条等章节。在内容上,法律文书以叙议为内容主体,具有层次分明的论辩结构,并含有大量法律概念。这些特点要求面向法律文书的自然语言理解模型能够处理法律文书的常见结构,理解法律概念,甚至应对一些推理任务。

表1 刑事案件判决书示例

1 自然语言理解在法律文书中的应用

学术界针对自然语言理解在法律文书领域的应用已经开展了一系列的研究,主要集中于法律文书的信息抽取、类案检索、司法问答、法律文书摘要和判决预测五个方面,并取得了一系列研究成果。

1.1 面向法律文书的信息抽取

面向法律文书的信息抽取任务需要从非结构化的法律文书中提取结构化信息。该任务可以提取关键角色、抽取法律要素、还原事实经过,从而直接帮助相关人员快速查阅、厘清案件信息。法律文书中抽取的结构化信息对自然语言理解在法律文书上的其他应用任务也有所帮助,如利用法律要素辅助判决预测(Hu等[2],Zhong等[3])。相比于通用文本上的信息抽取,面向法律文书的信息抽取除了关注命名实体识别、实体链接、关系抽取、事件抽取等基础信息抽取任务外,更需要关注法律要素抽取。

1.1.1 基础信息抽取

目前,针对法律文书的基础信息抽取研究表明通用语料上的信息抽取技术可以在法律文书上取得较好的效果。在法律本体抽取任务中,Bruckschen等[4]和Zhang等[5]通过命名实体识别方法实现法律本体库构建和扩展。Cardellino等[6]指出直接在通用语料(如维基百科)上训练的命名识别模型用于法律文本中,会有过拟合导致的性能下降,而通过课程学习方式可以缓解这一问题。Wang等[7]基于预训练语言模型,在包含上万篇巴西法律文书的数据集LeNER-Br上取得了0.93的F1值。对事件抽取而言,针对法律文书的事件抽取研究沿用ACE[8]的任务形式,抽取法律文书中的事件和事件相关论元。Shen等[9]定义了拘留、逮捕、偷窃、抢劫、故意杀人等11种诉讼法和刑法相关的事件类型和26个事件相关论元(故意杀人-受害者,故意杀人-原因等),基于注意力机制进行事件抽取,在论元识别任务上取得了0.90的F1值。

1.1.2 合同要素抽取

合同是一类重要的法律文书。由于商业公司、政府机构对合同分析的巨大需求,合同要素抽取受到了广泛的关注。

Chalkids等[10]分析了商业合同的固定结构(包括标题,合同当事人,主要内容等),抽取了起止日期、合同期限、引用法条等11种合同要素。Chalkids等[10]指出合同要素与合同结构有紧密联系,并利用手工制定的规则特征抽取要素,取得了0.80的F1值。在随后的工作中,Chalkids等[11]发现深度学习模型可以进一步提升合同要素抽取的效果,Wang等[12]将单领域合同要素抽取扩展到包括私人合同和商业合同在内的多个领域。

1.1.3 法律要素抽取

法律要素主要指裁判文书中可能影响裁判结果的关键信息,如劳务合同报酬纠纷案例中是否存在劳务关系、交通肇事案例中被告是否为酒后驾驶。在刑事案件中,法律要素通常指犯罪构成要件[13],构成要件是刑法规定的对行为的社会危害性及其程度具有决定意义的并且为该行为成立犯罪所必须的事实特征。在罪名预测任务中,法律要素不仅能提供具有判别性的弱监督信息(Hu等[2]),还能为模型提供良好的可解释性(Li等[14])。民法中没有对法律要素的明确定义,其法律要素一般指法律文书中事实描述部分的关键信息,如Li等[15]将婚姻法案例中的法律要素定义为婚姻状态、子女个数等关键信息。

Shu等[16]提出了涉及婚姻家庭、劳动争议和借款纠纷三个领域的法律要素抽取数据集CAIL2019-fe(示例见表2),该数据集要求模型识别出给定事实描述中的法律要素。Zhong等[17]在该数据集上尝试了多种深度学习模型(CNN[18]、DPCNN[19]、BiDAF[20]等),均取得了超过0.70的F1值。

表2 CAIL2019-fe示例

现有的法律要素抽取任务只针对单一段落抽取要素,如CAIL2019-fe。事实上,很多法律要素的确定可能需要综合多段落信息。如在“海商法”领域,海上货物运输无单放货纠纷案例中的“原告主体资格认定”,不仅需要原告提交证据证明存在被告无单放货事实以及其遭受的损失,还需要证明原告是否是合法的提单持有人,前者通常出现在质证段落,而后者通常隐含在事实陈述段落。这类法律要素抽取任务还需后续工作的进一步探索。

1.2 类案检索

类案检索的任务目标为对于给定的待检索案例,从案例库中找出与其最相关或相似的案例并返回给用户。在判例法国家,法院在审理案件时,依照“遵循先例”的原则,将先前的相似判例作为审理和裁决的依据。因此,了解相似案例是律师在开庭前需要做的一项重要准备。在成文法国家,相似案例也是司法从业人员了解裁判依据和尺度、或准备辩护策略的重要参考信息。

类案检索与常见的网页检索有很大区别。首先它的用户是掌握专业法律知识的法律工作者,其次它的检索结果通常为半结构化的法律文书[21]。更重要的是,法律文书相关性定义与通常意义上的文本相似性定义有很大区别,Opijnen等[22]认为法律信息检索中的相关性应该涉及主题、法系以及用户需求等多个维度;在中国的法律体系下,Ma等[23]认为类案检索应该考虑相关法条、争议焦点以及基本事实三个方面,这一观点也体现在《最高人民法院关于统一法律适用加强类案检索的指导意见(试行)》(1)http://lawdb.cncourt.org/show.php?fid=152311中。Shao等[24]探究了类案检索系统的用户行为,认为相比于网页检索,类案检索系统用户倾向于花费更长的时间以满足其需求,并且任务难度会显著影响用户的行为。

现有的类案检索数据集可分为判例法数据集(Case Law Collection[25],COLIEE 2020[26])和成文法数据集(LeCaRD[23])。这些数据集包含若干待查询案例,并在案例库中标注出了与每个查询相关的案例。LeCaRD增加了争议案例(二审对一审结果改判),作为复杂查询以更好地模拟真实场景。

基于文本相似度的检索方式仍然是现阶段法律案例检索的主要方法。BM25[27]、TF-IDF[28]等基于词语匹配的方法常常被用作基线模型[23]。Tran等[29]借助法律文书摘要技术,首先获取法律案例的摘要,然后计算查询案例与候选案例文本(含摘要)之间的词汇重叠度,以此衡量案例文本之间的相关性。近年来,利用法律文书的特点和法律知识的法律案例检索吸引了很多研究者的注意。Sugathadasa等[30]利用法律案例中对其他案例的引用信息和案例文本自身信息将案例文本向量化,进而利用向量相似度构建法律案例检索系统。Shao等[24]提出计算法律案例文本相似度时应该考虑法律文书的结构,利用查询案例与候选案例各个段落间的交互信息计算法律案例之间的相关性。

法律案例检索任务中相关性定义与法律文书本身的特点密不可分,这也是其与传统文本检索任务的主要区别。对于检索范式的思考和探究也是法律案例检索发展的新方向。Liu等[31]探究了对话式检索的应用前景,这一方式允许用户在检索过程中与检索系统进行多轮交互。Liu等[31]得出与传统的检索范式相比,对话式检索的用户满意度较高、检索时间成本更低。但如何实现一个自然、高效的智能对话系统接口,仍然是一个巨大的挑战。

1.3 司法问答

司法问答需要以法条、裁判文书等各类法律文书资源为依据,回答用户以自然语言形式提出的问题。司法问答系统可以为客户在法律事务上提供解释、建议或者解决方案。与开放域问答相比,司法问答需要结合法律知识,得到答案的推理过程需要遵循法律推理逻辑。

现有的司法问答任务可以分为面向普通群众的问答和面向司法从业者的问答。关于隐私条款的问答是面向普通群众的问答任务之一,隐私条款用于说明产品收集、使用、分享和管理用户数据的方式,但其篇幅较长且结构复杂,给用户阅读带来很大困难。Ravichander等[32]提出了关于隐私条款问答的数据集PrivacyQA,收集了“该产品是否会收集我的健康数据”等用户关注的问题,其答案为隐私条款中与问题相关的原文。Ravichander等认为对于PrivacyQA中的问题,模型首先需要预测问题的可回答性;对于可回答的问题,模型采用机器阅读理解的任务形式,从隐私条款中找出能够回答问题的语句。

近年来,有更多研究者关注面向司法从业者的问答任务,其中以面向法律资格考试的问答为主,如COLIEE比赛[33]使用日本法律资格考试中的选择题作为赛道数据,数据集JEC-QA[34]收集了中国国家司法考试的试题。表3为中国国家司法考试问题与答题思路示例。

表3 面向司法从业者的问答示例(引用自文献[29])

在COLIEE比赛中,司法问答被分为相关法条检索和法条蕴含判断两个任务。相关法条检索任务要求模型从法条库中检索出与给定问题相关的法条。Carvallo等[35]利用法条与问题的词根特征进行检索;为了解决法条文本的多段落问题,Do等[36]将含有多个段落的法条拆分为多个法条,使用TF-IDF、欧式距离等特征检索法条。Kien等[37]使用CNN和注意力机制计算法条和问题之间的相似度。

法条蕴含判断任务要求判断是否可以根据相关法条中的内容回答给定问题,早期的工作使用基于规则的方法(Kim等[38])判断蕴含关系,Carvallo等[35]抽取浅层语义特征,基于机器学习文本分类方法作出预测。Do等[36]和Kim等[40]在检索相关法条的基础上,采用深度学习文本分类模型。此外,有研究者也引入了法律知识,如Fawei等[41]提出一套能够自动抽取法律本体的方法论,以此支持蕴含判断。

1.4 法律文书摘要

法律文书摘要是文本摘要在裁判文书上的应用,旨在用精炼的话语总结裁判文书中的主要内容和关键信息。司法从业者常常需要阅读数以百计的裁判文书,并且大部分裁判文书长达数十页。法律文书摘要能够帮助司法从业者快速了解法律文书的关键信息,使其免于繁重的文书工作。

作为法律文书摘要的主要研究对象,裁判文书具有很多不同于其他领域文本的特点: 首先,裁判文书通常情况下显著长于其他常见领域的文本(如新闻等)。其次,裁判文书具有固定且鲜明的层次结构,并且包含丰富的法律概念和词汇。此外,法律领域的专业性要求法律文书摘要必须包含法律依据等法定措辞。为了更完整地保留原文中的法定辞令,现有的研究多基于裁判文书的篇章结构进行抽取式摘要。

裁判文书通常按照特定的结构组织内容。例如表1所示的刑事案件判决书包括当事人信息、案情描述、法庭判决、相关法条等内容。将裁判文书按照一定的篇章结构划分为若干组不同的句子(篇章结构标记),然后从每组句子中选出最具有代表性的一句话(摘要句选取)组成摘要,是当前法律文书摘要的主要研究思路。

早期研究者们多使用语言学特征标记篇章结构和选取摘要句。Groover等[42]和Farzindar等[43]选用关键字、时态、词性等特征,Wagh等[44]加入了文本位置特征。

近年来,有学者认为法律知识对于法律文书摘要有重要的指导意义,Bhattacharya等[45]依据法律专家对法律文书的分析,为单词、句子等设计不同的权重,使用整数线性规划标记篇章结构和选取摘要句。作为一种无监督文本摘要方法,Bhattacharya等[45]的实验效果超过了基于BERT的有监督文本摘要方法。Duan等[46]在针对法庭辩论记录文本的摘要中,引入争议焦点信息,将法庭辩论记录划分为若干组围绕争议焦点展开的句子,然后再标记争议焦点和选取摘要句。Duan等[46]认为在庭审过程中,争议焦点是辩论双方争论的主要问题,整场法庭辩论通常是围绕若干个争议焦点展开的。如在借贷纠纷案例中,常见的争议焦点包括原告和被告之间是否存在借贷关系、放款人是否履行了放款义务。实验效果上,Duan等[46]的方法显著好于其他抽取式文本摘要方法。

Bhattacharya等[45]和Duan等[46]的研究表明法律知识的引入能够有效提升法律文书摘要的效果,这也说明以恰当的方式引入法律要素、争议焦点等法律知识是法律文书摘要研究的重要发展方向。

1.5 判决预测

判决预测任务旨在根据案情描述,寻找适当的法律依据,做出合理的裁判结果。判决预测的任务形式和任务内容因为民事纠纷和刑事案件的差异各不相同,在刑事案件方面,常见的法庭判决内容包括罪名、刑期、罚款数额等;在民事领域,判决预测关注诉讼双方的诉讼请求是否被支持以及所依据的法律条文等。由于判例法和成文法的区别,一些国外研究者不对民事案件和刑事案件做直接区分,只关注于法官在法庭中的行为。

1.5.1 刑事案件的判决预测

在刑事案件方面,判决预测系统的输入为案件的事实描述,输出包括该案件所适用的罪名、刑期以及判决依据的法条。因此,对刑事案件的判决预测常常被定义为一个文本分类任务。

早期研究基于语言学特征和规则进行文本分类。Liu等人[47]选取了台湾地区法律中常见的12个罪名,利用基于关键词的规则获取案例中的句法和语义特征,使用KNN作为分类器预测罪名。

随着深度学习在自然语言理解领域的广泛应用,以及互联网上大规模裁判文书数据的进一步公开,研究者开始使用深度学习模型进行判决预测。如Luo等[48]使用Bi-GRU编码事实描述和法律文书,结合注意力机制预测罪名。

除了罪名预测外,研究者也关注对刑期、罚款金额、相关法条等判决内容的预测。Chen等[49]在神经网络模型中加入门控机制,过滤与判决无关的特征,从而预测刑期。值得注意的是,刑事案件判决的各个内容之间并非相互独立,例如,刑期通常会与罪名有着较强的关联,因此很多研究者使用多任务学习的模式同时对多个判决内容进行联合预测。Zhong等[50]使用有向无环图(Directed Acyclic Graph, DAG)建模法条预测、刑期预测、罪名预测之间的拓扑关系,使用多任务学习的模式同时预测多个判决内容。在Zhong等[50]基础上,Yang等[51]设计了更精细的拓扑结构捕捉子任务之间的依赖关系。在多任务学习的基础上,Yue等[52]认为在判决过程中,定罪与量刑分别依据事实描述中的不同内容,应将其区分对待。

1.5.2 民事领域的判决预测

民事领域的案件描述通常包括事实描述、原告诉讼请求、被告抗辩,以及证据提交情况等多种内容。在文本长度上,民事案件文本显著长于刑事案件文本。民事领域的法庭判决常常与诉讼请求相关,体现为是否支持原告的诉讼请求或在多大程度上支持诉讼请求。

目前在民事领域判决预测的研究一般关注于特定的法律领域,如婚姻法、合同法等。Li和Zhang等[15]使用正则表达式,结合人工规则抽取婚姻纠纷案件中的法律要素,随后使用马尔可夫逻辑网络预测婚姻法中常见的判决内容,如是否同意离婚、子女监护权归属等。在Li和Zhang等[15]的工作中,法律要素和人工规则的设计都需要相关领域法律专家的深度参与,这使得模型具有较好的可解释性,但同时丧失了对其他民事案由的泛化能力。Long等[53]将民事领域判决预测任务定义为问答任务,以原告诉求为问题,以事实描述和相关法条为参考文本,使用机器阅读理解模型进行判决预测,即判定原告的每一条诉讼请求是否应该得到支持。相比于Li和Zhang等[15],Long等[53]提出的方法不深度依赖于领域专家制定细粒度的规则或模板,因而具有更好的泛化能力。

1.5.3 国外判决预测研究

目前判例法国家的研究者主要关注于预测法官对于案件的意见以及法庭判决,这些工作的研究对象一般限定于特定法庭的法律案例。Aletras等[54]以欧洲人权法庭(European Court of Human Rights)中的案例作为研究对象,使用案件文本的N-gram特征和主题特征,预测某个案件是否违反相关法条。Katz等[55]使用法官对案件标记的下级法院意见、初审法庭、案件来源等以类别标签为主的特征,预测美国最高法院法官对下级法院判决的意见。

1.5.4 判决预测中的难点

现有判决预测研究已经取得了较好的进展,然而判决预测距离实际应用还面临着很多困难,其中对于判决的可解释性和案件类别分布不均衡是最突出的两方面。

可解释性可解释的判决预测研究旨在提供司法从业者可理解的预测解释,以支撑模型预测结果的实际应用。现有研究致力于将模型的预测过程可视化,为模型的输出提供解释根据,从而避免预测结果不可解释的黑箱现象。Liu等[56]将罪名预测视为一系列的决策过程,将事实描述以句子为单位依次输入模型,模型在每一步输入进行决策,当模型认为收集到足够多的信息时,就会输出罪名预测的结果,而模型在预测过程中充分重点关注的句子则被视为其决策依据。Jiang等[57]使用短语级的决策依据,将案情文本划分为长度为6个字的短语序列,然后将可以支持罪名预测结果的短语作为决策依据。除了直接从原文中抽取决策依据,Zhong等[3]使用法律专家设计的法律要素作为决策依据,如案件中是否与交通相关、是否出现饮酒情节等。模型首先从事实描述中抽取相关法律要素,然后综合利用法律要素和案情描述进行罪名预测。

案件类别分布不均衡在现实生活中,不同案由的案件数分布并不平衡。以Hu等[2]针对中国刑事案件的统计数据为例,最常见的10个罪名(如盗窃罪,故意伤害罪和交通违规罪等)覆盖了78.1%的案例,然而最不常见的50个罪名(如倒卖文物罪、扰乱法庭秩序罪和偷税罪等)只覆盖了不到0.5%的案例数。对于少样本标签,常见的机器学习模型很难从有限的训练样本中学习到对预测这些标签有用的特征。任务少样本标签因此成为判决预测中亟待解决的问题。

目前针对少样本标签的研究仍然有限。Hu等[2]通过多任务学习的模式同时预测法律要素和罪名,提高了模型在少样本罪名上的预测效果。He等[58]发现使用胶囊网络编码案情描述文本对罪名预测中的少样本标签有所帮助。

2 主要挑战

综上所述,面向法律文书的自然语言理解研究已经在多种任务上取得了显著进展,部分技术已被应用于法律文书检索、法律智能问答等应用场景中。在提高司法效率、维护司法公正方面,面向法律文书的自然语言理解还有更大的研究和应用潜力,同时也面临着困难和挑战。例如,法律案例检索需要模型理解案件中的争议焦点,结合法律知识和语义信息计算案例间的相似性;判决预测模型需要给出符合逻辑、有说服力的判决依据。目前基于法律文书的自然语言理解研究面对的主要挑战可以归纳为三点: ①如何处理法律文书中的语言表述与日常生活中语言表述的差异性; ②如何理解法律文书中的论辩说理内容; ③如何将法律条文、推理模式等法律知识融入自然语言理解模型中。

2.1 如何处理语言差异

法律文书中的语言表述与日常生活中的语言是具有显著差异的,这是应用已有自然语言理解技术处理法律文书所面对的首要困难。这种差异主要表现为词汇表述差异和篇章结构差异。

就词汇而言,作为规范性法律文件,法律文书包含大量专业词汇。如表4所示,司法判决书的法院判决部分包含“船舶优先权”“工资债权”“劳务合同纠纷”等多个法律概念,理解这些概念对理解法律文书至关重要。此外,判决书中的事实描述部分以及法律咨询中的问题多采用口语化的表达方式。将法律概念的专业化表述与口语化的表达关联起来就显得至关重要,如表3中,“150万元假钞从国外运回中国”与“走私假币”和“运输假币”两个罪名是密切相关的。

表4 民事案件判决书(法院判决部分)示例

法律文书的行文组织与其他开放域文本存在较大区别。如第1节所述,法律文书通常为半格式化文本,遵循一定的行文组织结构。如民事判决书一般包含原告诉求、原告诉称、被告辩称、法院查明、法院判决等多部分内容,这些内容按照特定的法律逻辑组织后呈现在判决书中。因此,法律文书中的篇章结构通常比新闻、影评等常见文本中的篇章结构更为复杂。

预训练语言模型为解决语言差异提供了一种可能的解决方案。Chalkidis等[59]探究了BERT[60]迁移到法律领域的多种方式,得出通过法律语料进一步微调BERT或者在法律语料上重新训练BERT均能在自动判决预测、合同命名实体识别等法律文本理解任务上发挥更好的效果。Xiao等[61]提出了面向中文法律文书的预训练语言模型Lawformer。Lawfomer将在通用文本上预训练好的语言模型,在大量法律文书上进一步训练,这使得Lawformer能够更好地理解法律专有词语。基于Longformer的滑动窗口注意力机制[62],使得Lawformer能够处理长度超过512词的文本,从而具有一定理解复杂篇章结构的能力。实验表明,Lawformer在判决预测、法律案例检索等任务上的表现均优于BERT[60]、RoBERTa[62]等通用预训练语言模型。

2.2 如何做到“以理服人”

在司法裁判文书中,法官会记录完整的审理过程和结果,包含法官做出判断的推理过程、所使用的法律依据、以及最后的裁判结果。刑事案件的裁判文书中包含从案情描述到犯罪要件的推理过程,民事案件的裁判文书中则包含从事实描述和相关证据到对诉讼双方诉讼请求的判决结果的解释。可以看到,法官希望在裁判文书中明确地“说理”从而达到“以理服人”的效果。基于深度学习模型的决策过程往往与人类的思维逻辑有所不同。有学者认为法律人工智能模型在给出各种判决或者预测的同时,应当给出符合人类逻辑的解释[64],这就要求研究者引导模型依据法律知识进行推理,做到“以理服人”。

在法律问答任务中,问题和答案之间的关联可能包含多步推理,这需要模型运用法律知识给出从问题到答案的推理过程,提高模型输出的可解释性和可信程度。如在表3所示案例中,系统需要先从事实描述中分析嫌疑人触犯了走私假币罪和运输假币罪,然后对比两种罪名的刑期区间,最后才能依据“想象竞合原则”从重定罪。

部分研究者使用一阶逻辑来实现基于法律知识的逻辑推理,如Li等[15]在抽取婚姻法案例的关键要素后,使用马尔可夫逻辑网络完成从法律要素到诉求判决之间的推理。Li等[14]在获取刑事案件中的主观要件和客观要件后,使用一阶谓词演算完成犯罪要件到罪名之间的推理。一阶逻辑作为最直接的显式推理形式,能够为判决预测系统提供良好的可解释性,但需要法律专家设计基于相关法律知识的推理规则,这一过程复杂并且代价高昂。

因此,更多的研究者使用深度学习模型进行隐式推理。Liu等[56]和Jiang等[57]在罪名预测的过程中,找出能够支持判决预测结果的句子或短语,将其作为最终判决预测的决策依据;根据决策依据预测罪名,也可将其视为一种基于文本内容的推理模式。近年来,还有学者尝试依据犯罪构成理论来指导模型进行推理。犯罪构成理论是中国刑法学界的基础理论,它规定任何一种犯罪的成立都必须构成四个方面的要件,即犯罪主体、犯罪主观方面、犯罪客体和犯罪客观方面。Li等[14]依据双层犯罪构成理论,将罪名预测任务分解成主观要件预测与客观要件预测两个子任务,最后根据子任务的输出结果预测罪名。Hu等[2]基于犯罪构成理论为每个罪名设计了相关的法律要素。

法律文书的说理部分通常都包含复杂的论辩结构,如何准确解析或生成论辩结构也是我们需要面对的重要挑战。例如,在民事案件裁判文书中,通常都会列出案情经过、原告方与被告方的诉求或抗辩内容以及对提交证据的质证过程,其中蕴含着双方争议的焦点,以及法庭是如何认定基本事实、基于何种法律依据、做出怎样的裁决等重要信息。理解裁判文书中的推理逻辑能够帮助深度学习模型更好地完成下游任务。Duan等[46]在法律文书摘要中,使用角色特征(法官、原告、被告、证人)编码文本,并将论辩过程按照争议焦点聚类。Long等[53]通过将罪名预测任务定义为机器阅读理解任务,直接抽取〈事实描述,诉讼请求〉和〈事实描述,相关法条〉之间的交互关系。Ma等[65]在判定民事案件的诉讼请求是否应该满足时,对原告诉称、事实描述和被告辩称之间的交互关系建模,进而提升判决预测效果。

加强对法律文书的推理和论辩结构的研究能够为法律人工智能模型提供良好的可解释性,因而是法律人工智能走向实际应用所必须要面对的挑战。

2.3 如何引入法律知识

法律知识对于单纯数据驱动的自然语言理解模型有着至关重要的作用,不但可以提高模型性能,还可以指导模型避免数据自身带来的偏差。这里所指的法律知识包括但不限于法律理论、法律条文、指导案例等。

法律知识的多样性也决定了在深度学习模型中融入知识是极具挑战性的。此前,Luo等[48]利用法条信息作为法律依据提高罪名预测任务的性能。Li等[14]利用双层犯罪构成理论预测判决结果。法律条文和法律理论是明确的法律知识,同时,领域专家总结的法律要素和法律本体也可以作为法律知识,Hu等[2]在罪名预测时,设计与罪名相对应的法律要素作为法律知识,提高模型的预测效果。

我们注意到法律知识的表达形式多样,具体应用时,首要困难是如何利用计算机可读的方式来表示法律知识。法条一般以非结构化文本的形式呈现,Luo等[48]将法条作为普通文本字符串; Zhong等[66]从法条中提取出预测罪名所需要的关键要素,如犯罪动机、犯罪行为等,并进一步利用这些要素辅助法条预测任务;除了直接利用法条文本外,Wang等[67]在罪名预测过程中利用了法条之间的层次关系,Li和Zhang等[15]将法条拆解成一阶谓词逻辑的形式。在多种法律知识的表达形式中,无论是法律要素还是一阶谓词逻辑都离不开领域专家的设计和标注,其中使用一阶谓词逻辑来表示法条内容是最为精确的,但是成本高昂。此外,语言表述上的差异可能会导致规则的匹配困难、可扩展性差, 如 “一年级小孩”与“未成年人”之间的关联;而且一旦有法条更改,就要重新手工修订相关规则。而如Luo等[48]直接使用法条文本,虽然不需要专家设计规则,但无法保证模型能够正确使用法条文本中的法律知识。

如何使自然语言理解模型运用法律知识是现阶段法律知识引入研究的第二个困难。在罪名预测任务中,联合优化多个相关子任务可以提升罪名预测效果。Zhong等[50]使用多任务学习的方式将法条预测、刑期预测、案由预测等关联内容联合优化,以建模罪名、法条之间的隐含关联知识,从而提升判决预测的性能。使用犯罪构成理论将端到端的罪名预测任务拆解成多个子任务能够有效引导模型关注裁判文书中与法律知识相关的内容,Li等[14]利用双层犯罪构成理论设计模型,将模型分为客观要件抽取模块、主观要件预测模块以及推理模块三部分,进而提升模型对法律知识的关注度。另一方面,引导模型重点关注如何区分相似罪名等复杂案例的判决有利于模型学习关键法律知识,如区分抢劫罪和抢夺罪的一条关键知识为“是否携带凶器”,Xu等[68]在利用法条信息预测罪名的过程中,通过区分相似法条使模型积累了更准确的法律知识。研究者需要有针对性地设计融合模式才能更好地向现有自然语言理解模型中引入法律知识,进而提升各项任务的效果。同时,需要注意到,尽管现有方法能够引入一些法律知识,但仍无法摆脱对精细化专家标注的依赖,并且,对于实现可扩展的法律推理过程也无能为力。

3 总结

本文简要总结了近年来自然语言理解技术在法律领域的应用情况。梳理和归纳了法律信息抽取、类案检索、司法问答、法律文书摘要和判决预测五个主要任务的研究现状,并总结了其所面临的主要技术挑战。

在司法智能化的未来,法律人工智能在普通用户法律咨询以及法院、检察院及律师事务所等专业场景下有着巨大的应用潜力。目前基于法律文书的自然语言理解方兴未艾,但迈向大规模实际应用还面临着许多困难,如细粒度地解析论辩文本、合理有效地运用法律知识、提供可解释可信赖的预测结果等。解决这些问题仍需要更多研究者的参与。

猜你喜欢
法律文书罪名检索
2019年第4-6期便捷检索目录
法律文书教学的多维透视
刑法罪名群论纲*
法律文书写作问题刍议
重新认识滥用职权和玩忽职守的关系*——兼论《刑法》第397条的结构与罪名
刑法论丛(2016年2期)2016-06-01 12:14:25
专利检索中“语义”的表现
专利代理(2016年1期)2016-05-17 06:14:36
论法律文书说理——以司法体制改革为背景的考察
法学与实践(2015年1期)2015-12-01 03:41:07
减少死刑的立法路线图
减少死刑的立法路线图
对法律文书格式的法理学思考