基于LSTM网络的法院案件智能推理分析系统研究与实现

2023-04-29 00:00:00赵永翼,魏晓东

摘要:当前法院案件数量持续增加,而法官员额固定不变。为提高法官的办案效率,利用计算机相关技术帮助或辅助法官对案件进行推理分析,是解决案件繁重的有效途径。为解决上述问题,在详细分析现有神经网络模型及相关算法的基础上,使用Word2Vec对案件样本进行向量化处理,利用长短时记忆算法创建了案件智能推理辅助分析模型。首先介绍系统的各个组成部分及其实现逻辑和算法处理过程,而后对案件样本进行训练生成智能推理辅助分析模型,最后参考案件笔录对案件进行辅助分析得出推荐结论。系统结合房屋租赁合同纠纷案例对案件推理分析结论被采纳的情况进行了评估,通过实际使用和测试,案件推理分析结论被法官采纳的有效率达到80%左右,有效地提高了法官的办案效率。

关键词:长短时记忆算法; 案件智能推理; 神经网络; 数据挖掘

中图分类号:TP391.3文献标志码:A

doi:10.3969/j.issn.16735862.2023.04.004

Research and implementation of an intelligent reasoning and analysis system for court cases based on LSTM network

ZHAO Yongyi1, WEI Xiaodong2

(1. Software College, Shenyang Normal University, Shenyang 110034, China;

2. Law School, Liaoning University, Shenyang 110136, China)

Abstract:With the continuous increase in the number of court cases and the fixed number of judge positions, in order to reduce the workload of judges and improve their efficiency in handling cases, the only effective way to solve the heavy workload of cases is the use of computer related technology to assist judges in thinking. To solve the above problems, based on the detailed analysis of existing neural network models and related algorithms, we use Word2Vec to vectorization the case samples, and use long short-term memory(LSTM) algorithm to create a case intelligent reasoning auxiliary analysis model. Firstly, the various components of the system, their implementation logic, and algorithm processing are introduced. Then, the case samples are trained to generate an intelligent reason-assisting analysis model, and combined with the case records, the case is analyzed to draw recommended conclusions. The system evaluated the adoption of case reasoning and analysis conclusions in combination with housing lease contract disputes. Through the practical use and testing, the effectiveness rate of the case reasoning and the analysis conclusions being adopted by judges achieve about 80%, effectively improving the efficiency of judges in handling cases and other issues.

Key words:long short-term memory algorithm; case intelligent reasoning; neural network; data mining

由于法院案件逐年增加,但法官员额固定不变,人均案件数量持续增加,法官的工作压力越来越大。在体制方面暂时无法彻底解决的情况下,任何非裁判决策智能的辅助工作都不会从实质上提高司法效率。所谓结案是法官对案件结果的决策完成,这是思考的过程,是脑力工作的结果而不是体力工作的结果,是思维工作的结果而不是感知的结果,所以只有从根本上帮助或辅助法官对案件进行推理分析,才是解决案件繁重的有效途径。

从深度学习的发展来看, 1986年, Hinton[1]在总结了传统词袋模型忽略的词语顺序信息及没能很好解决数据稀疏问题的基础上提出了词向量的概念。 词向量是指把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中, 每个单词或词组被映射为实数域上的向量。 CBOW(continuous bag-of-words),Skip-gram等神经网络语言模型是逻辑上的方法, Word2Vec是实现CBOW和Skip-gram的工具。 Word2Vec利用CBOW和Skip-gram这2种训练模式可实现词嵌入[2]。

适合自然语言处理的神经网络模型有很多,其中,比较常用的包括递归神经网络(recurrent neural networks, RNN)、卷积神经网络(conrolutional neural networks, CNN)、长短时记忆(logn short-term memory, LSTM)和注意力机制(attention)等。LSTM与RNN同属于循环神经网络,但是当输入序列过长时,RNN的权重矩阵要循环相乘就会产生梯度消失和梯度爆炸的问题,因而RNN不能解决长期依赖问题,而LSTM的记忆长短期信息的能力正好解决了这一问题[34]。

因此,本文通过对案件陈述中词向量的生成,结合长短期记忆神经网络模型,创建了法院案件智能推理辅助分析模型实现对房屋租赁案件的辅助推理分析,从而提高法官的办案效率。

1系统结构

基于神经网络的法院案件智能推理辅助分析系统(图1)主要分为4个步骤。

1) 词向量转换。主要利用Word2Vec使案件样本中文本内容简化为向量空间中的向量,并计算出向量空间上的相似度来表示文本语义上的相似度。

2) 案情训练规则。根据《中华人民共和国民法典》中相关法律条款制定出判断规则。

3) 案件推理模型训练。 将案件样本中的句子中的每一个词, 通过词向量转换形成词向量, 按照案件样本句子为单位形成新的词向量句子, 这些句子成为神经网络LSTM模型的输入, 输出则是所需要的基于案件样本所得到的案件和案件结论所形成的关系矩阵。 这些关系矩阵是案件智能分析的基础。

4) 案件智能推理分析。将案件陈述和笔录内容进行词向量转换,根据查询推理训练模型中的关系库,形成对照并进行相似度计算,从而形成智能推荐的过程。

2主要功能及算法

2.1词向量转换

词向量转换主要基于Word2Vec来实现。Word2Vec工具主要包含2个模型:连续词袋模型(continuous bag-of-words, CBOF)和跳字模型(Skip-gram)。二者的区别在于,CBOW是根据上下文去预测目标词来训练得到词向量,而Skip-gram是根据目标词去预测周围词来训练得到词向量[56]。根据经验,CBOW用于小型语料库比较适合,而Skip-gram在大型的语料库上表现得比较好。由于目前只使用房屋租赁案例样本,所以选择CBOW进行训练,词向量空间模型的建立过程如图2所示。

CBOW中生成词向量空间模型的步骤如下:

1) 读取语料,统计词频信息;

2) 构建词典,初始化哈夫曼树及随机初始化每个词的对应向量(维度默认是200);

3) 以行为单位训练模型(输入文件都在一行上,会按照最大1000个词切割为多行);

4) 获取当前行中的一个输入样本(当前词向量及相邻几个词的词向量);

5) 累加上下文词向量中每个维度的值并求平均得到投影层向量X(w);

6) 遍历当前词到根节点(输出层的Huffman树)经过的每个中间节点;

7) 计算中间节点对应的梯度g*学习速率;

8) 刷新投影层到该中间节点的误差向量(与梯度和中间节点向量相关);

9) 刷新中间结点向量(与梯度和投影层向量相关);

10) 刷新上下文词向量(其实就是将误差向量累加到初始向量中)。

2.2案情训练规则

结合《中华人民共和国民法典》(以房屋租赁为例)建立案情训练规则如下:

Rule:People(?x)∧rent(?x,?y)∧document(?y,?t)→Terminate(?x,?t)

规则的发展:当事人x租赁当事人y的房屋,当事人y约定了解除合同的要件t。当事人协商一致,可以解除合同。当事人可以约定一方解除合同的条件。当满足解除合同条件时,解除权人可以解除合同。

解除合同的条件定义如下[713]:

1) 当事人协商一致,可以解除合同;

2) 因不可抗力致使不能实现合同目的的,可以解除合同;

3) 出租人未按约定交付租赁物,经承租人催告在合理期限内仍拒不交付租赁物的,承租人可以解除合同;

4) 因不可归责于承租人的事由致使租赁物部分或全部毁损、灭失,致使合同目的不能实现的,承租人可以解除合同;

5) 不定期租赁,承租人有权随时解除合同;

6) 租赁物危及承租人安全或健康的,即使承租人订立合同时明知该租赁物质量不合格,承租人仍有权随时解除合同;

7) 司法机关或者行政机关依法查封租赁房屋导致承租人不能使用的,承租人可以解除合同;

8) 租赁物权属有争议导致承租人不能使用的,承租人可以解除合同;

9) 不符合《中华人民共和国建筑法》《中华人民共和国消防法》等法律关于房屋使用条件的强制性规定并导致承租人不能使用的,承租人可以解除合同;

10) “一物数租”之有效合同不能实际履行的,承租人可以解除合同;

11) 承租人未按约定方法或者未根据租赁物的性质使用租赁物,致使租赁物受到损失的,出租人可以解除合同并请求损失赔偿;

12) 承租人未经出租人同意转租的,出租人可以解除合同;

13) 承租人逾期不支付租金的,出租人可以解除合同;

14) 法律规定的其他情形。

2.3案件推理模型训练

将通过Word2Vec词向量转换而形成的句子作为神经网络模型LSTM的输入部分,每个词向量的分量对应一个LSTM输入层节点。推理模型流程图如图3所示。不断调整损失函数、优化器、学习率、激活函数等参数,而后根据案情训练规则,创建推理模型。

LSTM的学习率可以结合案件样本先用较大的学习率,快速找到较优值,然后逐步减小学习率,使模型找到最优解以便模型在训练后期稳定。指数衰减学习率公式如下:

指数衰减学习率=初始学习率×学习率衰减率(当前轮数/多少轮衰减一次)

LSTM的激活函数主要有3种:sigmoid函数、tanh函数和ReLU函数。经过综合对比,激活函数选择ReLU时测试集准确率较高。

损失函数显示出预测值(y)与已知答案(y_)的差距,从而不断调整使预测数据的真实值和实际值的误差较小,通过对比均方误差、自定义、交叉熵的方法,发现损失函数为均方误差时,测试集的准确率较高。

由于在模型训练过程中同一个学习率并不能很好地适应各个训练阶段的模型,所以选择RMSProp模型拟合。

2.4案件智能推理分析

系统对案件陈述内容及笔录进行分析,并结合2个指数指标实现分类,而后推理分析,案情内容指标如图4所示[1415]。

案件陈述内容及笔录与租赁合同内容相似性分析公式为

p(w|d)=p(w|t)×p(t|d)(1)

利用LDA(Latent Dirichlet allocation)算法进行计算,其中d是案件陈述内容及笔录的关键词,t是租赁合同部分内容的关键词。

CS(u)=(simu(t,cu))(2)

利用余弦相似度算法进行计算,其中t是民法典租赁合同部分关键词,cu代表的是第q条案件陈述内容及笔录的关键词。

案件样本相似度RCS(radar cross-section)为

RCS(uj)=avg(simu(rmip,rmiq)),p≠q

0,其他(3)

其中:sim()是余弦相似算法; rmip代表的是与第p个案件样本的相似度;rmiq代表的是与第q个案件样本的相似度;avg()等于所有案件样本相似度值的平均值。 如果没有相似的案件, 则其相似度等于0。

案件推理过程是根据设定的规则强度,对照LSTM案情分类模型,从而推出结论等推荐辅助决策信息,具体算法如图5所示。

3系统实现

本系统采用Win10+PyCharm IDE+Python 3.9+Tensorflow 1.0开发,其中Python 3.9中包含gensim,该包封装了Word2Vec及其优化。结合数据库技术存储相关案件样本、案件笔录、案件推理模型、案情推理分析指标及其关联关系模型等信息。对LSTM进行手动调参优化,相关参数设置见表1。

其中:batchSize代表批处理数据的大小,也可以说是训练一轮数据所对应的案件样本数;numClasses代表输出的类别数,其对应14种案件训练规则;Epoch代表训练次数;IstmUnits代表LSTM的单元个数;Dropout代表Dropout算法的比率值。

案件推理模型训练和案件智能推理分析为完全独立的2个程序,案件推理模型训练不影响案件智能推理分析,案件样本更新后即时开展案件推理模型训练进而实时更新案件推理模型,从而保证了案件智能分析系统推理结论的可用性和有效性,案件智能推理分析系统界面如图6所示。

另外,本文也对系统智能推理分析结论被法官采纳的情况进行了统计, 并结合训练过程中案件样本数量的变化形成了相关统计图表, 如图7所示。 图7中数据表明, 当案件样本数量在150件左右的时候推理结论被法官采纳的有效性趋于稳定, 当案件样本数量在200件以上的时候推理结论被法官采纳的有效性稳定在80%左右。 经过分析,导致案件推理存在误差的主要原因为案情陈述过程中的表述不规范、用词不一, 笔录中内容有些省略句或者缺字少词需要分析上下文等会造成推理分析出现偏差。 当然案件样本也需要经过精挑细选并结合法官经验对不同涉案内容进行判别, 从而保证在一定数量的案件样本中能反映出尽可能多的涉案内容, 以保证在尽可能少的案例训练后得出较为理想的推理分析结论。

4结论

本文利用神经网络技术实现了法院案件的智能推理分析,并做了初步的实验。结果证明,该技术在解决现有法官工作量和工作强度的问题上有一定的帮助,在一定程度上可以实现法律推理决策的智能化,并且能够实现对法官思维相对高度一致的模拟。随着技术的发展进步,系统会越来越成熟高效,必将推动整个司法系统审判效率的提高,进而实现真正的智慧法院。

参考文献:

[1]邓智嘉. 基于人工智能的知识图谱构建技术及应用[J]. 无线电工程, 2022(5):766-774.

[2]杨丹,邵玉斌,张海玲,等. 融合多特征的半监督并列结构识别[J]. 小型微型计算机系统, 2021(9):1818-1825.

[3]HOCHREITER S,SCHMIDHUBER J. Long short-term memory[J]. Neural Comput, 1997,9(8):1735-1780.

[4]GERS F A,SCHRAUDOLPH N N,SCHMIDHUBER J. Learning precise timing with LSTM recurrent networks[J]. J Machine Learning Res, 2003,3(1):115-143.

[5]金楠,王瑞琴,陆悦聪. 基于Word2Vec与深度神经网络的协同推荐模型[J]. 湖州师范学院学报, 2022(8):50-59.

[6]邬明强,邬佳明,辛伟彬. Word2Vec+LSTM多类别情感分类算法优化[J]. 计算机系统应用, 2020(1):130-136.

[7]法律出版社法规中心. 中华人民共和国民法典注释本[M]. 北京: 法律出版社, 2020:388-406.

[8]郑珺丹. 房屋租赁合同标的物及合同解除权的认定[D]. 绵阳: 西南科技大学, 2016.

[9]张新宇,方灿. 房屋租赁中优先承租权适用浅析[J]. 中国律师, 2022(3):79-81.

[10]杨亮. 房屋租赁合同违约方合同解除权的经济考量[J]. 法制博览, 2022(5):169-171.

[11]杨心雨. 房屋租赁合同承租人违约解除的司法适用[J]. 新疆开放大学学报, 2022(3):64-67.

[12]杨华. 房屋租赁合同中违约方解除权问题研究[J]. 法制与社会, 2020(5):53-54.

[13]梁小琼. 房屋租赁合同中的违约方解除权问题研究[D]. 兰州: 西北师范大学,2022.

[14]任智慧,徐浩煜,封松林,等. 基于LSTM网络的序列标注中文分词法[J]. 计算机应用研究, 2017,34(5):1321-1324.

[15]翟社平,李兆兆,段宏宇,等. 基于词法、句法和语义的句子相似度计算方法[J]. 东南大学学报(自然科学版), 2019,49(6):1094-1100.