摘 要:现有基于知识图谱的法律判决预测方法重点关注案件的要素实体和关系,不能充分地获取案件的特征信息。针对该问题,提出了一种增强案件特征融合的知识图谱法律判决预测方法。首先,该方法利用双向门控循环神经网络挖掘事实描述文本深层次的因果、时序等全文语义特征信息。然后通过知识图谱向量空间中案例间相似度注意力计算学习类案特征表示。最后,融合特征信息和知识图谱的结构化知识,丰富实体和关系在案件事实文本中的语义特征表示,实现法律判决链路预测任务。在危险驾驶罪和盗窃罪两类罪名数据集上的实验结果显示,该方法在MRR、Hit@1两个关键评价指标上与当前表现最好的链路预测模型相比提升了1.5%左右,Hit@3和Hit@10等指标也均有提升,验证了案件特征增强融合能补充法律知识图谱中缺失的案件特征信息并提高预测的效果。
关键词:知识图谱嵌入;特征增强;历史相似案例;法律判决链路预测
中图分类号:TP391.1 文献标志码:A 文章编号:1001-3695(2024)07-032-2153-07
doi: 10.19734/j.issn.1001-3695.2023.11.0533
Legal judgment prediction using case feature enhancement based on knowledge graph
Abstract: The existing legal judgment prediction methods based on knowledge graph focus on the element entities and relationships of the case, and cannot adequately capture the characteristic information of the case. Aiming at this problem, the paper proposed a knowledge graph legal judgment prediction method that enhanced the fusion of case features. Firstly, this me-thod used bidirectional gated recurrent neural network to mine the deep semantic feature information such as causality and time sequence of fact description text. Then, it calculated the feature representation of the learning class case by the similarity attention between cases in the knowledge graph vector space. Finally, the fusion of feature information and structured knowledge of knowledge graph enriched the semantic feature representation of entities and relationships in the case fact text, and realized the legal judgment link prediction task. The experimental results on the two types of crime datasets of dangerous driving and theft show that the method improves the two key evaluation indicators of MRR and Hit@1 by about 1.5% compared with the current best-performing link prediction models. The indicators such as Hit@3 and Hit@10 are also improved, which verifies that the case feature enhancement fusion can supplement the missing case feature information in the legal knowledge graph and improve the prediction effect.
Key words:knowledge graph embedding; feature enhancement; historical similarity cases; legal judgment link prediction
0 引言
人工智能技术下的法律判决预测(legal judgment prediction,LJP)是指从海量司法案件中学习判决模式,根据案件的事实文本来预测案件的判决结果,如适用法律条款、所犯罪名和刑期等。基于深度学习的法律判决预测方法[1~5]取得了非常高的预测准确率,但由于判决模式对法律工作人员不可见以及对案件中的核心要素刻画不足,导致其无法很好地解释判决结果的由来。基于知识图谱的法律判决预测方法以三元组的形式关注案件事实描述中关键要素实体及实体间的关系,能有效地提取和展示海量案件信息知识,将影响最终判决结果的案件事实要素直观地展现出来,为案件的判决结果提供清晰有力的支持。洪文兴等人[6]依托命名实体识别和关系抽取技术,概括案件事实的骨架结构,提出司法案件的案情知识图谱自动构建模型,为后续中文法律知识图谱的下游任务奠定了基础。
为增强法律知识图谱实体关系的表达能力,杜文源[7]提出基于知识图谱的刑事案件判决预测模型,融合多源信息的向量化表示,取得了较好的效果,但采取直接拼接的方式实现知识图谱多源异质信息的融合会产生融合损失。陈思[8]通过在司法图谱嵌入四种类型的罪名空间标签特征,捕获更多的罪名信息来学习鲁棒的罪名向量表示,实现了更好的预测效果,但却未针对如何融合这些罪名标签的表征提出更有效的嵌入方式。Dhani等人[9]基于印度知识产权相关法律法规构建知识图谱,借鉴远程监督思想提出了一种通过从法律知识图谱中自动学习节点特征来预测案例图节点的解决方案,发现结合相关领域特征可以获得更好的预测结果。另外,为了丰富知识图谱结构化表示的信息,Li等人[10]针对文本理解和法律推理困难的问题提出了基于文本和图的法律条文补全方法,通过文本特征增强图节点表示,提升了预测效果。王治政等人[11]提出基于多视角知识图谱嵌入的量刑预测方法,通过学习要素的初始表示以及融合知识图谱特征,在量刑预测任务中表现较优。针对当前法律判决任务不能完全有效地整合法律条款的信息,Zhao等人[12]设计了一种图融合方法来融合文本和外部知识的法律条文区分信息,有效提升了预测效果。考虑到判决预测过程中相似案例的影响,黄治纲等人[13]针对传统的知识图谱向量化表示精度较低等问题,提出一种基于知识图谱的案件推荐模型,通过知识表示学习寻找相似案件,提升推荐准确率。综上所述,基于知识图谱的法律判决预测方法主要集中于提取案件事实描述的关键信息,过度依赖实体关系,未能全面地捕捉到案件事实的特征信息,而通过融合外部信息来丰富特征表示以弥补不足,对于预测结果准确率的提升具有不错的效果。
受此启发,本文提出了一种对知识图谱进行特征增强的法律判决预测方法。从案件事实描述文本中抽取实体关系构建法律知识图谱,以结构化信息概括影响判决结果的案件核心要素。利用案件事实描述文本的全文语义特征以及历史类案特征来增强当前案例实体关系的特征表示,进行全局信息学习和历史信息学习。实现融合外部信息的同时,增强知识图谱内部类案特征的表示,既强化案情描述和案件要素实体之间的信息交互,又增强相似案件之间的影响,减少无关因素的干扰,为知识图谱案件事实要素三元组中的实体关系向量表示提供更丰富的特征信息,增强案件文本与法律知识图谱之间的关联性,提高最终的预测效果。
本文的主要贡献如下:
a)采用双向门控循环神经网络理解文本描述上下文信息,进行全局信息学习,获取案件文本中的全局语义信息特征,增强知识图谱嵌入空间中实体关系与案件事实描述文本之间的关联表示。
b)计算案例间实体相似度来获取知识图谱中历史相似案例特征信息,学习历史信息特征,扩大法律图谱向量空间中相似案例间实体关系特征影响。
c)采用基于注意力机制融合方法来减少两种异质特征的融合损失。
1 问题定义
将法律判决预测任务定义为知识图谱的链路预测任务,如图1所示,通过结合知识图谱中的结构化案件信息和案件事实描述文本的特征信息,丰富向量表示,提高最终判决预测结果的准确率。
针对案件事实描述进行知识抽取,并完成本体构建,旨在结构化表述案件的事实要素信息和审理过程,以本体模型作为表示、存储案件事实要素信息的逻辑存储介质,主要以裁判文书中案件事实描述的组成部分及它们之间的语义关系为依据。基于七步法[14],结合司法判决基本流程,构建法律判决本体模型,为法律知识图谱构建提供逻辑支撑,具体定义实体类型和实体间关系如表1所示。其中,以案件号实体为出发点的关系主要描述案件事实基本信息,以罪犯实体为出发点的关系主要描述某罪犯在某案件中最终所获判定信息。
对于法律知识图谱中的实体集合E和关系集合R,链路预测任务的输入端是从案件事实描述中提取到的案件事实要素三元组的集合S={(h,r,t)},其中h,t∈E,r∈R,每个三元组由头实体h、关系r和尾实体t组成,输出端是预测的三元组量刑尾实体。该任务的目标是通过给定的判决结果三元组(h,r,t)遮盖尾实体,生成测试三元组(h,r,ttest),并利用知识图谱链路预测模型来推断该判决结果实体属于目标实体的概率。在该预测模型中,通过对头实体向量h和关系向量t进行计算,得到当前案件的判决结果实体属于目标实体的概率值,根据概率值对判决结果三元组的尾实体进行预测。
2 基于知识图谱的案件特征增强法律判决预测模型
针对知识图谱嵌入存在案件事实特征信息缺失的问题,提出基于知识图谱的案件特征增强法律判决预测模型(know-ledge graph feature enhance legal judgment prediction,KGFELJP),模型主要由知识图谱嵌入模块、类案特征增强模块、全文语义特征增强模块和基于注意力机制的特征融合模块组成,模型结构如图2所示。
首先需要对案情描述的事实文本进行知识图谱三元组提取,将自然语言的案件事实转换为结构化的图谱表示,有助于捕捉案件事实之间的关系。另外,为了获取案件事实描述的整体语义信息,还需要对事实描述文本进行词向量编码,编码后通过单层的双向门控循环神经网络(bidirectional gate recurrent unit,Bi-GRU)[15]作为理解上下文信息的嵌入机制来增强案件事实描述文本的全文语义特征,更准确地捕捉案件文本之间的关联性。同时,对知识图谱嵌入后的案件要素向量通过案例实体相似度计算学习历史案例实体的向量表示,计算案例间实体相似度作为权重,让当前案例学习到相似案例的关键实体和特征。最后通过基于注意力机制融合历史案例特征增强后的知识图谱案件要素向量表示和案件事实描述全文语义特征。在融合特征后进行法律判决链路预测任务,基于现有实体之间的关系,预测出判决结果的尾实体,实现法律判决预测的目标。通过全文语义特征和历史相似案例特征来丰富知识图谱三元组的向量表示,弥补知识图谱嵌入过程中案件特征信息的丢失,在保证可解释性的前提下提高预测结果的准确性。
2.1 知识图谱嵌入模块
通过知识抽取,将裁判文书中的案情事实描述转换为事实三元组的形式来进行表示,使案件事实描述的自然语言文本转换为结构化的知识图谱向量,基于当前表现最好的RotatE[16]链路预测模型进行知识图谱嵌入。RotatE 模型主要是通过将实体和关系映射到复数向量空间中,后续再将每个关系定义为复数向量空间中的旋转,进而可以对不同类型的关系模式进行建模和推理,并且由于其在时间和内存上都保持线性,具有更强的表示能力,所以易扩展到大型的知识图谱,正好符合法律领域大量相关数据的特点。可以实现将案件事实要素的初始向量映射到图谱向量空间中,融合文本信息表示和知识图谱结构,获取法律知识图谱中案件要素实体和关系的向量表示。
基于几何模型RotatE的思想,定义如式(1)所示的评分函数来评估一个事实三元组(h,r,t)的置信度:
如果事实三元组(h,r,t)为真,评分函数应该得到一个尽可能大的值。基于评分函数z(h,r,t),法律知识图谱中事实三元组(h,r,t)的条件概率定义如式(2)所示。
其中:h′、t′表示头实体和尾实体的负例;负样本集S′(h,r,t)={(h′,r,t)|h′∈E}∪{(h,r,t′)|t′∈E}。
知识图谱嵌入模型的目标是最大化当前法律知识图谱中已有事实三元组的条件概率,如式(3)所示。
2.2 类案特征增强模块
实现类案特征增强首先要对相似案例进行分组,将具有相似特征的案例分到同一个组,每个组表示一个案例类。从每个案例类中学习差异性特征,分析每个案例类中的案件差异,作为该类的差异性特征。将当前案件的特征与每个案例类作比较,匹配相似度最高的那个类。根据匹配案例类的差异性特征调整当前案件的向量表示,纠正偏差,关注当前案件和匹配案例类的差异点,保留当前案件的独特特征。
案例间相似度就是把一个案例的各个实体属性间相似度综合在一起,通常是通过距离来定义的。在构建好的知识图谱实体向量空间中,每个案件ci都是由n个实体eni表示成ci=(e1i,e2i,…,eni)T的形式。为了计算每个不同案件之间的语义相似度,通常使用两个案件之间的欧氏距离来体现案件的语义相似性。两个案例ci、cj之间的欧氏距离为两个k维向量(e1i,e2i,…,eki)与(e1j,e2j,…,ekj)之间的距离,如式(4)所示。
其中:d(ci,cj)表示两个向量之间的欧氏距离。假设案例ci、cj的相似度使用simcase(i, j)来表示,如式(5)所示。为了进行归一化处理,将案例间相似度限制在(0,1]来作为注意力权重系数:
得到当前案例与历史相似案例的相似度之后,把相似度作为注意力机制的权重αj加权求和,使当前案例学习到对历史案例注意力聚焦的实体特征c,沿着列方向平铺得到具有历史案例特征的案件要素向量表征C,如式(6)所示。
c=∑αjc:j
C=TiledT(c)(6)
其中:αj为上述得到的当前案例与历史相似案例的相似度;TiledT(c)表示沿着列方向平铺T次。
2.3 全文语义特征增强模块
进行全文语义特征增强,需要对案件事实描述进行词向量编码,将每个字符映射到高维向量空间,其中每个向量元素代表了一个词语或短语的语义表示。将案情描述向量表征输入一个单层的双向门控循环神经网络来获取上下文信息的语义向量序列。将案件事实的语义信息嵌入到文本编码向量中,增强文本表示的语义特征,获取更全面、准确的案件表示,继而更好地理解案件各个要素之间的关系和影响,弥补知识图谱嵌入重点关注于三元组信息而缺失全文语义特征的缺陷。
将输入案件的案情描述分为m个句子,每个句子经过词向量编码后表示为si,每个句子中的词使用词向量wj进行表示,因此整个案件的案情描述可以表示为m个句子的向量序列fact={s1,s2,…,sm}。之后将案情描述的词向量表示送入双向门控循环神经网络层中,模拟词与词之间的语义交互来获取案情描述上下文语义依赖特征F,如式(7)所示。
2.4 基于注意力机制的融合模块
对类案特征增强后的知识图谱三元组向量特征表示C和对事实描述文本全文语义特征增强后的特征表示F采用注意力机制特征融合方法(attentional feature fusion,AFF)[17]进行融合,融合后的特征可以表示为
最终链路预测的结果分数采用与 RotatE一致的评分函数,如式(1)所示,区别在于加上了融合后的特征向量矩阵可以实现案件要素的向量表示与知识图谱的三元组结构相结合,丰富三元组中实体和关系的特征表示,如式(9)所示。
其中:Re(·)表示向量的实部;lm(·)表示向量的虚部;Wfc表示增强融合后的特征在复数空间的向量矩阵;Θ为参数空间。
2.5 方法步骤
算法 基于知识图谱的特征增强链路预测方法
3 实验和分析
3.1 实验数据集
数据集选择经过脱敏处理的CAIL2018的测试数据集[18],共包括268万刑事法律文本,其中涉及202条罪名和183条法条,刑期长短包括0~25年、无期、死刑,内容对应到案情描述与罪名裁定两部分,满足对裁判文书中的数据源的需求。经过数据清洗,挑选出单人单罪的案件,即只有一个犯罪嫌疑人且只触犯一个罪名的案件,最终选择初始数据集和经过筛选得到的危险驾驶罪和盗窃罪这两类罪名刑期标签分布差距很大的类别案件为研究对象,并对数据的刑期结果进行统计,得到以月为单位刑期的案件数量统计,如图3所示。
3.2 参数设置和评价指标
由于中文案件事实描述文档长度大部分都在 300~750 字符,为减少裁剪和填补带来的负面影响,设置最大文档长度为 635字符;采用 Adam 算法作为优化器,学习率设为 0.000 1;提取案件事实语义特征的邻域信息的长度为 50,即为案件事实要素采样 50 字符节点作为其上下文信息;单层Bi-GRU 的dropout(随机失活率)设置为丢失 0.2;批次处理大小设置为 8,训练轮次设置为 99。
知识图谱嵌入的实体和关系向量维度为200,每个计算批次的大小为 100 × 50,正例三元组的个数为100,每个三元组的负采样个数为50,训练轮数设置为 1 000,剩余参数为RotatE中所提供的默认参数。
链接预测任务通常以MRR、Hit@1、Hit@3、Hit@10作为评估模型的指标。MRR是指平均倒排序,主要用于衡量正例三元组的最高排名,计算值越大,表示模型的链接预测性能越好,表示为
Hit@n是指在链接预测中排名小于n的三元组的平均占比,侧重于总体排名,数值越大,表示模型的链接预测性能越好,n的取值一般为1、3和10,具体公式如下:
其中:S表示三元组的集合;|S|是三元组集合的个数;ranki表示第i个三元组的链接预测排名;函数I(·)表示如果条件成立则为1,不成立则为0。
考虑到需要与基于深度学习的判决预测方法进行比较,使用准确率Acc和宏F值(macro-F)用于基于深度学习的法律判决预测的评价指标。Acc与Hit@1基本一致,主要用于评价结果中最大概率为正确标签的比例;macro-F用于评价模型在所有标签中的分类性能。
3.3 基线模型
为了验证本文方法在基于法律知识图谱的法律判决链路预测任务中的有效性,将本文方法与几类非常典型的知识图谱链路预测模型方法和深度学习预测方法进行对比。对比方法主要包括TransE[19]、TransH[20]、TransA[21]、TransR[22]、DistMult[23]、SimplE[24]、ComplEx[25]、ConvE[26]和当前链路预测表现效果最好的RotatE[16]以及当前最新的基于深度学习的法律判决预测方法NeurJudge[27]、EPM[4]以及ML-LJP[28]。
3.4 实验结果和实验分析
为了比较特征增强的知识图谱法律判决链路预测模型 KGFELJP 和基线模型,在未筛选罪名的CAIL2018数据集和筛选某种罪名后的两种罪名,即危险驾驶罪和盗窃罪的数据集上进行了大量的实验,实验结果如表2~5所示,黑体数字为最优结果(下同)。特别说明:考虑到基于知识图谱和基于深度学习的判决预测任务具有两种不同的评价指标体系,无法获取对方的评价指标数据,因此在表5中使用“—”来代替表示。
从实验结果可以看出:
a)从基准模型的角度来说,KGFELJP模型在不同的数据集上,整体都优于当前最好的知识图谱链路预测模型RotatE。其中在三类数据集上, KGFELJP 比最好的模型RotatE 在评价指标MRR上均有提升,说明本文方法对正确实体的结果预测位置更靠前,预测效果更好;在评价指标Hit @1、Hit @3、Hit @10上同样有所提升,说明本文方法在预测精度上更加优秀。由此可以证明,通过增强知识图谱中实体和关系的特征表示,获取实体关系在案件事实描述文本中的语义信息及历史案例中的特征信息,进行法律判决链路预测任务,可以提升最终预测的效果。但由表5可得,KGFELJP模型与最新表现较好的基于深度学习的法律判决预测模型ML-LJP相比,仍然存在一定的差距,但通过使用图谱嵌入方法可以获得案件要素的向量表示,为模型学习案件的审理逻辑提供推理链路规则,使办案人员能清楚地理解模型的预测依据,提升预测结果的可解释性。
b)从聚焦罪名的角度来说,KGFELJP模型在聚焦某类罪名的数据集上,评价指标的提升要比在CAIL2018整体数据集上提升效果高得多,很可能是通过筛选出某种特定的罪名,去掉了很多对结果无关的影响因素,控制模型复杂度,减少模型学习的困难,避免过拟合。
c)从刑期分布的角度来说,KGFELJP模型在危险驾驶罪的数据集上,评价指标的提升要比在盗窃罪的数据集上提升性能高,原因可能是危险驾驶罪的刑期标签分布比较均匀,会减少很多因数据不均衡而产生的噪声损失,后续研究需要在数据集处理时,对刑期标签划分固定区间范围以减少损失。
考虑到知识图谱数据的稀疏问题,即由于信息表达的丰富性往往带有偏好,且受限于知识抽取手段本身性能问题(一些暗含的常识信息并不会出现在自然语料中),实体间的关系往往是不完整的。为了充分验证模型的有效性,额外在两种罪名数据集上进行了稀疏知识图谱信息实验,在保证不剔除实体/关系的前提下,随机剔除数据中的一些事实,结果如表6和7所示。
实验结果显示,在随机剔除某些事实的条件下,在两种罪名数据集上各模型表现均有下降,其原因可能是某些关系的缺失影响了部分实体描述的丰富性,制约了模型的进一步提升。这一问题在基于嵌入的模型RotatE中尤为明显,这是由于缺乏结构信息在语义空间中会学习到错误的嵌入,最终效果会下降很多。而本文模型通过额外学习全局信息和历史信息来弥补语义空间部分实体关系缺失的不足,虽然表现也有所下降,但相较于RotatE模型还算比较稳定。上述实验验证了本文模型在面对数据稀疏问题的有效性,为知识图谱法律判决预测任务提供了一个新的有竞争力的解决方案。
3.5 消融实验
为了验证本文模型的类案特征增强模块、全文语义特征增强模块以及注意力机制特征融合模块的有效性,采用控制变量的方法进行比较,实验结果如表8~10所示。特别说明:“(-)SCFE”表示未对知识图谱向量空间使用相似案例特征增强;“(-)SFE”表示未使用全文语义特征增强来弥补语义损失;“(-)AFF”表示对特征增强后的向量采用直接拼接的向量融合方式,未引入注意力机制融合来减少损失。
实验结果显示,在不同的罪名数据集上去掉某个模块的结果,模型表现均有所降低,充分验证了模型中各模块的有效性。另一方面,在使用两个模块对知识图谱向量空间进行丰富向量表示后,额外加入注意力特征融合机制可以明显弥补两种异构特征融合时的信息损失,从而进一步提升了最终的链路预测效果。综上,通过定量分析,充分验证了本文模型中各模块的有效性,为知识图谱法律判决预测任务提供了一个新的有竞争力的解决方案。
3.6 预测方法可解释性分析
虽然本文模型的预测效果与当前表现较好的基于深度学习的法律判决预测模型相比,仍然存在一定的差距,但是基于知识图谱的判决预测方法通过自然语言处理,对司法领域非结构化文本数据进行信息提取和知识融合,将文本中的案件事实和法律关系进行提炼和概括,实现了从非结构化文本向结构化知识图谱的转换,从而减少数据的模糊性和不确定性,获得了更具解释性和确定性的司法知识表达。知识图谱结构化表示有利于案件分析和法律推理,可以实现对司法决策过程的可解释性建模,在构建好的法律知识图谱中,每一个案件事实实体和关系中都存在一条清晰明了的推理链条,即“案件基本信息-案件提交证据-案件犯罪主体-案件当事人违反罪名及法条-案件加(减)刑因素-案件最终判决结果”,如图4所示。
从当前案件审判流程中所提交的案件关键证据事实出发,途经案件犯罪主体和对案件的判决结果有影响的案件因素,将识别出的案件要素与提交证据标准关联匹配,获取相符合的法条和罪名,并最终得到当前案件的法律判决结果,形成完整严谨的法律判决预测逻辑体系,清晰地展示出案件审理推断的主要情况和发展趋势,支撑法院审判工作流程中的案件演化分析,如图5所示,辅助法官通过案件推理链条实现对案情的合理分析,可提高司法审判的效率和质量。
4 结束语
本文选取智慧司法领域中较为重要的法律判决预测任务作为研究重点,针对基于知识图谱的法律判决预测方法未充分融合外部特征,存在案件特征信息缺slTl7RrN4ZhcxWyXgk90FdmzN3pnbZztqc1FVzEtpCE=失的问题,引入特征补全来弥补知识图谱嵌入中案例信息的缺失。具体来说,本文通过双向门控循环神经网络获取案件事实描述文本的语义信息表示,另一边对知识图谱嵌入后的案件要素向量表示进行历史相似案例特征增强,最终两者经注意力机制融合不同层次的案情描述的表示,以增强知识图谱中的实体和关系与案件的文本描述之间的关联,获得实体和关系在案情文本中的语义信息,从而提升最终预测的性能。在经过数据处理后的公开数据集上进行了实验,结果显示,本文提出的特征增强的类案辅助链路预测方法在法律判决预测任务上优于当前表现最好的链路预测模型,且相较于基于深度学习的法律判决预测方法来说,更具有可解释性,可以实现对司法决策过程的可解释性建模。当然,本文研究也存在一定不足之处,如选取了只有一个当事人且只涉及到一个罪名的案件作为研究重点,此外效果也并未达到基于深度学习的法律判决预测方法的最优效果。未来,考虑从这两个方面继续进行研究,在保证可解释性的前提下,不断提高方法的最终预测效果。
参考文献:
[1]Zhong Haoxi,Guo Zhipeng,Tu Cunchao,et al. Legal judgment prediction via topological learning [C]// Proc of Conference on Empirical Methods in Natural Language Processing. Stroudsburg,PA: Association for Computational Linguistics,2018: 3540-3549.
[2]Ma Luyao,Zhang Yating,Wang Tianyi,et al. Legal judgment prediction with multi-stage case representation learning in the real court setting [C]// Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York : ACM Press,2021: 993-1002.
[3]Huang Yunyun,Shen Xiaoyu,Li Chuanyi,et al. Dependency learning for legal judgment prediction with a unified text-to-text transformer[EB/OL].(2021-12-13). https://arxiv.org/abs/2112.06370.
[4]Feng Yi,Li Chuanyi,Vincent N. Legal judgment prediction via event extraction with constraints [C]// Proc of the 60th Annual Meeting of the Association for Computational Linguistics. Stroudsburg,PA: Association for Computational Linguistics,2022: 648-664.
[5]张晗,郑伟昊,窦志成,等. 融合法律文本结构信息的刑事案件判决预测 [J]. 计算机工程与应用,2023,59(3): 253-263.(Zhang Han,Zheng Weihao,Dou Zhicheng,et al. Integrating multi-layer structure information of law for legal judgment prediction [J]. Computer Engineering and Applications,2023,59(3): 253-263.)
[6]洪文兴,胡志强,翁洋,等. 面向司法案件的案情知识图谱自动构建 [J]. 中文信息学报,2020,34(1): 34-44.(Hong Wenxing,Hu Zhiqiang,Weng Yang,et al. Automated knowledge graph construction for judicial case facts [J]. Journal of Chinese Information Processing,2020,34(1): 34-44.)
[7]杜文源. 基于知识图谱的刑事案件判决预测算法研究 [D]. 厦门:厦门大学,2020.(Du Wenyuan. Research on criminal case judgment prediction algorithm based on knowledge graph [D]. Xiamen:Xiamen University,2020.)
[8]陈思. 司法领域知识图谱构建及推荐应用的研究与实现 [D]. 北京: 北京邮电大学,2020.(Chen Si. Research and implementation of knowledge graph construction and recommendation application in the judicial field [D]. Beijing:Beijing University of Posts and Tele-communications,2020.)
[9]Dhani J S,Bhatt R,Ganesan B,et al. Similar cases recommendation using legal knowledge graphs [EB/OL].(2024-03-02). https://arxiv.org/abs/2107.04771.
[10]Li Luoqiu,Zhen Bi,Ye Hongbin,et al. Text-guided legal knowledge graph reasoning [C]// Proc of the 6th China Conference on Know-ledge Graph and Semantic Computing. Singapore: Springer,2021: 27-39.
[11]王治政,王雷,李帅驰,等. 基于多视角知识图谱嵌入的量刑预测 [J]. 模式识别与人工智能,2021,34(7): 655-665.(Wang Zhizheng,Wang Lei,Li Shuaichi,et al. Sentencing prediction based on multi-view knowledge graph embedding [J]. Pattern Recognition and Artificial Intelligence,2021,34(7): 655-665.)
[12]Zhao Qihui,Gao Tianhan,Zhou Song,et al. Legal judgment prediction via heterogeneous graphs and knowledge of law articles [J]. Applied Sciences,2022,12(5): 2531.
[13]黄治纲,谢新强,邢铁军,等. 基于司法案例知识图谱的类案推荐 [J]. 南京大学学报:自然科学,2021,57(6): 1053-1063.(Huang Zhigang,Xie Xinqiang,Xing Tiejun,et al. Case recommendation based on knowledge graph of judicial cases [J]. Journal of Nanjing University Natural Science,2021,57(6): 1053-1063.)
[14]邓诗琦,洪亮. 面向智能应用的领域本体构建研究——以反电话诈骗领域为例 [J]. 数据分析与知识发现,2019,3(7): 73-84.(Deng Shiqi,Hong Liang. Constructing domain ontology for intelligent applications: case study of anti tele-fraud[J]. Data Analysis and Knowledge Discovery,2019,3(7): 73-84.)
[15]Cho K,Van Merrienboer B,Gulcehre C,et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation [EB/OL].(2014-09-03). https://arxiv.org/abs/1406.1078.
[16]Sun Zhiqing,Deng Zhihong,Nie Jianyun,et al. RotatE: knowledge graph embedding by relational rotation in complex space [EB/OL].(2019-02-26). https://arxiv.org/abs/1902.10197.
[17]Dai Yimian,Gieseke F,Oehmcke S,et al. Attentional feature fusion [C]// Proc of IEEE/CVF Winter Conference on Applications of Computer Vision. Piscataway,NJ: IEEE Press,2021: 3559-3568.
[18]Xiao Chaojun,Zhong Haoxi,Guo Zhipeng,et al. CAIL2018: a large-scale legal dataset for judgment prediction [EB/OL].(2018-07-04). https://arxiv.org/abs/1807.02478.
[19]Bordes A,Usunier N,Garcia-Durán A,et al. Translating embeddings for modeling multi-relational data [C]// Proc of the 26th Internatio-nal Conference on Neural Information Processing Systems. Red Hook,NY : Curran Associates Inc.,2013:2787-2795.
[20]Wang Zhen,Zhang Jianwen,Feng Jianlin,et al. Knowledge graph embedding by translating on hyperplanes [C]// Proc of the 28th AAAI Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press,2014:1112-1119.
[21]Xiao Han,Huang Minlie,Hao Yu,et al. TransA: an adaptive approach for knowledge graph embedding [EB/OL].(2015-09-28). https://arxiv.org/abs/1509.05490.
[22]Lin Yankai,Liu Zhiyuan,Sun Maosong,et al. Learning entity and relation embeddings for knowledge graph completion [C]// Proc of the 29th AAAI Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press,2015: 2181-2187.
[23]Yang Bishan,Yih W T,He Xiaodong,et al. Embedding entities and relations for learning and inference in knowledge bases [EB/OL].(2015-08-29). https://arxiv.org/abs/1412.6575.
[24]Kazemi S M,Poole D. Simple embedding for link prediction in know-ledge graphs [EB/OL].(2018-10-26). https://arxiv.org/abs/1802.04868.
[25]Trouillon T,Welbl J,Riedel S,et al. Complex embeddings for simple link prediction [EB/OL].(2016-06-20). https://arxiv.org/abs/1606.06357.
[26]Dettmers T,Minervini P,Stenetorp P,et al. Convolutional 2D know-ledge graph embeddings [C]// Proc of the 32nd AAAI Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press,2018:1811-1818.
[27]Yue Linan,Liu Qi,Jin Binbin,et al. NeurJudge: a circumstance-aware neural framework for legal judgment prediction [C]// Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York : ACM Press,2021: 973-982.
[28]Liu Yifei,Wu Yiquan,Zhang Yating,et al. ML-LJP: multi-law aware legal judgment prediction [C]// Proc of the 46th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York : ACM Press,2023: 1023-1034.