王江涛,江国华
(武汉大学 法学院,武汉 430072)
数字技术的发展给人们生活带来极大便利,人们也开启了数字化生存模式[1]71-81。 个人信息是人数字生存的表达,是人们在物理空间的内容转化到信息空间的呈现。 因此,个人信息在数字社会发展中的重要性不断提升。 习近平总书记指出:“网络和信息安全牵涉到国家安全和社会稳定,是我们面临的新的综合性挑战。”[2]个人信息是信息安全的基本单位,保障个人信息是实现信息安全的重要部分[3]。 《个人信息保护法》(以下简称“个保法”)的出台给个人信息保护提供了法律指引。 但随着网络技术的快速迭代,人们对个人信息保护的需求逐渐增长,使得个保法较为宏观的规范无法及时、有效地回应权益需求,这给个人信息保护案件的裁判认定带来诸多难题。 司法裁判作为维护社会公正的最后一道防线[4],对个人信息保护案件的正确认定和准确裁判发挥着指导和教育意义。 在司法裁判智能化的改革背景下,司法裁判要利用好人工智能准确认定个人信息的范围、内容以及损害程度等是公正裁判的关键。 法律本体模型是实现人工智能和理解法律知识的桥梁,是计算机理解专家经验的基础,是实现辅助裁判的技术前提。 人工智能辅助裁判利用搭建好的个人信息保护法律本体模型对个人信息保护裁判要点进行提取、识别和计算,在认定事实要件准确度的同时,提升案件裁判的科学性和可靠性,有助于法官做出合理的司法裁判。 法律本体模型是用形式化术语描述法律知识,这些术语可用来支持人类对领域及其结构元素的理解[5]283,是帮助计算机认识和理解个人信息保护所需要的法律信息和知识的关键技术[6]140。 因此,依照“个保法”搭建全流程、分主体的法律本体模型来支持人工智能辅助裁判的技术可靠,促进司法裁判的公正。
在个保法颁布之前,学界对个人信息的研究集中在性质界定[7]2-14和保护模式[8]71-73分析上。个保法的颁布给个人信息保护提供了法律基础,个保法本身相对宽泛的规范内容,给学界研究带来诸多议题。 有学者对个保法展开讨论,分析个保法的法律定位,基于此衍生出相应的个人信息法律属性,进而考虑个人信息的保护重点[9]26-37。也有学者从整个法律体系[10]105-123和技术完善[11]107-117出发,强调个人信息保护的法律体系建设。 个保法颁布后,学界就实践中应用现状和可能出现的难题展开分析。 这其中包括,对个保法中 具 体 概 念 的 解 读[12]41-51、 相 关 制 度 的 构建[13]39-50以及结合具体的应用场景下的个人信息保护问题研究[14]68-79。 其中,在司法场域下,个人信息保护既是需要注意的安全问题[15]60-67,又是司法裁判的对象。 就法官认定个人信息保护案件而言,学者分析该类犯罪的犯罪特征[16]59-70,也有学者提出个人信息保护案件具有刑事民事交叉的特征,在案件认定上应当结合具体情况展开分析[17]96-103。 除了在理论层面对案件特征分析外,也有域外学者根据信息保护的特点引入技术分析来辅助司法裁判。 学者围绕欧盟数据保护法案,在分析个人信息保护法律关系的基础上,构建知识模型表达个人信息保护的法律知识。 如ProOnto 隐私本体是对欧盟数据保护法案中所涉及到的权利义务进行计算机可识别表达[18]91-100。而GConsent 本体则是围绕当事人的同意权为中心形成本体模型,欧盟数据保护法案对同意的有效性规定权利和义务,为数据主体提供了随时撤回同意的权利,要确定和证明遵守这些权利义务需要数据主体了解并掌握同意是如何获得、使用以及个人信息在数据流转中的变化[19]270-282。 而OPPD 本体模型着力点在于保障GDPR 对法律推理和合规性审查[20]144。
综上,当前个人信息保护的研究由整体分析深入到具体应用场景,具体研究聚焦在司法裁判领域时,对个人信息保护案件的事实认定准确度成为司法裁判的核心。 相较于欧盟数据法案,中国“个保法”在内容上兼具公法和私法的规定,且对个人信息的处理做出较为一般性的规定,这给个人信息案件的事实认定带来操作难题。 探究法律本体模型在个人信息保护法律领域的应用,利用知识模型辅助个人信息的事实认定,为法官理解辅助裁判以及识别裁判要点提供技术支持,进而给法官运用人工智能技术提供理论分析和指导。
从本体到法律本体模型再到个人信息保护法律本体模型,本体模型的应用不断深入逐渐具象化为人工智能进入司法裁判提供技术支持。 法律本体模型了解案件事实的基础是对案件所涉及的具体法律规范进行知识拆解、组织和表示,在此基础上实现法律知识的可视化,帮助计算机提升事实认定的准确度和理解法律逻辑并做出裁判。
本体(Ontology)揭示事物本源和存在,是哲学形而上学的一个基本分支,研究的是事物的实体存在(Being)[21]60-64。 法律本体则是探讨法律的本体问题,是对法律做哲学思考,是追寻法律的合法性根源,从而为法律的存在提供一种终极性论证[22]33-40。 计算机学科的发展,不断尝试把现实世界中的知识转化到网络世界中,让机器理解现实世界。 随之而来,知识工程的出现为现实知识的可读化、可识别化、可计算化的研究提供条件。 为了计算机能够更好地理解领域知识,知识工程通过本体模型来读懂领域内普遍、通用的知识内容,从而促进计算机中语义的交流,实现机器中概念的共享[23]199-220[24]20-26。 从哲学领域转向计算机领域,使得本体概念的内涵也发生了改变。本体提供了一种通用的方式来表示领域知识,并定义知识领域中实体和属性之间的关系[25]1-17。 其主要要素包括实体概念、属性、关系和实例。 其中,实体概念是术语的集合,可以看作是对知识范围的概念性描述。 属性描述对象的性质或特征,属性可以是实体属性也可以是关系属性。 关系连接并描述类或实例之间的结构。 最后,实例是用类表示的例子。 对领域知识的拆解和找寻根本的过程,可视为本体模型构建的过程。 存储在模型中的知识集合即为专家经验[26]145-164。
法律本体模型为计算机理解和运用法律领域的知识提供了稳定的基础[27]70-76,该模型用法律概念、法律规范、证据规则等内容形成本体模型中的概念、关系和属性,实现法律知识的模型化表示。 个人信息保护法律本体模型聚焦在个人信息之中,是保障个人信息安全案件司法裁判过程的重要手段,而个人信息的流通性给法官认定和掌握个人信息带来难度。 构建个人信息保护法律本体模型在个人信息认定方面打通了信息流转环节,从而提升了个人信息的认定效果。
人工智能辅助裁判利用法律本体模型的前提是需要法律规范本身符合形式化要件以及计算机能够对规范进行建模[28]115-127。 法律本体模型对法律知识的认知与构建离不开对法律知识本身的概念特征和逻辑分析,法律知识的可塑性和逻辑性给本体模型实现法律领域知识组织奠定基础。同时,法律本体模型的设计思路和设计理念能够有效理解和组织法律知识,从法律本体模型的结构出发,寻找法律本体模型的内在逻辑:
第一,法律本体模型是寻找法律知识的通用概念,是对抽象内容具象化的过程。 法律知识的概念化表达在当下法律规范中能够被准确找到,这种概念内容正与法律本体模型中“实体”“关系”“属性”的定义相契合。 当然,法律知识的表达,也并非法律规范的直译,法律专业人士的判断也为本体模型的概念认定提供帮助,如法律专业人士对法律规范、裁判规则和司法过程中不清晰概念的解读,将解读要点同法律规范概念点相结合后进行知识建模,如在个人信息保护法中对“个人信息”的界定,可明确对应法律本体模型中的实体概念。 在此基础上,法律本体模型中所构建的要素点同事实要件所需要的裁判点之间相匹配,这一过程相较于完全的机器学习、算法黑箱等情况,往往是法官无法理解、无法判断的,法律本体模型对基本裁判点的确定能够给计算机认知现实提供指引。
第二,法律本体模型丰富的语义信息,可以充分表达法律要素的含义。 通常法官裁判是对多重要素的考量,简单的概念要素只是组成法律本体模型的基本内容,法律本体模型中“实体”“关系”“属性”的组合为本体模型表示法律知识提供丰富的表达。 通过三种要素的组合,可以表达出复杂的法律知识,如在个人信息保护中,信息主体和信息处理者之间的关系并非是唯一关系,本体模型中多重“关系”的构建能够满足现实中事实认定的要求。由此可以发现,法律本体模型根据经验要求,对法律知识点进行构建,这与法官裁判中形成的裁判要点相适应[29]67-75。 如G 省、S 直辖市所提出的“专家经验、模型算法和海量数据”的建设逻辑,将经验知识提取形成本体模型。 在此基础上,透过机器学习等技术加持,优化法律本体模型的知识组织,实现内容覆盖的全面性和可靠性。
第三,在法律本体模型的组织下,人工智能辅助裁判中基于规则的推理得出更符合规范的裁判结论。 基于规则的推理,强调规则的所有前因都能根据案件事实作出解释,那么该规则就可以证明案件的结论是合理的。 规则推理之初需要计算机对规则的学习,法律本体模型是其学习的基础,根据本体模型内容的组织形式,编译相应规则内容,透过机器学习、深度学习等技术不断优化规则。 之所以能够实现的基础是司法裁判中法条的表达往往是条件规则(if-then),这同机器推理规则相吻合[30]1965。 这样的法律表达同机器规则和法律本体模型相适用,使得本体模型能够应用在司法裁判中。 另外,法律本体对推理规则的应用并非僵化不变的,推理中可废止原则的存在也让本体模型的应用变得灵活。 可废止性是指法律推理的可变性,即新的信息输入后,形成新的推理结论,新的结论同旧的结论之间并不会发成冲突,而是按照新的规则实现结论和内容[31]139-150。 这种思路大大提高了计算机的使用范围。
第四,本体模型与知识库相分离,具有一定稳定性与独立性。 无论是法律条文的变更还是案件信息的变化,都不会影响法律本体模型对法律知识的表达。 法律本体模型是对法律知识的概括,保证法律知识的稳定性。 而法律信息具有动态性,在信息变更的情况下只需对法律本体进行微调即可,无须重新构建法律本体模型。
综上,法律本体模型是由外向内逐层剖析探索并构建知识本源的结果。 法律知识本身具有的结构性和规范性,与法律本体模型要求的知识概念化、类型化相契合。 用法律本体模型来梳理和表达法律知识体系,有助于计算机理解并学习法律知识,提高对个人信息保护案件的自动化处理效率和裁判辅助的精确度。
个人信息保护法律本体模型构建的过程是掌握计算机运行机理的过程,因此对个人信息保护裁判依据的解构和知识组织,是以“个保法”为代表分析法律知识转变为本体知识的方法和形式。 在此基础上,根据个人信息的保护点拆解个人信息保护法律关系,形成个人信息保护法律本体模型。
对法律规范中要素的拆解是建设个人信息保护法律本体模型的前提,通过前期对法律规范与裁判要点的分析,组织和构建个人信息保护法律本体模型。 如针对刑事案件的构建要点对犯罪构成要件的分析[32]60-75,每个犯罪构成要件属于本体模型中的“实体概念”,每个犯罪构成要件的内部组成则是属于本体模型中的“属性”,要件之间的因果关系是法律模型中的“关系”。 因此,构建个人信息保护法律本体模型,利用已有的法律概念框架本体对个人信息保护法中法律条文的要素点进行分析,拆分出法律本体模型所需的实体概念、属性和关系。 法律框架本体模型由三部分组成,分别是规范框架、行为框架和概念描述框架[33]17-19。
其一,规范框架。 该框架是针对法律条款中权利能力和行为能力的描述,主要内容是规范主体被命令、禁止、允许或授权(法律模态)实施某一行为(行为描述)。 故完整的规范框架包括一个规范主体、一个法律形态和一个行为描述。 如在《民法典》中对自然人的民事权利能力的相关条款,在第十八条中“成年人”规定了规范主体,“民事法律行为”则是对行为的描述,“可以独立实施”是对法律为完全民事行为能力人,可以独立实施民事法律行为。 其二,行为框架。 行为是法律条文中最为重要的内容,行为框架是在讨论条文中对行为描述要件的拆解。 通常法律关系客体是某种行为,对行为的定义和描述是判断合法与否的重要依据。 在行为框架中,首先是辅助性内容“行为识别”“颁布”和“范围”。其次是对重点行为的规定,具体可分解为主体要素、手段要素、行为要素。 接着对行为所处的场景进行规范,包括行为发生的时间、地点和环境。 最后对行为的原因和结果予以说明。 这些内容要素为本体的阐释提供基础。 而在个人信息保护法律本体中对行为条款的理解无须保证各项内容的完整性,对行为规范的拆解是根据法律条文的实际情况进行的。 其三,概念框架。该框架强调具体的概念内容。 在法律领域,需要描述的概念通常是具体的法律术语。 这种类型被称为法律定义。 如“个保法”第73 条第1款中对个人信息处理者的定义。
在法律框架本体模型的指导下,对个人信息保护中内容进行拆解和组织共同构成法律知识,形成个人信息保护法律本体模型所需要的“实体”“关系”和“属性”,再结合规则逻辑的内容,共同构成人工智能辅助裁判的基础操作。
在对个人信息保护法律内容整理和分析之后,采用自上而下的方式结合专家经验构建个人信息保护法律本体模型,将个人信息保护法律本体模型划分为静态层和动态层,静态层是围绕个人信息保护中的基本概念和结构的界定。 信息主体、个人信息处理者和国家机关属于个人信息保护法律本体模型中的主体“实体概念”,个人信息是对象“实体概念”。 另外,为强调个人信息中所包含的具体内容,增加相应的属性信息,如个人信息是体现所包含的载体属性、风险度属性、匿名化属性和期限属性。 将这些要素划归静态层,因为这些内容贯穿个人信息的流转过程之中,不会因为法律关系的变化而消失。 动态层强调不同主体之间的法律关系的程序内容。 其变化主要围绕信息主体与信息处理者、信息处理者与其他信息处理者之间的信息流转。 其中共享、收集和处理等行为概念形成动态关系。 这些关系发展到不同的阶段对应的主体所保护的权益是不同的。
个人信息保护法律本体模型在满足基本的要素组成外,针对个人信息保护的特殊性,在本体构建中还应该强调三点内容:首先,信息主体、个人信息处理者、国家机关等主体和个人信息之间的组合和关系。 其次,个人信息保护所形成的法律关系既有人格属性也有财产属性,对两者的判断需要根据案件的发展情况进行。 最后,明确在法律关系中参与主体和客体以及各个主体参与关系的表现。
第一步,本体模型要表示信息的动态流转,动态流转是基于主体间的行为,行为的核心对象是个人信息。 在个人信息保护案件中,信息只有流通起来,才能产生价值并出现损害的可能性。 这种流通的个人信息始终处于常规的运动状态,因而形成了个人(信息主体)、个人信息、他人(国家机关、个人信息处理者)的动态关系。 在关系中个人信息是信息保护的对象,是贯穿信息案件的核心,也是司法裁判中认定的核心点。 在图1 中,不同主体之间形成信息流转的关系,在“信息主体—个人信息处理者”“信息主体—国家机关”关系中,国家机关亦可视为“个人信息处理者”而非发挥国家机关监管职责。 在这两个环节中,信息主体的请求行为和个人信息处理者与国家机关收集、处理行为被定义为行为关系。 图1 中,个人信息处理者向国家机关共享信息的过程是单向的,即国家机关利用企业技术或平台获得自己所需要的信息和数据。 而“国家机关—个人信息处理者”之间强调国家机关监管智能,发挥对个人信息的保护作用。 同时,国家机关和个人信息处理者之间同样存在信息共享的情况。 在本体模型的构建中,注意个人信息的流向和信息与主体之间的关系,形成了模型的动态层。
图1 个人信息保护法律本体模型之信息流转图
第二步,在动态层的基础上,信息的流动始终处在个人、个人信息、他人所形成的三维关系中,这种关系需要在具体案件中才会形成个人信息保护法律关系[34]17-30。 在对法律关系梳理的过程中,可以发现,个人信息的保护会从不同主体的角度去判断保护的重点。 之所以需要将主体拆开来看,是因为不同主体的利益保护在信息流转下有着较大的区别。 美国学者Nissenbaum H 认为,对个人信息的处理需“考虑各方的行动能力、信息类型以及信息在各方之间传递的原则”[35]14。 相较于行为本身,个人信息本身的内容同样组成判断和权衡各方主体利益的重要因素,图2 中将个人信息所涉及的“载体”“风险”“匿名化”“期限”等内容定义为属性,其中匿名化是个人信息的明确标注,所以现实中判断匿名化是评估个人信息受损的重要考虑点[36]877。 从信息主体的角度出发,具有多重行为如数据访问、数据更正、数据擦除、数据携带、数据拒绝、数据限制处理、反对数据自动处理等,这些行为丰富了关系的属性[37]。 对于信息处理者的行为与信息主体有重合和区分包括但不限于对个人信息的收集、存储、使用、加工、传输、提供、公开、删除等。 而国家机关若和信息处理者处于同一角色则具有信息处理的若干行为关系概念,但处于监管角色则具有监督和管理的行为实体。 由此可以发现,个人信息保护是判断实体之间利益大小的过程,而比较的关键就是哪一主体利益属于更重要的保护地位[38]29-38。 利益背后所代表的是行为关系,这些行为关系共同组成个人信息保护法律关系的客体,所以客体不只是信息处理者还包括信息主体和国家机关的行为。
图2 个人信息保护法律本体模型之法律关系图
第三步,个人信息保护法律本体模型需要识别出个人信息保护关系之上的责任承担情况,责任承担是“行为—责任”的递进,是对关系判断和比较之后的结果(见下页图3)。 个人信息涉及利益上,可表现为财产属性抑或人格属性,需结合具体场景进行类推判断。 具体的比较是对个人信息中财产属性与人格属性之间的重要性特征进行比较,确定个人信息的使用过程中哪一特征隶属于哪一主体利益[39]91-104。 当然人格属性只可能是自然人所具有,在个人信息保护法律关系中,侧重于财产属性还是人格属性是在法律关系中不断变化的。随着信息的流动,个人信息的属性会发生调整,根据制定的规则对不同主体下的个人信息内容进行比较,来判断个人信息的保护利益,如在信息共享中,信息处理者之间的责任承担是经济责任,不存在人格责任。 此外,关系中行为具有抽象化的特点,本体模型的构建将前述的行为关系化表示,形成若干权利来标注关系属性。 个人信息保护中要注意对各方主体权利义务的联系,形成可清晰的保护要点。 权利义务责任的概念也并非单独存在,在本体模型的构建中权利和责任除了和相关主体相连外,还要注意和间接关联的主体所形成的关联关系,在权利和责任之间建立连接。 同时,基于个人信息所蕴含的双重属性,在责任承担方面划分为民事、刑事和行政责任,不同责任会与不同的规范相连。
图3 个人信息保护法律本体模型之行为责任图
综上,个人信息保护法律本体模型构建是在理解并组织个人信息保护相关法律规范的基础上,形成分层的法律本体模型。 这种知识组织的形式不仅能实现个人信息保护相关法律知识的存储、共享和更新,还有助于跨领域、跨部门的法律知识融合。 在促进法律本体模型不断完善的同时还让计算机的逻辑更符合裁判的逻辑。
个人信息保护法律本体模型在具体的司法裁判场景下,发挥技术优势,为裁判正义提供新的视角和思路[40]102。 个人信息保护法律本体模型在法律咨询问答、量刑辅助和类案推荐的功能上发挥优化作用,提升人工智能辅助裁判的运行效率和保障输出结果的可靠性,并为法官理解具体功能提供路径。
个人信息保护法律本体模型在司法保障上的应用在于法官在知识检索上能够获得较为准确的法律知识,并为法官决策提供有效的信息,而非浪费大量时间对自己内容进行判断。 若信息检索的结果不如人意,法官也就没有必要去运用技术去辅助裁判。 法律咨询问答的准确度体现在检索的准确性上,省去法官自我甄别信息的过程,这就需要计算机能够对已有信息的准确划分和对检索信息的准确认定,二者共同作用下才能实现。 个人信息保护法律本体模型依照个人信息的流通情况构建,并专门建立“行为—责任”模型以及对个人信息的属性细致化划分。 对案例分析可以依照个人信息的流转情况提取出案例中蕴含的关键信息,把握和定位案例背景,理清案件发展逻辑和关联。 在此基础上,对已输入的案件内容进行整理,学习已有的裁判情况为提供准确的法律信息打好基础。
法律问答系统不仅需要答案准确,还要对提问能准确分析,利用个人信息保护法律模型的资源检索,使计算机通过了解输入内容背后的知识,在本体层面形成知识关系。 这种通过现象到本质,准确地捕捉到用户真正的检索意图,并以此在关联数据中进行搜索,从而更准确地向用户返回最符合其需求的搜索结果。 这种对信息的存储记录和精准抓取的优势,能够弥补法官在法律规定、类似案例等知识存储上的有限性[40]101。 例如,当用户检索“案例‘王某、深圳市腾讯计算机系统有限公司个人信息保护纠纷民事二审案’和案例‘柯某侵犯公民个人信息案’的共同点是什么”,将这句话输入到搜索引擎中,进行关键词匹配,很难得到用户想要的结果。 而在语义检索中,利用句法分析技术,识别这条检索语句中的主谓宾结构,首先是主体配对“王某、深圳市腾讯计算机系统有限公司”和“柯某”,都是对应的法律本体模型中的“主体”概念实体,在对象中在查找的案件中都是“个人信息”,往上延伸是本体数据库中的“对象”概念实体。 基于此,找到两个目标案件所在的节点,进而找到联通案件之间的路径。 如图4,可以看到目标案件之间存在两条路径,其中处于上方的路径显示,两个目标案件都包含法律规范《中华人民共和国网络安全法》。 处于下方的路径显示,目标案件都与另一个案件“邵某等侵犯公民个人信息案”相关联。 语义检索有助于提高用户的资源检索效率,降低用户用于分析和鉴别检索结果的时间及人力成本。
图4 个人信息保护法律本体模型之法律问答示例
综上,提供有效且可信的法律咨询问答意见是个人信息保护法律本体模型提供司法保障的重要功能。 针对个人信息的本体,围绕个人信息的要点展开分析和理解,让计算机更能准确地回答问题。 个人信息保护法律本体模型对概念和关系的把握能够整合法律资源,指引智能系统作出正确判断。
基于个人信息保护法律本体的司法保障要准确认定裁判依据。 个人信息保护法律本体模型在底层逻辑上为个人信息保护裁判构建法律模型,丰富的属性内容让人工智能辅助裁判的规则推理实现多重运行路径,保障计算机理解的准确度。量刑辅助功能针对的是个人信息的刑事案件,而个人信息在流通中,犯罪行为不是一步到位而是在不断的流通中逐步实现财产属性的剧增。 这就需要分清个人信息在案件中的发展情况,对不同环节下主体行为进行比较。 这种比较在非本体的数据库中是无法呈现的,因为计算机对信息的抓取是算法运行的结果,人类还无法判断这一过程是如何实现的。
在个人信息保护法律本体模型的指导下,信息流通过程和本体中的信息动态传递相匹配,计算机能够识别过程中的个人信息。 信息流转在关系模型中丰富行为属性,使得计算机能够在个人信息保护法律本体模型中找到对应点。 在对本体内容分析的基础上,进入到“行为—责任”模型中,将个人信息保护本体中的要素与行为条款和事实情节相联系,实现法律推理中大前提(法律规范)和小前提(案件事实)之间的关联。 在流通过程中区分行为和责任,有助于法官了解案件发生的过程,也为推理规则的运行提供基础。 在此基础上,对裁判规则进行提炼,保证推理规则和模型适配。 设置推理规则是专家经验的计算机化,围绕个人信息保护法律本体模型进行规则设定,如根据《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》,可以制定出用于侵犯公民个人信息的量刑规则(见下页表1)。 规则运用的熟练度也离不开机器的训练,尤其是例外规则的准确度。 而个人信息保护法律本体模型为计算机适用裁判规则提供符合个人信息流转情况的指引,从而使人们能够理解机器的运行原理,提升人们对程序的认可度。
表1 个人信息保护量刑辅助本体规则生成示例
综上,个人信息保护法律本体模型和规则推理,使得法律在机器中形成对话,在整合法律资源的同时,保障程序运行的正当性。 对量刑裁判中的规则拆分,可以让法官理解机器运行的原理,提升系统运行的透明度。 就司法保障而言,有助于辅助个人信息损害自动化判定,实现对案例的自动推理和批量化处理。
基于个人信息保护法律本体模型的司法保障,要求法官对个人信息保护案件裁判要点的清晰认识,作出正确裁判。 类案推荐是推荐与法官正在办案件最为相似的案件,是在对裁判要点理解的基础上,比对相似点所作出的判断。 推荐案件的可靠性一定程度上会影响法官对现有案件的判断。 在人工智能辅助裁判的环节中,计算机给法官在海量案件中找到相似案件的效率大大提升,但案件准确性还有待提升。 通常,法官裁判中判断是否类似的标准主要是案件情节、适用法条与争议焦点。 这些内容主观判断成分较大,尤其是案件事实蕴含多个要素点,法官的直觉可能存在偏见,无法全面认识案件事实。
个人信息保护法律本体模型是对个人信息保护案件所涉及的裁判要素的全面识别,根据已设立的裁判规则对案件之间、案件与规范之间全面比对[41]54-61。 计算机通过提取案件情节,对案情的分析上升到本体模型中,在“实体”“关系”“属性”中寻找相似点,并将相似点映射到实际数据库中寻找情节最为类似的案件,推荐给法官[42]46-53。 在个人信息保护法律本体模型中,本体模型中实体和关系蕴含丰富的属性,实体间存在多种关系,这种丰富的语义网为推荐相似点提供多点判断[43]418-436。 例如从案由、个人信息、法律规范、信息处理者等多个维度的实体、关系及属性,通过词嵌入的方式,将不可计算的文本转化为可计算的向量,计算语义相似度。 当案件在若干点相似性较高时,将这两个案件认定为相似案件,如图5 所示。 通过比较案件之间的相似性信息,用户可以找到相似案件。 通过对比分析案件的异同来加深对案件的理解、辅助案件的判断。 例如,由于案件都涉及到了“业主房源信息”,案件的相似性较高,因此可以判断“陈文辉等7 人诈骗、侵犯公民个人信息案”与“柯某侵犯公民个人信息案”为相似案件。
图5 个人信息保护法律本体模型之类案推荐示例
个人信息保护法律本体模型作为司法裁判的技术支持,在提升司法效率的同时,还要注重技术服务的准确度。 司法裁判的过程是法官不断判断的过程,人工智能辅助裁判“解放”了法官,使法官更为清晰有效地认知案件情况,更为方便地进行裁判活动,提升裁判效率,维护司法公正。 因此,技术除了要保障速度外,还需要保障质量。 个人信息保护法律本体模型让技术在推理中理解并模仿法律逻辑给予裁判程序上的依据,又让法官掌握技术裁判的运行机理,从而保障法官对司法裁判的控制和主导,避免陷入算法黑洞。
保护个人信息是保护人在数字领域享有的基本权利。 个人信息保护法律本体模型解决当下信息所产生的“眼见为虚”的难题。 个人信息保护法律本体模型将个人信息保护领域的概念、属性和关系进行整合并表示形成该案件的法律本体模型,来辅助系统识别和提取有关现实知识。 具体到司法保障方面,个人信息保护法律本体模型,根据个人信息的流转性特征,依照信息保护过程中的实际需求,针对性地提升法律问答的可靠度、量刑裁判的准确度和类案推荐的相关度,从而提升技术在司法裁判中应用的可靠性,辅助司法裁判,进一步为法官理解技术运行逻辑提供帮助。 法律本体模型是人类智慧成果转化、提升辅助准确性的重要环节,发挥人的主动性形成人机在司法领域的良性互动,提升司法裁判的效率,最终服务于中国司法公正的根本要求。