梁庆寅,魏 斌
进入20 世纪以后,诸如法律概念及规则的可废止性、规范义务属性、开放结构等具有法律特性的问题进入了现代逻辑的研究视野,现代逻辑在法律知识表达、刻画法律推理及论证、支持立法选择、生成法律专家系统和法律判决辅助系统等方面开始有所作为,其中一个方向逐步形成了“人工智能与法”的研究领域。在人工智能与法的研究中,建立适用于法律论证的人工智能模型成为当今的核心课题。这是一种基于人工智能逻辑的法律论证建模方法,其成果被用于刻画证据推理、法庭对话和论辩、诉讼证明等,受到人工智能和法学界的关注。
人工智能与法的研究始于20 世纪50 年代末。1958 年梅尔(L. Mehl)发表了《法律世界的自动化理论》,提出了法律信息修正理论①L. Mehl,Automation in the Legal World,National Physical,Laboratory,Vol. II,755—780,1959.。1970 年布坎南(B. Buchanan)和黑德里克(T. Headrick)发表了《关于人工智能与法律推理的思考》,成为人工智能与法研究的标志性文章②B. Buchanan and T. Headrick,Some Speculation about Artificial Intelligence and Legal Reasoning,Stranford Law Review,1970.。1977 年麦卡锡(T. Mc-Carthy)就美国税法构造了一个TaxMan 系统③T. McCarthy,Reflections on TaxMan: An Experiment in Artificial Intelligence and Legal Reasoning,Harvard law Review,90: 837—893,1977.,并在1981 年改进为TaxManⅡ系统,这是最早的法律论证形式化系统。
根据里斯兰德(E. Rissland)、阿什利(K. Ashley)和路易斯(R. Louis)的看法,人工智能与法的研究得以产生,主要是由于法律的若干特点引起了人工智能科学家的注意①E. L. Rissland,K. D. Ashley and R. Loui,AI and Law: A fruitful synergy,Artificial Intelligence,150(1—2) : 1—15,2003.。他们列出了以下特点:(1)法律拥有不同种类的知识,包括大量的案例、规则、理论、程序、概念和原则;(2)法律有清晰的结构和证成的标准;(3)法律允许不同类型的推理模型;(4)法律有具体的知识储存;(5)法律有多样的任务定位,包括主张、判决、计划以及执行等;(6)法律拥有开放结构的概念;(7)法律是一个通过对抗性过程产生真理的领域;(8)法律具有高度的自我反省特点。
笔者认为,人工智能与法研究的产生不仅与法律的上述特点有关。更直接的是与法律论证的特点有关。法律论证的特点为人工智能技术运用于法律提供了合适的条件,其特点包括:(1)法律语境下的论证活动是一个知识更新的过程,为通过建模来刻画法律推理过程中的知识表达提供了可链接的资源,并且知识库中的信息是可以得到不断修正的;(2)法律语境下的论证活动是一个开放的过程,大多数法律概念、法律规则是可废止的,本质上都是诉诸例外的,并且基于规则和案例的推理都是非单调的②经典逻辑是单调的,推理的单调性是指,如果一个命题可以从前提集合推出,那么加入任意命题到这个前提集合中都不会使结论发生改变。非单调逻辑是前提集合与结论之间的推论关系不是单调的那一类非经典逻辑,换言之,这类逻辑的前提集合的某些扩充会导致结论的改变,比如可废止逻辑和缺省逻辑都是典型的非单调逻辑。法律推理是可废止的,因为这种推理所包含的推论关系是非单调的,证据前提集合的某些扩充会使得原有结论发生改变。;(3)法律论证是允许不一致信息存在的,尤其是法律推理中的证据、适用规则、适用先例等都可以存在不同的观点;(4)司法程序为存在异议的对话或争论设置了公平严格的论辩程序,并且对程序实施的规则等有清晰严格的定义;(5)诉讼证明中的证明责任与证明标准将法律论证与日常论证区分开来,并用于判定法律论证的好坏。
进一步的问题是人工智能怎样应用于刻画法律论证。1997 年本奇卡朋(T. Bench Capon)提出,人工智能与法领域的法律论证建模可以分为③T. Bench Capon,Argument in Artificial Intelligence and Law,Artificial Intelligence and Law,Kluwer Academic Publisher,5: 249—261,1997.:(1)基于案例的法律论证建模,比如麦卡锡开发的TaxMan系统;(2)法律论证的表达和解释的建模,比如可用于表达论证结构的图尔敏模型(Toulmin model);(3)法律概念冲突等非单调问题的建模,比如普拉肯(H. Prakken)提出的比较冲突规则的可废止论证系统;(4)作为论证过程的法律论辩及对话博弈的建模,比如戈登(T.F. Gordon)提出的诉讼博弈模型。本奇卡朋的这一分类是按照模型功能及应用目标对已有的论证模型进行了归纳,但是从今天看来,这种分类已经不足以描述法律论证模型的新发展。根据新的研究成果,法律论证适用的人工智能模型可以分为框架模型(Framework)和语义模型(Semantic)两大类。框架模型如同逻辑句法,不考虑多个论证间的关系,关注的是论证的构造,包括定义逻辑语言、给出论证的构造方法、呈现两个论证间的攻击方式以及击败关系等;语义模型如同逻辑语义,考虑多个论证间的关系,关注的是论证的评价,通过分析多个论证间的冲突和辩护关系,判定论证的证成状态或证成度,从而反映论证的可接受性或可信度。
根据论证中所包含的推论规则是否可以被废止这一标准,可以将论证的框架模型分为演绎论证框架和可废止论证框架。这里介绍三种框架模型,并讨论如何运用它们分析特定的法律论证。它们分别是:刻画司法三段论的演绎论证框架、刻画法律可废止推理的ASPIC+论证框架和一种刻画法律论证渐进强度的可废止论证框架。
在大陆法系中,能够归结为三段论的演绎推理是法律推理的核心。因此,论证是清晰的演绎论证或者是简化三段论,成为审判阶段法律论证证成的必要条件。司法三段论是在法律规范得到确定、案件事实经过梳理的前提下,将法条应用于案例得出法律判决的演绎推理。巴斯纳德(P. Basnard)和亨特(A.Hunter)根据经典逻辑构造了一个演绎论证模型①P. Besnard and A. Hunter,Elements of Argumentation,The MIT Press,37—68,2008.,该模型可用于刻画司法三段论。模型语言以一阶语言为基础,增加了一些表达知识库Δ 的元素和算子。论证和反论证都是从知识库中得到的,Δ 内的公式可以表达确定的和不确定的信息,知识库的假定符合法律实践中信息的不一致性和法律推理的容错性要求。系统定义了基本的论证和攻击关系概念,给出了表达论证间关系的论证树。根据该系统的定义,容易构造一个适用于表达司法三段论的论证树:
笔者以威格莫尔(J. Wigmore)引用的三段论为例③J.H. Wigmore,A Student's Textbook of the Law of Evidence,Brooklyn: The Foundation Press,6,1935.:“大前提:如果一方当事人已经签约要为另一方实施某个行为,但是未能完成;小前提:被告签约需要为原告实施一个行为;结论:被告需要对原告承担违约责任。”从论证树看,这个论证的根是:〈{如果一方当事人已经签约要为另一方实施某个行为并且未能完成,那么她需要对另一方承担违约责任,被告签约为原告实施一个行为并且未能完成},被告对原告要承担违约责任〉。论证树也可以描述一个论证的反论证,由于演绎论证不具有可废止性,需要构造的是削弱一个论证的反论证(Undercuter),这种反论证是一种攻击大前提或小前提④由于演绎推理的保真性,攻击结论可以转化为攻击前提,故此处可以省略对攻击结论的反论证的讨论。此外,这里的削弱论证( Undercuter) 是一类攻击前提的论证,它不同于下面将介绍的可废止论证框架中的削弱论证,可废止论证框架中的削弱论证表达的是一类攻击推论关系的反论证。的论证。攻击大前提可以指出对大前提的解释存在分歧,或大前提表述的规则可能出现例外,以此说明所援引的法律规范不合适。攻击小前提可以指出小前提表述的案件事实存在争议,以此说明小前提援引的事实尚不确定。演绎论证框架不能表达包含实践推理、可废止推理的论证,但可以清晰地表达演绎论证及其反论证,同时能避免可废止论证框架禁止引入换质位推理等缺陷。
如果能够将所有的法律论证置于演绎论证框架之内,就可以将所有的法律推理和论证交给计算机处理。但是司法实践中的法律概念、规则往往可以做不同解释,而且往往是诉诸例外的,如果遵循演绎主义,每增加一次例外就重写一次公式,无疑会增加一阶公式表达的复杂性,因此需要另寻途径和方法。法律实践表明,将法律推理处理为一种非单调推理是有效的解决办法。非单调推理的实质是前提集的扩充能够导致结论的改变,而这种扩充是法律开放结构所允许的。在构建法律论证的过程中,随着运用于案例的法律解释的更新,使规则不断得到修正,并且随着新证据的加入,案件的法律事实也会随之改变,从而使得原来作为结论的法律判决发生改变甚至遭到反驳。所以,法律推理本质上是非单调的,而建立在法律推理之上的法律论证是可废止的,这种可废止性体现在一个论证能够被更强的论证所击败,即通过对前提、结论或推论关系的反驳,不断引入新的反论证,从而废止原论证。
随着非单调逻辑的发展,人工智能领域已经涌现出多个法律可废止推理的论证模型。这里着重讨论由普拉肯(H. Prakken)构造的ASPIC+抽象论证框架⑤S. J.Modgil and H. Prakken,A general account of argumentation with preferences. Artificial Intelligence 195:361—397,2013.,它尤其适用于分析论证的结构。该框架具有5 个特点:(1)引入严格推论规则和可废止推论规则,并且以是否包含可废止推论规则为标准将论证分为严格论证和可废止论证;(2)不仅定义了攻击结论的“反驳攻击”(Rebutting)和攻击推论关系的“削弱攻击”(Undercutting)①与演绎论证系统不同,这里的削弱攻击不是攻击前提的反论证,而是攻击推论关系的反论证。,还增加了攻击前提的“破坏击败”(Undermining)作为第三种构造反论证的途径②其中,削弱攻击和破坏攻击是非对称攻击,反驳攻击是对称攻击。;(3)引入反对函数“-”区分命题间的反对关系和矛盾关系;(4)将前提集细分为公理集、前提集、假设集和问题集四种不相容子集,并且以前提是否属于公理集为标准,将论证分为稳定论证和似真论证;(5)击败关系(即成功攻击)依赖于相互冲突的论证之间的偏好、可废止推论规则之间的偏好关系以及知识库中前提之间的偏好关系。ASPIC +抽象论证框架包含逻辑语言、知识库定义、论证的递归定义、攻击与击败的定义等,运用这个论证框架可以精致分析法律论证的结构,可以构造完整有效的论证,可以识别不同类型的论证。该论证框架运用于描述可废止的法律论证,其难点之一是找出恰当的可废止推论规则。普拉肯认为,从本质上说,论证图式不仅是对话博弈的工具,也应当被看作可废止推论规则③H. Prakken,On the Nature of Argument Schemes,London: College Publications,172—175,2010.,因此主张将论证图式④论证图式表达的是日常会话中论证的典型推理模式,适用于法律论证的论证图式是在法律语境下使用的典型论证。沃顿( D.N. Walton) 列举了26 种普遍的论证图式,其中适用于法律论证的论证图式包括诉诸专家意见、诉诸证人证言、诉诸人身攻击、诉诸承诺、诉诸正面及负面结果、诉诸先例或类比等图式。处理为法律论证中的可废止推论规则。例如,诉诸证人证言的可废止推论规则:如果处于某个位置的证人甲知道A 是否为真并且甲陈述A 为真(假),那么 A 假定为真(假)。诉诸专家证言的可废止推论规则:如果甲是包含命题A 的专业领域S 内的专家并且甲断定A 为真(假),那么 A 假定为真(假)。
庭审过程中的证据多是以证人证言和专家证言的形式展现。下面分析一个包含证人证言和专家证言的案例片段(记为“案例片段1”):令命题P 为“张某供述李某近距离开枪射杀王某”,命题Q 为“李某妻供述张某由于偏见证词不可信”,命题R 为“法医鉴定枪击非致命伤”。根据证人证言推论规则和专家证言推论规则,即可得出包含以P 为前提的论证结论S 为“王某死于枪杀”,包含以Q 为前提的论证结论W 为“张某在说谎”(或者表达为P ⊗S,即P 无法保证推出S),以及包含以R 为前提的论证结论¬ S 为“王某致命伤非枪击所致并且王某死于毒杀”。由论证定义可以得到论证:A1=[P];B1= [Q];C1= [R];A2= [A1⇒S];B2= [B1⇒W];C2= [C1⇒¬ S]。其中,论证 B2削弱攻击论证 A2并且论证A2与论证C2互相反驳攻击。进一步的,击败关系的定义诉诸于论证的偏好关系的比较:论证A 击败论证B 当且仅当A 反驳B 的子论证B’且有A 偏好于B’或者A 破坏B 且有A 偏好于Prem(B)或者A 削弱B。仍以“案例片段1”为例,如果A2偏好于C2,那么A2不仅攻击C2而且击败C2,并且有B2击败A2。可以看出,运用该论证框架可以有效地识别论证的结构以及两个论证间的攻击关系,这有利于在司法实践中构造有效的支持论证或给出强有力的反驳论证。
在庭审阶段,起、应双方在举证时需要尽量给出强度高的论证,而审方需要对论证的强弱作出判断,考量论证具有何种强度才达到相应的证明标准,根据论证的强弱指导裁决。因此,只比较论证的优劣是不够的,还需要评估前提支持结论的强度,以强度来表达法律论证的渐进性质更加符合法律实践的要求。ASPIC+可以描述和比较论证之间的优劣关系,但是不能刻画法律论证的渐进强度。下面笔者给出一种改进型的带渐进值的ASPIC+框架⑤QingYin Liang and Bin Wei,An argumentation model of evidential reasoning with variable degrees of justification. Legal Knowledge and Information Systems. JURIX 2012: the 25th Annual Conference. Amsterdam etc,IOS Press,71—80,2012.,这种框架模型可以刻画法律论证的渐进模糊性质。改进的论证框架将沿用ASPIC+的逻辑句法,内容包括逻辑语言、知识库定义、论证的构造方法、论证间的攻击关系等。修正的内容主要包括:
(1)前提以及推论规则的偏好关系替换为相应的赋值函数;
① v 是对推论规则的赋值函数,我们有v(r):r→[0,1]当r∈R 并且有v(r0)=1 当r0∈Rs。这里R=Rs∪Rd是一个由严格推论规则集Rs以及法律可废止推论规则集Rd所构成的集合并且Rs∩Rd=Ø;
② η 是对证据知识库K 中的前提的赋值函数,我们有η(A):A→[0,1]当A∈K 并且η(A0)=1当A0∈Ke。这里K=Ke∪Ka是一个由证据构成的证据集Ke以及由假设构成的假设集Ka所构成的集合并且Ke∩Ka=Ø。
(2)给出了一个计算论证强度的算法;V 是评估论证强度的函数且满足以下条件:
① 如果论证A ∈K,那么V(A)=η(A);
② 如果论证 A 形如 A1,……,An→/⇒Ψ,那么
V(A)=min{V(A1),……,V(An),v(n(Conc(A1),……,Conc(An)→/⇒Ψ))}①这里的n 表示一个将可废止推论规则转化为逻辑语言的命名转换函数。此外,Con( A) 表示论证A 的结论,而Prem( A) 表示论证A 的前提。。
以前述“案例片段1”为例,易得A1=[P],B1=[Q]以及C1=[R]为初始论证并且属于证据知识库。那么根据算法①易得V(A1)=η(P),V(B1)=η(Q)以及V(C1)=η(R)。假设论证A2、B2以及C2所包含的可废止推论规则的强度为 v(n(P⇒S))=ρ1,v(n(Q⇒W))=ρ2以及 v(n(R⇒¬S))=ρ3。那么根据算法②易得 V(A2)=min{V(A1),ρ1},V(B2)=min{V(B1),ρ2}以及 V(C2)=min{V(C1),ρ3}。
(3)给出一类直接攻击关系以及修正击败关系的定义;区分出一类特殊的直接攻击关系,这类攻击关系涉及论证本身,而不涉及论证的真子论证。以“案例片段1”为例,易得B2直接攻击A2,而A2与C2对称直接攻击。此外,击败关系的定义不再诉诸论证偏好关系的比较,而是通过比较论证强度来判定论证间的击败关系。我们定义:论证A 击败论证B 当且仅当A 反驳B 的子论证B’且有V(A)>V(B’)或者A 破坏B 且有V(A)>V(Prem(B))或者A 削弱B。以“案例片段1”为例,如果V(A2)>V(C2),那么A2不仅直接攻击C2而且击败C2,并且有B2击败A2。
除上述三种框架模型之外,法律论证的框架模型还有戈登等发展的Carneades 论证模型②T.F. Gordon,H. Prakken and D.N. Walton,The Carneades model of argument and burden of proof. Artificial Intelligence,171: 875—896,2007.、普拉肯与沙托尔(G. Sartor)的可废止论证框架③H.Prakken and G. Sartor,Logical Models of Legal Argumentation,Kluwer Academic Publishers,1997.、维黑杰(B.Verheij)的CummlA 论证模型④B.Verheij,Rules,reasons,arguments: formal studies of argumentation and defeat,Doctoral dissertation,University of Maastricht,1996.、本奇卡朋的加入听众的基于价值的论证框架⑤T. Bench-Capon,Persuasion in practical argument using value-based argumentation frameworks,Journal of Logic and Computation,13: 429—448,2003.、弗兰西斯卡托尼(Francesca Toni)等的基于假设的论证模型(ABA)⑥P. M. Dung,R. A. Kowalski,and F. Toni. Assumption-based argumentation. Argumentation in Artificial Intelligence,Springer,25—44,2009.以及贝克斯(F.J. Bex)等发展的结合论证和故事模型的复合模型⑦F.J. Bex,Arguments,Stories and Criminal Evidence: A Formal Hybrid Theory. Springer,Dordrecht,2011.等。
前述表明,框架模型可以分析论证的基本构成和论证之间的攻击关系。确定两个冲突论证之间的论证状态,比如两个互相反驳的论证A 与B,其中A 优于B 或者A 的强度大于B 的强度,那么A 是被证成的(Justified),而B 是被否决的(Overruled)①从形式论证理论上看,论证或命题的证成状态或证成度反映的是人们从认知层面对该论证或命题的可接受性的评估,这种论证的可接受性也常常被简单表达为论证的性质。例如,如果一个论证有最优证成状态或高证成度,那么人们对该论证的可接受性强度就高,论证的可信度就高。为简便起见,这里采用普拉肯的二值语义,将论证的状态表达为“被证成”和“被否决”两种状态。。但是法律论证往往表现为起、应、审多主体之间的理性互动,论证往往处于包含多个攻击关系的复杂网络之中。考量论证的状态不仅仅局限于比较两个冲突论证间的优劣,比如上例在两个互相反驳的论证A 与B 之外,加入一个反驳论证A 的论证C,并且C 优于A 或者C 的强度大于A 的强度,那么论证A 与B 的状态就发生了改变,即论证A 的状态变为被否决的,而论证B 的状态变为被证成的。因此,要确定一个论证的最终状态,还取决于这个论证与其它所有可能论证之间的博弈,这就要求对论证所在的复杂论证网络进行分析,对此框架模型是处理不了的,需要构造刻画论证复杂网络的语义方法。美国学者波洛克(J.L.Pollock)和泰国学者潘明栋(P.M.Dung)在这方面做了重要工作。波洛克提出了两种方法:一种是利用标记方法(多重赋值语义Multiple-assignment semantic)定义论证状态的理论②J.L.Pollock,Defeasible Reasoning,Cognitive Science,11: 481—518,1987.,另一种是计算命题证成度的渐进语义(批判链语义Critical-link semantic)。潘明栋提出了一种用于表达非单调逻辑程序,类似于缺省逻辑语义的扩充语义。潘明栋的扩充语义方法和波洛克的标记语义方法适用于刻画法律论证或命题可接受性的离散状态,而波洛克的批判链语义方法则适用于描述法律命题证成的渐进属性。
普拉肯认为潘明栋的抽象论证语义(即扩充语义)有三个特点③H. Prakken,An abstract framework for argumentation with structured arguments. Argument and Computation 1:93,2010. 普拉肯在近期的讲课稿中增加了一点,他认为抽象论证语义还可以应用于重构非单调推理。:一是为论证的逻辑后承概念提供了直观的语义刻画;二是将不同的系统转化为抽象形式加以精确比较;三是研究了论证系统的形式性质。概括地说,论证语义高度的抽象性决定了其强有力的描述性,适用于不同类型的可废止论证系统。该语义适用于法律论证的原因不仅在于具有高度的概括性,还在于相对于其它非单调逻辑的语义,这种以论证的可接受性为初始假设的特性更符合法律推理及论证的要求。评价论证不再仅仅诉诸于命题的真假或论证的有效与否,还需要考虑论证的可接受性,这就为考量形式之外的道德、价值、利益等因素留出了余地。
潘明栋扩充语义的核心思想是通过定义论证框架中一系列论证集的特性来揭示论证的不同证成状态。扩充语义的基本内容包括④P. M. Dung,On the Acceptability of Arguments and its Fundmental Role in Nonmonotonic Reasoning,Logic Programming and N-person Games. Artificial Intelligence,77: 321—357,1995.:(1)定义攻击关系:论证框架是一个二元对(Args,attack),其中,Args是一个有限论证集且二元关系为 attack ⊆Args× Args。给定论证集 X,Y ⊆Args,X 攻击 Y 当且仅当∃x ∈X且∃y ∈Y,使得(x,y)∈attack;(2)定义可接受性:论证A 是关于S 可接受的当且仅当所有攻击A 的论证都被S 中的某个论证攻击;(3)定义论证的扩充:①S 是可允许集当且仅当S 中的所有论证都关于S 可接受;②S 是偏好扩充当且仅当S 是极大可允许论证集;③S 是稳定扩充当且仅当所有不属于S 的论证都被S 中的某个论证攻击;④S 是完全扩充当且仅当S 是可允许论证集且所有关于S 可接受的论证都属于S;⑤S 是可靠扩充当且仅当S 是极小完全扩充。以ASPIC +分析“案例片段1”所得到的论证为例,可允许集合包括{B2}、{C2}以及{B2,C2};偏好扩充为{B2,C2};完全扩充为{B2}、{C2}以及{B2,C2};可靠扩充为{B2}以及{C2}。
相对于不同论证集合的类型特征,人们在实践中更为关心影响到论证可接受性的证成状态。扩充语义的特点是通过对可允许集合进行条件限制得到不同的扩充,从而由扩充的类型特征反映集合中论证元素的证成状态。比如,如果论证集合S 是可靠扩充,那么S 中的所有论证都是被证成的或不被击败的。显然扩充语义无法直接得到任意论证的证成状态,那么一种可直接被用于计算论证证成状态的语义在表达论证的性质方面要比扩充语义有效得多。这种被称为“标记语义”①先后有学者给出了不同的标记语义,这些标记语义的不同之处在于初始论证的标记赋值。例如,波洛克、普拉肯与弗里斯维克( G.Vreeswijk) 的方法都是二值的,卡米纳达( M.Caminada) 的方法是三值的,而雅克博维茨( H.Jakobovits) 与韦梅尔( D.Vermeir) 的方法是四值的。由于初始赋值不同,其刻画能力及范围也不同。的方法最早由波洛克运用于其多重赋值语义,该语义后来被雅克博维茨(H. Jakobovits)等证明与潘明栋的子扩充语义(Preferred Semantic)是等价的②H. Jakobovits and D. Vermeir,Robust semantics for argumentation frameworks,Journal of Logic and Computation,9:215—261,1999.。多重赋值语义是通过对论证网络中的初始论证赋值并经过运算后得到对应的值,从而直接区分论证的不同证成状态。该语义的基本定义包括③J. L. Pollock,Cognitive Carpentry: A Blueprint for How to Build a Person,MIT Press,Cambridge,MA,121—123,1995.:(1)定义一个推论图G(Inference Graph),它由表达论证结论的点(Node)、表达点之间攻击关系的攻击链(Defeat Link)以及表达点之间支持关系的支持链(Support Link)构成。攻击链和支持链都是由表达根(Root)的点联接表达目标(Target)的点。(2)定义点基(Node-basis)和点攻击者(Node-Defeater):点A 的点基是以该点为目标的支持链的根构成的集合,而点A 的点攻击者是以该点为目标的攻击链的根构成的集合。(3)定义推论图中的初始点:推论图中的某个点是初始点当且仅当该点的点基和点攻击者都是空集。(4)定义部分状态赋值:一个推论图中G 的点集合的赋值λ是部分状态赋值当且仅当①λ对任意初始点的赋值都是不被击败的;②λ对一个非初始点α的赋值是不被击败的当且仅当λ对点α的点基中的所有元素赋不被击败的并且对点α的点击败者中的所有元素赋被击败的;③λ对一个非初始点α的赋值是被击败的当且仅当λ对点α的点基中的所有元素赋被击败的并且对点α的点击败者中的所有元素赋不被击败的。(5)定义状态赋值:一个赋值λ是状态赋值当且仅当λ是一个部分状态赋值并且λ不真包含于其他任何部分状态赋值。(6)定义多重赋值:一个论证图G 中的点α是不被击败的当且仅当每个状态赋值都对α的赋值是不被击败的,否则α是被击败的。以“案例片段1”为例,由定义(1),易得{Q}、{P}以及{R}分别是点W、S 以及¬S 的点基;由定义(2),易得{W}是点 S 的点击败者,{S}是点¬S 的点击败者并且{¬S}是点 S 的点击败者;由定义(3),易得Q、P 以及R 都是推论图中的初始点,又由于初始点在任意状态赋值下都是不被击败的,那么它们的赋值都为不被击败的;由定义(4),存在非初始点W 的赋值λ0={不被击败的}是部分状态赋值,因为W 的点基中的所有元素都是不被击败的并且W 的点攻击者为空集。由定义(5),易得λ0是状态赋值,因为不存在其他部分状态赋值包含λ0;由定义(6),易得W 是不被击败的。同理分析可得S 是被击败的,而¬S 是不被击败的。
此外,在多种标记方法中,卡米纳达(M. Caminada)等的三值语义是一种最新的典型方法④M. Gaminada and D. Gabbay,A Logical Account of Formal Argumentation,Studia Logica,4,2009.,基本的定义包括:论证框架是一个二元对(Args,attack),标记是一个全函数:l:Args→{+,-,±}。l 是完全标记当且仅当任意论证A 都满足:①如果论证A 不被任意论证所攻击,那么l(A)= +;②如果∃B∈Args,使得(B,A)∈attack 且 l(B)= +,那么 l(A)= -;③如果∀B∈Args,使得(B,A)∈attack 且 l(B)= -,那么l(A)= +;④如果A 不满足以上三种情况,那么l(A)= ±。为更好地表达法律论证的状态,笔者按照状态对应的可接受性强度由强到弱将其分为:论证A 是完全证成对应于JS(A)={+},论证A 是弱完全证成对应于JS(A)={+,±},论证A 是可防御的对应于JS(A)={±}与JS(A)={+,-,±},论证A 是弱被反驳的对应于JS(A)={-,±},论证A 是强被反驳的对应于JS(A)={-}①这里的JS( A) 表示A 的完全标记集合。。以“案例片段1”为例,JS(B2)= JS(C2)= {+},JS(A2)= {-},故论证B2与论证C2是完全证成的,而论证A2是强被反驳的。
建模法律论证抽象结构的主要工作是确定论证所处的证成状态。在法律语境下,司法判决所依赖的论证往往被要求是完全证成的②冤假错案中,支持最后判定的论证都不是完全证成的论证,往往是弱完全与可防御的论证。在描述复杂案件的庞大论证网络中,如果某些弱完全或可防御的论证被伪装成完全证成的论证,必然是无法排除合理怀疑的,也就必然导致冤假错案的发生。判定论证证成状态的能行方法可以从形式分析的角度为避免冤假错案的发生提供一些帮助。,一个好的诉讼证明不仅要求起、应双方展示事实,找出符合的法条规则进行推理,而且还包含对论证进行防御和辩护以达到使博弈参与方确信的目的。因此在法律论证实践中,掌握判定论证证成状态的方法对整个诉讼尤为重要。
法律论证的可接受性仅仅表示为证成状态是不足够的,在司法实践中,人们更希望把握一个论证是可以被弱接受或强接受的,或者能以量化的方式评价论证的可接受性,这就需要引入计算证成度的语义,以描述法律论证的渐进可接受性。波洛克的批判链语义(Critical-link semantic)③J. L. Pollock. Defeasible reasoning with variable degrees of justification,Artificial Intelligence,133: 233—282,2002.就是一种用于计算可废止推理中命题证成度的恰当语义。
批判链语义是一种反贝叶斯语义模型④波洛克给出了一个简单的反贝叶斯模型的例子:考虑一个结论被多个独立证据支持,如果使用贝叶斯方法计算该结论的概率,将导致得到的结果小于单个证据支持结论的概率。,该语义用于计算包含支持链与攻击链的推论图中的命题点的证成度,适用于刻画法律语境下命题的渐进可接受性。该语义的特点是定义了一类新的被称为减弱关系的攻击关系,减弱论证(Diminisher)在无法完全击败目标论证的情况下仍然有能力削减目标论证的证成度,而这恰恰符合法律论辩的特性:怀疑论证尽管不能完全否定目标论证,但仍然影响目标论证的可信度。该语义的目的是计算命题点的证成度,其思路是通过递归定义推论图的更新方法以给出计算命题证成度的算法。该语义的基本定义包括:(1)定义推论/攻击路径:推论图中由点A 到点B 的推论/攻击路径是一个由支持链和攻击链构成的序列并且满足点A 是第一个链的根,点B 是最后一个链的目标,后一个链的根是前一个链的目标并且不存在内部循环的子路径。(2)定义点依赖:点A 是点B 依赖的(B-Dependent)当且仅当存在一个由点B 到点A 的路径。(3)定义循环路径:推论图中点A 的循环路径是一个由点A 出发回到点A 的推论/攻击路径。(4)定义点批判:一个攻击链是点A 批判的(A-Critical)当且仅当它是某个极小攻击链集合的元素并且使得剔除该集合中的所有攻击链足以去除所有点A的循环路径。(5)定义更新推论图:一个关于点A 的更新推论图GA满足条件:①删除在原始图G 中的所有点A 批判的攻击链;②使得点A 的点基中的所有元素都为GA中的初始点;③使得GA中所有点A非依赖(B-Independent)的点的证成度与它们在原始图G 中的证成度一致。(6)定义命题点证成度的算法:如果原始图G 中的点P 是由{B1,……,Bn}推出并且推论关系的强度为σ,D1,……,Dk都是点P 非依赖的攻击者并且Dk+1,……,Dm都是点P 依赖的攻击者,那么点P 的证成度为:J(P,G)=min{σ,J(B1,G),……,J(Bn,G)}~[max{J(D1,G),……,J(Dk,G)}+max{J(Dk+1,GP),……,J(Dm,GP)}]。可以看出,批判链语义可以更加精确地分析基于证人证言和专家证言的论证及其反论证。同样以“案例片段1”为例,得到的推论图G 表示为图2。其中,虚线箭头表示支持链,实线箭头表示攻击链。
图2
图3
由推论图(图2),易得命题W 削弱攻击命题S,命题S 与命题¬S 对称反驳攻击。图中存在S 以及¬S 的两个循环路径,S 是¬S 依赖的并且¬S 是 S 依赖的,由 S 到¬S 的攻击链以及由¬S 到 S 的攻击链都是S 批判的或¬S 批判的,那么在原始图G(图2)上更新得到的推论图GS以及G ¬s 都必须剔除这两个攻击链得到(图3)。假设可废止推论规则P⇒S 的强度为s1,Q⇒W 的强度为s2并且R⇒¬S 的强度为s3。命题初始点Q、P 以及R 的证成度赋值记为J(Q,G),J(P,G)以及J(R,G)。据命题证成度的计算公式,命题W 的证成度为J(W,G)=min{s2,J(Q,G)}。计算命题S 的证成度则需要更新原始图(图2)得到推论图 GS如(图3),那么命题 S 的证成度可表达为 J(S,G)=min{s1,J(P,G)}~[max{s2,J(Q,G)}+max{s3,J(R,GS)}]。同理,计算命题¬S 的证成度同样需要更新原始图(图2)得到推论图G ¬S亦如(图 3),那么¬S 的证成度可表达为 J(¬S,G)=min{s3,J(R,G)}~ max{s1,J(P,G ¬S)}。
波洛克的批判链语义可以计算命题的证成度,进而反映法律语境下命题的可接受性。但是该语义用于刻画法律论证还存在若干问题:(1)批判链语义是在由命题组成的推论图中定义、计算命题的证成度,但是法律实践不仅关注命题的证成度,还需要直观地判定(以命题作为结论的)论证的可接受性程度。要直观地得到论证的可接受性程度,需要的是由论证组成的论证图。(2)批判链语义容易导致一些反直观的结果①Bin Wei and H. Prakken,An analysis of critical-link semantics with variable degrees of justification. Proceedings of ECAI-12 Workshop on Computational Models of Natural Argument. Montpellier,France,39—43,2012.,例如,减弱攻击的数学性质及其定义会使强度相等的两个互相攻击的命题的证成度为0,但是在实践中,两个同等强度的命题即使在互相攻击的情况下仍然可以支持或攻击其它命题;又如,该语义处理削弱攻击和反驳攻击所采用的方法相同,然而攻击可废止推论关系的削弱攻击与攻击结论的反驳攻击是两种性质不同的攻击类型,需要对两者加以区分。(3)波洛克的系统中不包含攻击前提的攻击类型(ASPIC+称之为破坏攻击),因而他的批判链语义不能计算遭到破坏攻击的命题的证成度,该语义应当加入关于破坏攻击的算法。
为避免以上问题,笔者给出了一种新的基于论证图的渐进论证语义②Qing Yin Liang and Bin Wei,An argumentation model of evidential reasoning with variable degrees of justification. Legal Knowledge and Information Systems. JURIX 2012: the 25th Annual Conference. Amsterdam etc,IOS Press,71—80,2012.,这种语义可以通过计算论证的证成度来反映法律语境下论证的可接受程度。该语义的核心内容包括:(1)定义了一种新的论证图G(Argument Graph),论证图由论证、真子论证链以及论证间的攻击链三部分构成。在论证图的图示中,圆点形箭头表示论证间的真子论证关系,普通箭头表示论证间的攻击关系。(2)在论证图中定义了一类由论证点A 通达论证点B 的路径P(A,B),并且定义了一类由论证点A 通达其本身的循环路径P(A,A)。(3)给出了一种更新论证图的方法,这种方法通过剔除循环路径中的被称为点依赖(Node-Dependent)的攻击关系从而得到更新的论证图。(4)与前述的带渐进强度的ASPIC +框架相结合,利用该框架中的算法计算得到论证的强度并作为语义中算法的初始赋值,同时采纳该框架中诸如论证构造、攻击类型以及击败关系等概念。(5)给出了一种计算论证证成度的算法,这种算法可以处理任何带圈的复杂论证图中任意论证的证成度,该算法还包含了计算被破坏攻击的论证的证成度,并且对被反驳攻击的论证与被削弱攻击的论证加以区别处理。仍以“案例片段1”为例,得到的论证图G 表示为(图4)。
图4
图5
由论证图(图4),论证B2削弱攻击论证A2并且论证A2与论证C2对称反驳攻击。假设论证A2、B2以及C2所包含的可废止推论规则的强度为v(n(P⇒S))=ρ1,v(n(Q⇒W))=ρ2以及v(n(R⇒¬S))=ρ3。初始命题Q、P 以及R 的强度赋值记为η(Q),η(P)以及η(R)。由论证证成度的计算公式,可得J(B1,G)=V(B1)=η(Q)、J(A1,G)=V(A1)=η(P)以及 J(C1,G)=V(C1)= η(R);论证 B2的证成度为J(B2,G)=min{ρ2,J(B1,G)}。计算论证A2的证成度则需要更新原始论证图(图4)得到新论证图GA2(图5),那么论证 A2的证成度可表达为 J(A2,G)=min{p1~J(B2,G),J(A1,G)}~ max{p3,J(C1,GA2)}。同理,计算论证C2的证成度同样需要更新论证图(图4)得到新论证图GC2亦如论证图(图5),那么论证 C2的证成度可表达为 J(C2,G)=min{ρ3,J(C1,G)}~ max{ρ1,J(A2,GC2)}。
法律论证适用的语义模型有助于起、应、审三方在庭审阶段厘清思路,分辨出论证的证成状态或证成强度。以刑事审判为例,从审方的角度看,无论是大陆法系还是英美法系,都需要准确地判定起方支持其主张的论证是不是完全证成的或具有高证成度的,以衡量论证是否达到无合理怀疑或自由心证的证明标准。从起方的角度看,在英美法系中,起方首先需要给出支持其主张的可防御或弱证成度的论证以履行举证责任,从而达到微弱证据标准,为进一步履行说服责任,还需要构造支持其主张的完全证成或具有高证成度的论证以回应其反论证,以达到无合理怀疑的证明标准。从应方的角度看,应方需要识别出起方给出的论证是不是完全证成的或具有高证成度的论证,具体方法可以找出对应的反论证或者指出起方给出论证中存在包含于偶循环或者奇循环的子论证。
上面对法律论证适用的人工智能模型(框架模型和语义模型)做了介绍和分析。需要指出,对于法律论证模型,人们不仅关注它的构建和它对法律属性的刻画能力,而且关注基于论证模型生成的可视化软件及其在司法实践中的应用前景。这就推动了对法律论证应用系统的研究,并且产生了若干成果。应用系统是在法律论证模型①前文列举的最新框架及语义模型都已有对应的可视化软件。例如,亨特等在其演绎论证模型基础上开发的基于命题逻辑的应用论证系统JArgue;戈登等在其Carneades 框架上开发的一种开源的Carneades 论证系统;马克斯奈斯(M.Snaith) 在ASPIC+框架上开发的ASPIC+证明机。而有关潘明栋( Dung) 的论证语义,已经存在诸多应用软件,比较典型的有:邓迪大学论证研究小组开发的Dung 图计算工具;卡米纳达等开发的基于标记语义的论证应用系统等。的基础上,结合不同的司法实践目的,利用人工智能技术和计算机编程技术生成的软件系统。已有的研究成果随着应用的推广也逐步在司法实践领域发挥作用。总体而言,对法律论证应用系统的研究,大陆法系更注重基于规则的推理(RBR)的论证系统,英美法系更注重基于先例的推理(CBR)的论证系统。当前应用系统研究所涵盖的内容已经不局限在法律论证与法律推理的可计算建模,还扩展到法律知识获取和表达、法律规范概念和司法行为的表达、规范系统以及多主体系统的表达等方面。按照应用目标的不同,法律论证的应用系统可以分为基于法律规则的系统、基于先例的系统、基于对话和论辩的系统以及图解论证系统①( 一) 基于法律规则的论证系统主要有:1988 年吉野( H.Yoshino) 与北原( M.Kithahara) 给出的通过比较规则间的偏好以解决不相容规则间冲突的系统;1989 年哈姆雷特( A.Hamfelt) 与巴克朗( J.Barklund) 开发的基于DEMO 谓词逻辑元程序的系统等。(二) 基于先例的论证系统主要有:1977 年麦卡锡就美国税法构造的第一个法律论证形式化系统TaxMan 并在1981年改进的TaxManⅡ系统;里斯兰德与阿什利于1987 年提出的第一个利用法律先例建模论证及对话的HYPO 系统;里斯兰德与斯卡拉克( D. Skalak) ,阿什利与埃里温( V. Aleven) 在1992 年分别在HYPO 系统的基础上发展的结合RBR 和CBR 的复合系统CABARET 系统和CATO 系统等。( 三) 基于对话及论辩的论证系统主要有:加德纳( L.Gardner) 于1987 年就美国合同法构造的可以区分简单与复杂问题的问题识别模型;戈登于1993 年就美国商务法规提出的诉讼博弈模型;洛德( A.Lodder) 发展的较戈登的诉讼博弈模型刻画能力更强的Dialaw 模型等。( 四) 图解论证系统主要有:维黑杰基于框架模型CumulA 的Argue! 系统以及基于DeFlog 的ArguMed 系统;里德( C.Reed) 与罗韦( G.Rowe) 合作开发的描述双极论证模型的Araucaria 系统;本奇卡朋与斯坦尼福德( G.StaniFord) 的法律支持系统PLAID;布拉克( van den Braak) 结合论证与故事的复合模型,用于分析刑事调查过程的Aver 系统等。。
为了完善对法律论证适用的人工智能模型的建构,当前对法律论证模型的研究开始呈现一些新的趋势:(1)继续拉近抽象论证模型与自然论证的距离,针对自然论证的特性不断完善抽象模型,服务于司法实践。例如,本奇卡朋发展了一种加入听众因素(听众包括审方)的基于价值考量的论证模型。柯洛司沃特(J. Crosswhite)与福克斯(J. Fox)等提出了构造修辞论证的可计算模型的设想②J. Crosswhite et al,Computational Models of Rhetorical Argument,Argumentation Machines,Kluwer Academic Publishers,175—210,2004.。(2)引入贝叶斯网络等数理方法,更精细地对法律论证进行讨论。例如,普拉肯主持了“设计并理解包含论证及情境的法庭贝叶斯网络”研究项目③参见网页 NWO Project: “Designing and Understanding Forensic Bayesian Networks with Arguments and Scenarios”.http: //www.nwo.nl/nwohome.nsf/pages/NWOP_88LEP8_Eng.,旨在发展一种基于贝叶斯网络技术的规范方法。该方法的应用将有助于避免因使用统计证据所引发的错误。(3)继续与新证据科学相结合,进行交叉研究。例如,贝克斯(F.J. Bex)等结合论证模型和故事模型提出了一种复合模型,用于辅助刑事案件侦查,同时为解决最佳解释推论(IBE)难题提供了一种新的方法。
法哲学家佩策尼克(A. Peczenik)说:“在法律论证的实践体系中,经常发生一种非演绎性的跳跃④A. Peczenik,On Law and Reason,Spinger,96,2009. 佩策尼克认为从一个前提集 S 到一个结论 q 的跳跃发生当且仅当q 不能演绎地从S 中推出,并且不能以前提集S’满足以下条件的方式来扩张或改变S:(1) 结论q 从S’中演绎推出;并且(2) S’必须仅由已考虑语境下的确定前提、假设前提以及已证前提所构成。……法学家在法律语境下的实践行为需要这种跳跃,而哲学家必须为此提供更精确的法律逻辑理论、法律证成理论、法律认识论以及法律本体论。”⑤A. Peczenik,Scientia Juris: Legal Doctrine as Knowledge of Law and as a Source of Law,A Treatise of Legal Philosophy and General Jurisprudence,Springer,92,2005.人工智能与法的研究,正是源于司法活动的实践。随着计算科学和人工智能技术的发展,法律论证的人工智能模型将进一步完善,更加贴近司法实践的要求。