因果逻辑的“演绎之困”与因果结构模型理论的兴起

2022-09-02 12:17任晓明
哲学分析 2022年4期
关键词:结点演绎推理刘易斯

任晓明

近三百年来,因果逻辑和哲学研究可谓命运多舛。19世纪之前,人们普遍认为我们对于物理世界的理解是围绕着“因果”概念和普遍的“因果原则”构建起来的,科学研究离不开因果问题,追寻原因甚至成了人生的最高追求。然而,到了19世纪末,主流物理学家和哲学家都认为,因果概念只是前科学的产物,应该把因果概念从哲学词汇表中请出去。20世纪早期,相对论和量子力学的兴起,好像有预谋似的打破了因果决定论的神话,因果逻辑和哲学的研究逐渐淡出人们的视野。20世纪中期以后,因果逻辑和哲学概念在分析哲学中的重要性才逐渐显现,开始用分析性的演绎逻辑对因果关系作条件句逻辑分析,但是研究发现,用实质蕴涵式来“转译”反事实因果条件句会出现实质蕴涵怪论,等值代换也不能必然保真。为此,有逻辑学家主张另起炉灶,采用一些新型的蕴涵式,比如反事实蕴涵、因果蕴涵等,以适当地刻画反事实因果条件句。然而这些尝试都面临一个共同的困难:用具有演绎特性的条件逻辑来刻画具有非演绎特性的因果推理总有一些不适当甚至违反直观的问题。正是在解决这些问题的过程中,因果逻辑和哲学研究得以艰难地向前推 进。

因果逻辑研究如此举步维艰的原因是什么?这是一个值得深入探讨的问题。本文主要探讨因果研究所面临的逻辑哲学问题,试图揭示因果推理面临的“演绎之困”,即尝试破解因果推理研究面临的保真与保义、有效性与信息性难以兼顾的两难,探讨如何在外延适当性与内涵适当性、扩大性与非扩大性、单调性与非单调性之间保持张力的问题,揭示因果模态方法和反事实方法的局限,凸显因果结构模型在理论上和应用上的优势,展望因果逻辑发展的未 来。

以下我们讨论几种有代表性的研究方法。首先讨论因果模态逻 辑。

一、旧瓶新酒:因果模态逻辑的困厄

因果模态逻辑是对一般模态逻辑的类比。计算机科学家、哲学家阿瑟·勃克斯(Arthur Burks)以类比作为方法论武器,“使得原先在一般模态逻辑中行之有效的演算和可能世界语义学,都顺利地类推到因果陈述即因果模态句”。简言之,他用模态逻辑工具“将归纳化归为演绎”。他首创了“因果蕴涵”“因果必然”“因果可能”“因果可能世界”等新概念,并建立了一个因果陈述句逻辑的公理系统。因果陈述句逻辑的公理系统继承了经典逻辑的基本内核,它由非模态性的一阶谓词理论(或不带等词的一阶函项演算)加上关于逻辑模态词(“可能”“必然”)与因果模态词(“因果可能”“因果必然”)的演算而构成。这个公理系统的特点是:第一,经典一阶谓词逻辑成为它的一个特例(无模态词);第二,因果陈述句逻辑作为公式、规则、定理和证明组成的形式语言已经有了一套关于公式、定理、规则和证明的判定算 法。

总之,勃克斯在因果逻辑研究相对低迷的背景下试图重振因果研究雄风的探索是难能可贵的。但是他并没有根本扭转因果逻辑研究的颓势。主要原因在于,因果陈述句逻辑只是在经典逻辑基础上加上模态算子而形成的扩展型演绎逻辑。为了规避实质蕴涵怪论问题,它不得不增加若干规避蕴涵怪论的规则和附加条件,这使得它的形式系统不必要地复杂化,也使得它的解释力较弱,可应用范围大受限制,因而它似昙花一现,并没有引起学界的持续关注。它给学界留下的深层困惑是:(经典)演绎逻辑是不是刻画因果推理的适当工 具?

既然有此困惑,那么学界为何都把演绎法作为刻画因果关系的首选?这是因为,现有的逻辑中发展相对成熟的只有经典演绎。只此一家别无选择。就像人工智能界流传的一个故事所说,月黑风高之夜,警察问一位在路灯下找钥匙的年轻人:为什么在这里找?回答是:这里灯亮!显然,演绎就是那茫茫夜空中唯一的一盏明灯。正是因为这一原因,自诩经验论传人的英语哲学界,在第二次世界大战之后,却成了强调分析性的演绎哲学的大本营。可见,因果推理的演绎化研究面临的困境有其深刻的历史根源。这是由演绎逻辑的性质、研究范围和限度所决定的,也是由因果逻辑具有不同于演绎逻辑的特殊性决定的。为此,我们有必要探讨其渊 源。

数学史、科学史和哲学史表明:几千年来,演绎推理一直在人类智力探索的各领域中占据重要的地位。在古希腊,欧几里得《几何原本》和亚里士多德的《后分析篇》是演绎逻辑的典范。在这一典范之下,人们从不言而喻的真理即公理出发,通过演绎推论从这些真理中逐步推导出更多的真理。在科学界,欧几里得模式和亚里士多德模式几千年来一直具有强大的影响力,是经典的数学和科学概念的代表。在哲学界,著名哲学家都借助欧几里得几何学来发展其哲学体系,最突出的代表前有斯宾诺莎的《理智改进论》等著作,后有卡尔·亨普尔(Carl Hempel)和保罗·奥本海姆(Paul Oppenheim)的演绎—律则模型。实际上,演绎法在科学界和哲学界具有这样显赫的地位并不奇怪,因为它具有确定性的诱惑力,它承诺可以为科学和哲学提供不可动摇的基础。但在因果推理中,这种确定性的保证将大打折扣。因果陈述句逻辑的兴衰沉浮就是明 证。

随着研究的深入,人们逐渐发现,因果推理显然具有不同于演绎推理的特 点。

第一,因果推理是基于经验的推理,因果律只能经验地(即诉诸经验)发现。但是我们的经验总是与特定情形、特定现象以及现象的特定次序有关。我们能够观察到一个特定事态(比如C)下的几个事例,我们观察到的事例也能够被一个特定种类现象(如P)的一个事例所伴随。但是我们未来能够经历的仅仅是世界上事态C中的一些事例,这些考察能够展示给我们的仅仅是P伴随着C的一些事例。然而,我们的目标是建立一个普遍的因果推理。我们如何能够从我们经历的特定事例中,得到C的所有场合下都有P这样的普遍命题?事实上,因果推理不具有演绎推理那样的普遍性,至多具有相对于一定语境的普遍 性。

第二,演绎推理所具有的必然保真性也是因果推理不具有的。因为演绎推理的表现形式虽然千差万别,但其核心特点很明显——必然保真。像数学证明一样,演绎推理通过“一连串仔细的步骤,每一步都从假定的或先前证明的陈述以及先前的步骤中逻辑地推出来”。例如,若西西是一只猫,所有的猫都是动物,那么西西就必然是动物;只要前提为真,结论就必然真。这一属性通常被称为必然保真性(necessary truth-preservation),它是区分演绎推理与其他类型推理的依据和标准。尽管在(非经典的)相干逻辑中,必然保真只是演绎有效性的必要条件而不是充分条件;但在经典逻辑中,必然保真仍然是有效性的充分必要条件。相反,因果推理即便具备了休谟所质疑的因果必然性,也不能保证它具备了这种演绎意义上的必然保真 性。

第三,任何推理(包括演绎推理)都应该具有让我们从已有信息中推出新信息的功能;换句话说,我们期望论证和推理具有扩大效应,从而具有信息性。但这样一来,我们马上就会遇到新的问题:如果前提的真实性必然导致结论的真实性,那么结论的内容就会以某种方式包含在前提的内容中。这就触及演绎推理令人困惑的核心问题:既然必然保真是演绎的最重要特征,那么它何以既是有效的又是有信息的?这就是所谓“推理的怪论”(the paradox of inference)。换句话说,在演绎的有效性和有用性之间似乎存在着一种内在的紧张关系,因为它的必然保真的核心特征正是使它最终成为非信息性的根源。可见,要使我们的推理获得原创性,单凭演绎是难有作为的。只要推理(包括演绎推理)的首要目标是为了产生信息增益,那么无用性的威胁就会一直存在。

事实上,即使有可能对演绎推理的信息增益制定一个令人满意的说明,应用演绎推理的代价仍然很大——因为在演绎论证中,前提若要完全排除结论的非真理性,通常需要大量的信息输入来获得少量的信息输出。在多数情况下,现有的信息不足以推出一个演绎性的结论。在现实生活中,演绎推理所提供的高度确定性往往是不需要的;在这种情况下,我们只需要知道的只是,在没有任何异常情况发生的背景下,从现有的信息中可能得出的结论。这就是因果推理面临的“演绎之困”(the trouble with deduction)。

二、改弦易辙:因果推理反事实进路的探索

与因果陈述句逻辑昙花一现的结局相映成趣的是反事实因果推理的历久弥新。因果推理的反事实进路是当代学界持续关注的研究进路。大卫·刘易斯(David K. Lewis)提出的“反事实进路”(counterfactual approach)吸取了以往研究的经验教训,更多地考虑到反事实因果条件句不同于一般因果陈述句的特点,具有一些理论上的优 势。

刘易斯的探索是建立在休谟对因果关系的深刻思考之上的。休谟将因果关系还原为两类事件在经验上的恒常联结(constant conjunction)。更具体地说,两类事件之间的因果关系事实上是由经验中的三个条件产生的:(1)时空毗邻;(2)时间前后相继;(3)两类事件恒常联结。然而,休谟的因果论无法适当地处理一些案例,例如无法区分真正的原因与结果、副现象以及被先占的潜在原因(preempted potential causes)之间的区别。与休谟不同的是,刘易斯把自己限定在特定事件之间的因果关系上,也就是说,他谈论的是个例事件c和e,而不是谈论事件类型C和E。

刘易斯认为,以上问题出现的共同原因在于休谟式规则性解释是一种经验概括,而因果关系则具有某种模态效力。基于这一基本思路,刘易斯从反事实条件句入手,给出对因果关系的定义,有两个要点:第一,定义事件之间的反事实依赖(counterfactual dependence)关系,并用反事实依赖关系来建立起事件之间的因果链条(causal chain),继而定义并刻画因果关系;刘易斯的理论分两步走:他先定义了他所谓的因果依赖,然后才是因果关系本身。以下是他对因果依赖的定 义。

简而言之,“e是否发生,取决于c是否发生”。在这里,因果关系完全是以反事实条件句的依赖性来阐述 的。

第二,用反事实条件句表达事件之间的反事实依赖关系,并通过确定可能世界基于比较相似性(comparative similari)的排序来刻画反事实条件句的真值条件。这样一来,通过判定某反事实条件句的真值情况就可判定相应事件间因果关系的有无。刘易斯的因果理论关注实际事件(actual event)间是否具有因果关系的问题,而判定是否具有因果关系的关键是对相应反事实条件句真值的判定。因此,两个事件之间具有反事实依赖关系,当且仅当由相应命题构成的反事实条件句为 真。

刘易斯的反事实句的公理系统可概述如下:

(1) 所有真值函数的重言式(永真 式)。

在帕尔看来,刘易斯的公理可以“翻译”为珀尔因果结构模型的公理,比如将刘易斯的世界等同于一个因果模型中所有变量的实例。分配给因果模型中变量子集的值将代表刘易斯的命题(例如上述规则和公理中的A和B)。可见,刘易斯逻辑理论为因果结构模型理论奠定了逻辑基 础。

刘易斯给出了基于可能世界相似性比较的语义解释。首先,他以一种可能世界间的总体比较相似性(comparative over-all similarity)关系作为初始概念。它描述的是可能世界间的一种三元关系:世界w相对世界w而言,与现实世界w的相似程度更高或更低。进一步,他基于比较相似程度的高低来为可能世界与现实世界距离的远近进行排序:与现实世界相似度越高的可能世界距离现实世界越近,相似度越低则距离越远。因此,比较相似性表达的是一个可能世界相对于其他可能世界而言,是否更接近或最为接近现实世界。但是,比较相似性作为一个含混的概念,一直面临质疑和诟 病。

面对种种质疑,刘易斯承认,每一个可能世界都是一个极为复杂的系统,对其相似性的比较并不存在唯一合理的标准——在比较成都和重庆两座城市的相似性时,选择其结构功能或风土人情等任何一方面作为标准都是合理的,尽管得出的结果不同。因此,可能世界比较的模糊性不可避免。不过,他还是可以给出一些清晰而容易理解的描绘参数,根据这些参数,就能通过排序和加权刻画大多数可能世界比较的确切结果。但是,可能世界排序方案和加权比较系统的引入,使刘易斯的反事实因果理论同样遭受了许多批评。比如,对于刘易斯的相似性测度问题,有没有一种客观方法来确定那些世界最接近我们的世界,这是尚存疑问 的。

实际上,因果推理反事实方法面临困局的深层原因是多方面的,主要 有:

第一,因果推理在多数情况下具有非单调性特征,这与演绎逻辑的单调性是冲突的。具有单调性的演绎逻辑难以刻画具有非单调性的因果推理。反事实因果进路没有考虑到因果推理这一特殊性。非单调性体现在,如果从A和B到C的推理是有效的,那么添加任何任意的前提D都不会阻止从A、B和D推出结论C的推理。单调性是从必然保真中如此直接导出的:必然保真所确保的是,在所有A和B都是如此的情况下,C也必然如此。当然,这也包括所有A、B和(任何任意的)D都是如此,C也必然如此的情况。因此,在前提A、B中增加任意一个新前提D,仍将必然推出C。然而,因果推理等非演绎推理,不仅缺乏必然保真性,而且缺乏单调性。换句话说,在因果推理中,前提即使是真的,结论也不一定真。因果推理具有演绎推理所不具有的可废止性(defeasibility)。在可废止推理中,前提虽然赋予结论以一定的合理性和支持,但有关论证可能被新加入的信息所废止。既然演绎推理具有必然保真性和单调性,那就从根本上与可废止推理的原则相悖;如果要对这种因果推理进行建模,结果很明显,必然保真和单调的演绎逻辑不能担当 此 任。

第二,作为一种日常推理的因果推理具有不同于经典演绎推理的特征。演绎的形式化,尤其是由弗雷格、罗素和希尔伯特发展起来的演绎逻辑,与数学证明中实际使用的演绎形式相去甚远。虽然我们通过演绎形式化取得了相当的形式优势,但是与实际的日常推理拉开了差距。为此,需要建立一个尽可能接近实际推理的系统。在日常推理的特定系统中有一些不言而喻的规则。为了证明这些规则的合理性,通常需要诉诸认识论和/或语言学论据:这些规则的正确性来自所涉及的(逻辑)术语的含义本身。因此,有学者认为,这些规则,与其说是应该保真,不如说是首先应该保义。也有学者指出,在个别推理中,从前提到结论的过渡所保留的只是争议,而不是真理。尽管必然保真性提供了高度确定性的承诺,但在大多数情况下(在现实生活中),这种确定性很可能是多余的。

第三,对因果关系的逻辑刻画必须在外延适当性和内涵适当性(extensional and intentional adequacy)之间保持必要张力。哪一类的因果理论是外延适当的呢?回答是:根据相关理论,“所有且只有那些我们直觉上认为是因果关系的事件序列或过程才算作因果关系在外延上适当的情况”。然而,早期和晚期的抢先、双重阻止、缺席和遗漏之类的问题,使我们的因果理论很难在外延上完全适当。另一方面,一个因果关系理论是内涵适当的,仅当我们(或大多数人)把前理论阶段与因果关系相关联的老生常谈(platitudes)纳入理论。与这种因果关系理论相联系的特征包括:原因先于结果;结果不会同时引起其原因,即因果关系是不对称的;原因产生结果;结果反过来取决于原因,等等。因此,因果推理研究应该在外延适当性和内涵适当性之间保持必要张 力。

总之,在因果研究的语境下,对演绎推理的非扩大(non-ampliative)性、非信息性的担忧始终存在,因果推理的演绎进路的限度和短板时不时困扰我们。解决这一问题需要因果观念的重大转变。这一革命性转变是从朱迪亚· 珀尔(Judia Pearl)开始的。珀尔对因果推理的数学化、模型化研究使因果推理面临“演绎之困”的局面有了根本的转变。从实际因果出发,跳出保真与保义、有效性与信息性、单调性与非单调性的二元对立,兼顾确定性与非确定性,有助于解决因果推理中的 难 题。

三、重大转变:因果结构模型方法的兴起

为了应对刘易斯反事实因果面临的不对称性、传递性等困难,珀尔系统地给出了因果结构模型。他利用结构因果图、do操作、干预和反事实分析等概念,提出了全新的形式化理论。珀尔的工作使得我们从事实或事件回到抽象的模型。在珀尔那里,因果关系可以被铸成所谓的结构方程。例如,如果药物治疗确实有效,我们可以以最简单的形式写出以下方程:R = f(T),这意味着康复是药物摄入量的一个函数。在我们的简单模型中,T和R都只能取1和0的值。期望的结果是R=f(T)=T,即康复和药物摄入是正相关的。正是依靠这种抽象,因果概念“从一个笼罩着神秘色彩的概念转变为一个具有明确语义和逻辑基础的数学对象”,经历了一次因果观念的重大转 变。

珀尔研究的目标是,借助规则和算法从观察数据中成功推断出因果关系。他的基本思想主要包 括:

第一,“因果以及有关的随机化、混杂、干预等概念并不是统计概念”。因果概念比统计概念更基本。这是贯穿珀尔因果演算和因果结构模型的基本原理。作为贝叶斯网络之父,珀尔对曾经对统计概念和统计推理抱有很高的期望,但是他后来坦承:“今天我的观点已经非常不同,现在我认为因果关系是客观世界的实在性和人类理解这种实在性的基本构件,并且认为概率关系只是因果关系的表面现象,而因果关系才是我们理解世界的基础和推动力。”

第二,“在任何因果结论背后一定有某种未经检验的因果假定”。这种假定包括“共同原因原则”“独立因果机制原则”和“个体处理结果不变假定”等。正是这些假设奠定了因果推理的哲学基础,基于这些假设,因果分析的数据支持与数据的数量无关,这就为小数据基础上的因果分析创造了条 件。

第三,“反事实是在最邻近世界中的替换操作”。以往的反事实定义要么含义模糊,要么难以识别,并没有严格区分现实世界与可能世界。有些定义用自然语言描述,难以转化为数学公式,不便于计算。珀尔的定义则语义明确,易于在计算机上运算,与常识较为吻合,便于应 用。

珀尔的模型概念具有其独特的含义,它具体表现在这种“模型”是对现实世界的一种理想化描述。它往往突出现实世界的一部分而忽略其他部分。然而,在逻辑系统中,模型是一个数学对象,它为给定语言中的语句指派真值。比如,真值表是命题逻辑中的模型,它为每个布尔表达式指派一个真值,以表征目标域中的一个事件或者一组条件。同样,因果模型是表征因果关系的数学模型,能够为表征因果关系的语句赋予真值。这些语句包括行动语句:如果我们实施行动B,则A将是真的;反事实语句:假如不是B,那么A就不会为真;简单的因果语句:A导致B或由于A而发生B。在珀尔看来,“这些语句不能用标准的命题逻辑或概率演算来解释,因为它们描述的是外部世界发生的变化,而不是刻画关于静态世界信念的变化”。在他看来,因果模型通过改变机制的表征来编码和区分外部变化的信息。这是因果模型不同于经典逻辑的一个主要特 征。

珀尔指出,科学思想的基础是反事实推断,“反事实推断可以表征因果关系,但是它很难用逻辑、代数方程等标准数学语言来形式化”。因此,因果关系研究需要一种新的形式化语言,在这种语言中,表征这个世界的不变(恒常)关系与表征一个人对于这个世界信念的非恒常关系是有区别的,但这种区别无法用标准代数,比如方程代数、布尔代数来表示。因果结构模型可以表示这种区 别。

因果结构模型包含因果图、结构方程和反事实。这种因果结构模型有对应的逻辑结构。逻辑中的命题可对应于因果模型中的结构方程,结构方程可转化为命题。在经典逻辑中,实际发生的情形可表示为命题,比如单个事件的情形可表示为原子命题p,多个事件的情形或者事件的某种关系可表示为复合命题。在因果模型中,赋值变元X= x可模拟实际发生的某种情形或者某个事件,结构方程X= x对应于原子命题p,也可直接将结构方程X= x作为原子命题。事件间的关系即变元间的关系可表示为结构方程,比如X = Y,表示Y决定X,可转化为条件句“如果Y,则X”,对应于条件句Y→X。结构方程X=Y也可表示X和Y之间具有等值关系,对应于命题X↔Y。同时,因果模型中引入逻辑联结词¬、∨、∧、→和↔联结单个结构方程组合成复合命题,比如X=Y∨Z即X=Y∨X=Z,表示Y决定X,或者Z决定X,对应于复合命题p∨q。同样,同一变元X取不同值构成不同的结构方程,比如,X=1 表示事件X发生,X=0 表示事件X不发生,表示两种不相容状态,不可同时出现在同一系统中。这种不相容状态在逻辑上表示为不相容析取命题p∨¬p,对应于结构方程的析取即X=1∨X=0,如此等 等。

(一) 因果模型的定义

首先讨论因果模型的确定性(决定性)定义。该定义包括目标变量之间的函数关系,每个函数关系又表征一种自治的机制。在这个模型中,因果关系和反事实关系都可以根据这种机制针对局部修改所作出的反应来进行定义,而概率关系则通过给外生条件指派概率而自然地涌现出 来。

因果模型是一个三元模型

其中:

(i)U是一组背景变量(外生变量),由模型外部因素决 定。

(ii)V 是由变量{V,V,…,V}组成的集合,称为内生变量,这些变量由模型中的变量(即U ∪ V)决 定。

(iii)F是由{f,f,…,f}组成的函数集合,每个f都是从U∪ PA到V的映射,其中,U⊆ U, PA⊆ V V, 且全集F形成从U到V的映射。换言之,每个函数

为内生变量 V指定了一个值,该值取决于V ∪ U中选择的变量子集(的值),且全集F具有唯一的解V(u)。

事实上,依据以上条件,珀尔所构造的模型是一个递归模型。在这个递归模型中,方程以一种固定的顺序排列,这种固定顺序实质上规定依赖变元间的因果顺序≼(causal ordering),即 X≼Y,X的取值影响Y的取值,但Y的取值不能影响X的取值,也就是对于变元X的取值x、x′和变元Y的取值y、y′来说,f(x, u) ≠ f(x′, u),但f(y, u) = f(y′, u)。换言之,变元集的固定因果顺序规定了后一个变元的取值都可以表示为前一个变元的函数,每个依赖变元都可以表示为独立变元的函数。已知独立变元的取值,依赖变元有唯一取值,模型有“唯一 解”。

珀尔指出:“我们倾向于拉普拉斯的准—确定性(quasi-drterministic)因果关系概念。与随机性概念相对照,我们将用它来定义和分析我们所研究的大多数因果关系实体”。这种偏爱是基于以下三个步骤的考 虑。

第一,拉普拉斯概念更为一般。每一个随机模型都可以被许多(具有随机输入的)函数关系来模拟;但反之不亦然,函数关系只能作为随机模型的有限近 似。

第二,拉普拉斯的概念与人类的直觉更加吻合。少数与拉普拉斯观念的预测相冲突的深奥量子力学实验会让人们惊讶并难以置信,因为这些实验要求物理学家放弃关于局部性和因果性的根深蒂固的直觉,但我们的目标是保护、阐释和满足这些直觉,而不是破坏它 们。

第三,人类话语中普遍存在的观念只能在拉普拉斯框架内定义。例如,我们将看到,诸如“事件B因事件A而发生的概率”和“假如没有事件B事件A就会不一样的概率”之类的简单概念不能仅仅用随机模型来定义。这些被称为反事实的概念需要对拉普拉斯模型中包含的确定性和概率性成分进行综 合。

以上三个步骤,可以总结为以下定 理。

给定模型〈M,P(u)〉,给定证据e,可以用以下三个步骤来评估反事实语句 “如果是A,那么B”的条件概率P(B| e)。

1.溯因——通过证据e更新P(u),得到P(u | e)。

2.行动——通过行动do(A)修改M,以得到其子模型M,其中A是反事实语句的前 提。

3.预测——使用修改后的模型M, P(u | e)来计算B的概率,即反事实语句的结果。

(二) 因果图

因果图是因果结构模型的直观、形象的表达形式。每个因果模型M都与有向图G(M)相关联,其中每个节点对应一个变量,有向边是从Pa和U中的结点指向V。因此,我们称G(M)是因果模型M的因果图。由此,我们可以看到因果模型与因果图的相互关系。换言之,一个因果模型可以用一个因果图表示,因果图可以比较直观地表征因果关系。因果图由“路径图”演化而来。路径是不考虑方向性的任意连续边序列。当结点X和Y间相互依赖时,可表示为X—Y;当X和Y之间独立时,则不存在直接路径联结。与依赖关系不同之处在于,因果关系具有方向性,“事件X导致事件Y”与“事件Y导致X事件”表示不同的因果方向。因此,用图形方式来表示因果关系就必须明示结点间的方向。因此,变元间的因果关系用有向图表示。在因果模型中,珀尔等人主要采用有向无环图和有向无环混合图表示变元间的因果关系,从而避免了在模态逻辑和反事实条件句逻辑中难以刻画因果方向的困 难。

因果图通常采用家庭族谱关系来描述变元间的各种关系。“在图模型中,如果结点X是结点Y的子结点, 那么Y是X的直接原因;如果X是Y的后代,那么Y是X的潜在原因。”如果结点间可用箭头直接联结,那就表示结点间是因果相关的,比如在图1中,X→X表示X是X的父结点,即父结点X的取值对子结点X的取值有直接因果影响。不难看出,X的取值对子结点X的取值也有直接因果影响。结点间X和X并没有箭头联结,X阻断X和X之间的所有路径,致使信息无法直接从X流向X,导致X和X是因果不相关的。X和X同时指向X,意味着X和X的取值可直接影响X的取值,即X和X、X和X分别是因果相关的。结点X和X间没有直接的箭头连结,意味着需要通过中间结点X来调节。可见,因果图既可表达变元间的因果相关性,也可表达因果不相关 性。

图1 表征五个变量之间的家庭族谱关系

因果图同时编码了因果知识和统计知识。因果知识是实质性假设,它附着在结点集合中的因果结构中,统计知识是源于被动观察的非实验数据或者实验数据,包括事件发生的条件概率以及结点的取值 等。

(三) 结构方程

结构方程不同于代数方程,变元间的决定性关系赋予函数或者方程中的等号两层含义。等号既具有数学意义上相等的含义,又具有逻辑上等值关系的含义;它一方面表示方程左右两边的取值相等,另一方面右边的变元取值决定左边的变元取值。同时,在没有干预的初始情形中,若已知左边变元X的取值,可推知右边变元Y的取值。等号包含双蕴涵之意,表示从左到右、从右到左的逻辑推理均成立。同时,等号也可看作编程语言中的赋值,规定变元取值的方式。依据函数的赋值形式,可以这样来理解因果关系:“若变元X出现在变元Y的赋值函数中,则X是Y的直接原因;若变元X是变元Y的直接原因或者任意原因,则X是Y的原因。”

若变元X是变元Y的直接原因,变元X的取值唯一决定变元Y的取值,变元Y可以表示为变元X的函数。因果依赖可以推出函数依赖,但是函数依赖却不能推出因果依赖。结构方程中的函数依赖关系并不能反映系统中变元的直接因果依赖关系,只有赋予函数依赖以因果解释时,才可推出变元间的因果关 系。

(四) 反事实

模型中计算反事实条件句为真的概率是一种因果关系的量化分析,相较于确定性分析更为复杂,但它在一定程度上捕捉到了实际情形中的不确定性。单纯的概率函数缺乏物理意义上的时间信息或者其他限制变元的可能因果结构的实质性假设,无法推断变元间因果依赖的方向性,无法识别因果结构。将概率置于因果模型中,就可以在实质性假设之中判断变元间因果关系成立的可能性,事实上,就能够在固定原因事件的情形下判断结果发生的可能性。因果模型中容纳概率可以以因果结构来约束概率的一系列假设,将标准概率和模型相结合而构建的模型可以计算反事实概率,是估算因果效应的有效方式,也是因果的一种不确定性推理。不难看出,在因果模型中,既有确定性推理,又有不确定性推理。兼顾了二者,这是它的一个优 势。

因果模型不同于以往的因果推理方法的特点 是:

(1)稳定性和自治性。在因果模型中,因果关系比概率关系更稳定,“因为因果关系属于本体论,描述了世界中的客观物理约束,而概率关系属于认识论,反映了我们对世界的认知或信念。因此,只要环境没有变化,即使我们对环境的认识发生了变化,因果关系也应该保持不变”。因果模型为什么具有这种稳定性,“答案在于自治的概念”,因为,在模型中,机制的不变性意味着机制可以彼此独立改 变。

(2)动态性。因果结构模型与统计推理的差别在于,统计学研究变量之间分布的静态性质,而因果分析研究其动态性质。比如,do操作就是一种对数据的主动干预,在传统统计学中找不到对它的描述。统计分析是观察了什么(所谓seeing),并估计会发生什么;因果分析是干预,关注的是做了什么(所谓的doing)并预测会发生什么。因此,因果结构模型具有动态 性。

(3)局域性。在行动的表征中,结构模型“假设在推断过程中将施加的行动表述为局部手术(local surgery)”,这就是行动的局域性。因果结构模型的语义强调行动在机制空间中是局域的,尽管机制受到各种影响,但无需列举该行动的所有影响。因此,因果结构模型具有局域 性。

总之,珀尔的因果模型可以克服因果模态方法和反事实方法面临的困厄,具有以下优 势:

第一,珀尔的因果模型尝试在计算机上寻找合适的数据结构和算法来对应于人脑中的内部表征和计算过程,从而实现智能。这种实现是在推理中主动寻找所需知识的需求驱动,而不是机械地把所有知识集成起来,再看问题是否可解。珀尔的方法假定,人脑的某一层次上有一个因果联系图,可以刻画人们在确定一个事件真正原因时的实际思维过程。这一思想彻底改变了人工智能最初基于规则和演绎逻辑的研究方向,是一次重大的思想转 变。

第二,珀尔因果结构模型的表达力不弱于刘易斯的理论,并且还能克服刘易斯系统的困难。刘易斯建立了一个包含权重和优先级的系统来描述相似性概念,然而这种优先级可能是因果颠倒的,甚至违反直觉。但是在因果结构模型中,这种难题不会出 现。

第三,珀尔因果结构模型既包括演绎推导,又考虑了具不确定性的概率因素,把因果与概率融为一炉,超越了因果关系究竟是演绎还是非演绎的截然二分。它不仅可以刻画因果推理的非单调性,也可以刻画其中的单调性,在较大程度上破解了因果推理的“演绎之 困”。

最后,我们和珀尔一样,期待着在未来的十年,迎接逻辑学、人工智能、计算机科学等相关领域的第二次因果革 命。

猜你喜欢
结点演绎推理刘易斯
合情推理与演绎推理
合情推理与演绎推理
基于地理位置的AODV路由协议改进算法的研究与实现
例谈对小学生推理能力培养的认识
刘易斯:被自大击败的拳王
2014.3新高考高二数学配送练习参考答案“推理与证明、复数”测试卷
不要轻视任何对手
世界上最短的演讲