渐进式论证、连锁型滑坡论证和连锁悖论的概率分析

2023-09-04 18:33:27邢锟
逻辑学研究 2023年2期
关键词:渐进式爬山连锁

邢锟

1 引言

在沃尔顿(D.Walton)的论证型式分类中,渐进式论证(argument from gradualism)是一类常见的但很少得到专门讨论的论证,其定义如下:

定义1.1(渐进式论证).令A0,...,An为任意命题。渐进式论证是具有如下形式的论证类型:

前提一:A0。

前提二:对任意0 ≤k <n,如果Ak,那么Ak+1。

结论:An。

简单地说,渐进式论证就是连续多步无分支的论证:给定命题A0,然后从A0推出A1,从A1推出A2,如此一直推出想要的最终结论An。虽然上面的论证看起来只有两个前提,但实际上每个条件句都应当被单独视为一个前提,所以这样一个论证一共有n+1 个前提,写在一起只是为了简洁。定义1.1 参考的是文献[23]第339 页论证型式48,作了一些改动。两个定义的前提一和前提二基本相同,这里只改变了一些符号和文字表述。不过,定义1.1 去掉了沃尔顿论证型式48 中的前提三,因为该前提和本文对渐进式论证的分析无关。如果使用本文的符号,前提三是说“如果A0成立,那么An成立”不能直接地或通过更短的推理得出(被接受)。按照本人的理解,所谓能直接得出(被接受),就是该条件句已经被认为是成立的,可以作为前提使用,因此只需一步就能从A0推出结论An,而原来的论证是不需要的;所谓能通过更短的推理得出(被接受),意思是原来的推理过程中有些步骤是多余的,因此可以构造一个更短的(n更小的)论证得出结论An而不改变其论证效果,最典型的例子就是推理过程中出现命题Ai=Ai+j,这时从Ai+1到Ai+j的所有推理步骤都可以去掉。所以,如果前提三不成立,即“如果A0成立,那么An成立”可以直接地或通过更短的推理得出(被接受),那么就可以构造出一个更短的满足前提三且论证效果相同的论证。这时我们就不需要讨论原来的论证,而只讨论新的更短的论证。因此,前提三是否成立只影响我们究竟选择分析哪个论证,而不影响对论证的分析过程。换而言之,我们总是可以假设前提三成立而不影响讨论的一般性。渐进式论证在日常生活中很常见,比如我们经常会进行类似下面的推理或论证1这些例子中,我把前提一放到前提二的后面,因为感觉这样更符合语言习惯。:

例1.如果(A0)明天不下雨,(A1)小明就去爬山;如果(A1)小明去爬山,(A2)小王也会去爬山;如果(A2)小王去爬山,(A3)小孙也会去爬山。(A0)明天不下雨。因此,(A3)明天小孙会去爬山。

例2.如果(A0)不好好学习,(A1)小明就不会取得好成绩;如果(A1)不取得好成绩,(A2) 小明就考不上好大学;如果(A2) 考不上好大学,(A3) 小明就找不到好工作;如果(A3)找不到好工作,(A4)小明就没有高收入;如果(A4)没有高收入,(A5)小明将来就不能过体面的生活。(A0)小明不好好学习。因此,(A5)小明将来不能过体面的生活。

当然,更常见的也许是下面这种更简洁的表述:

例3.如果(A0)陪审团不能克忠职守,做出公正判断,将导致(A1)罪行不能受到惩罚,罪犯逍遥法外,于是(A2)法律和秩序会崩溃,继而(A3)造成动乱,最后(A4)整个社会将岌岌可危。(A0)陪审团没有克忠职守,做出公正判断。因此,(A4)整个社会将岌岌可危。2这个例子转引自文献[26]第61-62 页。原本是滑坡论证的例子,但很容易改成渐进式论证。

逻辑学的核心问题是评价论证的好坏。如何判定这类论证的好坏呢?这类日常论证难以用古典逻辑进行分析,因为我们得出结论时往往不能完全确定前提的真假,或者前提作为某种规律或规则总是存在反例因而严格来说是假的。比如例1 中,“如果明天不下雨,小明就去爬山”,“如果小明去爬山,小王也会去爬山”等并不能在今天预测小明明天的行为时完全确定其真假。当然,等明天过去了,这些命题的真假就完全确定了,但这时之前的推理已经失去了意义,因为这类推理的主要目的在于做出预测。如果非要在明天到来之前作出断言,我们只能说这些命题都是假的,因为即使明天不下雨,即使之前小明承诺过,也有可能存在其它原因导致小明不去爬山,比如突然生病了,家里有急事等;由于类似的原因,即使小王答应了小明去爬山,即使他们的关系再好,小王明天也并非百分之百会去爬山。另外两个例子同样如此。总之,日常论证中许多命题的真假都具有一定的不确定性。

对于真假不完全确定的命题和包含这类命题的推理,目前主要有两类分析方法。一类是非单调理论如非单调逻辑(nonmonotonic logics,[19])、缺省逻辑(default logic,[2])、可废止推理(defeasible reasoning,[6],第622-627 页)等,另一类是概率论和基于概率论的条件句理论([15,16])。非单调理论存在不少困难,比如难以找出全部或大部分反例,难以对规则进行排序,非单调规则本身不能进行推导等。([15],第470-473 页)比如说,例1 中的条件句“如果明天不下雨,小明就去爬山”的反例有哪些呢?我们可以想到一些,但很难将全部或大部分反例找出来。反例不能全都找出来,那么使用非单调理论进行推理就难以得到期望的结果。另一方面,对很多命题而言,即使找不到反例,我们也不会或不应该相信其一定为真。比如说,某本历史书告诉我们“秦始皇是吕不韦之子”。因为这个命题不是条件句,不表达某种规律或规则,因此很难确定它的反例是什么。3有人可能会说,这里的反例指的是诸如“如果历史书L 记载了A,则A 成立”之类条件句的反例。然而,这样的反例很难完全确定下来,因为其它证据也没法完全证明这本书的某些记载一定是错的。而且,即使我们确定了这本历史书上记载的命题B 一定是错的,我们能否说它记载的命题C 一定是对的或错的呢?恐怕都不合适。然而,我们通常不会也不应该因为某本历史书上这么写了就完全相信其为真,而如果出现某些反面的证据我们也不应该完全相信其为假。多数情况下,我们都缺少足够的证据完全确定此类命题的真假。这种不确定性普遍存在,却难以用非单调理论来刻画。基于概率论的理论可以很好地解决这些问题:可以容忍反例,反例不需要都找出来,并且依据概率的贝叶斯解释的通行做法,可以用命题成立的概率表示我们对其真假的不确定程度,即命题的可信度(credibility,[16],第1-3 页)。基于这些原因,本文主要采用概率方法刻画命题真假的不确定性。当然,概率方法也不是没有问题,有的学者还认为命题真假的不确定程度不能用概率表示,但相关的理由受到其它学者的质疑。([7,17,18])概率方法和非单调理论也不是不相容的,因此如果有必要,可以把这两种方法结合起来,只是本文暂不考虑。实际上,论辩理论中有不少融合二者的研究。([5,10])不过,论辩理论的这些研究虽然也使用了概率方法,但它们讨论的是多个论辩之间的支持-反驳关系和其中的不确定性,并没有专门讨论过单个论证型式前提和结论的可信度(成立的概率)之间的关系,更没有单独讨论过渐进式论证。([5,9-11])关于概率方法和非单调理论更详细的比较可以参见文献[15]第10 章。

当然,即使知道命题具有不同的可信度,例1-3 中论证的好坏也不容易判定,甚至经常会有争议。原因之一是我们对前提的可信度究竟是多少有分歧。比如说,例1 中“如果明天不下雨,小明就去爬山”的可信度是多少?成立的概率有多高?回答这类问题需要搜集小明的行为数据,建立行为模型,然后根据统计学方法进行计算。这些不属于逻辑学研究的内容。正如古典逻辑讨论的主要问题是假设前提都为真时结论是否为真,本文主要讨论下面的问题:

(I) 对于渐进式论证,给定前提的可信度,如何计算其结论的可信度?

(II) 如何通过这些计算判定渐进式论证的好坏?

虽然例1-3 中渐进式论证的好坏不容易判断,但我们很容易判断下面这个渐进式论证是不好的。4这个例子引自文献[3]第278 页。

例4.前提一:只有1 块钱的人是穷人。

前提二:对任意i >0,如果只有i元的人是穷人,那么只有i+1 元的人也是穷人。

结论:只有100 亿元的人也是穷人。

之所以这个论证是不好的,是因为(i)它的所有前提(前提一和前提二中的每个条件句)的可信度都很高——接近或等于1,因为只有1 块钱的人无疑是穷人,而不论一个人已经有多少钱,再给他1 块钱也不会让他从穷人变成富人;(ii)这个论证的结论极其不可信——其可信度几乎等于0。于是,我们从非常可信的前提用MP 规则(modus ponens)推出了极其不可信的结论,因而上面的论证被视为一个悖论,称为连锁悖论(sorites paradox,[12])。

从形式上看,连锁悖论是一类特殊的渐进式论证。类似的例子还有自古希腊就开始讨论的谷堆悖论、秃头悖论等。([26],第65 页)学者们为解决连锁悖论提出了多种不同的方法,并认为含义模糊的语词如“穷人”“谷堆”“秃头”等的使用是悖论出现的根本原因,因此发展了多种理论处理语词的模糊性(vagueness,[12];[20],第2 章)。本文的目的是讨论更一般的渐进式论证,关于模糊语词和连锁悖论的讨论将作为本文理论的应用而留到第4 小节。

很容易发现,模糊语词的使用并非渐进式论证成为连锁悖论的充分条件。

例5.前提一:只有1 块钱的人是穷人。

前提二:对任意i >0,如果只有i元的人是穷人,那么只有i+1 元的人也是穷人。

结论:只有100 元的人是穷人。

上面的论证和连锁悖论具有完全相同的形式并且同样使用了“穷人”这一模糊语词,但它的结论的可信度很高,因而不构成悖论。例4 和例5 的唯一区别是推理的长度,即推理了多少步。例4 推理了100 亿步,得出了一个不可信的结论,而例5 只推理了100 步,得出了一个可信的结论。不过,和渐进式论证形式完全一样的数学归纳法,则不论推理了多少步,只要前提正确,结论一定正确。比如下面这个例子:

例6.前提一:1 是实数。

前提二:对任意i >0,如果i是实数,那么i+1 也是实数。

结论:n是实数。

因此,我们可以提出如下问题:

(III) 对于包含模糊语词的渐进式论证,为何推理的长度会影响结论的可信度?如何影响?

(IV) 为何数学归纳法中推理的长度不会影响结论的真假?

模糊语词的使用也并非渐进式论证成为悖论的必要条件。比如5例7 是谚语“明日复明日,明日何其多,我生待明日,万事成蹉跎”的一种理解。该谚语在文献[27]中作为滑坡论证进行研究,这里将其改写成渐进式论证。:

例7.前提一:小明可以从今天开始行动并完成这些任务。

前提二:对任意k >0,如果小明可以从k天后开始行动并完成这些任务,那么小明可以从k+1 天后开始行动并完成这些任务。

结论:小明可以从100 万天后开始行动并完成这些任务。

这个论证的结论显然是荒谬的、不可信的,因为100 万天后小明早就去世了,不可能开始行动并完成这些任务。然而,这个论证没有包含模糊的语词。当然,有人可能会认为自然语言几乎所有的词都是模糊的,只是模糊程度的不同。比如“开始行动”“完成”“这些任务”等都具有模糊性。如果持有这种观点,我们可以在具体语境下将这些词替换为更精确的词,比如在某个语境下,“这些任务”指的是写完博士论文,“开始行动”指的是动笔写下博士论文的第一个字,“完成”指的是写完交给学校的博士论文的最后一个字。我想绝大多数人都会认为这样的表述足够清楚了,至少其模糊程度足够低从而对推理没有实质影响。当我们做出这样的修改后,该论证仍然得到不可信的结果。既然如此,那么通过处理模糊性而解决连锁悖论的方法都无法用于解释为何上面的论证会得到不可信的结果。而且,在不包含模糊语词的渐进式论证中,推理的长度同样会影响结论的可信度。

例8.前提一:小明可以从今天开始行动并完成这些任务。

前提二:对任意k >0,如果小明可以从k天后开始行动并完成这些任务,那么小明可以从k+1 天后开始行动并完成这些任务。

结论:小明可以从100 天后开始行动并完成这些任务。

因此,我们需要回答下面的问题:

(V) 不包含模糊语词的渐进式论证为何也可能得到不可信的结论?推理的长度如何影响结论的可信度?

连锁悖论(例4)和类似的渐进式论证(例7)通常被归类为连锁型滑坡论证(sorites slippery slope arguments),其定义如下6参见文献[26],第66-67 页;[23],第340-341 页论证型式51。:

定义1.2(连锁型滑坡论证).连锁型滑坡论证是具有如下形式的论证类型:

前提一:A0(a0具有性质P)。

前提二:对任意0 ≤k <n,如果Ak(ak具有性质P),那么Ak+1(ak+1具有性质P)。

前提三:一系列肯定前件式子论证,联结初始前提和结论,并经过一个灰色区域(gray zone):因为A0,所以A1,所以A2,...,(灰色区域),...,所以An-1。

结论:An(an具有性质P)。该结论往往是荒唐的或难以接受的。

可以看出,连锁型滑坡论证是渐进式论证的一种特例:虽然它增加了前提三,并要求An是荒唐的或难以接受的,但前提三以及最后对结论的要求并不改变推理的形式,而只是进一步要求相应的渐进式论证具有某些特殊性质:推理过程包含灰色区域,以及结论不成立或不可接受。7某个命题是否成立和它是否可接受代表了两类不同的判断。比如“人类灭亡”是否成立断言的是某个事实是否发生了,而“人类灭亡”是否可接受表达了人的一种价值判断。事实判断是价值判断的基础:如果“人类灭亡”本身不成立或可信度很低,那么谈论该结果是否可接受毫无意义。本文主要讨论命题是否成立的事实判断,而不讨论其是否可接受的价值判断。涉及价值判断的论证留待后续研究。

连锁型滑坡论证和其它类型的滑坡论证一起得到了大量研究,其中沃尔顿的理论影响较大。沃尔顿认为,每个滑坡论证中都存在一个灰色区域Ax,...,Ay;当推理从可控区域A0,...,Ax到达灰色区域时,就失去控制从而滑向失控区域Ay,...,An,并最终得出不可信的结论或不能接受的结果。([22],第288-289 页)

沃尔顿的理论可以解释为何例4 和例7 会得出不可信的结论,因为其推理经过了灰色区域;也可以解释为何例5 和例8 不会得出不可信的结论,因为其推理没有经过灰色区域。因此,应用沃尔顿理论的关键在于确定渐进式论证中有没有灰色区域,以及灰色区域究竟在哪。沃尔顿认为是由于存在某些驱动(driver)而导致推理进入灰色区域并最终滑向不可接受的结果。([22],第288 页)然而,沃尔顿对驱动的描述比较模糊,没有提供可靠的方法让人们在一般实例中确定驱动是否存在以及究竟是什么。或许有些滑坡论证会告诉我们驱动究竟是什么,但并非所有滑坡论证都如此。比如我们很难无争议地确定例4 或例7 的驱动是什么或灰色区域究竟在哪,也难以确定例1-3 中究竟有没有灰色区域。驱动和灰色区域似乎都需要靠人们不那么准确的经验常识来判断。虽然后来一些学者将沃尔顿的理论形式化了,但在那些理论中,驱动或灰色区域通常都是理论预设的存在(即预设已经知道了),而并没有告诉我们如何确定其是否存在或存在于何处,也没有讨论是否可以对灰色区域进行定量的刻画。([26,27])因此,我们可以提出下面的问题:

(VI) 可否以及如何定量地刻画连锁型滑坡论证中的灰色区域?8对于如何定量刻画和评价滑坡论证,余喆老师在其博士论文给出了提示:“要评判一个滑坡论证,不论是对滑坡过程发展的理由,还是对恶性后果是否的确难以接受,都常常是基于其在当前社会环境下可信的概率。”([26],第82 页)这是本文用概率讨论相关问题的想法来源之一。

问题(I)-(VI)是本文将讨论的主要问题。这些问题相互关联,可以用概率论统一分析和解答。下一节将给出命题可信度和论证好坏的定义。第三节则用这些定义讨论一般的渐进式论证和连锁型滑坡论证。第四节应用前面的理论讨论连锁悖论。最后一节则是全文总结和后续研究的探讨。

2 命题的可信度和论证的评价

概率论有两种不同的表述方式:一种是集合方式,一种是命题方式。集合方式先给出包含所有可能结果的样本空间,然后定义和计算其子集,即各个事件成立的概率。([4],第5-22 页)命题方式则直接定义命题成立的概率,即它的可信度。9这两种表述方式的对应关系的简要讨论参见文献[16]第6 页。更详细的讨论参见文献[14]。本文采用命题方式,即有如下的定义:([16],第3-5 页)

定义2.1(命题的可信度).令A、B为任意命题。A的可信度是A成立的概率P(A)。此外,

1.“并非A”的可信度为P(¬A)=1-P(A);

2.“A且B”的可信度为P(A ∧B);

3.“A或B”的可信度为P(A ∨B);

4.假设P(A)≠0。“如果A,那么B”的可信度为条件概率P(B|A)。

古典逻辑中命题只有真和假两个真值。古典逻辑中的真命题可以理解为我们完全确信的命题,即可信度为1 的命题;假命题可以理解为我们完全不相信的命题,即可信度为0 的命题。对于评价论证的好坏,古典逻辑区分了两个不同的问题:(i)论证的前提是否都为真;(ii)当论证的前提都为真时,能否保证结论一定为真。古典逻辑通常不研究问题(i),而只研究问题(ii),并认为好的(有效的)论证形式是前提都为真时结论一定为真的论证。([25],第2-6 页)换而言之,古典逻辑中好的(有效的)论证形式是前提的可信度都为1 时,结论的可信度也一定为1的论证。当命题的可信度可以是[0,1]区间的任一值时,如何对论证进行评价?这时同样可以区分两个不同的问题:(i)论证前提的可信度是否都很高(即接近1);(ii)当论证前提的可信度都很高时,能否保证结论的可信度一定很高。这两个问题的研究对象是不同的:问题(i)讨论的是一个个具体论证中前提的可信度如何;问题(ii)讨论的是一类形式相同的论证在预设前提可信度都很高时,能否保证结论的可信度仍然很高。下面先考虑问题(ii)。参照古典逻辑中有效的论证形式,我们得到如下的定义:

定义2.2(可靠的论证形式).假设某个论证形式前提的可信度都接近1,并且能够从前提的可信度计算出结论的可信度,那么该论证形式的可靠程度等于其结论的可信度。作为特例,我们有

• 如果结论的可信度接近1,那么它是一个可靠的论证形式。

• 如果结论的可信度接近0,那么它是一个不可靠的论证形式。

上述定义中故意使用接近1 和接近0 这种模糊的表述,是为了让该定义适用于不同的应用需求。如果需要精确化,接近1 可以定义为大于某个接近1 的数值,比如0.999、0.99、0.95、0.9 等。接近0 也类似。综合考虑前提是否可信,我们给出如下定义:

定义2.3(好的论证).一个论证是好的当且仅当其前提的可信度都接近1,并且其论证形式是可靠的。

因此,好的论证能保证结论的可信度接近1。由于评估前提的可信度通常需要专门的知识,本文不讨论论证的好坏,而只讨论论证形式是否可靠,并简称为论证是否可靠。为了评价论证是否可靠,我们需要依据前提的可信度计算其结论的可信度。概率论提供了相应的计算方法。我们首先讨论一类最简单的论证:只有一步的渐进式论证。10该渐进式论证和古典逻辑中的MP 规则很像,其区别在于MP 规则中,条件句“如果A,那么B”被解释为实质蕴含,而在渐进式论证中,条件句解释为条件概率。

前提一:A。

前提二:如果A,那么B。

结论:B。

假设已知前提一和前提二的可信度P(A)和P(B|A)。同时假设P(A)≠0,因为P(A)=0 时作为前提的命题A已知一定为假,因此该论证已经没必要继续讨论了,而且P(A)=0 时P(B|A)也没有定义。下面计算命题B成立的概率P(B)。根据概率论的知识,下面的引理成立([16],第3-5 页):

引理2.1.如果P(A)=1,那么:

假设P(A)1。根据全概率公式可得:([16],第3-5 页)

由于我们只知道P(A)、P(¬A)和P(B|A),P(B)一般是算不出来的,除非我们进一步知道P(B|¬A)。在不知道P(B|¬A)时P(B)不确定是符合常识的。比如说,假如只知道明天不下雨的概率为0.8,以及如果不下雨则出门的概率为0.9,是无法计算出明天出门的概率的,因为我们不知道明天即使下雨仍然出门的概率,除非我们假定这样的概率为0 或接近0。不过,我们可以得到下面的结果:

引理2.2.如果P(A){0,1}且P(¬A)*P(B|¬A)≈0,则

应用上面引理的关键是判定是否P(¬A)*P(B|¬A)≈0,而这只需要P(¬A)≈0 或P(B|¬A)≈0。在评价论证是否可靠时,如果A是论证的前提,我们通常会假设P(A)≈1,于是P(¬A)≈0。不过,对于多步论证,A很可能只是其中间某一步的结论,P(¬A)需要在该步推理之后计算才能确定。因此,下面主要讨论是否P(B|¬A)≈0。考查前面的论证实例可以发现,大多数时候P(B|¬A)都很小,接近0 甚至等于0。比如例1 中的第一步论证:

例9.(A)明天不下雨。如果(A)明天不下雨,(B)小明就去爬山。因此,(B)小明明天去爬山。

上述论证中,P(B|¬A)=P(小明明天去爬山|明天下雨)。这时P(B|¬A)的值很小,因为很少有人下雨天爬山。例1 中的第二步论证:

例10.(A) 小明明天去爬山。如果(A) 小明去爬山,(B) 小王也会去爬山。因此,(B)明天小王会去爬山。

上述论证中,P(B|¬A)=P(明天小王会去爬山|小明明天不去爬山)。如果小王和小明平时总是一起去爬山或一起玩耍,那么P(B|¬A)的值很小;如果并非如此,那么前提“如果小明去爬山,小王也会去爬山”的可信度就不高。分析例1-3 的其它推理步骤以及很多其它例子,也能得到类似结果。再看例4 中的第k步论证:

例11.(A)有k元的人是穷人。如果(A)有k元的人是穷人,那么(B)有k+1 元的人是穷人。因此,(B)有k+1 元的人是穷人。

该论证中,P(B|¬A)=P(有k+1 元的人是穷人|有k元的人不是穷人),其成立的概率为0,因为如果拥有k元的人都不是穷人,拥有k+1 元的人更不可能是穷人了。分析例5、7、8 中的其它推理步骤,以及许多其它推理长度很长的渐进式论证也能得到类似结论。如果P(B|¬A)=0,那么P(¬A)*P(B|¬A)=0,我们可以得到下面更强的结果:

引理2.3.假设P(A){0,1}且P(¬A)*P(B|¬A)=0。那么11格里兰(W.Grennan)也用概率评价论证并得出和引理2.3 同样的结果。([8],第34-36 页)不过,我认为他得出该结果的推导方法不正确,或者在概念上和本文很不一样。本文严格按照概率论方法进行推导和计算。另外,格里兰也没有对渐进式论证或连锁型滑坡论证进行专门讨论。

3 渐进式论证和连锁型滑坡论证

如前所述,渐进式论证具有如下形式:

前提一:A0。

前提二:对任意0 ≤k <n,如果Ak,那么Ak+1。

结论:An。

我们的目的是根据给定前提的可信度计算出结论的可信度。因此,我们假设已知命题A0的可信度P(A0),以及对任意0 ≤k <n,已知命题“如果Ak,那么Ak+1”的可信度P(Ak+1|Ak)。同时假设P(¬Ak)*P(Ak+1|¬Ak)≈0(0 ≤k <n)。一般而言,约等关系可以传递若干步,只是不能传递太远。比如根据1≈1.01≈1.02≈1.03≈···,我们可以得到1≈1.05 乃至1≈1.1。因此,如果论证长度比较短(即n比较小),我们可以重复应用引理2.2 得到对任意0 ≤i <j≤n:

因此,下面的定理成立。

定理3.1.假设A0,A1,...,An是任意命题,且对任意0 ≤k <n,P(Ak){0,1}且P(¬Ak)*P(Ak+1|¬Ak)≈0。如果n比较小,下面的公式成立:

因为例1-3 中论证的长度都比较短,如果P(¬Ak)*P(Ak+1|¬Ak)≈0 都成立,且前提的可信度都确定了,我们就可以应用定理3.1 计算得到其结论的可信度。我们用例1 来说明计算过程。例1 中n=3。为了简化计算,假设P(A0)=P(A1|A0)=P(A2|A1)=P(A3|A2)=v。如果v=0.99,那么P(An)≈0.994≈0.961,这时结论的可信度还算比较高,和前提相差不大。如果v=0.95,P(An)≈0.954≈0.815;如果v=0.9,P(An)≈0.94≈0.656,这时结论的可信度已经显著降低。如果v=0.8,P(An)≈0.84≈0.410,这时结论已经不怎么可信了。随着推理长度的增加,结论的可信度会削弱得更严重。比如说,如果推理长度增加到10,那么当前提的可信度都是v=0.99 时,结论的可信度P(An)≈0.9910≈0.904;当v=0.95 时,P(An)≈0.9510≈0.599;当v=0.9 时,P(An)≈0.910≈0.349。这些计算说明,对于渐进式论证而言,如果前提的可信度不是都非常接近1(比如说大于0.95),那么随着推理长度的增加结论的可信度会被迅速地削弱,从可靠的论证变成不可靠的论证。日常生活中,前提的可信度大于0.95 已经是比较高的要求了,所以我们常用的渐进式论证都比较短,很少超过10 步。当然,渐进式论证前提的可信度不一定都相同,也不一定都具有很高的可信度,这时结论的可信度究竟如何应当以计算结果为准。

不过,像连锁悖论或连锁型滑坡论证(例4、5、7、8),推理长度成百上千甚至更长。这时约等号的传递关系就不可靠了,我们不能再用定理3.1 进行计算。不过由上一节的分析可知,这样的论证中P(¬Ak)*P(Ak+1|¬Ak)=0(0 ≤k <n)一般都成立。这时我们有如下定理:

定理3.2.假设A0,A1,...,An是任意命题。假设对任意0 ≤k <n,P(Ak)≠0,并且当P(Ak)≠1 时,P(¬Ak)*P(Ak+1|¬Ak)=0。那么

证明.对任意0 ≤k <n,当P(Ak)=1 时,根据引理2.1 可知P(Ak+1)=P(Ak)*P(Ak+1|Ak);当P(Ak)≠1 时,由于P(¬Ak)*P(Ak+1|¬Ak)=0,由引理2.3 可知P(Ak+1)=P(Ak)*P(Ak+1|Ak)。因此对任意0 ≤k <n,P(Ak+1)=P(Ak)*P(Ak+1|Ak)都成立,于是对任意0 ≤i <j≤n:

因为等号可以一直传递,上面的定理对推理长度n没有限制。下面用该定理计算例7-8 中结论的可信度。为了方便计算,不妨假设对任意0 ≤k <n,P(Ak+1|Ak)=P(A0)=v=0.9995。当n=100,即结论是例8 中的“小明100 天后开始行动可以完成这些任务”,P(An)=0.9995101≈0.951,因此仍然具有比较高的可信度,所以例8 的论证是可靠的。当n=1000,即结论是“小明1000 天(约3 年)后开始行动可以完成这些任务”,P(An)=0.99951001≈0.606,这时结论的可信度已经不高了。当n=10000,即“小明10000 天(约27 年)后开始行动可以完成这些任务”,P(An)=0.999510001≈0.00673。这时P(An)已经非常接近0,极其不可信了。如果n >10000,P(An)会更小。因此,例7 的结论是不可信的,所以是一个不可靠的论证。这些结果是比较符合常识的。当然,v=0.9995 只是我的一个简单假设,具体每个前提的可信度是多少会依据任务或小明的个人情况而不同。比如说,如果完成这个任务本身只需要3 天时间并且没有其它条件的限制,那么即使10000 天后,小明完成任务的可能性都是很高的,这时很可能v >0.99995。当然,100000 天(约274 年)后对所有人来说,完成该任务的可能性都几乎为0 了,因为没有人能活那么久(但也不能说可能性一定为0,因为说不定若干年后人类的寿命在科技的帮助下延长到300 岁甚至更长)。

我们看到,当前提的可信度都极高时,即使推理经过成百上千步,结论依然比较可信。然而,即使如此,随着论证长度的增加,类似例7、8的渐进式论证的结论也会越来越不可信,会从可靠的论证变成不可靠的论证。这是一个普遍的现象,因为我们可以得到下面的定理。

定理3.3.假设A0,A1,...,An是任意命题。假设对任意0 ≤k <n,P(Ak)≠0,并且当P(Ak)≠1 时,P(¬Ak)*P(Ak+1|¬Ak)=0。假设P(A0)≤u <1,且对任意0 ≤k <n,P(Ak+1|Ak)≤u <1。那么12其实这个定理的条件还可以放宽,即可以让某些P(Ak+1|Ak)=1,结论也不会改变。但这样表述起来比较复杂,这里就不写了。

定理3.1-3.3 加上定义2.2-2.3 足以回答本文第一节提出的问题(I)、(II)和(V)。对于问题(IV)为何在例6 的数学归纳法中,推理的长度不会影响结论的真假,也不难回答:因为数学归纳法中前提都要求是真命题,即它们的可信度都为1,所以从定理3.2 可知,P(An)=1n+1=1。现在我们也可以回答问题(VI)可否以及如何定量地刻画连锁型滑坡论证中的灰色区域。沃尔顿认为灰色区域是论证中Ak从比较合理走向不合理的区域,而对任意0 ≤k≤n,用定理3.1-3.3 可以计算出渐进式论证第k步推理后得到的结论Ak的可信度P(Ak),即该结论的合理程度。不妨认为,如果可信度大于0.5,结论在某种程度上还算合理的,而如果可信度小于0.1,结论大概就不合理或不可接受了。于是,我们可以给出如下一种定义:

定义3.1(灰色区域).渐进式论证的灰色区域是Ak的可信度从P(Ax)=0.5 变成P(Ay)=0.1 的区域Ax,...,Ay。

当然,正如沃尔顿说灰色区域的起点Ax和终点Ay是不确定的([22],第288页),定义3.1 中选择0.5 和0.1 作为分界点实际上带有人为规定的性质,就像交通规则规定某些路段大于60 km/s 算超速一样。选一些不同的数值也不会有什么问题,具体选择还需要看实际问题。本文的讨论只是说明,如果想要精确定义灰色区域是能做到的,但具体如何定义可以根据实际问题调整。

4 应用:连锁悖论

如前所述,连锁悖论是使用了模糊语词的连锁型滑坡论证。既然连锁悖论是一类特殊的连锁型滑坡论证,因而是一类特殊的渐进式论证,前面对渐进式论证和连锁型滑坡论证的分析应当可以应用于连锁悖论,只要模糊语词得到恰当的解释。模糊语词有多种不同的解释方法,比如认知主义(epistemicism)、多值逻辑(many-valued logic)和模糊逻辑(fuzzy logic)、超赋值(supervaluationism)和多赋值(plurivaluationism)理论、语境主义(contextualism)、直觉主义(Intuitionism)等。因为模糊性不是本文的主题,故不对这些理论进行介绍,感兴趣的读者可以参考文献[12,20,21]。在这些理论中,本文选择用模糊集(fuzzy sets)解释模糊语词,因为这一选择在文献[20]中得到了比较充分的辩护,而且可以让前面对渐进式论证和连锁型滑坡论证的分析方法直接应用于连锁悖论,从而实现理论的统一性。这比为连锁悖论单独发展一种理论更有吸引力。

模糊集由札德(L.A.Zadeh)于1965 年提出。令X是一个普通集合,X上的一个模糊集Xµ是一个有序对(X,µ),其中µ:X →[0,1]是从X到区间[0,1]的一个函数,表示元素x对集合X的隶属度(grade of membership)。([13,24])不过,究竟如何理解、赋予和计算某个元素x对集合X的隶属度呢?模糊逻辑通常将元素x对集合X的隶属度理解为命题x ∈X(即“x 是X”)的真假程度(degree of truth),并认为这种真假程度源于客观对象自身具有的性质。([20],第60-71 页)和模糊逻辑不同,本文将元素x对集合X的隶属度理解为命题x ∈X的可信度,即x ∈X成立的概率。这么做一方面使得x对集合X的隶属度可以使用基础严谨、研究充分的概率论和统计方法赋予和计算,而不需要像模糊逻辑一样引入有争议的理论或方法赋予或计算命题的真假程度,另一方面使得包含和不包含模糊语词的渐进式论证都可以用同样的方法进行分析,从而让连锁悖论的分析成为前面理论的一种应用。

除了采用模糊集,本文还采用语境主义的观点,即认为同一个词在不同语境下可以有不同的解释,因此同一个模糊语词在不同语境下可以被解释为不同的模糊集。以“穷人”为例,究竟拥有多少财富的人是穷人呢?这很大程度上取决于说话的语境。比如说,对于居住在小城市的人而言,有100 万大概就不算穷人了;对于居住于北京上海等城市的人而言,恐怕要上千万才能比较好地生活;对于参加资产数亿的富豪聚会的人而言,可能需要拥有数十亿才能不算穷人。不过,如果语境确定下来,“穷人”一词的含义一般认为是确定的,即对应唯一一个模糊集。

采用上述观点后,例4-5 和例7-8 形式上完全相同,其分析方法也相同,唯一的区别是,例7-8 中P(Ak)和P(Ak+1|Ak)的确定依赖于我们对小明能否完成那些任务的理解,而例4-5 中P(Ak)和P(Ak+1|Ak)的确定依据的则是我们对模糊语词“穷人”在特定语境下的理解(解释或定义)。因为只是举例说明,我们不妨假定一个对大多数人都适用的语境:财产1 万元人民币以下是确定无疑的穷人,财产1 亿以上的人确定无疑不是穷人,财产大于1 万低于1 亿则或多或少算一点点,同时财富越多,是穷人的可能性越小。为了便于计算,µ选择一个特殊的分段连续不增函数,于是得到下面的定义。

定义4.1.“穷人”的含义由模糊集(N,µ)来定义,其中N 是自然数集,其中的自然数k代表某个人所拥有的以人民币为单位衡量的财富值,而µ(k)则是命题“拥有k元的人是穷人”的可信度。并且

当k≥108时,P(Ak)=0,因此P(Ak+1|Ak)没有定义。这时我们可以如某些文献一样强行规定其值等于1,或者采用更复杂的处理方法。([1],附录2)当k <108时,依据上面的定义,引理2.1 和2.3 告诉我们:

这说明例4-5 中两个论证的前提都是非常合理的,因为它们的可信度或者等于1 或者接近于1。然而,例4 中结论的可信度为0,因此是一个不可靠的论证,或者说是一个悖论;而例5 中结论的可信度为1,因此是一个可靠的论证。我们还可以看到,当104≤k≤108时,每一步推理都让结论的可信度减少一点点,最终让命题Ak的可信度µ(k)从1 减少到0。此外,依定义3.1,该论证的灰色区域是0.1<µ(k)<0.5,即106<k <107.6(从100 万到约4000 万),也基本符合常识的理解。

5 结论

通过将命题的可信度定义为命题成立的概率,本文用概率论统一地分析了渐进式论证、连锁型滑坡论证和连锁悖论,得到了判定渐进式论证是否可靠的一般方法,并给出了连锁型滑坡论证中灰色区域的一种定量刻画。

除了连锁型滑坡论证,滑坡论证还包括一些应用更广的类型,其中往往涉及价值判断或因果关系,因此分析会更加复杂。([22],第288-289 页;[26],第65-77页)除了滑坡论证,还有大量其它的论证型式。([23])能否以及如何将本文的分析推广到更多的论证型式是接下来可以研究的内容。

另外,渐进式论证是多步论证中最简单的类型,因为它没有分支。更复杂的论证可以是树或图的结构。能否及如何将本文的分析推广到更一般的论证结构,也是值得研究的课题。

猜你喜欢
渐进式爬山连锁
专注零售连锁空间打造
现代装饰(2020年7期)2020-07-27 01:27:44
基本收入的理论构想与渐进式实现路径
创造(2020年12期)2020-03-17 08:59:20
难忘那次爬山
爬山
爬山
库里受伤的连锁效应
NBA特刊(2018年7期)2018-06-08 05:48:32
布拉格Burrito Loco连锁快餐店
现代装饰(2018年4期)2018-05-22 02:57:23
有趣的爬山
小主人报(2016年3期)2016-02-28 20:47:13
轻熟女“渐进式”省钱保养计划
Coco薇(2016年1期)2016-01-11 02:48:05
有壹手——重新定义快修连锁