三门问题的概率动态认知逻辑分析

2021-12-09 00:25李章吕潘易欣
逻辑学研究 2021年5期
关键词:概率定义逻辑

李章吕 潘易欣

1 引言

三门问题(Monty Hall problem)源于美国的一档娱乐节目。该档节目设置了A,B,C三扇门,其中一扇门后有一辆汽车,另外两扇门后各有一头羊。玩家若选中后面有车的那扇门即可获得该汽车。游戏最开始让玩家先选一扇门,然后在尚未打开这扇门的情况下,由主持人打开另外两扇门后有羊的一扇(若两扇门后都是羊则任意打开一扇),让玩家看到门后的羊,并给玩家一次换门的机会。问题是:换门是否会增加玩家赢得汽车的概率?

从直观上看,似乎玩家选择的那扇门后有车的概率和主持人未打开的那扇门后有车的概率都是1/2。Krauss 和Wang 的实验也表明,只有29% 的人选择换门,且即便在换门的这群人里也很少有人觉知到换门赢得汽车的概率大于不换门([10])。然而,Gillman 等人的研究表明,在主持人打开那扇没有车的门后,换门赢得汽车的概率更大。([6,5,12,8])这是一个非常反直观的结果,引发了旷日持久的讨论,不仅数学爱好者关注这个问题,心理学、经济学、计算机科学等领域的学者也对其进行了研究:实验心理学家通过设计实验来研究“害怕后悔”“错误表征”等心理因素对玩家的影响,进而解释为什么有些玩家会选择不换门([14]),但没有给出具体方案来比较换门与不换门赢得汽车的概率;经济学家基于玩家对主持人动机的不信任来研究玩家与主持人之间的博弈,从而得出玩家不应该换门的结论([11]),但并没有给出非博弈视角下换门与不换门赢得汽车的概率;计算机科学家利用R 语言对三门问题进行建模并进行大量的数据模拟,表明在获得一定信息的前提下,改变最初选择提高了赢得汽车的可能性([15]),但它没有从演绎的角度向我们展现换门与不换门的概率分布1这里的具体做法是结合R 语言进行大量的编程模拟,并对模拟结果进行统计,发现换门赢得汽车的概率趋向于2/3,不换门赢得汽车的概率趋向于1/3。这实际上是一种归纳的方法。;数学家和逻辑学家主要基于贝叶斯定理,用条件概率来对先验概率进行更新,并得出换门赢得汽车的概率更大([8]),但这种方案在运算过程和最终结果的呈现上不够直观。

为了更加直观地呈现三门问题中换门与不换门各自赢得汽车的概率,本文拟用概率动态认知逻辑来为三门问题建立概率认知模型,并用概率更新模型来对其进行更新,从而将主体认知概率的变化过程细致地刻画出来。

2 概率动态认知逻辑的模型及其更新规则

概率动态认知逻辑(Probabilistic Dynamic Epistemic Logic,简称PDEL)是一种将概率逻辑与动态认知逻辑相结合的逻辑系统。相比于一般的动态认知逻辑,PDEL 加入了概率内容,其表达力更加丰富;相比于一般的概率逻辑,PDEL 将事件的概率处理成认知模型里的世界的概率,其更加直观。

Halpern 和Tuttle([7])以及Fagin 和Halpern([4])将概率逻辑与静态的认知逻辑相结合,建立了静态概率认知逻辑;Kooi([9])和van Benthem([2])在静态的概率认知逻辑基础上,分别在其中加入了公开宣告和行动模型,使概率认知逻辑动态化,建立了概率动态认知逻辑;van Benthem、Gerbrandy 和Kooi([3])在概率动态认知逻辑的概率更新规则中又明确区分了先验概率(prior probability)、发生概率(occurrence probability)和观测概率(observation probability),明确定义了概率认知模型、概率更新模型和概率乘积更新规则,完善了PDEL 的语义内容;Achimescu、Baltag 和Sack([1])将[3]中的单主体推广到了多主体,使得PDEL可以刻画多主体之间的互动。下面,我们在[3]的基础上介绍PDEL 的模型与更新规则,在[1]的基础上介绍PDEL 的语言和语义,为第三部分建立三门问题的概率认知模型奠定理论基础。

定义1(概率动态认知逻辑的语言).给定一个主体集Ag,一个原子命题集At和一个有理数集Q,概率动态认知逻辑的语言可定义如下:

其中,p ∈At,i ∈Ag且α1,···,αn,β ∈Q。

根据这个定义,其它几个概率公式可定义如下:

定义2(概率认知模型).给定一个主体集Ag和一个原子命题集At,概率认知模型M(S,~,P,V)定义如下:

S是一个有穷非空世界集;

~是主体i建立在S上的等价关系集;

P:Ag →(S →(S →[0,1])),P刻画了主体i在S中某个世界上对S中任意世界的概率指派,一般表示为Pi(sm)(sn),其中sm,sn ∈S,m,n ∈N;V:At →℘(S),V对每个原子命题指派一个S的子集。

与一般的认知模型相比,概率认知模型多了概率指派P。直观上看,概率指派函数P表示的是主体在某个世界上对另一个世界指派概率,特别地,主体在任意一个世界上对S中所有世界的概率指派总和为1。[3] 将概率认知模型中的P指派的概率命名为先验概率。

定义3(概率更新模型).给定一个主体集Ag和一个原子命题集At,概率更新模型A(E,~,Φ,pre,P)定义如下:

E是一个有穷非空事件集;

~是主体i建立在E上的等价关系集;

Φ 是E中事件发生的前提条件集,Φ⊆At,Φ 是两两不一致的公式集;

pre:Φ→(E →[0,1]),指前提条件p为真的情况下,事件e发生的概率,一般表示为pre(p,e),其中p ∈Φ,e ∈E,特别地,若M,s⊨p,则可以用pre(s,e)表示pre(p,e);

P:Ag →(E →(E →[0,1])),P刻画了主体i在E中某个事件上对E中任意事件指派概率,一般表示为Pi(em)(en),其中em,en ∈E,m,n ∈N。

其中,[3]将概率更新模型中pre运算出来的结果命名为发生概率,将P指派的概率命名为观测概率。主体在任意一个事件上对E中所有事件的概率指派(观测概率)总和为1。

定义4(概率乘积更新规则).令M 是一个概率认知模型,A 是一个概率更新模型。概率更新模型A 对概率认知模型M 的更新规则如下:

更新后的概率认知模型M′M×A(S′,~′,P′,V ′)。

定义5(概率认知逻辑的语义).

上述PDEL 的语言和语义(定义1 和5)之所以借鉴[1]中的定义,是因为[3]采用的是带等号的概率公式,但带不等号的概率公式的表达力更为丰富。模型和更新规则(定义2、3、4)之所以借鉴[3]中的定义,是因为三门问题只涉及单主体,这样可以保持语义的简洁性。

3 三门问题的概率动态认知逻辑解

我们将三门问题里的玩家视为认知主体。基于第二部分给出的PDEL,首先建立三门问题的初始概率认知模型,然后根据主持人可能采取的行动来建立概率更新模型,最后求出更新后的概率认知模型,并将这个模型里概率赋值最高的世界作为主体的最优选择。

3.1 三门问题的概率认知模型

根据定义2,用a,b,c分别表示原子命题“车在A门后”“车在B门后”“车在C门后”。三门问题最初的概率认知模型M(S,~,P,V)如图1 所示,其中S{sa,sb,sc}。根据无差别原则,在获取更多信息之前,主体对命题a,b,c指派的概率是相等的,故对于sm,sn ∈S(m,n ∈{a,b,c}),都有Pi(sm)(sn)1/3。由于在同一个世界上,命题a,b,c有且只有一个为真,所以V(a){sa},V(b){sb},V(c){sc}。

图1:三门问题的概率认知模型

3.2 三门问题的概率更新模型

根据定义3,在主体选择A门的情况下,主持人打开B门或C门的概率更新模型A(E,~,Φ,pre,P),其中E{open B,open C},open B和open C分别表示“主持人打开了B门”和“主持人打开了C门”,Φ{a,b,c}。函数pre和概率指派函数P的值可以用全概率规则来计算。

令P(a)、P(b)、P(c)分别表示汽车在A门后的概率、汽车在B门后的概率、汽车在C门后的概率,则P(a)P(b)P(c)1/3;P(open B |a),P(open B |b),P(open B |c)分别表示汽车在A门后主持人打开B门的概率、汽车在B门后主持人打开B门的概率、汽车在C门后主持人打开B门的概率;P(open C | a)、P(open C |b)、P(open C |c)分别表示汽车在A门后主持人打开C门的概率、汽车在B门后主持人打开C门的概率、汽车在C门后主持人打开C门的概率。汽车所在的位置及主持人相应的行动共有如下三种情况:

(1) 当汽车在A门后时,按照无差别原则,主持人打开B门和C门的概率是相等的,即P(open B |a)P(open C |a)1/2。

(2) 当汽车在B门后时,因为A门已经被主体选中,所以主持人不可能打开A门,即P(open A | b)0;又因为主持人要打开一扇没有车的门,所以他也不会打开B门,即P(open B | b)0;因此,主持人只能打开C门,即P(open C |b)1。

(3) 当汽车在C门后时,同理,P(open A|c)P(open C |c)0;因此,主持人只能打开B门,即P(open B |c)1。

根据全概率规则,在主体选择A门的情况下,open B和open C发生的概率分别为:

根据[3],对于任意的p ∈Φ 和任意的e ∈E,PDEL 中pre(p,e)的值就等于概率逻辑中P(e|p)的值。因此,

根据[3],对于任意的em,en ∈E,PDEL 中Pi(em)(en)的值就等于概率逻辑中P(en)的值,因此,

概率更新模型A 可以用图2 直观地表示:

图2:三门问题的概率更新模型

其中,虚线表示函数pre,分别表示在命题a,b,c为真的情况下,主体对事件open B和open C的概率指派,虚线上的数字是发生概率;实线表示主体对事件open B和open C的认知不可区分关系,实线右侧的数字是观测概率。

3.3 三门问题更新后的概率认知模型

三门问题最初的概率认知模型M,在经过概率更新模型A 更新后为M′(S′,~′,P′,V ′),该模型本来共有六个世界(如图3 所示):

图3:三门问题更新后的概率认知模型1

其中,世界(sa,open B)表示“车在A门后并且主持人打开了B门”,其余世界类似。

根据定义4 的第一条规则,需要删去概率指派为0 的世界。由于pre(sb,open B)0 且pre(sc,open C)0,因此,应该在世界集中删去(sb,open B)和(sc,open C)。

再根据定义4 的第三条规则,世界(sa,open B)的概率为1/6,计算过程如下:

另外三个世界(sa,open C),(sb,open C),(sc,open B)的概率计算方法类似,它们的概率分别为1/6,1/3,1/3。

三门问题删去概率指派为0 的世界后的概率认知模型M′(S′,~′,P′,V ′)如图4 所示:

图4:三门问题更新后的概率认知模型2

在主体选择A门并且主持人打开B门的情况下,比较车在A门后和车在C门后的概率,就是比较(sa,open B)和(sc,open B)的概率。由图4 可知,(sc,open B)的概率更高,因此主体应该换为C门;同理,在主体选择A门并且主持人打开C门的情况下,主体应该换为B门。总之,在主体选中A门后,无论主持人打开哪一扇门,换门赢得汽车的概率都更高。

上述是在模型层面直观地比较模型M′中各个世界的概率,下面我们基于语义定义来证明公式Pi(a)<Pi(¬a)在模型M′中有效。

根据定义4 的第四条规则,V ′(a){(sa,open B),(sa,open C)},V ′(b){(sb,open C)},V ′(c){(sc,open B)}。又由于a,b,c在任意一个世界上有且只有一个为真,因此,

再根据定义5中关于概率公式的语义解释,在模型M′中的任意一个世界(s,e)∈S′上,都有:

M′,(s,e)⊨Pi(a)1/3;

M′,(s,e)⊨Pi(¬a)2/3。2其中,Pi(a)的值就是主体对(sa,open B)和(sa,open C)的概率指派之和,即1/6+1/6=1/3;Pi(¬a)的值就是主体对(sb,open C)和(sc,open B)的概率指派之和,即1/3+1/3=2/3

因此,在主体最初选择了A门且主持人打开了一扇没有汽车的门后,汽车在A门后的概率要小于汽车不在A门后的概率,也就是说,主体选择换门能提高赢得汽车的概率。

从三门问题最初的概率认知模型(图1)到更新后的概率认知模型(图4),清晰地刻画了以下过程:在主持人没有开门之前,任何一扇门后有车的概率都是1/3,所以主体选中的A门后有车的概率是1/3,而未被选中的那两扇门后有车的概率是2/3,也就是P(A)1/3 和P(B)+P(C)2/3。当主持人打开一扇没有汽车的门时,也就是确认了要么P(B)0 要么P(C)0。因此,要么P(B)2/3要么P(C)2/3,即换门会增加主体赢得汽车的概率。

4 结语

本文结合[3]和[1],给出了PDEL 的语言和语义,并为三门问题建立了概率认知模型,清晰呈现了换门与不换门各自赢得汽车的概率(主体的认知概率分布),全面展现了三门问题的概率认知模型在概率更新模型下的变化过程,帮助我们更加直观地理解了三门问题。这不仅体现了概率动态认知逻辑强大的表达力,亦为分析彩票悖论、睡美人难题等概率问题提供了借鉴方案。以彩票悖论为例(关于彩票悖论的逻辑结构可参见[13]),可以利用本文所给的PDEL 语言和语义,为其建立初始概率认知模型M0,该模型里共有100 万个世界,这些世界刻画的都是它所对应的那张彩票会中奖。然后将“否认第一张彩票会中奖”作为概率更新模型A0对M0进行更新,得到概率认知模型M1。M1删除了刻画“第一张彩票会中奖”的世界。接着将“否定第二张彩票会中奖”作为概率更新模型A1来更新M1,得到概率认知模型M2。如此更新下去,概率认知模型Mn−1(n100 万)将只有一个世界,它刻画的是“最后这张彩票会中奖”。这就表明,主体在否认其它彩票会中奖之后,不能再否认最后这一张彩票会中奖,否则会导致矛盾。

猜你喜欢
概率定义逻辑
刑事印证证明准确达成的逻辑反思
以爱之名,定义成长
概率统计中的决策问题
概率统计解答题易错点透视
逻辑
概率与统计(1)
概率与统计(2)
严昊:不定义终点 一直在路上
定义“风格”
女生买买买时的神逻辑