托马斯·贝叶斯对概率原理的证明尝试

2016-01-31 02:10程献礼
山西经济管理干部学院学报 2015年4期

□程献礼

(河南大学哲学与公共管理学院,河南 开封 475001)



托马斯·贝叶斯对概率原理的证明尝试

□程献礼

(河南大学哲学与公共管理学院,河南 开封 475001)

【摘要】从原著入手往往可以发现作者的本意,对托马斯贝叶斯思想的解读也不例外。作为向经验学习的一种规范性理论,贝叶斯关注的是逆推理问题。从贝叶斯的基本概念——概率的两个定义入手,结合Shafer的对该问题的论述,重新解读贝叶斯对概率原理的证明尝试。不管选择实施的机会变化中什么样的事件,然而贝叶斯构建的一次偶然事件B的持续出现将产生无限的增益。

【关键词】概率原理;嵌套约定;贝叶斯命题

Richard Price既是托马斯·贝叶斯(Thomas Bayes)的遗嘱继承人也是他的好朋友,在贝叶斯去世后整理了其生前的文章。Price向《皇家学会哲学学报》提交的以《论机会学说中的一个问题》(An Easy Towards Solving a Problem in the Doctrine of Chances)贝叶斯关于二项分布中逆概率的手稿,于1763年发表。文章提出的由限定的二项分布的观察出发对其参数进行概率推断的方法,被称为“贝叶斯定理”,并推广到二项分布以外应用之中的任何样本分布。后来的拉普拉斯(1774年),把该方法推广到一般形式。

由于代表在观察到任何数据之前对参数信念度的分布,因此,个人对参数所认定的分布成为他的先验分布。贝叶斯定理给出了关于更新参数值的一个先验分布,从而得到参数后验分布(即观察到于未知参数值有关的实验结果之后所确定的分布)的数学方法。该方法给出了按照新的信息对某个参数的信念度修正或更新的工具,这是一个将经验知识或随机过程理论上的理解和观察数据加以综合的过程,所以它是一个向经验学习的规范性理论。该原理无疑改变了人们对推理的认识,开创了一个推理研究的新时代。

1问题的产生

Price给贝叶斯论文取的题目并没有真正的体现贝叶斯文章的真实目的。直到贝叶斯论文受到广泛关注的新时期,有关机会学说的绝大部分著作还纠结于所谓的“直接推理”中:即,已知某个机会的基础概率,计算特定实验次数后某特定结果出现的概率,或计算出为达到某期望水平结果的可能所需重复的次数。贝叶斯的论文关注的是逆推理问题:已知控制实验的可观察结果,推出,某一给定的实验中某个机会设置(chance setup)产生此特定类型项目的可能性。更准确地说,贝叶斯为他自己设置的问题是——“给定一个事件发生和失败的次数,求其在一次实验中发生的概率位于两个任意指定的概率度之间的概会”[1]188。不难发现,贝叶斯认为,与计算出一个可定义数值的直接概率问题的答案一样,他问题的解决方案也不得不用相同的“项”来表达。

Price告诉我们,“贝叶斯先生想以对这些就会的普遍规则的证明来开始他的工作,他认为这是合适的。这样做的理由,正像他在导言部分说的,不仅仅是使读者在其他地方查找他给出的那些原则不至于有麻烦,而且考虑到他们不知道什么地方能对这些规则的清楚说明提供参考”[1]187。G.A.Barnard说“后面几页中给出的贝叶斯论文,应该作为科学史上最著名的回忆录之一,它所讨论的问题今天人有着激烈的争议”*S詹姆斯·普雷斯.贝叶斯统计学——原理、模型及应用,廖文、陈安贵等译,北京:中国统计出版社,1992年,第181页。。“然而具有讽刺意味的是,文章中贝叶斯自己关于很多有争议的假设辩护的基本观点,已经被包括卡尔·皮尔森(Karl Pearson),费舍(R.A.Fisher),哈罗德·杰弗里斯(Harold Jeffreys)和哈金(Ian Hacking)等人的评论在某些问题上所曲解”*程献礼:《从“附注”管窥贝叶斯推理》,载《重庆理工大学学报(社会科学)》,2012年第8期(待刊)。。

为方便分析,本文把贝叶斯的论文划分为四部分。第一部分,即贝叶斯的命题1至7,提供一个概率的定义,之后该定义被用于证明如今被作为基本的公理或理论用于计算概率的诸多概率原理;在第二部分,也就是贝叶斯命题8至9及其推论则运用这些观念去获取关于一个应用于完美水平的台球桌的概率组合一些准则;第三部分由“附注”(Scholiun)组成,作为一种解决其问题的一种形式,贝叶斯努力尝试证明从第二部分获得的原则,他这样做是有道理的;第四部分(贝叶斯命题10,规则及一个附录)通过提供第2部分和第三部分出现的具体应用和积分的数值估计,完成解答。第一部分内容也是本文试分析的主要内容,第三部分(即对“附注”部分的研究),该文作者已经做过相关探讨,有兴趣的读者可以参考相关文章。

与《从“附注”管窥贝叶斯推理》文对第三部分内容的讨论不同,本文就贝叶斯文章中第二部分的推理问题,即贝叶斯论文对该问题的主要论证,进行从定义到命题,重点分析贝叶斯对概率原理的证明尝试,从而做出一个崭新角度的解读。

2贝叶斯的两个概率定义

在贝叶斯问题上重新出现非难的中心困境,可以追溯到试图产生于联合概率的两个——本文倾向于“信念度”和“客观概率”的,一种状态(tension)。第一个概念由论文的定义5给出,“任一事件的概率,等于予以计算的依赖于该事件发生的期望值与该事件发生时所预期的值之比”*同上,第188页。。现代贝叶斯主义者可能希望把该定义视为他们概率定义的试金石,寥寥几个字的省略,该定义就能被冠以个人的诠释:已给主体事件的概率是最大的,意味着在该事件发生时该主体将愿意为一个协议支付1人民币(1RMB$),否则则不是。但贝叶斯的限制词“应该是”显示,他心里所指的不是主观或个人信念度而是趋于理性的或合理的信念度。该解读是由贝叶斯所给出的其问题的解决方案提供了明确的不收不同主体的偏好等影响的数值这样一个事实所支持的。

贝叶斯的立场不同于那些除了承认有限的具体信念概念定义之外,不承认任何客观机会概念彻底的贝叶斯主义私人主义者。Price在序言中盛赞了De Moivre的工作,他帮助指出了“为说明事物的组成结构中存在固定的规则,因而世界之框架是智慧和某个智慧之神的结果,并因此证实神存在的终极原因”*同上,第186页。。而贝叶斯应接受更高的赞誉,“由于这个问题的反问题(也称逆问题)的解决更直接地适用于这个目的,因为它周密而精确地像我们显示,对任何一个秩序或任何重复发生的事件,我们有理由认为这种重复或秩序是由大自然中某些固定的原因或规则导致的,而不是任何偶然的不规则的原因造成的”*同上,第186页。。有现代读者把Price的“秩序或任何重复发生的事件”解释为产生稳健频率的机会建立的趋势,把他的“固定的原因或规则”解释为一种在机会建立中的固有属性和重复实验中可观察频率的重要的物理属性。贝叶斯是否赞成此观点,已无法确切地从他的文章中解读出来,然而规则1中的应用给出了独立事件属性解释。除非把它解读为一种非认知、客观机会的固定未知值的合理估计,否则,无论按照性向的,还是有限频率,抑或其他完全不同方式的解释,他对问题的阐述无论怎样都让人难以理解。

这里,难点并非贝叶斯没有给出“客观概率”的定义,用现代的说法,“客观概率”是“自旋”和“魅力”等一样的理论术语。该术语并不迫切需要超越从它在理论中,如,基本粒子理论中“自旋”和“粲数”,及机会方案理论中的“客观概率”起作用所获得的隐定义之外的任何定义。更确切地说,对贝叶斯来说困难在客观概率的值中讨论信念度。回顾一下:作为指派到事件的信念度的贝叶斯概率,不管事件的形而上学状态是什么,它们总是那些确定要发生或不发生的事件,否则,用以定义信念度的经济价值的期望或约定就不能兑现。对该难题最直接的回复就是,寻找一个用作客观概率位于具体范围之间事件状态的替代事件(另文分析)。

3贝叶斯证明概率原理的尝试

根据贝叶斯命题1的证明,给出贝叶斯推理方式的一个例子,“不一致事件”的有限可添加性原理。令A、B、C为不相容事件对,设这些事件的概率分别为a、b、c。如果我们用[RMB$P;Z]表示回报抵偿P的期望或约定,事件Z出现的可能情况,则,该概率的指派就是指“你”将为[RMB$1;A]支付RMB$α,“你”将为[RMB$1;B]表示其支付RMB$b,为[RMB$1;C]支付RMB$c。在此条件下,贝叶斯称,“你”将为[RMB$1;A或B或C]支付RMB$(a+b+c)。因此,由概率的定义析取事件A或B或C事件的概率就是你独立事件概率之和。此处,因为已约定[RMB$1;A或B或C]等于三个约定[RMB$1;A],[RMB$1;B]和[RMB$1;C],而且三个的约定的值是三个值之和,贝叶斯论证得出的似乎是[RMB$1;A]、[RMB$1;B]及[RMB$1;C]=val[RMB$1;A]+val[RMB$1;B]+val[RMB$1;C]。作为概率公理的荷兰赌合理性上的一部分,Schick(1986)批评了这个“值的可添加性原理”。本文现在不想介入这个纷争,首先引用Schick的观点来看,除非值的可添加性是荷兰赌构成的一个隐含假定,其次,注意,已给在荷兰赌的值的可添加性,贝叶斯的论证无须加入任何其他的就已经证实了概率有限可添加性公理。但也要指出的是,贝叶斯对该问题的解决所涉及的原理比有限可添加性更有力。

命题1的推论是一个否定规则,Pr(A)+Pr(r+A)=1,该推论是由命题1依照假定val[RMB$N;A或-A]=N直接得出。该规则反过来有被用来建立命题2,该命题断言,一个事件的概率就是,如果失败,它没发生时失败的概率;当发生时,增加的概率。(P2,如果某人对事件的期望依赖于该事件的发生与否,那么该事件的概率与它失败时的概率之比,等于该事件失败时他所遭受的损失与该事件发生时他所获得的收益之比)。Pr(A)=P/N指,对于“我”来说,val[RMB$N;A]=P。这就意味着:当事件没有发生时,“我”的损失是RMB$P;而发生并获得A时,“我”的收益是RMB$(N-P)。因此,由命题1的推论,得,

关于后续事件A和B的命题3和5,现代评论者分别表示为:

(1a)

(1b)

这是一个双重难题。首先,以现代的眼光看,(1a)和(1b)似乎是定义而不是需要证明的实质性命题。其次,通过命题3中已经建立的(1a),(1b)也能通过平行证明而成立,而贝叶斯为命题5提供的证明完全不同于命题3的证明。Shafer(1982)提示,时序是理解看到的(1a)和(1b)之间差异的关键,但在本文看来,A和B的时序看起来没有在贝叶斯命题3的证明中起到任何作用。解决这些困惑的另一个建议如下:对于第一个困惑,(1a)可以看作是条件概率的一个定义,但该定义急需理由或操作的依托,而这正是命题3要提供的。至于第二个困惑,命题5的证明是很不同于命题3,暗示了,在命题5中,贝叶斯在寻找多于命题3变形的(形式)。令PrB(·)表示知道B发生时由概率产生的结果的概率Pr(·)。从而,贝叶斯在命题5中说“我正确的概率”的大部分情况,我想,A已经发生了,“首先发现,第二个事件[B]已经发生”*S·詹姆斯·普雷斯.贝叶斯统计学——原理、模型及应用,廖文、陈安贵等译,北京:中国统计出版社,1992年,第191页。,或许他的本意已经是PrB(A)了。在该符号中,命题5所涉及的是:

为了尝试证明命题3,贝叶斯令:

并且他假设“事件1[A]发生条件下事件2[B]”*同上,第190页。的概率,如,

则分别指的是,

val[RMB$N;AΛB]=P,

val[RMB$N;A]=a。

贝叶斯接着推出,偶然事件AΛB(根据定义5)“我的期望值为P,而在事件1[A]发生时它为b”*S·詹姆斯·普雷斯.贝叶斯统计学——原理、模型及应用,廖文、陈安贵等译,北京:中国统计出版社,1992年,第190页。。这样就意味着,他说,如果事件A发生,一个人的收益为b-p,而它失败,一个人的损失就是P。于是根据命题2,他得出,

用来得出想要的结果。该证明并不能使人信服,这是因为这里“得到”一词与命题2中的含义不一样。

在贝叶斯的论文中有可信理由的足够的材料。我们很快就会看到,命题5介绍了嵌套约定[[RMB$N,C];D](nest contract)的概念,其中当获得D时,其收益为约定[RMB$N,C]。在计算该约定中,可以采用这两个原则:

首先,val[[RMB$N,C];D]=val[RMB$N,CΛD]。

val[[RMB$N,CΛD]=Pr(CΛD),

我们就得到:

由于命题5是贝叶斯论文中第二部分和第三部分的关键,本文将详细检验贝叶斯的证明尝试。这个尝试是建立在命题4的基础之上的,贝叶斯奇特的逻辑由Shafer(1982)发扬光大。设,每天有两个相继事件A1,B1在第一天被确定,两个相继事件A2,B2在第二天被确定,等以至无穷。概率Pr(Bi),i=1,2,3,…,在第i天第二个事件的出现假定与所有的i相等,同样,概率Pr(AiΛBi)等于第i天两个事件出现概率的合取。令Ej,j=1,2,3,…,是一个假使A在第一天发生,事件B从第j天开始发生时出现的事件。A1=A,B1=B,命题4表明:

(2)

Shafer的(2)对贝叶斯证明的重构是完美和简洁的。按照Shafer的解释,贝叶斯假设,Pr(E1)=Pr(E2),并且,E2独立于(A1,B1)。通过构建E1与,(A1ΛB1)∨(-B1ΛE2)因此,

Pr(E1)=Pr(A1ΛB1)+Pr(-B1ΛE2)

=Pr(A1ΛB1)+Pr(-B1)×Pr(E2)

=Pr(A1ΛB1)+(1-Pr(B1))×Pr(E2)

=Pr(A1ΛB1)+(1-Pr(B1))×Pr(E1)

(3)

第一个等式是从添加性定理(命题1)中得来的,第二个是通过独立事件的乘法原理得来的,第三个是从否定原理(贝叶斯命题1的推论)得出来的,第四个,是由开始假定得的。等式(2)是由项的重新组合而得到的。

不管怎样,Shafer的重构跟贝叶斯自己的证明不一样。尤其是,贝叶斯没有直接要求独立事件的乘法规则;实际上,该规则一直到命题6才出现。为理解贝叶斯的推理,从Pr(E1)所指的就是val[[RMB$1,E1]=x。第一天,如果事件A1和B1都发生,那我就按预期得到RMB$1。但,如果这个巧合没有发生,则“我按预期回到前面的条件,如,获得事件2失败预期的x”*同上,第191页。。假设,val[RMB$1,E1]=valc,第二个预期就能解释为嵌套约定.[val[RMB$1,E2];-B1]因为这两个预期“之和与我的初始概率相等”,建立命题4所需的是,嵌套约定的赋值原则(valuation principle),即:

[val[RMB$1,E2];-B1]=val[RMB$1;E2]×Pr(-B1)],

这正如他所写的指出的一样“所以,由于x是预期,y/x就是得到它的概率,则此时的期望值为y”。由以上所述我们应得出:

[val[RMB$1,E2];-B1]=val[RMB$1;E2Λ-E2]=Pr(E2Λ-B1)。

因而,为得到:

Pr[E2Λ-B1]=Pr(E2)×Pr(-B1)=val[RMB$1;E2]×Pr(-B1),

看起来必须求助于独立事件的乘法公理。

通过添加命题4,命题5的证明就完成了,该推论产生另外两个等式:

PrB(E1)=PrB(A)

(4)

PrB(E1)=Pr(E1)

(5)

按照贝叶斯所说的,“但在这个发现(获得B)*本文加。括号里的下同。之后,我获得N(E1上偶然的报酬)的概率应为两个相继事件(A)中事件1在假定事件2已经发生时的条件概率”*同上,第191页。,第一个等式可以直接得出。而(5)的证明,更是疑点重重。首先假设,因为,那么,在知道第一个事件是否发生之前,PrB(E1)

4结论

不管选择实施的机会变化中什么样的事件,然而在贝叶斯的构建中基于事件B的持续出现将发生一次偶然的坍塌。尽管有时让人想起“荷兰赌”(也称大弃赌)观点,但当前的说法缺少他们的尝试。遭遇在荷兰赌中的那个“倒霉蛋”,无疑面临破财的处境。毕竟偶然事件并非一个十分有力的可信赖的“拐杖”,因为它威胁着所有过于频繁出现、谨慎服从概率定理的事件。贝叶斯归谬法的另一部分是,它甚至难以引起兴趣。如果,PrB(E1)>Pr(E1),就有使一个人拒绝取消[RMB$1;RMB$2]而放弃[RMB$1;RMB$x]诱因的溢价,且这跟B事件持续的出现一样反复发生。如果说拒绝采取产生无限收益的行动是一种遗憾,而这种遗憾似乎不是“概率论应当建立”的那种遗憾。

参考文献:

[1]Bayes,T.“AnEssayTowardsSolvingaProblemintheDoctrineofChances.”PhilosophicalTransactionsoftheRoyalSocietyofLondon,1764(53):370-418.

[2]Price,R.FourDissertations.London:A.MillarandT.Cadell.2nded.,1768.

[3]Shafer,G.“Bayes,TwoArgumentsfortheRuleofConditioning.”AnnalsofStatistics,1982(10):1075-1089.

[4]Schick,F.“DutchBookiesandMoneyPumps.”JournalofPhilosophy,1986,83:112-119.

[5]Stigler,S.M“ThomasBayes’BayesianInference”JournaloftheRoyalStatisticalSociety,SeriesA,1982(145):250-258.

[6]S·詹姆斯·普雷斯.贝叶斯统计学——原理、模型及应用[M].廖文,陈安贵等译,北京:中国统计出版社,1992.

[7]程献礼.从“附注”管窥贝叶斯推理[J].重庆理工大学学报(社会科学),2012(2).

[责任编辑:杨春艳]

TheAttempttoApprovethePrincipleofProbabilitybyThomasBayes

CHENGXian-li

(Faculty of Philosophy and Public Administration, Henan University, Kaifeng 475001, China)

Abstract:Since people often approach the writer' s own idea by studying his original works, so does the studies on Bayes' inference thought. As a normative theory to the experience, Bayes paid much attention to the Inverse inference problem. We start from the fundamental concepts, degree of beliefs and objective probability, and associate with the argument by Shafer to re-study and restitute the Bayes' approve to the Principle of Probability. Finally we found regardless of selecting what kind of events in opportunity change of implementation, an accidental event B' s continuous emergence Bayesian constructed would lead to an unlimited gain.

Key words:Principle of Probability; nest contract; Bayes' proposition

作者简介:卞彩巍(1979-),女,吉林长春人,硕士,现工作于长春师范大学,讲师,研究方向:思想政治教育。

基金项目:吉林省教育厅“十二五”社会科学研究项目“共同成长视域下的吉林省高校辅导员队伍职业化建设探究”(吉教科文合字[2015]第284号)

收稿日期:2015-07-10

【中图分类号】B81

【文献标识码】A

【文章编号】1008-9101(2015)04-0004-05