《科学推断》一书评介

2011-03-18 00:08龚凤乾
统计与信息论坛 2011年10期
关键词:杰弗里测量学概率论

龚凤乾

(天津财经大学 理工学院,天津 300222)

《科学推断》一书评介

龚凤乾

(天津财经大学 理工学院,天津 300222)

《科学推断》(Scientific Inference)是英国学者杰弗里(Sir.Harold Jeffeys,1891-1989)众多专著中的一本,它和作者的另一本著作《概率论》一道,被认为是新一代统计工作者及任何有志于研究科学推理的人士不可不读的好书。学术界现在一般认为,杰弗里对近几十年来贝叶斯学派的重新兴起贡献很大。本文旨在对该书作一评介,希望能引起读者的阅读兴趣。

一、全书概览

《科学推断》全书共10章。第一章“逻辑与科学推断”,第二章“概率”,第三章“抽样”,第四章“误差”,第五章“物理量”,第六章“测量学”,第七章“牛顿动力学”,第八章“光与相对论”,第九章“对科学的三种误解及其有关问题”,第十章“统计力学与量子论”。书末还有三个附录。

关于写作的原因,作者在第一版的序言中指出,“我认为从经验中学习并据以做出超越直接由感官所获信息的推理是可能的……,本书坦率地把科学探索的原则当作一种简单的假定,并由此逐步展现这种假定所带来的多种结果。这种假定能导致一种解释和证明,即实际上许多简单的数量定律都伴有很高的发生概率,从而导致对这些定律所涉及的过程的重新表述。”在第二版的序言中继续强调,“自本书问世以来,科学推断的理论获得了重大发展,因此我认为有必要重写本书的大部分内容。本书总的观点,即没有概率论(它可视为关于知识接受程度的理论),科学方法的理解就失去了必要充分条件,依然没有改变。”

杰弗里的这些话激起了我们跟随他深入探讨概率论在科学推理中作用的极大兴趣。

二、各章内容择要

在第一章中作者虚拟了一位植物学家和一位逻辑学家的一场辩论,旨在说明利用过去的观测数据推断未来并不属于演绎推理。没有被观测到的数据既可能和未来的事件有关,也可能仅和现在尚未被检验过的事件有关。这种推理实际属于归纳推理。

通过这个虚拟的辩论,杰弗里指出科学的进步是一种不断逼近的过程。辩论中那位植物学家因为未能清楚地承认这一事实,因而才不断地陷入矛盾之中。实际上他需要做的只是把生物学定律用最普通、最简单的形式表述出来,然后随着经验的增加不断地修正这些定律即可。杰弗里在全书中都力图证明这种作法不仅能避免自相矛盾,而且唯一可行[1]1-56。

第二章是“概率”。杰弗里认为,一旦超越观测数据而进行相应的推断,所表达的就是在观测数据和相应推断之间存在一种逻辑联系,这种联系属于更一般的逻辑而非演绎推理。这种逻辑并不声称由观测数据演绎地证明或否证相应的推断,它只给出在一定数据下对推断的支持,而最关键的是这种支持在程度上可以有种种的不同。一组数据与结论之间的联系称之为概率,在本质上它可称为当代多值逻辑。

如果在数据变动的条件下考虑关于不同命题的相信程度,就需考虑数据变动的后果,此时要求考察概率时所用的数据不能自相矛盾。如果在数据中存在自相矛盾,应采用演绎推理予以检查并作相应的修正。不言而喻,观测数据本身不应该有矛盾,但在两个假设之间或在观测数据与假设之间却可能存在矛盾,而这些假设正是有待检验的。

杰弗里认为所谓逆概率原理(贝叶斯定理可由此推出)就是乘法规则的直接结果,而“后验概率∝先验概率*似然”对于概率论的意义,一如毕达哥拉斯定理之于几何学,从而使概率论与科学推断自然地发生了联系。熟知,对似然的重视(贝叶斯定理断言所有来自数据的信息都被总括到似然之中)和对先验概率无矛盾加以指派的深思熟虑,是贝叶斯方法的主要特征。由此,贝叶斯分析就成了科学地从经验和数据来学习的一种方法,与信息时代的要求非常合拍,适用性极广[2]1-9。

杰弗里在本章还提出了简单化假设(the simplicity postulate),即“科学定律之所有可能形式的集合是一有限集或可数集,且这些定律的初始概率构成总和等于1的收敛级数的项”。

第三章是“抽样”。众所周知,二项分布、泊松分布及正态分布是概率论中经常出现的三个分布。本章应用概率论的方法对抽样展开讨论,从而对这三个重要分布的性质做出深入分析,发表了许多发人深思的见解。本章还通过经典案例介绍了多项分布及χ2-分布。

第四章是“误差”。杰弗里指出,理论值和观测值之间的差即为误差或残差,它绝无贬义,而在进一步的讨论之前必须要考虑误差的性质,这需要从测量仪器的读数误差(这部分地归因于人们的偏好)及来自其他一些误差源的误差两方面进行分析。误差的分布——如果待测的量尽可能地稳定——将近似服从正态分布,由此引出人们熟知的中心极限定理。

杰弗里指出,正态误差律单参数的估计方法可推广到任何误差律的参数估计上去,而且除了少数情形外,这些估计方法在观测值较多时还具有标准形式;只要后验概率密度与似然成比例,估计的准确性就不会有重大损失。由此可知先验概率分布的精确形式并无实际的重要性,尽管其理论上的重要性依然存在[3]50-73。

第五章是“物理量”。杰弗里指出,物理试验得到的观测值很少与定律的预测值精确吻合,而物理教师在向学生传授这些定律时似乎总把它们说成能和试验结果精确吻合。这差不多和人们在数学中使用因果律的做法相似,然而物理定律只有在得到误差概念的支撑时应用因果律才合适。一旦引入误差,物理定律(只要和观测数据有关)就成为关于概率分布的陈述,由此产生的物理量原则上就成了这些概率分布中的参数了,这才是需要读者关注的。

第六章是“测量学”。本章对距离测量极为关注,它首先指出最基本的自然科学是关于长度之间关系的科学,杰弗里称其为测量学,以区别于纯数学的几何学,其主要目的乃是指出实验基础的重要性(这种重要性常常被忽略)。

几何学以公设开始,其他具体结果均可由公设推出;而在测量学中测量结果最为重要,具有普遍性的定律根据,建立在简单化假设上的推广程序,可以由测量结果推出来。

欧氏几何是和测量学最为近似的一门几何,但欧氏几何体系决不会等同于测量学,事实上它既不是测量学也不是几何学,而是这两者的混合体。例如,欧几里得使用圆规作图(这是很合法的测量学方法),但却拒绝使用圆规度量距离①利用圆规度量距离,需使圆规在取定一段长度而移动到指定点处时,其两脚间的距离保持不变。但欧几里得假定用的是一个不能固定两脚的圆规,而在以给定点为心、给定距离为半径作圆时,他又假定圆规的两脚是能固定的。。欧几里得假设任何两点间均可作一直线。在实践中这假设经常能够成立,但不是永远能成立。凸体表面上的点由于凸体太坚硬而无法穿透(从而不能作一直线连接其上的两点),然而两点间的距离是存在的,可用两脚规分两次测出。首先,张开两脚规测量凸体上两点间的距离;其次,利用标尺读出此距离的读数。两点间距离的概念实际上比两点间可作一条直线更具普遍性。

第七章是“牛顿动力学”。如果说第六章主要讨论距离及其(点之间的)所有角度均不随时间的改变而变化,即刚性的性质,本章则关心距离随时间的推移而改变,即所谓动力学的新领域。

“一物体具有指向另一邻近物体的加速度,此加速度与两物体间距离的平方成反比。两物体相互产生的加速度呈现为一比例,与时间和位置无关。”这两个定律是第七章所有论述的核心。杰弗里在这里借助大量天文学的例子,说明即使考察像天体动力学这样一门最为古老而且也是人类有测量以来最为精确的数量化科学,也处处离不开测量以及对测量误差的解释,从而把前面有关章节对概率、测量及误差等的讨论自然地延伸到对力学规律的探讨之中。从(天体)力学的视角论证了“从经验中学习并据以做出超越直接由感官所获信息的推理是可能的”这一主旨[4]53-93。

第八章是“光与相对论”。在第六、七两章,杰弗里关心两个最基本的学科即欧几里得几何和牛顿力学的实验基础(所获结果并未引起任何争议),而实验的目的在于获得创立这两门学科所用方法的特点。进入20世纪之后,这两门学科均有做出一些改变的必要。

本章通过介绍斐索实验、麦克尔逊-莫雷实验等物理学史上的著名实验,阐述了爱因斯坦的相对论,并指出爱因斯坦引力理论与牛顿引力理论相比,有三个可以观测到的不同。第一,爱因斯坦引力理论暗示行星的运行轨道不是精确的椭圆。除水星外这一点并不容易察觉,而列维叶(Leverrier)发现牛顿引力理论做出的关于水星轨道近日点进动的预言,和他实际观测到的结果差别非常显著,爱因斯坦相对论做出的相应预言却和实际观测结果吻合得很好。第二,承认引力能对光产生作用表明光在太阳附近会发生偏转,因而当发自恒星的光从太阳近旁穿过时,这些恒星就不会像通常那样看上去方向毫无变化。太阳改变了它周围空间曲率的计算。第三,高致密物体在光谱线上的位置与牛顿动力学方程的预言不相符合。

第九章是“关于科学的三种误解及其有关问题”,杰弗里认为关于当代科学原则存在三种引起思想混乱的主要观点。第一种观点认为,在某种意义上说科学定律所表述的东西都是确凿无疑的;第二种观点认为,物理测量可以做到准确无误;第三种观点认为在科学思想和人的普通思维之间存在明显的界限。因在本章多次提到这三种不正确的观点,所以杰弗里把它们简称为关于科学的确凿论、准确论和界限论。

本章从多方面对确凿论、准确论和界限论展开批判。现实主义和理想主义、奥克姆剃刀原则(若无必要勿增实体)、罗素和怀特海的理论、无穷集合、概率的频率理论等等,均在评论之列,语言犀利,发人深思(其中也有偏激之辞,如对概率频率理论的尖刻批评,读者对此应有自己的判断)。特别值得指出的是,杰弗里在这里对“推演”(entailment)和“蕴含”(implication)作了区分。他指出在普通用法中,两者指的是同一件事。(由p推演q)意即“q可由p推出”,但在罗素的《数学原理》中,“p蕴含q”意即“非p或q”。只要知道p假或者q真,“p蕴含q”就告成立,而与p和q之间是否存在演绎关系无关。(由p推演q)和p是否为真没有关系,但如果~p真,则不论q之真假,(~p或q)总为真,于是可得到一个奇怪命题,即一个假命题蕴含任何命题。尽管表面相似,但这个奇怪命题和一个矛盾命题蕴含任何命题在意义上大不相同。

杰弗里 还 分 辨 了 “原因”(cause)、“结 果”(effect)、“因为”(because)这三个词,认为它们的立足点不同,也和因果律没有关系。他的这些辨析即使对我们单纯学习数理逻辑而言也很有参考价值。

第十章是“统计力学与量子论”。在前几章中杰弗里说明了测量学、经典力学以及相对论的大部分何以能够从经验推出,也说明了推理原则的作用在于它们应使科学定律能以很大的概率成立的道理。统计力学和量子论的主题是禁止所谓精确的、内在性定律的概念,即使在人们所能想象出的最精确的表述中概率也会出现。

他认为现行的气体动力学理论对概率论的关注非常不够,所以其解释往往不能令人满意;气体动力学使用经典力学原理但却利用它导出了有关的统计性质,因而在本质上也是概率论的一个应用。对海森堡、狄拉克和薛定谔等人在量子论方面的工作,杰弗里也在本章作出了自己的评论。

三、《科学推断》给我们带来的启示

杰弗里的《科学推断》对我们主要有以下几方面的启示:

首先,杰弗里关于贝叶斯定理和科学推断之间关系的发现以及简单化原则的提出,是统计发展史上的重大事件,他的工作使概率与统计的联系愈发密不可分。他使我们确信,从经验中学习并据以做出超越直接由感官所获信息的推理是可能的。例如,当代BMOM(Bayesian Method of Moments,贝叶斯学派的矩法),就是一个很能说明从经验和数据中进行学习的案例[5]。

其次,杰弗里关于类比式归纳法的研究,对我们理解科学推断的本质有莫大的帮助,对我们在各自的研究工作中正确提出理论(或对待现有理论)、妥善收集处理数据、恰当做出结论等方面都有很强的启发性。

再次,杰弗里对实际测量的重视和据此提出的一系列精辟见解,给我们留下了深刻印象和启示。从实际测量出发可能对现有理论(无论其有多么流行、多么具有权威支持)提出令人耳目一新的评论,促进现有理论发展,甚至开创出全新的研究领域。他对理发师悖论的见解(第一章),对贝叶斯定理的深入挖掘(第二章),对欧氏几何的中肯批评(第六章),等等,都是这方面的例子[6]1-11。

最后,杰弗里在综合利用植物学、物理学、天文学、数学、几何、概率统计及数理逻辑等学科探索科学推断的实质所展现的洞察力,以及书中不时闪现的发人深思的叙述与评论使我们认识到,为使当代统计学研究走向深入,多方面汲取知识,踏实细致地做一番消化对比的工作必不可少。

(该书已译成中文,约25万字,厦门大学出版社出版发行)。

[1] Sir Harold Jeffreys.Theory of Probability[M].3 rd ed.London:Oxford University Press,1961.

[2] Zellner A.计量经济学贝叶斯推断引论[M].张尧庭,译.上海:上海财经大学出版社,2005.

[3] 陈希孺.数理统计学简史[M].长沙:湖南教育出版社,2002.

[4] 史宁中.统计检验的理论与方法[M].北京:科学出版社,2008.

[5] 张尧庭.BMOM——贝叶斯学派的新贡献[J].统计与精算,2001(1).

[6] Jaynes E T.Probability Theory the Logic of Science[M].Beijing:Posts & Telecom Press,2009.

2011-06-07

龚凤乾,男,天津人,副教授,经济学博士,研究方向:统计学与风险管理。

(责任编辑:杜一哲)

【统计应用研究】

猜你喜欢
杰弗里测量学概率论
测绘工程专业大地测量学课程思政教学探索与实践
线上线下混合教学模式在概率论与数理统计课程中的应用
数学实验在概率论与数理统计中的教学应用
少年智斗大力士
有效减肥法
概率论方法在高等数学解题中的应用
测量学实践教学与行业需求相结合问题的探讨
非测绘专业测量学课程教学方法设计
找律师讨房租
测量学精品资源共享课建设的探索