100%,这事儿(几乎)可以确定了

2018-10-25 03:24玛丽安佛里伯格瑞秋汤马斯徐雅
书摘 2018年6期
关键词:硬币概率频率

☉[德]玛丽安·佛里伯格 [英]瑞秋·汤马斯 著 徐雅 译

早晨,看着窗外灰色的天空,我想起了今天的天气预报。怎么,下雨的概率真的只有1%吗?难以置信!1%这个预报结果对英国的任何一天都显得过于乐观,更别提是对一个灰蒙蒙的九月天了。没有办法,尽管有先进的科技和数学,我们还是经常上天气预报的当,尤其是在我们忘了带雨伞的时候。好像天气有意让我们体会什么叫“意外事件”似的。

我们每天都会遇到与概率、风险和机会有关的事。根据对食品的研究结果,我们会选择吃或不吃某种食物,以减少患某种疾病的概率。比如抽烟吧,在医学的忠告下,虽然也听说某个大烟鬼一直活了103岁,我们还是让抽烟从一种无害的行为变成了一个会增加肺癌发病率的罪魁祸首。

一个事件发生的概率是怎样度量的呢?在17世纪有一场关于赌博的讨论,布莱士·帕斯卡和皮埃尔·德·费马都参加了这场讨论。通过这场讨论,“机会的数学”——概率诞生了。当时的概率思想是以事物的对称性为基础的。例如,一个硬币,它有正、反两个面,只要这个硬币造得匀称规则,你把它抛向空中,当它落地时,每一个面都应该有相等的机会朝上。这就是说它有50%的机会(或说有1/2的概率)是正面朝上。英国的彩票也是同样的道理。你从49个数字中抽出6个,根据不同的组合,你会面临1400万个可能的结果。假如每一个结果出现的机会相同,也就是说,当抽英国彩票的机器不会“偏心”任何一个数字时,你赢彩票的概率是一千四百万分之一。

在现实生活中,这个建立在事物的对称性上的方法并不十分理想,所以,我们转而用一种比例的方法。如果医生说,你有5%的概率患某种癌症,他的意思是,对一批与你状况相似的人群的研究显示,他们中有5%的人得了那种癌症。对下雨的预测往往来自模型的综和预测。天气对初始条件的变化,哪怕十分微小,也很敏感。既然我们无法准确测量到预测所需的地球上每一处的温度、压力和其他变量,气候专家只好利用模型来模拟天气。每次模拟的初始条件都会根据实际情况做一些微调。如果有1%的模拟显示今天有雨,他们就发出今天下雨的概率是1%的天气预报。

这个方法的背后是频率论:它认为一个事件(比如硬币落地后正面朝上)的概率应该被解释成,在经过大量(抛掷硬币的)试验后,某个事件发生的比率,或说某个事件发生的相对频率。频率论与另外一个概率理论——贝叶斯理论,一直争执不休。汤马斯·贝叶斯是18世纪英国数学家和英格兰长老会的牧师。他认为概率是一个主观变量,用来衡量人们在已有的观察基础上,对某件即将发生的事的判断。如果新的情况出现,我们就会更新我们的判断。

平均法则的真假

无论哪一种解释或衡量概率的方法,其背后都有一整套支持这种方法的数学理论。这些概率理论虽然大都直接明了,然而它并不总是和我们的直觉一致。我们都很熟悉平均法则,或称大数定律:如果不断地抛掷一个硬币,只要进行的次数足够多,而且正面朝上和反面朝上都有相同的机会出现,那么,你会期望在投掷过程中,正面朝上和反面朝上出现的比例基本是50%对50%。所以,当你看到一个硬币被抛掷了999次、而每次都是正面朝上时,你会倾向于觉得下一次抛掷的结果是反面朝上,由此来打破出现的不均等的现象。

但是,像千百万赌博赌输的人一样,你错了。下一次投币与前一次投币无关,所以,反面出现的机会依旧只是50%。以前每次是这样,以后每一次也将是这样。这是不是违反了大数定律了呢?不是的。大数定律只是说,当你把抛掷硬币的次数增加到接近无穷多次的时候,正面出现的比率将趋向50%。即使你已经抛掷出了许多次正面朝上的结果,你依然有抛掷无穷多次的机会来把平均结果下降到50%。至于大数定律的结果是否在下一次抛掷中开始显现,那谁也说不准。

许多例子都证明“机会”的概念是多么的含糊不清。关于它的书也有很多,有人写它是为了娱乐,有人则是因为严肃的哲学原因。我们能够确定的是,“机会”这个概念与“随机”这个概念,就像一对孪生姐妹一样,紧密相关。

其实“随机”很普遍

在没有抛掷硬币这样的随机行为协助前,人类并不擅长制造随机事件。如果我让你随机地在一张纸上写下一串数字,模拟抛掷硬币的结果,或者一组数字,或者是一系列由圆点儿构成的图形什么的,你的每一步,都会情不自禁地受到上一个抛币结果,或数字,或图形的影响。为什么呢?是因为我们总小心翼翼地要确保选择是在一种漂亮的分布下进行的。所以,通常我们很容易发现所写下的结果,或数字串,或图形并不是纯粹随机的。我们的大脑总是不自觉地选择服从一定的“规律”,因此,我们很难制造随机事件。一旦我们意识到某种规律的出现,我们就认为我们打破了随机性,会马上改变我们的下一个选择。

事实上,在一个完全随机的事件中,事件会以任何一种顺序出现,包括那些显得有规律的顺序。假设有一个硬币被你连续抛掷了10次,而且连续10次都是正面朝上,也就是说,出现了“正正正正正正正正正正”的情况,它实际上同出现“正反正反反反正正反反”“反反正正正反正反正正”或者“反反反反反反反反反正”等结果的概率是一样的。

在赌博业的刺激下,人们对随机事件的实验研究也有上千年历史了。尽管研究人员一会儿抛硬币,一会儿掷骰子,但是,从数学上对随机事件下一个准确的定义还是令人意想不到的艰难。第一个想对随机下一个正式的定义的人是法国数学家E.波莱尔,他创立了数学测度论。波莱尔除了是一位出色的数学家以外,还十分热衷于政治活动,他当过海军部长,并在二战中参加过反纳粹的抵抗运动。1909年,波莱尔沉迷于那些有着无限位小数的数字(包括不同记数法下的无限小数)。波莱尔认为,如果所有的数字,包括两位及两位以上的数字,出现在某个数的小数位的频率相等,它应该被称作一般数。也就是说,数字1,像其他的九个一位数字一样,应该在一般数的小数位里出现1/10次。(因为一共有10个由一位数字组成的数,每个数出现的频率相等,所以就得到了1/10。)同理,每一个由两位数字组成的数,比如11、23或者09,应该在一般数的小数位里出现1/100次,因为有100个由两位数字组成的数。由此可以推及任何由三位数字组成的数出现的频率是1/1000。当一串小数由n位数字组成时,它出现一般数的小数位的频率应该是1/10n次。一般数是不偏向任何数字组合的。同样,在一个无限小数的展开中,每一个有限的数字组合都应该出现。如果无限数字串中的每一个数字都是由投掷一颗10面的骰子产生的,那么,你会期待它们遵循这个一般原则。这个一般原则是使一个无限序列成为随机序列的条件:即,如果你想是随机的,你就必须是一般的。

波莱尔指出一般数不但是存在的,而且“大多数”的实数都是一般的。(他自己很清楚这个“大多数”指什么。)数学家们坚信所有大家喜欢的数学常数,像π、e和,都是一般的,只是到目前为止还没有一个常数被证明是一般的而已。波莱尔证明了几乎每一个实数都是一般的,但是这并不够。他给我们留下了一个重要但缺乏详细例证的结论。这个困局被一个名叫张伯诺的在1933年打破了。他给出的证明方法令人拍案叫绝。他把所有的自然数一个接一个地连成一串,作为小数点后面的数字:

0.1234567891011121314151617181920212223242526272829303132333435363738394041……

这就是张伯诺数。它既简单又充满智慧,不仅清晰地诠释了一般数的概念,同时还提供了第一个10进制下的一般数的例子。在这个例子里,每一个一位数、每一个两位数和每一个三位数,等等,所出现的频率都相等。每一个你可能想象得到的、有限的、数的序列都会在这个无限延续的张伯诺数的某一段出现。

等等,你说什么?每一个你可能想象得到的、有限的、数的序列都会在这个无限延续的张伯诺数的某一段出现?让我想一想。这是不是意味张伯诺数,或其他任何一个一般数(包括那个更加有名的π),能涵纳每一个我所能想到的、有限的、数的序列?如果我把我的名字翻译成数字,那么,一般数的小数位里也包括我的名字?!对!事实上,一般数涵纳了每一个人的名字,无论你是否活着;涵纳了每一个句子,无论是已经写出来的还是将要写出来的;涵纳了每一本书,无论是已经出版了的还是将要出版的;涵纳了历史和每一个可能发生的未来。

圈点机会

概率是数学与现实生活最常相遇的地方。现在我们把一些注意力转向它的哲学基础。概率理论为我们提供了一个计算“机会”的准则。例如,“所有可能发生的事件的概率总和是1”就是一个准则。这不难理解,在抛掷一枚硬币时,如果正面向上的概率是1/2,那么,反面朝上的概率就是1-1/2=1/2。概率理论还告诉我们怎样计算同时发生的事件的概率,例如,如果一个事件A发生的概率是p而事件B发生的概率是q,而且两个结果是相互独立的,那么,A和B同时发生的概率是p×q。在硬币的例子里,这意味着,当你同时抛掷两枚正常的硬币时,或者,把一枚正常的硬币抛掷两次,那么,得到两个都是正面的所谓正常概率是1/2×1/2=1/4。

问题在于,概率不像我们计算长度和重量那样容易。我们可以把情况抽象化,好比说,抛掷一枚硬币有两个可能发生的结果,这等于是说每个结果出现的概率都是1/2。或者,我们可以从频率的角度思考问题,观察硬币被抛掷1000次、正面出现的次数将近一半。但是,这些结果与下一次的抛掷有什么关系呢?它实际上说明了什么呢?如果我们无法回答这些问题,我们还应该相信概率理论吗?

20世纪的一个数学计算机游戏给这个概率理论提供了一个奇妙的证明。其中心思想是,概率不是一个客观存在,而是主观估计的程度:如果我说一枚被抛掷的硬币落地之后正面朝上的概率是1/2,那不是因为1/2这个数与硬币的正面有什么关联,而是因为,出于种种原因,我有50%的信心认为正面将会出现。所以,对概率的估计是因人而异的。但是,通过赌博,我们有可能把它量化出来。例如,我对正面朝上的估计程度可以用我愿意和别人为“下一次正面朝上”这个结果而下的赌注来衡量。

哲学家的忠告是,如果你认为一个人遵守最基本的理性原则,那么,他们的主观估计应该是遵循概率原则的。如果不遵循概率原则,他们在打赌的时候一定会输。举个例子,假设我对一个硬币落地后“正面朝上”的主观估

计是1/2、“反面朝上”的主观估计是1/4,那么,我就违反了第一个概率准则,即“所有可能出现的结果之概率总和为1”的原则。因为,根据我的估计,所有可能出现的结果(正面朝上和反面朝上)的概率相加是3/4。在这个时候,你可以这样跟我打赌:一半对一半赌“正面朝上”;3对1赌“反面朝上”——这样的赌注符合我的概率判断,所以,我会接受它。如果你在“正面朝上”上押20元、在“反面朝上”上押10元,当结果是“正面朝上”时,你拿走40元(其中你拿回赌注20元,赢20元);当结果是“反面朝上”时,你也拿走40元(其中拿回赌注10元,赢30元)。这样一来,只下了30元赌注的你会稳赚10元。而我呢?输定了。

哲学在一定程度上解释了概率的数学背景,同时把理性和概率结合了起来。反对意见自然是强调生活不是一场接一场的赌博。人们可以轻易地拒绝参与一场赌博,从而留住自己的钱。但是,争论的要点不是去模拟人在现实中的行为,而是告诉人们,为什么概率论是值得一听的。它就像天气预报一样,假如你没有伞,那么,你最好记住天气预报说下次什么时候下雨。预报可能不准,但是,预报所依据的统计数学是理性而可信的。预测,从其本质上说,不可能是完美的。在现实生活中,可能除了数字,没有什么事物是完美的了。

猜你喜欢
硬币概率频率
处理器频率天梯
概率与统计(1)
概率与统计(2)
让硬币飞
振动与频率
概率与统计解答题集锦
一类非线性离散动力系统的频率收敛性
硬币
硬币塔
概率与频率