杨程博
(吉林大学 数学学院,吉林 长春 130012)
在信息化和全球化不断加深的当今,事物的发展变化也愈加复杂,愈加难以预测。在这样的时代背景下,大学教育对于学生决策能力培养的必要性也愈发突出。由于所有决策都是基于概率判断[1],那么在只有少量信息的情况下,计算出最合理的概率并形成贝叶斯更新的能力,对相关领域人才的培养来说就是一项必不可少的教育。但当前的概率论教学大都基于概率的频率解释,因此,导致学生很难理解条件概率和贝叶斯定理的内涵[2],这对于后续诸如贝叶斯更新这一类知识的传授形成了巨大障碍。
以往对概率论教学的研究并没有对这一现状给予足够的重视。许多研究只关注概率的数学计算方面,很少提及如何看待概率及其内涵解释。在应用概率和获取概率所代表的信息时,我们首先必须了解概率的准确含义,才能更合理地把握所要解决的问题。因此,只强调概率的数学计算而不涉及对概率内涵进行解释的概率教学是不可取的,仅基于频率解释的概率论教学也是不全面、不透彻的。综上所述,在概率教学中强调对概率解释的区别以及进一步加深对概率内涵的准确理解和把握是十分重要的。本文将以概率解释的历史演进为理论视角,梳理概率解释的形成过程,为今后进一步打造融入概率解释的概率论课程设计夯实理论基础。
安德雷·柯尔莫哥洛夫(Andrey Kolmogorov)于1933年首次给出了概率公理化定义,该定义从数学层面来讲几乎不存在异议。然而,当被问及概率意味着什么时,却没有一个公认准确的答案。本文将这种关于概率的哲学观点及其意义称为概率解释。从骰子、彩票到测试的准确性,在各种情况下处理概率问题时,概率解释也存在明显区别。目前的概率解释主要有大类:频率解释(客观解释)和贝叶斯解释(主观解释)。
概率的频率解释是根据相对频率的极限来定义概率的。首先数学极限本身就是人们有限经验无法达到的界限,这就涉及了用无限的理想状态(数学极限),来解释有限经验(统计频率)的合理性问题[3]。此外,频率解释应用于现实时也存在缺陷,由于事件可能不具有重复性,或者在操作上很难定义“在相同条件下”和“随机”的含义,那么,就没有办法通过重复实验来求解此类事件的概率,这一点对于小概率事件尤其明显。因此,频率解释更多地被应用于物理学、生物学等学科,因为这些学科都更关注事实证据而不是人类思维。
概率的贝叶斯解释基于贝叶斯定理,它的发现者是托马斯·贝叶斯(Thomas Bayes)。贝叶斯定理的发现在当时并未受到关注,一直到贝叶斯过世后的1763年,相关著作《机会问题的解法》才被他的好友理查德·普莱斯(Richard Price)提交给英国皇家学会并发表[4]。贝叶斯定理认为概率是对个人头脑中固有信念的评估,而不是频率解释中隐含苛刻假设的现实世界特征。例如,在投注赛马时,即使所有投注者都拥有相同的马匹信息,但投注的结果却各式各样。这是因为根据个人经验和知识得出的马匹胜率是完全不同的。此时的概率是作为确定程度或推理手段给出的。如果胜率是从出现次数的相对频率来确定的话,那么不管是谁计算这个值都应该是一样的。但主观主义者认为在人脑中有两种信息:独立于经验数据的先验信息,以及来自重复实验的经验数据。这两种类型的信息都能影响贝叶斯定理中的可能性函数,进而更新相关事件的先验概率并给出新的概率。换句话说就是,用新的、客观的信息更新你对某事的最初想法会产生更高质量的见解。这就避免了频率解释应用于实际时所遇到的困难和问题。然而,贝叶斯解释也经常被批评为不科学,因为它没有为如何测量先验概率提供指导。每个人可以将任何概率分配给任何事件,所以概率的贝叶斯解释缺乏客观基础。但是,对于处理实际问题尤其是决策问题,却是一种强有力的工具,即使知识是受客观局限,也能够做出当前状况下最为合理的决策。因此,在不存在苛刻的“相同条件”的情况下,在没有多次试验证据的情况下,对于概率的贝叶斯解释是更为有效的。
概率起源于对骰子、彩票等事物的观测活动。远古时代的人类就已经开始使用动物骨骼等,来创造均匀的随机发生器,以产生稳定的频率进行某些特定活动,他们虽然在直觉上好像接受了某些事实,但却始终无法正确理解其原理。直至17世纪中叶,一位法国贵族德梅莱(Demere)向布莱斯·帕斯卡(Blaise Pascal)问了一个关于掷骰子的问题。随后帕斯卡又写信将这个问题向皮埃尔·德·费马(Pierre de Fermat)讨教,两人的通信讨论为后人津津乐道,也标志着现代概率论的开端[5]。由于其起源于客观随机观测,因此基于频率的概率解释,始终伴随着概率论的早期发展。频率解释的普遍传播始于福特(Ford)汽车工厂大规模生产技术的出现,因为在假设“无限人口”的情况下,事物的特征是可以用平均值来衡量的。在这样的社会背景下,频率解释的实用性就进一步增加了。1920年至1930年代,以罗德纳·费舍尔(Ronald Fisher)等为代表的频率论者强调,基于多次观察的频率是概率,其具有任意性的主观解释与标榜准确和客观的近代科学相矛盾。再加上贝叶斯定理计算的复杂性,最终,概率的贝叶斯解释受到了强烈的抑制和抵触,被人们敬而远之。
但是,在第二次世界大战期间,主观主义者成为英雄。由于战时的决策者必须在无法获得完整信息的情况下,以最佳方式快速做出生死决定,因此根本无法使用基于长期经验的频率解释,而每次获得情报之后都可以更新事件发生概率的贝叶斯解释却得到了大量的应用。在这个过程中,艾伦·图灵(Alan Turing)发挥了重要的积极作用,他通过基于主观概率解释的直观猜测并结合贝叶斯定理,破解了德军的加密通信系统Enigma。也正因如此,贝叶斯定理的相关应用也被当时的英国政府一度视为军事机密。进入1980年代,工业领域“大规模生产”的时代结束了,从有计划的大批量生产转向了“多品种、小批量”的个性化生产。时代背景的转换导致以往运用平均值进行管理的模式无以为继,概率的频率解释的应用范围也在逐步缩小。
直到今天,这两种历史上对立的概率解释的界限已经逐渐变得模糊。例如,在医学领域,在验证药物效果时使用概率的频率解释,而在医学检查中则使用概率的贝叶斯解释。在现今的学术领域中,不再试图根据单一的概率解释来解释所有现象了,而是根据实际问题的情况来采取不同的概率解释,这种解决问题的灵活性和互补性正是频率解释与贝叶斯解释对立与统一的体现。
总结概率解释的历史演进,可以发现对于概率的认识始于一个直观的想法,即如果抛出一个均匀的立方体,所有面都会以相同的可能性出现。这是对概率的主观解释,因为它是基于个人信念来认识概率。但这里的个人信念是直观的、粗糙的,因此,可以称早期的概率解释是一种直观的主观概率解释。然后,通过大量观测的实践,人们遇到了一些情况,意识到了未经多次试验的直觉想法是不可靠的,并开始运用频率来解释概率。在此之后,历史见证了主观概率解释的异军突起和蓬勃发展。而在今天,最常见的情况是看到两者之间的灵活运用与相互补充。由此可以得到,概率解释形成的过程经历了“直观的主观解释——频率解释——贝叶斯解释——两种解释对立统一”的演进路径。
现代概率论教材几乎都是按照经典知识体系进行编排的,注重和体现知识之间的内在逻辑。少有基于特定时代背景和具体数学问题的研究发展进程为脉络主线的著作。如此一来,这虽然保持了知识体系的完整性和严谨性,但却对于学生理解和把握各个知识与问题间的联系,无形地设置了较高门槛。对于数学问题发展和形成的历史痕迹的抹除,在一定程度上违反了知识积累循序渐进的基本规律。因此,教师在教学过程中,应在保证知识体系完整性的基础上,尽可能地加入并还原相关知识的历史发展过程,由此来降低新知识与旧知识之间的抽象性,同时也能锻炼和培养学生运用已有知识和技能,去解决和探索新问题的习惯和能力。
根据上述梳理出来的概率解释形成路径,以及当前教学方面所面临的不足之处,可以考虑以下几点教学改进。
第一,在概率教学所运用的数学工具方面,强化概率公理化定义的地位,打破两种概率解释的界限。当前大部分概率教学中涉及的概率是从费马、帕斯卡到伯努利再到拉普拉斯的概率论诞生时代的古典概率。虽然假设“等可能”的古典概率对于概率数学模型的初期发展是必要的,但是,在进入大数据时代的今天,越来越多的事件已经不再符合这种假设,概率的贝叶斯解释越来越适用且受到重视。由于柯尔莫哥洛夫在设定公理时并不需要给出概率本身的具体含义,因此,公理化概率对客观频率解释和主观贝叶斯解释都是开放的,是研究概率问题时更具一般性和广泛性的数学工具。
第二,要遵循人们理解概率的客观历史演进规律,合理组织教学内容,还原知识骨架上的历史血肉。条件概率和贝叶斯定理可以说是概率论中最重要的教学内容之一,为了更好地帮助学生去理解和掌握,应该首先帮助学生理解概率的贝叶斯解释。这是因为虽然某些情况下可以根据概率的频率解释来计算出条件概率,但却很难解释其结果的意义。事实上,许多研究报告也都表明,在概率的频率解释下进行条件概率和贝叶斯定理的教学,是很难让学生理解和接受的。同时需要注意的是,概率的贝叶斯解释虽然是个体独有的,但必须在其内部保持一致,符合一定的逻辑运算规律,不能是纯粹随机的。因此,需要强调和事件、积事件等事件运算以及概率的基本性质在贝叶斯解释中的重要性。
第三,人工智能的繁荣发展迫切要求学生具备相关的思维框架和知识储备,教学思路也应与时俱进。复杂的机会游戏的出现发展出了概率论;天文学家对精确预测天体轨迹的需求衍生出了误差理论,进一步建立了统计学的基础。而当今人工智能所面临的重重困难,也迫使人们正在逐步开启因果推断科学的大门。概率的贝叶斯解释对于理解“因果”的含义是十分必要的,关于原因的概率是指以时间上后出现的结果为条件的早期事件的概率,它无法应用概率的频率解释来进行描述和分析。在当前学生在校期间所参加的各类数学建模竞赛中,与人工智能决策相关的建模问题层出不穷,为了帮助学生顺利地理解问题和解决问题,就需要在教授概率论相关知识时,扩展介绍当前的前沿问题及其发展方向,从而将基础知识教学与社会问题实践相结合,让旧知识在学生头脑中萌发新芽。
此外,在概率论教学中,为了让学生切身体会到概率解释的形成和变化过程,应该在教学中设计相应场景的系列例题,让学生在遇到新问题时,自然产生对概率内涵的思想转变。当然这个过程也需要教师根据学生的不同学习阶段进行有意识的引导,最终使学生养成灵活运用不同的概率解释思维去解决问题的能力。以往的许多教学研究都集中在概率的数学计算能力方面,但是,大学教育的目的是使学生获得在复杂社会环境中运用所学知识和技能的能力。例如,在面对特定社会问题时,如何根据有限的信息做出合理的决策,以及如何评估和运用有关风险的概率信息等。从这个角度来讲,本文的研究以及提出的教学改进思路是不可或缺的。在今后的教学探索中,也将致力于形成一系列支撑该教学目标的教学资料。
当前的概率论教学大都很少提及如何看待概率及其内涵解释。本文将以概率解释的历史演进为理论视角,探究概率解释的形成和转变过程,提倡根据人们认识概率的客观历史演进规律进行概率教学的组织和安排,从而加深学生对概率内涵不同维度的理解,提升学生灵活解决问题的能力。