条件概率教学需要关注的两个问题

2023-02-28 03:01李杰民代超群
中国数学教育(高中版) 2023年12期
关键词:样本空间

李杰民 代超群

基金项目:岭南师范学院2021年度基础教育高质量发展研究院专项立项科研项目——数学学科大概念教学实施策略研究(GZL202109);

广东教育学会“十四五”教育科研课题——大概念统摄下的数学单元教学设计与实践研究(GDESH14007);

岭南师范学院高等教育教改项目——大学数学课程与高中数学新课程衔接研究——以概率统计课程为例(岭师教务[2022]154号厚理工类26).

作者简介:李杰民(1973— ),男,讲师,博士,主要从事数学教育研究;

代超群(1991— ),女,助教,主要从事数学与思政教育研究.

摘  要:条件概率教学要先理解概念的定义,厘清条件概率与无条件概率的关系,即条件概率是含参变量的集合函数,是概率的推广. 然后要了解概念的价值,知道引入条件概率的必要性和重要性,即對于复杂随机事件的概率计算,条件概率是不可或缺的工具,即使是作为概率研究基础的古典概型,涉及“二维”以上的样本空间,随机事件的概率计算也离不开条件概率.

关键词:随机事件的概率;条件概率;样本空间;古典概型;集合函数

一、引言

条件概率是概率统计课程中一个极其重要的概念,大量的后续概念与命题建立在该概念基础之上. 例如,全概率公式与贝叶斯公式、指数分布与几何分布的“无记忆性”、假设检验中的“两类错误”等. 《普通高中数学课程标准(2017年版2020年修订)》将条件概率作为选择性必修课程中概率内容的起始知识点,随着新教材在全国范围内的逐步推广,数学教育类期刊发表的关于条件概率教学方面的文章逐渐增多,这些文章关注较多的是条件概率的计算与教学设计,如文献[2]和文献[3]. 另外,文献中出现的一些错误也被发现和纠正. 例如,文献[4]指出,许多文献错误地将[BA]称为事件,将条件概率[PBA]错误地理解为使用无条件概率[P·]这把“尺子”去度量一个所谓的事件[BA].

事实上,条件概率看似简单,实则抽象,隐藏着许多有待揭示的“秘密”. 从目前高中数学教学实践和公开发表的教研论文来看,关于条件概率的教学尚有两个问题需要关注. 其一,条件概率的定义的理解. 如果没有正确理解条件概率的定义,对概念的理解出现偏差,既难以把握条件概率的思想,又不能正确区分条件概率和无条件概率的关系. 其二,学习条件概率的意义. 对于引入条件概率的必要性和重要性的思考较少,不利于从整体上把握概率知识,尤其不利于将选择性必修阶段的概率知识与必修阶段的概率知识联系起来. 以下针对上述两个问题展开探讨. c

二、条件概率的理解

1. 条件概率的定义方法

条件概率的定义方法不是中学数学中常见的“属加种差定义”,甚至不属于文献[5]所列出的六种下定义的方法,而是现代数学中较为常用但往往被基础教育阶段忽视的“构造式”定义. 为此,我们借助图1来阐述条件概率的定义方法.

[度量事件[BA] (错误路径)][概率 (测度)[P·]][条件概率

[P· A]][条件概率

[PBA]][度量事件B][弱抽象] [图1  条件概率概念的理解(集合函数视角)]

要对条件概率的定义有正确的认识,就要先了解概率的公理化定义. 正如文献[4]指出,现代概率论采用公理化方法来定义概率. 所谓概率,是一个集合函数[P·],自变量是事件(事件用集合表示),因变量是实数,并满足三条公理:① 非负性,对任意的事件[A],[PA≥ 0];② 规范性,[PΩ=1],这里[Ω]是样本空间或必然事件;③ 可列可加性,[Pk=1∞Ak=k=1∞PAk],这里的[Ak][k=1,2,… ]是两两互不相交的随机事件. 换言之,概率实质上是一种测度. 需要特别指出的是,概率采用公理化定义,满足该定义的集合函数并非唯一. 不难证明,条件概率也满足上述三条公理. 因此,条件概率也是概率. 准确地说,条件概率是一种概率测度.

通俗地说,概率测度是度量随机事件发生的可能性大小的“尺子”. 同一个随机事件发生的可能性大小可以用不同方法进行度量,原因在于选取的样本空间不同:无条件概率是在样本空间[Ω]范围内度量;条件概率是在“缩减样本空间”(即[Ω]的某个子集)内度量.

由图1可知,条件概率[PBA]是一个含参变量的集合函数[P· A]. 其中,[B]处于自变量的位置,[A]处于参变量的位置. [PBA]的值是用“新尺子”[P· A]去度量事件[B]得到的结果,而不是使用“旧尺子”[P·]去度量一个没有定义的所谓“事件”[BA]. 条件概率[PBA]中的[BA]被诸多研究者看作事件,正是因为其没有理解条件概率的定义,不了解图1所示的弱抽象过程,从而将条件概率[PBA]错误地理解为使用无条件概率[P·]这把“尺子”去度量一个并非事件的所谓事件“[BA]”. 用认知心理学的话来说,这是一次错误的概念同化. 而且,这种错误同化具有很强的隐蔽性,导致该错误普遍存在. 例如,有些文献中有如下的描述:理解概念从事件分析入手. 条件概率最容易混淆的是两个事件,即[AB]与[BA]. 要引导学生从不同的角度对它们进行深入剖析,充分理解事件[BA]中条件[A]的必然性和事件[B]的随机性. 因为学生在学习概率时,习惯了随机性事件. 他们往往会问:“老师,事件[A]怎么会是必然发生的呢?”“怎么知道它是必然发生的呢?”岂不知,“必然发生”是我们限定的条件.

上述论述不但将条件概率[PBA]中的[BA]看作事件,还错误地认为“事件[A]必然发生是我们限定的条件”. 事实上,事件[A]和事件[B]都是随机事件,不存在所谓的“事件[A]必然发生”一说,“事件[A]发生”只是一个逻辑上的假设前提而已. 因此,“充分理解事件[BA]中条件[A]的必然性和事件[B]的随机性”也是一种错误解读. 由于条件概率[PBA]是一个含参变量的集合函数,故可以这样解读:事件[A](参变量)的给定性和事件[B](自变量)的任意性. 换言之,“集合函数”视角是认识条件概率的重要切入点,可以有效减少“事件[A]的必然性和事件[B]的随机性”之类的模糊认识.

此外,有些研究者认为条件概率[PBA]中的事件[A]和事件[B]的发生存在先后之分,这是一种错误的直觉. 事实上,我们在计算[PBA]的时候,可以同时计算[PAB]的值. 如果事件[A]和事件[B]的发生有先后之分,将导致矛盾. 因此,该直觉是错误的.

2. 条件概率和概率的关系

首先,条件概率和概率都满足概率的公理化定义,两者同属于概率测度家族,这是共性. 不同之处在于,条件概率是一个含参变量的集合函数[P·A],将[BA]作为一个整体符号来看待没有意义,遮蔽了对于条件概率这把“新尺子”的认知.

其次,由[PBΩ][=PBΩPΩ][=PB]可知,无条件概率也可以表述成条件概率的形式. 如果说[P·]是一把尺子,那么[P·A]则是一簇尺子,[A]不同,对应的“尺子”不同.

关于条件概率和概率的关系,很容易出现误判. 根据已有经验,平行四边形是四边形的特殊情形,依此类推,条件概率似乎是概率的特殊情形. 但事实恰好相反,概率是条件概率的特殊情形. 从概率到条件概率,是从特殊到一般. 因此,理解条件概率的定义也是明晰条件概率与概率的关系的重要前提.

最后,关于两个概念出现的顺序,既不同于常见的“属概念→种概念”的演绎方式,也不是简单的“从特殊到一般”的归纳方式.“随机事件的概率”是概率论的基本概念,基于公理化定义,出现在前;“条件概率”是高阶概念,采用构造式定义,建立在概率概念基础之上,出现在后. 但概率论发展历史与此相反,公理化定义直到20世纪30年代才出现. 高中阶段没有介绍概率的公理化定义,两个概念间的逻辑关系需要教师自己把握,如果缺少对条件概率概念的深入思考,很容易出现理解上的偏差,甚至错误.

三、条件概率的价值

1. 对于复杂随机事件的概率计算,条件概率是不可或缺的工具

如上所述,条件概率是可以“变化”的“尺子”. 因此,条件概率的适用范围更广,用途自然更多. 特别是能建立起不同事件之间的联系,借助递推关系和事件的运算还可以建立起多个不同事件之间的联系. 在复杂随机现象的研究中,条件概率是不可或缺的工具.

对于条件概率的理论意义与工具价值,在后续的学习和建模应用中会有更深切的体会. 高中阶段只能初步感悟条件概率的重要价值. 事实上,人教新教材中已经出现概率论中的三个重要公式(乘法公式、全概率公式和贝叶斯公式),为计算复杂随机事件的概率提供了有力工具.

首先,由条件概率导出的乘法公式彻底解决了积事件的概率计算问题. 新教材介绍的乘法公式[PAB=]

[PAPBA]看上去很平凡,由条件概率的定义经过简单变形即可获得,但是从两个事件可以轻易地推广到多个事件的情形,得到[PA1A2…An=PA1PA2A1 ·]

[PA3A1A2 ·…· PAnA1A2…An-1]. 如此,乘法公式的价值得以凸显.

其次,依賴于条件概率的全概率公式是概率论中一个极其重要的公式. 利用一组两两互斥的事件获得一个样本空间的划分. 然后,将一个复杂事件表示为两两互斥事件的和事件,再由概率加法公式和乘法公式求这个复杂事件的概率. 全概率公式为计算复杂事件的概率提供了有力的工具.

最后,贝叶斯公式获得了广泛应用. 贝叶斯公式看似复杂,其实形式简单:第一步,使用条件概率的定义;第二步,分子使用乘法公式,分母使用全概率公式. 归根结底,从乘法公式到贝叶斯公式,都是依赖条件概率建立起来的.

人教A版《普通高中教科书·数学》(以下统称“人教A版新教材”)将“条件概率”安排在选择性必修第三册第七章“随机变量及其分布”的第一节“条件概率与全概率公式”之中,意在将条件概率用于处理更复杂的随机现象.

2. 即使是古典概型,涉及“二维”以上的样本空间,随机事件的概率计算也离不开条件概率

古典概型是概率论的基础. 在高中概率教学中,古典概型一直承担着导出新概念和定理的载体功能. 下面重温人教A版新教材必修第二册“10.1.3 古典概型”的例9,重新审视该例题的解法,感悟必修课程和选择性必修课程中概率内容的差异和联系,体会条件概率的价值.

题目  袋子中有5个大小质地完全相同的球,其中有2个红球、3个黄球,从中不放回地依次随机摸出2个球,求下列事件的概率.

(1)[A=]“第一次摸到红球”;

(2)[B=]“第二次摸到红球”;

(3)[AB=]“两次都摸到红球”.

教材解法:将两个红球编号为1,2,三个黄球编号为3,4,5. 第一次摸球时有5种等可能的结果,对应第一次摸球的每个可能结果,第二次摸球时都有4种等可能的结果. 将两次摸球的结果配对,组成20种等可能的结果,用表1表示.

表1

[第一次 第二次 1 2 3 4 5 1 — (1,2) (1,3) (1,4) (1,5) 2 (2,1) — (2,3) (2,4) (2,5) 3 (3,1) (3,2) — (3,4) (3,5) 4 (4,1) (4,2) (4,3) — (4,5) 5 (5,1) (5,2) (5,3) (5,4) — ]

(1)第一次摸到红球的可能结果有8种(表中第1行和第2行),即[A=1,2, 1,3, 1,4, 1,5,]

[2,1, 2,3, 2,4, 2,5],所以[PA=820=25].

(2)第二次摸到红球的可能结果也有8种(表中第1列和第2列),即[B=2,1, 3,1, 4,1, 5,1,]

[1,2, 3,2, 4,2, 5,2],所以[PB=][820=25].

(3)事件[AB]包含2个可能结果,即[AB=1,2,]

[2,1],所以[PAB=220=110].

该例题出现在“10.1.3 古典概型”这一节,上述解法借助样本空间和“古典概型”情形下事件的概率的定义来解决问题.

高中数学课程中的概率内容,按知识发生发展的逻辑顺序分为两章,分别是必修第二册的第十章和选择性必修第三册的第七章. 虽然分布在两本书上,但是概率内容自身是一个整体,教师应该思考不同阶段内容安排的意图,思考如何建立两者之间的联系,而不是前后脱节.

事实上,上述例题的解法需要教师认真思考,为什么要这样处理,还有没有其他解法?如果学生提出困惑,如何解惑?

例如,对于第(1)小题,第一次摸到红球的概率[PA],因为袋子中有5个大小质地完全相同的球,其中2个红球、3个黄球,显然[PA=25]. 为什么放弃简单的方法,反而采用貌似更烦琐的解法?

又如,一定要写出样本空间吗?以下对此问题进行分析,供一线教师参考. ① 在样本空间有限的前提下,初学者容易产生错觉,认为写出样本空间是一件容易的事情,写出样本空间后随机事件可以一一列出,从而认为写出随机事件也是一件容易的事情. 然而,在复杂随机现象的研究中,写出样本空间往往是一件很困难的事情. 困难在于:其一,难以写出甚至无法写出. 其二,即使较为简单的问题,容易写出样本空间,也需要考虑样本空间的创建原则. 一般而言,样本点或者说基本事件要尽量简单,不能再分解. 可见,教师应该理解“样本空间”的构建原则,不可随意构建;否则,将给教学带来困扰. 此外,教师要引导学生感受样本空间的动态性和复杂性,做好示范,引导初学者认认真真写好样本空间,为后续研究复杂概率问题奠定基础. ② 注意样本空间的维数. 同一个背景下的不同问题,一般采用相同维数的样本空间,前后一致. 如果使用不同维数的样本空间,往往会导致混乱和错误. 虽然上述例题的第(1)小题可以轻易得到[PA=25],但事实上使用了“一维”样本空间;而第(2)小题则需要“二维”样本空间. 因此,教材采用相同的样本空间,一次性解决同一个问题的3个小题,教师对此需要有清晰的认知. ③ 写好样本空间是概率初学者的必经之路,有利于学生对问题产生直观的感受和清晰的认识,但写出样本空间并非唯一的方法,很多复杂的随机现象难以写出样本空间,即使是较为简单的古典概型,也并非每次都要写出样本空间. 如果将上述例题改为50个球,其中20个红球、30个黄球,列表法就遇到阻碍;如果改为500个球,其中200个红球、300個黄球,即使有耐心列表,也需要考虑时间成本,迫使我们思考其他解法.

事实上,如果将上述例题改写为[m+n]个球,其中[m]个红球、[n]个黄球,则:第(1)小题可得[PA=mm+n];第(2)小题借助条件概率和全概率公式,可得[PB=]

[PAPBA + PAPBA = mm+n · m-1m+n-1+nm+n ·][mm+n-1=mm+n];第(3)小题借助条件概率和乘法公式,可得[PAB=PAPBA=mm+n · m-1m+n-1].

不难看出,上述例题是此一般情形下[m=2,n=3]的特例.

由以上分析可知,即使是古典概型,如果涉及“二维”以上的样本空间,随机事件的概率计算也离不开条件概率.

四、结语

条件概率是概率论的重要概念,也是计算概率的有力工具. 从高中一线教师发表的教学论文与教学案例来看,当前条件概率教学中存在较多问题:一是对概念的理解存在偏差,甚至出现科学性错误;二是忽视对概念内涵与思想的揭示,混淆定义与公式的差异,对概念教学的重要性重视程度不足. 条件概率教学,只有先理解概念的定义,才能深刻认识其重要特征,厘清条件概率与无条件概率的异同. 同时,要理解条件概率的价值,意识到引入条件概率的必要性和重要性.

参考文献:

[1]中华人民共和国教育部. 普通高中数学课程标准(2017年版2020年修订)[M]. 北京:人民教育出版社,2020.

[2]徐道奎. 由条件概率看概念教学在学生素养培养中的重要作用[J]. 数学通报,2018,57(6):34-38,43.

[3]李凯,郑玲. 对一个条件概率问题的再辨析以及思考[J]. 中学数学研究(华南师范大学版),2019(5):33-35.

[4]李杰民,廖运章. 条件概率的本质及其教学建议[J]. 数学教育学报,2021,30(1):54-60.

[5]曹才翰,章建跃. 中学数学教学概论(第3版)[M]. 北京:北京师范大学出版社,2012.

[6]李杰民,廖运章. 人教A版高中数学新旧教材“概率”的比较研究[J]. 中学数学杂志,2021(1):12-15.

[7]李杰民,廖运章. 高观点下一个中学概率问题的分析与启示[J]. 数学通报,2020,59(5):41-45.

猜你喜欢
样本空间
高中数学新教材一个探究试验的商榷
概率统计中样本空间刍议
人教A版高中数学新旧教材“概率”的比较研究
全概率公式在实际中的应用
古典概率计算中常见的错误分析
全概率公式在高中数学中的教学研究
全概率公式的推广与应用
学生概率认知中的典型错误:潜在原因及教学对策
浅谈高校古典概率的教学
古典概型中一道易错题的思考