葛 旸,李 纯
(天津职业技术师范大学理学院,天津 300222)
《概率论与数理统计》是高等学校一门重要的数学基础课,不仅数学学院,大部分文、理、工科院系都开设这门课程。作为本科阶段的大学生,学好概率统计有一定难度,因为它具有一般数学课程的抽象性和逻辑性;与此同时,学好概率统计又具有深远意义,因为不论是在物理学、天文学、生物信息学、机械智能化、系统可靠性分析、产品质量检测、物流运输安全等科学工程领域,还是在心理学、金融经济学、广告传媒、司法等人文社科领域,都有非常广泛的应用,并且相当一部分的应用还参与到这些领域最前沿的研究当中。早在19世纪,法国著名数学家拉普拉斯曾说[1]:“对于生活中的大部分,最重要的问题实际上只是概率问题。几乎所有知识都是不确定的,只有一小部分能够被确定地了解。甚至数学科学本身,归纳法、类推法和发现真理的首要手段都是建立在概率论的基础之上。因此,整个人类知识系统是与这一理论相联系的。”而今,计算机以及网络技术的问世和迅速发展使海量数据的搜集、存储与计算成为了可以实现的工作,在大数据的时代里,对概率统计基本知识和方法的掌握已成为每个人综合素养中必不可少的一部分,它直接关系到人们的生活质量和职场竞争力。
由于概率统计的主要研究对象是随机现象,而随机现象都是来自于生活,因此正如拉普拉斯所言,概率统计是源于生活的科学。概率统计课程中大部分概念和方法,都可以找到大量与之相关的生活实例,这决定了概率统计的教学组织具有很大的弹性和灵活性[2]。国内的传统教学多遵循概念、与概念有关的性质和定理、课堂例题、课后作业等教学模式,实例多在课堂例题和课后作业的部分出现,且实例的主要目的是对知识的巩固和掌握程度的考查。但实例更加重要的作用是丰富概念的涵义和背景,使抽象的理论形象化。在深化教学改革的进程中,如何更好地应用实例教学,使其充分发挥应有价值,提高教学的水平和质量,是一项具有重要意义的研究课题。笔者以近年教学实践的经验为基础,结合具体案例,总结出四类在教学活动中创新应用典型例题的方法。所引用例题都是概率统计课程中的常见例题,但它们不同于以往的运用方式具有一定的启发性。
有些形式抽象,但却有丰富实际背景的概念和定理,可以安排一道例题在引入理论之前讲授,在解题过程中启发学生主动总结出新的概念和方法。法国著名数学家和物理学家泊松的工作特色就是应用数学方法研究各类物理问题,并由此发现新的数学理论。在理论之前讲授实例,能够避免学生对陌生的抽象理论望而却步,使他们在思考例题的过程中潜移默化地习得理论;当学生发现以现有的理论认知难以解决新的问题时,也能激发他们学习新理论和新方法的求知欲望。此外,在日后的理论研究或社会实践中,需要学生独立分析问题,并探索开发出全新的方法来解决问题。传统教学先理论后例题模式会抑制学生的主动性和创造性,导致学生习惯于使用别人提供的现成思路来解决问题,而在面对新问题时束手无策。相反,先例题后理论的教学模式能培养学生的研发能力,因为这和从事研发工作的思维过程更趋一致。以全概率公式的教学为例说明如下。
例1某电子设备制造厂所用的元件是由三家元件制造厂提供的。根据以往的记录有以下数据,如表1所示。
表1 产品数据统计表
在以往教学中,这一例题设置在全概率公式的理论后。学生往往迷惑于为什么要对空间进行划分,又为什么要设计这么复杂的公式。此时对理论的接受过程是被动的。然而,如果将例题放到理论之前来讲授,在思考题目的过程中学生会很自然地发现必须对所取元件的来源进行分析,然后不重复且不遗漏地对各种可能的情况做出归总,进而理解求一个复杂事件的发生概率,实质上是众因归果的过程。此时再提出全概率公式,并指出从本质上看,其所描述的方法和学生中学阶段已经接触的数学思想——分类讨论是一致的。实践表明,多数学生无须记忆公式的形式,也能很准确地掌握方法。
同样的例题运用方式在条件概率、独立性、连续型随机变量的概率密度、求随机变量的函数分布等抽象定义和方法上,也明显改善了教学效果。
在实际教学过程中,例题可以处理得灵活一些,如可在题目内容的宽度和深度上加以拓展。其优势为:第一,赋予课堂更强的生命力。当学生发现教师讲授的素材与课本并不全然相同,且比课本更具有趣味性时,他们的注意力会更多地集中到教师的课堂讲授上,更积极地参与到教与学的互动中;第二,经过重新设计的例题将更有针对性地服务于课程的教学目标,从而促使理论与实例融合成为相互联结的有机整体,而不是彼此孤立的两部分。以数学期望的概念提出为例。
例2一射手进行打靶练习,规定射入区域e2得2分;射入区域e1得1分;脱靶,即射入区域e0得0分。射手每次射击的得分X是一个随机变量,设X的分布律为:
设该射手现在射击N次,其中得0,1,2分各有a0,a1,a2次,a0+a1+a2=N。
图1 例题图示
在教材中,该例叙述至此紧接着计算射手的平均得分,再依据大量独立重复试验中,频率趋于概率,得到数学期望的定义,即在实际讲授中完全照搬这一模式,学生难免会感到突兀,认为这一实例就是为引出新的定义而设置的。如果转换成另一种方式,在介绍完题目背景后提问学生:应该如何衡量该射手的竞技水平?还可以进一步把问题具体化,让学生对比甲乙两名射手射击得分情况,得分X、Y的分布律分别如表2和表3所示。
表2 X的分布律
表3 Y的分布律
从射中靶心概率来评判的学生会认为甲的水平高,而从脱靶率来评判的学生会认为乙的水平高,最终发现仅从分布律表面观察很难得到一致结论。此时,教师可以启发学生,相比了解随机变量X、Y的具体分布,更需要一个统一的指标来反映射手的水平,且该指标应刻画射手每次击靶的平均得分。
又如下面条件概率算例的拓展过程。
例3一盒子装有4只产品,其中3只一等品,1只二等品。从中取产品2次,每次任取1只,作不放回抽样。设事件A为“第一次取到的是一等品”,事件B为“第二次取到的是一等品”,试求条件概率P(B|A)。[3]
按照传统教学模式,单纯把上述例题作为计算条件概率的一道练习题,无法激发学生的兴趣,但如果在该题后面增加一问,该例题将焕然一新:若不知道第一次抽样的结果,第二次抽得一等品的概率是多少?
这是一个开放性的问题,只要变换一下视角,实质上等同于只做一次抽样预测抽得一等品的概率。该问题的引申旨在培养学生先把题目内容分析透彻,而后再优选方法进行计算的好习惯。同时,如果有学生采用第一次抽样结果分类归总的方法来求解,也可为后面全概率公式的学习做铺垫。在教学中系统性固然重要,但过于强调系统性会抑制学生学习的自发性,而自发性才是一切优秀发明创造真正的源动力。这也是在教学中设计开放性问题的意义所在。
从事概率统计领域科研和实践工作的教师都深刻认识到,工作的核心和难点往往并不在于数学上的推演,而在于模型的建立以及对数据所包含信息的分析。在传统教学中,例题仅被作为一种机械性的训练工具,只要学生能够使用当前章节的知识点把结果计算出来,题目的讲授就已完成。然而,从培养具备科学研究和社会实践能力的应用型人才这一角度看,这样的训练是不完整的。美国著名数学家哈尔默斯说过,问题是数学的心脏。创新往往是从提出问题开始,而问题又是来自已有认知基础与新信息之间产生的认知冲突[4]。因此,在教学中应多启发学生从例题计算结果中发现问题和归纳问题,使课堂真正成为充满互动氛围与探索精神的学术殿堂。通过如下三个教学案例进行说明。
例4[3]根据以往的临床记录,某种诊断癌症的试验具有如下的效果:若以A表示事件“试验反应为阳性”,以C表示事件“被诊断者患有癌症”,则有P(A|C)=0.95现在对自然人群进行普查,设被试验者患有癌症的概率 P(C)=0.005,试求 P(A|C)。
以上是贝叶斯公式在临床医学诊断中的一道应用案例。经计算
题目的讲授不应以计算出结果而结束,因为题目中的数据还有丰富的潜在挖掘价值。首先可以启发学生,P(A|C)=0.95说明在被试验者患癌的情况下结果呈阳性的概率为 95%,说明在被试验者未患癌的情况下结果呈阴性的概率也为95%,说明这是一个不论哪种情况下误诊率都仅有5%的试验。然而,检出阳性实际却未患病的概率却有1-0.087=0.913,这当中是否存在矛盾?其实对以上公式稍加细致观察就会发现,虽然患癌的情况下检出阳性的概率远高于未患癌的情况,但是在人群总体中患癌的只有0.5%的比例,因此患癌且检验呈阳性的概率仍远低于未患癌且检验呈阳性的概率,导致了很高的假阳性率。这也说明作为发病率较低的疾病,患病和未患病两种情形下的误诊率不能等同看待,若要进一步提高测试精度,必须降低健康人群的被误诊率。之后还可以引导学生继续思考,检出阳性,但实际还有很大几率并未患病,那么若检出阳性,该结果还是否值得重视?这个数值单独来看并不大,但如果和P(C)=0.5%相比,就很显著了。这说明如果一个经该试验检查呈阳性的人,他的患癌几率比没有做任何检查的人要高17.4倍(8.7%÷0.5%)。经过以上数据分析,学生可以很快认识到先验概率和后验概率的区别:P(C)=0.5%是基于以往数据分析,通过一般性经验得到的概率,即先验概率;而P(A|C)=8.7%是结合当前试验信息,在先验概率基础上经过修正得到的概率,即后验概率。甚至无需强调上述关于概念的文字描述,也能由该例题的分析深入地刻画出概念的本质。
例5[3]按规定某种型号电子元件的使用寿命超过1 500 h的为一级品。已知某一大批产品的一级品率为0.2,现在从中随机地抽查20只。问20只元件中有k只(k=1,2,…,20)为一级品的概率是多少?
此题原本是一道针对二项分布的分布律进行具体说明的应用题。以随机变量X记20只元件中一级品的只数,由于元件总数N很大,抽查元件数量相对很小,可用二项分布 b(20,0.2)近似超几何分布 h(20,N,N/5),即近似有 X~b(20,0.2)。
从而得到所求概率为:
计算结果如表4所示(仅列出概率值不小于0.01的部分)。
表4 计算结果列表
用柱形图表示上述分布,如图2所示。
图2 计算结果分布图
由表4和图2知,X的分布以4为中心两侧呈单调递减,且虽然左侧分布比例偏高,但整体分布呈现为钟形。
进一步深入挖掘,可得到更多有价值的结果。在频率一节中,学生已了解到当试验次数足够大时频率会趋于概率,此时试验结果将反映出事物的本质规律。于是启发学生将n取得更大(n=50,100),并观察此情形下的二项分布,如图3和图4所示。
图3 B(50,0.2)二项分布
图4 B(100,0.2)二项分布
由图3和图4可知,n=50时,二项分布B(50,0.2)的中心位置即取值概率最大的位置是10;n=100时,二项分布B(100,0.2)的中心位置是20。而且随n增大,中心两侧分布更加对称,且整体分布轮廓更加明显呈钟形。此时,先启发学生认识这个中心位置的含义,它们都恰好等于 n·p(20*0.2=4,50*0.2=10,100*0.2=20)。进一步直观分析 n·p 的含义:p 表示平均一次抽样取得p个正品,那么n·p表示经过n次抽样平均得到的正品数目。实际上,n·p就是二项分布B(n,p)的数学期望。再来认识随 n增大二项分布轮廓渐近呈对称钟形的现象,指出实质是中心极限定理在起作用,因为二项分布B(n,p)可以分解为n个独立同分布的两点分布之和,而任一确定分布的随机变量,其独立和都将渐近服从于这样的钟形分布,它还有一个专门的名称——正态分布。通过深入挖掘数据,一道简单的例题引申出后面章节中正态分布、数学期望和中心极限定理3个很重要的知识点。在学生接触这些抽象概念之前,借由例题为概念的提出多次预先铺垫,能够在潜移默化中有效降低学生接受新概念的难度,还有助于学生在学习过程中建立更加完整和立体的知识结构。同样的教学手段也适用于大数定律、似然估计、假设检验以及研究生课程《高等概率论》中的大偏差定理[5]等以往教学中学生较难理解、掌握,但其规律和思想广泛渗透于大量实例数据中的概念、方法和结论。
对题目背景再创造是最具挖掘空间的一类创新。建构主义认为,学生的学习是在一定情境中发生的,不能脱离实际生活,在头脑中抽象出虚无的、孤立的事实和理论。教师应充分利用学习者已有知识经验,把它们作为新知识的生长点[6]。时代瞬息万变,然而教科书中的例题却很难做到同步更新。在教学中选择源于当下社会生活的,学生更熟悉、更关心的素材重建题目,使学生认识到落伍的只是教科书中例题的题材而并不是科学本身,这是现代教学设计的必然趋势。
例6[3]甲进行射击,设每次击中的命中率为0.2。现独立射击20次,求甲仍未击中目标的概率。
此题是随机事件独立性的一个应用案例。但诸如射击、抽球等题目背景在教材中出现频率很高,并且脱离实际生活,更像是一种纯粹的数学游戏。对于那些尚未对数学本身产生浓厚兴趣的学生而言,这样的题目叙述难免显得乏味。然而,如果保留题目骨架的数学模型,为其更换一个时下在社会中受关注程度更高的题材作为背景,效果是令人耳目一新的。重新设计的例题如下。
例7甲从事小额网络诈骗,首次行骗后被查获的概率是0.2。若未被拘捕则他将继续行骗,且下一次行骗后被查获的概率仍为0.2。求经过20次行骗后甲仍然逍遥法外的概率。
以Ai(i=1,2,…,20)表示事件“甲第i次行骗被查获”,则所求事件可表示为经计算,
同样的知识点,同样的推导过程,但更换背景后的题目显然有着更加丰富的内涵和现实意义:虽然网络诈骗一次被查获的概率很小,但是不断重复犯罪行为,必然难逃法网。这说明大量重复试验中小概率事件的发生有其必然性,也解释了为什么被查获的不法分子大都是惯犯。还可引申至宿舍安全、行车安全等问题,说明防微杜渐的重要性,因为单一一次风险率很低的犯规行为,在长年累月的不断犯规中终将导致严重的损失和祸患。通过分析和解释生活中的现象,将新引入的抽象理论与日常熟悉的经验认知结合讨论,使学生认识到从随机现象中发掘隐含规律的思辨能力是每个人都应具备的,学习概率统计是运用数学手段来描述这一分析的过程,从而使得到的结果更加严谨和有说服力。巧妙运用生活化的题材能够帮助学生克服学习概率统计过程中的畏难心理,促使学生主动和自发地去接受和理解知识,从而极大地提高教学效率和教学质量。
本文对近年来在概率统计课程教学中关于例题创新应用所做的探索进行了总结。教学是一门艺术,它拥有无限的可能性。教师必须在科研工作和日常生活中不断自我充实,才能在教学中充分解放思想,更好地应用各种创新教学方法和手段,将课程设计得更加生动、鲜活、有意义,更好地促进教学工作,使学生充分理解、吸收并掌握新知识。
参考文献:
[1]LAPLACE P S.关于概率的哲学随笔[M].钱敏平,龚光鲁,译.北京:高等教育出版社,2013.
[2]鲍建生,周超.数学学习的心理基础与过程[M].上海:上海教育出版社,2009.
[3]盛骤,谢式千,潘承毅.概率论与数理统计[M].4版.北京:高等教育出版社,2008.
[4]曹才翰,章建跃.数学教育心理学[M].2版.北京:北京师范大学出版社,2006.
[5]陈琦,刘儒德.当代教育心理学[M].2版.北京:北京师范大学出版社,2007.