卢跃奇,王艳梅
(洛阳师范学院 河南 洛阳 471934)
概率统计课程已成为高校理工专业的一门重要数学基础课程,不仅为学生后续各门专业课程的学习提供必需的理论基础、方法原理,而且对培养学生的逻辑思维和推理能力起着巨大的推动作用。但在很多高校概率统计课程的具体实施过程中,大多主讲概率统计课程的教师只负责概率统计基本原理基本方法的理论推导、适合手工计算的简单习题的证明演算,不讨论大数据情况下的实际统计推断决策问题。而计算机语言和大数据课程大多只讲编程方法、大数据处理方法,却忽略或没有综合考虑背后的概率统计原理。这种脱节现象不适应《促进大数据发展行动纲要》鼓励高校跨学科跨专业培养综合型人才的目标,不利于培养具有多学科综合知识的跨界复合型人才[1-2]。
在近几年的教学实践中,在结合其他高校相近专业概率统计教学研究成果经验的基础上,根据洛阳师范学院应用统计学专业培养方案要求,结合具体实际情况、学生在大学生数学建模和市场调查分析等竞赛中的表现,根据学生对课程教学情况的反馈和要求、学生特点和能力水平,不断完善概率统计课程的教学实施方案,摸索出了“聚焦核心原理+问题驱动+翻转课堂+程序实现”这一教学模式,使得在以培养复合型创新人才为主要目标的新形势下,呼应了新理科坚持问题导向、开展跨学科跨专业研究的一流专业学科建设目标,同时也为其他理工科相关专业开展统计、大数据、机器学习等类似课程的教学提供了一些有益的探索和实践经验。
问题驱动式教学方法是根据现代建构主义教学理论建立的一种教学方法,主张在“提出问题―分析问题―解决问题―优化方案”的“已知―未知―新的已知”的不断循环递进过程中学习新知识、掌握新方法、理解新思想。在具体的教学实施过程中,表现为以学生为主体、以教师为主导,教师的作用主要是教学活动的设计者、组织者和引导者[3-4]。
概率统计课程知识纷繁多样,名词术语众多、原理定理方法多种多样,即使一时能够通过死记硬背、反复演练、短期理解,也无法长期记忆,更不要说专业学习结束后还能回忆起来,甚至再把概率统计思想原理方法应用于实践来解决实际问题。概率统计课程的这些特点为学生学习概率统计课程提出了极大的挑战。人们总是通过以概念为核心来观察、认识、把握客观世界,进而改变世间万物,甚至创造新事物。因此,掌握概率统计课程知识的关键,在于把握概率统计课程中最重要的若干核心概念、原理、方法,从而以有限的核心概念、原理、方法为中心,以概念思维导图为框架,以事实案例主题应用为依托,来观察、认识、理解、把握它们的内涵外延、结构功能、起因变化、动态联系、相关属性与不相关属性等维度。
在学生掌握概率统计基本原理、手工推导证明演算的过程中,如果能够通过编写程序解决大数据情况下的统计计算、原理演示和统计推断等实际问题,那么不仅可以实现概率统计课程的理论教学目标,而且还可以培养学生理论联系实际、根据概率统计原理结合计算机技术解决实际问题的实践应用能力,实现跨越知识的浅表性认知到深度学习、从内容态度到技能行动的应用统计学专业培养要求。因此,只要有可能,教师应尽量安排学生通过编写程序充分理解核心概念、原理和方法。
离散情形下有
课前学生的任务包括:预习条件概率的定义,条件概率的几何意义是什么?理解贝叶斯原理的基本含义,其中先验信息(先验分布)、总体信息(总体分布,似然率)、样本信息分别指代贝叶斯公式中的哪个部分,分别有什么价值和意义?利用网络和分发的学习资料,总结频率学派与贝叶斯学派在概率的概念定义上的不同之处,并能注意到无论频率学派还是贝叶斯学派对概率的基本计算规则是相同的;还能根据具体的抽样样本对已知先验分布进行后验分布估计或概率计算,把握其基本计算规则。以上内容是翻转课堂第一阶段的任务。
【例】根据机器生产的产品是否合格来估计机器是不是处于正常状态,如果不正常则停机检修。假设机器只有两种状态:正常和损坏,用表示,机器生产的产品也只有两种情况:合格和不合格,用表示。若已知概率即似然率,则根据预先指定的先验分布,利用生产出的产品是否合格(即样本信息)和贝叶斯原理可以估计机器当前状态即后验概率比如,假定似然率分别为
即:如果机器工作状态正常,则平均每生产100 个产品只有一个不合格;如果机器工作状态异常,则生产的产品中至少40%的产品会是不合格的。根据经验,假设该机器每生产100 件产品需要停机检修一次,即机器处于正常状态和异常状态的先验概率分别可能是0.99 和0.01,即若发现机器现在生产出了一件不合格产品,则机器需要检修(即处于异常状态)的概率是多少?
根据贝叶斯原理,有
为什么连续出现不合格产品就要对机器停机进行检修呢?这部分内容就可以放到翻转课堂师生面对面环节进行分析和总结,这是翻转课堂第二阶段的中心任务。实际上,如果连续出现了两个不合格产品,就要在第一个不合格产品对机器处于正常状态的概率进行修正的基础上再一次进行修正。具体操作是,只需把第一步计算出的后验概率作为第二步计算的先验概率,重新利用贝叶斯原理计算一次后验概率即可:
从中可以发现,当连续出现两个产品不合格时,机器处于异常状态的概率从最初的0.01 急剧上升至0.942,也就是机器极有可能处于异常状态而需要停机检修。
对贝叶斯原理的认识和检验是否到此结束呢?不,还要继续分析。如果连续更多次出现不合格产品时,机器处于异常状态的概率变化趋势是怎样的?这种变化趋势是不是跟我们最初假定的先验概率有关系?如果改变似然率,会不会影响这种变化趋势?如果连续检查生产出的产品是否合格服从某种分布,比如二项分布时,机器应如何根据生产出的产品是否合格进行及时检修?这个时候的停机检修策略应如何制订?这些问题的解决由于牵涉到比较大的计算量,手工计算已不可能,必须借助于编程语言辅助计算和分析。这一部分内容可以放到翻转课堂的第三阶段即课后实施,既可以作为作业锻炼学生的编程能力,又可以从中提高学生对贝叶斯原理的深度认识和把握。
贝叶斯原理中涉及的计算主要是乘法和加法,其中的概率又可以用向量表示,从而贝叶斯原理的计算可借助R语言编程简单直观地表示出来:
情形1:如果连续出现多个产品不合格(如4 个),代码如下,其运行结果显示机器处于异常状态的概率就会急剧上升。
情形2:如果生产的产品服从两点分布L~B(1,0.1),其中不合格产品的概率为0.1,则应如何制订机器检修策略?将情形1 中的数据修改为:
运行结果发现,从长期来看,机器的后验概率处于异常的概率趋于0。这是一种偶然还是必然?原因是什么?这种趋势会受到不合格产品率的影响吗?
在聚焦核心原理的问题驱动式教学模式下借助编程语言实现计算、证明和趋势分析,利用翻转课堂实施概率统计课程教学,不仅将促进理论知识的学习与创新实践相统一,而且可以促进学生的深度学习,提高自学能力,培养质疑精神,为学生的长期长远发展提供极大的鞭策和激励作用;不仅使得理论不再止步于推演和手工计算,还可以极大提高学生从数据实践的角度深度理解和把握基础理论及其应用价值的能力。