李源 郝小枝
摘要:分析了在随机变量的数字特征的定义教学中存在的常见问题,就数学期望和相关系数的定义教学提出建议;探讨了在随机变量的独立性和不相关性常常发生混淆的主要原因,并给出对应的教学策略.
关键词:数学期望;协方差;相关系数;相互独立;不相关
中图分类号:O13;G642 文献标识码:A 文章编号:1673-260X(2019)02-0149-04
概率统计是理工类和经管类本科专业的一门重要的学科基础课程,其中涉及的解决随机问题的基本思想方法被广泛应用于经济决策、质量控制、投资风险管理等领域.根据教育部高等学校大学数学课程教学指导委员会发布的大学数学课程教学基本要求[1],在本科概率统计课程中应使学生掌握课程的基本知识、基本理论,对学生进行必要的基本运算技能的训练,为学生学习相关后继课程奠定必要的随机量方面的数学基础,培养学生综合运用所学知识分析和解决问题的能力.但在本科概率统计课程的教学中还存在不少认识上的误区,以下结合笔者的教学实践谈几点体会.
1 概率统计课程的基础和课程目标分析
1.1 初等数学中的概率统计内容分析
概率统计是高中数学教学内容的重要组成部分,从高考数学大纲给出的教学内容和考试要求,并结合近年高考数学的试题可以看出中学数学的概率统计课程的下列教学侧重点:
(1)用排列组合工具计算有限等可能实验中随机事件的概率.
(2)理解并会应用特殊条件下的概率加法公式和乘法公式计算随机事件的概率,其中的特殊是指:仅考虑互斥情形的加法公式和相互独立的乘法公式.
(3)理解并掌握n次独立重复试验中事件恰好发生k次的概率计算.
(4)理解离散型随机变量分布列的意义,会基于古典概率的计算方法求出某些简单离散型随机变量(有限取值)的分布列.
(5)理解随机变量的期望值和方差的意义,会计算有限取值的离散型随机变量的数学期望和方差.
仅从教学内容上看高中概率统计课程,其基本方法是初等的,难点主要在于古典概率中排列组合等计数方法的应用,但这并非概率统计课程真正关注的问题.
1.2 本科概率统计课程的内容和研究工具
在前述的大学数学课程的本科教学基本要求中,对公共概率统计课程的概率论部分提出的基本要求包括(但不限于):
(1)了解概率的公理化定义,掌握概率的性质.
(2)了解随机变量分布函数的概念和性质,会利用分布函数计算随机事件的概率.
(3)理解离散型随机变量及其分布律的概念和性质,理解连续型随机变量及其概率密度的概念和性质,理解常见的离散型分布(包括0-1分布、二项分布、泊松分布)和连续型分布(包括均匀分布、指数分布、正态分布).
(4)了解多维随机变量联合分布函数的概念和性质,了解二维离散型随机变量的联合分布律的概念和性质,理解二维连续型随机变量的联合概率密度的概念和性质,会计算多维随机变量的边缘分布,理解随机变量的独立性;
(5)理解随机变量的数字特征(包括数学期望、方差、协方差、相关系数、矩)的概念和性质,会计算上述常见分布的数字特征.
(6)了解大数定律与概率的统計定义及参数估计之间的关系,了解中心极限定理的意义及其在实际问题中的应用.
从上述教学基本要求可以看到,在大学本科的概率统计课程的主旨是:借助于高等数学工具研究随机现象,其核心方法包括:利用函数方法将随机事件的概率计算用分布函数统一解决,利用无穷级数理论将离散型随机变量的研究推广到取值为无穷可列的情形,利用积分理论研究连续型随机变量,利用极限理论研究随机变量序列的依概率收敛等问题.
虽然概率统计课程中的部分知识学生在中学有所接触,但本科课程在这些问题上所要求的深度和广度是中学课程无法比拟的.因此,将中学概率统计课程中作为特例出现的基本概念和性质推广到更一般情形就成为本科概率统计课程教学的一项基本任务,其中应在课程中重点强调微积分工具和方法的应用.当然,作为随机数学基础的本科概率统计的课程目标,不仅应当提升学生对课程基本概念和方法的认识,还应在课程中对学生进行必要的基本运算技能的训练,为学生学习诸如随机过程等随机数学的进阶内容提供必要的基础支撑.
2 数学期望定义教学中的缺憾和建议
数学定义是展开对该数学对象讨论的前提和出发点,因此教学中对数学定义的内涵和外延的解读是极为重要的.然而,在当前的概率统计课程的教学中,或因为受限于课程学时,或因为备课不充分,授课教师对数学期望定义的解读常常是不够的,现详述如下.
在中学的概率统计课程中,学生已经会计算取值有限的离散型随机变量的数学期望,但在更一般的情形下,离散型随机变量的数学期望是用如下方式给出的.
与中学在有限取值情形下将离散型随机变量的数学期望定义为随机变量的取值与其对应的概率乘积之和不同,上述定义中增加了级数绝对收敛的前提.在随机变量取值可列的情形下,要保证其数学期望的存在性,学生容易想到级数xkpk收敛的前提,但为什么对其收敛性要求提高到更高水平的绝对收敛?颇为遗憾的是在诸如教材[2]这样被广泛使用的经典教材中,对此问题也未进行任何解释和说明,如果教学中不进行必要的引导,就会为学生正确理解和把握数学期望定义造成障碍,由此引发对其他数字特征理解上的偏差.
在笔者看来,数学期望的教学是数字特征教学中最为重要的部分,因为本质上随机变量的其他数字特征不过就是特定函数随机变量的数学期望.因此,在数学期望定义的教学中,以下教学环节是不可或缺的:
首先,应当对级数绝对收敛前提做必要的解读.事实上,数学期望的概率论意义在于刻画随机变量取值的集中位置,其值自然不应受到随机变量取值排序的主观性影响.由于条件收敛级数在更序后可能改变和[3],甚至改变其敛散性[4],而绝对收敛级数则可保证对级数任意重排时其和不变,因此在离散型随机变量的数学期望定义中必须设定级数xkpk绝对收敛这一前提.类似可以解释在连续型随机变量的数学期望定义中对积分xf(x)dx做出绝对收敛要求的意义.
其次,应分别就离散型变量和连续型变量给出数学期望不存在的实例,以提高学生对数学期望存在前提的认识.例如:对分布律为发散,因此其数学期望不存在.
有了这样的教学环节,学生自然就能理解不论对于离散型变量还是连续型变量其数学期望均未必存在.从而在极限定理的教学中,学生也就容易理解定理条件中强调随机变量序列数学期望存在性的意义.
3 协方差和相关系数定义教学中的常见问题
协方差和相关系数均为刻画随机变量X,Y之间线性相依关系强弱的数字特征.教材[2]中利用两随机变量和的方差公式
并依据X,Y相互独立时,有E[(X-E(X))(Y-E(Y))]=0的这一事实,据此指出:当(X-EX)(Y-EY)≠0时,X,Y之间必定不独立而是存在一定联系,从而给出下述定义.
上述引入协方差的教学设计,内容衔接自然流畅值得肯定.但教材中随即直接给出相关系数定义的处理方式却颇让人费解.为什么有协方差还要引入相关系数,二者有何区别?这些问题在该教材中均未提及!由于教材[2]是国内应用最广的概率统计教材之一,这种做法可能被初登讲台的青年教师直接采用,从而为学生正确理解协方差和相关系数形成障碍.
笔者认为,在引入协方差后,一种较自然的处理应该是讨论协方差的相应性质.在性质的讨论中揭示:协方差是有量纲的量,其值受X,Y自身的量纲影响.为克服这一缺陷,考虑先对X,Y进行标准化,即令由于标准化过程消除了X,Y自身的量纲,对标准化变量X*,Y*定义协方差就克服了其值受量纲影响的缺陷,因此可以用Cov(X*,Y*)这个无量纲量的数值大小来刻画X,Y之间的关系,由此引出相关系数的下述定义:
4 不相关性和独立性教学中的常见问题
随机变量的独立性和不相关性是概率统计教学中极易引起学生混淆的两个概念.随机变量相互独立表明二者之间没有关系,其特征是联合分布等于边缘分布的乘积.而随机变量的不相关是指二者不存在线性关系,其特征是相关系数(或协方差)为零.
二者的关系,无论从直观概念还是数学定义本身都容易做出区分,即相互独立必然不相关,但不相关未必相互独立.而造成学生引起混淆的主要原因,常常在于下述教学环节处理的失当.
4.1 在给出随机变量不相关的定义时,未及时给出不相关但并非相互独立的实例.筆者认为,在给出容易引发混淆的新概念时,与原有概念的对比是极其重要的.因此,在给出相关系数的定义时,应当用最简单的实例明确不相关和相互独立的区别.
4.2 二维正态分布的独立性与不相关性等价的原因未做深入解读.二维正态分布是一种常见的连续型分布,其独立性和不相关性的关系是极其特殊的,即由于二维正态分布的联合概率密度形式较复杂,以此作为基础计算边缘密度和数字特征对积分的能力有一定要求,因此很多教师对此重要命题的教学往往采取述而不证的方式,这就为学生的理解这一结论形成了不小的障碍.
笔者认为,正态随机变量在概率统计中有着举足轻重的作用,在学时充分的条件下,应当考虑对其性质进行严格的刻画,这也是课程中培养学生必要的基本运算技能的良好素材.即使受限于学时,也必须明确:
4.3 对公式E(XY)=E(X)·E(Y)成立的条件未进行适时的正确解读.作为数学期望的一条重要性质,该公式通常在数学期望的性质中首次亮相,此时其结论被表述为[2]:
利用相互独立确保的联合分布等于边缘分布乘积的条件,其结论是容易得到的.但教学中应明确:X,Y相互独立条件是E(XY)=E(X)·E(Y)成立的充分条件.在引入X,Y不相关的定义后,应适时指出E(XY)=E(X)·E(Y)可以在更弱的条件下成立,并引导学生得出下述与X,Y不相关等价的命题:
参考文献:
〔1〕教育部高等学校大学数学课程教学指导委员会.大学数学课程教学基本要求(2014年版)[M].北京:高等教育出版社,2015.10-13.
〔2〕盛骤,谢式千,潘承毅.概率论与数理统计(第四版)[M].北京:高等教育出版社,2008.109-133.
〔3〕唐建国.一个条件收敛级数重排项后的和[J].大学数学,2011,27(06):130-134.
〔4〕周祖逵,张成恒.将条件收敛级数重排成发散级数的一方法[J].数学通报,1993(09):35-36.