李 真
(广东财经大学 统计与数学学院,广东 广州 510320)
凡是在一定条件下断定随机变量之和的极限分布是正态分布的定理,在概率论中统称为中心极限定理.中心极限定理是揭示产生正态分布的源泉,是应用正态分布来解决各种实际问题的理论基础[5].该部分是《概率论与数理统计》课程中的一个非常重要内容,在概率论与数理统计的知识体系中起着承上启下的作用[3].教学大纲要求学生理解独立同分布的中心极限定理,并掌握该定理的应用.
样本均值的抽样分布定理同样是《概率论与数理统计》中的一个重要定理.它是统计学的基础理论之一,奠定了抽样推断的基础.对样本均值的抽样分布定理的理解程度,决定了学生对整个抽样推断理论的理解程度[4].
然而,这两个定理都非常抽象(尤其中心极限定理).学生对定理的理解不到位,且不了解这两个定理的联系,大多数学生会以为结论多而烦,产生恐惧和抵触心理,很难取得良好的学习效果.故本文探讨独立同分布的中心极限定理和样本均值的抽样分布定理的联系与区别,进行类比教学[2].
定理1(莱维—林德伯格定理) 设X1,X2,…是独立同分布随机变量序列,且 E(Xi)=μ,Var(Xi)=σ2,则对任给 x∈(-∞,+∞),均有
其中Φ(x)是标准正态分布N(0,1)的分布函数.
注:该定理又称之为独立同分布的中心极限定理.
定理1的条件明确要求随机变量序列X1,X2,…要具备:独立、同分布两个条件,这正是该定理又称为独立同分布的中心极限定理的原因;同时,还需知道Xi的期望和方差,这两个条件在定理的结论中要用到.除此之外,并不要求随机变量序列满足何种分布.
结合独立性和同分布,
虽然定理1的结论涉及极限分布,但在实际中,应用独立同分布的中心极限定理解决具体问题时,只要n充分大,我们就可以用中心极限定理做近似计算.因此,可将(1)式记为:当n充分大时,有
很多学生初学定理1,对该定理不甚理解.而它的记忆及应用,恰是以理解为基础的.这是学生学习独立同分布的中心极限定理的难点,也是教学过程中教师应讲解的重点.
定理2 设X1,X2,…Xn为来自均值为μ,方差为σ2的总体的一组样本,则当n充分大时,近似地有
分析:定理2中X1,X2,…Xn是一组样本,具备有相互独立,且与总体同分布的性质.因此,它是独立同分布的随机变量序列.定理2也告知了Xi的期望与方差,与定理1的条件唯一的区别是:定理2是有限个随机变量,但在结论中提到了n充分大,与(2)式(见2.2)的前提是一致的.因此,可直接得到(2)式结论.再做进一步讨论.
证 因为X1,X2,…Xn是一组样本,所以X1,X2,…Xn独立、同分布,当n充分大时,由独立同分布的中心极限定理(定理1)知,
而此结论就是定理2的结论(3)式的标准化!
定理2说明,给定任意分布形态的总体(即使不知道总体的分布类型也无关紧要),其均值为μ,方差为σ2,从中抽出容量为n的样本;只要样本容量n足够大,样本均值的分布就近似服从均值为μ,方差为的正态分布.它指出了样本均值与总体均值的关系,奠定了抽样推断的基础.学生如果不能较好地理解样本均值的抽样定理,就不能进一步理解参数估计和假设检验这些统计推断的原理.
从3.2可以看出,样本均值的抽样分布定理(定理2)其实是独立同分布的中心极限定理(定理1)的推论!这也说明,中心极限定理是数理统计中大样本统计方法必不可少的理论基础,体现了中心极限定理在概率论与数理统计知识体系中的承启的作用.
但两者的意义不同,在概率论与统计学中的地位也不尽相同.中心极限定理非常重要,而样本均值的抽样分布也有它的理论意义,是统计学的基础理论之一(详见3.3).
把独立同分布的中心极限定理和样本均值的抽样分布定理进行联系教学,旨在让学生认识到这两个抽象定理的联系与区别.一方面,让学生更加明确这两个定理的理论意义和应用价值;另一方面,在解决实际问题时,可引导学生把这两个定理视为同一个定理,减少结论的记忆量,消除学生对抽象定理的恐惧或抵触心理,培养、提高学生应用定理解决具体问题的能力.