二项分布的性质及其在数学上的应用

2018-01-18 10:03刘晋源

课程教育研究 2018年42期

刘晋源

【摘要】本课题研究如何通过二项分布的性质证明数学分析中的Weierstrass定理。首先给出了概率空间并在其上定义了服从二项分布的随机变量，然后推导二项分布的数学期望和方差等数字特征，并给出了二项分布可加性的证明。最后利用概率上的方法证明了Weierstrass定理。

【关键词】二项分布数字特征可加性 Weierstrass定理

【中图分类号】G633.6 【文献标识码】A 【文章编号】2095-3089（2018）42-0134-02

1.前言

伯努利试验是只有两种结果的试验，某事件A发生或者不发生，若事件A发生了，则称此次试验成功，否则称为失败，且每次试验成功的概率是相同的。而二项分布就是重复地进行n次相同的伯努利试验，每次的伯努利试验都是相互独立的，与其他各次试验没有关系。比如现在有200颗豌豆种子，颜色为黄色的个数服从二项分布;已知肝癌患病率为p，现在调查200人，则此200人中患肝癌的人数服从二项分布;某条街道上共有1000只路灯，一个月之后坏掉的数量也服从二项分布。这都是我们生活中常见的二项分布的例子，也说明了二项分布应用的广泛性。本文就是研究二项分布的性质以及阐述其在数学上的应用价值。

2.二项分布

2.1 二项分布的建立

为了建立二项分布，我们首先需要建立概率空间，包括样本空间，事件域和概率测度。现在进行n重伯努利试验，每次试验成功，即某事件A发生，记其概率为p。于是样本空间为Ω={（ω1，ω2，…，ωn）：ωi代表事件A发生或者不发生}，此试验具有2■个基本结果。若样本点（ω1，ω2，…，ωn）中只有k个表示事件A发生，其他n-k个表示事件A不发生，则

P（（ω1，ω2，…，ωn））=p■（1-p）■

随机变量X表示这n重伯努利试验中成功的次数，于是可令事件域为由随机变量X生成的σ代数。此时

P（X=k）=■■p■（1-p）■，k=0，1，…，n

这个分布称为二项分布，记为X～b（n，p），其中■■是组合数。

2.2 二项分布的期望和方差

下面我们推导二项分布的数学期望和方差，主要利用的是组合数的性质。X的数学期望为，

E（X）=■k■■p■（1-p）■=np■■■p■（1-p）■=np

又因为

E（X■）=■k■■■p■（1-p）■=■（k-1+1）k■■p■（1-p）■

=■（k-1）k■■p■（1-p）■+■k■■p■（1-p）■

=■（k-1）k■■p■（1-p）■+np

=n（n-1）p■■■■p■（1-p）■+np=n（n-1）p■+np

于是，二项分布的方差为Var（X）=E（X■）-（E（X））■=np（1-p）。

2.3二项分布的可加性

我们称服从同一类分布的独立随机变量和的分布仍然属于此类分布的情形为可加性，比如泊松分布具有可加性，下面我们证明二项分布也具有可加性。

定理2.1（二项分布的可加性）设随机变量X～b（n，p），Y～b（m，p）且X与Y独立，证明Z=X+Y～b（n+m，p）。

证明：首先随机变量Z的取值可能为0，1，…n+m等不同的值。然后考虑事件{Z=k}的概率。由于k是总的试验成功次数，则随机变量X代表的成功次数最大只能是n和k的最小值。另外由于X取值非负，且最小为k-m，于是：

P（Z=k）=■P（X=i，Y=k-i）

=■P（X=i）P（Y=k-i）

=■■■p■（1-p）■■■p■（1-p）■

=p■（1-p）■■■■■■

由超几何分布的性质■■■■■■■=■■

于是P（Z=k）=■■p■（1-p）■，k=0，1，…，n+m

这表明Z=X+Y～b（n+m，p）

3.二项分布证明Weierstrass定理

从函数的复杂程度来看，多项式可以认为是最简单的函数类。用简单函数去逼近复杂函数无论从理论上还是在实际应用中都是十分重要的。例如我们想要求ln（1+x）在x=0.1处的取值，这样的任务虽然可以交给计算机解决，但是即使是计算机，应对这样的计算任务也是需要进行大量的运算的，比如用二分法不断迭代。但是最简单的方法莫过于用多项式近似ln（1+x），从而只需要计算多项式的值即可，这样的任务交给计算机也能大大减少计算量，从而提升运行速度。伍胜健老师的《数学分析》中证明了任何有限闭区间上的连续函数都可以被多项式逼近，但是只是一个存在性的证明，并没有为我们构造出具有显式表达式的结果。

定义 3.1 设f（x），fn（x）（n=1，2，…）为定义在I？奂■上的函数。若对于？坌ε>0，存在n∈N当n>N时，对一切x∈I，有

fn（x）-f（x）<ε，

则称函数序列{fn（x）}在I上一致收敛于f（x），记为fn（x）■f（x）（x∈I）。

定义 3.2 设函数f（x）在区间I上有定义。若对于？坌ε>0存在多项式P（x），使得对于一切x∈I有f（x）-P（x）<ε，则称f（x）在I上可被多项式逼近。

定理 3.1（Weierstrass定理）设函数f（x）∈C[a，b]，则f（x）可被多项式逼近。

下面，我们利用二项分布的性质给出上述Weierstrass定理一个概率上的证明，并构造出了具有显式表达式的结果。为了简单起见，我们的讨论限制在[0，1]上。

定理 3.2 设函数f（x）在[0，1]上连续，对每个正整数n，定义Bn（f，x）=■■■f■x■（1-x）■，证明Bn（f，x）■f（x）（x∈[0，1]）。

證明：Bn（f，x）-f（x）=■■■f■x■（1-x）■-■■■f（x）x■（1-x）■=■■■[f■-f（x）]x■（1-x）■

由于f（x）是[0，1]上的连续函数，从而一致连续。于是对于任意的ε>0，存在δ>0，当x′，x″∈[0，1]，x′-x″<δ时，有f（x′）-f（x″）<■。

则Bn（f，x）-f（x）≤■■■■■f■-f（x）x■（1-x）■=■■■f■-f（x）x■（1-x）■+■■■f■-f（x）x■（1-x）■<■■■■x■（1-x）■+■■■f■-f（x）x■（1-x）■

又因为f（x）的连续性，可知存在M>0使得f（x）≤M，对任意的x∈[0，1]成立。

于是，

■■■f■-f（x）x■（1-x）■≤2M■■■x■（1-x）■≤2M■■■■x■（1-x）■≤■■≤■

上述第三个不等式利用的是二项分布的方差公式，此时取N>■，则当n>N时，

■■■f■-f（x）

从而Bn（f，x）=f（x）

4.总结

本文给出了数学分析中的Weierstrass定理概率上的证明，利用的是二项分布的期望和方差的性质，以及连续函数的有界性和一致连续性。

参考文献：

[1]茆诗松. 概率论与数理统计简明教程[M]. 高等教育出版社， 2012.

[2]伍胜健. 数学分析[M]. 北京大学出版社， 2009.