范玫瑰 汪本旺
(浙江省安吉县孝丰高级中学)
本文以2023年教育部四省联考概率统计试题为背景,追本溯源到人教2019版选择性必修第三册第81页探究与发现中有关二项式概率函数的最大值问题,以此为启发逐步去探究二项分布和超几何分布的概率函数和似然函数的最大值问题,最后从中心极限理论去理解二项分布与超几何分布的极大似然估计.
【例题】(2023·四省联考)设一个池塘里鱼的数目为N,从池塘里捞出200尾鱼,并给鱼作上标识,然后把鱼放回池塘里,过一段时间后再从池塘里捞出500尾鱼,X表示捞出的500尾鱼中有标识的鱼的数目.
(Ⅰ)若N=5 000,求X的数学期望;
(Ⅱ)已知捞出的500尾鱼中15尾有标识,试给出N的估计值(以使得P(X=15)最大N的值作为N的估计值).
【分析】本题已知样本是X=15,N为变量,求出现这个样本量的概率最大的N的值,在统计学中称为极大似然估计.
已知p(x,θ)为x,θ的二元函数,其中x表示样本的值,θ为概率模型参数,若θ是确定的,x为变量,称p(x,θ)为概率函数,它描述对于不同的样本点x,其出现概率是多少.若x是确定的,θ为变量,称p(x,θ)为似然函数,它描述对于不同模型参数,出现x这个样本点的概率是多少.而极大似然估计,就是利用已知结果信息,去推导出最大概率导致这些结果出现的模型参考值.
人教2019版选择性必修第三册第81页探究与发现素材中指出:
当k<(n+1)p时,pk>pk-1,pk随k值的增加而增加;当k>(n+1)p时,pk 教材已解决概率函数的最值问题,即样本量x取何值时,概率最值问题,而对于似然函数,它的概率最大值又如何呢? (1)当k=0时,f′(p)<0恒成立,f(p)在(0,1)单调递减,f(p)无最值. (2)当k=n时,f′(p)>0恒成立,f(p)在(0,1)单调递增,f(p)无最值. 对于二项分布,分别采用作高法和导数法,很容易解决概率函数和似然函数的最大值问题,并且发现概率函数最大值点唯一或有两个,似然函数最大值点只有一个.超几何分布与二项分布密不可分,那么对于超几何分布,它的概率函数和似然函数的最大值又如何,是否有类似结论? 【例题1】(2022·张家界3月模拟·节选)2022年底,新冠病毒肆虐全国,某校期末考试时采用了线上考试和线下考试两种形式,现随机抽取200名同学的数学成绩做分析,其中线上人数占40%,线下占60%,通过分别统计他们的数学成绩得到了如下两个频率分布直方图: 线上考试 线下考试 其中(50,70]称为合格,(70,90]称为中等,(90,110]称为良好,(110,130]称为优秀,(130,150]为优异.现从线下考试的学生中随机抽取10名同学,且抽到k个学生的数学成绩为中等的可能性最大,试求k的值. ∴当k=10时,概率最大,即小A赢得10局的比赛概率最大. 【例题3】(回归问题背景) (Ⅰ)略. 【例题4】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品不合格品的概率都为p(0 首先,我们来研究超几何分布与二项分布关系,不妨假设X~H(N,n,M), 即当N足够大时,超几何分布逼近二项分布. 接下来,我们只需研究二项分布,从上述研究我们不难发现二项分布概率函数和似然函数图象都具有中间大,两边小的特征,而此特征恰好与正态分布密度曲线形状非常接近,那么二者之间是否存在某种关联呢? De·Moivre和Laplace提出中心极限定理:设在独立实验序列中,事件A在各项试验中发生的概率为p(0 中心极限定理说明:当n充分大时,正态分布可以认为是二项分布的极限分布,当n不是很大时,二项分布可以近似看成正态分布,图象满足中间大,两边小的规律. 对于概率函数,从中心极限定理去理解,p(x,θ)的图象呈中间大,两边小的规律,特别地,当数学期望取值介于1与n之间时,图象呈先增后减趋势,类似于二次函数,当np为整数时,最大值即为期望,当np不为整数时,概率函数图象不一定关于直线k=np对称,仍需比较与它相邻两个随机变量的概率,大的就是最大值点.三、思维萌芽
四、学以致用
五、知识升华