陈学云
摘 要 文章在阐明标准正态分布分位数、置信水平、置信区间和样本均值的抽样分布的基础上,通过计算样本均值落在总体均值两侧任何位数抽样标准差范围内的概率,运用中心极限定理建立总体均值的参数估计区间; 根据估计区间,提出假设检验的基本思想,明确双侧检验和单侧检验的拒绝域,并提醒学生左侧检验与右侧检验容易误判的地方;通过引例,实施理实一体化教学,边讲原理边做实验,化抽象为具体,从具体再到抽象,消除学生对参数估计和假设检验的畏惧感,明晰推导思路,让学生在完成操作任务的过程中学习统计学知识。
关键词 参数;区间估计;假设检验;理实一体化教学
中图分类号:G642 文献标识码:A DOI:10.16400/j.cnki.kjdk.2024.9.047
Integration of Theory and Practice Teaching Exploration of the Principle of
Estimation Interval Estimation and Hypothesis Testing of Parameters
CHEN Xueyun
(School of Economics and Management, Chuzhou University, Chuzhou, Anhui 239000)
Abstract On the basis of elucidating the sampling distribution of standard normal distribution quantiles, confidence levels, confidence intervals, and sample means, the article calculates the probability that the sample mean falls within the sampling standard deviation range of any digit on either side of the population mean, and uses the central limit theorem to establish the parameter estimation interval of the population mean. Based on the estimated interval, propose the basic idea of hypothesis testing, clarify the rejection domains of bilateral and unilateral tests, and remind students of the areas where left and right tests are prone to misjudgment. By citing examples, implementing integrated teaching of theory and practice, teaching principles while conducting experiments, transforming abstract concepts into concrete ones, and moving from concrete to abstract ones, students' fear of parameter estimation and hypothesis testing is eliminated. The reasoning process is clarified, allowing students to learn statistical knowledge while completing operational tasks.
Keywords parameters; interval estimation; hypothesis testing; integrated teaching of theory and practice
现行的本科统计学(非统计学专业)教材对于参数估计和假设检验原理的讲解大致有下列两条思路:一是先计算样本均值落在总体均值两侧任何倍数的标准误差范围内的概率,然后利用样本均值与总体均值的对称性解释置信区间建立的原理;二是利用中心极限定理和标准正态分布的分位点定义建立置信区间。前者显得有些抽象,学生难得要领;后者显得烦琐,学生不易理解。本文尝试结合案例,使用理一体化教学方式综合这两种思路,进一步明晰置信区间的建立过程,使学生更易理解。假设检验则利用参数估计区间确定拒绝域来实现,消除学生抽象感。
理实一体化教学是一种采用理论与实践有机结合的方式,促进学生认知能力发展和实践能力提高的混合式教学方式。在参数估计和假设检验的教学中,全面突出教学做一体,将每个知识点视为一个模块,并完成一个实验操作任务,采用示范教学法、分组操作等多种教学方法,让学生在完成任务的过程中学习统计学知识。通过实例,在讲解理论的同时进行实验(统计软件)操作,有利于学生对参数估计和假设检验基本原理的深刻理解,突破教学难点。
1 參数估计与假设检验
1.1 参数估计
参数估计是在抽样及抽样分布的基础上,根据样本统计量来推断总体参数的过程;点估计是指通过样本数据得到总体参数的一个单值估计。点估计的常用方法有矩估计、极大似然估计、最小二乘法和顺序统计量法等,它不考虑估计的误差,直接用样本估计量估计总体的参数。区间估计是指通过样本数据得到总体参数的一个区间估计,是在点估计的基础上估计总体参数所在的区间范围。在区间估计中,我们能给出一个范围,有一定的把握说这个区间包含真实参数值。常用的区间估计方法包括置信区间和预测区间。置信区间是用于估计总体参数的一个范围,而预测区间则是用于估计未来观测值的范围。
1.2 假设检验基本原理
假设检验是根据样本信息对总体某特征值做出决策判断,但抽样有其偶然性。因此,要判断抽样结果是偶然性在起作用还是系统误差造成的,需给出一个量的界限(临界值),如果超出这一界限,则抽样结果是由系統误差造成的。具体运用小概念原理加以判断(概率反正法):假定原假设成立,如果小概率事件在一次试验中竟然发生了,则拒绝原假设;若原假设正确,则某个统计量(计算样本值与假设值差异的大小)落入某个区域(拒绝域)是一小概率事件,如果该统计量的值真的落入该区域,则说明原假设不可信,有理由拒绝之。
2 引例
一个班级共有60名学生,身高服从正态分布。假定该班学生平均身高为170cm,标准差为6.08cm,试估计该班学生身高在160cm到180cm之间的人数。
该问题可以归结为求该班学生身高落在[160,180]cm区间上的概率,可用SPSS函数CDF.Normal(180,170,6.08)-CDF.Normal(160,170,6.08)计算之。学生操作统计学软件,边实验边学理论,达到理实一体化教学效果。得到的结果大约为0.9,说明该班大概有90%的学生(54个)身高在160cm到180cm之间。
那么,如果以170cm为中心构建一个区间,要求落在该区间上的概率为0.9,则该区间一定为[160,180],这个区间称为置信水平(置信度)为90%的置信区间。若对该班学生的身高进行标准化处理,则该班学生的身高服从标准正态分布,置信区间转换为[-10/6.08,10/6.08],约为[-1.645,1.645]。我们把Z0.05=1.645称为此标准正态分布的上分位数,Z0.95=-Z0.05=-1.645称为此标准正态分布的下分位数。
3 参数的区间估计
3.1 解释分位数
解释分位数是连续分布函数中的一个数,这个数对应的概率为。上分位数是指使得标准正态分布中有一定比例的数据大于等于该值的临界点;下分位数是指使得标准正态分布中有一定比例的数据小于等于该值的临界点。
3.2 解释置信水平与置信区间
置信水平表示我们对于置信区间的可信程度,通常以百分比的形式表示,常见的有90%、95%和99%。置信区间是根据样本统计量所构造的关于总体参数在一定置信水平下的估计区间。因此,置信水平与置信区间是一对相依相伴的概念,其中置信水平用1― 来表达。若置信水平为1― ,意思是说,重复构造置信区间若干次,有比例为1― 的区间包含总体参数真值,有 比例的样本不包含总体真值。需要注意的是,置信水平和置信区间是表示估计结果的可靠性程度,并不是针对具体的某个样本,而是概括了在相同条件下多次抽样所获得的区间。同时,置信水平和置信区间是相互关联的,较高的置信水平通常对应较宽的置信区间。
3.3 解释样本均值的抽样分布
样本均值的抽样分布是指在重复选取容量为n的样本时,由样本均值所有可能取值所形成的相对频数分布。当样本容量n足够大时,样本均值的抽样分布是正态分布,且均值等于总体均值,方差为总体方差的1/n倍。可以作出这样的判断:在样本均值的抽样中,有90%的样本均值落在 ?.645 区间内,有95%的样本均值落在 ?.96 区间内等。为对此判断作检验(以90%为例),把样本均值的抽样分布作标准化,已知有90%的落在区间[-1.645,1.645]内,运用SPSS函数CDF.Normal(1.645,0,1)-CDF.Normal(-1.645,0,1)来验证之,使学生容易理解。
3.4 构造总体均值的置信区间
基本思路:中心极限定理保证了样本均值的数学期望等于总体均值,样本均值落在总体均值 两侧任何倍数标准误差范围内的概率都可以计算。由于和 的距离是对称的,如果某个落在 的某倍数的标准误差范围内,则 也被包括在以为中心两侧一该倍数的标准差范围之内。这意味着,约有1― 比例的样本均值所构造的该倍数标准误差的区间会包括总体均值 。在上述对分位数、置信水平和置信区间以及样本均值的抽样分布的概念做解释的基础上,构造总体均值的置信区间。
4 假设检验原理
如果假设值在置信区间内,则不能拒绝原假设,如果不在,则拒绝原假设,这是假设检验的基本思想。在引例中,假如我们随机抽到一个均值为165cm的样本(样本容量为36),可计算出具体的区间为[163.35,166.65],然后看总体均值的假设值(为170cm)是否在这一区间(不在),来判断关于总体的假设是否正确(不正确)。
人们相信一次抽样所得到的统计量的值在置信区间内。以均值为例,一次抽样的样本均值标准化之后应该在区间上下分位数之间;若计算的标准化值不在这个区间,则有理由拒绝原假设(双侧检验),因为小概率事件发生了。因此,我们把置信区间以外的区间称为拒绝域,从而得出拒绝域和非拒绝域的概念。
在引例中,若抽到的是一个均值为165cm的样本(样本容量为36),把该值进行标准化处理得到的值为-5,不在[-1.645,1.645]区间内,拒绝原假设。
在引例中,若假设全班学生平均身高大于等于170cm,而抽到的样本均值为165cm,比170cm要小,但是否小到达到明显的程度呢?如上所述,样本均值的标准化值为-5,小于-1.645,在(-∞,-1.645]区间内,所以在90%的置信度下要拒绝原假设,表明全班学生的平均身高不足170cm。
这里要提醒学生,根据样本计算的统计量的值的正负不能作为判断是左侧检验还是右侧检验的依据。在引例中,如果假设全班学生平均身高小于等于170cm,则是右侧检验问题。而统计量的标准化值仍然是-5,在左边。而此时的区间为[1.645,-∞],显然-0.882不在这一区间内且明显小于1.645,不能拒绝原假设,表明没有充分的理由说明该班学生的平均身高不小于170cm。由于样本计算的统计量的值为负,而拒绝域在右,注意这时观察到的显著水平p值会很大(超过0.5),在用p值进行检验时要充分注意这一点。
参数估计和假设检验是统计学教学的重点也是难点,实现融会贯通及灵活运用较为困难。因此,需要教师在教学过程中贯彻理实一体化教学理念,采用系列化探究式项目教学法,將实验实训和理论知识相结合,用直观的形式展现抽象的内容,使学生在完成设定的任务中深刻理解所学内容,同时做好过程性考核,提高学习效率,增强学习效果。
5 进一步讨论
5.1 参数估计与假设检验的一般性步骤
参数估计一般性步骤:①定义问题。明确要估计的参数是什么,属于哪一个参数(均值、比例、方差)。②收集数据。收集与该参数相关的数据样本。③构造区间。根据总体和样本特征,使用适当的参数估计公式构造估计区间。
假设检验一般性步骤:①假设定义。明确要检验的假设、假设的前提条件和假设的预期结果。②数据收集。抽取样本,收集与该假设相关的数据,并确保数据的可靠性和完整性。③作出决策。根据所收集的数据,计算出统计量(均值、比例、方差等),根据规则作出决策。必要时对结果作进一步解释,并提出对策建议。
5.2 参数估计与假设检验的关系
参数估计和假设检验是数理统计的两个基本问题,也是推断统计的两种重要统计方法,两者密切联系。①两者都是以样本统计量的抽样分布为依据,对总体参数进行推断。在区间估计中用到的样本标准化统计量和在假设检验中用到的检验统计量本质上是同一个函数,选择标准也相同。②在区间估计中置信水平与假设检验中显著性水平具有对偶关系,而区间估计中置信区间与参数假设检验中的接受域(“接受域”的说法,主要是为了方便,而并不是说在现有的样本信息条件下不能拒绝原假设时就等于“接受”原假设)一致。③区间估计与假设检验所得结论相容。如果总体参数落在置信区间里,则假设检验的决策结果就不会拒绝原假设。相反,如果总体参数没有落在置信区间里,则假设检验的决策结果就会拒绝原假设。
5.3 置信区间表述与两类错误
用一个具体的样本所构造的区间是一个特定的区间,该区间要么“绝对包含”,要么“绝对不包含”总体参数的真值,不存在“以多大的概率包含总体参数”的问题。因此,置信水平只是说明用多次抽样所得到的样本构造出的区间中大概有多少个区间包含了参数的真值,而不是针对某一具体区间而言的。如果在构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么用该方法构造的区间是置信水平为95%的置信区间(其他置信水平的区间也同样表述)。其中的5%在假设检验中称为显著性水平,即事先确定的用于拒绝原假设时所必须的证据,能够容忍的犯第Ⅰ类错误的最大概率(上限值),或者说原假设为真时拒绝原假设的概率。
基金项目:安徽省本科教学质量工程一流课程项目“统计学原理与实验”(2021XSXXKC210)。
参考文献
[1] 程建华,洪文.统计学原理与应用[M].北京:人民邮电出版社,2013:124.
[2] 吴和成.应用统计学[M].北京:科学出版社,2015:11.
[3] 贾俊平.统计学——基于SPSS(第二版)[M].北京:中国人民大学出版社,2016:83.
[4] 李奇明,徐德义.参数估计与假设检验:原理、方法与误区[J].大学教育,2018(2):40-42.
[5] 戴金辉.区间估计与参数假设检验的比较[J].统计与决策,2019(9):72-74.
[6] 卫淑芝,张兴旭,周越.检验统计量对假设检验影响效果分析[J].大学数学,2023(3):93-97.
[7] 刘高生,柏杨,余平.部分函数型线性空间自回归模型的假设检验[J].数学学报(中文版),2023(2):239-252.
[8] 徐晓岭,王蓉华,顾蓓青.统计学教学中的若干问题思考[J].高等数学研究,2023(1):66-69.
[9] 杨羽,孙加秀.经贸专业理实一体化教学模式创新探索——以“国际经济学”为例[J].科教文汇,2023(16):71-74.