◎黄娟娟
(空军通信士官学校,辽宁 大连 116000)
上篇文章中我们还有几个教学中应该注意的问题没有指明和解决,本文对正态总体参数假设检验进行的单元教学设计,指出了教师应该注意的剩余七个问题,并给出实例加以说明
假设检验被著名的统计学家R.A.Fisher称为统计推断三大中心内容之一,这是因为很多统计方法都与假设检验有关
目前,国内各种数理统计教材都将其中的正态总体参数的假设检验作为基本内容,课时安排为4~6学时,主要内容包括假设检验的基本思想、基本问题、基本概念和一般步骤,单个正态总体参数的单边检验,两个正态总体参数的假设检验这部分内容的特点是思想深刻、方法独特、重点集中、难点突出、概念众多、顺序严格(紧凑)、逻辑严谨、步骤紧密,这使教师教学和学生学习容易遇到困难本文根据教学设计的原则对正态总体参数假设检验进行了单元教学设计,并指出了对于这部分内容,教师在讲授时应注意的问题,以帮助教师提高教学质量
第一,明确教案的主要内容,并确立教学目标教师在学生深刻理解假设检验的基本思想、基本概念和一般步骤的基础上,使学生熟练地掌握正态总体参数假设检验的各种方法,并能正确使用其解决实际问题这样就解决了课堂上学生要学什么的问题
第二,课堂教学设计基本上是提前计划好教学模式,教师用创造性的策略达到预期的教学目标因此,具体地给出教学设计方案就是解决怎样教的问题根据本节内容特点,笔者设计具体的教学方案如下:
(1)给出两个浅显的生活实例和与一个正态总体参数检验有关的实例,然后概括出假设检验的基本思想
(2)通过上述给出的例子明确假设检验的基本问题
(3)假设检验的基本概念和一般步骤要结合实例一起讲解教师通过解决一个具体问题,理清假设检验的五个步骤,并在每个步骤里讲解各个基本概念产生的背景条件、内涵和需要注意的问题
(4)对于正态总体参数假设检验的具体方法,教师根据总体个数、检验的参数、已知条件以及检验的拒绝域是单侧还是双侧,每种情况讲解一个实际问题,通过实例,明确检验应使用的具体方法
第三,明确教学难点和重点,并提出解决问题的关键和策略我们认为这个单元的教学难点是正确认识假设检验的基本思想,深刻理解假设检验的基本概念和一般步骤,熟练掌握正态总体参数的假设检验方法
如果我们将假设检验的思想同具体问题一起讲解,则容易造成混乱我们可以利用分散难点的教学原则解决这个问题上课之初,教师先讲两个简单的日常生活中的例子,然后用一个统计实例来阐明假设检验的思想,指出基本思想的本质特征由于这部分内容的名词概念有十多个,加之概念之间有明确的顺序关系,教师讲丢了不行,讲乱了也不行,讲解难度很大教师可以通过一个具体实例的解决过程来理清假设检验的每个步骤,以及我们在每个步骤中遇到的名词概念随着问题的解决,步骤逐渐清晰,各个概念在每个步骤中的意义、作用也都清楚了我们将假设检验视为一个具有系统性规模的工程,每一个步骤可以被看成这个工程中的一个子环节,这些子环节按照排列组合的程序性特点,有序地进行等级排列,且前一个子环节影响着后面的子环节,而后面的子环节又依存并制约前一个子环节所有内容的渐进程序性要求课堂设计也应体现类似计算机程序的规律性与联系性,这样的设计保证了课堂教学设计的科学性
正态总体参数假设检验的背景、场合、条件、要求各有不同,方法也是各式各样,各种情况虽具有相对的独立性,但他们之间又互相依存和制约,组成了一个有机的总体所以课堂的教学设计更要立足于整体,做到总体与各环节的辩证统一,并有机地把系统的分析结合起来,以达到整体化教学的目的据此,我们可采用如下的方法进行处理
当明确问题是一个或两个正态总体参数假设检验时,由于总体可以是一个或两个,检验的参数可以是期望或方差另外的参数可以是已知或未知,检验可以是单侧或双侧,所以我们可按下列步骤进行
一看正态总体是一个还是两个;二看检验的参数是什么;三看另外的参数是已知还是未知;四看检验是单侧还是双侧只有这样,我们才能明确这是参数假设检验的八类二十四种中的哪一种检验问题明确了问题的实质,我们就能正确使用方法进行检验了这样就完全解决了正态总体参数的假设检验问题根据教学目标,假设检验的基本概念、一般步骤和各种检验方法,既是教学难点,也是教学重点在讲解这部分内容的过程中,教师要对其进行强调,突破难点,解决重点这样教师就能合理地运用系统方法设计出教学过程,提高学习者获得知识、技能的效率和兴趣,使教学成为一种具有操作性的程序,使教学效果最优
下面本文对教学中教师应该注意的十二个问题中的后七个做重点解释说明
因为我们注重拒绝原假设,所以可以将复合原假设:≤简写为′:=在我们实际应用这种方法时,对于一个正态总体的两个正态总体参数的单侧假设检验会有类似的情况出现
(1)如何正确理解假设检验的基本思想?
(2)什么作为原假设?什么作为备择假设?
(3)拒绝假设和接受假设的含义
在拒绝假设和接受假设方面,我们对于拒绝原假设要给以特别的注意,在原假设为真时,样本观测值落入拒绝域是一个小概率事件根据实际推断原理,在一次观测中,小概率事件是几乎不可能发生的,所以拒绝原假设的理由是充足的由于检验第二类错误的概率并没有受到限制,仅要求它尽可能小,所以在备择假设为真时,样本观测值没有落入拒绝域可能不是一个小概率事件,因为接受原假设的理由可能是不充足的,正如在教学中我们不能用一个例子去说明一个结论一样,用一个样本不能证明一个命题是成立的,但可以用一个样本推翻一个命题事实上,在“拒绝原假设”和“拒绝备择假设”(从而接受原假设)之间还有一个模糊域如今我们把它并入接受域,所以接受域是复杂的,我们将之称为保留域也许更恰当,但人们习惯上已把它称为接受域,没有必要再进行改变,只是应注意它的含义科学的说法是不拒绝原假设我们把“不拒绝原假设”说成“接受原假设”,这是为了使实际工作者能较快地熟悉和使用假设检验方法
(4)两类错误的关系与N-P原则
在进行假设检验时,由于样本的随机性,我们可能做出正确的判断,也可能做出错误的判断,这时我们可能会犯两类错误(弃真错误和纳伪错误)一般地,在样本容量固定时,要减小犯第一类错误的概率,必然导致增大犯第二类错误的概率;反之,若要减小犯第二类错误的概率,则会使犯第一类错误的概率增大换句话说,当样本容量固定时,不可能使得犯两类错误的概率都减小,这一现象在一般的检验问题中都会出现基于这种情况,教师需要采用某种妥协方案J.Neyman和E.S.Pearson的假设检验理论的基本思想,就是使犯第一类错误的概率限制在某一范围内,然后,寻求使犯第二类错误的概率尽可能小的检验,这就是N-P原则
(5)第一类错误和第二类错误的概率大小如何确定
犯第一类错误的概率是事先选定一个较小的常数我们经常取1%、5%和10%作为的值,的选取也依赖于我们关于假设的先验信息,依赖于我们对犯第二类错误的要求比如,我们根据以往的检验,非常相信原假设是真的,而犯第二类错误又不会造成大的影响后果,此时可以取小一点又如,第二类错误带来的影响较大,需要严格控制犯第二类错误的概率,此时可以选大一些
例如,在医药行业中,某种药品合格被错判为不合格的影响不大,但若将不合格品错判为合格品后用于临床,问题就严重了因此我们要适当减小犯第二类错误的概率,可以通过适当放大犯第一类错误的概率来实现再如,生产纽扣的工厂,若将合格纽扣错判为不合格品将浪费原料,而将不合格品错判为合格品也能将就使用,问题不太大因此我们要适当减小犯第一类错误的概率这说明我们确定第一类错误和第二类错误的概率大小要具体问题具体对待
(6)检验中处理复合原假设的方法
我们通过例子说明这个问题,当正态总体的方差未知时,欲检验:≤(已知)vs:>,此时原假设是一个复合假设,我们可以采用第一种检验法,讨论如下:
当′:=vs:>时,原假设′成立,选择检验统计量:
给定显著性水平,我们可以通过查(-1)表得到临界值1-(-1)有(≥1-(-1))=,此时拒绝域为:
={≥1-(-1)}
拒绝域确定了,检验方法就已确定
当′′:
∴>≥1-(-1)
在′成立时,落入拒绝域,一定有′′成立时,落入拒绝域
因为我们注重拒绝原假设,所以可以将复合原假设:≤简写为′:=
(7)Behrens-Fisher(贝伦斯-费歇尔)问题
(8)检验和检验的关系
如果遇到同时要检验两个正态总体期望和方差是否对应相等的问题,由于检验统计量分布的推导的必要条件是两总体方差要求相等,又由于Behrens-Fisher问题的存在,因此我们一定要先用检验法检验两个正态总体方差是否相等,只有两个正态总体方差相等时,我们才能使用普通的检验法检验两个正态总体期望是否相等
(9)假设检验与区间估计的关系
假设检验和区间估计这两个统计推断问题看似完全不同,而实际上两者有着非常密切的联系由参数假设检验问题的水平的检验,可以得到参数的置信水平为(1-)的置信区间,反之亦然具体地说,1减显著性水平就是置信水平,置信区间就是一种接受域
(10)使用检验的值
在显著性水平检验中常常会出现这样的问题,在一个较大的显著性水平下会得到拒绝原假设的结论,而在一个较小的显著性水平下会得到相反的结论这是因为显著性水平变小会导致检验的拒绝域变小,于是原来落到拒绝域的观测值就可能落入接受域,这种情况在应用中会带来麻烦为了避免这种问题出现,我们提倡拒绝域与检验的值并用的方法,这样就可以避免人为设定检验水平的非议
(11)充分性原则
进行正态总体参数假设检验时,原假设成立,检验的统计量可能不唯一,原则上我们应该选用充分统计量或充分统计量的函数作为检验统计量,这就体现了Neyman(耐曼)的充分性原则
(12)检验方法具有稳定性
总体正态可进行参数的假设检验,如果总体非正态,那么在样本容量较大时,理论表明其可近似地看成正态总体参数假设检验,检验方法是具有稳定性的
针对以上出现的问题,我们以两个参数假设检验的应用进行举例说明:
1某调研小组的研究观察数据表明,仅某一个小镇每天夜间微信视频通话时间的标准差为5分钟,现在有一个由100个视频通话时间构成的简单随机样本,它们的平均通话时间为14分钟在置信水平为百分之九十五的条件下,如何利用样本信息判断该乡镇每晚微信视频通话的平均通话时间的置信区间呢?
根据已知调查数据可以判断,这是一个双侧置信区间问题
假设该乡镇原来每晚视频通话时间为15分钟,因为15∉(1302,1498),所以总体均值并未落在置信区间中
2某调研小组的研究观察数据表明,某一乡镇原来每天夜间微信视频通话平均通话时间为15分钟,其标准差为5分钟现在由此小组跟踪调查的100个微信视频通话时间组成的简单随机样本,平均通话时间为14分钟如何在百分之五的显著性水平条件下,利用已有的样本信息,判断每晚微信视频通话时间是否发生变化呢?
根据已知调查数据可以判定,这是一个双边假设检验问题
提出假设::=15,:≠15
拒绝域对应的是临界值的外侧,不拒绝域对应的是临界值的内侧
例1和例2表明,如果总体参数未落入置信区间中,在进行假设检验时,检验统计量的值会落在拒绝域内,从而拒绝原假设无论进行区间估计还是参数假设检验,出现以上问题时,只需对号入座解决即可