统计假设检验中原假设H0和备择假设H1的探讨

2013-04-29 13:13:05孙艳
教育教学论坛 2013年52期
关键词:假设检验

摘要:本文通过对假设检验的原理的分析,说明了假设检验的方法是在一定情况下,否定原假设,而不能肯定原假设,举例说明了交换原假设与备择假设,产生相反结果的原因,并指出了设定原假设与备择假设的合理方法。

关键词:假设检验;原假设;备择假设;小概率事件

中图分类号:G642 文献标志码:A 文章编号:1674-9324(2013)52-0093-02

在统计学教学实践中,参数的假设检验占有独特、重要的地位。在教学中,笔者发现大多数学生及统计工作者甚至个别青年教师假设检验的原理理解不到位,突出表现在对原假设与备择假设的设定上觉得无从下手,掌握不好,有时在判断结论上会出现截然相反的结论,这种情况的发生,使得在教学过程中引起混淆,甚至怀疑假设检验本身的正确性。基于此,本人谈几点看法。

一、假设检验的基本思想及基本原理

假设检验是事先对总体参数或分布形式作出某种假设,随后由所抽取的样本构成检验统计量,根据统计中的小概率原理,即“小概率事件在一次试验中几乎不可能发生的”。依据样本信息,对于提出的假设作出判断:是接受,还是拒绝,这种基本思想是带有概率性质的“反证法”。为了判断一个“结论”是否成立,先假设该“结论”成立,称此“结论”成立为原假设,记为H0,与之对立的“结论”,称为备择假设,记为H1,在原假设H0成立的前提下运用统计分析的方法进行推导和计算,如果得到一个不合理(小概率事件在一次试验中发生了)的现象,就有理由怀疑原假设H0的正确性,从而拒绝原假设H0。反之,若没有出现上述这种不合理现象的发生,就没有理由拒绝原假设H0,即可以接受原假设H0。由于样本的随机性,无论是拒绝H0,还是接受H0,我们都无法保证假设检验的结果绝对或者是完全的正确,也可能会出现错误判断,从而导致犯两类错误。第Ⅰ类错误一般叫做“弃真”错误:如果原假设H0为真时,错误地拒绝了H0,那么就犯了弃真错误,记为P{拒绝H0|H0为真}=α,α为显著性水平。第Ⅱ类错误一般叫做“取伪”错误:如果原假设H0不真时,错误地接受了H0,那么就犯了取伪错误,记为P{接受H0|H0不真}=β。由于犯两类错误的概率不能同时控制变小,通常我们控制犯第Ⅰ类错误的概率,使它不超过a,这里所说的“显著性”是“显著性不合理”,是指只有当H0成立时,显著不合理的状态才拒绝H0,否则就要“接受”H0,这里的接受是指不拒绝H0,原因是由于没有获得充分的理由拒绝H0而勉强接受而已。因此,使用显著性检验时,当检验结果为拒绝H0时,结论比较可靠,是很有说服力的,因为检验结果为拒绝H0时,犯错误的概率不超过α,换一句话说,我们有1-α的把握相信这种拒绝H0是正确的。反过来,如果获得“不拒绝”原假设的结论,那么“接受”原假设就显得没有说服力,所以这是仅仅表明的是样本数据与原假设没有矛盾,但这并不能说明原假设是应该被接受的,不拒绝并不等于接受,那么如何合理地设立原假设和备择假设呢?

二、原假设H0及备择假设H1的确定

从经常遇到的实际问题的背景来看,我们真正感兴趣的可能是备择假设,因为接受备择假设可能表明会得到特别意义的结论,或意味着采取某种重要决断,因此,对备择假设应取慎重态度,没有充足的理由不能轻易接受。一般来说,应遵循以下原则来确定原假设与备择假设。第一、把具有保守经验的选择为原假设,也就是设为原假设应该是不能被轻易否定的结论,这些结论通常是指原有的基本理论、基本方法、基本状况等,也可以说是公认的、经验的、历史的一些结论。在假设检验中,由于原假设已经默认为真,对应着大概率的情况,在没有获取足够的证据时是否定不了它的,要想把这种默认改变,那么所对应的样本观测值就必须有显著性的发生改变。而对于那些不能轻易否定的结论,在没有足够的理由证明它的错误之前,人们总是不会做出轻易否定的结论,这就是通常把不能被轻易否定的结论作为原假设的基本原理和基本依据。特别地,在进行单侧检验时,一般取与预想结果的相反面为原假设。比如说,当病人前来问诊时,医生要对病情作出诊断,这时医生可能会犯“无病看成有病”或者“有病看成无病”的错误,而这两种结果相对比较来说,更严重的错误是把“有病看成无病”的结论,所以应将“看病的人有病”作为原假设H0,“看病的人无病”作为备择假设H1。

三、实例应用,对假设检验一个误区的解释

在统计学教学实践中,有些学生甚至是教师,对于下面的假设检验问题常常会得出一个令人困惑的结论。问题如下:从某厂生产的一批灯泡中随机地抽取20只进行寿命测试。由测试结果计算得这批灯泡的平均寿命为x=1960(小时),s=2000(小时)。假定灯泡寿命服从正态分布:X~N(μ,σ2)其中μ,σ均未知。那么在显著性水平α=0.05下能否认为这批灯泡的平均寿命达到国家标准2000小时?

对上述问题,给出以下有两种解法,确得到了截然相反的结论。

解法1:提出原假设H0:μ≥2000备择假设H1∶μ<2000,作检验统计量T=■,显然,该统计量符合自由度为19的T分布,即:T=■~t(19).

结合假设,确定拒绝域的形式为{T<-t0.05(19)}由α=0.05,查t分布表,定出临界值-t0.05(19)=-1.729,从而求出拒绝域 {T<-1.729}.由测试结果得到:

T=■=■=-0.894,

由于T>-1.729,作出接受假设H0的判定,即认为这批灯泡的平均寿命达到国家标准2000小时.

解法2:提出原假设H0:μ<2000备择假设H1μ≥2000,

作检验统计量T=■,显然,该统计量符合自由度为19的T分布,即:T=■~t(19).

结合假设确定拒绝域的形式{T>t0.05(19)}由α=0.05,查t分布表,定出临界值t0.05(19)=1.729,从而求出拒绝域{T>1.729}。由测试结果得到:T=■=■=-0.894,

由于T<1.729,作出接受假设H0:μ<2000的判定,即认为这批灯泡的平均寿命未达到国家标准2000小时。

我们看到,随着问题提法的不同(把哪个断言作为原假设的不同),得出了截然相反的两种结论。对同一问题,为什么出现这种结果,错在哪里?基于上述过程也使得一些对统计思想不甚理解的人感到迷惑不解。实际上,以上问题的解法,是基于我们不同的着眼点。在解法1中,提出原假设H0:μ≥2000是依据该厂产品以往的质量和信誉一直良好,达到国家标准,所以对其断言已有了较大的信任度,没有充分的理由就难以改变我们对该厂产品的信任度,所以一开始就对该厂产品持有肯定的态度。解法2中,提出原假设H0:μ<2000是根据该厂产品一直质量较差,信誉低,没有达到国家标准,从一开始我们就对该厂产品质量持有怀疑态度,如果不是很有利于该厂产品质量的良好结果,那么就很难改变对该厂的看法。因此我们的着眼点不同,也就决定了所得到的相应的结论。从实际问题来看,对同一问题进行分析时选取不同的原假设是具有不同含义的,也就是说,原假设和备择假设在设定的本质上是带有一定的主观因素和情感的。这样,在解决某一个具体的实际问题时,由于不同的人感兴趣的问题不同,研究的目的不同,出发点也不相同,即使是研究同一个问题,也可能会提出完全相反的原假设和备择假设。如果把原假设和备择假设两者的意义交换,那么,原假设和备择假设受保护的地位就会发生转变,这样的话,原来努力去论证正确的备择假设就变成研究人员想办法收集证据予以达到反对的假设,这就改变了研究人员的研究初衷和研究目的。所以,进行假设检验的关键应该是合理地选取原假设和备择假设。对于同一个实际问题,在显著性水平α之下,由于原假设和备择假设不同,所进行的假设检验将会导致不同的研究意义和研究目的。

假设检验是统计分析中的一种重要方法,理论上,假设检验中的原假设和备择假设可以以任意的方式设定。但在实际问题中应合理、辩证地选取原假设和备择假设,这样可以得到更明确而有效的结论.在统计学的假设检验教学过程中,如何设定原假设和备择假设,这种基本的问题我们应重点强调清楚,有助于学生对假设检验的清晰、透彻理解, 能够使学生更好地掌握假设检验的思想方法,具体在实践中应用假设检验方法解决实际问题,并对后续的理论学习产生良好的作用。

參考文献:

[1]李延忠,孙艳,等.概率论与数理统计[M].北京:高等教育出版社,2011.

[2]吴赣昌.概率论与数理统计[M].北京:中国人民大学出版社,2008.

作者简介:孙艳(1964-),女,学士,副教授。

猜你喜欢
假设检验
假设检验结果的对立性分析
一种求解假设检验拒绝域和计算p-值的系统化方法
一种求解假设检验拒绝域和计算p-值的系统化方法
微信抢红包最高金额与其影响因素的回归分析
假设检验在审计抽样工作中的应用
时代金融(2017年23期)2017-09-13 19:00:48
假设检验教学中的案例设计
统计推断的研究
时代金融(2017年6期)2017-03-25 12:02:43
双幂变换下正态线性回归模型参数的假设检验
统计与决策(2017年2期)2017-03-20 15:25:23
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
统计学教学中关于假设检验问题探讨