参数的区间估计与假设检验的关系

2014-11-29 09:27贺乐平莫宏敏
考试周刊 2014年85期
关键词:假设检验置信区间

贺乐平 莫宏敏

摘 要: 本文对统计推断理论中区间估计和参数假设检验的相关性问题进行了分析,并对区间估计和假设检验的内在联系和区别进行了探讨.

关键词: 统计推断 置信区间 假设检验 拒绝域 区间估计

1.引言

数理统计是数学中的一个重要分支,具有广泛的应用.假设检验和区间估计作为两种重要统计推断方法,在金融保险、经济管理、科学研究、工程技术、质量控制乃至国防安全、灾害防治等各方面等领域的应用日趋广泛.其在科学决策中的作用也被越来越多的人所认知.表面上看,假设检验和区间估计从是两个不同的概念,但实际上它们之间的联系是很密切的,掌握它们之间的关系、各自的适用范围和应用条件,以及应注意的问题对作出正确的统计推断至关重要.本文初步探讨了区间估计与假设检验问题的内在联系和区别,讨论了如何利用置信区间解释假设检验的有关问题的新思路、新方法.

2.参数的区间估计与假设检验的内在联系

统计推断的基本问题分为两类:一类是参数估计,另一类是假设检验.它们是两个不同的统计概念,但又有着密切的联系,从某种意义上来讲,是同一问题的不同表达方式,参数区间估计与假设检验虽然提法不同,但解决问题的方法、途径是相通的,统计推断的基本思想是一样的,都是利用样本信息推断总体的性质,即用部分推断总体.它们选取的都是同一个统计量,然后计算出这个统计量落在某个区间上的概率,而据由此作出判断.利用区间估计可以建立假设检验,反之亦然.

例:设总体X~N(μ,σ■),σ■未知,试求未知参数u的区间估计.

解:选取统计量

t=■~t(n-1),按置信度1-α确定一个大概率事件

p|■|≤t■=1-α,由此得到u的置信度为1-α的置信区间为[■-■t■,■+■t■].该区间估计恰好是原假设H■μ=μ■的一个接受域,其中显著性水平为α.

对假设检验问题,则提出假设:H■∶μ=μ■;H■∶μ≠μ■,选择统计量t=■

对给定的显著性水平为α,得到一个小概率事件p|■|>t■=α,由实测值,

|■|>t■是否成立,决定是否拒绝原假设,拒绝域为|■|>t■,接受域为|■|≤t■,则结果正是u的置信度为区间估计.

3.参数的区间估计与假设检验之间的区别

参数的区间估计与假设检验的统计处理确有相通之处.某种意义上是从不同的角度回答同一问题,但两者之间又有区别,主要体现以下几点.

第一,参数估计解决的是定量问题,是多少(或范围)问题,假设检验解决的是定性问题,则判断结论是否成立的问题.各自的要求不尽相同.区间估计是确定置信度1-α(一定的概率)下给出未知参数的接受范围.而假设检验是在给定的置信水平α下,确定未知参数能否接受已给定的值.

第二,区间估计与假设检验对问题的了解程度不尽相同.假设检验原假设H■的设定对结果影响很大,其中考虑了某些非样本信息,原假设必须选有足够理由认为其成立概率很大的假设,因为没有非常充足的证据是不能轻易推翻原假设的,而区间估计则只依据样本作出推断.因而在实际应用中,究竟选择哪种方法进行统计推断,需要根据实际问题的情况确定相应的处理方法.否则将会产生不同的结论,得出错误的统计推断.

例:已知某厂生产的维尼纶纤度服从正态分布,规定标准为纤度不低于100,某日抽取6根纤维,测得纤度为分别85,90,95,97,100,103.问能否认为这天的维尼纶是合格的?(a=0.05)

解法一:①提出待检假设:H■∶u≥100,H■∶u<100

②选取统计量:t=■

③对于给定的检验水平α=0.05,查表确定临界值t■(5)=2.015,从而给出拒绝域:P{t<-t■=-2.015}=α=0.05,拒绝域为(-∞,-2.015)

④计算判断:易得■=95,s=6.6030

t=■=-1.8558

因统计量观察值没有落入拒绝域中,应当接受原假设H■,可以认为这天的维尼纶是合格的.

解法二:提出待检假设:H■∶u≤100,H■∶u>100

其拒绝域为(2.015,+∞),统计量的观察值也没有落入拒绝域中,理应接受H■,结论是这天的维尼纶是不合格的,为何当交换原假设和备择假设作检验时,却得出截然相反的结论呢?这主要是由样本的随机性所引起的.事实上,第一种解法的拒绝域为(t■,+∞),第二种解法的拒绝域为(-∞,-t■),两种方法的接受域有一个公共的交集(-t■,t■).由于样本的随机性,当样本观测值落入两者的交集时,两种解法都是接受原假设,从而得出截然相反的检验结果.

假若从区间估计的角度分析,由已知条件,利用样本数据,可以算出,置信度为0.95的置信区间大约是(90,100),而所给样本数据中超过100的概率只有约5%.因而从数据来看,很难认为这天的维尼纶是合格的.区间估计与第二种推断方法结果相同,却与解法一大相径庭,其中的原因值得研究.

如果我们知道该厂的生产过程一直很稳定,装配工人技术娴熟,以往的检验很少有生产不正常的情况出现,被判定为不合格,犯错误的概率较大,则我们选择假设检验的解法一.尽管这次检验所给样本数据似乎不太理想,但经检验,我们还是有理由相信,这天的维尼纶是合格的.这时,若用区间估计的方法进行检验,则结论为这天的维尼纶是不合格的,检验并没有考虑到我们已有的非样本信息,因此该结论是不全面的.如果样本仅如例2所列,除此之外并无其他值得重点考虑的信息,则用区间估计检验,并据之判断,按区间估计的结果认为该认为这天的维尼纶是不合格的并无不当.因此,从例2的情况可知,区间估计与假设检验适用的情况应有所不同,而且假设检验中,在某些情况下,所得结论与原假设及备择假设的设定有关,这关乎单侧假设检验中原假设的设定原则问题,这里不再赘述.

综上所述,在常规情况下如果我们对问题的总体的某些非样本信息,如历史经验等有很多实际的了解,则应选取假设检验方法,如果我们对待检验问题除样本信息外的其他信息一无所知,则用区间估计方法检验较妥当,据此作出判断较客观,失误相对较少.总之,在学习和应用中,准确把握住数理统计中区间估计与假设检验这两种统计推断方法内在联系和区别是得出正确结论的关键,我们必须注意它们各自适用的范围和条件,这对作出正确的统计推断至关重要.

参考文献:

[1]邓集贤等.概率论与数理统计(下)[M].北京高等教育出版社,2009.

[2]茆诗松,王静龙.数理统计[M].上海华东师范大学出版社,1986.

[3]茆诗松等.高等数理统计[M].北京高等教育出版社,2000.

[4]杜世平.对区间估计与假设检验的关系的思考[J].西南民族大学学报,2005,31(3):339-341.

项目:吉首大学新开课程建设立项项目:2012KCB04,吉首大学教改课题:民族地区统计学专业应用型人才培养模式改革的理论与实践(2013JSUJGA13)

猜你喜欢
假设检验置信区间
定数截尾场合三参数pareto分布参数的最优置信区间
Maxwell分布参数的最短置信区间研究
p-范分布中参数的置信区间
多个偏正态总体共同位置参数的Bootstrap置信区间
定数截尾场合Pareto分布形状参数的最优置信区间
假设检验结果的对立性分析
一种求解假设检验拒绝域和计算p-值的系统化方法
列车定位中置信区间的确定方法
统计推断的研究
双幂变换下正态线性回归模型参数的假设检验