假设检验中的P值研究

2012-04-12 15:56
关键词:假设检验概率体重

杨 刚

(陕西理工学院 数学与计算机科学学院,陕西 汉中 723000)

常规的假设检验(又称为临界值法)是根据检验统计量落入的区域作出是否拒绝原假设的决策.在确定α后,拒绝域的位置也就相应确定.α是一个通用的风险概率,这是用域表示的缺点.但根据不同的样本结果进行决策,所面临的风险事实上是有差别的,为了精确反映决策的风险度,可利用P值进行决策.但许多统计学教材中关于P值的描述常常比较抽象、简要、零碎,所以对其进行比较详细、全面和深入的探讨是十分必要的.

1 P值的概述

1.1 P值的提出

假设检验理论的创立者Fisher在假设检验中首先提出了P值的概念.他认为假设检验是一种程序,人们依照这一程序可以对某一总体参数形成一种判断.换句话说,他认为假设检验是数据分析的一种形式,是人们在研究中加入的主观信息.

1.2 P值的计算

P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率[1].这种描述比较抽象和含混,下面这种描述就显得比较清楚:如果原假设为真,P值是抽样分布中大于或小于样本统计量的概率.当左侧检验时,P值为曲线上方小于检验统计量部分的面积;当右侧检验时,P值为曲线上方大于检验统计量部分的面积.P值被称为观察到的(或实测的)显著性水平.

一般用X表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据检验统计量X的具体分布,可求出P值[2].具体地说,左侧检验的P值为检验统计量X小于样本统计值C的概率,即P=P(XC);双侧检验的P值为检验统计量X落在样本统计值C为端点的尾部区域内的概率的2倍,即P=2P(X>C)(当C位于分布曲线的右端时)或P=2P(XC).

P值其实就是按照抽样分布计算的一个概率值,这个值是根据检验统计量计算出来的[3].通过P值,可以知道在P<α的情况下犯第一类错误的实际概率是多少.如果P>α,那么原假设不被拒绝,在这种情况下,第一类错误并不会发生.P值也可以说是拒绝原假设的最小显著性水平,或观察到的(实例的)显著性水平,或显著性概率.P值表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法.

1.3 P值的分布

通过对P值的进一步研究发现,P值实际上是一个随机变量,在无效假设(即原假设)H0成立的条件下,P值的分布服从区间[0,1]的均匀分布[4];在无效假设H0不成立的条件下,P值的分布不仅受样本含量n和检验功效1-β的影响,还受总体参数之差以及总体中个体变异的影响,因而理论上其分布较为复杂,不一定服从均匀分布.

1.4 2个概念的区分

P值是在H0成立的情况下,检验统计量X大于或小于样本统计量C的概率,而不是X大于或小于C条件下H0成立的概率[5].从条件概率的角度,前者可以表示为P=P(X>C或XC或XC或XC或X

2 P值法的优点和缺点

2.1 P值法的优点

P值法与临界值法处理问题的角度不同.P值法的核心是计算出现样本值或更极端值的概率,而临界值法则着重于比较检验统计量的值与临界值的大小[6].P值法比临界值法具有以下优点:

(1)P值法使用方便

在统计推断中,只要涉及假设检验问题,无论是参数的假设检验(如方差分析和回归分析),还是非参数的假设检验(如中位数检验、尺度检验和总体分布的检验),统计分析软件均会给出P值,从而可以很方便地得出是否拒绝H0的结论.在统计软件中输出的P值,有的用“P-value”表示,有的用“Sig.”表示.而在临界值法中常常需要查表求出临界值,这样比较麻烦.

(2)P值法的结论更加准确

在P值法中,P值本质上是在拒绝H0时犯弃真错误的概率.事实上,在利用P值法检验时,对于任何大于P的显著性水平α,均可以拒绝H0.在临界值法中,若拒绝了H0,则只知道犯弃真错误的概率不超过α,但确切的犯弃真错误概率并不知道,故P值法的结论更加准确.

2.2 P值法的缺点

(1)P值是假定原假设为真时所得到的样本观察结果或更极端结果出现的概率,并不是原假设为真的概率的估计值.

(2)由著名的Jeffreys—Lindley悖论可知,当样本容量很大时,由P值检验几乎总是得出拒绝原假设的结论.因此,当样本容量很大时P值并不太适用,几乎失效.

(3)对于多重假设检验问题,利用P值检验法也不好做出判断.对于P值检验法的不足之处,在实际工作中,可以借助贝叶斯学派的方法来弥补.

(4)P值在解决医学领域的某些问题时存在缺陷.在医学领域中,假设检验的P值虽然能提供精确的概率值,但提供的信息有限,常常仅能回答两组总体参数是否有差别,这种差别无统计学意义,不能回答临床医生更关心的差别程度和有无临床意义[7].而效应量的可信区间则能提供更多信息,同时能显示差别的大小及有无临床意义等.因此,应该把P值同可信区间的结果相结合,即同时报告P值和可信区间信息,这样的结果是才是完整和有效的,它将有助于临床医生结合专业知识得到相应的临床结论.

3 P值法的应用

3.1 利用P值进行决策

计算出P值后,将给定的显著性水平α与P值比较,就可做出检验的结论:如果αP值,则在显著性水平α下拒绝原假设.并且,P值越小,拒绝原假设H0的证据越充分;P值越大,不能拒绝原假设H0的证据越充分.其实,没有足够的证据拒绝原假设只表明原假设中的参数具有存在的合理性,不排除其他参数存在的可能性,一次检验仅仅表明某个参数值是否合理[8].在实践中,当α=P值时,也即统计量的值刚好等于临界值时,为慎重起见,可增加样本容量,重新进行抽样检验.

3.2 P值法应用实例

例:由统计资料得知,2008年某地新生儿的平均体重为3 190克,新生儿体重的标准差为80克,现在从2009年的新生儿中随机抽取100个,测得其平均体重为3 210克,问2009年的新生儿与2008年相比,体重有无显著差异?(α取0.05)

解:H0∶μ=3 190,认为2009年新生儿体重同2008年相比没有差异;

H1∶μ≠3 190,认为2009年新生儿体重同2008年相比有明显差异.

这是一个双侧检验问题,拒绝域位于分布曲线的两侧.

又由已知:α=0.05,n=100,σ=80,故这是一个大样本且σ已知的问题,故可以采用z统计量,它服从标准正态分布:

查表可得z分布在α/2处的分位数为zα/2=1.96,所以有z>zα/2,统计量落在了拒绝域,可以进行决策:在α=0.05的显著性水平下,有证据拒绝H0,从而接受H1,即认为2009年新生儿的平均体重同2008年相比有明显差异.

此题也可以由P值进行检验:

因为z=2.5,故由概率的几何意义有:0.5P=1-Φ(2.5)=1-0.993 8=0.006 2,故P=0.012 4,P<α,所以在α=0.05的水平上拒绝H0,有证据表明2009年新生儿的平均体重同2008年相比有明显差异.

4 结语

采用临界值法进行假设检验的优点是进行决策的界限清晰,但弱点是进行决策面临的风险比较笼统.采用P值进行决策可以精确地反映决策的风险度.在P<α的情况下,P值越小,拒绝原假设的理由越充分,故用P值进行假设检验的优点是很明显的.但在具体应用中,还应注意P值的缺点和该方法所使用的专业领域的特点,防止P值被滥用或误用.

参考文献:

[1] 贾俊平,何晓群,金勇进.统计学[M].4版.北京:中国人民大学出版社,2009:214-215.

[2] 樊冬梅.假设检验中的P值[J].郑州经济管理干部学院学报,2002,17(4):70-71.

[3] 韩志霞,张玲.P值检验和假设检验[J].边疆经济与文化,2006(4):62-63.

[4] James H,Robert T,Bauer P,et a1.The behavior of theP-value when the alternative hypothesis is true[J].Biometrics,1997(53):11-22.

[5] 吕佳,乔克林.浅谈假设检验中的P-值[J].科学技术与工程,2010,10(34):8494-8496.

[6] 侯志强,柴文义,宗明刚,等.P-值法及其应用[J].北方工业大学学报,2007,19(1):63-65.

[7] 康德英,王家良,洪旗,等.循证医学中统计结果的准确表达:P值与可信区间[J].华西医学,2000,15(4):402-403.

[8] 鲍贵,席雁.统计显著性检验:问题与思考[J].南京工程学院学报:社会科学版,2010,10(4):27-32.

猜你喜欢
假设检验概率体重
第6讲 “统计与概率”复习精讲
给鲸测体重,总共分几步
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
称体重
你的体重超标吗
统计推断的研究
双幂变换下正态线性回归模型参数的假设检验
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials