百分率χ2检验的应用条件

2015-02-20 06:12徐向宏
甘肃农业大学学报 2015年3期
关键词:样本容量概率论百分率

徐向宏

(甘肃农业大学生命科学技术学院,甘肃 兰州 730070)

百分率χ2检验的应用条件

徐向宏

(甘肃农业大学生命科学技术学院,甘肃 兰州730070)

摘要:百分率的χ2检验在农业科学数据分析中的应用非常普遍,但目前在应用条件上仍存有偏差.本文以一个总体的百分率P是否等于常数P0的χ2 检验为例,根据χ2检验模型的来历认为:应用的条件np≥5,nq=n(1-p)≥5,在实际应用时对应的应用条件应该是:m≥5,n-m≥5,而不仅仅是目前教科书的应用条件:np0≥5,nq0=n(1-p0)≥5.本结果将有助于研究人员在应用χ2检验避免偏差,得到更客观的统计结果.

关键词:百分率检验;χ2检验;应用条件

第一作者:徐向宏(1955-),男,副教授,研究方向为生物统计.E-mail:xuxh@gsau.edu.cn

Application conditions ofχ2 test on percentage

XU Xiang-hong

(College of Life Science and Technology,Gansu Agricultural University,Lanzhou 730070,China)

Abstract:The test on percentage is very common applied in data analysis of agricultural science,but there is still deviation in application conditions.In this paper,we took a example of making a comparison of the overall percentage P and the P0 constant,calculated whether two number were equal or not.According to the origin of χ2 model,the application conditions of np≥5,nq=n(1-p)≥5 should be corrected.In the actual application,the application condition should be :m≥5,n-m≥5,instead of the relevant content,np0≥5,nq0=n(1-p0)≥5 in the text book.The results will help researchers to avoid deviation in the application of χ2 test,and get more objective statistical results.

Key words:percentage test;χ2 test;application condition

1问题的提出

假设H0:p=p0,

(1)

(2)

(2)式是Yates.f的连续性校正模型.

现举例用np0≥5,np0≥5的应用条件[1-4]进行检验.假设总体P(A)=p=2%(实际中p的大小未知),现检验p与p0=5%差异是否显著.对于该问题,正确的统计结论应是差异显著.但在np0≥5,nq0=n(1-p0)≥5的应用条件下进行检验能否得出正确结论.

np0≥5,nq0≥5条件,

=3.789

χ2=3.789<3.84(或者显著性sig.=0.052>0.05)统计结论是总体百分率p与5%差异不显著.如用(2)式计算,χ2=3.184<3.84,统计结论同样是总体百分率p与5%差异不显著.

=4.737

因为χ2=4.737>3.84所以统计结论是总体百分率p与5%差异显著.如用(2)式计算,χ2=4.126>3.84,统计结论同样是总体百分率p与5%差异显著.

例2统计分析检验出了的总体p=2%与p0=5%的差异,而例1的统计分析没有检验出p=2%与p0=5%的差异,造成了统计结论的错误.同一总体的2个样本,都满足χ2检验条件,为什么例1检验的统计结论不正确,是否仅是样本容量小造成的,现直接用二项分布模型对例1进行检验.

假设H0:p=5%,抽样A出现的次数m~B(200,5%),m左尾5%的界是4.656,现m=4<4.656,小概率事件发生了,因此推翻假设,统计结论是p<5%.利用二项分布模型对例1进行检验也检验出了p=2%与p0=5%的差异,这一检验进一步说明例1用的统计结论错误不仅是样本容量小造成的.究其原因例1、例2统计结论的不同是由于χ2检验的应用条件造成.例1中m=4<5,不满足m≥5,n-m≥5的条件,而例2中m=5,n-m=245≥5,满足m≥5,n-m≥5的条件.现追溯该模型的来历,以确定应用的正确条件.

2百分率χ2检验来历

2.1χ2分布的定义

2.2二项分布近似正态分布的条件

2.3χ2检验模型

~χ2(df=1)

3百分率χ2检验正确的应用条件

即:χ2检验的应用条件是:m≥5,n-m≥5.

例3.对于例1,现加大样本容量n,n=250,m=5,n-m=245,都大于等于5,可用百分率的χ2检验.

=4.737,p=sig.=0.030

因为p=sig.=0.03<0.05,所以统计结论是总体百分率P与p0=5%差异显著,统计结论与实际相符.

在χ2检验应用的研究中,已有人发现当理论次数np0≥5,nq0=n(1-p0)≥5时,一般与χ2分布符合较好,否则有可能与χ2分布偏差变大[6-9].

综合上述,χ2检验的正确应用条件是:m≥5,n-m≥5;np0≥5,nq0≥5.

4讨论

本文以一个总体的百分率p是否等于常数p0 的χ2检验为例说明了百分率χ2检验应用条件是实际次数m≥5,n-m≥5;np0≥5,nq0≥5.关于百分率的χ2的其他检验的应用条件,如独立性检验、适合性检验等,也应是实际和理论次数均大于等于5.

这一研究结果与统计学研究前辈沈恒范老先生1966年编写的《概率论讲义》中指出的百分率χ2检验应用条件是:“通常取mi≥5”[10]一致.

参考文献

[1]李春喜,姜丽娜,邵云,等.生物统计学[M].4版.北京:科学出版社,2011

[2]周概容.概率论与数理统计[M].北京:高等教育出版社,1984

[3]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,1989

[4]盖钧镒.试验统计方法[M].北京:中国农业出版社,2008

[5]日本数学学会.数学百科辞典[M].北京:科学出版社,1984

[6]Sidney Siegel,N John Castellan Jr.Nonparametric Statistics for the Behavioral Sciences[M].2 Edition.Boston:Book-mark Press,1988

[7]陈世耀,赵耐青.临床科研统计方法与选择[J].中华消化杂志,2002,22(11):289

[8]陆运清.用 Pearson′s 卡方统计量进行统计检验时应注意的问题[J].统计与决策,2009(15):32-33

[9]丁宁,范大志,刘丽,等.配对四格表资料χ2检验在SPSS和SAS软件中的实现[J].中国医院统计,2014,21(2):92-93

[10]沈恒范.概率论讲义[M].北京:人民教育出版社,1966

(责任编辑胡文忠)

收稿日期:2014-09-10;修回日期:2015-03-16

中图分类号:F 302.5

文献标志码:A

文章编号:1003-4315(2015)03-0178-03

猜你喜欢
样本容量概率论百分率
数学实验在概率论与数理统计中的教学应用
求百分率的实际问题(部级优课)
采用无核密度仪检测压实度的样本容量确定方法
求百分率的实际问题(部级优课)
10%+10%为什么等于0.11
浅谈《概率论与数理统计》课程的教学改革
概率论方法在高等数学解题中的应用
分层抽样技术在课堂满意度调查中的应用研究
基于距平百分率的万源市气象干旱灰色预测
论《概率论与数理统计》教学改革与学生应用能力的培养