应用假设检验需特别注意的几个问题

2017-03-21 05:10
中华医学图书情报杂志 2017年5期
关键词:假设检验结论效能

, , , , ,

假设检验是医学科研中重要的推断方法,用于判断医学研究中通过样本观察到的“差别”是由抽样误差引起的还是因总体本身不同造成的。如为比较某新药与常规用药治疗婴幼儿贫血的疗效,将20名贫血患儿随机等分两组,分别接受两种药物治疗,结果测得两组血红蛋白增加量(g/l)的平均值分别为23.6和20.9。研究人员需借助假设检验判断观察到的“差别”是由抽样误差(即患儿个体的差异)引起的还是因总体本身不同(即两药物疗效不同)造成的。

假设检验是指对总体提出某种假设 ,然后利用从总体中抽样所得的样本信息检验所提假设是否正确的一种统计推断方法,在科学研究中应用非常广泛。但由于人们对假设检验的相关概念和方法理解不够深入和透彻,常会做出不准确甚至是错误的推断[1-2]。本文就参数假设检验选择单侧检验还是双侧检验、如何建立原假设和备择假设、检验结果的误判率有多大、如何提高检验效能等问题展开讨论、辨析,能够消除人们的疑惑,使假设检验发挥更好的作用。

1 两类错误、检验效能及误判率

对于任何一次假设检验,不论其结论是拒绝H0,还是接受H0,都有判断错误的可能,即可能犯两类错误。如在前面提到的比较两种药物治疗婴幼儿贫血的疗效的问题中,H0设为两种药物疗效无显著性差别,并取检验水准α=0.05,则当统计分析结果认为两药物疗效有显著性差别时会犯第一类错误,但犯第一类错误的概率很小,小于规定的检验水准0.05,即犯错的概率小于5%;当统计分析结果认为两药物疗效无显著性差别时会犯第二类错误,但犯第二类错误的概率未知。

第一类错误(也称Ⅰ型错误)是指拒绝了实际上成立的H0,其概率大小用α表示;第二类错误(也称Ⅱ型错误)是指接受了实际不成立的H0,其概率大小用β来表示。通常把1-β称为检验效能(也称把握度),其意义是当两个总体确有差别时,按规定的检验水准α能够发现该差别的能力[3]。如1-β=0.90,则意味着当H0不成立时,理论上在每100次抽样检验中,按照α的检验水准平均有90次能够得出差别有统计学意义的结论。

当样本含量一定时,不可能同时降低两类错误,减小α会导致β增大,而减小β又会导致α增大。要使α与β同时减小,则只有加大样本含量。

在给定样本含量的情况下,我们总是控制第一类错误的概率,使它不大于α,α通常取0.05、0.01等。这种只控制第一类错误的概率,而不考虑第二类错误的概率的检验称为显著性检验[4]。拒绝H0时认为差别显著,有统计学意义,误判率P<α;不拒绝H0时认为差别不显著,没有统计学意义,误判率未知。

2 单、双侧检验的选择

图1 t检验拒绝域示意图

3 原假设和备择假设的建立

因为假设检验只能控制第一类错误的概率α(拒绝H0可能犯的错误),即只规定了拒绝H0时的误判率要小于检验水准α(α通常取0.05或0.01),未控制第二类错误的概率β(接受H0可能犯的错误)。因此在实际应用时,为了通过假设检验对某一结论(如试验中发生的结果)取得科学的、强有力的支持,通常把这种结论本身作为备择假设H1,而将这一结论的逆命题作为原假设H0。这样,当假设检验的结果为拒绝H0而接受H1时,犯错误的概率很小(小于显著性水准α,即P<α)。因此有充分的理由接受H1,即对H1的结论给出了科学的、强有力的支持[5-6]。如生产线运行异常时需停产,会造成严重后果,需要有科学的、强有力的支持时才能停产,因此一般把生产线异常作为备择假设。下面通过实际例子进一步说明。

上面的例子说明,由于假设检验只能控制第一类错误的概率α,所以只有当检验结果拒绝H0而接受H1时,误判率才是已知的(为P<α),结论才具有科学性。因此应当把想要证实的结论作为备择假设H1,而将这一结论的逆命题作为原假设H0。

4 提高检验效能的途径

当假设检验结果为“不拒绝”原假设H0时,仅仅意味着样本数据与原假设不存在矛盾,并不意味着原假设应该被接受。这种情况很可能是由于样本太小等原因使得检验效能1-β不足,发现不了真实存在的差别,研究者切忌因此而放弃原有的观点,得出组间“无差别”的结论。“不拒绝”不等于“接受”,当相关专业知识或经验支持“有差别”的猜测时,可通过加大样本含量降低二类错误的概率β,提高检验效能1-β。当然,也可以适当增大一类错误的概率α,以减少二类错误的概率β,从而达到提高检验效能1-β的目的。

在“风险”决策中, 对“风险”的处理依赖于决策者的价值判断。若要严格控制一类错误的概率α,就只能通过加大样本含量来提高检验效能。实际上,如果总体确有差别,那么对于小样本试验,总体差别大假设检验结果也不一定有统计学意义;而对于大样本试验,总体差别小假设检验结果也可以有统计学意义。需要说明的是,差别有统计学意义不一定有实际意义。如某新药比常规用药的有效率仅提高了1%,没有临床意义,但只要样本量足够大,假设检验就一定能得出差别有统计学意义的结论[3]。

5 科研论文中假设检验应用常见的问题

5.1 未说明所用的假设检验方法的名称

不少利用假设检验进行数据分析的科研论文中都未说明所用的假设检验方法的名称,只简单地给出了P值。例如文献[7]和[8],读者无法考察作者所选假设检验方法是否正确、统计计算结果是否正确等,因此也无法判断作者给出的结论的科学性。一般而言,科研论文中若用到了假设检验方法就应该说明具体的方法的名称,例如2检验,t检验,F检验等[9]。当一篇论文中用到一个以上的统计分析方法时,还应对每个统计结果所用的统计方法加以说明[10]。

5.2 样本量小导致假设检验结论的科学性差

样本量太小是导致假设检验效能较低、假设检验结论科学性差的重要因素之一,但这种情况在科研论文中并不少见。如文献[7]抽取了科研教育组用户67人、企业组用户23人,并对两组人员的生物医药信息来源及信息交流方式进行了统计分析,结果均为差异无统计学意义(P>0.05)。

由于是计数资料,比较的是相对数指标百分比,样本太小时(尤其是企业组用户仅抽取了23人)计算出的百分比不能正确地反应对应总体的真实情况,假设检验效能较低,假设检验结果的可信度较差,即差异无统计学意义(P>0.05)的结论的科学性较差。

6 结语

进行假设检验前,应该先分析样本数据所提示的总体间的差异在专业上或实际中是否有意义。如果有意义,再进行检验;如果没有意义,就不必再作检验了,因为不论检验结果如何,都是无价值的。

运用假设检验要正确设置原假设和备择假设,应该把想要证实的结论作为备择假设,因为假设检验能够检验备择假设的真实性而不能验证原假设的真实性。假设检验结果的正确性是以概率为保证的,不论拒绝或不拒绝检验假设都可能发生错误,应结合专业知识下结论。当假设检验结果为差异无统计学意义时要慎重下组间无差异的结论,因为此时有可能是因为样本太小,假设检验效能较低,无法测出存在的差别。必要时可通过加大样本量降低两类错误的概率,提高假设检验结果的科学性。

猜你喜欢
假设检验结论效能
由一个简单结论联想到的数论题
迁移探究 发挥效能
立体几何中的一个有用结论
充分激发“以工代赈”的最大效能
假设检验结果的对立性分析
统计推断的研究
凤爪重量质量管理报告
结论
基于改进隐马尔科夫模型的畜禽全基因组关联分析中的多重检验方法
唐代前后期交通运输效能对比分析