郭三刚, 张 琳
(陕西理工大学 数学与计算机科学学院, 陕西 汉中 723000)
假设检验是基于小概率事件推理原理,以在总体上的两个相互对立假设之间做出统计抉择的理论和方法。小概率事件推理原理必须与假设检验结合起来才能正确使用,否则将会产生错误[1]。
假设检验中有两个假设:零假设H0(Null Hypothesis)和备择假设H1(Alternative Hypothesis),后者是检验者需要证实的假设,前者是检验中需要被检验的假设,是与备择假设对立的假设。通常,零假设和备择假设由单个总体或多个总体某个或某些参数(数学期望或者方差)等之间的大小关系表示。令θ是上述参数构成的标量或向量,Θ0和Θ1分别表示零假设H0和备择假设H1为真时所对应的参数θ的取值集合[2]。
零假设和备择假设都有两种类型:简单假设和复合假设。为了正确使用小概率事件推理原理,零假设和备择假设必须是互为对立的假设。但是,现行的教科书[2-4]有时使用不是互为对立的零假设和备择假设,在逻辑上是错误的。
假设检验中,首先要有一个区分零假设和备择假设差异性的数值指标T,它是来自于总体的简单随机样本的函数,称为检验统计量。检验统计量应当是零假设是否为真的灵敏标记。在零假设为真时,检验统计量的概率分布或近似分布是可知的,称为零分布[5]。
假设检验是基于小概率事件推理原理的,即在一次随机试验中,小概率事件几乎是不可能发生的,如果发生了则它很可能不是小概率事件。假设检验是如何利用小概率事件推理原理呢?首先,构造小概率事件,即给定小概率α(也称为显著性水平),在零假设H0为真时构造小概率事件Aα,使得对于任意的θ∈Θ0,有[3]
P(Aα)≤α。
通常,在零假设为真时求检验统计量T的数学期望(假定T的方差也存在),根据切比雪夫不等式,可以证明T的值不可能远离其数学期望太多,远离太多的概率是很小的。这是我们确定小概率事件Aα的结构和最终形式的理论基础。小概率事件Aα对应的检验统计量T的取值区域称为零假设为真时零假设的拒绝域,记为R(lbα1,ubα2),其中α1、α2分别称为左、右侧显著性水平。
下面根据前面对小概率事件结构的分析介绍拒绝域的结构和系统化求解方法。
(i)双侧假设检验的拒绝域:如果零假设H0为真时T的值不能太大也不能太小,则零假设H0的拒绝域具有形式:
R(lbα1,ubα2)=(-∞,lbα1]∪[ubα2,+∞),
其中α1≤α/2,α2≤α/2,相应的检验称为双侧假设检验,且P(T≤lbα1)≤α1,P(T≥ubα2)≤α2。
(ii)左侧假设检验的拒绝域:如果零假设H0为真时,T的值不能太小,则拒绝域具有形式(-∞,lbα1],其中α1≤α,相应的检验称为左侧假设检验,且P(T≤lbα1)≤α1。
(iii)右侧假设检验的拒绝域:如果零假设H0为真时,T的值不能太大,则拒绝域具有形式[ubα2,+∞),其中α2≤α,相应的检验称为右侧假设检验,且P(T≥ubα2)≤α2。
特别地,当假设检验为双侧、且检验统计量T为连续型时,取α1=α2=α/2,否则当检验统计量T为离散型时,取α1≤α/2,α2≤α/2,且α1、α2尽可能接近α/2;当假设检验为左侧、且检验统计量T为连续型时,取α1=α,否则当检验统计量T为离散型时,取α1≤α,且α1尽可能接近α;当假设检验为右侧、且检验统计量T为连续型时,取α2=α,否则当检验统计量T为离散型时,取α2≤α,且α2尽可能接近α。
根据拒绝域的上述定义,小概率事件Aα可以表示为
Aα={T|T∈R(lbα1,ubα2)}。
在假设检验中,势必会犯两类错误:零假设H0为真却被拒绝,其概率不大于给定的显著性水平α;零假设H0为假而却被接受,其概率记为β,计算公式为
通常一个好的假设检验方法,犯第一类错的概率P(Aα)要较小,即小于预先给定的显著性水平α,另外,犯第二类错误的概率β也要较小。但是,简单的分析发现这两者不能都小,关于如何计算和控制犯两类错误的概率有较多的文献讨论[8-11]。
检验统计量T选好以后,关键的步骤是如何获得小概率事件,即零假设H0为真时零假设的拒绝域所对应的事件。文献[2,3,5]都没有给出拒绝域的系统化求解方法。为了求拒绝域,文献都是将可能是复合假设的零假设变成简单假设来做,这破坏了利用小概率事件推理原理的逻辑基础。再如马世荣[12]给出零假设拒绝域的一种模式化求解方法,但也同样破坏了零假设可能是复合假设的现实。姜淑美[13]利用Neyman K. Pearson定理推导出单个正态总体均值或方差的单侧假设检验中拒绝域的一种方法,但在求解过程中也将复合的零假设简化为简单假设处理,且方法过于复杂。冯予等[14]给出了二点总体中未知参数p的双侧假设检验的基本方法和泊松总体参数λ的单侧假设检验,但仍将单侧假设检验中复合的零假设改为简单假设求解拒绝域。曹晓刚等[15]给出了单个正态总体均值的假设检验拒绝域一种分析求解方法,但没有给出一般、可推广性的系统化方法。罗荣华等[16]从抽样误差极限的角度提出了假设检验的一种新思维,仅考虑正态总体均值的三种假设检验,用观察法给出零假设为真时其拒绝域的形式,没有给出系统化求解方法。
本文给出了一种基于最优化方法求解零假设为真时其拒绝域和计算p-值的系统化求解方法。这种方法对零假设中的任意参数θ∈Θ0,使得事件Aα={T|T∈R(lbα1,ubα2)}总是小概率事件,且满足:
P(Aα)=P(T∈R(lbα1,ubα2))≤α。
通常,要将文字描述的零假设和备择假设抽象成用总体参数表达的等式或不等式的形式,一般地,有三种形式的零假设和备择假设
H0:θ=θ0,H1:θ≠θ0;H0:θ≤θ0,H1:θ>θ0;H0:θ≥θ0,H1:θ<θ0;
通常,双侧假设检验的检验统计量T的分布不依赖于任何未知参数,即T的分布类型和分布函数是确定的。假定检验统计量T的数学期望ET和方差DT都存在。假定三种零假设为真时,检验统计量T的数学期望依次满足:ET=m0,ET≥m0,ET≤m0,这里m0为常数。然后,依此条件得到零假设为真时零假设的拒绝域的结构类型。
知道了零假设为真时其拒绝域的结构类型,那么给定显著性水平α,以及左右侧显著性水平α1和α2,就可以给出拒绝域R(lbα1,ubα2)的一种系统化求解方法。
分别就双侧、左侧和右侧假设检验讨论零假设为真时其拒绝域的系统化求解方法。
2.1.1 双侧假设检验
根据假定:双侧假设检验零假设为真时,检验统计量T的概率分布不依赖于任何未知参数,故∀(θ,θ0)∈Θ0,T的分布是相同的。于是,有
P(T∈R(lbα1,ubα2))=α,
即P(T≤lbα1)=α1,P(T≥ubα2)=α2,
查检验统计量T的概率分位数表或者设法计算,协调地找到临界值lbα1和ubα2,且lbα1要尽可能地大,ubα2要尽可能地小。
2.1.2 左侧假设检验
选择α1=α,按照下式求解零假设H0的拒绝域:
(1)
2.1.3 右侧假设检验
选择α2=α,按照下式求解零假设H0的拒绝域:
(2)
分别就双侧、左侧和右侧假设检验讨论零假设H0为真时其拒绝域的系统化求解方法。
2.2.1 双侧假设检验
根据假定:双侧假设检验的检验统计量T的分布不依赖于任何参数,故∀(θ,θ0)∈Θ0,T的分布是相同的。于是,有
P(T≤lbα1)=α1,P(T≥ubα2)=α2,
查检验统计量T的概率分位数表或者设法计算,协调地找到临界值lbα1和α1,ubα2和α2,使得lbα1要尽可能地大,ubα2要尽可能地小。
2.2.2 左侧假设检验
选择α1≤α,且α1尽可能接近α,按照下式求解零假设H0的拒绝域:
(3)
2.2.3 右侧假设检验
选择α2≤α,且α2尽可能接近α,按照下式求解零假设H0的拒绝域:
(4)
2.1—2.2节的系统化方法求解的拒绝域保证了零假设H0为真时所有参数(θ,θ0)∈Θ0对应的事Aα={T|T∈R(lbα1,ubα2)}都是小概率事件。
事实上,无论检验统计量是连续型还是离散型,都有:
(1)对双侧假设检验,∀(θ,θ0)∈Θ0,有
(5)
(2)对左侧假设检验,∀(θ,θ0)∈Θ0,有
(6)
(3)对右侧假设检验,∀(θ,θ0)∈Θ0,有
(7)
上述计算p-值的系统化方法能够保证p-值检验的完备性,下面以定理给出并证明之。
定理上述计算p-值的系统化方法能够保证p-值检验的完备性,即根据p-值和给定的显著性水平α的相对大小,可以在零假设H0和备择假设H1之间做出抉择,即如果p-值大于α,则接受零假设H0;如果p-值小于或等于α,则拒绝零假设H0而接受备择假设H1。
证明下面就双侧、左侧和右侧假设检验分别证明。
(I)双侧假设检验。再分两种情况讨论。
(i)如果P(T≥tobs)=min{P(T≥tobs),P(T≤tobs)},则p=2P(T≥tobs)。
如果p≤α,我们要证明tobs∈R(lbα1,ubα2)。不然,设lbα1 (8) (ii)如果P(T≤tobs)=min{P(T≥tobs),P(T≤tobs)},则p=2P(T≤tobs)。 如果p≤α,我们要证明tobs∈R(lbα1,ubα2)。不然,设lbα1 (9) (II)左侧假设检验。如果 且零假设为真时其拒绝域为R(lbα1,ubα2)=(-∞,lbα1]。那么,根据小概率事件推理原理以及p-值与给定的显著性水平α之间的相对大小,在零假设H0和备择假设H1之间做出统计推断。 事实上,如果p>α,即 故tobs>lbα1,即检验统计量T的观察值tobs落入了零假设H0为真时的接受域,故接受零假设H0而拒绝备择假设H1。 如果p≤α,则如果tobs>lbα1,则 (III)右侧假设检验。如果 且零假设为真时其拒绝域为[ubα2,+∞)。那么,根据小概率事件推理原理以及p-值与给定的显著性水平α之间的相对大小,在零假设H0和备择假设H1之间做出统计推断。 事实上,如果p>α,则 故tobs 如果p≤α,则如果tobs 证毕。 定理表明:按照本文所提出的计算p-值的系统化方法保证了p-值决策的完备性。p-值决策的完备性蕴含着一种假设检验方法,即给定显著性水平α,依据p-值与显著性水平α的相对大小对零假设和备择假设做出统计推断。 限于篇幅,关于拒绝域和p-值的系统化求解方法的应用将另文介绍。 本文详细介绍了假设检验的基本理论与方法,将求解零假设拒绝域的问题转化为一个最优化问题,提出了一种求解零假设拒绝域和计算p-值的系统化方法,该方法能够保证所得到的拒绝域对零假设为真时的所有参数对应的事件都是小概率事件;另外,证明了p-值的系统化计算方法保证了p-值检验的完备性。4 小 结