李俞利,胡宏昌
(湖北师范大学 数学与统计学院,湖北 黄石 435002)
序贯方法的特点是:在抽样时不预先指定子样的容量,而是要求给出一组停止采样的规则。每新抽取一个子样后立即考察一下,按给定的停止采样规则来决定是停止采样还是继续采样,如果采样一旦停止,就按此时所给出的n个观察作为一个固定子样容量的问题进行统计推断——参数估计或假设检验。应用序贯方法进行的检验,称为序贯检验。序贯分析奠基人瓦尔德(A.Wald)提出的“序贯概率比检验”(参见文献[1])至今仍然是序贯分析中很重要的领域,成果丰硕,如:文献[2]系统地讨论了序贯分析的检验和置信区间等问题;文献[3]利用广义序贯概率比检验方法研究了两个不同分布族的检验问题;文献[4]深入阐述了二元响应模型的序贯概率比检验统计量与分类证据之间的关系。关于序贯检验的应用成果参见文献[5~7]等,其它相关成果参见文献[8~9]等。文献[10]提出了具有稳健性的Lq似然比型(简记为LqRT)检验方法,得到了检验统计量的渐近分布。本文基于序贯概率比检验和LqRT检验方法,首次提出了序贯Lq似然比型检验方法,并对其进行初步研究。
设ξ1,ξ2,…,ξn是取自总体ξ独立同分布的随机变量序列,ξ的概率函数为f(x;θ),x=(x1,x2,…,xn)为样本观测值,Θ0和Θ1为原假设和备择假设的参数空间,则LqRT检验的统计量(参见文献[11])为
(1)
(2)
对此简单假设检验的序贯问题,类似于序贯概率比检验方法,我们提出了序贯LqRT检验法,其实施的步骤是:
设x1是子样的第一个观察,计算λ1(x1),如果λ1(x1)≥B,则停止观察,并拒绝原假设H0;相对地,如果λ1(x1)≤A,则停止观察,并接受原假设H0;最后,如果A<λ1(x1)
类似地计算λ2(x1,x2),如果λ2(x1,x2)≥B,则停止观察,并拒绝原假设H0;相对地,如果λ2(x1,x2)≤A,则停止观察,并接受原假设H0;最后,如果A<λ2(x1,x2)
如果由n-1个观察不能作出停止继续观察并拒绝或接受假设H0的决定,则继续抽取第n个观察xn,并计算λn(x1,…,xn).如果λn(x1,…,xn)≥B,则停止抽样并拒绝H0;如果λn(x1,…,xn)≤A,则停止抽样并接受H0;最后,如果A<λn(x1,…,xn)
这一检验假设的全过程称为序贯LqRT检验,其停止法则是τ*=inf{n∶≥1,λn∉(A,B)}.这里两个边界A和B(A
(3)
(4)
在这里,子样x是一个无限观察序列x=(x1,x2,…).如果N(x)=n,则它表示对这个无限子样序列只需进行n次观察,获得(x1,x2,…,xn)后采样就终止。且基于这n个观察进行统计推断,如果λn(x1,…,xn)≥B则拒绝H0;如果λn(x1,…,xn)≤A则接受H0.如果N是一个以概率1终止的停止规则,即P{N<∞}=1,则它表示对几乎所有的子样序列x只需作有限次观察后采样终止。
本节研究序贯LqRT检验的性质。若记
Z=Lqf(ξ,θ1)-Lqf(ξ,θ0)-C(θ1,q)+C(θ0,q),
Zi=Lqf(ξi,θ1)-Lqf(ξi,θ0)-C(θ1,q)+C(θ0,q).
则随机游动Z1,Z2,…也是独立同分布随机序列,且有
(5)
首先给出边界A,B与强度(α,β)之间的关系,利用它可以决定检验的边界。
定理1 如果一个以概率1终止的序贯LqRT检验,其停止边界为A,B,强度为(α,β), 则当q→1时有
A≥log(β/(1-α)),B≤log((1-β)/α),0<α,β<1.
(6)
证明 注意到当q→1时,Lq(u)→logu.于是当λn(ξ1,…,ξn)≥B时,有
(7)
所以对于很小的δ>0,当q∈U(1,δ)时, 有
(8)
Cn={(ξ1,…,ξn)∶N=n,λn(ξ1,…,ξn)≤A},则{ωn}和{Cn}均是互不相容事件,于是
(9)
由于假定它以概率1终止,所以
Pθ1{拒绝H0}=1-β.
(10)
故由(9)和(10)式得α≤e-B(1-β).
类似地,有
(11)
至此结论证毕。
由于α,β一般较小,所以我们可以假定A A≈log(β/(1-α)),B≈log((1-β)/α). (12) 类似于序贯概率比检验的证明方法,可以得到序贯LqRT检验的一些结论,这些结论推广和类似于序贯概率比检验的相应结论。下面我们只列出部分结论,在此略去其证明,定理2~3的证明参见文献[2]。 定理2 设ξ1,ξ2,…是一列独立同分布的随机变量,在假设Hi(i=0,1)之下其概率密度分别为f(x;θi),记N是所考察的序贯LqRT检验的停止随机变量,则对于使得Pθ{|Z|>0}>0的任何概率密度f(x;θ),有 1)Pθ{N<∞}=1; 2)存在t0>0,使Eθ{etN}<∞,对-∞ E(SN)=E(g(ξ1))·EN. Eθi(SN)≈Pθi{接受H0}A+Pθi{拒绝H0}B.,i=0,1. 因此如果Eθi|Z|<∞,EθiZ≠0,由定理3得 (13) 设母体ξ服从Bernoulli分布b(1,p),p是未知参数,检验H0∶p=p0⟺H1∶p≠p0. 由于b(1,p)分布的概率密度函数为f(x;p)=px(1-p)1-x,因此对于q≠1有 (14) 如令vn为n个观察的序列中“1”的频数,则 =aqvn+cqn. (15) 其中 如果它的停止边界分别为A,B,则当 Sn=aqvn+cqn≥B (16) 成立时拒绝原假设H0;当 Sn=aqvn+cqn≤A (17) 成立时接受原假设H0.由于 =cq+paq. (18) 所以由(13)和(18)式可得 (19) 现在考虑一个抽样问题,用p表示这批被验产品的次品率,假定p0=0.04,p1=0.10,α=0.05,β=0.10,则由(12)式得 A≈ln(β/(1-α))=ln1/9.5=-0.9777,B≈ln((1-β)/α)=ln18=1.2553. 注意到 因此取不同的q值代入(13)式可得到平均子样容量(有关计算结果见表1): n=2-1(E0.04(N)+E0.10(N)), 其中 从表1可知,当q越大,平均样本容量越小。但是,我们的理论结果是在|q-1|较小的条件下得到,因而在实际应用中需要兼顾|q-1|和平均样本容量的大小,使得二者均较小。在q=1.01时,平均子样容量为23比序贯概率比检验的平均子样容量71要小得多,抽样个数可节约近67.6%. 表1 q值与平均子样容量及νn的边界的关系 上面研究了序贯Lq似然比型检验方法边界与强度之间的关系,进而得到了在Eθi|Z|<∞,EθiZ≠0情况下该检验方法的平均子样容量,并通过实际的算例说明了在选取合适的q值时,序贯Lq似然比型检验方法优于序贯概率比检验方法。虽然在某种程度上丰富了序贯Lq似然比型检验的内容,但是对于序贯Lq似然比型检验的研究不仅限于此,本文仅考虑了一种情况下的平均子样容量,内容还不够完善,为了得到完整的结论还需进一步的研究。 Sequential Lq-Likehood ratio type test and its applications LI Yu-li,HU Hong-chang3 模拟算例
3.1 Bernoulli分布中参数p的检验
4 结论