南方医科大学公共卫生与热带医学学院生物统计学系(510515) 张惠风 段重阳 陈方尧 陈平雁
样本量估计及其在nQuery和SAS软件上的实现*
——率的比较(四)
南方医科大学公共卫生与热带医学学院生物统计学系(510515) 张惠风 段重阳 陈方尧 陈平雁△
*教育部重点课题(DIA070113)
△通讯作者:陈平雁
2.1.1.1 两组构成比检验
方法:Lachin(1977)〔4〕提出的两组构成比的样本量估计是建立在自由度为c-1,非中心参数为2NΔ2的非中心χ2分布基础上。检验效能计算公式为
式中,π1j和π2j分别是两组第j类的总体构成比;Δ2为效应量;c为分类数;n为每组样本量。样本量可以用循环逼近的方法根据式(2-28)求得。
〔例2-12〕某研究欲验证A、B两种基因标记物是否与两种炎性肠病(Crohn's病和溃疡性结肠炎)有关。预实验的结果如表2-4所示。如果每组样本量为40例,试计算检验效能是多少。
表2-4 两种基因标记物在两种肠病中显示的构成
nQuery Advisor 7.0实现:设定检验水准 α=0.05;c=4;n=40。在nQuery Advisor 7.0主菜单选择:
方法框中选择:Two-group Chi-square test comparing
proportions in C categories.
注意,首先应根据两组每类构成比对效应量Δ2进行估计,在菜单栏中选择:
Assistants:⊙Compute Effect Size
弹出辅助计算窗口。依据上述基础数据,在弹出的计算窗口将各参数值键入,如图2-27所示,结果为Δ2=0.194。
图2-27 nQuery Advisor 7.0关于例2-12样本量估计中效应量的计算结果
在弹出的检验效能计算窗口将各参数值键入,如图2-28所示,结果为1-β=0.92。
图2-28 nQuery Advisor 7.0关于例2-12样本量估计的参数设置与计算结果
SAS9.2软件实现:
SAS运行结果见图2-29。
2.1.1.2 CMH 检验
方法:Nam(1992)〔10〕提出二分类CMH检验的样本量估计公式为
图2-29 SAS9.2关于例2-12样本量估计的参数设置与计算结果
其中,π1c和π2c分别为对照组和试验组第c层(c=1,2,…k)的阳性率;OR为公共比值比;fc为第c层占的比。
〔例2-13〕某项临床试验欲验证一种预防夜间胃灼痛的新药疗效是否优于安慰剂。由于身体质量指数(BMI)可能对治疗的反应率有影响,故本试验根据BMI进行分层设计,各层的比例按照目标人群的分布,即BMI<25的为35%,25≤BMI<30的为45%,BMI≥30的为20%。根据以往研究报道,对照组各层阳性事件发生率分别为0.5、0.4、0.3,试验组相对于安慰剂组的公共OR值为1.6,试估计检验效能为90%时的样本量。
nQuery Advisor 7.0实现:设定检验水准α=0.05;分层数k=3;1-β=0.9;采用双侧检验,即取s=2。
在nQuery Advisor 7.0主菜单选择:
方法框中选择:Mantel-Haenszel(Cochran)test。
注意,首先应根据总体各层阳性事件发生率和在总体中各层占的比对D1、V0和V1进行估计,在菜单栏中选择:
Assistants:⊙Compute Effect Size
弹出辅助计算窗口。依据上述基础数据,各层占比分别为0.35、0.45、0.20,各层对照组的阳性率分别为0.50、0.40、0.30,在弹出的计算窗口将各参数值键入,如图2-30所示,结果为D1=0.114、V0=0.244、V1=0.240。
在弹出的检验效能计算窗口将各参数值键入,如图2-31所示,结果为n=393。
SAS9.2软件实现:
图2-30 nQuery Advisor 7.0关于例2-13样本量估计中效应量的计算结果
图2-31 nQuery Advisor 7.0关于例2-13样本量估计的参数设置与计算结果
SAS运行结果:
图2-32 SAS9.2关于例2-13样本量估计的参数设置与计算结果
2.1.1.3 校正CMH检验
方法:Nam(1992)〔10〕同时给出了校正CMH检验的样本量估计公式,
式中,n'为校正CMH检验的样本量,n为根据式(2-29)求得的样本量。
2.1.2 等效性检验
2.1.2.1 两样本率比较的等效性检验
方法:Machin & Campbell(1987)〔7〕提出的两样本率的等效性检验的样本量估计建立在正态近似的基础上,其公式为
式中,πS是对照组的总体阳性率;πT是试验组的总体阳性率;Δ1=πT-πS;Δ0是等效性界值,其符号由试验组与对照组阳性率之差的符号决定。
〔例2-14〕某临床试验欲对一款新研发的人工髋关节进行临床验证。试验采用非劣效验证,以目前临床应用最多的一款人工髋关节为对照。据以往研究报道,使用现有人工髋关节进行髋关节置换,两年成功率在90~95%。我们假定两年成功率的非劣效界值为-0.05(试验组-对照组),并预期试验组的两年成功率与对照组相等。如果我们用平衡设计,设定检验水准为0.05,检验效能为85%,试计算样本量。
nQuery Advisor 7.0实现:设定检验水准 α=0.025(等效性检验取双单侧界值,等价于双侧的0.05);1-β=0.85。
在nQuery Advisor 7.0主菜单选择:
方法框中选择:Two group test of equivalence in proportions。
在弹出的样本量估计窗口将各参数值键入,如图2-33所示,如果试验组的两年成功率为90%,则所需样本量为647例;如果为95%,则样本量为342例。
图2-33 nQuery Advisor 7.0关于例2-14样本量估计的参数设置与计算结果
SAS9.2软件实现:
SAS运行结果:
图2-34 SAS9.2关于例2-14样本量估计的参数设置与计算结果
2.1.2.2 基于非劣效下限的检验(试验组-对照组)
方法:Newcombe(1988)〔11〕提出的两样本率比较的等效性或非劣效验证的样本量估计是基于可信区间的方法,通过模拟实现的。首先模拟产生四格表资料,然后使用Newcombe-Wilson score的连续校正方法计算观察可信区间,如果该区间的下限小于事先所确定的非劣效下限,则记为成功,然后将总的成功次数除以总的模拟次数就是所需要的检验效能。计算公式如下:
l1和u1是关于 π1的方程 |π1-a/m|=z1-α/s的根,l2和u2是关于π2的方程|π2-的根。
式中, θ为总体率差θ=π1-π2的估计值,m和n分别是两组的样本量,a和b分别是两组的阳性例数,π1和π2分别是两总体率。
〔例2-15〕以例2-14为例,试根据非劣效界值的下限为-0.05估计样本量。
nQuery Advisor 7.0实现:设定单侧检验水准α=0.025;模拟次数5100次;随机数种子35。在nQuery Advisor 7.0主菜单选择:
方法框中选择:Two group test of equivalence in proportions(using Confidence Interval)。
在弹出的检验效能计算窗口将各参数值键入,如图2-35所示,如果试验组的两年成功率为90%,则所需样本量为658例;如果为95%,则样本量为369例。
图2-35 nQuery Advisor 7.0关于例2-15检验效能估算的参数设置与计算结果
SAS9.2软件实现:
SAS运行结果:
图2-36 SAS9.2关于例2-15样本量估计的参数设置与计算结果
2.1.2.3 基于非劣效上限的检验(试验组-对照组)
方法:将上述基于非劣效下限检验改为上限,这里就不赘述。
2.1.2.4双单侧等效性检验(试验组-对照组)
方法:将两样本率比较基于非劣效下限检验和上限检验的样本量估计结合在一起就是所谓的双单侧等效性检验。
〔例2-16〕以例2-14为例,应用Newcombe-Wilson Score方法估计样本量。
nQuery Advisor 7.0实现:设定单侧检验水准α=0.025,则双侧为0.05;模拟次数5100次;随机数种子35。在nQuery Advisor 7.0主菜单选择:
方法框中选择:Two group test of equivalence in proportions(using Confidence Interval)Two sided confidence interval for πT-πS。
在弹出的样本量计算窗口将各参数值键入,如图2-37所示,如果试验组的两年成功率为90%,则所需样本量为843例;如果为95%,则样本量为466例。
图2-37 nQuery Advisor 7.0关于例2-16样本量估计的参数设置与计算结果
SAS9.2软件实现:
SAS运行结果:
图2-38 SAS9.2关于例2-16样本量估计的参数设置与计算结果