南方医科大学生物统计学系(510515)
黄耀华 唐欣然 段重阳 陈平雁△
两组率同为100%或0%时率差置信区间估计的SAS实现*
南方医科大学生物统计学系(510515)
黄耀华 唐欣然 段重阳 陈平雁△
目的 通过SAS编程实现两组事件发生率均为0%或100%时率差置信区间的估计。方法 针对事件发生率均为100%或0%时率差置信区间的估计问题,采用SAS9.4编程,使置信区间估计的Miettinen Nurminen法、Newcombe-Wilson法及校正Newcombe-Wilson法等三种方法得以实现,并通过实例进行说明。结果 所编程序实现了三种方法的置信区间估计,便于专业和非专业人员使用。实例中两组样本量分别为59,56,结果两组事件发生率均为100%,三种方法的95%置信区间:Miettinen Nurminen法为[-6.16%,6.47%];Newcombe法为[-6.11%,6.42%];校正Newcombe法为[-7.62%,8.00%]。结论 本文所提供的SAS宏程序可以简便地实现两组事件发生率均为0%或100%时三种常用的率差置信区间的估计方法。
率差置信区间 SAS宏程序 Newcombe法 Miettinen Nurminen法
医学研究领域,有时会遇到一种极端的结果,即两个比较组的事件发生率均为100%或0%,如CT成像的优良率、关节置换的成功率、使用脑膜贴片的脑脊液渗漏率等,此时两组的率差为0。目前,常用的两组事件发生率均为100%或0%时率差的置信区间估计方法有三种,分别是Miettinen Nurminen法[1]、Newcombe法和校正Newcombe法[2-4]。然而,最新版本的SAS软件尚未提供上述三种方法的计算模块,既不便于专业人员的操作,又阻碍了非专业人员的应用。因此,本研究将编制SAS 9.4宏程序,为此种类型的数据处理提供方便可靠的工具。
1.Miettinen Nurminen法
若用x1、x2分别表示两组的事件数,p1、p2为两组事件发生率,n1,n2分别为两组样本量,N=n1+n2为总样本。对于率差θ,Miettinen Nurminen法[1]先构建如下统计量:
其中
L0=x2θ(1-θ),L1=(n2θ-N-2x2)θ+x1+x2
L2=(n1+2n2)θ-N-x1-x2,L3=N
率差置信区间(L,U)分别为如下两个等式的解:
L:TMN=-zα/2
U:TMN=zα/2
Newcombe[2]对上述算法重新表示为如下表达式:
2.Newcombe-Wilson法
Newcombe-Wilson方法已被FDA指南推荐,作为差置信区间计算方法的首选[2-5]。其计算方法是通过Wilson法分别得到两单样本率的可信区间上下限[3]。Wilson法单样本率置信区间上下限为等式
式中q=1-p。Newcombe-Wilson法通过杂交方式构建出率差置信区间上下限(L,U)如下:
其中l1,u1,l2,u2分别为两组率Wilson得分方法计算得到的置信区间上下限[2-4]。
3.校正Newcombe-Wilson法
连续校正Newcombe-Wilson得分方法相对较为保守[2-3],其率差计算公式杂交方法同Newcombe-Wilson得分方法,区别在于Wilson单组置信区间的计算公式有所调整,采用了连续性校正后的结果,具体计算公式为
连续校正方法因单组率计算的调整而增加可信区间的宽度,从而更加保守地估计组间差异[2-4]。
%macroratediff(n1=,n1_event=,n2=,n2_event=,alpha=,side=);
/* 近似正态方法1,此方法无法计算两组率均100%率差,因此将两组率保守设为99% */
dataCMHChisq;
n1=&n1.;p1=0.995;
n2=&n2.;p2=0.995;
d=p1-p2;
l_diff=d-probit(1-&alpha./&side.)*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2);
u_diff=d+probit(1-&alpha./&side.)*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2);
run;
/*MiettinenNurminen方法*/
datamienur;
n1=&n1.;a1=&n1_event.;a2=n1-a1;p1=a1/n1;
n2=&n2.;a3=&n2_event.;a4=n2-a3;p2=a3/n2;
z=probit(1-&alpha./&side.);
d=p1-p2;
*率差置信区间下限;
l_diff=-(z**2*(a1+a3)/((a1+a3-1)*a1))/((z**2*(a1+a3)/((a1+a3-1)*a1))+1);
*率差置信区间上限;
u_diff=(z**2*(a1+a3)/((a1+a3-1)*a3))/((z**2*(a1+a3)/((a1+a3-1)*a3))+1);
run;
/*Newcombe-Wilson得分方法,提交FDA报告中常见的方法 */
dataNewcombe;
n1=&n1.;a1=&n1_event.;a2=n1-a1;p1=a1/n1;
n2=&n2.;a3=&n2_event.;a4=n2-a3;p2=a3/n2;
z=probit(1-&alpha./&side.);
*单样本率置信区间下限;
l1=(2*a1+z**2-z*sqrt(z**2+4*a1*a2/n1))/(2*(n1+z**2));
l2=(2*a3+z**2-z*sqrt(z**2+4*a3*a4/n2))/(2*(n2+z**2));
*单样本率置信区间上限;
u1=(2*a1+z**2+z*sqrt(z**2+4*a1*a2/n1))/(2*(n1+z**2));
u2=(2*a3+z**2+z*sqrt(z**2+4*a3*a4/n2))/(2*(n2+z**2));
d=p1-p2;
单样本率置信区间下限
l_diff=d-sqrt((p1-l1)**2+(u2-p2)**2);
单样本率置信区间上限
u_diff=d+sqrt((p2-l2)**2+(u1-p1)**2);
run;
/*Newcombe-Wilson得分连续校正方法,所有计算方法中最保守 */
dataNewcombeCC;
n1=&n1.;a1=&n1_event.;a2=n1-a1;p1=a1/n1;
n2=&n2.;a3=&n2_event.;a4=n2-a3;p2=a3/n2;
z=probit(1-&alpha./&side.);
*单样本率置信区间下限;
l1=(2*a1+z**2-1-z*sqrt(z**2-2-1/n1+4*p1*(n1*a2/n1+1)))/(2*(n1+z**2));
l2=(2*a3+z**2-1-z*sqrt(z**2-2-1/n2+4*p2*(n2*a4/n2+1)))/(2*(n2+z**2));
*单样本率置信区间上限;
u1=(2*a1+z**2+1+z*sqrt(z**2+2-1/n1+4*p1*(n1*a2/n1-1)))/(2*(n1+z**2));
u2=(2*a3+z**2+1+z*sqrt(z**2+2-1/n2+4*p2*(n2*a4/n2-1)))/(2*(n2+z**2));
d=p1-p2;
*率差置信区间下限;
l_diff=d-sqrt((p1-l1)**2+(u2-p2)**2);
*率差置信区间上限;
u_diff=d+sqrt((p2-l2)**2+(u1-p1)**2);
run;
dataratediff;
lengthmethod$ 200;
setmienur(in=mienur)CMHChisq(in=CMHChisq)
Newcombe(in=Newcombe)NewcombeCC(in=NewcombeCC);
ifmienurthenmethod=′MiettinenNurminen(仅限两组均为100%)′;
ifCMHChisqthenmethod=′近似正态 (两组率均为99.5%)′;
ifNewcombethenmethod=′Newcombe′;
ifNewcombeCCthenmethod=′Newcombe连续校正′;
l_diff=l_diff*100;
u_diff=u_diff*100;
run;
procprintdata=ratediff;
varmethodn1a1p1n2a3p2dl_diffu_diff;
formatl_diffu_diff8.2;
run;
%mend;
某项用于骨折患者的骨钉临床试验,由于产品技术成熟,所有随访到的受试者在最终的临床评价中都为有效,即试验组和对照组事件发生率皆为100%。其中试验组有效例数为59,对照组有效例数为56,计算两组事件发生率差值的点估计和置信区间估计。
该研究符合两组率都为100%条件,可以调用之前所编写程序,获得三种方法下计算得到的率差的点估计和置信区间估计。
%ratediff(n1=59,n1_event=59,n2=56,n2_event=56,alpha=0.05,side=2);
表1为调用该宏程序后得到的结果,其中n1为试验组样本量,a1为试验组有效的例数,p1为试验组事件发生率,n2为对照组样本量,a2为对照组有效的例数,p2为对照组事件发生率,d为试验组和对照组两组率差点估计,l_diff和u_diff分别为率差置信区间的下限和上限。
三种方法算得的点估计都为0,MiettinenNurminen计算的率差置信区间估计为[-6.16%,6.47%];近似正态方法因无法估算两组率差的置信区间,将两组事件发生率保守估计为99.5%,获得率差置信区间估计为[-2.58%,2.58%];Newcombe方法计算的率差置信区间估计为[-6.11%,6.42%];而Newcombe连续校正方法计算的率差置信区间估计为[-7.62%,8.00%]。
表1 调用%ratediff宏获得三种方法下两组率差点估计和置信区间估计
研究者可以根据试验预先设定的评价方法选择恰当的一种,结合临床和统计评价标准判断试验研究假设是否成立。
率差置信区间估计最常用的方法是CMH(Cochran-Mantal Haenszel)法[5,9-11],但该法对于两组率同为0%或100%的情况无法进行置信区间估计,应用中虽然有将0%或100%用接近的数据替代(如0.5%或99.5%),但毕竟导致数据失真,不宜提倡。
从实例看,Miettinen Nurminen法和Newcombe法的结果相近,而校正Newcombe法的结果最为保守,且精度较差。关于这三种方法的统计性能究竟如何,尚有待我们进一步的研究予以明确[9-11]。
[1]Miettinen O,Nurminen M. Comparative analysis of two rates Stat Med,1985,4(2):213-226.
[2]Newcombe RG. Interval estimation for the difference between independent proportions:comparison of eleven methods . Stat Med,1998,17(8):873-890.
[3]Newcombe RG. Improved confidence intervals for the difference between binomial prportions based on paired data.Statist . Stat Med,1998,17(6):2635-2650.
[4]Newcombe RG. Two-sided confidence intervals for the single proportion:comparison of seven methods . Stat Med,1998,17(8):857-872.
[5]FDA. Guidance for Industry and FDA Staff - Statistical Guidance on Reporting Results from Studies Evaluating Diagnostic Tests.(2007-03-13)http://www.fda.gov/medicaldevices/deviceregulationandguidance/guidancedocuments/ucm071148.htm
[6]SAS Institute Inc. SAS/IML®9.2User’s Guide.Second Edition. Cary,North Carolina,USA:SAS Institute Inc,2009.
[7]Barker N. A Practical Introduction to the Bootstrap Using the SAS System.Heidelberg,2005.
[8]Mehrotra D,Railkar R. Minimum risk weights for comparing treatments in stratified binomial trials. Statistics in Medicine,2000,19:811-825.
[9]张高魁. 阳性药对照临床试验有效性的可信区间评价方法. 中华临床药学,2005,(5):389-391.
[10]刘沛. 总体率可信区间计算的一次近似法及其特征 . 中国卫生统计,2004,21(5):297-299.
[11]刘沛. 四种方法计算总体率可信区间的比较研究 . 中国卫生统计,2005,22(6):354-358.
(责任编辑:郭海强)
SAS Implements of Calculating Rate Differences Confidence Intervals in Clinical Trials with Rates of 0% or 100% in Both Groups
Huang Yaohua,Tang Xinran,Duan Chongyang,et al
(BiometricsDepartment,SchoolofPublicHealthandTropicalMedicine,SouthMedicalUniversity(510515),Guangzhou)
Objective To estimate confidence intervals of clinical trials with success rates of 0% or 100% in both treatment and controlled groups using SAS programming.Methods To resolve the issue of calculating confidence intervals of rate differences in clinical trials with both rates of 0% or 100%,programs were drafted using SAS 9.4. Miettinen and Nurminen,Newcombe-Wilson Score and Continuity-corrected Newcombe-Wilson methods could all be implemented with these programs. In addition,one example was displayed to illustrate the convenience of the programs.Results Confidence intervals in trials with both success rates of 0% or 100% could be resolved using the 3 methods,and it can be used feasibly by professionals and non-professionals. In the given example,with sample size of 59,56,both of two groups had the success rate of 100%. 95%CI of rate difference was [-6.16%,6.47%] calculated by Miettinen Nurminen,[-6.11%,6.42%] by Newcombe-Wilson Score and [-7.62%,8.00%] by Continuity-corrected Newcombe-Wilson Score.Conclusion Miettinen and Nurminen,Newcombe-Wilson Score and Continuity-corrected Newcombe-Wilson methods could all be implemented easily to calculate confidence intervals of rate differences in clinical trials with both rates of 0% or 100% by invoking the developed programs.
Proportion difference confidence interval;SAS macro procedure;Newcome-Wilson score;Miettinen Nurminen
*国家自然科学基金项目资助(81673270)
△通信作者:陈平雁,E-mail:chenpy99@126.com