两组率同为100%或0%时率差置信区间估计的SAS实现*

2017-03-09 08:34南方医科大学生物统计学系510515
中国卫生统计 2017年1期
关键词:置信区间校正例数

南方医科大学生物统计学系(510515)

黄耀华 唐欣然 段重阳 陈平雁△

两组率同为100%或0%时率差置信区间估计的SAS实现*

南方医科大学生物统计学系(510515)

黄耀华 唐欣然 段重阳 陈平雁△

目的 通过SAS编程实现两组事件发生率均为0%或100%时率差置信区间的估计。方法 针对事件发生率均为100%或0%时率差置信区间的估计问题,采用SAS9.4编程,使置信区间估计的Miettinen Nurminen法、Newcombe-Wilson法及校正Newcombe-Wilson法等三种方法得以实现,并通过实例进行说明。结果 所编程序实现了三种方法的置信区间估计,便于专业和非专业人员使用。实例中两组样本量分别为59,56,结果两组事件发生率均为100%,三种方法的95%置信区间:Miettinen Nurminen法为[-6.16%,6.47%];Newcombe法为[-6.11%,6.42%];校正Newcombe法为[-7.62%,8.00%]。结论 本文所提供的SAS宏程序可以简便地实现两组事件发生率均为0%或100%时三种常用的率差置信区间的估计方法。

率差置信区间 SAS宏程序 Newcombe法 Miettinen Nurminen法

医学研究领域,有时会遇到一种极端的结果,即两个比较组的事件发生率均为100%或0%,如CT成像的优良率、关节置换的成功率、使用脑膜贴片的脑脊液渗漏率等,此时两组的率差为0。目前,常用的两组事件发生率均为100%或0%时率差的置信区间估计方法有三种,分别是Miettinen Nurminen法[1]、Newcombe法和校正Newcombe法[2-4]。然而,最新版本的SAS软件尚未提供上述三种方法的计算模块,既不便于专业人员的操作,又阻碍了非专业人员的应用。因此,本研究将编制SAS 9.4宏程序,为此种类型的数据处理提供方便可靠的工具。

方法介绍

1.Miettinen Nurminen法

若用x1、x2分别表示两组的事件数,p1、p2为两组事件发生率,n1,n2分别为两组样本量,N=n1+n2为总样本。对于率差θ,Miettinen Nurminen法[1]先构建如下统计量:

其中

L0=x2θ(1-θ),L1=(n2θ-N-2x2)θ+x1+x2

L2=(n1+2n2)θ-N-x1-x2,L3=N

率差置信区间(L,U)分别为如下两个等式的解:

L:TMN=-zα/2

U:TMN=zα/2

Newcombe[2]对上述算法重新表示为如下表达式:

2.Newcombe-Wilson法

Newcombe-Wilson方法已被FDA指南推荐,作为差置信区间计算方法的首选[2-5]。其计算方法是通过Wilson法分别得到两单样本率的可信区间上下限[3]。Wilson法单样本率置信区间上下限为等式

式中q=1-p。Newcombe-Wilson法通过杂交方式构建出率差置信区间上下限(L,U)如下:

其中l1,u1,l2,u2分别为两组率Wilson得分方法计算得到的置信区间上下限[2-4]。

3.校正Newcombe-Wilson法

连续校正Newcombe-Wilson得分方法相对较为保守[2-3],其率差计算公式杂交方法同Newcombe-Wilson得分方法,区别在于Wilson单组置信区间的计算公式有所调整,采用了连续性校正后的结果,具体计算公式为

连续校正方法因单组率计算的调整而增加可信区间的宽度,从而更加保守地估计组间差异[2-4]。

率差置信区间估计的SAS实现[6-8]

%macroratediff(n1=,n1_event=,n2=,n2_event=,alpha=,side=);

/* 近似正态方法1,此方法无法计算两组率均100%率差,因此将两组率保守设为99% */

dataCMHChisq;

n1=&n1.;p1=0.995;

n2=&n2.;p2=0.995;

d=p1-p2;

l_diff=d-probit(1-&alpha./&side.)*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2);

u_diff=d+probit(1-&alpha./&side.)*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2);

run;

/*MiettinenNurminen方法*/

datamienur;

n1=&n1.;a1=&n1_event.;a2=n1-a1;p1=a1/n1;

n2=&n2.;a3=&n2_event.;a4=n2-a3;p2=a3/n2;

z=probit(1-&alpha./&side.);

d=p1-p2;

*率差置信区间下限;

l_diff=-(z**2*(a1+a3)/((a1+a3-1)*a1))/((z**2*(a1+a3)/((a1+a3-1)*a1))+1);

*率差置信区间上限;

u_diff=(z**2*(a1+a3)/((a1+a3-1)*a3))/((z**2*(a1+a3)/((a1+a3-1)*a3))+1);

run;

/*Newcombe-Wilson得分方法,提交FDA报告中常见的方法 */

dataNewcombe;

n1=&n1.;a1=&n1_event.;a2=n1-a1;p1=a1/n1;

n2=&n2.;a3=&n2_event.;a4=n2-a3;p2=a3/n2;

z=probit(1-&alpha./&side.);

*单样本率置信区间下限;

l1=(2*a1+z**2-z*sqrt(z**2+4*a1*a2/n1))/(2*(n1+z**2));

l2=(2*a3+z**2-z*sqrt(z**2+4*a3*a4/n2))/(2*(n2+z**2));

*单样本率置信区间上限;

u1=(2*a1+z**2+z*sqrt(z**2+4*a1*a2/n1))/(2*(n1+z**2));

u2=(2*a3+z**2+z*sqrt(z**2+4*a3*a4/n2))/(2*(n2+z**2));

d=p1-p2;

单样本率置信区间下限

l_diff=d-sqrt((p1-l1)**2+(u2-p2)**2);

单样本率置信区间上限

u_diff=d+sqrt((p2-l2)**2+(u1-p1)**2);

run;

/*Newcombe-Wilson得分连续校正方法,所有计算方法中最保守 */

dataNewcombeCC;

n1=&n1.;a1=&n1_event.;a2=n1-a1;p1=a1/n1;

n2=&n2.;a3=&n2_event.;a4=n2-a3;p2=a3/n2;

z=probit(1-&alpha./&side.);

*单样本率置信区间下限;

l1=(2*a1+z**2-1-z*sqrt(z**2-2-1/n1+4*p1*(n1*a2/n1+1)))/(2*(n1+z**2));

l2=(2*a3+z**2-1-z*sqrt(z**2-2-1/n2+4*p2*(n2*a4/n2+1)))/(2*(n2+z**2));

*单样本率置信区间上限;

u1=(2*a1+z**2+1+z*sqrt(z**2+2-1/n1+4*p1*(n1*a2/n1-1)))/(2*(n1+z**2));

u2=(2*a3+z**2+1+z*sqrt(z**2+2-1/n2+4*p2*(n2*a4/n2-1)))/(2*(n2+z**2));

d=p1-p2;

*率差置信区间下限;

l_diff=d-sqrt((p1-l1)**2+(u2-p2)**2);

*率差置信区间上限;

u_diff=d+sqrt((p2-l2)**2+(u1-p1)**2);

run;

dataratediff;

lengthmethod$ 200;

setmienur(in=mienur)CMHChisq(in=CMHChisq)

Newcombe(in=Newcombe)NewcombeCC(in=NewcombeCC);

ifmienurthenmethod=′MiettinenNurminen(仅限两组均为100%)′;

ifCMHChisqthenmethod=′近似正态 (两组率均为99.5%)′;

ifNewcombethenmethod=′Newcombe′;

ifNewcombeCCthenmethod=′Newcombe连续校正′;

l_diff=l_diff*100;

u_diff=u_diff*100;

run;

procprintdata=ratediff;

varmethodn1a1p1n2a3p2dl_diffu_diff;

formatl_diffu_diff8.2;

run;

%mend;

实例分析

某项用于骨折患者的骨钉临床试验,由于产品技术成熟,所有随访到的受试者在最终的临床评价中都为有效,即试验组和对照组事件发生率皆为100%。其中试验组有效例数为59,对照组有效例数为56,计算两组事件发生率差值的点估计和置信区间估计。

该研究符合两组率都为100%条件,可以调用之前所编写程序,获得三种方法下计算得到的率差的点估计和置信区间估计。

%ratediff(n1=59,n1_event=59,n2=56,n2_event=56,alpha=0.05,side=2);

表1为调用该宏程序后得到的结果,其中n1为试验组样本量,a1为试验组有效的例数,p1为试验组事件发生率,n2为对照组样本量,a2为对照组有效的例数,p2为对照组事件发生率,d为试验组和对照组两组率差点估计,l_diff和u_diff分别为率差置信区间的下限和上限。

三种方法算得的点估计都为0,MiettinenNurminen计算的率差置信区间估计为[-6.16%,6.47%];近似正态方法因无法估算两组率差的置信区间,将两组事件发生率保守估计为99.5%,获得率差置信区间估计为[-2.58%,2.58%];Newcombe方法计算的率差置信区间估计为[-6.11%,6.42%];而Newcombe连续校正方法计算的率差置信区间估计为[-7.62%,8.00%]。

表1 调用%ratediff宏获得三种方法下两组率差点估计和置信区间估计

研究者可以根据试验预先设定的评价方法选择恰当的一种,结合临床和统计评价标准判断试验研究假设是否成立。

讨 论

率差置信区间估计最常用的方法是CMH(Cochran-Mantal Haenszel)法[5,9-11],但该法对于两组率同为0%或100%的情况无法进行置信区间估计,应用中虽然有将0%或100%用接近的数据替代(如0.5%或99.5%),但毕竟导致数据失真,不宜提倡。

从实例看,Miettinen Nurminen法和Newcombe法的结果相近,而校正Newcombe法的结果最为保守,且精度较差。关于这三种方法的统计性能究竟如何,尚有待我们进一步的研究予以明确[9-11]。

[1]Miettinen O,Nurminen M. Comparative analysis of two rates Stat Med,1985,4(2):213-226.

[2]Newcombe RG. Interval estimation for the difference between independent proportions:comparison of eleven methods . Stat Med,1998,17(8):873-890.

[3]Newcombe RG. Improved confidence intervals for the difference between binomial prportions based on paired data.Statist . Stat Med,1998,17(6):2635-2650.

[4]Newcombe RG. Two-sided confidence intervals for the single proportion:comparison of seven methods . Stat Med,1998,17(8):857-872.

[5]FDA. Guidance for Industry and FDA Staff - Statistical Guidance on Reporting Results from Studies Evaluating Diagnostic Tests.(2007-03-13)http://www.fda.gov/medicaldevices/deviceregulationandguidance/guidancedocuments/ucm071148.htm

[6]SAS Institute Inc. SAS/IML®9.2User’s Guide.Second Edition. Cary,North Carolina,USA:SAS Institute Inc,2009.

[7]Barker N. A Practical Introduction to the Bootstrap Using the SAS System.Heidelberg,2005.

[8]Mehrotra D,Railkar R. Minimum risk weights for comparing treatments in stratified binomial trials. Statistics in Medicine,2000,19:811-825.

[9]张高魁. 阳性药对照临床试验有效性的可信区间评价方法. 中华临床药学,2005,(5):389-391.

[10]刘沛. 总体率可信区间计算的一次近似法及其特征 . 中国卫生统计,2004,21(5):297-299.

[11]刘沛. 四种方法计算总体率可信区间的比较研究 . 中国卫生统计,2005,22(6):354-358.

(责任编辑:郭海强)

SAS Implements of Calculating Rate Differences Confidence Intervals in Clinical Trials with Rates of 0% or 100% in Both Groups

Huang Yaohua,Tang Xinran,Duan Chongyang,et al

(BiometricsDepartment,SchoolofPublicHealthandTropicalMedicine,SouthMedicalUniversity(510515),Guangzhou)

Objective To estimate confidence intervals of clinical trials with success rates of 0% or 100% in both treatment and controlled groups using SAS programming.Methods To resolve the issue of calculating confidence intervals of rate differences in clinical trials with both rates of 0% or 100%,programs were drafted using SAS 9.4. Miettinen and Nurminen,Newcombe-Wilson Score and Continuity-corrected Newcombe-Wilson methods could all be implemented with these programs. In addition,one example was displayed to illustrate the convenience of the programs.Results Confidence intervals in trials with both success rates of 0% or 100% could be resolved using the 3 methods,and it can be used feasibly by professionals and non-professionals. In the given example,with sample size of 59,56,both of two groups had the success rate of 100%. 95%CI of rate difference was [-6.16%,6.47%] calculated by Miettinen Nurminen,[-6.11%,6.42%] by Newcombe-Wilson Score and [-7.62%,8.00%] by Continuity-corrected Newcombe-Wilson Score.Conclusion Miettinen and Nurminen,Newcombe-Wilson Score and Continuity-corrected Newcombe-Wilson methods could all be implemented easily to calculate confidence intervals of rate differences in clinical trials with both rates of 0% or 100% by invoking the developed programs.

Proportion difference confidence interval;SAS macro procedure;Newcome-Wilson score;Miettinen Nurminen

*国家自然科学基金项目资助(81673270)

△通信作者:陈平雁,E-mail:chenpy99@126.com

猜你喜欢
置信区间校正例数
基于贝塔分布的最优置信区间研究
Maxwell分布参数的最短置信区间研究
p-范分布中参数的置信区间
定数截尾场合Pareto分布形状参数的最优置信区间
二维超声与四维超声联合诊断产前胎儿畸形的临床价值
1168 例女性泌尿生殖道感染支原体培养及药敏结果探讨
人工膝关节翻修例数太少的医院会增加再翻修率:一项基于23 644例的研究
劉光第《南旋記》校正
帕金森病睡眠障碍与非运动症状的相关性分析
建立在校正系统上的强大实力Sonance所能士i12