如何正确运用χ2检验
——对数秩检验与SAS实现

2022-01-07 12:50胡纯严胡良平
四川精神卫生 2021年6期
关键词:四格频数对数

胡纯严 ,胡良平 ,2*

(1.军事科学院研究生院,北京 100850;2.世界中医药学会联合会临床科研统计学专业委员会,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

在比较两组或多组生存资料的生存函数是否相等时,有多种非参数检验方法,而对数秩检验是其中最常用方法之一。与其他非参数检验方法相比,通常情况下,对数秩检验的检验结果具有更小的P值。本文将汇集文献中具有不同表达形式的对数秩检验统计量,阐释“对数秩”的真实含义;基于具有两种不同数据结构的实例并借助SAS软件实现对数秩检验。

1 概 述

1.1 “对数秩”的含义

Peto等[1]于1972年创造了“对数秩检验”。这个检验是基于给每个观测值(即原始数据)均赋予一个“生存函数的对数值”为其“分值”而构造出来的。Altshuler于1970年采用下式作为“对数生存函数”在 t(i)的估计值。

在式(1)等号右侧,m(j)和 r(j)分别代表死亡时间等于 t(j)的个体数和风险集 R[t(j)]中的个体总数。

1.2 对数秩检验的种类

虽然对数秩检验的检验统计量具有多种表现形式,但从检验统计量的分布类型来看,主要有两种:χ2分布和标准正态分布。事实上,由于Z2=χ21[说明:Z~N(0,1)],这意味着,从概率分布角度考量,对数秩检验统计量都服从χ2分布。另外,根据资料中试验因素水平数目的不同,对数秩检验的检验统计量所具有的自由度是不相同的,通常的自由度df=K-1,此处,K为“试验因素的水平数”或称为“组数”。

1.3 对数秩检验的应用场合

一般来说,对数秩检验应用于生存资料中比较两个或多个生存函数之间的差别是否具有统计学意义[2];也被认为可用于比较两个暴露组中事件的发病率,此处的发病率可伴随访时间(长度为T)而改变[3]。

2 对数秩检验统计量

2.1 未分层对数秩检验统计量

2.1.1 文献[2]对未分层对数秩检验统计量的定义

在SAS/STAT的LIFETEST过程中,有六种用于比较两组或多组生存资料的生存函数是否相等的假设检验方法[2],其中,对数秩检验统计量见式(2):

式(2)中的χ2服从自由度df=矩阵V的秩的χ2分布;v'是v的转置向量;V-是矩阵V的广义逆矩阵。式(2)中等号右侧各变量的具体含义如下:

在式(3)中,各分量的计算公式见式(5):

在式(4)中,V是由vk的方差和vk与vh之间的协方差组成的矩阵,其各元素的定义如下:

校正的(或称加权的)对数秩检验的检验统计量见式(8):

在式(8)中,χ2服从自由度为K-1的χ2分布,它是对加权的K个样本的生存函数进行检验的检验统计量。式(8)中等号右侧各变量的含义如下:

让(Ti,δi,Xi,wi),i=1,2,…,n,代表具有右删失的生存资料的一个独立样本,Ti是一个可能的右删失的时间;δi是一个删失的指示变量(δi=0代表Ti是删失时间,δi=1代表Ti不是删失时间,即事件发生的时间);Xi=1,2,…,K 代表 K个不同的组;wi是LIFETEST过程的WEIGHT语句中指定变量在各观测上的取值;在时刻Tj(j=1,2,…,D),让ti

在式(12)中,A、B和C的内容分别如下:

在式(13)中,A的内容与式(14)相同;D、E和F的内容分别如下:

2.1.2 文献[3]对未分层对数秩检验统计量的定义

在文献[3]中,对数秩检验统计量见式(20):

在式(20)中,Q服从自由度为1的χ2分布;m为不同生存时间点的个数(即四格表的张数,因为在对两组生存资料进行比较时,需在每个时间点上将全部资料划分成一个四格表资料,设两行分别代表试验组与对照组,则两列分别代表死亡与存活);wi代表第i张四格表的权重,权重有多种不同的定义方法,分别对应不同名称的检验方法,当wi=1时,对应检验方法的名称为对数秩检验;d1i、ê1i和v̂1i分别代表第i张四格表中第1组的观察死亡数、基于独立性假设推算出来的理论死亡数和对应的方差的估计值;ê1i和v̂1i的计算见式(21)、式(22):

在上面两式中,ni和di分别代表第i张四格表中的总频数和总死亡数;n1i和n0i分别代表第i张四格表中第1组与第0组的频数。

【说明】式(20)是基于按全部不同时间点所形成的每张四格表资料的第1组中第1列(即死亡)上的观察频数与期望频数构造出来的一个检验统计量。因篇幅所限,未分层对数秩检验统计量在文献[4-8]中的定义从略。

2.2 未分层广义对数秩检验统计量

未分层广义对数秩检验也被称为加权对数秩检验,其检验统计量由下式定义:

在式(23)中,χ2服从自由度df=矩阵V的秩的χ2分布;V-为矩阵V的广义逆。U和V的计算见式(24)和式(25):

在以上两式中,相关变量或符号的含义和涉及内容可查阅文献[2](参见SAS/STAT的ICLIFETEST过程中的“Generalized Log-Rank Statistic”部分),此处从略。

【说明】关于“基于对数秩检验的多重比较”“分层对数秩检验”和“趋势对数秩检验”的内容[2],因篇幅所限,此处不再赘述。

3 实例及对数秩检验的SAS实现

3.1 问题与数据

【例1】检验给视网膜炎着色的患者补充不同剂量的维生素A以预防其视力损伤,收集到的临床试验数据列见表1[4]。试采用对数秩检验比较两组生存函数之间差异是否有统计学意义。

表1 接受15 000 IU和75 IU维生素A治疗的个体生存数据

【例2】10名患乳腺癌的妇女被随机均分为两组,一组切除乳房后施行CMF治疗(即循环使用B-518及5-氟味抗癌药),另一组切除乳房后不进行治疗。两年后得到复发时间(或缓解时间)的数据(月)[6]如下。CMF治疗组:23,16+,18+,20+,24+;控制组:15,18,19,19,20。试采用对数秩检验比较两组生存函数之间差异是否有统计学意义。

3.2 基于SAS软件分析例1资料

【分析与解答】设所需要的SAS程序如下:

【程序说明】表1中最后两列数据可以不输入,因为程序会自动计算;“失访(withdraw)”在生存分析中被称为“删失(censored)”或“截尾”,对应“cen⁃sored=1”;“失败(fail)”被视为完全数据,对应“cen⁃sored=0”。也就是说,变量“censored”用来标识每位受试者的“时间数据”是完全或准确数据,还是失访或删失数据;“strata”语句中的变量“group”实际为“试验因素”,而不是“分层变量”。

【SAS输出结果及解释】

以上为A组数据的描述性统计量计算结果,因失访数据较多,无法估计75%和50%分位数的数值;算术平均值及标准误差分别为5.13574和0.10155。

以上为B组数据的描述性统计量计算结果,因失访数据较多,无法估计75%分位数的数值;算术平均值及标准误差分别为4.80523和0.11793。

以上输出的是基于三种非参数检验方法(即“对数秩检验”“威尔科克森检验”和“负2倍对数似然比检验”)比较两组生存资料生存率之间的差别是否具有统计学意义的检验结果,P均小于0.05,但对数秩检验的P=0.0206最小,说明该方法的检验效能更高。

由于A组的生存曲线位于B组生存曲线的右侧(图形从略),即整体而言,A组的生存率大于B组的生存率。

【统计结论与专业结论】两组生存函数之间的差别具有统计学意义,又由于A组的生存曲线位于B组生存曲线的右侧,故可以认为:A组的生存率大于B组的生存率。也就是说,每天接受15 000 IU维生素A治疗比每天接受75 IU维生素A治疗具有更好的效果。

3.3 基于SAS软件分析例2资料

【分析与解答】设所需要的SAS程序如下:

【程序说明】“strata”语句中“test=”选项后指定了多种进行两组生存资料比较的方法,其中,“LR”为对数似然比检验法;“fleming(p,q)”中的两个参数“p”与“q”都可以取大于等于零的实数。在本例中,取p=1和q=1时,P值相对较小。

【SAS输出结果及解释】

以上是七种差异性分析方法的计算结果,其中,对数秩检验结果给出的P值是最小的。

由于A组的生存曲线位于B组生存曲线的右侧(图形从略),即整体而言,A组的生存率大于B组的生存率。

【统计结论与专业结论】两组生存函数之间的差别具有统计学意义,又由于A组的生存曲线位于B组生存曲线的右侧,故可以认为:A组的生存率大于B组的生存率。也就是说,切除乳房后施行CMF治疗(即循环使用B-518及5-氟味抗癌药)的效果优于切除乳房后不进行治疗的效果。

4 讨论与小结

4.1 讨论

在对数秩检验这个名称中,有“对数”一词。但在各种不同表达形式的对数秩检验统计量中,却没有取对数的痕迹。事实上,这个名称起源于对数生存函数。也就是说,对数秩检验统计量中内置了对数生存函数,故此得名。

值得注意的是,若按乘积-极限法估计各时间点上的生存函数,则对数生存函数的表达式如下:

然而,本文式(1)给出的定义与式(26)却有着本质区别,式(1)的分子为死亡数,而式(26)的分子为存活数。由此可知,基于式(1)得到的对数秩检验统计量,只能视为按特定定义推导出来的产物,并非是严格按对数生存函数赋值所推导出来的对数秩检验统计量。

在计算对数秩检验统计量的数值时,涉及理论频数的计算。然而,计算理论频数的方法有别于四格表资料独立性检验时计算理论频数的方法。因为在对数秩检验统计量的计算中,只需要计算每张四格表资料中一个网格[例如:(1,1)网格]上的理论频数,而不需要计算4个网格上的理论频数。另外,式(1)中的很容易被错误地视为,其实,此处的“e”仅代表函数的符号。在数学上,习惯用“f”表示函数的符号,例如,f(x)=1.5+2x+3x2。若希望式(1)不被误解,则改用式(27)表达更合适:

在式(27)等号右侧,m(j)和r(j)分别代表死亡时间等于 t(j)的个体数和风险集 R[t(j)]中的个体总数。值得一提的是:式(1)和式(27)中要带一个负号,是因为各时间点上的生存概率的对数值为负值,为使最终的结果为正值,需要乘以“-1”。

4.2 小结

本文给出了未分层对数秩检验统计量的多种表达形式,但它们在本质上是相同的,都是用每个生存时间点上的对数生存函数作为一个分值,赋予相应的个体,以取代其对应的生存时间(可能是完全数据,也可能是删失数据)。通过具有不同数据结构的两个实例并借助SAS软件实现了对数秩检验。

猜你喜欢
四格频数对数
明晰底数间的区别,比较对数式的大小
比较底数不同的两个对数式大小的方法
爆笑四格
爆笑四格
爆笑四格
爆笑四格
频数与频率:“统计学”的两个重要指标
活用对数换底公式及推论
神奇的对数换底公式
中考频数分布直方图题型展示