用SAS软件实现具有一个重复测量的单因素设计定量资料的统计分析

2011-01-27 05:15胡良平郭辰仪军事医学科学院科技部生物医学统计学咨询中心北京100850
药学服务与研究 2011年6期
关键词:协方差定量资料

胡良平,郭辰仪(军事医学科学院科技部生物医学统计学咨询中心,北京100850)

在药学试验中,研究者们经常遇到观测的定量指标会随着时间的推移发生变化,必须在不同时间点上对同一个受试对象的相应指标进行多次重复观测的情况。更常见的是需要考察与分析在某一特定条件下,每位受试对象随时间、部位或时间与部位的组合的改变时,某一定量指标取值的变化规律。此时,所对应的设计被称为重复测量设计,其复杂程度取决于独立试验分组因素的个数和与重复测量有关的因素个数。下面看一个例子。

例1 研究奈哌地尔对高血压的疗效,选择符合1999年WHO诊断标准的轻、中度高血压病人96例。入选前收集临床病史资料,选取符合标准者,并进行随机分组,采用自身对照,观察用药前后血压变化规律。所有入选病人停用所有降压药物,口服安慰剂2周后开始治疗。按药品说明书推荐初始剂量给药,25mg/次,bid;两周后,剂量增加为50mg/次,bid,观察一个月。本文重点在于描述统计分析方法,因此选用该试验的其中一项指标收缩压作为例子,见表1[1]。

上面的例子就是典型的具有一个重复测量的单因素设计定量资料,如果仅仅用治疗后2周或4周的收缩压与治疗前相比,没有考虑到其动态变化,是比较片面的。而通过资料整体对时间因素做分析,能看出随着治疗时间的推移,病情是否得到有效的缓解,比治疗后各时间点分别与治疗前相比更有说服力。

表1 奈哌地尔对原发性高血压病人收缩压的影响aTable 1 Effects of naftopidil on systolic blood pressure of patients with primary hypertension

1 重复测量设计

1.1 重复测量设计的定义和特点 重复测量设计是在不同条件下,从同一受试对象重复获得某定量指标观测值的一种试验设计类型。这里所说的不同条件通常是指时间因素取不同水平,也可以指受试者身上的几个对称部位或具有可比性的不同部位,有时也指时间因素和对称部位的各种水平组合。如果不同条件仅与一个因素有关,就叫做具有一个重复测量的M因素设计;如果不同条件与两个因素的水平组合有关,就叫做具有两个重复测量的M因素设计。这里的M指试验中涉及到的全部试验因素的个数,包括与重复测量有关的试验因素。与重复测量无关的因素被称为试验分组因素,即受试对象被完全随机地分配到这些因素的水平组合所形成的各小组中去。在某项研究中,若需要了解随时间推移或部位改变时定量观测指标的动态变化情况,就需要运用此设计[2]。本文只研究涉及单因素的重复测量,对于更复杂的涉及其他分组因素的情况,将在后续的文章中详细介绍。

1.2 重复测量设计定量资料统计分析方法的合理选用 (1)观测指标在同一受试对象上重复获得,这是重复测量设计的基本特点;(2)重复测量设计对于数据有正态性的要求,不满足此要求的定量资料,一种方法是对数据进行一定的变换,如取对数或开平方根,使其满足正态性;另一种方法是采用混合效应方差分析模型处理,该方法事先假定重复测量资料具有某种协方差结构模型,并用此模型拟合给定的定量资料,考察拟合的效果[3]。在SAS系统的MIXED过程中,设置了30多个不同的协方差结构模型,其中最常用的有5种,在下文的SAS程序中,“type=”后分别用5个关键词来表示不同的协方差结构模型。

2 实例解析

下面应用SAS软件分析具有一个重复测量的单因素设计定量资料。例2 沿用例1中的资料,试问受试对象在接受治疗后,随时间推移,病情改善有没有统计学意义?

对问题的分析与SAS实现 此资料对病人没有分组,仅涉及一个三水平的试验因素——时间,在这三个水平下都对同样的病人做了相应的重复测量,因此该资料为具有一个重复测量的单因素设计定量资料。应用SAS进行分析,程序如下。

程序说明:第1步建立数据集,“input”语句表明从cards后的数据中读取每行相应的数据赋值给变量。两个do循环给每个数据标明了病人编号和对应的测量时间点(注:这里的时间并不要求必须是具体的时刻)。第2~6步调用mixed过程,分别采用ar(1)、vc、cs、sp、un 5种协方差结构模型对原数据进行建模。“repeated”声明是进行重复测量的分析,“type=”后面接对应的协方差结构模型的类型。ODS html语句用来将统计分析结果输出成网页格式。

上述5种协方差结构模型主要的区别在于模型的随机效应项在不同重复测量水平上的相关性。例如,vc模型考虑不同时间点上同一个病人的随机效应项没有关联。ar(1)模型,即自回归模型,随机效应的相关度随时间间隔增大而下降。cs模型假设不同时间点的随机效应项相关度一样。sp模型根据不同时间点上各观测的欧氏距离确定相关度。un模型最复杂,将不同时间点上的随机效应的相关度都设为独立的参量,适用范围最广,因此有时mixed过程在迭代计算时会不收敛。

研究者在处理数据时,可以结合实际情况只选取一种或几种协方差结构模型。本文将5种常用的协方差结构模型都列出来了。

如果不能确定具体应该采用哪种协方差结构模型,可以参看拟合度。在SAS的mixed过程输出结果中,有-2Res Log Likelihood、AIC、AICC和BIC 4个指标用来评价拟合度。以上指标的数值越小,表明与该模型的拟合度越好。

对于上面程序的输出结果,拟合度最好的是un协方差结构模型,本文只在此解释该模型的主要输出结果,其他模型结果类似,此处省略。

模型信息(model information)数据集 work reptest应变量 y协方差结构 unstructured受试对象 patient估计方法 REML残差法 none固定效应标准误计算方法 model-based自由度估计方法between-within

从上表可以看出,采用协方差结构模型“unstructured”即“un”,进行迭代计算,见下表。

迭代记录

经过一次迭代计算,已经达到收敛标准。注意这里一定要看清楚最后迭代是否收敛。收敛的情况下会显示“convergence criteria met”,若不收敛则结果显示为“warning:did not converge”。表1中的数据,SAS软件给出了4种评价指标,结果分别为:-2Res Log Likelihood=1 853.4,AIC= 1 865.4,AICC=1 865.7,BIC=1 880.8,根据-2Res Log Likelihood的结果,横向比较这5种模型,最终结果un模型此项指标取值最小,为1 853.4,因此un模型最优。

零模型似然比检验

这里的零模型即是指vc模型。由于P<0.05,假设检验的结果表明在这里un模型要远好于协方差结构为对角阵的vc模型(假设检验的原假设是协方差结构为对角阵,正好是vc模型)。实际在对比拟合度时,也可以直观地看出un模型要优于vc模型(vc模型的-2Res Log Likelihood为2 184.0)。

3型固定效应检验

由此可以得到下面的统计结论:F=1 814.90,P<0.000 1,故按α=0.05的水准,时间效应项对数据整体影响具有统计学意义。进一步,可以分别用治疗后的数据与治疗前数据相比较,程序如下。

a:使用mixed过程可以进行多种方法的两两比较,这里只用到Dunnett’s t检验,因此使用“Dunnett”选项。

得到的结果见表2。由表2可以看到,治疗后2周和治疗后4周的收缩压与治疗前相比,其差异都具有统计学意义。专业结论:治疗前、治疗后2周和治疗后4周的收缩压分别为(164±12)、(148± 11.25)和(130±9.7)mmHg,随治疗时间的推移,收缩压降低得越多,治疗效果越好。因此可以认为随着时间的推移,病情得到了明显的改善。

表2 最小方差离差Table 2 The minimum variance deviation

[1] 胡宝荣,哈 力,刘 璐.奈哌地尔治疗高血压病人的临床疗效[J].药学服务与研究,2005,5(2):165-166.

Hu BaoRong,Ha Li,Liu Lu.Clinical efficacy of naftopidil in treatment of patients with hypertensive disease[J].Pharm Care Res,2005,5(2):165-166.Chinese with abstract in English.

[2] 郭 晋,赵元科,胡良平,等.如何用SAS软件正确分析生物医学科研资料(Ⅳ.用SAS软件实现单因素多水平设计一元定量资料的统计分析)[J].中国医药生物技术,2009,4(4):315-319.

Guo Jin,Zhao YuanKe,Hu LiangPing,et al.How to analyze biomedical data with SAS software properly(Ⅳ.Statistical analysis of one unknown quantitative data in single-factor multiple levels design with SAS software)[J].Chin Med Biotechnol,2009,4(4):315-319.Chinese.

[3] 胡良平.医学统计学:运用三型理论分析定量与定性资料[M].北京:人民军医出版社,2009:49.

Hu LiangPing.Medical statistics-analysis of quantitative and qualitative data with triple-type theory[M].Beijing:People’s Military Medical Press,2009:49.Chinese.

猜你喜欢
协方差定量资料
有机物官能团的定量关系在解题中的应用
多重荧光定量PCR法同时定量检测4种混合熟肉种源
Party Time
PAIRS & TWOS
JUST A THOUGHT
一种改进的网格剖分协方差交集融合算法∗
外汇风险敞口的定量刻画
投资组合中协方差阵的估计和预测
基于子集重采样的高维资产组合的构建
二维随机变量边缘分布函数的教学探索