五种含区组因素设计类型的SAS实现

2011-03-11 14:02胡良平李长平
中国卫生统计 2011年6期
关键词:区组实验设计设计方案

高 辉 胡良平△ 李长平 郭 晋

实验设计是统计学中的重要内容,是整个科研工作的行动指南。在实验前制定一个科学、完善、合理、可行的设计方案,可保证整个实验过程有章可循。完整的实验设计方案,涉及实验设计的“三要素、四原则和设计类型”的全面考虑和妥善安排。然而,由于不同设计类型的特点各异,常规的随机数字表、随机排列表应用起来不是十分方便。本文借助SAS 9.2简体中文版软件的plan、optex过程,实现了五种含区组因素设计类型的设计方案。此外,plan过程和optex过程的直接输出结果只是因素水平值的交叉组合,不易被用户所理解。本文以tabulate过程对随机化结果进行调整,使其以能体现设计类型特点的形式展现出来,程序简洁,方便科研人员修改使用;结果清晰明了,方便实验者记录实验数据。

随机区组设计

随机区组设计是配对设计的扩展,它首先将受试对象按可能影响实验结果的属性分组,使属性相同或接近的分在同一组内,形成区组,然后将各区组内的受试对象随机分配至各处理组〔1〕。

【例1】选择4组受试对象,共16个,各组内受试对象条件相近。分别给予4种不同的处理,拟采用随机区组设计安排实验,请给出具体的设计方案。

对受试对象进行编号,第1组编号范围为1~4,第2组编号范围为5~8,依此类推。

SAS程序如下:

proc plan seed=10000;

factors group=4 ordered treat=4;

output out=a group cvals=('第1组 ''第2组 ''第3组 ''第4组')

treat cvals=('处理1''处理2''处理3''处理4');

run;

data b;set a;subject=_n_;run;

ods html style=analysis;

proc tabulate format=2.0;class group treat;var subject;

table group=",subject='受试对象编号'*

treat=''*sum=''/box=[label='区组 '];

run;

ods html close;

输出结果见表1。表格内数字为受试对象的编号。如数字“3”所在的行标识为第1组,列标识为处理1,表示区组1中的3号受试对象接受处理1的处理。科研人员可在数字后记录受试对象的观测结果。

表1 例1的随机化设计方案

拉丁方设计

拉丁方设计是在随机区组设计的基础上发展的,适用于实验中安排一个处理因素和两个区组因素且各因素水平数相等的研究〔2〕。

【例2】拟采用拉丁方设计考察4个不同的受试对象在4个不同的时间接受4种不同方法的检测,请给出具体的设计方案。

对4种检测方法进行编号,范围为1~4。

SAS程序如下:

proc plan seed=10000;

factors subject=4 ordered period=4 ordered;

treatments test=4 cyclic;

output out=a subject cvals=('受试者1''受试者2''受试者3''受试者4')random period cvals=('时间1''时间2''时间3''时间4')

random test nvals=(1 2 3 4)random;

run;

ods html style=analysis;

proc tabulate format=2.0;

class subject period;var test;

table subject='',test='检测方法 '*period=''*sum=''/box=[label='受试者编号 '];

run;

ods html close;

输出结果见表2。表格内数字为检测方法的编号。

表2 例2的随机化设计方案

2×2交叉设计

交叉实验设计是按事先设计好的处理次序,在实验对象上按各个时期逐一依次实施各项处理,以比较这些处理的作用。2×2交叉设计指的是两个时期、两个处理的交叉设计〔3〕。

【例3】拟采用2×2交叉设计来考察两种药物的疗效,选择8个受试对象参与实验,请给出具体的设计方案。

对两种药物进行编号,范围为1~2。

SAS程序如下:

proc plan seed=10000;

factors subject=8 period=2 ordered;treatments drug=2 cyclic;

output out=a period cvals=('第1阶段''第2阶段')drug nvals=(1 2);

run;

ods html style=analysis;

proc tabulate format=2.0;

class subject period;var drug;

table subject='',drug='药物种类 '*

period=''*sum=''/box=[label='受试者编号 '];

run;

ods html close;

输出结果见表3。表格内数字为药物的编号。

表3 例3的随机化设计方案

含区组因素的析因设计

含区组因素的析因设计,比析因设计多考虑了一个区组因素。它先按受试对象的某种属性形成区组,然后将各区组内的受试对象随机地分配至各因素各水平完全组合形成的各处理组中去〔4〕。

【例4】选择4个区组的受试对象,各区组内有4个条件接近的受试对象。拟采用含区组因素的析因设计考察药物(两种药物)及剂量(两个剂量)的效应。请给出具体的设计方案。

对16个受试对象进行编号,区组1内的受试对象编号范围为1~4,区组2内的受试对象编号范围为5~8,依此类推。

SAS程序如下:

%let factor_a=2;

proc plan seed=10000;

factors block=4 ordered r=4;output out=aa;

run;

data bb;

set aa;subject=_n_;do i=1 to&factor_a;if r< =i* &factor_a and r>(i-1)* &factor_a then do;a=i;b=r-(i-1)* &factor_a;end;end;

run;

data cc;

set bb;

if a=1 and b=1 then c='A1B1';

if a=1 and b=2 then c='A1B2';

if a=2 and b=1 then c='A2B1';

if a=2 and b=2 then c='A2B2';

run;

ods html style=analysis;

proc tabulate format=2.0;

class block c;var subject;

table block='',subject='受试对象编号'*c=''*sum=''/box=[label='区组 '];

run;

ods html close;

程序中设置了宏变量,factor_a的值为因素药物种类的水平数。输出结果见表4。表格内数字为受试对象的编号。

表4 例4的随机化设计方案

平衡不完全随机区组设计

平衡不完全随机区组设计是随机区组设计的一种补救,适用于原本可采用随机区组设计但实验因素的水平数大于每个区组内实际可用的受试对象数的情形〔5〕。

【例5】拟采用平衡不完全随机区组设计考察5种处理方法的效果,选取5个区组的受试对象,每个区组内有3个。请给出具体的设计方案。

对受试对象进行编号,区组1内的受试对象编号范围为1~3,区组2内的受试对象编号范围为4~6依此类推。

SAS程序如下:

%let block=5;%let treat=5;%let subject=3;%macro aa(treat);

data a;%do i=1%to&treat;

treatment=compress('疗法 '||& i);

output;%end;

run;

%mend aa;

%aa(&treat);

proc optex data=a seed=10000 coding=orth;

class treatment;model treatment;blocks structure=(&block)&subject;output out=b;

run;

data c;

set b;number=_n_;

run;

ods html style=analysis;proc tabulate format=2.0;

class block treatment;var number;

table block='',number='受试对象编号 '*

treatment=''*sum=''/box=[label='区组 '];

run;

ods html close;

程序中使用%let语句设置了三个宏变量,block、treat和subject分别表示区组的个数、处理的个数和每组中所能处理的受试对象个数。输出结果见表5。表格内数字为受试对象的编号。

表5 例5的随机化设计方案

总之,借助SAS软件的强大功能,可以较为方便地实现各种含区组因素的实验设计类型。本文所涉及的plan过程和optex过程,均基于随机数来产生设计方案〔6〕。所以,借助这两个过程,事先给出随机种子数,进行随机化后得到的实验设计方案,既符合随机原则的要求,也具有可重现性,应予以提倡〔7〕。

1.徐勇勇.医学统计学.第2版.北京:高等教育出版社,2004:167-170.

2.孙振球.医学统计学.北京:人民卫生出版社,2002:59-60.

3.苏炳华.新药临床试验统计分析新进展.上海:上海科学技术文献出版社,2000:63-115.

4.胡良平.统计学三型理论在实验设计中的应用.北京:人民军医出版社,2006:71-106.

5.胡良平.SAS统计分析教程.北京:电子工业出版社,2010:687-689.

6.王睿,贺佳.随机抽样方法的SAS实现.中国卫生统计,2007,24(1):85,93.

7.刘玉秀,姚晨,杨友春,等.随机化临床试验及随机化的SAS实现.中国临床药理学与治疗学,2001,6(3):193-195.

猜你喜欢
区组实验设计设计方案
变化区组随机化及其SAS宏实现
基于可持续理念旧建筑改造设计方案探讨
如何正确运用方差分析
——平衡不完全区组设计定量资料一元方差分析
不同的温度
有趣的放大镜
哪个凉得快?
中医临床研究中区组设计应用现状的计量学分析*
数据中心ECC设计方案研究
无字天书
高压电力系统规划设计方案探讨