医学论文中定量资料假设检验方法误用分析

2015-12-04 01:33:08常微微袁慧贺连平姚应水皖南医学院公共卫生学院安徽芜湖241002

长江大学学报(自科版) 2015年12期

常微微，袁慧，贺连平，姚应水（皖南医学院公共卫生学院，安徽芜湖241002）

医学统计学是运用概率论和数理统计的原理和方法，研究医学领域中资料收集、整理、分析和推断的一门学科［1］，作为一种认识医学现象的重要工具，在医学研究的过程中起着非常重要的作用。但有研究者通过调查发现，医学论文中统计学方法的误用比例比较高，比如忽视方法的应用条件、或是分析的方法不恰当等，从而影响研究结论的正确性和可信性［2～4］。为保证医学科研结论的可靠性和医学论文的科学性，我们对医学研究论文中定量资料假设检验方面常见的错误分析如下。

1 定量资料及常用假设检验方法

定量资料，又称计量资料、数值资料，是对观察对象测量指标的数值大小所得的资料，表现为数值大小。例如：身高（cm），体质量（kg），细胞数（个）等。在统计分析过程中，要根据资料的特点和假设检验的适用条件选用合适的统计方法。定量资料的假设检验常用的方法是t检验、方差分析和非参数检验。

1.1 t检验

t检验分为单样本t检验、配对t检验和两组独立样本t检验三类，应用于样本量较小（如n＜50）的研究设计，并且单样本t检验的样本所来自的总体、配对t检验两样本对应差值的总体和两组独立样本t检验两样本所来自的总体均要求呈正态分布，两组独立样本t检验的两组样本所代表的总体还需方差齐性。如果资料不呈正态分布，可以通过数据转换使之满足正态分布后再进t检验；若转换后仍无法满足t检验的应用条件，则需采用非参数检验的方法进行分析。如果资料方差不齐性，可采用近似t检验的方法进行分析。研究者如果不清楚t检验的适用条件以及这三种t检验的区别就很容易出现t检验的误用。

1.2 方差分析

多组均数间的比较，如果各样本来自正态总体且各样本的总体方差相等，我们可采用方差分析（F检验），包括完全随机设计的方差分析、区组随机设计的方差分析、多个样本均数的两两比较（SNK检验，亦即q检验和LSD－t检验）等。

1.3 非参数法的秩和检验

若定量资料不符合正态分布，我们采用非参数的秩和检验，包括配对设计的Wilcoxon符号秩和检验、两样本Wilcoxon检验、完全随机设计多样本比较的检验、随机区组设计的检验等。

除应用条件的限制外，t检验最常误用的原因便是两组独立样本t检验和配对t检验以及两组独立样本t检验和方差分析的混淆。使用两组独立样本t检验还是配对t检验主要在于研究设计是配对还是完全随机设计。t检验和方差分析的区别主要在于前者仅用于单因素两水平设计和单组设计的资料，而后者主要用于单因素多水平（一般大于等于3个水平）和多因素设计的资料。

2 医学论文中常见的定量资料假设检验错误

2.1 单因素方差分析（ANOVA）两两比较误用两独立样本t检验

在医学论文中，这是定量资料假设检验最常见的统计学错误。

例1 某作者比较了正常对照组和缺血性脑血管病患者有斑块组及无斑块组的同型半胱氨酸（Hcy）和基质金属蛋白酶－9（MMP－9）水平，采用两两比较的t检验，结果见表1。

错误分析：该研究目的是想比较对照组、有斑块组和无斑块组这三个独立样本来自的总体均数是否有差异，属于多组样本均数的比较。t检验只能用于2个成组样本均数的比较，本例应该采用单因素方差分析。若差异有统计学意义，则可进行多个样本均数的两两比较，如q检验等。

对处理观测指标（本例是Hcy和MMP－9观察值）是定量的、影响因素（本例是分组）是定性的实验资料，无论有多少个组，也无论有多少个影响因素，很多人不加思索地就选择t检验。这也是很多方差分析误用成t检验的原因。如果3组或3组以上的计量资料分析时采用t检验，会增大第一类错误的概率。当进行n次假设检验时，则总的推断结论犯第一类错误的概率就是1－（1－a）n，a为进行一次检验时犯第一类错误的概率（统计学一般定义为0.05），n为均数使用的重复次数。本例中n为3（两两比较3次），计算犯第一类错误的概率为1－（1－0.05）3＝0.1426，远远大于0.05。由此可见，单因素方差分析误用成两两独立样本t检验，会更容易得出差别有统计学意义的结论。

另外此表格设计也是不合理的。如果是假设检验，在统计表格中需要列出假设检验方法统计量的值，在根据统计量值的大小来判断p值的大小。此表格中没有列出每组假设检验统计量的值和p值，并且p值的大小一般是没有＜0.001这个界点的，一般为＜0.01或＜0.05。更合理的表格如表2。

表1 3组Hcy及MMP－9水平的比较

2.2 定量资料误用成卡方检验

卡方检验是一种用途非常广泛的假设检验方法，常用于两个或多个率或构成比之间比较，通常用于计数资料的统计推断。

例2 某作者欲比较新观念剖宫产和腹部横切口剖宫产两种手术方法的手术时间、术后排气时间和术中出血量的差别，分析结果见下表2。该文作者认为，两种方法剖宫手术从手术时间、术中出血量、术后排气时间指标都有明显缩短及减少。两组经卡方检验，P＜0.01，具有显著性差异。

错误分析：从表中我们可以看出本例的结果变量（手术时间、术后排气时间和术中出血量）都是定量变量，变量值表现为数值的大小，因此资料为定量资料，不符合卡方检验的适用条件。本例中分组变量为两组，如果三种变量的观察值符合正态分布，正确的方法是采用两组独立样本均数的t检验。

表2 3组Hcy及MMP－9水平的比较（x±s）

表3 新观念剖宫产与腹部横切口子宫下段剖宫产手术比较

另外此表格设计也是不合理的，一般表格的左侧（横标目）表示被统计分析的事物（本例为两种剖宫产的手术方法），即统计表的主语；表格的上端（纵标目）表示主语的各项指标（本例为手术时间、术后排气时间和术中出血量），并且应列出两组的例数n。如果使用卡方检验也应写出确切的卡方值，具有显著性差异应改为差异具有显著性。合理的表格如表4。

2.3 配对t检验误用成两独立样本t检验

例3 某研究采用Lysholm膝关节功能评分评定手术前后的膝关节功能，作者采用两独立样本t检验，结果见表5。

错误分析：本例作者采用自身前后对照，比较治疗前后膝关节功能疗效，而错误地采用两独立样本t检验进行统计学处理。原设计为自身对照配对设计，是最简单的重复测量设计，这种比较应采用配对t检验，若每对数据的差值不服从正态分布时可采用配对比较的符号秩和检验（非参数检验）。

配对t检验和两独立样本t检验有不同之处：①两者设计类型不同；②观察的内容不同，两独立样本t检验是比较两样本均数代表的总体均数有无差异，而配对t检验是在同一个体上进行实验，以观察每个实验单位处理前后（或两种处理方法）两次结果的差值平均数来推断某处理因素对同一样本处理前后（或两种处理方法）有无差异；③配对t检验最大程度地减少了个体变异对处理问变异的可能影响，用较少样本可得较多的信息，同时提高了检验效能。

表4 新观念剖宫产与腹部横切口子宫下段剖宫产手术比较

表5 治疗前后Lysholm膝关节功能评分比较

3 讨论

假设检验是用样本的信息推断总体的某个特征是否成立，换句话说它的目的是研究理论总体。如果我们在进行假设检验的时候选用的方法不恰当甚至是错误的，那我们得出的结论肯定也是不正确的。在分析医学研究数据中的定量资料时，切忌只关心P值的大小而忽视统计分析方法的适用条件，盲目套用公式而造成统计分析方法的误用。换句话说，合理地选用统计分析方法，是得到正确结论的关键所在。

以上例举的错误类型在各种医学文献中较为普遍，提示我们医学科研工作人员的统计分析知识比较薄弱。在实际应用中，医学科研工作者应进一步学习和掌握最基本统计学分析方法的概念及其应用条件，这些远比掌握具体的检验步骤更为重要。同时医学期刊也应加大对稿件中统计学分析方面的审查力度。只有这样，才能使医学论文中统计学方法应用上的缺陷和错误得以弥补和改正，从而保证论文的科学性和结论的可靠性。

［1］姚应水，刘更新 .预防医学［M］.西安：第四军医大学出版社，2011：169.

［2］胡良平 .影响我国医药科技事业发展的要因分析及其对策研究［J］.医学情报工作，2003，49（2）：152～154.

［3］王倩，张博恒 .五种中华医学会系列杂志论著中统计方法的应用现状［J］.中华医学杂志，1998，78（3）：230～233.

［4］张亘稼 .略论科技期刊论文中统计方法的误用［J］.中国科技期刊研究，2012，23（3）：413～414.