医学科研中常见统计学误用及其防范对策

2014-05-25 00:29陈佰锋陈玉娟姚应水
卫生软科学 2014年1期
关键词:组间错误医学

陈佰锋,陈玉娟,朱 玉,李 杰,姚应水

(皖南医学院,安徽 芜湖 241002)

● 经验交流 ●

医学科研中常见统计学误用及其防范对策

陈佰锋,陈玉娟,朱 玉,李 杰,姚应水

(皖南医学院,安徽 芜湖 241002)

医学科研的整个过程都需要统计学知识,统计学的合理选择及应用直接影响到医学科研的质量。文章分别从研究设计、统计分析、统计学表达、结果解释共4个方面对医学科研中常见的统计学误用进行了归纳分析,并提出了相应防范对策,为医学科研工作者正确使用统计学知识提供参考依据。

医学科研;统计学方法;统计学表达;结果解释

统计学作为一种强大的医学科研工具,广泛应用于国内外各种公开发行的医学期刊中,然而其应用水平往往不尽人意,大量的医学科研论文被指出存在统计学误用[1]。统计学误用往往导致非常严重的后果,如结论错误、数据造假、丢失有价值的数据信息等,医学科研中的统计学误用更是违背了医学伦理学要求,甚至可能导致不良的临床后果[2]。

为了使广大医学科研工作者认识到统计学的重要性,笔者对近年来国内医学期刊中常见的统计学误用从四个方面进行了归纳分析,并提出了相应的防范对策,以提高科研论文质量及我国医学科研的整体水平。

1 研究设计

医学科研顺利开展的前提在于良好的设计,设计阶段的缺陷可能导致整个科研没有意义,甚至得出某些错误的结论[1],这也将严重违背医学伦理学要求。统计学方面的设计主要包括确定研究类型、估算样本含量、确定预期研究成果、选定统计分析指标和方法等。在研究设计阶段应认真考虑统计方面设计。

样本含量、抽样方法、组间均衡性、盲法等科研方法都应在设计阶段叙述清楚。样本含量应在研究设计阶段进行估计,研究中途的退出者应详细记录并体现在论文中,样本含量不足时往往导致检验效能低下,从而增加犯II类错误的风险[3]。抽样方法也应详细介绍,所有的统计推断结论都是基于随机样本得到的,对于“随意取得”的样本没有任何意义。组间均衡性问题也应考虑,仅仅采用假设检验来判定组间基线资料的均衡性是不够的,特别是当样本量较小时,由于缺乏检验效能,结果往往不正确。当组间不均衡时,除非采用多元分析方法(如协方差分析)去校正混杂因素,否则统计学差异就不能简单的归因于实验效应。另外,为了减小研究偏倚,还应尽量采用盲法等方法。研究设计中常见的统计学错误和缺陷见表1。

表1 研究设计常见的统计学错误和缺陷

2 统计分析

同一种数据资料可选择的统计分析方法有很多,但是研究者仍需慎重选择最佳的统计方法。选择任何统计学方法都应严格考虑其应用条件,然而不幸的是,在很多医学期刊中,即使最简单的统计学方法(如t检验和χ2检验等)都常常出现误用(如不满足正态性和方差齐性的两独立样本却采用了t检验)。除了要选择正确的统计学方法,还需要选择正确的计算公式,如进行四格表χ2检验时,公式的选择需要考虑样本含量及理论数的大小。

单因素K(K≥3)水平设计的定量资料,不能简单的对多个组进行两两比较的t检验,否则会增大I类错误的风险[4]。另外,设计初期没有指定的多组间两两比较方法也应避免使用,否则会给人以“经营”统计学显著性结论的印象[5]。多个组的两两比较往往是由于设计缺陷导致,这种缺陷通常可以在研究设计阶段通过咨询统计学家尽量避免。对于多组设计资料的比较,可采用非参数检验或方差分析。如果存在某些可能的混杂因子或者组间基线资料不匹配,还必须采用多元分析方法。数据分析常见的统计学错误和缺陷见表2。

表2 数据分析常见的统计学错误和缺陷

3 统计学表达

医学科研的数据及统计学方法应详细描述,以便读者可以通过相关数据对研究结果进行检验。在论文中,虽然没有必要介绍统计学的具体公式及计算过程,但所选择的统计学方法的类型及其适用条件都应详细说明;另外,对于是否配对设计,以及假设检验的单双侧问题等都应进行说明。有的论文中将统计学方法简单的表述为“选择合适的统计学方法”,虽然表面上作者好像是倾向于使用“合适”的统计学方法,实际上这种表达是不严谨的。

一个好的研究,其统计表达如同数据收集和统计分析一样重要。若数据为正态分布或近似正态分布,用算数均数和标准差描述其集中趋势和离散趋势。表示方法上,采用“均数(标准差)”要好于“均数±标准差”,因为后者容易被误读为95%的置信区间。由于标准误使数据看起来变异度更小,论文中常见用标准误代替标准差进行统计描述的错误,而标准误是统计推断指标而不是统计描述指标,必须避免这种误用[6]。如果资料是偏态分布,应使用中位数、四分位数间距或极差进行描述。然而,研究者应该认识到极差容易受到极端值的影响,因此使用四分位数间距更稳定。若检验方法采用的是非参数检验,应采用中位数、极差或四分位数间距进行描述。此时用均数和标准差进行描述就自相矛盾了。另外,统计描述时仅仅给出了集中趋势指标而没有给出变异指标也是不充分的。

假设检验的P值仅仅反映现有样本中H0成立的概率,它并不能反映组间差异的大小[7]。因此,为了反映组间差异的大小,对于主要的数据和结果还应给出置信区间,而且,除了有每个组的置信区间,还应该有组间差异的置信区间,这样可以为读者提供更多的信息。P值应该写出具体值,而不是简单的给出一个大小范围(如P<0.05或P>0.05),但给出超高精确度P值也没必要(如P=0.00321……),因为根本无法由一般大小的样本含量去论证P值的超高精确度。统计学表达常见的统计学错误和缺陷见表3。

表3 统计学表达中常见的错误和缺陷

4 结果解释

所有的研究结果必须有相关数据的支持,差异有统计学意义的结论必须来自于假设检验;差异无统计学意义时,下结论也要慎重,因为统计学没有差异并不一定说明没有效果或没有差异——特别是结论来自于小样本资料时要考虑犯II类错误的可能性,无统计学差异的结论也可能包含重要的临床发现和对其他研究者有价值的信息。研究结果的解释还需要充分考虑潜在的混杂因子和偏倚。统计分析结果解释错误或缺陷见表4。

表4 统计分析结果解释错误或缺陷

5 讨论

本文通过分析总结医学科研中常见的统计学误用情况,以帮助医学科研工作者提高科研水平,重视数据在科研中的作用。本文分析了一些简单但又很实用的统计学问题,旨在帮助那些没有系统学习过统计学知识的科研人员完善其科研中的统计学设计。然而,随着医学科研对统计学要求的提高,本文所提到的统计学问题还远远不足,其它一些统计学问题如随机对照试验、meta分析、诊断试验等,需要研究者学习更广泛和更深入的统计学知识[8]。

目前有很多非常简单的统计软件包供科研者使用,即便是没有什么统计学知识的研究人员同样可以方便进行统计分析,但是若研究人员缺乏相关统计学知识或相关概念模糊,可能会出现一些错误的分析结果。另外,很多研究都是在设计已经完成之后,在研究过程中出现问题后再去请教统计学专家,此时往往难以避免统计学的不足,从而导致科研的浪费[9]。

有研究表明,医学专业期刊的统计学审核还不够严格,医学杂志编辑应该对稿件中相关统计学问题进行专审。在论文发表前,需要统计学专家对所有统计学问题进行审核,杂志也应该在“稿约”中规定相关统计学的要求[10]。

生物医学研究中统计学知识关系到一个病人的存活或者死亡、关系到健康的改善或损害、关系到医学科学的进步或者错误。医学科研的进步需要合理的统计学实践,研究者、杂志编辑、大学老师、统计学专家等,无论其水平和职业都有义务以专业性、合乎伦理的态度,严谨的应用统计学方法来促进科学研究。

[1] ALTMAN DG.Statistics in medical journals: some recent trends[J].Stat Med,2000,19(23):3275-3289.

[2] GARDENIER JS,RESNIK DB.The misuse of statistics:concepts,tools,and a research agenda[J].Account Res, 2002,9(2):65-74.

[3] OLSEN CH.Review of the use of statistics in Infection and Immunity[J].Infect Immun,2003,71(12):6689-6692.

[4] 王 倩,张博恒.五种中华医学会系列杂志论著中统计方法的应用现况[J].中华医学杂志,1998,78(3):230-233.

[5] MOREIRA ED,STEIN Z,SUSSER E.Reporting on methods of subgroup analysis in clinical trials:a survey of four scientific journals[J].Brazilian J Med Biol Res,2001,34 (11):1441-1446.

[6] NAGELE P.Misuse of standard error of the mean (SEM) when reporting variability of a sample.A critical evaluation of four anaesthesia journals[J].Br J Anaesth,2001,90 (4):514-516.

[7] 孙红卫,董兆举,赵拥军.对统计假设检验的误解与误用[J].中国卫生统计,2012,29(1):147-150.

[8] MOHER D,SCHULZ KF,ALTMAN DG.The CONSORT statement:revised recommendations for improving the quality of reports of parallel-group randomised trials[J].Lancet, 2001,357(9263):1191-1194.

[9] ALTMAN DG,GOODMAN SN, SCHROTER S.How Statistical Expertise is used in Medical Research[J].JAMA,2002,287 (21):2817-2820.

[10] 王 玖,徐天和,祁爱琴,等.医学论文统计学误用及其防范对策[J].编辑学报,2002,14(6):417-418.

(本文编辑:何庆节)

Prevention measure to common statistical misuse in medical research

CHEN Bai-feng, CHEN Yu-juan, ZHU Yu, LI Jie, YAO Ying-shui
(Wannan Medical College, Wuhu Anhui 241002, China)

The entire process of medical research requires statistical knowledge. The reasonable selection and application of statistic directly influent the quality of medical research. This paper concludes and analyzes common statistical misuse in medical research as follow 4 aspects: study design, statistic analysis, statistics expression and result interpretation. it is widely recognized that the proper use of statistics is a key element of research integrity. It puts forward relevant prevention measures, providing the reference frame for proper using statistic to medical researchers.

medical research, statistical method, statistics expression, result interpretation

R195.1

A

1003-2800(2014)01-0058-03

2013-07-29

安徽省高等学校省级教学研究项目(20100612,2008jyxm529)

陈佰锋(1980-),男,湖北建始人,讲师,硕士,主要从事流行病学研究。

姚应水(1972-),男,安徽铜陵人,教授,硕士生导师,主要从事流行病学和医学统计学研究。

猜你喜欢
组间错误医学
达格列净对预混胰岛素治疗血糖控制不达标的2型糖尿病患者的疗效和安全性研究
在错误中成长
医学的进步
预防新型冠状病毒, 你必须知道的事
数据组间平均数、方差关系的探究
要背沟,不要“虎背熊腰”
更 正
医学
不犯同样错误
医学、生命科学类