郭晋,李卫
在临床医学研究中,统计学作为重要的分析手段已被广大临床医生所认同。因为临床医学研究的对象是人,作为最高等的生物体,人体出现的各种现象充满了变异性也存在许多规律性,统计学就是通过差异描述规律;透过现实走向理性,走出混沌,走向秩序的学科。
一项临床研究项目,统计学研究设计、方法运用质量的高低反映了这个项目科学性、严谨性。希腊约阿尼纳大学的Ioannidis等人对1990-2003年期间发表在N Engl J Med、JAMA和LANCET三种著名医学杂志上,而且引用次数在1000次以上的文献进行调查。结果显示,在49篇高引用率的原始文献中,45篇声称干预方法有效,而报告结果被以后的研究所否定的有7篇(15.6%),最初报告的疗效被夸大的有7篇(15.6%),因此接近1/3的研究结果没有经受住时间的考验[1,2]。如果这些研究在研究伊始,就能够重视统计学在试验设计、资料收集与整理、资料表达与描述、结果分析、结果解释和结论陈述等各环节的应用,我们相信更多令人信服的结论会出现。针对临床医学科研中统计学的应用,国家心血管病中心医学研究统计中心将逐一介绍相关的理论和方法,以期帮助广大临床医生提高统计学的应用水平。
本期杂志,我们首先介绍统计学的基本内容,概率的定义和医学解释。
在医学科研和科研论文写作时,我们经常会见到P<0.05的情形,要搞清楚这个问题,就要明白随机事件的概念。在自然界和人类社会中,存在着两类不同的现象:一种叫确定性事件,是指在一定条件下,一件事肯定发生或肯定不发生,如秋季过后,冬季必然会来临,而不可能是夏季。另一种叫随机事件,比如,抛掷一枚硬币,结果可能是国徽向上,也可能币值向上,抛掷前不能肯定。
对于随机事件的发生情况,我们用概率(Probability)来描述,概率用P值来表示。P值反映了事件发生可能性的大小。概率用从0到1之间的小数表示,也可表示为百分数。
比如,我们希望知道某种降压药物的有效性。为此,我们设计了一个试验,有300个高血压患者陆续接受了治疗,其中240人用药后降压效果明显,有效率为=80%,这个数字是经过了300次试验得到的。就像仍硬币一样,扔的次数越多,国徽向上的可能性就越接近50%。同理,对于这个降压药而言,其有效的可能性就是80%,简单的理解,如果有第301个人用此降压药治疗高血压,用药有效的可能性为80%。
统计学检验的目的是检验样本之间的差别是来源于抽样误差的可能性大小。P<0.05是说明样本之间的差别是不可能来源于抽样误差,而是事实存在的差别。还以上述高血压试验为例。假如这300个人又服用了另外一种药物,结果有210个人降压效果明显,有效率70%,问题是第一种药和第二种药的降压效果到底有无区别呢?我们通过合适的统计学方法进行统计学检验和计算,会得到一个P值,如果P<0.05,就说明我们的这次试验表明,两种降压药物是等效的这种可能很小,是小概率事件,从而证明这两种降压药的有效性是有差别的。
P<0.05的正确表达应为“差异(或差别)有统计学意义”,并不含有差异非常大的意思。“差异(或差别)显著”或“差异(或差别)非常显著”是从英文翻译过来的,原文statistical significance并不含差异大或非常大的意思。P>0.05的正确表达为“差异(或差别)无统计学意义”,并不能说明所检测的对象有无差别,可能有差别,但是试验的结果没有证明有差异,没有达到有统计学意义的水平。
[1]蒋文.临床研究结果面临时间的考验.中国医学论坛报,2005,21.
[2]Ioannidis JP.Why most published research findings are false.Plos Med,2005,2:e214.