医学论文“统计学处理”常见问题分析及建议

2016-02-13 20:49周英智
中国科技期刊研究 2016年5期
关键词:组间资料软件

■周英智

山东大学自然科学学报编辑部,山东省济南市经十路17923号 250061

医学论文主要由摘要、引言、材料与方法、结果、讨论五部分组成,各部分几乎都会涉及到统计学内容[1]。其中,“材料与方法”部分一般先交代统计设计的类型、对象选择及数据获取的方法,之后将“统计学处理”作为一项独立性的内容予以介绍[2],也有的论文将这部分的小标题命名为“统计学分析”[3]、“统计学方法”[4]。从结构上来说,“统计学处理”根据论文前面介绍的研究目的、科研设计类型、资料性质等确定,而“结果”部分的内容又必须与该部分保持一致。因此,“统计学处理”在全文具有承上启下的作用。如果这部分出现问题,将严重影响整篇论文的学术及编辑质量。许多研究对期刊中的统计学问题做了比较全面的分析[5-7],也有针对某些方面,如摘要中的统计学问题[8]、P值使用错误[9]、统计描述中存在的问题[10]等做了深入分析,而专门针对“统计学处理”中存在问题的报道较少。本文结合典型案例,对“统计学处理”中存在的问题做一系统总结。

1 “统计学处理”的基本内容

国际医学期刊编辑委员会在医学期刊投稿指南中对该部分有详细的要求[11],国内大多数医学期刊在稿约中也有具体的规定。一般来说,“统计学处理”包括统计软件及版本、统计分析(包括统计描述与统计推断)方法、检验水准三部分。以题为《槲皮素对前列腺癌细胞热休克蛋白27表达的影响》为例[12],其“统计学处理”如下:

采用SPSS 17.0统计软件,所有数据以均数±标准差表示,组间比较采用t检验,P<0.05为差异有统计学意义。

从中可以看出,所用软件为SPSS,版本为17.0,统计描述方法为均数±标准差,统计推断方法为t检验,检验水准α=0.05。

2 “统计学处理”中的常见问题

2.1 “统计学处理”内容不全

一些论文只交待统计软件,而不交代具体的统计分析方法;或只交待统计分析方法,而不交待使用的统计软件;还有的不交待检验水准。

例1[3]某研究收集了34例霍奇金淋巴瘤标本,其中结节性淋巴细胞为主型13例,经典型21例,后者又包括4种亚型,检测IMP3和CD30蛋白在霍奇金淋巴瘤H/RS细胞中的表达。“统计学处理”如下:

采用SPSS 16.0分析软件。不同临床病理资料组间抗体表达阳性率比较采用 χ2检验,两组间CD30和IMP3蛋白阳性率分析采用两独立样本非参数检验,多组间CD30和IMP3蛋白阳性率分析采用多个独立样本非参数检验,H/RS细胞的CD30和IMP3蛋白染色强度分析采用两独立样本等级/频数表资料的非参数检验。

“统计学处理”部分交待了统计软件、版本及统计分析方法,但未交待检验水准,需补充。

另外,上面3次提到了非参数检验。非参数检验方法很多,应明确具体的方法。结合本资料,结节性淋巴细胞为主型和经典型霍奇金淋巴瘤之间CD30、IMP3阳性表达率的比较采用Wilcoxon秩和检验,经典型霍奇金淋巴瘤4种亚型之间CD30、IMP3阳性率的比较采用Kruskal-WallisH检验。若要分析CD30和IMP3阳性表达是否存在相关性,宜用Spearman秩相关分析;若要分析它们之间是否存在线性变化趋势,宜用线性趋势检验。

2.2 多组比较未交待两两比较的方法

组数≥3时,一般先进行总体比较,若总体有统计学差异,需进一步进行两两比较。一些论文只是笼统地交待总体比较的方法,却未说明组间两两比较的方法。

例2[13]某研究选择60例健康体检者(对照组)和83例慢性充血性心力衰竭(CHF)患者(心衰组),后者又根据心功能分为3个亚组,比较两组之间、3个亚组之间 NT-proBNP水平,并分析 NT-proBNP水平与心功能的相关性。“统计学处理”如下:

采用SPSS 17.0统计学软件,计量资料采用均数±标准差(x±s)表示,CHF不同分级组间比较采用单因素方差分析,P<0.05为差异有统计学意义。

在结果部分给出了3个亚组两两比较的结果,但文中仅交待它们总体比较的方法(单因素方差分析),而没有给出两两比较的方法,需补充。另外,结果部分还交待了心衰组与对照组比较的结果,而比较的方法却没有交待,应该根据正态性检验及方差齐性检验的结果选择t检验、t′检验或Wilcoxon秩和检验。文中结果还表明,血浆NT-proBNP水平与心衰的严重程度呈正相关,“统计学处理”部分也没有交待相关分析的方法。根据文中材料,宜用Spearman秩相关。

2.3 统计软件与统计推断方法混淆

如前所述,“统计学处理”一般包括统计软件、x±s是未作任何转换的原始数据。

该研究使用的统计软件为SAS 9.2,作者却描述为使用单向ANOVA统计软件,单向ANOVA只是本研究应用的一种统计推断方法。

该论文“统计学处理”部分还存在下列问题:①英文拼写不规范,如各单词首字母大小写不统一;存在拼写错误,如Kruskal误拼为Kruskall,pairwise误拼为pairmise。②多组比较采用单因素方差分析后,若总体差异有统计学意义,则需进一步进行组间两两比较。LSD-t检验是常用的方法之一,LSD的英文全称是least significant difference(最小显著差异),而本例使用了Least Squares Means difference test,是否应修改为LSD-t检验,需与原文作者商榷。两两比较最好选用Bonferroni法,该方法对累计检验水准不超过0.05进行了校正。③根据全国高等医药院校教材的内容[1],建议将“单向ANOVA”改为“单因素方差分析”,“Kruskall-Wallis test”改为“Kruskal-WallisH检验”,“各组间的成偶对比”改为“组间两两比较”,“差异有显著性统计学意义”改为“差异有统计学意义”。

除了以上问题外,该论文仅交待将肥胖大鼠分为3组,而一共多少、每组多少只没有交待。这是科研设计最基本的内容,文中忽略实属不该。

2.4 统计学基本概念模糊

掌握统计学概念是做好统计学处理的基础,如果连统计学的基本概念都不清楚,其他就无从谈起,而有些论文中的说法令人费解。统计推断方法等内容。常用的统计软件有SAS、SPSS、STATA等,它们均能提供常用的统计推断方法。也就是说,一种软件可以提供多种统计推断方法,而同一种统计推断方法可由不同的软件实现,而有的论文却把统计软件与统计推断方法混淆了。

例3[4]某研究将大鼠分为3组,分别给予不同的饮食,观察肝脂肪量、肝脂肪酸组成等指标的变化。“统计学处理”如下:

采用单向ANOVA统计学软件分析数据(SAS Institute Inc.,version 9.2)做组间差异分析。所有不呈正态分布的数据做对数转换。经对数变换后仍不呈正态分布的数据,采用Kruskall-Wallis test做差异显著性检验。用Least Squares Means difference test做各组间的成偶对比(pairmise comparison)。P≤0.05为差异有显著性统计学意义。x±s表示,多组间比较采用单因素方差分析的SNK法,两两比较采用t检验;率的比较采用χ2检验或Fisher精确检验。

为了弄清上面存在的问题,首先简单介绍一下单因素方差分析及其应用条件。对于完全随机设计的定量资料,若处理组(水平数)≥3,应先对资料进行正态分布检验。如果原始资料或经数据转化后的资料符合正态分布且方差齐同,则可采用单因素方差分析;如果符合正态分布但方差不齐可采用校正的方差分析,否则不宜用单因素方差分析。若总体有统计学差异,则可采用SNK-q检验等方法进一步进行组间两两比较。因此,上面提及的“多组间比较采用单因素方差分析的SNK法”不妥。进一步分析原文具体内容,计量资料的比较仅限于轻度镇静组和常规镇静组,作者采用了t检验,而没有用到单因素方差分析及SNK-q检验,因此这句话应该删去。

论文“结果”部分给出了两组患者生存曲线,并进行了比较,而具体方法并没有在“统计学处理”中交待。应根据实际应用的方法予以补充,如Kaplan-Meier法、log-rank检验等。另外,“统计学处理”中未交待检验水准,也应予以补充。

2.5 统计描述与统计推断方法不一致

统计分析包括统计描述和统计推断,前者指用恰当的统计指标,描述资料的数量特征及其分布规律,后者指在一定可信程度下由样本信息推断总体特征[1]。“统计学处理”中必须注意它们的内在联系。

例5[15]某研究根据Barthel自理能力评分将患者分为4组,比较每日直接护理工作量,并对自理能力评分、护理工作量进行相关分析。“统计学处理”如下:

将所有收集的数据录入Excel表格中建立数据库,导入SPSS 17.0软件,采用均数±标准差(

例4[14]某研究将78例机械通气患者分为轻度镇静组和常规镇静组,比较两组镇静药物剂量、机械通气时间、ICU住院时间、ICU病死率、并发症和不良反应发生率,并测定入住ICU 48 h炎症指标。“统计学处理”如下:

采用SPSS 13.0统计软件,计量资料以x±s)描述,应用Kruskal-Wallis非参数检验及Spearman相关分析进行统计分析。

对于单因素多水平设计的定量资料,如果满足独立性、正态性和方差齐性,首先考虑单因素方差分析。如果不满足上述条件,则可选用Welch方差分析或Kruskal-WallisH检验。本研究应用了Kruskal-WallisH检验,很可能原文作者已经注意到了资料不符合正态分布。再看文中数据,许多呈明显的偏态分布,如护理人员在“健康宣教、沟通交流”方面用于 4组的时间(min)分别为78.18 ±208.33、85.85 ±190.22、95.41 ±524.88、77.09±308.67。对于偏态分布的资料,不应用x±s描述,而宜用中位数和四分位间距表示。这样,统计学处理中有关统计描述与统计推断的方法才能保持一致。另外,“统计学处理”中未交待检验水准,需补充。

2.6 “统计学处理”与“结果”内容不一致

“统计学处理”部分交待了统计描述及统计推断的方法,“结果”部分则根据这些方法,以文字、统计表、统计图的形式交待研究结果,前后内容一定要呼应。

例6[16]某研究观察试验性栓塞治疗上消化道出血的临床疗效,“统计学处理”如下:

采用SPSS13.0软件进行分析,采用t检验比较计量资料,χ2检验比较计数资料,P<0.05为差异有统计学意义。

查阅“结果”部分,发现只有计数资料,并无计量资料,也就没有采用t检验,因此,“计量资料采用t检验”应删掉。

2.7 “统计学处理”中含有“结果”部分的内容

“统计学处理”部分交待统计描述与统计推断的方法,而统计结果则应在“结果”部分给出,一定不要把这两部分内容混在一起。

例7[17]为探讨分化型甲状腺癌术后131I联合利可君治疗的可行性,根据治疗方案将167例患者分为3组,比较其疗效。“统计学处理”如下:

采用SPSS 17.0软件进行数据处理和统计分析,应用ANOVA方差分析进行组间对比和卡方检验。P<0.05表示差异有统计学意义。两两比较结果显示任意两组组间差异无统计学意义(P<0.05)。

最后一句不够具体,不知道哪些指标的比较,令人不知所云。查看原文结果得知,3组治疗前WBC和PLT差异无统计学意义。此处的意思应为3组间两两比较,WBC和PLT差异均无统计学意义。这是统计学结果的内容,不应放在“统计学处理”部分。实际上,如果方差分析总体无统计学差异,就没有必要再进行两两比较。因此,这句话可以删掉。这句话还存在另一问题,“任意两组组间差异无统计学意义”与“P<0.05”相矛盾。

另外,“应用ANOVA方差分析进行组间对比和卡方检验”语序上不够通顺,而且“ANOVA方差分析”也不通,因为ANOVA是analysis of variance的缩写,就是“方差分析”的意思。根据文中内容推测,此处的“ANOVA方差分析”应为“单因素方差分析”。

3 “统计学处理”存在问题的原因分析与建议

“统计学处理”存在上述诸多问题,可能因为下列原因:①对统计学基础知识了解不深,不能发现其中的问题,对这部分内容的编辑存在畏难情绪,无法给作者提出正确的修改意见。②缺少统一的编辑规范,随意性强,不注意内容是否全面、表述格式是否统一。③不注意“统计学处理”内在的联系,如统计描述与统计推断的方法不一致。

针对上述原因,提出以下建议:①几乎每一篇医学论文都含有统计学内容,如果不懂统计学,医学编辑可能一直处于“糊涂”状态。因此,要注重统计学知识的学习,将统计学审核作为日常工作的重要内容[18]。②制定期刊统计学审核标准[19],明确“统计学处理”的主要内容及其先后顺序,按照全国高等医药院校教材的要求规范使用统计学术语。③编辑论文时注意全文各部分统计学内容之间的联系,注意“统计学处理”部分的内容与前文所述的研究目的、科研设计、资料类型是否一致,与“结果”部分相应的内容是否一致。④发挥编辑对作者的引导作用[20],严格要求作者按照正确的统计学方法修改论文。⑤对于一些涉及比较复杂统计学方法的论文,请富有经验的统计学专家评审[7]。不少期刊聘有统计学编辑,这种做法值得借鉴。

[1] 孙振球.医学统计学[M].3版.北京:人民卫生出版社,2013.

[2] 胡良平,鲍晓蕾.呼吸系统科研设计与统计分析[M].北京:军事医学科学出版社,2013:249-252.

[3] 葛娟,汤红平,简文静,等.IMP3和CD30蛋白在霍奇金淋巴瘤H/RS细胞中的表达及意义[J].诊断病理学杂志,2014,21(12):751-754.

[4] 石红,潘瑞,洪晶安.共轭亚油酸同分异构体对肥胖大鼠脂肪肝的影响[J].肠外与肠内营养,2014,21(1):51-54.

[5] 章新生,刘璐,姚仁斌,等.医学稿件中统计学分析使用调查[J].中国科技期刊研究,2011,22(3):393-395.

[6] 梁明佩,潘明志,唐毓金,等.广西医学类科技期刊常见统计学错误浅析[J].传播与版权,2015(5):38-39.

[7] 彭芳,董燕萍,金建华,等.重视医学期刊中统计学问题的审查[J].科技与出版,2013(11):43-46.

[8] 冉明会.医学期刊编辑应重视摘要中统计学著录问题的审编[J].编辑学报,2014,26(3):238-240.

[9] 陈章颖.生物医学期刊中常见的P值使用错误[J].编辑学报,2014,26(2):137-139.

[10] 王曼.医学论文统计描述性数据审核的问题与方法[J].中国科技期刊研究,2015,26(4):359-362.

[11] International Committee of Medical Journal Editors.Recommendations for the Conduct, Reporting, Editing, and Publication of ScholarlyWork in Medical Journals[S/OL].[2015-10-07].http://www.icmje.org/icmje-recommendations.pdf.

[12] 于峰,姜丽丽,邸彦橙.槲皮素对前列腺癌细胞热休克蛋白27表达的影响[J].中国医学科学院学报,2014,36(5):506-509.

[13] 张庆,王枭旻,王素琴,等.血浆NT-proBNP在老年慢性充血性心力衰竭诊断中的价值及其与心功能的关系[J].实验与检验医学,2014,32(5):498-499.

[14] 蔡燕,李勇,吉木森.轻度持续镇静对重症机械通气患者预后和炎症水平的影响[J].中华结核和呼吸杂志,2014,37(11):820-823.

[15] 江会,陆海燕,顾艳.Barthel自理能力评分与护理工作量的相关性研究[J].护理研究,2014,28(12A):4238-4240.

[16] 黄振,何晓峰,庞桦进,等.试验性栓塞治疗上消化道出血的临床疗效分析[J].中国介入影像与治疗学,2014,11(1):11-14.

[17] 王荣福,王飞,李颖,等.分化型甲状腺癌术后131I联合利可君治疗的临床应用研究[J].标记免疫分析与临床,2014,21(1):19-21.

[18] 姜春霞.论医学期刊编辑的统计学审核[J].中国科技期刊研究,2014,25(6):782-784.

[19] 姜春霞.在办刊实践中培养编辑统计学素养——以《郑州大学学报(医学版)》为例[J].编辑学报,2014,26(3):287-288.

[20] 姚实林,马宗华.科技期刊编辑对作者的引导作用[J].中国科技期刊研究,2011,22(5):752-754.

猜你喜欢
组间资料软件
达格列净对预混胰岛素治疗血糖控制不达标的2型糖尿病患者的疗效和安全性研究
禅宗软件
Party Time
PAIRS & TWOS
JUST A THOUGHT
数据组间平均数、方差关系的探究
软件对对碰
要背沟,不要“虎背熊腰”
更 正
即时通讯软件WhatsApp