医学期刊编辑应注意文章的数据统计

2016-03-28 03:17刘焕英陈珊茗
传播与版权 2016年10期
关键词:错误检验方法

刘焕英 唐 颜 陈珊茗

医学期刊编辑应注意文章的数据统计

刘焕英唐 颜陈珊茗

数据的统计方法对文章的结果和结论有重要的影响,针对医学论文中统计方法应用的重要性,从研究设计、统计软件的选择、统计方法、统计描述及统计图表几个方面分析了统计分析中常见的错误。编辑对稿件进行加工时应注意文章的统计分析,从研究设计到结果描述进行严格审核,指导作者选择正确的方法,提高稿件的科学性。

医学期刊;编辑;数据统计

数据统计是论文的基础,是医学论文写作上不可或缺的环节,正确使用统计方法能使研究的结果和结论更科学、严谨和可靠。医学期刊论文的统计学问题已经成为衡量论文质量的重要标准,统计学的错误会导致论文学术水平及学术质量的降低。

一、统计研究设计的审核

研究设计是工作的源头,良好的研究设计是顺利进行科学研究和数据统计分析及统计推断的先决条件,也是获得预期结果的重要保证。研究设计主要包括专业设计和统计设计两部分,专业设计是基础,统计设计是对资料搜集、整理和分析全过程总的设想和安排。医学科学研究中常用的方法有实验研究、调查研究、实地研究和文献研究,特别是实验研究和调查研究用得最多。编辑在对论文处理时发现,实验设计和调查设计存在不少问题。

大多数实验设计存在以下错误:(1)未按照实验设计的基本原则要求设立对照组,临床试验应设立对照组,病例报告类文章则无须设置对照组。对照是比较的基础,设立对照组是控制混杂因素和偏倚的重要手段,只有设立对照组,处理因素的效应才会充分显露出来;不设立对照组往往会导致错误的结论,误将处理因素造成的偏倚当成处理效应。(2)设立的对照组没有满足组间的均衡性,把非处理因素造成的偏倚当成处理效应。在整个实验过程中,对照组和实验组应始终处于同时同地,即应设同期对照组。尽量不要用历史对照或其他研究的资料作为对照。对照组设立后应对各组的基线资料进行统计分析比较,检验对照组及处理组开始时的状态是否均衡。(3)实验设计的受试对象没有按随机化原则分组。使用随机的方式、对大量不可控制的非处理因素的重要手段,使每个受试对象有同等的机会被分到实验组和对照组中。它可使不可控制的混杂因素在实验组及对照组中影响相当,可视为实验误差。在实际实验中,随机化可通过随机数字表和计算机的伪随机数来实现。(4)实验研究没有进行重复,使实验误差过大。因实验误差是客观存在的,只有在相同的实验条件下对同一观察指标进行多次重复测定,才能准确算出误差的大小。

调查问卷在医学论文中应用也比较多,它是通过有针对性地设计一系列的问题,直接对调查对象进行调查的一种方法,医学研究中主要用于病因探讨。调查设计包括调查研究资料的收集、整理和分析全过程的计划和安排。调查设计类稿件主要存在的问题:(1)调查问卷的定义不够准确,调查问卷的问题较含糊,使调查对象无所适从,搜集到的数据不准确[1]。(2)调查表的问题使用了不确切的词,如“很久”“经常”“一些”等副词或形容词。调查表制定的问题带有引导式的提问或有断定性问题,引导性的问题会使被调查者偏向同意问题中的暗示的结论。引导式的提问是调查的大忌,常会导致出现严重偏倚的结论。(3)没有对调查表的内容进行效度、信度及可接受性进行考评。其中信度与效度的考评方法适用于各条目均有和分的调查表,信度与效度的相关系数越接近1越好,越接近0越差。(4)调查的抽样方法使用错误,使调查结果的抽样误差过大。(5)调查表没有对样本含量进行估计,样本含量过大过小都有其弊端。样本含量过小,研究所得指标不稳定,检验的功效低,推断总人体模型的精密度和准确度差,难以获得正确的研究结果。样本量过大,浪费人力物力和时间,还会引入过多的混杂因素,从而影响数据的质量。

二、数据处理软件的审核

目前,医学期刊中采用频率较高的统计学软件为SPSS、SAS、STATA、PEMS等,其中以SPSS软件使用最为常见[2]。所有论文均需对数据处理所用软件、版本、具体方法及检验水准进行详细表述。SPSS和SAS进行统计分析时没有给出假设检验的显著性水平,或者没有根据数据的类型给出正确检验方法。统计方法描述不准确如卡方检验里面,当n<40及T<1时采用χ2检验确切概率法进行检验,但大部分的稿件只笼统地描述为“χ2检验”。

三、统计方法的审核

医学期刊中最常用的统计推断方法为t检验、χ2检验、F检验、方差分析、相关分析、回归分析。处理稿件时比较常见的错误:(1)t检验使用不当,t检验一般用于两组资料的对比,对数据要求正态、随机。多组资料的分析用方差分析,方差分析的前提条件是样本独立随机,正态分布,方差齐。稿件中作者往往没有对数据进行方差齐性检验,对方差不齐的数据也用此检验,导致检验结果不可靠。多组资料比较差异有统计学意义时,再选择合适的方法进一步两两比较,而非简单选用两样本的t检验,增加犯一类错误的概率。(2)卡方检验方法或结果选择错误,部分文章随意使用卡方检验。卡方检验的适用范围为:当n>40且T>5时,使用一般的卡方检验;但当1<T<5,或n≥40时,应采用校正后的χ2检验;当n<40及T<1时采用χ2检验确切概率法进行检测。对卡方检验结果选择错误,一般的卡方检验所读结果为peason chi-square,校正的卡方检验所读的结果为continuty correct,确切概率法检验结果为fisher’s exact test。(3)相关分析和回归分析混淆,相关系数和决定系数使用错误,相关分析主要是用于分析两变量的相关关系,回归是从预测的角度反映两变量的变化规律。(4)相关分析时,只求出相关系数,并没有对相关系数进行统计检验[3]。

四、统计结果描述的审核

一般来说,选择了合适的统计软件,运用正确的统计方法对数据处理后,数据的标注问题不大。统计结果描述的常见错误有以下几种:(1)对于符合正态分布的定量数据的描述,一般用“均数±标准差”或“均数±标准误”表示,而非正态分布资料则用中位数、四分数间距或众数来表示。(2)对于定性数据,要正确区分构成比和率。率和构成比是两个不同的概念,不能混淆更不能以率代替构成比,构成比是说明各组成部分的比重或分布,而率是说明某现象发生的频率或强度。用率和构成比对资料进行比较时,要注意资料间的可比性,合并计算分组资料的率时,不能简单相加。(3)算术均数、向何均数及中位数的误用。算术均数适合正态分布的数据,几何均数适合等比数据,而中位数适用于大样本偏态分布的数据。(4)对统计学上的P值理解错误,仅根据P值的大小得出相应的结论。在实际工作中比较常见的错误表述是“P<0.05”认为差异显著,“P<0.01”认为差异非常显著,“P<0.001”认为差异极其显著。其实P值并不代表各组数值差异的大小,P值越小只能说明组间的比较有差异,而不能反映研究对象差异的大小。(5)统计值或P值描述不清以及统计值缺失问题。许多稿件对统计结果进行描述时,没有完整地描述统计值和P值,统计结果未列出具体的P值,仅用“P<0.05”或“P>0.05”得出结论,或仅列出具体的P值,缺少相应的统计值。(6)直接在论文中写P=0。SPSS对数据进行统计分析时,当P值过小的情况下,系统会输出P=0.0000,但实际上P值并不等于零,应描述为P<0.001或P<0.0001[4]。

五、统计图表的审核

论文中的数据一般以统计图或统计表来表示,统计图与统计表的错误非常常见,稿件中常见的图表问题:(1)统计表违背了编排规范,主谓安排不当,标目重复。编排规范上的错误主要是由于作者对规范掌握不足,而统计表格的错误主要是由于作者的主观偏好或列表习惯所致。(2)横纵标目不明确,主辞和宾辞倒置。个别作者为了统计表格的美观,纵横标目倒置,以至于表格不能表达本来的意义。(3)统计表中缺少显著性结果的标注,有些表格有多个因素需要用不同的符号或字母进行标注,表格中没有作含义说明,标注不明确。(4)统计图中有统计学差异结果的标注。有些图没有标准差或标准误,有些多种标识没有图注。审核标注结果时,图表需简单明了,做好相应的图注和表注。(5)统计图中的坐标单位选择不当、图例形式选择不当和坐标轴缺失等。(6)统计图中坐标轴上各标值线间隔表示的数量不相等,当坐标标值不等距且有一定规律时,可改为对数坐标或半对数线图或改为直条图[5]。

编辑不仅要注意统计图表中的数据标注问题,还要审核图表的文字描述,文字描述要与图表的表述相一致。当统计分析结果显示差异没有统计学意义时,作者表述时不宜用略有增加减少,或者描述为呈增加或减少的趋势等。

六、结语

统计分析方法的正确与否关系到科研结果的可信度及有效性高低,对数据处理方法的合理性及科学性的把握,影响到论文学术质量[6]。编辑加工时应注意文章的数据统计,从研究设计到统计软件选择再到数据统计指标、文字描述及统计图表都要认真审核,提醒作者运用正确的方法。要做好统计学的审核工作,需培养编辑人员的统计能力。首先,要提高编辑人员的统计学水平,采用多元化渠道对统计学知识进行学习;其次,聘请统计学专业的专家给予指导[7]。

编辑对数据统计方法的认真审核,有助于作者自觉地按照规范的方法进行医学研究设计、数据分析及数据推断,而且有助于编辑对研究设计的结果核实,更有助于满足meta分析等文献再分析的需要。统计软件和统计方法的选择正确能提高结果的可信度,从而提高论文的科学性。

[1]邵晓军.科技期刊编辑应注意统计描述中的错误[J].赤峰学院学报(自然科学版),2011(8):208-210.

[2]张巧莲,杨晨晨.3种医学期刊统计学软件及统计学推断方法应用现状分析[J].新疆医科大学学学报,2016(1):126-129.

[3]魏中青.编辑加工时应注意文章的数据统计——以《生态学杂志》为例[J].农业图书情报学刊,2015(3):162-164.

[4]吴艳妮,周春兰,江霞,等.国内护理学统计源期刊论文中报告精确P值常见错误:P=0.000[J].编辑学报,2016(2):133-134.

[5]汪勤俭,耿鹏,刘洪娥,等.科技论文中统计线图坐标标值不等距的处理方法[J].编辑学报,2008(2):118-119.

[6]姜春霞.论医学期刊编辑的统计学审核[J],中国科技期刊研究,2014(6):782-784.

[7]吴学军,廖粤新.科技期刊编辑应注重统计数据的审核[J].编辑学报,2010(5):416-417.

刘焕英、唐颜、陈珊茗(通讯作者),广州市第一人民医院。

猜你喜欢
错误检验方法
在错误中成长
2021年《理化检验-化学分册》征订启事
对起重机“制动下滑量”相关检验要求的探讨
关于锅炉检验的探讨
临床检验检验前质量指标的一致化
用对方法才能瘦
四大方法 教你不再“坐以待病”!
赚钱方法
捕鱼
不犯同样错误