刘欢欢,周龙,温潇潇,彭亚光,赵连成
技术与方法
《中国循环杂志》 刊出论文的统计学方法评价
刘欢欢,周龙*,温潇潇,彭亚光,赵连成
目的:评价《中国循环杂志》刊出论文的统计学方法的使用情况及存在问题。
期刊;统计学;评价
(Chinese Circulation Journal, 2017,32:284.)
统计分析方法的合理、正确使用是保证医学研究结果正确的重要因素之一,统计学方法使用不当可降低研究质量,甚至得出错误的结论,有可能对临床实践造成误导。同时,医学研究中统计分析方法是否存在错误或瑕疵,也可从侧面反映所在刊物的质量和水平。国内外一些医学专业杂志通过对刊出的文章进行统计学评价,提出改进建议[1-5],以提高发表论文的质量和刊物的水平。《中国循环杂志》创刊于1986年,至今年已有30年,2013年由双月刊改为月刊,发表的文章数量有所增加,期刊质量不断提升,刊物的影响因子也有明显提高[6]。为进一步提升杂志的学术水平和影响力,我们对本刊的2010年、2011年及2015年度刊出的文章进行统计学方法的评价,并分析其变化,以期发现不足和尚需改进的地方,为进一步提升刊物的质量提供科学依据。
资料来源:选取《中国循环杂志》2010年第1~6期,2011年第1~6期,2015年第1~12期中的“专题研究”“临床研究”“基础和实验研究”三个栏目中刊出的论著类文章,对杂志其他栏目所涉及的评论、综述、病例报告等文章未纳入分析。因刊物2010年和2011年为双月刊,故将这两年的资料合为一组与2015年进行对比评价。
研究方法:采用统一的文章评价表格,收集信息包括研究设计类型、方法学部分中对统计学方法的描述、实际使用的统计方法、结果解读和对统计学方法的评价。由两位评阅人分别通读文章并提取和归纳信息,判断其统计学方法的描述或使用是否恰当。交叉评阅发现不一致的地方由两人协商取得一致,若无法取得一致,则与第三人讨论最终达成一致。
根据《中国循环杂志》的收稿特点,文章归纳为以下4种研究设计类型:以患者为对象的临床研究(包括现况研究、病例对照研究、随访研究、随机对照临床试验、诊断试验)、以动物或细胞为对象的实验研究、人群流行病学研究及Meta分析。统计检验方法包括t检验、卡方检验、方差分析、秩和检验、相关分析、回归分析(包括线性回归和Logistic回归)、生存分析。如果未使用以上任何统计检验方法、仅对数据进行统计描述(如均数、标准差、中位数、四分位数或百分比等),则归为仅涉及描述性统计的文章。本次评价主要从方法学部分对统计方法的描述与实际使用的统计方法两个方面对文章进行评价。
方法学部分中,对统计方法的描述存在的问题可归类为:描述的统计方法实际未使用、用到的统计方法未进行描述、对实际用到的统计检验方法的描述存在欠缺或错误。其中,描述欠缺主要是指对统计检验方法描述的不够全面,如文章中使用了独立t检验和配对t检验两种,但只描述为t检验或只描述了其中一种;描述错误是指方法学部分对统计检验方法介绍错误,如方差分析中描述用t检验进行多组均值的两两比较等。
统计方法使用错误包括以下情况:(1)忽略研究设计错用统计方法,如配对资料设计类型用独立样本t检验、多组间均值的比较用t检验等。(2)忽略统计分析方法使用的前提条件,如偏态分布类型的资料错用参数检验进行分析等。文章中只要出现任何统计方法使用有误即判断为统计学方法使用错误,根据出现错误的文章数量分别计算两年的统计检验方法使用错误率。因方法学部分描述不充分或未说明具体使用的方法,对统计方法使用的正确性难以评判时,则归为无法判断统计方法使用是否正确,如在卡方检验中,理论频数过小时应进行校正或使用Fisher精确概率法,但方法学部分未进行说明。
统计分析方法:用Epidata3.1对数据进行双人录入及核对,用 SAS 9.4统计软件对数据进行统计分析。计数资料用例数和百分率表示,组间比较用χ2检验或Fisher精确概率法,以P<0.05为差异有统计学意义(双侧)。
2.1 基本情况
2010年、2011年、2015年杂志共收录论著类文章414篇,其中有10篇未使用任何统计描述或分析,剔除后共404篇纳入最终分析,其中2010年、2011年194篇,2015年210篇。
纳入研究的类型分布(表1):临床研究占的比例最大(75.3%),其主要类型为病例对照研究(23.5%)、随访研究(21.8%)和现况研究(15.4%)。共有366篇(90.6%)使用了统计检验方法,32篇(7.9%)只进行描述性统计,未涉及任何假设检验,另有6篇(1.5%) 为Meta分析。
表1 2010年和2011年、2015年杂志研究类型分布[篇(%)]
404篇文章中使用频率较高的统计检验方法依次为:t检验57.4%(232/404)、卡方检验56.7%(229/404)、方差分析35.2%(142/404)和回归分析23.0%(93/404)。与2010年、2011年相比,2015年秩和检验、生存分析、Meta分析的使用比例上升,而仅进行描述性统计的文章比例下降(表2)。
表2 统计学分析方法使用分布[篇(%)]
2.2 方法学部分统计学方法描述的评价
在404篇文章中,有63篇(15.6%)描述的统计方法文章实际并未使用,161篇(39.9%)未对文章中实际用到的统计方法进行描述,126篇(31.2%)对所使用的统计检验方法描述欠缺或错误。由表3可见,2015年描述欠缺或错误的比例低于2010年、2011年(P=0.02),具体到每类统计方法,描述欠缺或错误的比例均有减少,其中回归分析出现该问题的比例有明显下降(P=0.03)。
表3 统计学方法描述情况
2.3 统计学方法实际使用评价
排除32篇仅进行描述性统计及6篇Meta分析后,对366篇使用统计检验方法的文章进行了评价。如表4所示:共有71篇(19.4%)的统计检验方法使用错误,2015年与2010年、2011年相比错误比例无明显变化(P=0.88)。因方法学部分描述不充分导致无法判断统计学分析方法是否正确的文章共108篇(29.5%),其中2015年度的比例较2010年、2011年度有明显降低(P=0.04)。
表4 统计检验方法使用情况
统计检验方法使用错误情况:t检验中有18.1%(42/232)使用错误,主要为独立t检验与配对t检验使用错误、用t检验进行多组间均值的比较等。方差分析有14.1%(20/142)使用错误,主要为用单因素方差分析处理重复测量资料、用t检验进行多组间的两两比较等。有3.6%(2/55)的文章适用于独立样本t检验或卡方检验,实际错用了秩和检验。有5.5%(4/73)的文章将Pearson相关与Spearman秩相关的分析方法混用,2.2%(2/93)的文章回归分析方法选择错误。
无法判断统计方法是否正确:使用卡方检验的文章中有24.9%(57/229)出现理论频数过小,但未说明是否进行校正或使用Fisher精确概率法;方差分析中有31.7%(45/142)未说明多组均值两两比较的方法;6.9%(5/73)的相关分析、7.5%(7/93)的回归分析未说明所使用的具体方法。
此外,6篇(1.5%)Meta分析的统计方法描述和使用未发现问题,但其中有3篇未充分阐明研究的必要性,1篇未报告异质性检验结果,3篇未报告发表偏倚情况。
本研究对《中国循环杂志》的论著类文章进行统计学评价,主要包括方法学部分的描述和统计分析方法使用的正确性。统计方法使用是否正确,不仅关系到文章的质量和真实性,也对期刊的学术质量产生影响。
方法学部分针对统计方法的描述仍存在以下问题:方法学中介绍的统计方法,结果分析中并未使用,而实际用到的统计方法未进行介绍,描述与使用的统计方法前后不一致。对统计检验方法描述不充分,未对方法的使用条件进行介绍,对所使用的方法介绍不清楚。如文章中用到了卡方检验,但理论频数较小,不满足常规卡方检验的条件,则要在方法学部分指明是否校正或使用Fisher精确概率法。对于t检验,则要指出文中使用的t检验的种类,独立样本t检验或配对t检验,如果两种方法均使用,则要分别交代,描述清楚。此外,在单因素方差分析之后若需进一步两两比较,则要说明两两比较的方法,一般采用LSD或SNK。相关和回归分析也要描述准确,在方法学部分要说明使用的为Pearson相关或Spearman相关分析,线性回归或Logistic回归等,对数据处理方法要标注清楚。本次评价中有108篇(29.5%)文章因方法学部分未说明使用的具体方法或描述不充分,而无法判断统计方法使用是否正确。作为医学研究报告,应对结果分析用到的统计方法详细介绍,若对所使用的统计分析方法介绍不清,或未考虑实际是否使用只是简单罗列,则可能会使读者对文章的真实性和可靠性产生怀疑,影响对文章结果和整体质量的评价。
本次评价发现统计检验方法使用常见错误为:忽略研究设计错用统计方法;忽视统计方法使用的前提条件。在选用分析方法时未考虑设计类型,盲目套用统计方法。如用独立样本t检验分析配对设计资料,独立样本t检验要求组间完全独立,而配对设计资料的组间数据存在一定的相关性,其比较应使用配对t检验。多组间均值的比较错用t检验进行分析,两组以上的定量资料若用多次t检验进行比较,会增加犯假阳性错误的概率,正确的方法是:在资料满足方差分析条件的前提下,多组间均值的比较应使用单因素方差分析,若差异存在显著性,再进一步进行两两比较;若各组均数间都要进行比较,可用SNK法;若各组均与同一对照组比较,则用Dunnet_t检验。在方差分析中,用单因素方差分析处理重复测量资料。研究对同一受试对象的某项指标在不同时点进行多次测量,则测量值间通常存在相关性,违背了方差分析的独立性要求,此时应用重复测量方差分析对资料进行处理。如将研究对象分为治疗组和对照组,比较治疗1个月、3个月、6个月,1年后不同时间点指标的变化,此设计为重复测量设计,应用重复测量方差分析,比较两组不同时间点的指标差异是否有统计学意义。此外,在选用统计分析方法时未考虑统计检验方法的使用条件。如用卡方检验取代Fisher精确概率法,卡方检验对样本量和理论频数有所要求,当计数资料的理论频数过小,不满足常规卡方检验的条件时,应校正或用Fisher精确概率法。选择回归分析方法时,未考虑因变量的类型,若因变量为二分类变量应用Logistic回归,而线性回归则适用于因变量为连续性变量的资料类型。此外,数据的分布类型,如正态性、方差齐性等特征,决定数据的描述用均值和标准差、或中位数和四分位数;资料的检验用参数或非参数检验方法,因此分析前要考虑数据的分布特征,选择正确的统计分析方法。
通过对《中国循环杂志》刊出文章的统计学评价发现,2015年与2010年、2011年相比,统计分析方法使用的正确率有所改善,但在方法学描述、统计分析方法的使用等方面仍存在不同程度的问题。值得注意的是,本次评价中出现的错误多为常见的基础统计分析方法,鉴于本刊的作者多为临床医生,建议加强对基本的研究设计、统计分析方法的知识学习和训练。杂志也可在其刊物或网站上开设学习园地,介绍一些常用的统计学知识,供临床医生学习。另一方面,审稿人、编辑应进一步加强统计学审稿,保证论文的科学性和可靠性,提高期刊的学术质量。
[1] Choi E, Lyu J, Park J, et al. Statistical methods used inarticles published by the Journal of Periodontal and Implant Science. J Periodontal Implant Sci, 2014, 44: 288-292.
[2] 孔群钰,余金明,贾贡献,等. 中华心血管病杂志刊出论文的研究设计及统计学方法再次评阅. 中华心血管病杂志, 2012, 40: 963-966.
[3] Yim KH, Nahm FS, Han KA, et al. Analysis of statistical methodsand errors in the articles published in the korean journal of pain. Korean J Pain, 2010, 23: 35-41.
[4] 张李军,余金明. 中华心血管病杂志刊出科研论文的研究设计及统计学方法分析. 中华心血管病杂志, 2009, 37: 648-653.
[5] 万瑜,马骏,张凤菊. 《中华骨科杂志》论著文章统计学方法应用现状. 预防医学情报杂志, 2007, 23: 212-214.
[6] 《中国循环杂志》编辑部. 心血管中文期刊影响因子排名:《中国循环杂志》第二. 中国循环杂志, 2015, 30: 1062.
Evaluation of Statistical Methods for Articles Published in《Chinese Circulation Journal》
LIU Huan-huan, ZHOU Long, WEN Xiao-xiao, PENG Ya-guang, ZHAO Lian-cheng.
Department of Community Prevention, Cardiovascular Institute and Fu Wai Hospital, CAMS and PUMC, Beijing (100037), China Corresponding Author: ZHAO Lian-cheng, Email: zhaolch@163.com
Objective: To evaluate the applications and problems of statistical methods for articles published in《Chinese Circulation Journal》.Methods: We reviewed the statistical methods for original articles published in《Chinese Circulation Journal》in 2010, 2011 and 2015; general status with problems was analyzed and the situations were compared among different years.Results: A total of 404 articles were enrolled, statistical hypothesis testing was performed in 366 of them, 32 had descriptive statistics only and 6 articles were meta-analysis. The most frequently used statistical methods were student’st-test (57.4%), followed by chi-squared analysis (56.7%), analysis of variance (35.2%) and regression analysis (23.0%). The main statistical problems in “Methods” included in described method un-matched to really used method and insufficient or wrong description. The proportion of insufficient or wrong description in 2010 and 2011 was 36.6% (71/194), while in 2015 was 26.2% (55/210),P=0.02. The major wrong application of statistical approach was ignoring design with improper method and using unsatisfied precondition for specific analysis. The proportion of improper statistical method application in 2010 and 2011 was 19.1% (33/173), in 2015 was 19.7% (38/193),P=0.88.Conclusion: The quality of statistics was improved in 2015 than 2010 and 2011 for articles published in《Chinese Circulation Journal》; while there were still problems at certain degree, enhanced statistical review should be conducted in medical journals.
Journal; Statistical analysis; Evaluation
2016-11-02)
(编辑:梅平)
100037 北京市,北京协和医学院 中国医学科学院 国家心血管病中心 阜外医院 社区防治部(刘欢欢、周龙、温潇潇、赵连成);首都医科大学附属北京儿童医院(彭亚光)
刘欢欢 硕士研究生 主要从事心血管流行病学研究 Email: liuhh826@163.com 通讯作者:赵连成 Email: zhaolch@163.com*共同第一作者
R541.4
A
1000-3614(2017)03-0284-04
10.3969/j.issn.1000-3614.2017.03.018
方法:对《中国循环杂志》2010年、2011年和2015年发表的论著类文章中统计学方法使用情况进行收集、分析和评价,发现存在的问题,并在不同年份间进行比较。
结果:共404篇文章纳入评价,其中366篇使用了统计检验方法,32篇仅进行了描述性统计,另有6篇论著为Meta分析。使用频率较高的统计检验方法依次为:t检验(57.4%)、卡方检验(56.7%)、方差分析(35.2%)和回归分析(23.0%)。方法学部分对统计学方法描述存在的主要问题有:描述的方法与实际使用的方法不匹配、描述存在欠缺或错误。其中描述存在欠缺或错误的比例在2010年和2011年为36.6%(71/194),2015年为26.2%(55/210),差异有统计学意义(P=0.02)。统计检验方法使用错误主要为忽略研究设计错用统计方法、忽略统计方法使用条件等,统计方法使用错误的比例在2010年和2011年为19.1%(33/173),2015年为19.7%(38/193),两年份间无明显差异(P=0.88)。
结论:2015年刊出的论文与2010年和2011年相比,统计学方法正确使用情况有所改善,但仍存在不同程度的问题,应进一步加强论文的统计学审稿工作。