医学科技论文中常见统计学方法误用分析
孟月1,2
(1河南省科技期刊研究中心,2新乡医学院期刊社《新乡医学院学报》编辑部, 河南新乡453003)
摘要:统计学方法选用的正确与否直接关系到能否真实反映研究结果,使用错误的统计方法可影响结果的可靠性,使得出的研究结论不科学,这样的研究成果用于临床实践可能造成严重的后果。为提高医学科研工作者对常用统计学方法的认识,减少使用统计学方法的错误,提高科技论文的水平。本研究对已发表论文中计量资料常见统计学方法误用情况进行总结分析,以促进医学工作者在撰写科技论文时,正确应用统计学方法。
关键词:统计学方法; 医学论文; 误用
中图分类号:R195文献标识码:B
doi:10.3969/j.issn.1009-5551.2015.05.037
[收稿日期:2015-01-13]
医学统计学是应用概率论和数理统计的基本原理和方法,研究医学领域中数据的收集、整理和分析的一门科学[1],已被广泛地应用到医学研究中。医务工作者在进行医学研究过程中及医学论文的撰写中经常需要对数据进行统计学处理。统计分析方法的选用与资料类型密切相关。按照变量是定量或定性可将资料类型分为计量资料、计数资料和等级资料。计量资料最常用的有t检验和方差分析,而经常被误用的也是这2种方法,且以t检验的误用最多见。为帮助广大医务工作者正确地选用统计学方法,本研究对计量资料中常见的统计学方法误用类型进行总结,现报道如下。
1配对资料误用两样本t检验
配对t检验适用于配对设计的计量资料。配对设计主要有以下3种类型[2]:(1)两同质受试对象配成对子分别接受2种不同的处理;(2)同一受试对象分别接受2种不同处理;(3)同一受试对象接受处理前后。文献[3]中作者对治疗前后结果采用了两样本t检验进行比较(表1)。该研究中比较的2组数据是同一受试接受处理后在不同时间点上测量的同一个指标的数值,对象属于配对设计的第3种类型,应采用配对设计t检验,得出的结论才是可靠的。若2组数据出自不同受试者,即为相互独立的样本,则应采用两样本t检验[4]。例如表1对TACE组和联合组治疗后结果进行比较则可采用两样本t检验。
2多组间均数比较误用t检验
文献[5](表2)中作者对各组均数间的比较采用了t检验,文献[6](表3)中作者对各组均数间的比较采用了配对t检验。显然这2个研究中的统计学方法选择均不恰当,文献[6]并非配对设计,选择配对t检验不合适。这2个研究结果的比较应采用方差分析。t检验和方差分析的前提条件相同,均为正态分布和方差齐性,区别在于t检验用于2组均数间的比较,而方差分析用于多个均数间比较。应用t检验进行多组间比较时,会使Ⅰ类错误膨胀,导致得到假阳性结果的可能性增大。
表1 2种方法治疗前后患者免疫功能的改变
注:与治疗前比较,*P<0.05。
3方差分析中两两比较误用t检验
文献[7]作者在统计学方法部分描述多组间比较采用方差分析,两两比较采用t检验。如表4所示该研究实际上是检验6 个相互独立样本均数差异有无统计学意义,属于单因素方差分析,故应采用单因素方差分析进行检验。若差异有统计学意义,则可进行多个样本的两两比较,比如q检验。但本研究作者误以为只要是2组间比较就用t检验,因此两两比较时采用了t检验。直接通过t检验做两两比较,会增加犯I类错误的概率[8],结果会产生较大的误差,即可能把本来无差异的2个总体均数判为有差异,使结论的可信度降低。正确的方法是对多组均数比较时,首先应进行方差分析,若统计量F值有显著意义时,再选用合适的多重比较方法。如进行多个样本均数间的两两比较多采用q检验(SNK法);而对多个实验组与同一个对照组均数间的两两比较可选用Dunnett t检验、Duncan新法与LDS法。
表2 各组大鼠血浆 ET-1、NO、MDA、ALT 和 AST 含量比较( ±s)
注: 与对照组比较, aP<0.05; 与IPC组比较, bP<0.05。
注: 与人工关节置换组比较,aP<0.05; 与 DHS 内固定组比较,bP<0.05。
组别ALT(U/L)AST(U/L)ALB(U/L)正常组42.4±8.291.8±9.933.1±3.5模型组206.4±20.3318.5±40.624.0±3.1山楂总黄酮(30)182.7±23.6*285.0±28.3*26.6±3.9山楂总黄酮(60)173.4±18.4**212.3±30.0**29.0±3.2**山楂总黄酮(120)142.6±18.4**162.7±29.0**30.4±2.4**秋水仙碱160.7±16.9**207.9±35.6**27.8±2.6**
注:与模型组比较,*P<0.05,**P<0.01。
4重复测量资料的方差分析误用拆分文件的t检验或方差分析
重复测量设计是指在给予1种或多种处理后,在多个时间点上从同一受试对象重复获得指标的观察值。其研究目的是探讨同一研究对象在不同时间点上某指标的变化情况[9]。文献[10]中作者观察了2组患者麻醉诱导前(T1)、麻醉诱导后(T2)、置镜后1 min(T3)、置镜后3 min(T4)、退镜后1 min(T5)、退镜后5 min(T6)、退镜后10 min(T7)的SBP、DBP和心率(表5)。此组数据实质是重复测量资料, 应采用重复测量资料的方差分析。该研究的作者对组内比较采用了t检验,还有部分作者在处理此类数据时, 常误将横向(同组不同时间点的比较)数据应用单因素方差分析来处理, 结果导致统计学Ⅰ类错误发生[11]。要判断是否为重复测量设计,主要看重复测量的时间是不能随机分配给实验单位的伴随因素,还是可以随机分配的处理因素[9]。显然该研究中重复测量的时间是不能随机分配给实验单位的伴随因素,而非处理因素,因此属于重复测量数据,应用重复测量的方差分析。
表5 2组各时点血压、心率的比较(n=30, ±s)
注: 与T1时点比较,*P<0.05; 与对照组比较,#P<0.05。
参考文献:
[1]倪宗瓒.医学统计学[M].北京:高等教育出版社,2005:1.
[2]孙振球.医学统计学[M].北京:人民卫生出版社,2005:48-49.
[3]钟以胜,孙斐予,曾明亮,等.射频消融联合肝动脉栓塞化疗对无手术切除机会原发性肝癌的治疗价值[J].泰山医学院学报,2013,34(10):748-751.
[4]唐欣然,王杨,李卫. 科研论文中误用t检验的典型案例分析[J].中国循环杂志, 2013,28 (3):236.
[5]赵林静,王艳华,邓保国,等. 一氧化氮对肢体缺血预处理大鼠肢体缺血再灌注后肝损伤的保护作用[J].新乡医学院学报,2012,29(8):565-568.
[6]周迎锋,刘晓潭,路坦,等. 人工全髋关节置换术、动力髋部螺钉内固定术和股骨近端防旋髓内针内固定术治疗高龄不稳定型股骨转子间骨折对比研究[J].新乡医学院学报,2012,29(9):693-695.
[7]赵继玲.山楂总黄酮对四氯化碳致大鼠肝纤维化的保护作用及其机制研究[J].河南医学研究,2013,22(5):651-654.
[8]章新生,姚仁斌,刘璐,等. 医学稿件中常见统计学方法误用辨析[J].蚌埠医学院学报,2011,36 (6): 653-656.
[9]张维,邓强庭,冷怀明.医学期刊中容易误用的统计学方法辨析[J].编辑学报,2013,25(5):435-437.
[10]陈秀侠,齐敦益,郭继龙.麻黄碱预先给药对老年高血压患者丙泊酚麻醉无痛胃镜检查时血流动力学的影响[J].徐州医学院学报,2013,33(10):637-640.
[11]张振东, 孙丽君, 孙竹平. 医学科技论文常见的统计学误用问题及其商榷[J].现代妇产科进展,2011,20(2):159-160.
(本文编辑周芳)
《新疆医科大学学报》入选RCCSE中国核心学术期刊
由武汉大学中国科学评价研究中心(RCCSE)、武汉大学图书馆、中国科教评价网(www.nseac.com)共同研制的第4版 《RCCSE中国学术期刊评价研究报告——权威、核心学术期刊排行榜》已于近日完成。进入本次评价的学术期刊共有6 201种,在65个一级学科产生权威期刊(A+)316种,核心期刊(A和A-)1572种,准核心学术期刊1 848种,一般期刊1 828种,较差期刊637种。评价研究报告显示,《新疆医科大学学报》在国内197个医学综合期刊中排名第46位,属于核心期刊(A-),近几年《新疆医科大学学报》排名有较大幅度提升(2009、2011、2013年分别排名第82位、第74位、第71位)。截至目前,《新疆医科大学学报》已入选国内主要的四个核心期刊评价体系(北大中文核心期刊、中科院CSCD核心期刊、中国科技核心期刊、武汉大学中国科学评价研究中心RCCSE核心期刊)中的两个,即中国科技核心期刊、武汉大学中国科学评价研究中心RCCSE核心期刊。
(本刊编辑部)