对《河北中医药学报》来稿中存在的统计学问题分析

2021-02-23 05:17河北中医学院
河北中医药学报 2021年1期
关键词:样本量统计表中医学

河北中医学院

张 帅 张 婧 于红芳 王文智(石家庄 050091)

提要 医学统计学已经渗透到中医学科学研究的各个领域,也是中医学科技论文撰写的重要工具。本文就《河北中医药学报》来稿中存在的统计学问题进行了举例分析及解析,主要包括实验设计中存在的问题、统计学方法运用错误、统计描述中出现的问题。从而期望引起投稿作者、读者及编辑的关注,共同加强医学统计学的学习与提高;在实验设计时要以统计学思想为指导,正确的使用统计学方法进行数据的分析,全面、规范、准确的进行统计学描述,最终提高中医学科技论文的质量。

二十一世纪是科学力量加强的时代,是网络大数据时代,是生命科学快速发展的时代。撰写中医学科技论文是中医学临床工作和科学研究工作的总结,高质量的中医学论文可以促进中医学科研成果的交流,可以提高医疗技术水平。在中医学科学研究中,需要正确的收集、整理及分析大量的中医学信息,医学统计学分析就成为科研工作中非常重要的组成部分。科学研究的实验设计、实验室及临床资料的采集、资料的整理与分析、最终得出结论及结论的表述,都需要统计学的指导[1]。医学统计学的作用就在于使科学研究设计合理、严密,通过统计学数据分析进行证实性和探索性研究,最终以科学的、适当的方式将科研结果表达出来。正确的统计学方法应当贯穿于整个科学研究以及论文撰写的始终。随着中医学的发展,中医学科技论文的质量也随之提高,这与各个期刊社业务水平的提高和严格的把控是密不可分的。中宣部、教育部、科技部及中国科协四部委联合印发了《关于深化改革、培育世界一流科技期刊的意见》,这对中医学科技论文提出了一个更高的要求。因此,严谨的科学研究设计、正确的分析方法、规范的结果表述以及合理的结果解释决定着中医学科学研究是否具有科学性[2]。这些都要求运用正确的医学统计学分析。在《河北中医药学报》的来稿中,仍存在统计学的问题,本文就这些存在的问题进行汇总分析,并提出正确的统计学方法建议,希望引起作者、读者及编辑同仁的关注。

1 实验设计中存在的问题

实验设计是医学统计工作的内容之一,是根据实验研究的目的所制定的总研究方案。实验设计包括研究对象的纳入和排除标准,样本量的估计与选择,合理设置实验组和对照组,确定观察指标以及拟使用的统计学方法[3]。实验设计必须遵循3个基本的统计学原则:对照原则、随机原则、重复原则。如果在实验设计阶段出现错误,那么在数据分析阶段错误也是无法更正的。在中医学科技论文中,有关实验设计会存在一些问题,例如样本量估算错误、对照组设置不合理、未采用随机法进行实验分组等。其中样本量的估算非常重要,正确的统计推断是以合适的样本量为基础的。样本量小,实验中观察指标的数值不稳定,抽样所引起的误差大,假设检验的功效低,实际存在的不同组间差异不能显现出来,难以获得正确的研究结论。样本量过大,会增加科研工作的困难,需投入大量的人力、物力及时间,虽然能减少抽样误差,但会增加实验的非抽样误差[4]。在实际工作中,需根据设计类型和资料类型选择样本含量估算方法。

解析:随机分组可采用随机数字表法、计算机软件产生的随机数等方法进行分组。例1中采用了随机对照的原则,在文中给予了说明。实验设计样本量是需要计算的,例1中出现样本量计算的过程,但在科技论文撰写时,不必写出样本量计算过程与步骤,这样会占用篇幅,此处应将此过程删除。另外,选择的公式也不正确,算出来的应该是一组样本的含量。

2 统计学方法运用错误

在科学研究中,只有选择正确的统计方法,才能的得到可靠的统计结论[5]。在实验设计阶段,研究方案中统计学设计就应确定所选择的统计学方法。在选择统计学方法时,要首先判断资料的类型,是定量资料(也称计量资料)、定性资料(也称计数资料),还是有序资料(也称半定量资料或等级资料)。计量资料先进行正态分布检验和方差齐性检验。尤其注意的是针对2组及以上资料某指标在3个及以上时间点的比较,要采用重复测量的方差分析[6]。而定性资料与等级资料要区分开,不能混淆。

解析:例2中实验例数为32例,晨僵持续时间、双手平均握力、20 m行速、疼痛指数、肿胀指数、功能指数等这些指标不一定就是符合正态分布,需要做正态分布检验。如果为偏态分布,就不能采用t检验,需要采用秩和检验。例3中虽然研究例数为50例,属于大样本,但量表评分具有主观因素,同样需要做正态分布检验。不应直接采用t检验。

表3 治疗前后关节肿胀数比较

解析:从例4的表格可以看出,研究数据设计为重复测量设计,即同一受试对象的某一测量指标在不同的时间点上进行多次测量的的设计方法。因此其统计学方法使用错误,应当使用重复测量的方差分析[6]。

解析:例5中没有计数资料,也没有使用卡方检验。在统计学描述时,出现错误。等级资料应该选用秩和检验,因为秩和检验的效率高,在选择统计学方法时,应该选择效率高的方法。

例6:“抑郁症疗效:以HAMD-17减分率评价,HAMD-17减分率=[(治疗后评分-治疗前评分)/治疗前评分]×100%,≥75%为痊愈,50%~74%为显效,25%~49%为有效,<25%为无效;PMS疗效:以改良Kupperman减分率评价,改良Kupperman减分率=[(治疗后评分-治疗前评分)/治疗前评分]×100%,≥80%为完全缓解,50%~79%为显效,20%~49%为有效,<20%为无效。计数资料以百分比表示,采用χ2检验,P<0.05为差异有统计学意义。”

表5 两组治疗有效率对比 [例(%)]

解析:例6中混淆了总体率与构成比的概念。本研究属于等级资料,需要采用秩和检验,而不能采用适用于推断2个(或多个)总体率以及构成比之间有无差别的χ2检验。例7中治疗效果不能以构成比表示,本资料为等级资料,同样不能用χ2检验,而要用秩和检验。

3 统计学描述的问题

统计描述分析中最常用的重要工具就是统计表和统计图。统计图和统计表可以通过直观的形象,以简明扼要、清晰易懂的方式描述实验数据的基本特征。统计图和统计表一定要按照统计学中规定的要求进行绘制,未按统计学的规定会产生错误的描述而引起误会。

3.1 统计表 统计表应包括标题、横标目、纵标目、线条、数字、注释。横纵标目要有主谓关系。横标目表示的是主语,纵标目表示的是谓语,从左向右读,加上数字,就构成一个完整的句子。撰写论文一般采用“三线表”的格式。数字的小数位数一致,位数对齐。值得注意的是表格中不能有空格,没有数字要用“-”表示,而数字缺失要用“…”来表示。

例8:“治疗后两组均能有效改善单项‘胸闷’、‘气短’、‘心悸’、‘疲倦乏力’、‘畏寒肢冷’、‘不寐’等症状,差异有统计学意义(P<0.05);治疗后对照组能有效改善‘胸痛’、‘腰膝痠耎’等症状,差异有统计学意义(P<0.05);治疗后试验组能有效改善‘自汗’症状,见表3。”

表3 治疗前后两组中医证候单项积分组内比较 [M(Q)]

解析:例8表格层次不清,表格应以三条线为基础,根据具体情况需要可在表内加1~2条细线。表格中横线过多,应该删除。表中内容繁杂,负秩和、正秩和数据为中间计算过程,不应出现在统计表中,也应该予于删除。四分位数间距Q值是描述变异程度的指标,为百分位数P75与P25之间的差值,Q值不能为零。

例9:“观察组抑郁症疗效显著优于对照组(P<0.05),见表2。”

例10:“治疗8周后,治疗组与对照组比较有统计学意义,治疗组优于对照组(P<0.05)(见表3)。”

表2 两组抑郁症疗效比较 [例(%)]

表3 治疗后DAS28评分疗效比较

解析:通过例9、例10表格中的数据进行分析,数据为等级资料[7],统计学方法应该采用秩和检验。统计图表中不能出现空格。例10合计率不能缺失,应当添加。

3.2 统计图 统计图是利用各种几何图形将研究对象的各种关系、形象特征进行生动的表达,从而给读者留下清晰、深刻的印象。在科研论文中,统计图要与统计表联合使用。论文中要根据数据类型,所要表达的内容,选择不同类型的统计图。

例11:“心绞痛量表疗效及有效率比较,结果提示:两组均能有效改善心绞痛症状,试验组疗效及有效率均优于对照组(P<0.05),见图2。”

图2 两组治疗后心绞痛疗效分布图

解析:统计图前一般要配统计表。例11中仅有统计图而缺乏统计表,会使数据的描述产生模糊,让读者难以理解。此图中的图示与统计图内容不一致,图示中显效统计图中缺如,应将此图示删除。或者改用条图表示2组的有效率。

总之,提高中医学中科技期刊的统计学水平以及提高中医学科技期刊的整体水平,需要作者和编辑共同努力。本文就来稿中的统计学问题进行了举例分析,仅提出了本刊中比较典型的案例,还有一些比较普遍的统计学中应该注意的事项,希望作者都能引起重视。作者在实验、论文写作的始终,都应贯穿统计学思想,遇到问题可以向统计学专业的专家请教,保持科学严谨的态度。编辑工作者在审稿中发现统计学问题,应及时与作者沟通,共同协作提高论文的质量。

猜你喜欢
样本量统计表中医学
一种基于进化算法的概化理论最佳样本量估计新方法:兼与三种传统方法比较*
样本量与东方蜜蜂微卫星DNA遗传多样性参数稳定性的关系
网络Meta分析研究进展系列(二十):网络Meta分析的样本量计算及精确性评估
2020年部分在晋提前批招生院校录取统计表
医学研究中样本量的选择
中医学关于“瘀血”的用法
中医学关于“证”的用法
2019年提前批部分院校在晋招生录取统计表
上榜派出所统计表
神奇的统计表