苏祝捷
(广西师范学院 体育学院,广西 南宁 530023)
学术期刊体育论文存在的统计学问题
苏祝捷
(广西师范学院 体育学院,广西 南宁 530023)
体育统计不仅是进行体育科学研究必须掌握的一种重要方法,也是体育实践中数据分析的重要工具。随着科学的发展,体育统计在体育科学研究中的地位也日益得到强化。通过对体育科研论文常规统计出现的问题进行分析,并提出正确的建议。
体育统计;常见问题;体育科研
统计学(statistics)主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用在工商业及政府的情报决策中。在体育学的相关研究中,无论是社会体育、学校体育、竞技体育还是运动人体科学等领域的科研工作者,越加频繁地将统计学应用到研究当中,以期使研究结果更具真实性和说服力。
然而,笔者通过中国知网(CNKI)随机下载国内学术刊物中,涉及体育学相关内容并运用常规统计方法的论文100篇,分析发现在学术刊物的体育论文中统计学的应用还存在很多问题。由此可以看出一些体育工作者对统计学的认识有偏差,对一些定义的理解不准确,对一些研究方法的适用条件不清楚,导致了体育统计的误用或运用不当,使得研究结论与实际相去甚远。这不仅影响了研究的最后结果和论文的质量,更影响了研究的科学性、可靠性。
为此,本文对体育论文的常见统计学问题进行分析,并提出正确、合理的建议,以期引起有关人员的注意,并供体育科研工作者参考和使用,从而提高体育论文的科学性和严谨性。
表1 实验对象成绩测试对照表
表1是原作者进行背越式跳高教学实验前后的跳高成绩。先不管其选择x±s对定量数据进行描述是否正确,但是根据目前世界男子跳高纪录2.45m和女子跳高纪录2.09m的实际情况来看,该表中出现的标准差均大于3,这个数据是严重错误的,因为目前还没有任何一个人进行背越式跳高跳过3m的。在数据缺乏真实性的情况下,无论采用多么科学,多么合理的分析方法都是没有意义的。另说明:表1的原始数据通过各种方式在期刊数据进行检索,均未找到,因此其真实性也有待验证。
再如《分析跳高比赛的少年运动员的技术特征》一文中,对少年运动员成绩的构成及百分比进行男女比较时的数据资料见表2。从表2中我们可以看出少年跳高运动员成绩构成的6个指标中,其中男女运动员5个指标的标准差都是分别相等。但是在现实中,对同一组学生的某一个指标进行两次测试,两次成绩的标准差都很难出现完全等同的情况,更何况是对不同性别不同组别的运动员进行的测试。这种数据的高度吻合性,使其数据来源的真实性值得怀疑。
表2 少年运动员成绩的构成及百分比
科学研究的本质是探求真理,而真理必须以真实的资料为基础。因此,数据的真实性就成为问题的核心。要保证数据的真实性,就要求体育科研工作者有诚信,有一丝不苟之严谨态度。一般情况下,影响数据真实性的因素主要有三个方面:一为诚实的错误,是由于技术局限性或其他客观因素的制约,导致本来严谨的研究结果,却在后来的研究中未能得到证实。二为疏忽性错误,是由于研究工作者工作作风不严谨或设计时不科学、不周密导致的。比如在进行教学方法实验时,实验组和对照组受试者的条件没有可比性,对照组的处理措施选择不当等,导致的实验结果错误。三为科研中的不正行为,是指一些人为了达到所需要的结果,进行编制数据或其他形式的欺骗,这种情况属于个人道德品质问题。但这三种错误,除了第一种因研究者自身或所处的环境无法避免,后两种错误都是可以避免的。
2.1.1 现象分析
原文作者想比较某市3个少数民族初中男生50m跑成绩的差异性,采用了独立样本t检验,结果如表3。
表3 某市各少数民族初中男生50m跑成绩(s)
一般情况下,t检验主要有样本均数与总体均数的单样本均数的t检验和两样本均数的差异显著性检验,以及配对实验数据的差异显著性检验三种。进行独立样本t检验时,除了要求样本量不能过大,还要满足数据资料呈正态分布或近似于正态分布以及检验样本的方差齐性。但从本例的研究设计看,并没有说明样本的方差是否齐性,同时只考虑了民族这一因素,且是两个样本组以上均数的差异性检验,应采用单因素方差分析,而不是独立样本的t检验,t检验只对2个样本以下的检验。如果在进行方差分析时,若P≤a,差异显著,可进行均数的多重比较。当然在此案例中为了充分利用数据,还可以考虑不同年龄之间的差异性分析。
2.1.2 建议
x2检验常用于对两个或两个以上样本率之间差别的显著性差异检验,检验方法比较灵活,也是假设检验中重要的方法之一。一是两样本率的x2检验,例如在体育教学或训练的研究中,对新旧教学方法或不同训练手段的效果进行比较,有关这一类型的研究结果可采用x2检验方法进行处理。在对样本率进行x2检验时,常采用表格方式来处理,这种表格称为RC联表,R和C分别表示格子的行列数。二是多个率的x2检验,在进行多个样本率的检验时,当得到P<0.05,则要拒绝原假设,说明被比较的几个样本率之间差别有显著性。这是就各个率之间总的差别来说的,但不能据此作出任何两组间差别都有显著性的结论。若比较两个样本率之间的差异,需另作检验。
2.2.1 现象分析
如表1中的数据,实验对象n比较小,而且x<s,是严重的偏态分布,但还用来描述是不对的。
2.2.2 建议
x±s仅用于描述呈正态分布数据资料的集中和离散趋势,对于不呈正态分布的数据资料,一般用中位数(Md)或众数(M0)来描述其集中趋势,用四分位差(Q)来描述其离散趋势。而表1中的样本是很小的,而且数据呈偏态分布,甚至严重偏态,根本无法描述其分布状态和用x±s来进行数据描述。但是,一般情况下,计量资料呈偏态分布,可通过对数转换、平方根变换等转换方法,使其偏态分布资料接近正态,然后做进一步的分析。
原文作者是想通过表4中的数据来反映影响不同体育人口类型大学生参加体育锻炼因素的差异性。
在这一案例中,作者虽然作了统计处理,但未交待用的是哪一种统计方法进行的分析,比如t检验、x2检验等,仅告知P值与0.001、0.01、0.05的关系,也没有其他统计量的具体值,读者根本无法知道作者选择的分析方法是否正确,结果是否准确,因此呈现的信息是不完善的。直接根据计算结果P<0.05或P<0.01就轻易做出结论,是欠严谨的,缺乏科学性。
表4 影响体育人口参与体育锻炼的主要因素(%)
研究者应将所采用的统计方法交待清楚,比如是运用的独立样本t检验、相关样本t检验还是方差分析、x2检验等。因为使用不正确的统计方法会得出错误的结论,作者很有必要在论文中告知读者你选用的统计方法。严格地说,还应写明精确的相应统计量值,而不应笼统地以P>0.05或P<0.05代替或只一句“经统计学处理”后,就写出结论。提供相关的数值,以便读者判定结论的正确与否。此外,最好也交待一下所使用的计算工具与统计软件名称。
原作者对表5的文字描述为:“结果显示,除了‘改善自己的健康状况’和‘为了散心解闷消遣娱乐’两项原因之外,体育人口与非体育人口均有显著性的差异。无论是物质形态方面还是精神意识方面,体育人口均高于非体育人口。”可以看出表格中的数据并没有反映出作者的意图。同时表4的标题与表中的纵条目不相匹配,“内容”应改为“原因”;标题表述不清,建议修改为:“不同类型体育人口的大学生参加体育锻炼的原因比较”;表中出现严重的错误,在表的中部突然多出“n=235,n=1322,n=123”这些数据;在“准体育人口”这一列数据下方出现了“***、*、**、ns”符号,先不管标注是否错误,这些符号在表后的注释为“***P<0.001,**P<0.01,*P< 0.05,ns=不具有显著性”,而原作者并没有对数据所表现出来的差异性进行描述,造成数据的冗赘或者浪费。虽有“体育人口与非体育人口均有显著性的差异”这样的描述,但是表格中并没有相应的数据支撑。可见作者并没有重视表格的设计,导致描述和数据不合。附加说明,本研究只是去发现期刊文献中统计图表存在的问题,从而进行分析,关于原文中数据的真实性不在研究范围之内,需进一步考察和研究。
表5 参加体育锻炼的原因
统计图表是表达数据资料的重要工具,也是表述统计数量关系的主要方式。合理的统计图表可以使复杂的资料简明清晰,便于有关指标的对照比较和揭示事物之间的相互关系及发展趋势。因此在设计图表时要讲究科学性、合理性。但有些作者在运用图表时,设计不够规范,常出现一些错误,严重影响了数据描述的准确性。一般情况下,图表的标题应确切、概括地说明图表的内容,表的标目文字要简洁,组合规范、有序,内容简明扼要能够突出主题,线条不可过多,一般用三线格,表格的左上角尽可能不出现斜线等,图的纵横坐标要符合数学原则,图的类型要根据数据资料的性质进行选择。
体育科研论文中出现统计问题不仅是一种现象,更多的却是反映了我们的科研工作者对统计学的重视程度不够。导致对各种统计方法内涵不甚了解,不能够正确分析数据资料的性质,其中简单移植、套用教材或文献中的统计方法是体育统计运用出现问题的主要原因。当然,也有部分人为了私利,捏造虚假数据。
但是要提高科研质量,防止误用统计方法,除了受制于一些外在的因素,更重要的是科研工作者自身要不断提高统计学水平,在保证数据质量的前提下,结合研究目的、数据结构特征、样本大小和各种检验统计量的适合条件、适用范围来选择恰当的统计分析方法,从而客观、合理地对统计结果进行描述和解释。
[1]丁英俊,薛留成,夏健松.体育院系田径课程多元化教学手段的整合与改革实验研究[J].河南大学学报(社会科学版),1998,38(4):73-76.
[2]付降河,马文慧,赵书祥.体育科研论文中常规统计方法使用情况的调查研究[J].北京体育大学学报,2010,33(3):41.
[3]陈元方,邱仁宗.生物医学研究伦理学[M].北京:中国协和医科大学出版社,2003.09:72.
[4]刘容娟.定量资料的统计分析[J].湖北成人教育学院学报,2008,14(4):53-54.
[5]敖运忠,杨丽玲.江西省体育科研论文中体育统计应用情况调查与分析[J].上海体育学院学报,2002,26(5):77-79.
[6]韩捷,成龙.不同类型体育人口的大学生健康行为比较研究[J].搏击,2010,2(8):34-35.
[7]王净净.医学科研论文中的统计问题[J].中国医师杂志,2001,3(1):6-8.
[8]李健,祁国鹰,王锡群.从体育统计误用透视高校体育统计教育[J].体育科技,2009,30(1):79-81.
[9]从湖平.体育统计学[M].北京:高等教育出版社,2010.
[10]谢晓丹.体育统计中提高样本数据收集水平的问题探讨[J].科技创新导报,2008(4):160.
Statistics problems in sports papers in ordinary journals
SU Zhu-jie
(Sport Dept.,Guangxi Normal Inst.,Nanning 530023,China)
With the development of science,the sports statistics has become more and more important in the sports scientific researches.The paper analyses the statistics problems in the papers about sport in the ordinary journals.
sports statistics;common problem;sports scientific research
G80-32
A
1672-268X(2011)06-049-03
(2011-08-18收稿)