体育综合评价中误差存在的初步分析及处理

2015-11-17 08:47张文俊
赤峰学院学报·自然科学版 2015年9期
关键词:赋权标准化误差

张文俊

(安徽师范大学 体育学院,安徽 芜湖 241000)

体育综合评价中误差存在的初步分析及处理

张文俊

(安徽师范大学 体育学院,安徽 芜湖 241000)

采用文献资料法分析近年来有关体育综合评价的研究现状及研究成果,旨在从误差分析角度对提高体育综合评价过程的科学性提供理论支持.研究表明:评价过程可划分为:评价理论准备、评价数据获取及评价数据处理等三个主要阶段;体育综合评价理论准备阶段误差有指标初筛选误差、指标赋权误差、评价指标选择误差,评价数据获取阶段误差包括主观评分误差和客观测量误差,评价数据处理阶段提出评价数据的审核及定性指标量化和指标无量纲化误差.明确了不同阶段的误差存在原因,提出误差度量及误差控制的必要手段.

体育综合评价;误差分析;误差处理

郭亚军在其《综合评价理论与方法》一书中指出:体育综合评价的一般步骤是:明确评价目的、确定被评价对象、建立评价指标体系(包括收集评价指标的原始值)、指标的若干预处理、建立与各项评价指标相对应的权重系数、选择或构造综合评价模型、计算各系统的综合评价值并进行排序或分类.

通过对体育综合评价主要过程分解可知,在评价理论准备、评价数据获取及评价数据处理等阶段均有不同形式的误差存在:

图1 体育综合评价中误差存在阶段

需要解释的是:体育综合评价应用中,对于一些比较简单的单指标评价问题,上述几个阶段的区分井不十分明显.

1理论准备阶段误差分析

1.1 评价指标初选阶段

误差存在原因:研究者根据自身专业知识和经验的积累,结合研究目的找出评价指标的所有可能取值,这些经过初选而出的众多指标,在数量表现上可能较多,极易给人造成一种假象:似乎这些初选而出的指标已经满足研究需要.但是在应用中需考虑的一个重要问题:反映体育评价最直接、重要的维度指标是否有遗漏.如果在实际应用中出现这种主要指标遗漏情况,纵使二次指标筛选的手段方法如何高明,对评价结果的科学性造成的不良影响将是无法弥补的.

误差控制方法:评价指标初选阶段,这种因研究者主观因素造成的粗大误差,在综合评价应用中,为避免重要指标遗漏问题的出现,可采用“个人综合分析+多人罗列”相结合的方法规避.所谓“个人综合分析”是指:将综合评价指标体系的度量对象和度量目标划分成若干个不同组成部分或不同侧面,并逐步细分,直到每一个部分和侧面都可以用具体的统计指标来描述、实现.例如,在评价一个人的身体综合素质时,可以将身体综合素质划分为:力量素质、速度素质、耐力素质等,再对上述素质进行更为详细的划分,进一步划分为反应耐力素质的800m、1500m及3000m等;所谓“多人罗列”是指:研究者将研究目的和研究内容等相关材料送至其他研究人员,举众人之力,对其他研究人员所列众多初选指标进行对比,交叉对比,直到发现遗漏的其他指标成分.

1.2 评价指标筛选阶段

误差存在原因:经过初选的指标为保证不遗漏主要指标可能会非常全面,但处理这样地一大堆可能重复的指标,一是增加了测量和评价的难度、二是降低了评价的可信度.因此,需要对多个指标进行降维处理,选取少数几个典型指标代表总体特征.统计学上常用的提取典型指标方法是:主成分分析和因子分析.但是,应用中由于人们缺乏对主成分和因子分析的必要理论知识储备,不了解这两张方法应用的局限性,会使得主成分和重要因子的遗漏问题出现.这种因方法使用上产生的系统误差表现是有规律的,并非无法控制.

误差度量:对于因子分析来说,检测因子遗漏的简易方法是检查每个标准化后指标的特殊方差,如果某个指标的特殊因子方差大于0.5,则说明该指标有50%以上的信息不能被公共因子所解释,这时就应当留意可能会有因子遗漏问题;对于主成分分析来说,检测主成分遗漏的方法是以因子分析为基础,进行检测,如果有因子遗漏,就意味着有主成分遗漏问题出现.

误差控制方法:评价指标筛选阶段,因方法应用局限性而产生的系统误差,可采用修正的方式进行控制,例如:通过检测发现有主成分或因子遗漏问题出现,则需要对原有分析得出的主成分和因子进行修正,将发现的遗漏成分或因子补充进去,重新进行主成分或因子分析.

1.3 评价指标赋权阶段

误差存在原因:应用中,常用的评价指标赋权方法都是利用专家或个人的知识经验积累,进行主观赋值.例如:德尔菲法(Delphi)也称专家法,这种主观赋权方法首先选择10-30位有着该研究领域独特认识的人,集中众多专家的意见对各指标进行赋权.但在应用中,该方法所选取的专家人数往往达不到要求,更不说是否熟悉该研究领域这一要求.与此同时,各专家在对指标赋权后,很少有研究者对各专家指标赋权值进行均值、方差检验,更缺乏组织专家多次赋权,并且在赋权时各专家理解不同、赋权不同,会出现一定的差异,这种差异体现为随机误差.

误差度量:评价指标赋权阶段,产生的误差度量可采用一致性的χ2检验,以检测评价过程中专家对各项评价指标在赋权尺度上是否达成一致.

误差控制方法:指标赋权阶段,针对德尔菲法(Delphi)出现的误差,常用误差控制手段有:一是德尔菲法专家的选择需有代表性,同时赋权值应多次进行;二是将单一的德尔菲法与其他方法结合使用.例如,将德尔菲法与层次分析法和集值迭代法综合使用,以弥补单一方法使用的局限性.

1.4 评价标准选择误差

误差存在原因:对评价对象评价标准选择的不合理,例如,选取的标准过高,不能满足评价的现实需要,使得评价结果不甚理想,反之亦然.

误差控制方法:评价阶段因评价标准不同而产生的系统误差,应结合评价对象的实际状况,对不合理的评价标准予以修定,同时也可以根据研究者的专业经验积累和相关常识找出该评价标准的系统偏差值,予以修正,使需要调整的标准符合被评价对象的现实状况.

2 评价数据获取阶段误差分析

2.1 主观评分误差分析

误差存在原因:主观评分不是由仪器直接测量,而是评价者对评分规则或评分办法的理解,对评价对象的价值进行评分.在此阶段误差:一是主观数据的“质量”问题,即评价者在评分过程中受到各种主、客观因素的影响程度大小,使得评分数据可信度大小无法确定,主观误差难以避免;二是在对评价数据处理所用方法上,现有主观打分数据的处理方法存在问题,使得评价对象处理后分数与真实分数间存在较大的误差.

误差控制方法:针对评分数据“质量”误差的存在,常用的控制方法是评价主体选择的多元化,即完善评价者群体结构,将单一的评价者增加为多个评价群体共同参与评分,使评价群体内的单一评价者有机结合起来.

现今主观评分数据常用的处理方法是:去掉一个最高分、去掉一个最低分,取剩余打分的均值作为该评价对象的最后得分.这种评价方法虽避免了个别评价者分值过高或过低的影响,表面上似乎没有什么问题,但显得过于简单粗糙.这种处理方法简单粗糙体现在:一是舍去两端分值,缺乏科学支撑;二是评价数据的含量本身就不多,剩余的评价数据信息不足,不能完全代表评价数据.针对评价方法使用存在的误差,常用的控制方法是采取迭代的方法进行误差控制. 2.2 客观测量误差分析

2.2.1 测试环境产生的误差

在体育评价过程中,测试环境的变化在一定程度上影响着评价数据的客观性,这种客观环境包括:天气、湿度、温度等对被评价者产生的影响.例如,在一个较为适宜的天气里对某一同学的100m跑素质进行达标测试,可以认为在此环境条件下该同学100m跑成绩的评价结果较为真实,误差值较小,更为接近该同学的真实成绩;反之,在一个大雨和逆风的天气里对该同学进行同样的100m跑素质测试,所得成绩结果与该同学真实的成绩之间的误差值表现较大,此时获取的评价结果的可信度值得怀疑.

因此,为减小和控制误差对评价结果产生的不良影响,应留意评价时“显性”环境的变化,尽量避开这种不适宜环境.

2.2.2 测量仪器产生的误差

误差存在原因:因测量仪器自身的精确度大小所引起的系统误差.

误差度量:在此阶段,常用较为简单易行的方法是通过实验对比,以发现系统误差.例如,选用高一级精度的量块对同一对象进行测量,两次测量结果进行对比.但这种方法只适合不变的系统误差.

误差控制方法:针对这种不变的系统误差,有效的控制方法就是对测量结果进行修订,使之适合评价需要.例如,评价某学校三年级男生身高发育情况是否正常,使用身高测量仪进行测量,发现此身高仪测量偏小,通过比对发现:出现的误差值为-0.2,因此,只需对测得身高进行误差值修订即可.

3 评价数据处理阶段误差分析

3.1 数据审核

评价数据获取阶段,纵使测量者多么小心谨慎,总是避免不了会出现误差.因此需要对评价后的原始数据进行审查、整理,把其中错误的或可疑的数据予以更正(剔除),以减少因误差存在对评价结果可靠性的不良影响.在这一阶段也即为对评价数据误差分析的预处理.

评价数据的审核一般分为以下三个步骤:初审、逻辑检查及抽样复核.

3.1.1 初审

评价数据初审时,需逐项检查评价数据,有无“缺、疑、误、重”.

“缺”是指缺项未填,此时缺项应补项、补测,无法补的,可予以剔除;“疑”是指评价数据记录不清,书写潦草,不易辨认,或对评价记录的真实性有怀疑.对于记录不清的评价数据,需几人共同辨认,确认后重新写清楚,无法辨认的应予以剔除;“误”是指明显的错误,应予以剔除;“重”是指重复获取的评价数据,重复获取评价数据应予以抽出.

3.1.2 逻辑检查

初审以后,要进一步进行逻辑检查,研究者根据专业知识和所测指标本身有的性质以及指标之间的相互关系,检查资料的合理与否.

例如,某学生身高165cm,生高65cm,根据以往的知识和经验人的身高与生高之比应为2:1,因此,推断该数据可能有误,有条件情况下,应立即重油,若无法重测,应剔除.再如:某人的百米跑成绩为11s,跳远成绩为4m,显然,该评价数据为可疑数据,研究者需着重注意.

3.1.3 抽样复核

在原有的被评价测试者中,随机抽取1/10或1/50进行重新复核或复测,若发现个别错误应时纠正;若与原测数据相比,普遍偏大或偏小,则怀疑这批数据存在系统误差,这时,需要全部重测.

3.2 定性指标量化阶段误差

误差存在原因:对于大多数的体育综合评价而言,由于构成评价指标体系的指标都是已经量化的,可以直接采用常规方法开展综合评价.但随着体育综合评价应用领域的发展,一些定性的变量被引入到综合评价指标体系中来.例如,在对某中学学生体育意识进行评价时,评价结果为:非常好、很好、好、差、很差五种,应用中常用量化分值为:5分、4分、3分、2分、1分(或其他值).很显然,这种量化方法的优点是十分简单明白,但缺点是随意性过强,缺乏科学性.应用中这种常用量化方法所带来的误差值表现较大.

误差控制手段:针对这种随意性过强的量化分值方法,应用中为提高这种量化结果的科学性和合理性,通常与专家评价法结合起来使用.同时,基于定性变量带有的模糊性特征,应用中也可结合模糊评价法综合确定定性指标量化的分值.

3.3 评价数据无量纲化误差

评价指标之间由于各自单位及数量级的不同,使得评价结果出现不可比,这为评价结果的比较带来诸多了不便.例如,对人体素质进行测量时,100m跑的成绩单位为秒,跳远的成绩为米,测量后,对数据进行综合评价后发现,不能得到一个明确的且无量纲的最终评价结果.

误差存在原因:评价应用中,常用的无量纲化的方法是标准化处理,但是需要思考两个问题:一是评价数据标准化时机使用不当,如:在进行主成分分析时,标准化后的数据已经不再是原来的原始评价数据,变量间的关系已被人为的处理为1,但是在因子分析中,评价数据的标准化则是一种更好的处理手段;二是标准化对数据评价结果影响很大.

这两个问题的存在,使得在应用中所呈现而出的误差值较大.例如,在对3个应聘者多指标评价后,如果贸然对评价结果进行标准化处理,则不恰当,且误差数值表现很大.这是因为,已经得到评价结果不需再次进行标准化处理,这种人为的二次标准化,可能会使本来排名首位的拉到第三名的位置.再者,我们所说的标准化是以总体平均数μ和总体标准差σ进行处理,而非以样本均数x和样本标准差s进行处理.

误差控制方法:针对评价数据标准化时机使用不当而造成的误差存在,首先是明确标准化的内涵及统计意义;其实是明确标准化使用情况,何种情况下可以进行标准化处理、何种情况不能标准化.

〔1〕费业泰.误差理论与数据处理[M].北京:合肥工业大学出版社,2004.1-4.

〔2〕郭亚军.综合评价理论与方法[M].北京:科学出版社,2000.3.

〔3〕胡永宏,贺思辉.综合评价方法[M].北京:科学出版社,2000.40-41.

〔4〕费业泰.现代误差理论及其基本问题[J].宇航计测技术,1996,16(4-5):2-4.

〔5〕严今石.关于综合评价的多元统计分析方法的探讨[D].延边大学,2006.

〔6〕黄宝宏.体育教学评价方法的应用诊断与效果检测[D].安徽师范大学,2005.

〔7〕苏为华.多指标综合评价理论与方法问题研究[D].厦门大学,2000.

〔8〕李良萍.体育竞赛主观评分数据的统计处理与评价[D].安徽师范大学,2007.

〔9〕赵书祥.我国体育领域中综合评价理论与方法及实证的研究[D].北京体育大学,2008.

〔10〕王运良.体育评价中值得注意的问题及其处理措施[D].安徽师范大学,2007.29-31.

〔11〕黄明教,等.体育多种评价方法的比较研究[J].武汉体育学院学报,2001,35(2):114-116.

〔12〕刘钦龙.关于主成分分析在体育科研中应用的思考[J].上海体育学院学报,2003,27(5):78-79.

〔13〕魏登云.主成分与因子分析在体育综合评价中的应用检测[G].第十三届全国体育统计学会.

G80-05

A

1673-260X(2015)05-0168-03

安徽师范大学2014年研究生科研创新项目(2014yks010)

猜你喜欢
赋权标准化误差
论乡村治理的有效赋权——以A县扶贫项目为例
基于赋权增能的德育评价生态系统的构建
标准化简述
企业数据赋权保护的反思与求解
角接触球轴承接触角误差控制
Beidou, le système de navigation par satellite compatible et interopérable
试论新媒体赋权
压力容器制造误差探究
标准化是综合交通运输的保障——解读《交通运输标准化体系》
九十亿分之一的“生死”误差