魏登云
(安徽师范大学 体育学院,安徽 芜湖 241003)
数据的标准化处理在体育综合评价中的应用辨析
魏登云
(安徽师范大学 体育学院,安徽 芜湖 241003)
摘要变量或数据的标准化处理在统计分析中是常用的预处理手段。在体育综合评价中,评价指标或原始数据的标准化处理具有更丰富的内涵以及特殊的地位和作用。分析体育综合评价对评价指标及其评价值的要求,讨论标准化处理的内涵和评价功能及其在体育综合评价中的特殊作用,指出体育综合评价中标准化处理存在的“陷阱”,探讨标准化处理在体育综合评价中的应用策略。
关键词体育; 标准化处理; 综合评价; 评价总体; 评价样本; 评价指标; 应用
Author’s addressSchool of Sport Science,Anhui Normal University,Wuhu 241003,Anhui,China
在实际工作中,对评价指标的处理是综合评价的重要组成部分。一方面,初选的评价指标往往数目众多,信息交叉、重叠,需要经过整合、压缩、筛选,简化结构,形成评价指标体系;另一方面,评价指标的测量值通常不具有评价属性,不能直接用于评价,需要将其转化为评价值(即分值),称之为评价指标的分值化处理。在体育领域,评价指标的类型多种多样,生理生化指标、形态指标、运动素质指标、心理指标、主观评分指标等往往同时出现在评价指标体系中,故在体育综合评价中,对评价指标的处理就显得更为重要,尤其是评价指标的分值化处理。在综合评价的相关文献中,评价指标的分值化处理均被称为“无量纲化处理”[1-5]。其实,评价指标的分值化处理不仅仅是无量纲化处理,综合评价中评价指标的分值化处理要求更高,综合评价的实质是借助数学模型将多个指标的评价值“合成”为一个综合评价值,“合成”的前提是,多个指标的评价值必须“可比”,要求各个指标的评价值有统一的评价标准、评价尺度,要体现评价的公正和公平性;而“无量纲化处理”无此要求,仅仅作无量纲化处理也达不到这个要求。在综合评价的理论和实践研究中,评价指标的分值化处理未得到足够的重视,实际工作中往往被简单化对待,似乎选用任何一种无量纲化处理方法均可。事实上,评价指标的处理工作是比较复杂的,既要符合评价的具体要求,又要考虑某种处理方法的具体特点和局限性,否则,很容易导致综合评价不合理,而且不易发现。
数据或变量的标准化处理,即数据或变量减去平均数,再除以标准差,在统计分析和综合评价中是人们最常使用的预处理手段,但往往被简单地视为无量纲化处理的一种工具[6-9]。其实,标准化处理在很大程度上改变了变量或数据的特征或属性,有些统计分析方法对此非常敏感。例如,基于标准化数据的主成分分析结果,可能与基于原始数据的分析结果大不一样。特别是在综合评价领域,标准化处理本身所具备的评价功能,使其在评价指标的处理方面具有特殊的地位和作用,与此同时,标准化处理作为评价手段也有自身的局限性,应用中如果处理不当,对综合评价的影响也是“致命”的。纵观国内外文献,标准化处理运用很多,但讨论很少,尤其在体育综合评价领域,标准化处理的地位和作用、标准化处理的局限性、标准化处理在体育综合评价中如何运用等问题,尚未见讨论。
本文拟通过分析综合评价对评价指标的要求,讨论体育综合评价中评价指标的处理要求,进而分析标准化处理在体育综合评价中的地位和作用以及局限性,最后探讨标准化处理在体育综合评价中的运用策略。
1体育综合评价的2个基本概念
在实际工作中,体育综合评价绝大多数是相对评价,即评价的背后有一个参照系,对某一个评价对象的评价是相对于某一类对象的集合而做出的,一类对象的集合实质上规定了评价的标准。很显然,“一类对象”的选择不同,相当于评价标准不同,对个体的评价结果就不一样(绝对评价通常具有公认、绝对的评价标准,不需要对数据作标准化处理。故本文讨论的体育综合评价均指相对评价)。特别是对于多指标综合评价,综合评价值以各个指标的单一评价值为基础,如果评价者对“相对于哪一类评价对象”不明确或选择不合适,就会导致评价结果的不合理。出于理论上的严谨和完善以及应用中的需要和方便考虑,类似于统计学中的总体和样本,我们提出评价总体和评价样本2个概念。
1.1评价总体根据评价目的所确定的评价对象的全体,称之为评价总体。其中的每一个评价对象,称为评价个体。评价总体是具有某种特征的一类评价对象的集合,可以是有限的,也可以是无限的。评价总体中的个体未必都是等待评价的对象,实际问题中真正需要评价的对象都是有限的,甚至只有少数几个,称之为待评价对象,评价总体是待评价对象的母体。提出评价总体的目的,是为了界定评价的相对范围,从而确定评价标准,同时也规定了评价模型的适用范围。评价总体经常是“设想”的结果,这与统计学中的统计总体类似。评价总体与统计总体的区别在于:统计总体是统计描述或统计推断的对象、目标,而评价总体未必是需要实际评价的对象,更像是一种工具,提供了评价的参照系。之所以借用“总体”这个名称,是因为在确定评价标准时,通常需要某些特征数的信息,而总体特征数往往都是未知的,需要利用样本估计,关于这一点,与统计学中“由样本推断总体”是完全一致的。
1.2评价样本取自评价总体的一部分评价对象的集合,称之为评价样本。评价样本的唯一任务是获得评价总体的有关信息,为确定评价标准服务。在综合评价中,由于评价总体的信息未知,人们以已获得的评价样本代表评价总体,即以评价样本作为评价的现实参照系。从本质上说,评价样本充当了统计学中训练样本的角色。评价样本与待评价对象的集合是不同的概念,待评价对象是实际问题中真正需要评价的个体,是现实评价对象,而评价样本中的个体是为了评价而收集或选择的个体,评价样本不是目的,而是综合评价中使用的工具,待评价对象的集合才是综合评价的研究对象。当然,实际工作中如果待评价对象的个体数较多,能较好地代表评价总体,人们通常将待评价对象的全体作为评价样本。如果待评价对象的数目较少,那么待评价对象就不能作为评价样本使用。否则,导致的问题将是很严重的。
2体育综合评价对评价指标及其评价值的要求
2.1评价指标的相对独立性和代表性建立评价指标体系是综合评价的重要组成部分,评价指标体系是由多个相互联系、相互作用的评价指标,按照一定的层次结构组成的有机整体。评价指标体系中的评价指标要内涵清晰、相互独立,同一层次的不同指标之间应避免信息重叠,不能有因果关系。
初选的原始指标往往数目众多,难免存在信息交叉、重叠甚至重复现象,需要对其进行简化、压缩和筛选(称之为原始指标结构的处理),进而建立评价指标体系。严格来说,初选的原始指标不能被称为评价指标,因为他们可能不满足评价要求。评价指标是原始指标经过处理和筛选后的结果,是具有相对独立和代表性的原始指标或原始指标的组合,是评价指标体系的元素。
原始指标的结构处理方法较多,大致可分为主观分析法(例如专家法)和客观处理方法(如聚类分析法、主成分分析法和因子分析法等[10])两大类,由于专家法很难处理原始指标之间的信息重叠问题,所以应用中通常采用客观处理方法结合专家法[11]。由于原始指标的某些特征对有些数理方法的处理结果有影响,例如主成分分析法对原始指标的方差大小很敏感,所以在运用数理方法处理原始指标的结构时,往往需要对各个原始指标的观测值进行预处理,标准化处理就是最常用的预处理方法。
2.2评价指标分值化处理的可比性要求在评价指标体系中,很多评价指标的类型不同,量纲也多种多样,在综合评价之前,需要对各个评价指标进行分值化处理,将各个评价指标的测量值转化成评价值(分值),使多个评价指标能按不同的权重系数合成为综合评价值。评价指标的分值化处理实质上是针对单一指标的评价,是综合评价的重要组成部分,综合评价其实是对各个指标评价值的综合。评价指标分值化处理的最基本要求是满足可比性,即经过分值化处理,使分值化指标相互可比,指标评价值可以进行合成运算。可比性要求具体表现为同一评价总体、统一评价标准和统一评价尺度3个方面。
在本院收治的高血压伴心力衰竭患者当中选取70例(2016.6-2017.10)作为本研究中的观察对象,采用简单随机分组的方式将其分为两组,对照组与观察组患者例数相同(均为35例)。
2.2.1同一评价总体评价总体是评价的参照系,对某个个体的评价结果总是相对于评价总体的。在多指标综合评价中,评价总体一旦确定,各个评价指标的分值化处理都应以此评价总体为参照系,即各个评价指标的分值化处理必须针对同一个评价总体。这是多指标分值化处理的基本前提。
2.2.2统一评价标准评价总体统一了各个单一指标评价的相对范围,评价指标的分值化处理需要在此范围内规定评价标准和评价尺度。评价标准是评价的“临界值”或“分界线”,是针对评价总体所规定的,例如,总体平均数、有关分位数、最大值和最小值等。在不同情况下,根据需要所确定的评价标准可能不一样,但对于某一个综合评价问题,多个指标的分值化处理所采用的评价标准必须是统一的,例如,要么均为总体平均数,要么均以最小值为评价标准。
2.2.3统一评价尺度评价尺度是评价个体之间“间距”的工具。不同的评价指标通常具有不同的量纲,按指标测量值所度量的个体之间的间距大小不具有可比性,需要以某个统一的尺度为单位衡量个体之间的间距,例如,标准差和极差等常被用作评价尺度。不言而喻,在多指标的分值化处理过程中,评价尺度必须是统一的。
2.3指标评价值的公正公平性要求公正性和公平性是评价的最本质的要求,表现为对个体的评价结果(评价值)满足公正性和公平性要求。评价的公正性是指针对一个评价总体,优秀的个体获得较高的评价值,较差的个体,其评价值也较低。评价的公平性的意思是,测量值相差较大的个体,其评价值也相差较大,反之,测量值比较接近的个体,其评价值应该相差较小。
3标准化处理的统计学意义和评价功能及其在体育综合评价中的作用
类似地,在体育评价中,评价指标的标准化是基于评价总体的标准化,得到标准化评价指标;有关数据的标准化是基于评价样本的标准化,得到标准化数据。由于待评价对象的集合有时不能作为评价样本,即待评价对象的平均数和标准差不能替代评价样本的平均数和标准差,故关于待评价对象观测值(数据)的标准化处理,不是使用其自己的平均数和标准差,而是使用评价样本的平均数和标准差。这与统计分析中原始数据的标准化处理有所不同。
3.2标准化处理的统计学意义标准化处理的统计意义主要体现在多变量的处理和分析中,经过标准化处理,多个变量的标准化变量均值均为0,方差均为1,具有很多共同的主要特征。如果原始变量服从正态分布,那么多个标准化变量将具有同样的分布——标准正态分布,有利于进一步的分析和处理。
标准化处理也是无量纲化处理的基本手段之一。
3.4标准化处理在体育综合评价中的作用在体育综合评价中,标准化处理可用于评价指标的简化压缩和评价指标或个体观测值的分值化处理。
3.4.1标准化处理用于评价指标的简化压缩体育综合评价要求评价指标体系尽可能结构精简,评价指标之间相对独立,而初选的指标往往数目众多,相互交叉、重复,需要简化、压缩,主成分分析法或因子分析法是精简指标的常用统计方法。主成分分析法(或主成分因子分析法)的突出特点是提取蕴含在为数众多的原始指标中的主要信息,以少数几个主成分(或公共因子)来反映原始指标所描述的主要特征,从而替代原始指标,达到简化指标的目的[12]。主成分是原始指标的线性组合,主成分之间互不相关,所以由主成分分析法得到的少数几个组合指标之间没有信息重叠,而且综合了原始指标的主要信息,显示出主成分分析法在精简指标方面的优越性。主成分分析法对原始指标的方差非常敏感,基于不同方差大小的原始指标所得到的主成分可能完全不同。然而,从压缩评价指标的目的看,运用主成分分析法主要是针对原始指标之间的信息重叠,用来处理原始指标之间的关系,故处理结果不应受原始指标方差大小的影响。因此,在主成分分析之前,原始指标需要作标准化处理。标准化处理使所有指标的方差都一样,但又不改变原始指标之间的关系,所以,对原始指标作标准化处理是运用主成分分析法压缩评价指标时所必须采取的处理手段。
3.4.2标准化处理用于评价指标或个体观测值的分值化处理评价指标分值化处理的方法较多,各种计分方法原则上均可用于评价指标的分值化处理。标准化处理所具有的统计意义和评价功能,使其成为评价指标分值化处理的最基本和最常有的工具。作为评价函数,标准化处理以平均数为评价标准,以标准差为评价尺度,由于样本平均数和样本标准差作为总体均值和标准差的估计量具有较好的稳健性,不易受少数观测值的影响,因此,经过标准化处理之后的(分值化)评价指标具有比较稳健的评价标准和尺度,而且多个评价指标经标准化处理后具有可比性。在通常情况下可以直接利用标准化评价指标,结合相应的权重系数,建立综合评价模型。即使在有些情况下对分值化处理有特殊要求,例如要求分值与项目难度挂钩,那么先对评价指标做标准化处理,也是比较合理的做法。事实上,常用的计分方法(如标准百分、累进计分法)也是以标准化处理为基础的。
以标准化评价指标建立的综合评价模型,结构简单、清晰,解析表达式便于换算,需要时可以将综合评价模型中的标准化评价指标还原成评价指标甚至是原始指标,使综合评价值成为原始指标的函数,这样在对个体实施综合评价时,只需要将个体测量值带入评价模型就可计算个体的综合得分。
4标准化处理的“陷阱”
在体育综合评价中,标准化处理不仅是无量纲化处理的手段,更是一种评价处理,经过标准化处理,无论是评价指标还是测量数据,均具备了评价属性,而且评价标准和尺度很明确,因此,标准化处理在体育综合评价中有特殊的地位和作用,也正因如此,标准化处理对综合评价结果的合理性有直接的影响,如果使用不当,会给综合评价带来极为不利的影响。
例1假定需要对3个个体进行综合评价,设3个评价指标的总体均值均为50,总体标准差均为10,个体观测值及标准化处理结果列于表1。
表1 个体测量结果及标准化处理结果Table 1 Results of individual measurements and standardization process
由上可见,在体育综合评价中,不能简单地对需要评价的个体观测值作标准化处理,因为如果用于标准化处理的平均数和标准差稳定性差,不具有代表性,就意味着所选的评价参照系不合适,在此基础上的综合评价结果就可能不合理。
5标准化处理在体育综合评价中的应用策略
5.1明确评价总体评价总体是综合评价的参照系,对个体的综合评价只是相对于评价总体的评价结果,表征个体在评价总体中的相对位置,无论是构建综合评价模型,还是对个体实施综合评价,明确评价总体都是前提。标准化处理作为将各个评价指标分值化的常用手段,本质上是一种评价方法,是在综合评价之前,对个体的各个指标测量值所进行的单一评价。标准化处理的参照系是评价总体,标准化处理所使用的平均数和标准差应是评价总体的平均数和标准差,只是因为总体平均数和标准差一般都是未知的,应用中以样本平均数和标准差估计而已。因此,在综合评价中,无论是评价指标的标准化还是个体测量值的标准化处理,评价总体都是必须明确的,否则,我们无法判断标准化处理所使用的样本平均数和标准差是否符合评价要求。
5.2评价样本的利用与合理选择评价总体作为综合评价的参照系,通常都是理论上的,因为总体参数一般都是未知的。综合评价中实际使用的参照系是评价样本,评价样本是综合评价的现实参照系。标准化处理中所使用的平均数和标准差一般都是评价样本的平均数和标准差。作为初步评价手段,标准化处理对平均数和标准差的代表性非常敏感,例1已经说明。如果标准化处理所依据的平均数和标准差对评价总体相应参数的估计误差较大,那么基于标准化处理的评价结果将很不合理。故评价样本对评价总体要有足够的代表性。
评价样本的选择通常有2种途径,一种是以待评价对象为评价样本,另一种是收集训练样本。选择待评价对象为评价样本,需要谨慎。如果需要评价的个体数较少,待评价对象不能代表评价总体,那么待评价对象不能作为评价样本,对评价指标或原始数据的标准化处理不能使用待评价对象的平均数和标准差。这时,需要根据以前资料或者设计有关测试工作,形成训练样本,作为评价样本。当然,训练样本必须能够代表评价总体。
值得注意的是,如果待评价对象不能代表评价总体,而以训练样本作为评价样本,那么对于待评价个体数据的标准化处理所使用的平均数和标准差将是训练样本的平均数和标准差,而不是待评价个体数据的平均数和标准差,这与统计分析中关于数据的标准化方法有所不同。在统计处理中,一组数据往往就是样本观测值,数据的标准化均基于样本平均数和标准差,即使样本含量较小,标准化数据的抽样分布也是清晰的,况且成熟的统计方法都考虑到小样本所带来的抽样误差,一般不会造成严重的不良后果。在综合评价中,数据的标准化实质上是对个体的评价,标准化处理所使用的平均数和标准差代表着评价标准和尺度,一旦使用的平均数和标准差不能代表评价总体,评价的风险就会很大,而且评价方法本身对此没有识别和诊断的能力。故综合评价中的标准化处理对平均数和标准差的选择是有要求的。
5.3谨慎对待主观评分和主观赋值数据在体育综合评价中,评价指标的类型可能有多种,一个综合评价问题,既有客观测量数据,又有主观评分、评价数据。如果运用标准化处理对评价指标或个体测量值进行分值化处理,需要区别对待主观评分数据和主观赋值数据(对于主观评价,数据表现为主观评分数据或主观赋值数据,对此类数据的处理涉及到很多内容,尚在探索之中。鉴于本文的研究目的,主要针对客观测量数据,仅从数据的标准化处理的角度,讨论如何区别对待主观评分数据和主观赋值数据)。
主观评分数据一般由专家法对个体进行主观评分,结果以10分制或百分制等分数表示,这类数据尽管以主观的方式得到,但数据本身是数值型的,内涵丰富,个体之间的间距明确,零分和满分固定,已经是对个体的评价结果,而且便于计算。如果对主观评分数据做标准化处理,标准化数据作为评价结果,其合理性可能不比原始数据好。故对于主观评分数据,可以不做标准化处理,先对其他指标或数据做标准化处理,再将标准化数据转化成分值数据(按给定的满分规定),这样,所有指标便可以进行合成运算。
主观赋值数据是对于等级评价指标,为了量化的需要,由课题设计者对评价指标的各个等级进行主观赋值所得到的数据。例如,对于观测结果“满意、一般、不满意”通常以“5、3、1”予以赋值,“优、良、中、中下、差”以“5、4、3、2、1”赋值。主观赋值数据属于顺序量表,数据之间的相对大小代表了全部信息,数值是人为规定的,不具有绝对意义[13]。与主观评分数据不同,主观赋值数据尽管也是评价结果,但评价标准和评价尺度不确定,有很大的“随意性”,与其他评价指标不可比。所以,在体育综合评价中,如果有主观赋值数据,建议先对所有评价指标的观测值(除了主观评分数据)做标准化处理,再根据实际需要,作进一步的调整和转换。
5.4充分考虑实际评价的具体要求经过标准化处理,标准化指标或标准化数据具有可比性,可以按权重系数进行合成计算。在体育综合评价中,实际问题对评价都有具体要求,大多数情况下标准化处理都不是分值化处理的最后手段,而是对评价指标或原始数据的预处理,相当于预评价。标准化指标的均值为0,标准化数据有负值存在,作为评价数据,有时不符合实际要求;综合评价有时需要衡量个体的综合水平,不鼓励以少数评价指标的突出弥补在其他指标上的不足,但标准化数据没有上下限规定,使“以强补弱”成为可能;在实际综合评价中,有时需要考虑项目的难度,分值的大小与项目难度相适应,但标准化处理未考虑项目难度,标准化数据的分值是均匀的。因此,标准化处理之后,往往需要根据综合评价的目的和要求,对标准化指标或标准化数据作进一步的分值处理。例如,标准百分和累进计分法就是常用的分值处理方法。
6结束语
标准化处理所具有的统计学意义和评价功能,使其在体育综合评价中有特殊的地位和作用,从评价指标的压缩到综合评价模型的构建,再到对评价对象的具体评价,标准化处理均有重要作用,特定情况下甚至是不可替代的作用。标准化处理作为对数据的初步评价手段时,对其使用的平均数和标准差的代表性有较高的要求,综合评价的理论参照系是评价总体,如果标准化处理所使用的平均数和标准差对评价总体没有代表性,那么标准化的结果将会导致不合理评价。在实际应用中,应针对评价总体合理选择评价样本,利用评价样本的平均数和标准差对评价指标或个体观测值进行标准化处理。评价样本是整个综合评价的现实参照系,评价样本对评价总体的代表性在很大程度上决定了综合评价的合理性,不能简单地以待评价对象为评价样本。为了满足可比性要求,对评价指标体系中的所有评价指标做标准化处理,均应基于同一个评价样本。只要评价样本对评价总体有足够的代表性,所有评价指标原则上均可做标准化处理,但对于主观评分数据,笔者不建议做标准化处理,可以先对其他指标标准化,然后做同一化处理。
参考文献
[1]胡永宏.对统计综合评价中几个问题的认识与探讨[J].统计研究,2012,29(1):26-30
[2]冯平.评价论[M].北京:东方出版社,1995:75
[3]杜栋,庞庆华,吴炎.现代综合评价方法与案例精选[M].北京:清华大学出版社,2008:1-10
[4]汤立许,蔡仲林.我国体育评价研究述评[J].上海体育学院学报,2011,35(3):28-32
[5]陈雪梅.体育评价再认识[J].体育与科学,2003,24(3):68-69
[6]张卫华,赵铭军.指标无量纲化方法对综合评价结果可靠性的影响及其实证分析[J].统计与信息论坛,2005,20(3):33-36
[7]郭亚军,易平涛.线性无量纲化方法的性质分析[J].统计研究,2008,25(2):93-100
[8]张立军,袁能文.线性综合评价模型中指标标准化方法的比较与选择[J].统计与信息论坛,2010,25(8):10-15
[9]叶宗裕.关于多指标综合评价中指标正向化和无量纲化方法的选择[J].浙江统计,2003(4):24-25
[10]赵书祥.我国体育领域中综合评价理论与方法及实证的研究[D].北京:北京体育大学,2008:1-10
[11]魏登云.主成分与因子分析在体育综合评价中的应用检测[J].体育科学,2003,25(4):97-99
[12]林海明,杜子芳.主成分分析综合评价应该注意的问题[J].统计研究,2013(8):25-32
[13]吕树庭,倪同云,丘海雄,等.建立我国社会体育评估指标体系的研究[J].上海体育学院学报,2002,26(3):1-5
收稿日期:2015-12-04; 修回日期:2016-02-26
基金项目:安徽省哲学社会科学规划项目(AHSKY2014D96)
作者简介:魏登云(1963-),男,安徽肥东人,安徽师范大学教授;Tel.:13965190751,E-mail:dywei191@vip.sina.com
中图分类号G80-05
文献标志码A
文章编号1000-5498(2016)04-0021-06
DOI10.16099/j.sus.2016.04.004
Application of Standardization Process of Data in Comprehensive Evaluation in Sports∥
WEI Dengyun
AbstractThe standardization of variables or data is commonly used in statistical analysis.In the comprehensive evaluation in sports,the standardization treatment of evaluation index or raw data has richer connotation and special position.This paper discussed the requirements of evaluation index and its value for the comprehensive evaluation in sports,as well as the connotation and evaluation function in the comprehensive evaluation in sports.Besides,the trap of standardization and the strategy of the standardization processing in the comprehensive evaluation in sports were analyzed as well.
Keywordssports;standardization process;comprehensive evaluation;evaluation population;evaluation sample;evaluation index;application