体质评价的绝对标准

2013-01-30 05:18:55梁成军

浙江体育科学 2013年4期

关键词：体质群体测试

梁成军

(辽宁师范大学体育学院，辽宁大连 116029)

体质评价的绝对标准

梁成军

(辽宁师范大学体育学院，辽宁大连 116029)

对目前体质评价常用的两种标准即绝对标准和相对标准进行了分析讨论，指出了他们各自的优点和不足。在此基础上重点讨论了绝对标准的制定意义、关键问题、制定方法以及绝对标准可靠性的验证等问题。旨在阐明目前国外在体质评价绝对标准的研究现状与动态，为我国体质评价标准的改进与完善提供参考。

体质；评价；相对标准；绝对标准

0 前言

评价标准是指对被测事物进行价值判断的一种尺度。常用于体质评价的标准主要包括相对标准(比较标准)、绝对标准、个体标准等。对同一群体，相对标准的评价等级是依据群体中其他个体的表现来制定，即得出的标准是相比较而言的，标准的高低与现有使用对象或群体的体质总体水平和状态有关。绝对标准则是以评价对象是否健康为基本依据，进而研究制定相应的测试项目及对应的评价标准。如何客观准确地评价人们的体质水平一直是体质测量评价领域的一个研究热点问题。目前国内建立使用的评价标准或是有关评价标准的研究多是比较标准[1]，对绝对标准的研究则少有报道。本研究分析了绝对标准和相对标准各自的优点和不足，并着重对制定绝对标准的一些问题的研究现状进行了阐述。

1 绝对标准与相对标准的优点与不足

一些特殊群体如专业运动员、飞行航天员、消防员等群体，对他们的体质评价标准需依据所从事的行业要求单独制定。如我国的运动员的等级评价标准，消防员[2]体质评价标准等。对大多数普通民众而言，身体素质的评价标准通常采用的是相对标准或绝对标准，它们也是目前国内外使用最广泛的评价标准。二者各有优点和不足。

1.1相对标准的优点与不足

对于相对标准，只要有一定的样本数据，利用恰当的统计学方法对数据进行处理分析即可得到。相对标准的优点是可使被评价者很清楚地知道自己在群体中所处的位置或水平，但它也存在一些不足。

首先，特定年代制定的标准，只能适用于一定的年限，一般为5年[3]。因为随年代的推移，标准适用群体的状况会发生改变，所以标准应及时更新。但实际应用中往往由于人力、物力、时间等的限制，使得标准难以及时更新，造成评价结果不能真实反映使用群体目前的现状。

其次，比较标准的解释依赖于适用对象的体质水平，如果评价人群的体质群体不健康，其某一评价等级(如平均水平或平均水平以上)的含义不能反映群体本质上的体质特征。例如判定肥胖的比较标准，若被研究的群体表现为整体肥胖，假设某个人体脂含量处于60百分位，我们依据比较标准，判定结果应该判定该名受试者体脂含量正常，而实际上他已经是肥胖等级了。

再者，比较标准本质上是将评价对象的体质与同一群体其他对象进行比较，并依据样本数据和相关的统计学原理制定计算出的数值或分数，而不是被评价者应该达到的一个健康水平。如果制定的标准要求较高，对于有些个体，由于遗传或其他因素的影响，即使他们付出很多努力可能还是难以达到标准要求。因此该标准对于鼓励体质水平低下的人积极锻炼的动力不足。例如，若标准规定达到85百分位以上给与奖励，该奖励标准只会激励体质非常好的学生尝试获得；而体质不太好的学生获得它的动力不足，甚至是放弃通过努力来获得。另外，相对标准只适用于样本所代表的总体，不能随意外推使用。同一地区不同的人群有着不同的相对评价标准，不同地区同一人群评价标准也不尽相同，这使得标准种类、数目繁多。

1.2绝对标准的优点与不足

1.2.1 绝对标准的意义。早期的体质测量主要关注速度、力量、耐力、灵敏等素质，一些指标的测量评估对人体健康而言并非具有必要的相关性。许多时候在使用制定的比较标准进行评价时，有些身体健康的评价对象也不能通过测试，从而使得测试越来越更加关注健康[4]。到了20世纪80年代，肥胖率呈上升趋势，有越来越多的证据表明，过度肥胖和低的有氧运动健身水平增加了人体患许多慢性疾病的风险，于是开始采取与健康相关的测试项目评估身体成分。当然，与健康有关的体质指标很多，包括心肺耐力、背部柔韧性等都被认为是重要的健康问题[5]。

绝对标准在教育领域的含义是指学生掌握还是未掌握相应的知识与信息。它首先由Safrit[6]引入到体育领域中，并从20世纪80年代末开始有了具体的应用案例[7、8]。对于体育领域的评估绝对标准则意味着被评价者的体能水平是否达到或者具备保持身体健康所需的某种水平，这种水平即为绝对标准下的身体素质水平的最低要求。这个最低要求或者说是临界值一般以健康与否为标准来确定[9]。例如，力量素质究竟至少达到多少对我们来说就是健康的，这一数值如给出，就是一个绝对标准，这个问题目前还没有关于力量与健康之间关系的确切研究[10]。这就意味着绝对标准的制定与群体中其他个体的体质水平状况没有关系。相对标准可以依据需要将评价标准分为几个等级，如优、良、中、及格等，而绝对标准只有一个等级，即健康与不健康的分界线。

1.2.2 绝对标准的优点与不足。由于绝对标准不涉及群体中各个体间的相互比较，因此其标准的制定与群体的变化没有关系，其主要面对的困难是如何寻找健康与不健康的分界线。使用绝对标准的对象只需关注自己的健康状况，而不能得出自己的素质水平与群体中其他人相比较处于什么水平[11]。比较标准对于体质较差的人鼓励其进行锻炼提高的动力不足，绝对标准则可以弥补比较标准在这方面的不足，即他可以提高体质水平较低的人的锻炼信心；但另一方面也存在不足，主要体现在标准对于一些群体如儿童或青少年可能过低，使得他们较容易满足要求，他们甚至不用刻意去锻炼身体就能达到绝对标准的要求；再者绝对标准也不会激励使用对象去努力使身体素质保持在一个较高的水平。

2 绝对标准的制定方法

2.1关键问题

制定绝对标准的关键问题主要包括两个方面。其一是如何选择测试指标，即选择采用哪些指标来反映测定的体质是与健康相关的。解决这一问题是比较困难的，研究必须排除其他因素的影响证明所选指标与人体健康的相关性，这是确定利用该指标进行体质评价的绝对标准的前提。例如背部健康评价绝对标准的制定考虑下腰痛与健康体质和参与运动之间的关系[12]，无下腰痛者的躯干屈、背伸肌耐力、体育活动数值较高，而腰围则普遍偏低。该研究认为躯干弯曲，背伸肌耐力和体能活动、腹部肌肉力量、腰围可作为背部健康的评价指标。再如，有研究[9]依据“美国体能测试报告”给出的心血管健康绝对标准，对12～19岁青少年进行了测试，并对其患心血管疾病的风险因素进行了评估，表明通过最低标准的青少年患心血管疾病的风险比未通过的明显降低，说明体能测试报告选用的心血管评价指标是合理有效的。

另一方面是标准的可靠性与等价性。绝对标准的可靠性是指某一测量项目前后两次测试对研究对象分类的一致性程度；等价性则是采用不同测量项目来反映某一健康指标时其分类的一致性程度[13]。如美国的“体能测试报告”采用1英里跑/走、递增负荷有氧心血管耐力跑测试(PACER)来评价有氧工作能力[14]。这些不同的测试项目应具有较高的可靠性与等价性。许多学者对此问题进行了研究。

对于13～18岁的青少年[13]，PACER测试项目的分类一致性(可靠性)男女分别为81%和79%，1英里跑/走的测试项目可靠性则分别为77%和83%。采用引体向上、俯卧撑、单杠曲臂悬垂等来进行上肢肌肉力量测量，结果表明其分类一致性较低，说明用他们来对上肢肌肉力量来测量的等效性较差[15]。

Mahar[16]研究了利用1英里跑/走和PACER建立的4～5年级儿童绝对标准的可靠性，测试结果表明男孩通过PACER测试的比例(68%)与通过1英里跑、1英里走的比例(66%)相近；女孩通过递增负荷有氧心血管耐力跑测试(96%)的比例远高于通过1英里跑、1英里走(65%)。说明这两项测量的等价可靠性对男孩是合适的，对于女孩则分类一致性较差，可靠性比较低。提示用PACER对该年龄组女孩建立的绝对标准较低。其后继研究[17]采用了大样本和新的方法给出了新的二次方程模型和线性模型两个推算公式，模型的准确性证实了绝对标准的有效性较高。同时该研究也证实了考虑BMI(体重指数)后，模型的预测准确性提高。这两项测量对于大学生的测试结果则具有较好的分类一致性[18], 但二者作为测试有氧能力的指标，则PACER具有较高的可靠性[19]。

2.2制定方法

绝对标准关心的是受试者的体质的是否足够健康以远离潜在的健康风险。例如对于儿童的体质评价，绝对标准应考虑其体质是否能适应未来的需要，即能使他们成长为一个健康的成年人。绝对标准的制定主要包括如下两种方法[10]。

一种是组建领域内专家组，让专家组对每个测试项目进行考核，依据测试资料，估计出可接受的最低的通过测试的概率值，制定合格的分数标准。该方法可看作是教育学和心理学评估中的安戈夫(Angoff)方法的改进。例如有研究利用该方法对智障人员给出了包括力量、柔韧、灵敏、耐力等指标的体质评估的绝对标准[20]。

另一种是主要以关注受试者是否具有某种最低的能力来建立最低分数线。通常的做法是先确定健康体质的构成，然后选择测量项目，依据测量项目的结果与健康之间的关系，确立临界分数线。例如早期的研究[21，22]已经认识到儿童少年的皮褶厚度可作为评估成人患心血管疾病风险的指标，即患心血管疾病因素水平的升高往往伴随脂肪含量的升高。后继研究[23]又量化补充了青少年脂肪含量与其他心血管风险因素指标如高血压、血脂、低密度脂蛋白等的相关关系，并据此给出了可用于体质测试的体脂含量的各等级的标准。近期Going[24]通过大样本测量数据研究认为男孩脂肪含量超过20%，女孩超过30%患慢性疾病的危险因素大增，据此得出样本对象所属群体的体脂评估绝对标准。

3 绝对标准常用的统计学方法

制定绝对标准常用到两种数据处理分析方法即LMS曲线法和ROC曲线法。

LMS曲线法是用中位数、变异系数及将资料转换成正态所需要的度量偏度的转换的幂来全面描述样本数据资料的分布[25]。例如用LMS方法拟合建立儿童体质指数的百分位数曲线[26]，Laurson[27]建立了儿童少年身体肥胖增长的百分位数等均取得较好效果。LMS参数提供了一个对体质数据标准化转换分析的较好方法与手段，在体质评价标准的制定领域常用于对人的生长发育数据的分析与解释。

ROC曲线法是对于可能存在混淆的两种条件或状态, 需要领域专家做出精细判别并作出准确决策的一种定量方法[28]。ROC曲线分析就是比较不同测试或试验在多个判断界值条件下对应的灵敏度-特异度曲线的差异[29]。研究者利用ROC曲线，确定使灵敏度与特异度达到合理的平衡分界点。例如，采用ROC方法Laurson[30]建立了青年人体脂含量的绝对标准，认为男性最低、最高体脂含量为22.3% 、35.1% ；而女性则分别为 31.4% 、38.6% 。利用该方法，Welk[31]则给出了评价有氧能力的绝对标准。

另外，Zhu[32]提出了一种新的等价测试方法来评估分类的一致性，并成功用PACER测试得分推算1英里跑的时间；Boiarskaia[33]使用该方法将使用PACER推测VO2max值与用1英里跑/走推测的VO2max和实测VO2max值进行了比较，表明实测值与推测值不存在统计学差异，具有较好的一致性。

4 结语

身体素质评价的相对标准与绝对标准各有优缺点。相对标准评价的是基于个体间的相互比较，评价标准的分界线可按需要分成若干等级；身体素质绝对评价标准关心的是人体的健康状况问题，其标准只有一个即合格(健康)与否的分界线。绝对标准制定的关键在于确定与健康相关的测试项目，并科学地找到健康与否的分界线确定绝对标准。目前关于绝对标准的研究在有氧能力、身体成分等方面已取得较好的成果。

[1] 江崇民,于道中,季成叶,等.《国民体质测定标准》的研制[J].体育科学,2004,24(3):33-36.

[2] Steven A. Locke. Developing Physical Fitness Evaluation Criteria for the Hartford Fire Department[D]. Hartford Fire Department.2005.

[3] 编写组.体育测量评价[M].北京：人民体育出版社,1996:64.

[4] Plowman SA, Sterling CL, Corbin CB, Meredith MD, Welk GJ, Morrow JR Jr. The history of FITNESSGRAM[J]. J Phys Act Health .2006,3(S2):S5-20.

[5] Jackson SA. The evolution and validity of health-related fitness[J]. Quest.2006,58:160-175.

[6] Safrit MJ, Baumgartner TA, Jackson AS, Stamm CL. Issues in setting motor performance standards[J]. Quest 1980,32(2):152-162.

[7] Cureton KJ, Warren GL. Criterion-referenced standards for youth health-related f?tness tests: a tutorial[J]. Res Q Exerc Sport 1990,61(1):7-19.

[8] Kalohn JC, Wagoner K, Gao LG, Safrit MJ, Getchell N. A comparison of two criterion-referenced standard setting procedures for sports skills testing[J]. Res Q Exerc Sport 1992,63(1):1-10.

[9] LOBELO, F., R. R. PATE, M. DOWDA, A. D. LIESE, and J. R. RUIZ. Validity of Cardiorespiratory Fitness Criterion-Referenced Standards for Adolescents[J]. Med. Sci. Sports Exerc. 2009, 41(6):1222-1229

[10] Weimo Zhu, Matthew T. Mahar, Gregory J. Welk. Approaches for Development of Criterion-Referenced Standards in Health-Related Youth Fitness Tests[J]. Am J Prev Med 2011,41(4S2):S68-S76

[11] Koebel CI, Swank AM, Shelburne L. Fitness testing in children: a comparison between PCPFS and AAHPERD standards[J]. J Strength Cond Res 1992,6(2):107-114.

[12] Payne N, Gledhill N, Katzmarzyk PT, Jamnik V. Health-related fitness, physical activity, and history of back pain[J]. Can J Appl Physiol. 2000,25(4):236-249.

[13] Beets MW, Pitetti KH. Criterion-referenced reliability and equivalency between the PACER and 1-mile run/walk for high school students[J].Journal of Physical Activity amp; Health, 2006, 3(Suppl.2), S21-S33.

[14] Sharon A. Plowman, Charles L. Sterling, Charles B. Corbin et al. The History of FITNESSGRAM[J]. Journal of Physical Activity amp; Health,2006,3(Suppl.2),S5-S20.

[15] Pate RR, Brugess ML, Woods JA, Ross JG, Baumgartner T. Validity of field tests of upper body muscular strength[J]. Res Q Exerc Sport 1993,64(1):17-24.

[16] Mahar MT, Rowe DA, Parker CR, Mahar FJ, Dawson DM, Holt JE. Criterion-referenced and norm-referenced agreement between the mile run/walk and PACER[J]. Meas Phys Educ Exerc Sci 1997;1(4):245-258.

[17] Mahar MT, Guerieri AM, Hanna MS, Kemble CD. Estimation of aerobic fitness from 20-m multistage shuttle run test performance[J]. Am J Prev Med 2011,41(4S2):S117-123.

[18 ]Plowman S.A., Liu NY-S. Norm-referenced and criterion-referenced validity of the one-mile run and PACER in college age individuals[J]. Measurement in Phys Educ Exerc Sci. 1999,3(2):63-84.

[19] Ahmad Hashim, Mohd Sani Madon, Sazali Hassan. Criterion- Referenced and Norm- Referenced Agreement Between the Mile Run/Walk Test and PACER Test Among Male and Female Students of Sport Science Program[J]. British Journal of Arts and Social Sciences.2012,7(1):1-9.

[20] Min Kyu HAN. Won Kyung KIM. Dae Yeon KIM. Development of Assessment Standards for Health-Related Physical Fitness in Persons with Intellectual Disability. The 20th Asian Conference on Intellectual Disabilities[C]. Oral Presentation.351-363.

[21] Gortmaker SL, Dietz WH, Sobol AM, Wehler CA. Increasing pediatric obesity in the United States[J]. Am J Dis Child. 1987,141:535-540.

[22] Aristimufio GG, Foster TA, Voors AW, Srinivasan SR, Berenson GS. Influence of persistent obesity in children on cardiovascular risk factors: the Bogalusa Heart Study[J]. Circulation. 1984,69:895-904.

[23] Williams DP, Going SB, Lohman TG, et al. Body fatness and risk for elevated blood pressure, total cholesterol and serum lipoprotein ratios in children and adolescents[J]. Am J Public Health 1992,82(3):358-363.

[24] Going SB, Lohman TG, Cussler EC, Williams DP, Morrison JA, Horn PS. Percent body fat and chronic disease risk factors in U.S. children and youth[J]. Am J Prev Med 2011;41(4S2):S77-86.

[25] COLE TJ. The LMS method for constructing normalized growth standards[J]. Eur J Clin Nutr, 1990,44(1):45-60.

[26] 周乐山,李琛琛,何国平,等.用LMS法建立长沙市3～11岁儿童体质指数生长曲线[J].中国现代医学杂志,2012，22(10)：73-75.

[27] Laurson KR, Eisenmann JC, Welk GJ. Body fat percentile curves for U.S. children and adolescents[J]. Am J Prev Med 2011,41(4S2):S87-92.

[28] 邹莉玲,余小金,闵捷,等. ROC 曲线在医学诊断中的应用与进展[J].东南大学学报:医学版,2003,22(1):67-70.

[29] BRISMAR J.Understanding receiver-operating-characteristic curves:a graphic approach[J].AJR, 1991,157(5):1119-1121.

[30] Laurson KR, Eisenmann JC, Welk GJ. Development of youth percent body fat standards using receiver operating characteristic curves[J]. Am J Prev Med 2011,41(4S2):S93-99.

[31] Welk GJ, Laurson KR, Eisenmann JC, Cureton KJ. Development of youth aerobic-capacity standards using receiver operating characteristic curves[J]. Am J Prev Med 2011,41(4S2):S111-116.

[32] Zhu W, Plowman SA, Park Y. A Primer-Test Centered Equating Method for Setting Cut-off Scores. Res Q Exerc Sport[J]. 2010,81(4):400-409.

[33] Boiarskaia EA, Boscolo MS, Zhu W, Mahar MT. Cross-validation of an equating method linking aerobic FITNESSGRAM field tests[J].

TheAbsoluteStandardofFitnessEvaluation

LIANG Cheng-jun

(School of Physical Education， Liaoning Normal University， Dalian 116029， China)

Two fitness evaluation standards, including relative standard and absolute standard, were analyzed and discussed, and the advantages and the defects of them are analyzed. On the base of this, some questions of absolute standard, including significance, critical problems, setting methods and reliability and so on, were summarized and discussed its current research results. The major idea is to elucidate its overseas current research situation, in order to provide references for improving our fitness evaluation standard.

fitness; evaluation; relative standard; absolute standard

1004-3624(2013)04-0104-04

G804.49

2013-05-17

梁成军(1970-)，男，讲师，博士，主要研究方向：体育工程.

体质评价的绝对标准

0 前 言

1 绝对标准与相对标准的优点与不足

2 绝对标准的制定方法

3 绝对标准常用的统计学方法

4 结 语

0 前言

4 结语