美国粗大动作发展测试(TGMD)解析与启示

2021-06-23 03:07刁玉翠洪金涛孙建刚
成都体育学院学报 2021年2期
关键词:效度工具测试

李 博,刁玉翠,李 静,洪金涛,孙建刚,刘 阳,5

儿童时期的粗大动作发展是基本运动技能(Fundamental Movement/Motor Skill,FMS)的重要分支,儿童FMS 的测评是评估、诊断、监控个体动作发展的重要指标[1-2]。鉴于FMS 发展的重要性,发达国家的常规做法是对儿童的FMS进行纵向的大规模普查,如美国早在20 世纪80 年代就已对儿童的动作发展进行测评,并将其纳入《美国学校体育教育发展现状报告》分析指标,进行跟踪式调查[3];德国的全国性调研“德国儿童与青少年健康访查调研项目”中3~17 岁的儿童FMS 情况是其重要内容之一[4]。当前我国学校体育中缺少对学生FMS 发展情况的普查,而拥有一套科学的FMS 测评体系是进行大规模普查工作的前提,因此基于我国体育文化背景和学生动作发展情况的FMS 测评体系亟待被研发[5-8]。

美国粗大动作发展测试(TGMD)是由美国密西根大学的Ulrich 教授制定,以3~10 岁儿童作为测试对象,用来评价儿童FMS 发展水平的工具。经过30 多年的发展,目前已经更新到第三版,即TGMD-3,该测试采用过程性评价与结果性评价相结合的方式通过对儿童进行包括前滑步在内的13 个粗大动作的完成质量进行评分,进而评估测试对象的FMS 的发展情况。经过30 年的发展,TGMD 已经成为世界上应用最广泛的FMS 测评工具[6]。TGMD 的研发是基于美国本土儿童动作发展状况制定,根据经典测量理论的知识,由于地区之间的文化差异,国外测评工具在我国使用之前要进行一系列“本土化”工作[9],对我国学者而言该项工作包括测评体系的语言体系汉化和信效度检测等工作。当前国内的研究中对TGMD 的应用中跳过了语言体系汉化工作,造成了应用中存在TGMD 测量系统中相关术语“不统一”的现象,如现有文献中对“Gallop”动作的翻译有“马步跑”“跑马步”“前滑步”“前滑”等多种翻译,这种现象的存在可能会造成TGMD 的错误使用,因此有必要进行术语统一以规范TGMD 的应用。

鉴于上述情况,本研究对TGMD 的产生及发展、测试体系、信效度及应用现状进行系统梳理。为我国儿童动作发展评价体系的构建提供镜鉴和思路,推动我国儿童FMS 测评体系的研发工作。

1 产生发展

TGMD 系列是由美国密西根州立大学Dale A.Ulrich 在1981 年研制。TGMD 系列原始版本(TGMD -1)是1981 年Ulrich 在其博士论文中发布的,随后在2000 年和2013 年进行了版本更新,对应的版本分别是TGMD -2 和TGMD -3。TGMD 是一种直接观察、注重动作过程的FMS 评估工具,每项技能有3~5 个表现标准(观测点),这些动作标准用于界定儿童在完成某个动作时躯干和四肢配合是否协调、FMS的形成是否精确,是否达到自然、顺畅的动作技能模式。该系列的常模操作测试情景均是在美国本土完成的,适用年龄段基本涵盖了儿童FMS 发展的敏感时期。该系列的设计初衷是为了甄别那些动作发展总体表现明显落后于同龄人的儿童。TGMD 的产生和发展具有特定的社会和学术背景,主要是基于以下3 个方面。

1.1 终身体育理念的提出

终身体育理念是在“二战”之后受国际终身教育思想的影响和体育运动的发展,特别是大众体育的兴起而提出的。人体动作表现贯穿于人类的全生命周期,从胚胎和婴儿期的固有非条件反射,到儿童少年时期的FMS,再到成年时期的专项运动技能,研究者们认识到人类动作发展和体育运动之间存在着极为紧密的关系[2]。因此科学的解释人类动作发展的规律可以更加有效地教授或引导人们依据这种客观规律来掌握和学习动作技能,从而达到建立终身体育意识、具有终身体育能力和促进身心健康的目的。在此背景下,儿童动作发展测评的工具被各国学者相继开发。

1.2 美国学校体育教育测评的需求

儿童“运动技能”测评是美国学校体育课程中“对学生体育学习”评价的主要内容之一[3]。对于儿童而言,最常见的学校体育教育课程内容是FMS,3~10 岁儿童的运动技能发展主要体现在FMS 的完善程度上,该年龄段是儿童发展FMS 的敏感时期,因此该阶段的学生“运动技能”评价中将FMS 列为主要观测指标,并不是侧重于专项运动技能,因此TGMD 系列作为FMS 测评的体系在美国的体育课程评价中被广泛应用[10]。最新版的《K-12 体育教育标准》中明确指出一个具有完备的Physical Literacy(以下简称PL)的学生应“具备展示各种基本动作技能和动作模式的能力”,在PL 的理念进入学校体育教育之后,学生FMS 发展更是成为PL 的主要操作定义之一[11],这也就成为美国学生FMS 普查的范围不断扩大的重要原因[3]。

1.3 非典型动作发育儿童筛查的必要

儿童的FMS 发展存在正常发展、超前发展、滞后发展和障碍发展4 种现象,正常和超前发展可以被家长或教师接受,但滞后发展和障碍发展的儿童则需要被检出以便进行合理的干预或治疗[12]。以最常见的发育性动作协调障碍(Developmental Coordination Disorder,DCD)为例,又称动作技能协调障碍,指的是由于动作能力的不足导致日常生活能力和学习成就受到影响的一组神经发育障碍性疾病[13]。DCD 不会随着年龄的增长而“恢复”,甚至会持续到青春期和成年期[14]。而TGMD 系列则是较常被用于DCD 筛查的工具[15]。除此之外,TGMD 系列还被用于自闭症谱系障碍[16]、智力障碍[17]等具有非典型发育特征的儿童群体。

2 测评体系

2.1 测量理论:经典测量理论

TGMD 系列构建是基于经典测量理论的基础之上。经典测量理论亦称“真分数理论”。该理论假设观测分数X 是由真分数T 及随机测量误差E 所组成,即X=T +E;误差E的平均数等于0;误差E 与真分数T 间的相关为0[18]。在经典测量理论的知识体系中认为测评体系的构建需要经过信效度检验、项目分析、常模构建以及标准化等基本建造程序。标准化测评对实施程序、对象范围、施测环境、测试方式、测验时限、分数解释(常模)做了统一的规定,这样测评能够在异时、异地,不同的主试等条件下进行,并能得到同等有效的测评结果。标准化的思想主要来自自然科学中对实验条件进行严格控制以降低测量误差,其方法主要是通过对无关变量和干扰变量控制。TGMD 系列在现实操作中均已经具有了完整的操作手册,并对操作情景、工具规格以及测试人员品质等提出要求,较高的标准化程度保证了测试的信效度,同时保障了常模解释的准确性,这也是它得以广泛应用的重要原因。

2.2 测试流程:标准和严谨

标准和严谨的测试流程是保证该工具可以进行大面积推广应用的重要原因。TGMD 系列主要包含两个维度(移动和球技),测量了儿童动作技能里的移动技能和物体控制技能。最新版的TGMD-3 于2013 年发布并开始进行大样本规范性的信效度数据检测工作,TGMD -3 中主要包含了移动和球技两个分测试。移动测试中包含跑等6 项技能;球技测试包括双手持棒击定位球等7 项技能,两个子测试共计13 项测试动作,每个测试动作都有3~5 项具体的完成标准,测试动作正确执行得1 分,无法正确执行得0 分,重复测试,分值区间为0~100,其中移动分测试总分46 分,球技分测试总分54 分。在测试前需要获得包括人口学信息(性别、年龄、居住地)和常规生理信息(体重状况、优势手、优势脚)在内的个人信息,单次整个测试流程需要15~20 min,并且所需的器材均是体育课中常用的器材。

为了规范TGMD 的应用,本研究对TGMD -3 中的技能、器材和路线进行汉语翻译,在考虑中国特定的文化因素和用语习惯的基础上,使用纸质辞书(如:牛津高阶英汉双解词典第9 版)、电子辞书(如:Google 翻译)等翻译工具,按照“全体作者合作翻译→英文专业翻译人员审查→运动技能专家审查→一线体育教师审查”的翻译路径方法。翻译出TGMD-3 测试技能、器材和路线(如表1)。

表1 TGMD-3 测试技能、器材和路线Table 1 Testing skills,materials and directions included in TGMD-3

2.3 评价标准:常模参照评价

TGMD 系列采用“常模参照评价”的评价方式,根据不同年龄阶段的平均表现制成常模,绘制成儿童FMS 的“发展性常模”。原始版本TGMD-1 的常模测评样本是居住在美国8 个州的909 名儿童,并根据性别、种族和居住地等指标进行了区分。“常模”和“标准化样本”是测量学里两个重要的概念,常模参照测验中被测对象相对发展水平的衡量依靠常模的确立,而常模又是在标准化样本的基础上建立起来的。在TGMD 系列中,标准化的样本是基于大样本量的美国本土儿童。但是,现有的研究也证实,文化背景、语言体系和人种的差异均会使同龄儿童的粗大动作发展产生较大差异[19]。因此,基于美国的常模并不一定适用于其他国家或地区,基于应用国家或地区儿童数据的常模建设工作是应用该系列的常规工作[20-21]。也正因如此,多数测评体系存在跨文化测评[22]效度减弱的问题,其数据常模不能精确地适用于他国儿童,因此各国学者会根据本国儿童的实际情况有针对性地制定测评工具[6]。

3 信度与效度

Ulrich 的最新一项研究通过对807 名美国儿童的TGMD-3 测试来检验其信效度。结果显示重测信度较高,移动测试(ICC=0.97)、球技测试(ICC=0.95)和总分(ICC=0.97)的ICC 具有一致性。效度指标中,TGMD -3 具有可接受的项目难度(范围=0.43~0.91)和项目区分度(范围=0.34~0.67)。探索性因子分析支持TGMD -3 的单因素结构,其变异率为73.82%;验证性因素分析支持单因素模型,以上显示TGMD -3 可接受的结构效度,结果表明,TGMD -3具有很高的信效度[23]。TGMD 系列除了在大样本量的典型发育儿童使用信效度的检测之外,还在智力障碍[17,24]等非典型发育儿童群体中进行了信效度检测,也证实该体系在非典型群体儿童中同样具有较高的信效度。工具的信效度检验工作是测评工具推广的重要步骤,对于工具的推广和应用至关重要,因此相关的研究数量较多。

3.1 信度

经典测量理论中认为信度等于真分数变异数与实得分数变异数之比。测验的信度是指测验的可靠程度。它表现为测验结果的一致性和稳定性,信度是反应测验结果受到随机误差影响程度的指标,是评价测验质量的最基本的指标[25]。在其他国家和地区的信度测试中,TGMD 系列也显示出具有较高的信度值。此外,有研究比较了TGMD -2 和TGMD-3 的评分者信度和重测信度,运用组内相关性用于检查评分之间和评分者内部的可靠性,其结果显示,TGMD-2 的测试总分和TGMD-3 的测试总分表现出较高的评分者信度(ICC:0.92~0.96)[26]。TGMD -3 在我国上海儿童的信度检验中,各项指标也显示该工具具有较好的信度[27]。

3.2 效度

经典测量理论里认为效度等于有效分数变异数与实得分数变异数之比。TGMD 是对人类动作行为样本的客观和标准化的测量工具,是属于方法学的“测验”范畴,其效度不同于实验。测验的效度是指一个测验在测量某项指标时所具有的准确程度。它所回答的基本问题是:一个测验测量对象的什么特性,它对该特性的测量有多准确?测验的效度越高,则表示它所测结果越能代表所测对象的真正特征[28]。结构效度中Ulrich 通过检查四个关键假设来验证TGMD 系列的结构效度,分别是:(1)与实际年龄的相关性;(2)每组中高中低三个层次之间存在个体差异;(3)总分与子测试得分的相关性;(4)因子分析,最终指数显示在0.90~0.96 之间。TGMD-2 在我国山东地区儿童的效度测试中[29],内容效度(辨别力和难度)、结构效度(总分与子测试得分的相关性)和效标关联效度(效标采用的是“学生体育课的运动成绩和体育教师日常评价”)等指标的均呈现出较良好的结果。

4 优点与缺点

4.1 优点

TGDM 系列的优点有:(1)适用对象涵盖了FMS 发展的敏感时期,且该测试体系所有的年龄段应用同一套测量工具,这为儿童动作发展的纵向比较提供基础;(2)TGMD 测试流程标准严谨且多种环境应用下高信效度,这为全球视域下儿童FMS 的国际比较提供工具。(3)适用对象广泛,不仅适用于正常发育的儿童,对部分非典型发育的儿童同样适用。(4)相比较而言,TGMD 还有测试耗费少和对场地器材等硬件设施要求低的优点。

4.2 缺点

TGMD 系列的缺点有:(1)该系列没有包括稳定性的相关测评。TGMD 系列是FMS 最常用的测评工具。FMS 包括3 个下位范畴;移动技能、物体控制技能和稳定性技能[1]。然而,TGMD 可以通过移动子测验测试移动技能,通过球技子测验测试物体控制技能,但却缺乏对稳定性技能的测试。(2)测试指标的选取是基于美国的文化体系,部分指标适用性有限[19]。Kim 的研究运用身高体重指数(BMI)和TGMD-2 对216 名韩国儿童的测试中发现FMS 与BMI 不相关,与健康体重和肥胖不相关,这和既往研究的结论有较大的差异,研究者认为这种结果产生的原因很可能是由于TGMD的适用性问题[30]。再如“双手击定位球”动作是基于美国大众体育中的“棒球”击球动作选取的,但是在亚洲的体育文化当中应用此指标,其区分度情况需要进一步证实[31]。(3)过程性评价的弊端。Ward 等的研究选取了10 名小学教师和7 名儿童动作发展专家对儿童在TGMD -2 中跳跃、单脚跳、踢和投掷4 种技术的10 种表现进行人为打分评判,发现教师和专家对儿童FMS 总体熟练度的判定并没有差异,但是对于单个动作观测点的判定却存在较大差异。研究者认为,无论施测者的经验如何,对于动作熟练标准的具体实施还是有难度的。这项研究提示,对于诸如TGMD 这类应用过程性评价的工具存在由于施测者问题而降低效度的缺点[32]。

5 应用情况

5.1 主要用途

主要用途有:(1)识别与筛查。主要应用于儿童保育学领域,用于识别和筛查那些动作发展迟缓或障碍的儿童[15,33]。(2)教学设计评估。主要应用与体育教学课程中,评估运动技能干预或教学的成功与否。Ryan 等的一项在美国综合学校体育活动计划背景下开展的研究中利用TGMD-2 评价了1 460 名低收入家庭儿童,观察经过12 周的干预计划之后的动作技能变化,以此来评估该计划的实施效果[34]。(3)评估个体动作发展进度。主要用于儿童FMS的评估,主要涉及到FMS 相关的横断面以及纵向追踪研究等[35]。一项研究应用TGMD -3 评估了英格兰的贫困地区和不同种族地区的不同年龄阶段FMS 发展情况,发现FMS的发展在儿童期和种族之间的性别之间存在差异[36]。此外Issartel 等的研究显示TGMD 在12 岁儿童(该系列的适用年龄为3~10 岁)中也具有很好的信效度,适用年龄范围的扩大提高了该系列的普适性[37]。(4)干预项目或政策评估。评估儿童群体在FMS 发展方面的进程。如有研究运用TGMD-2 测量了我国大陆地区的儿童FMS 之后发现我国儿童移动动作技能整体优于美国儿童,而物体控制技能整体偏低[38]。

5.2 我国的应用现状

当前国际上与TGMD 相关的研究数量较多,这些研究集中在欧美等发达国家或地区,亚洲数据匮乏[10],相比较而言我国儿童的数据则更为匮乏。我国学者从2005 年起就开始进行TGMD 相关的介绍和实测工作。我国学者李静和梁国立于2005 年将TGMD-2 引入了该系列,并于2007 年就TGMD-2 的信效度在我国山东地区进行了测试,其结果表明在该地区具有良好的信效度[29]。一项研究通过TGMD -2 测试学前儿童FMS 发展,验证该工具在学前儿童中使用的信效度,结果显示TGMD-2 表现出较好的信效度,不同年龄与性别组呈现出得分差异,具有较好的区分度[39]。刁玉翠等通过上海市的1 186 名儿童对TGMD -3 进行了信效度检验并构建了上海市常模[27]。图1 选取了核心期刊中我国应用TGMD 系列的研究,从该图中可以看出当前与此工具相关的研究的主要是横断面研究,其中一部分研究通过TGMD 工具对中国儿童进行测量,并与中国香港、美国和巴西等国的儿童进行比较[38,40-41];另一部分研究中通过该工具的测量探讨FMS 发展与动作能力感知[42]、身体活动量[43]、体能[44]和身体素质[45]等变量间的关系。此外,该图中还显示尽管相关的研究总数量较少,但呈现出逐年上升的趋势。

图1 国内研究应用TGMD 系列的时间序列图Figure 1 Time series diagram of the domestic research on application of TGMD series

6 启示

6.1 以TGMD 为镜鉴,构建我国儿童动作发展测评体系

TGMD 系列以其适用性广、操作性强,高信效度等特性成为当前世界上应用最广泛的儿童FMS 测评体系。但是跨文化应用效度减弱问题依然是成为TGMD 推广的“绊脚石”,相关的亚洲数据匮乏是当前该体系在实际推广中遇到的问题[7]。因此各国学者会根据本国的实际情况进行有针对性地制定基于本国儿童的动作发展测评体系[6]。测评体系主要包括“测量系统”和“评价系统”两部分,既往研究中当前中国台湾学者孙世恒等以TGMD 为典范研制了基于台湾儿童的“大肌肉群动作发展测评”(PGMQS)[46];北京体育大学罗冬梅团队研制了“3~6 岁学龄前儿童大肌肉群动作发展评价量表”[47],但上述工具停留在“测量系统”层面,可以看出当前我国大陆地区相关的动作发展测评体系较为匮乏。因此,在借鉴和应用TGMD 系列测试流程和评分标准的基础上,根据工具研发的目的,选取具有我国儿童特色的动作技能指标,构建中国儿童FMS 测量工具,随后应根据中国儿童的动作发展数据,构建评价体系常模,并参考“国民体质监测”工作的流程,将我国儿童的动作发展测评纳入定期的大规模儿童身心健康发展调研中。

6.2 以健康促进为导向,开展大规模的儿童动作发展筛查

人体的动作发展水平既是判断和检测机体的身体形态、机能、素质、动作能力等体质健康状况的外在表现,又是检测人的体质状况的基础因素[2]。我国有针对儿童的大规模的体质普查工作,但是对于动作发展研究还停留在学术研究层面。一方面,儿童FMS 的发展关乎成年时期专项运动技能能否保持,是“终身运动”的基石;另一方面,具有非典型动作发育特征儿童的早期筛查是干预、治疗该类儿童的重要前提。因此,建议将动作发展筛查工作纳入儿童的健康评价体系,以我国“儿童动作发展测评体系”为工具,开展大规模的儿童动作发展筛查评价,以评估我国儿童的动作发展情况,为后续的儿童动作发展“监控→预测→改进”等工作打下基础。

7 结束语

作为当前世界上应用最广泛的FMS 测评工具的TGMD,其成功推广的原因不仅在于测评体系的高度标准化,更重要的是FMS 的发展确实在儿童时期至关重要。但就目前我国的学术界的情况来看,对儿童动作发展的研究还不够深入,同时我国学生的FMS 发展情况还没有纳入系统的学生发展评价工作。本研究部分展现了TGMD 的发展历史和应用现状,研究者期望本研究可以抛砖引玉,一方面国内学术界加快加深对儿童动作发展研究的开展,将儿童动作发展测评体系的研发尽早提上议程。另一方面在学校体育教育中,将儿童动作发展纳入到学生发展测评工作当中,尽快构建学生动作发展“监控→预测→改进”的工作体系,以提升学生的身心健康水平。

猜你喜欢
效度工具测试
波比的工具
波比的工具
心理测试
准备工具:步骤:
谈高效课堂下效度的提升策略
巧用模型法提高科学课堂教学的效度
“巧用”工具
大学生积极自我量表初步编制
计算机辅助英语测试研究
心理小测试