万 茹
(河南大学体育学院,河南 开封 475000)
◀学校体育
美国基于标准的K-12体育学业成就评价工具PE Metrics:历程、内容与启示
万 茹
(河南大学体育学院,河南 开封 475000)
“基于标准的评价”是“基于标准的教育”的关键和核心。研究采用文献资料法、逻辑分析法,以美国国家运动和体育联合会(简称NASPE)研制推广的基于标准的K-12体育学业成就评价工具PE Metrics为研究对象,分别针对PE Metrics的历程、内容与启示三个问题进行探讨,旨在为我国研制基于标准的体育学业成就评价工具提供帮助。研究结果表明:美国PE Metrics的研制先后经过了六个阶段,评价年级是K、2、5、8、高中(9-12),分为标准1评价、标准2评价、标准3-4评价、标准5-6评价。其中,“标准1”实施表现性评价,“标准2-6”实施笔试。PE Metrics具有研制过程的严谨性、学段覆盖的全面性、指标体系的代表性、测量学理论的先进性、多媒体运用的直观性、评价标准的科学性等特点。我国应加强对基于标准的学生体育学业成就评价工具的研制。在研制时,应该注意“基于课程标准”是核心,科学性是目标,先进的测量学理论是保障,充分发挥录像的直观作用,为教师使用提供更多的自主权。 关键词:PE Metrics;基于标准的评价;体育学业成就评价
自20世纪80年代后期开始,美国中小学教育改革开始致力于推行学术标准,用以描述学生通过学校教育应该知道什么或应该做什么,并发展可计量系统用以测量学生在学术标准上达到的成绩,这在美国被称为“基于标准的教育”(standards-based education)。[1]“基于标准的教育”包括“基于标准的课程”、“基于标准的教学”和“基于标准的评价”。其中,“基于标准的评价”是“基于标准的教育”的重要组成部分。美国加利福尼亚大学评价研究中心(CSE)在2002年的报告中曾宣称:基于标准的教育体系的成功依赖于两个要素:强有力的标准和能衡量出标准所期望的学习结果的评价。[2]我国学者崔允漷先生也指出:“要使课程标准真正发挥作用,成为教材编写、教师教学和学生学业成就评价的依据。这三点中……尤以学生学业成就评价为最。只有当评价这一最后的出口是基于标准的时候,前两者才有可能是基于标准的。”[3]
伴随各科“课程标准”的颁布,我国于2001年也正式进入“基于标准的教育”时代。在体育与健康课程标准实施的十六年中,尽管体育学习评价研究成果不计其数,但是“基于标准的评价”仍不完善,评价的片面化、评价与课程标准不一致问题突出,严重降低了课程标准对体育课程与教学的指导性,影响了教学改革效果。
PE Metrics是美国国家运动和体育联合会(The National Association for Sport and Physical Education,简称NASPE)研制推广的基于标准的K-12体育学业成就评价工具,同时也是美国目前使用最广、实践效果最突出的学生体育学业成就评价工具。了解该工具的研制过程及其内容将对我国提供可资借鉴的资料,有所裨益。
1.1 PE METRICS研制背景
1983年,美国国家卓越教育委员会指出,美国学生的学业水平无法与其他国家的学生抗衡。之后,美国开始致力于在教育领域推行“内容标准”(content standards)。“内容标准”决定了通过学科教学,学生应该知道什么,能够做什么。学校教育工作者应该努力建立与标准相匹配的课程及教材,并且还要评价学生对于标准的达成度。[4]
在基于标准的教育改革的大背景下,NASPE于1995年首次制定了国家体育课程标准。1999年3月,NASPE 组建了一支由大学和中小学教师组成的专家团,重点探讨如何有效提高K-12体育教学质量,该专家团将“基于标准的评价”放在优先发展的位置。2000年1月,NASPE创建了一个评估小组(简称ATF),专门负责研制每个学段基于标准的体育学业成就评价工具。经过长达十年的努力,NASPE最终完成了基于标准的体育学业成就评价工具PE Metrics的研制,并分别于2010年和2011年出版了《PE Metrics: 小学国家标准1-6评价》和《PE Metrics: 中学国家标准1-6评价》,弥补了长期以来“基于标准的教育”中“基于标准的体育学业成就评价”的缺失。 本文主要对2010版和2011版PE Metrics进行解读和研究。
1.2 PE METRICS研制步骤
PE Metrics是由NASPE研制的一套评价美国K-12年级学生身体教育标准达成度的评价工具。[5]其工作涉及两个方面。第一,标准1(技能)评价工具的研制;第二,标准2-6评价工具的研制。现以小学PE Metrics标准1评价工具研制步骤为例,说明PE Metrics的研制过程。
1.2.1 设计评价方案
该步骤需要解决的关键问题是选取哪些年级和选取哪些与年级水平相适应的技能进行评价。测试项目是由专家小组从课程标准中选择具有代表性的运动技能进行评价,以保证评价内容与课程标准相匹配(见表1),小学选取的年级是K、2、5。
1.2.2 制定单项运动技能评价方案
在评价方案确定之后,ATF就开始着手制定K、2、5年级各单项运动技能评价方案。单项运动技能评价方案主要涵盖以下内容:被评价的标准、绩效指标、评价任务、动作标准、评价量规、评价要求、录像设备安置要求、评价记录表。
1.2.3 预测试和修改
该阶段,评价工具设计已经获得审查委员会通过,接着要在K、2、5年级各选择1-2个班进行预测试。然后,根据教师意见反馈和ATF对录像资料的分析,修改评价方案。
1.2.4 国家试点测试
为了保证测试质量,ATF培训了一个庞大的项目管理人员队伍(主要是教师教育者)负责试点测试及试点测试数据收集工作。测试采用现场测试,并在全国范围进行。
1.2.5 录像评分
PE Metrics对标准1(技能)评价时采用录像评分,学生的技能表现要通过录像进行记录,并通过评分员确定等级。为保证评分的公正合理,ATF制定了一套保证评分信度的程序。在评分者内部信度上,ATF要求每个评分员要对10%的录像资料进行二次评分。在评分员一致性信度上,ATF要求同一份录像资料至少要被两个评分员进行评分。
1.2.6 进行项目分析,修改任务
PE Metrics研制的最后一步是利用测试数据,对测试项目进行难度和区分度分析,以保证测试内容及难度水平与年级水平相适应。当发现测试项目太容易或太难时,ATF将根据对试点测试数据的分析,以及来自教师和项目管理者的反馈,对评价标准和方案进行修改。[6]
2.1 PE METRICS评价对象
美国《国家体育课程标准》(2004版)对K-12学段的学生通过学校体育教育应该知道什么或应该做什么进行了规定。[7]考虑到各学龄间学生身体发育、动作技能表现及认知情感方面的差异,ATF在选择测试年级时并未将K-12均列入评价范围,而是选择K、2、5、8、高中(9-12)进行评价,其中高中(9-12)作为一个学段出现,没有列出具体年级。
2.2 PE METRICS评价指标
美国 《国家体育课程标准》(2004版)对“受过身体教育的人”(Physically Educated person)提出了六个方面的要求,即6个标准。其中“标准1”主要涉及运动技能,“标准2-6”则涉及运动知识、体能、心理健康等范畴。
2.2.1 标准1的PE Metrics评价指标
在标准1评价方面,PE Metrics将K、2、5、8、高中作为测试年级,各测试年级的标准1评价指标如下:
表1 标准1的PE Metrics评价指标[8]
2.2.2 标准2-6的PE Metrics评价指标
在标准2-6评价方面,ATF设置了相应的试题库,将2、5、8、高中作为测试年级,标准2、标准3-4、标准5-6作为评价单元。表2列举了标准2的PE Metrics评价指标。
表2 标准2的PE Metrics评价指标[9]
2.3 PE METRICS评价方法
2.3.1 标准1的评价方法
在PE Metrics的标准1评价中,ATF针对选取的各项指标均设计了评价方案,其中评价量规采用四点量表对技能表现进行评价,各项技能的评分等级均分为1、2、3、4,且评价量表一般包括2-4个维度(如,5年级篮球防守技,见表3)。但是,标准1的评价量规只是“顺序量表”,不是“等级量表”(见表4)。 为了解决得分问题,PE Metrics引入了能力得分(ability score),通过“项目反应理论”(IRT)采用“测验等值”将评价得分换算成同一尺度,用于计算学生最终表现。[10]例如,与一个在难度较大评价任务上处于“2”的学生相比,一个在难度小的任务上处于“3”的学生的能力得分更低。[11]ATF认为:在运动技能评价中,学生的技能表现转瞬即逝,教师很容易漏掉一些细节,录像能够确保评价的准确性。[12]因此,测试中要求对学生的运动技能表现进行录像,然后根据评价量规对录像进行评分。
表3 PE Metrics中5年级学生篮球防守技能评价量规
(连续:90%或以上;经常:75%-89%;有时:50%-74%;很少:50%[13])
表4 评价任务能力水平[14]
2.3.2 标准2-6的评价方法
在PE Metrics中,标准2-6的评价采用笔试,笔试仅适用于2、5、8、高中(不包括K)。2年级的笔试题型是判断对错,5、8、高中的笔试题型则是选择题。笔试分为标准2、标准3-4、标准5-6三个不同的测试。ATF建立了在线试题库,教师可以采用线上测试和线下测试两种形式。无论哪种形式,教师均可以根据自己的教学内容自行选择试题,且每
表5 8年级学生标准2笔试测试题举例[15]
次选用试题的数量、每道题的分值及笔试成绩在总分中所占比重,均由教师决定(PE Metrics没有对标准2-6的笔试题和笔试结果予以赋分和分级)。
3.1 加强对基于标准的学生体育学业成就评价工具的研制
“基于标准的评价”在某种程度上决定了课程与教学是否能够基于标准,关系到基于标准的教育改革的成败。通过对PE Metrics的分析发现,基于标准的评价工具应该满足以下三点要求:第一,从来源看,评价指标必须来自标准,且具有代表性。第二,从横向看,评价维度应该全面,能够完整地反映课程标准对个体知识、技能及情意态度的要求。第三,从纵向看,评价对象应该涉及中小学具有代表性的学段。自2001年体育与健康课程标准颁布实施以来,我国关于体育学习评价的研究成果丰硕,但是却鲜有满足以上要求的“基于标准的学生体育学业成就评价”方面的研究。鉴于我国基于标准的教育改革深化的需要,“基于标准的学生体育学业成就评价”研究迫在眉睫,应该引起教育管理部门及相关学者的高度关注。
3.2 “基于课程标准”是核心
所谓“基于标准的评价”,即评价内容紧密围绕课程标准,旨在促进学生达到课程标准的要求。PE Metrics的“基于标准”主要表现在以下方面:第一,PE Metrics分为标准1、标准2、标准3-4、标准5-6的评价,其中标准1-6同美国《国家体育课程标准》完全吻合。第二,PE Metrics的评价指标全部来自美国《国家体育课程标准》。第三,PE Metrics在标准1各项指标的评价方案上,均首先对标准1进行陈述,接下来的绩效指标、评价任务、动作标准、评价量规、评价细则等内容都是对标准1的细化和具体化。第四,PE Metrics在标准2-6的笔试试题设计上,试题的维度划分紧扣美国《国家课程标准》对学生的要求。因此,我国在研制该类评价工具时一定要紧密、全面围绕课程标准。
3.3 科学性是目标
PE Metrics的研制长达十年之久,该工具的科学性主要体现在以下方面:第一,学段覆盖广,PE Metrics不是仅对某个年级的评价,而是针对K、2、5、8、高中等不同学段均设计了相应的评价方案,可以满足中小学生体育学习评价的需要。第二,评价指标具有代表性。PE Metrics选取的评价指标是在课程标准范围内,经过专家多次讨论,然后进行预测试、全国测试并反复修改确定的,具有代表性。第三,测量的精准性。PE Metrics在评分方面的最大突破是,不同项目、不同年级的评价结果能够进行比较。ATF利用IRT理论中的测验等值(test equating),将不同测验(考察同一特质)上的分数(特质水平值)和项目(试题)参数做出单位系统转换,从而使之能相互比较。第四,适用面广,实用性强。PE Metrics不仅可以作为国家进行体育教学质量监测的工具,而且也可以作为教师日常教学中对学生进行学习评价的工具,可以进行过程性评价,也可以进行总结性评价。因此,我们在研制该类工具时也应该力争达到上述科学性要求。
3.4 先进的测量学理论是保障
评价工具的研制以测量学为理论基础。在PE Metrics的研制中, ATF主要采用了IRT中的罗殊模型(Rasch model),该模型表示了:一个有特定能力的测试者成功完成特定难度测试的可能性。例如,一个测试项目的难度为0,对于罗殊模型而言,难度被定义为在能力量表(ability scale)上的一个点,在该能力量表上关于项目正确反应的可能性是0.5。如果一个测试者的能力是2,他成功完成项目的可能性就是0.88。如果测试者的能力是-2,他成功完成项目的可能性就减少到0.12。在IRT中,测试者能力的估算也是建立在这个关系的基础上的。例如,两个人参加一个有三个项目的测试,1=正确,0=错误。那个能做对两个相对难度较大项目的人将要比那个做对两个难度较小项目的人得到更高的能力得分(ability score)。因此,我们的研制工作也应该充分运用先进的测量学理论。
3.5 充分发挥录像的直观作用
与以往体育学业成就评价相比,PE Metrics更倾向于录像这一直观形式在评价中的作用。PE Metrics在两个方面对录像提出了要求。一,在标准1评价过程中,要求对学生的技术表现进行录像,并根据录像进行评分。二,在标准1各评价量规的展示中,为了让教师、学生更加直观地了解评价量规,除了运用书面形式外,还增加了影像展示,即以真人演示配合文字说明表述评价量规。这一点,如果条件适合,我国也可以学习借鉴。
3.6 为教师使用提供更多的自主权
研制基于标准的学生体育学业成就评价工具的主要目的,是为了让教师在教学实践中能够更好地针对课程标准对学生的体育学业成就进行评价,了解学生对课程标准的达成度,优化教学质量。因此,评价工具的设计应该为教师使用提供更多的自主权。在PE Metrics中,教师可以根据自己教学侧重点在试题库中选择相应的测试项目和试题对学生进行测试,且根据自己学校对学生成绩的评定等级设置,给相应内容设定不同的权重。
自我国基于标准的教育实施以来,基于标准的学生学业成就评价就一直是一个本应解决但总未解决的问题,基于标准的学生体育学业成就评价亦是如此。PE Metrics是美国基于标准的K-12体育学业成就评价工具,在研制过程的严谨性、学段覆盖的全面性、指标体系的代表性、测量学理论的先进性、多媒体运用的直观性、评价标准的科学性等方面均有很多值得我国借鉴之处。
[1] national association for sport and physical education, PE Metrics-----Assessing National Standards 1-6 in Elementary School[M]. Sewickley: AAHPERD, 2010:7.
[2] Robert Rothman, Jean B. Slattery, and Jennifer L. Vranek. 2002. Benchmarking, and Alignment of standards and Testing. CSE Technical Report566〔DB/OL〕. http://www.cse.ucla.edu.
[3] 崔允廓,夏雪梅. 试论基于课程标准的学生学业成就评价[J]. 课程·教材·教法, 2007(1):13-18.
[4] Weimo Zhu, Judy Rink.PE Metrics: Background, Testing Theory, and Methods [J], Measurement in Physical Education and Exercise Science, 2011(15): 87-99.
[5] Jacalyn Lund, Deborah Tannehil. Standards-Based Physical Education Curriculum Development[M]. 3th ed. Burlington: Jones & Bartlett Learning, 2015: 124.
[6] Ben Dyson, Judith H. Placek, Kim C. Graber. Development of PE Metrics Elementary Assessmentsfor National Physical Education Standard 1 [J], Measurement in Physical Education and Exercise Science, 2011(15): 100-118.
[7] Jennifer L. Fisette, D. marian Franck. How Teachers Can Use PE Metrics for Formative Assessment[J]. Journal of Physical Education, Recreation & Dance, 2012(5):23-34.
[8] NASPE, PE Metrics——Assessing National Standards 1-6 in Elementary School[M], Sewickley: AAHPERD,2010; PE Metrics-Assessing National Standards 1-6 In Secondary School[M], Sewickley: AAHPERD,2011.
[9] NASPE, PE Metrics——Assessing National Standards 1-6 in Elementary School[M], Sewickley: AAHPERD,2010; PE Metrics-Assessing National Standards 1-6 In Secondary School[M], Sewickley: AAHPERD,2011.
[10] ZHU W. Test equating: What, why, how?[J]. Research quarterly for exercise and sport. 1998, 69(1): 11-23.
[11] Connie Fox. How teachers Can Use PE Metrics for Grading[J]. journal of physical education, recreation & dance, 2012(5):16-34.
[12] Connie Fox, Weimo Zhu, Youngsik Park, Jennifer L. Fisette. Related Critical Psychometric Issues and Their Resolutions During Development of PE Metrics[J]. Measurement in Physical Education and Exercise Science, 2011(15): 138-154.
[13] National association for sport and physical education, PE Metrics——Assessing National Standards 1-6 in Elementary School[M], 2010:39.
[14] Connie Fox. How teachers Can Use PE Metrics for Grading[J]. Journal of Physical Education, Recreation & Dance, 2012(5):16-34.
[15] NASPE. PE Metrics-Assessing National Standards 1-6 In Secondary School[M]. Sewickley: AAHPERD, 2011:59.
PE Metrics——the Tool of K-12 Standards-based PE Achievement Assessment in America: Development、Content and Reference
WAN Ru
(Department of physical education, Henan University, Kaifeng 475000, China)
Standards-based assessment is the key of standards-based education. The article takes The literature method,logical analysis to mainly discusses three questions about PE Metrics that is the tool of PE achievement assessment developed by NASPE: development、content and reference. Research shows: the development of PE Metrics includes six steps. The assessment grades are K、2、5、8、high school, and assessment involve standard 1、standard2、standard3-4、standard5-6. Standard 1 is performance assessment, standard 2-6 is written test. PE Metrics's traits include: the rigor of development, comprehensive of grade, advance of measurement theory, multimedia intuition, scientific assessment criteria. The advices: We should develop our the tool of standards-based PE achievement assessment as soon as possible. When we study it, we should notice that the "standards-based" is the core, scientificity is the target, The advanced theory of measurement is the guarantee, Giving the visual effect of video, providing more autonomy for teachers. Key words:PE Metrics;standards-based assessment;standards-based PE achievement assessment
2017-06-05;
2017-07-09
万茹 (1976-),女,副教授,博士研究生,研究方向:体育课程与教学。
G80-05
A
1672-1365(2017)04-0089-06