● 邵朝友
三要素表现标准框架的建构与验证研究
● 邵朝友
表现标准是促进教—学—评一致性的重要保障,而构建一种合理的框架乃是开发表现标准的基础。结合本国内容标准特征,架构了包括内容要求、表现水平、表现样例的三要素表现标准框架,并以结构方程模型加以验证。分析结果表明,模型的各项指标具有良好的适配度。三要素之间的高相关和最终数据分析显示二阶模型的存在。在此基础上,文末审视了研究局限,探讨了进一步研究方向。
表现标准;表现标准框架;结构方程模型
表现描述符和表现等级构成了表现标准基本内容,前者乃关键所在。这是因为表现描述符规定了表现标准质量要求,回答了学生掌握内容标准的程度和证据。若使不同用户更好解读表现标准,进而达成最大共识,还需要在这两者基础上增加一些要素,以便为文本解读提供多个视角。那么当前有哪些表现标准框架、又存在什么问题、基于现状应建构一种怎样的本土化框架,就成为研究者必须直面的现实课题。
伴随评价实践的深入,人们发现极需要一种清晰界定学生学习达成程度的评价标准。它不仅可以为课堂教学提供规范,也为大规模考试提供标尺,进而为校内外的教学—评价—学习一致性提供技术保障。
这种评价标准就是表现标准。西方国家,特别是美国,早在上世纪80年代就开展了相关研究。目前各州基本都开发了表现标准,建立了综合评价体系。在我国,教育部门和学界也逐渐认识到其重要性,开发学科质量标准(其本质是表现标准)已得到共识。但如何基于实际需要建构一种本土化框架乃是将来开发表现标准的重要议题。就此有必要考察、借鉴西方相关表现标准框架。
表现水平层级和描述符是构成表现标准最基本单位。纵向上,表现水平层级说明不同年级或年段应达成的水平层级,横向上则描述出同一学习主题/内容/内容标准不同的表现水平层级,如 “高级”、“熟练”、“基本”三种水平。描述符则描述出不同水平的内在要求,如1996年美国国家评估管理委员会(National Assessment Governing Board)就规定了学生在8年级科学中获得“熟练”水平必须达到的要求[1]:学生应知道和/或能收集基本信息以应用于物理、生活、社会环境。学生应能联系简单的思想来理解汇报与权衡。学生能分析原因与结果之间的关系,比如掠食性动物/牺牲者、生长/降雨量。学生应能设计实验来回答包含两个变量的简单问题,能控制某个变量,收集、呈现数据,并以此做出结论。学生应能开始理解各种关系(如力与运动、物质与能源),并能开始理解作用于生物与非生物上的规律。
就目前文献而言,构成表现标准框架的主要“变量”还包括认知复杂度、表现性任务、学生作品等。这些不同因素和表现水平的组合形成了各种表现标准框架。
1.五种典型表现标准框架
综合各方文献,可归纳出5种典型的表现标准框架(见表1)。下面简要地对表中相关要素做一说明。
——认知复杂度指内容标准分解后各条表现期望的认知要求,其中马扎诺四种认知水平包括:提取、理解、分析、知识运用。韦伯知识深度包括四种水平,即回忆与再现、应用基本技能/概念、策略性思维、扩展性思维。
——表现性任务是表现性评价的两大组成要素之一,它对应于传统标准化测试多项选择题,更注重学生解决问题能力的形成。
——学生作品是指学生完成评价任务的作品或表现,评注则是对学生作品或表现的点评,也包括评价任务所涉及相关表现要求的陈述。
表1 五种典型表现标准框架汇总
2.分析维度与结果
可从相互一致、基于认知、逻辑严密分析表现标准质量。一致性指各构成要素的相互匹配关系。如描述符能明确地划分不同表现水平,同一水平表现能包容不同表现水平的表现;或者表现样例中的学生作品本身就与某表现水平相互匹配。基于认知包括两层意思,一是开发表现标准过程要以认知心理学为基础,二是表现标准开发结果要基于认知来呈现,特别是有关学生典型错误表现的作品。逻辑严密维度主要指向于表现水平。表现水平的设置需要采取逻辑约定,如对于含有多个要素的某条内容标准,达到“熟练”水平的规定为:在绝大多数要素上达到“熟练”表现;此外,逻辑严密维度还要求表现标准呈现不同表现水平。三个维度相互关联、缺一不可,它们整体构成了判断表现标准的分析架构。应用三个维度可对表1做如下分析。
——阿拉斯加州科学学科表现标准:部分考虑了用表现水平与内容标准的一致性;缺乏认知复杂度,不能把表现标准建基于认知心理学基础上;表现水平层级的缺乏不能让使用者了解内容标准的不同水平表现。
——科罗拉多州框架语文阅读表现标准:缺乏认知复杂度:从其描述情况来看,表现水平还非常宽泛,在具体和抽象之间没有平衡,没有考虑学情,表现样例的缺乏也使得教师、学生失去一个解读表现水平的参考点。
——阿拉斯加州历史学科表现标准:在内容标准—表现标准—认知复杂度上,部分体现了相互一致维度,但没有具体说明评价任务与三者关系,其结果是不能很好地为评价设计提供参考;在基于认知维度上,没有呈现学情,减少了教学的重要参考点,也使得难以据此进行评价设计;在逻辑严密维度上,没有考虑如何确定表现水平层级。
——雷斯尼克等学科表现标准:在相互一致维度上,有表现要求和表现性任务,但没有明确表现性任务的认知复杂度,使得表现标准难以发挥评价引导作用,评价设计与内容标准失去联结;考虑了学情,并用评注的方式加以描述,很好地为教师和评价设计者提供参考点,也为学生提供示范;在逻辑严密维度上,没有呈现表现水平层级。
——肯德尔等表现标准:规定了认知复杂度,但试题的四种表现水平不是表现标准的表现水平,前者只是来自试题的评分规则,后者应来自内容标准;此外,学生作品也没有呈现,不能为每个水平做具体的参考点。
1.框架构成
为解决上述问题,本文尝试提出一种三要素表现标准框架,它们分别是内容要求(包括表现期望、认知复杂度)、表现水平、表现样例(包括表现性任务、学生作品)。
2.要素说明
——内容要求。它包括表现期望和认知复杂度。前者针对我国一些学科课程标准还不够具体清晰而提出。换句话说,它是内容标准被分解后得到的陈述。但表现期望还没有回答一个问题,即需要达到什么样的认知类型,因此还必须考虑如何在认知要求上规定内容标准的掌握程度。本研究借鉴了韦伯的四类知识深度水平理论。
——表现水平。虽然认知复杂度规定了认知复杂层次,但还是显得比较笼统。处于同样的认知复杂水平的不同学生,其表现亦可能有所不同。例如两位学生处于“应用基本技能/概念”,但表现未必完全相同,可能体现在熟练程度、细节、速度、流畅性上的差异。因此还需要对不同学生的表现做进一步划分。
——表现样例。表现样例包括表现性任务和学生作品,二者相伴出现,为用户提供解读认知复杂度、表现水平参考点。特别当学生表现处于不同表现水平临界点时,表现性任务和相应学生作品为区分不同表现水平提供具体参考。同时,划定水平时可能发现不合理甚至错误的典型表现,呈现这些表现一方面它代表学生真实表现,另一方面它帮助教师把握学情。
验证设计应用了结构方程模型,运用了Amos6.0分析软体。图1呈现了设计的路径图。
图1 三要素表现标准框架假设模型
表2描述了模型变量对应表,具体交代了三个潜在变量、以及代表观察变量的6个问卷题目。
表2 模型变量对应说明
调查范围覆盖浙江、山东、河南三省,相关信息见下表。数据收集乃通过问卷方式,剔除无效问卷,有效问卷共500份。具体调查时采取随机方式进行,如调查当日在校教师,要求被调查者在20分钟之内完成问卷并上交。
表3 调查对象基本信息
Amos6.0运行后输出各类数据,其中显著性概率值P=0.002<0.05,表明模型被拒绝,需要修订。点选修正指标项(Modification Indices),输出结果如下。从中可发现,若是将误差变量e3、el由固定参数改为自由参数,则至少可减少卡方值10.290,因此增加两者的共变关系。
表4 修正指标信息
Amos6.0重新运行后,得到图2。内容要求、表现水平、表现样例三个潜在变量之间的标准化后相关系数为0.77、0.70、0.84,表明模型总体具有很高一致性。Alpha(=0.6610)>0.6,表明修正模型具有较高内部信度。
图2 标准化后的三要素表现标准框架验证模型
模型的自由度为 5(Degrees of freedom=6),适配度卡方值为7.870(Chi-square=7.870),显著性概率值为 0.164(Probability level=.164),未达 0.05 的显著水平,接受虚无假设,即表明观察数据与假设模型间可以适配。
Amos 还 输 出 了 Baseline Comparisons、RMR、GFI、RMSEA、AIC、ECVI、HOELTER 等各项模型适配度指标,它们是判断模型是否成立的关键表征,现以表5统整如下。
图2显示三个要素之间的路径系数较高(0.77、0.84、0.70,皆不小于0.70),表明三个要素之上还存在一个更上位概念。从本研究来看,该上位概念就是表现标准。该二阶模型构造如下。数据分析表明,各项适配度指标保持不变,进一步确证了该二阶模型的存在。
表5 “三要素表现标准框架”验证性因素分析的整体模型适配度检验摘要
图3 标准化后的二阶验证模型
数据分析表明,三要素表现标准框架模型有较好适配度,是一个有机整体,并非“水果拼盘”架构,而各个要素之间的内在一致性有利于用户多渠道解读表现标准。
上述研究更多是指向框架本身是否成立,较少关注各要素的研究,加上研究样本本身的限制,因此还需要在以下若干方面做进一步探讨。
第一,扩大样本数量与类型。这乃因为本研究样本数量只有500例,虽然对于结构方程来说已基本足够,但如果要做更广泛外推,还需要更多样本来验证。同时由于样本类型仅局限于某省城比较好的三所学校,因此还需要在全国范围选择更多类型的样本。
第二,深化认知复杂度研究。本研究采用韦伯知识深度理论,虽然该理论已在美国20多个州得到广泛应用,但还需要结合我国具体学科认识知复杂度分类进行验证或调整。
第三,加强表现水平描述符研究。制订描述符可能是最难的一个研究领域,描述符有什么特征、怎样开发等等,都需要结合具体学科内容标准开展实证研究。
[l]Mills,C.N.,&Jaeger,R.M.Creating descriptions desired student achievement when setting performance standards[A].in Hansche,L.N.Meeting the requirements of Title I:Handbook for the development of performance standards[M].Washington,DC:U.S.Department of Education,1998:82.
[2][4]Alaska State Board Education&Early Development.Content and Performance Standards for Alaska Students[OB/EL].http://www.eed.state.ak.us/standards/pdf/standards.pdf.2005:119、138.
[3]Hansche,L.N.Meeting the requirements of Title I:Handbook for the development of performance standards.Washington,DC:U.S.Department of Education,1998:26.
[5]美国国家教育经济中心、匹兹堡大学著,上海市教育科学研究院组译.美国初中学科能力表现标准[M].北京:人民教育出版社,2004:3-18.
[6]John S.Kendall,Susan E.Ryan,Amy T.Richardson.The systematic Identification ofPerformance Standards[R].http://www.mcrel.org/pdf/Standards/5041TG PerfStnds.pdf.2010-2-9.
[7]Karin K.Hess,Dennis Carlock,Ben Jones,and John R.Walkup.Cognitive Rigor:Blending the Strengths of Bloom’s Taxonomy and Webb’s Depth of knowledge to Enhance Classroom-level Processes[R].Education Resources Information Center publication Ed517804.
邵朝友/华东师范大学课程与教学研究所教育学博士生
(责任编辑:张 斌)