丁原春,李红梅,胡文彦,宋志荣
(黑龙江职业学院,黑龙江哈尔滨 150111)
成果导向教育(OBE)理念于20世纪90年代在北美发展起来,创始人是Spady,成果导向是学习成果导向,重视学生学习成效与明确毕业生能力。Spady(1993年)给出了OBE的七个特征,如清楚列出学生毕业时能得以证明的学习成果;具有能够实现最终学习成果的学习计划、课程、教学单元等设计;有清晰的评估标准和参照系统。可见,“成果”需要预设,并运用评价工具和评价方法持续有效地对学生阶段性学习成果进行综合分析,让学生逐渐提升以达到预期的顶峰成果。与此同时,标准化测验的不足逐渐被显现出来,如造成教师教学侧重于测验的内容,窄化学生的学习成果等。美国教育界开始将纸笔测验之外的多元评价方式被引入教学,尤其是实作评量和案卷评量广泛运用在学科领域中,引导了美国教育测量的多元评量潮流。实作评量作为评估学校教学绩效和了解学生成就水平的策略,期望借助评量的革新来提升教师教学的品质和学生学习的成就。这股评量变革浪潮的袭来,引起各国教育学者、专家的高度重视,不断进行实作评量的应用实践及理论完善。
中国高等职业教育领域的课程评价采用过程性评价和终结性评价相结合,而具体呈现形式仍以笔试答卷为主。笔试答卷具有规范性、公平性以及易于操作等优势,但却无法更好地体现高职教育的全面评价学生、促进学生发展的特征。
实作评量(performance assessment)也被称为真实评量(autheentic assessment),Stiggins(1987)指出:以观察和专业判断来评量学生学习成就的评量方式,都可以称为实作评量[1]。美国教育评定技术处(1992)将实作评量界定为“通过学生自己给出的问题答案和展示的作品来判断学生所获得的知识和技能”。国际教育成就评价协会(IEA)在第三次国际数学和科学教育研究(TIMSS)(1999)中正式使用“实作评量”,并把实作评量定义为“利用综合的涉及使用仪器和设备的实践作业去评价学生的内容知识和程序知识,以及学生运用这些知识进行论证或解决问题的能力”。中国台湾学者李坤崇(1999)认为,实作评量是一种由实施测评的专业教师编拟于学校,应用与真实情景中的一种模拟测验,用以测评学生所知、所能的量化结果[2]。
根据建构主义教学观,学习是学习者基于先前经验主动建构的历程,强调学生对知识的主动探索和对所学知识意义的主动构建。从上述实作评量的定义研究进展来看,实作评量的目标聚焦于认知过程,由理论化→演绎规律→建立解释→应用到实际解决问题的情境之中,这是建构主义学习和教学理论在实作评量中的体现。实作评量是以学生为本,注重主观能动性;注重学生完成整体学习,获取知识的过程;以整体技能为基础,而不是单个技能;需要小组或团队技能,而不仅仅是个人技能。
实作评量已成为一套完整的“评价体系”,能测量学生已经知道的事物,以及尚未知道的事物;能测量学生专业能力,以及“发现问题”、“解决问题”的综合能力;能检测学生认知过程,及时予以反馈,不断提升能力;能让教师更有效地检测教学内容和学生学习的薄弱点;能辅助教师完成教学环节,更好地观察学生的学习效果。可见,实作评量不仅具备评价学习的初级功能,也具备以评价促进学习的功能;不仅具备评价学生的基本功能,也具备帮助教师“反思教学”的功能。因此,实作评量的应用,无可避免地改变了教师的教学和学生的学习。在国外,实作评量已被广泛应用于化学实验、设计、测绘、数学、语言教学等各个领域。在中国国内,实作评量主要运用于具有操作性的学科领域,伴随高职教育培养技术技能型人才的需求,实作评量作为教学评价的一股新鲜血液,将起到积极而重要的意义。
Herman等(1990)认为,实作评量具有以下特征:评量的作业能与真实生活产生关联;评价的作业具有意义性、挑战性并与教学活动相结合;历程(process)和作品(product)通常是评量的重点;表现的规准(creteria)和标准(standards)就是评量的重要层面与给分标准,要事先确定。Gronlund(1998)将实作评量的特征归纳为:更真实的评价作业、更复杂的评价作业、需要更多的评量时间、需要更多地应用专业判断。
实作评量是对学生完成作业的历程、结果表现或制作作品所应该表现的特定行为的检测,主要在于评量将所得知识转化为行动的能力。实作评量的定义和特征,以及所蕴含的精神,对于提高学生学习兴趣和学习成果,都不失为一种好的教学策略。然而,实作评量的愿景并不是自动达成的,需要经过严谨的设计,在实际教学中恰当、有效地实现其特征,才能充分发挥实作评量的作用。
在实施实作评量前,应依据课程教学目标,即学习成果选择实作评量方式,确定实作评量的实作目标;并在课程教学目标领域内,选择能代表重要学习成果的实际作业。然后,确定实际作业中包含的评测观测点,规划评量标准。最后形成实作评量尺规表,完成实作评量的设计过程。具体开发步骤及要求如下:
教师在评量前应明确课程教学目标,即学习成果,包括知识、技能和素养。传统的纸笔测试评量目的是评量事实知识、概念知识、程序知识及后设认知知识成果,而实作评量的目的是开发学习者的深层思维和评价问题解决技能。因此,对于重点描述行为技能表现和态度情意表现的教学目标,教师宜采用实作评量。实作评量通过评价学生的实际操作、小组合作交流、小组成员表现等,检测学生是否应用所学的知识和技能来解决问题,达成学习成果。
实作评量的实作目标应明确呼应课程教学目标的重要学习成果,实作目标应可实施、可评量。
“作业(tastes)”是一种综合反映学习者学习经验的实践活动。Linn and Miller(2005)提出发展实作评量作业的几点建议:选择或发展能代表学习结果的内容和技巧作业;将干扰评量目的和提高作业难度的技能降到最低。英国学者库珀说:一个受过教育的人不是记忆能手,而是一个知道如何把明显分离的东西在恰当而统一的情境中联系起来的人。综合学者的观点和实作评量的特征,融入教师共同研究实作评量实施的经验,建议在教学目标领域内,选择能代表重要学习成果的实际作业,作业应具有真实性、意义性、开放性和探究性。真实性是指教师应设计真实存在的问题情境,如真实情景中的实际操作或对日常生活情境的模拟,让学生体验认知生成,解决真实问题的过程;意义性是说教师应选择能实现学生能力的多重聚焦,具有类推性的重要的作业,排除与预期目标无关的作业,降低学生学习难度,这就要求教师在设计作业前,应掌握学生已有的先备知识和技能,在学生已有知识结构基础上,发展能力;选择开放性、探究性的任务,引导学生形成问题意识、拓展思维能力。
实作层面是学生实作的步骤、环节、项目、程序等基础单元,实作指标是实作层面中的具体评量的关键观测点[3]。实作指标是学生学习的指引,也是教师实施评量的关键依据,应选取实作环节中最具代表性的行为或态度作为实作观测点。
中国台湾学者李坤崇认为,实作层面和实作指标应具有目标性、代表性、鉴别力、可评性、意义性、真实性、先备性、明确性、精简性、公平性、可教性、类推行、可行性、渐进性的特性。由此,实作指标在选取上应具有以下主要特质:1)目标性:呼应实作目标及教学目标,以评定重要的学习成果,避免评量偏离或无关期望;2)关键性:应呈现高层次认知、技能或素质的技巧或表现,避免低层次、琐碎的层面;3)鉴别性:能鉴别学生学习的优劣,避免范范和无差别地评量;4)可评性:实作指标应为可观察的表现,避免隐含、模糊表现导致的不可测量。
为确保实作评量的有效实施,实作层面和实作指标在描述上应呈现以下主要特点:1)精简性:综合评量目的、学生数量、评量时间等因素,实作层面及实作指标的数量宜精简,实作层面一般设定3~5个为宜,实作指标一般设定10~15项为宜,在实际教学中可操作;2)顺序性:评价实践操作的实作指标之间应能呈现步骤或程序的连贯性,顺序性能很好地帮助评量者依序评量,如按照时间先后排序或操作先后排序。3)量化性:实作指标的操作程度和准确性可以用数值或等级予以量化,进而明确实作达成度。4)具体性:实作指标叙述应清晰、具体,授课教师或学生互评或兼职教师多元主体评价时,均能按照实作指标正确实施评分。
3.5.1 评量标准的构成要素:评量标准是评价表现的准则,是将评量主体感受到的学习成效转化成量化工具的标尺。评量规准的应用,目的在于实现教师对学生学习成果的客观评量,避免主观的成见或既定印象。Herman等人(1992)认为评量标准包含四项:1)重要的行为特质或向度:用来作为评判行为表现的依据。2)行为特质或向度的操作性定义:用来描述各行为特质或向度的内涵。3)计分量尺:用来评判表现行为。4)表现标准:用来沟通表现杰出、满意、待发展等不同水平的表现行为[4]。
因此,评量标准的构成要素需包括评量向度、向度描述和评量尺度。其内涵为:1)评量向度即实作层面与实际指标,需列出重要的行为特质[5]。2)向度描述是给予各向度清晰的操作性定义,并列出不同等级行为表现或特质的描述语。3)评量尺度是被评量任务的达成程度指标,一般确定3~5个不同尺度的标准,按照由高到低原则,可用等级、字母、数值表示。等级制也可在百分制的基础上实现,用数值明确划分等级层次,如单一数值表示占分比例,依次为A(100%)、B(90%)、C(80%)、D(60%)、E(40%),特定配分范围为A(100~90分)、B(89~80分)、C(79~70分)、D(69~60分)、E(60分以下)。
以表2“《发药服务礼仪》实作评量表”为例说明上述要素,向度为仪表、仪态和沟通;评量尺度为A、B、C、D、E五级;各级均有各个向度的操作性定义,即向度描述,如仪表的A级为着装上岗、佩戴胸卡,衣帽整洁、仪表端庄,双手清洁、指甲合格。B级为着装上岗、佩戴胸卡,衣帽较整洁、仪表较端庄,双手较清洁、指甲合格。
3.5.2 评量标准的建构步骤:评量标准的建构可按照以下步骤:1)列明基准。可以通过头脑风暴、参阅文献、请教专家、同行研讨或师生商讨等方式,列出向度及向度描述。2)标明等级。在最佳或最差的界定中,根据教师和学生的认知列出中间等级。3)练习应用。指定学生完成一项作业,并由学生以初步设计的评量标准提供评分。4)修订完善。教师使用与学生同样的评量标准,为学生作业评分,完善评量标准。
3.6.1 实作评量尺规表分类:实作标准的具体实施方式为设计评量尺规表,以“双向表格”形式呈现。实作评量计分可分为二元计分和多元计分,二元计分多用于检核行为技能的对错、是否、符合或不符合、通过或不通过,采用实作检核表进行具体操作,见表1。多元计分多用于态度情意的评量,或对不同程度的行为表现给予不同的表现标准,采用实作评量进行评量,见表2。
表1 《调配中药处方》实作检核表
表2 《发药服务礼仪》实作评量表
3.6.2 实作评量尺规表的构成要素:评量尺规表通常包括实作表名称、学生信息、指导语、评量项目、评量主体、评量标准、评定结果、备注或注意事项,以及签名和日期等信息。各部分信息的内涵如下:1)实作表名称应切合实作主体,应明示检核表或评量表。2)学生信息包括学生姓名、性别、班级、学号等。3)指导语是包括引导句、目的、做法、评量结果方式、历程及用途六部分,引导句是指问候语或引导评量的必要说明;目的是表述实作目标;做法是如何评分;评量结果方式是告知受评者评定检核结果的标示方式,如小组互评、教师评价等;历程是准备或实作的历程;用途是完成评量结果的用途。如表1中的指导语的包含因素为:为检验调配步骤的正确性(目的),请完成一次中药处方调配(历程),由组间互评(评量结果方式)。检核结果正确者打“√”,错误打“×”,漏项者打“○”,基本分为30分,每项检核项目正确者得5分,错误或漏项者计0分(做法)。此检核表于该单元结束后上交,汇总作为单元成绩(用途)。4)评量项目即实作层面与实际指标,即评量标准中的评量向度,即表1中的检核项目及检核重点,表2中的评量项目。5)评量主体即检核者,可以兼顾教师、学生、家长、企业指导教师等,实现多方共同参与评量。6)评定结果是打分数或评等级,可以采取多元评定结果,以鼓励表现较差学生,常用方式如下:①加符号的等级:在等级旁加注“+”、“-”或“上”、“下”,“+”、“上”代表用心或进步,符号越多代表越用心、越进步,“-”、“下”则代表不用心或退步,符号越多代表越不用心、越退步。②加评语的分数:教师在打分数后,对学生的努力程度或特殊情况给予适当的鼓励或提示,会具有更积极意义,如很好、不错、加油、改善等评语。6)备注或注意事项是用于补充其他信息不足之处,具有一定弹性,如涉及实作安全时,可警示学生注意安全,减少意外。