滕婉莹,易明芳,赵沈洪
2020年10月中共中央、国务院出台了《深化新时代教育评价改革总体方案》,其中指出“要扭转不科学的教育评价导向,提出完善过程性考核与结果性考核有机结合的学业考评制度”[1]。传统的评价观把评价的主要作用定义为评价学生对事实知识的理解,而现代的评价观则将评价视为一项旨在促进学生学习的活动。在新的知识观与学习观引领下,越来越多与学生学习评价有关的文献以及支持和促进评价实践的制度、政策应运而生,教育评价在理论和实践领域朝着更加科学的方向发展。
应试教育制度下我国传统的教学模式以传递接受为主,学生虽然能在短时间内被动地获取知识和技能,但无法内化为自己的能力去解决实际问题。量化评价在各学段应用广泛,以期末考试等终结性评价为主,学生没有养成主动思考、发现并提出问题的习惯。传统的测验难以有效地对学生的综合能力进行评价,无法满足多元化的评价需求。表现性评价经过近30年的探索与实践逐渐发展起来,在学生学业评价领域受到了广泛关注。表现性评价是一种指向深度学习的质性评价方式,是针对学生能力的评价。引导学生在评价过程主动地进行反思,发挥了评价的诊断和反馈功能。物理学是高等学校理工科各专业学生的必修基础课[2],应打破“唯课堂、唯分数、唯绩点”的单一评价模式,注重学生的自主学习,强化学生学习过程中的行为表现以及进步程度。因此探索新的学业评价方法,关注学生的学业成就表现,以期实现对学生的综合能力进行评估,促进学生的全面发展。
建构主义理论认为学习是学生自主建构知识的过程,通过小组合作、自主探究等来完成复杂的任务、解决实际问题[3],课程和教学强调在特定情境下进行有意义的学习活动,完成对信息的建构,从而掌握技能。标准化的测验只能检测学生“知不知道”,难以描述学生“会不会做”,也就是说无法评价学生在面临之前没有经历过的情境时,能否运用所学的知识解决新的问题,是否具有应对未知的能力,而表现性评价恰好可以解决这个问题。关于表现性评价,费兹帕特里克认为其内涵是“让学生完成一个活动或者制定一个作品,以证明学生在真实情境中表现出的知识和能力”[4];美国国会技术评价办公室将表现性评价定义为“要求学生创造出答案或产品以展示其知识或技能的测验”[5];我国学者周文叶定义为“在尽量合乎真实的情境中,运用评分规则对学生完成复杂任务的过程表现与结果做出判断”[6]。总之,表现性评价包含“目标、任务和评分规则”3个基本要素[6],它们相互关联、相辅相成。
舒伯特把课程与教学实施过程中产生的不同价值取向的目标课程分为4种[7],当前占据主导地位的“行为目标”取向只关注易于考察的陈述性知识与技能等要素,忽视了难以转化为行为的情感态度与价值观等要素,然而教育目标的发展从最早的关注基础知识与基本技能到布鲁姆提出的教育目标分类法中的三维目标,再到如今的核心素养,体现了教育目标对那些难以考察的要素的重视,因此,教育目标应当由“行为目标”取向转变为“表现性目标”取向。
相对于传统的测验采用填空、选择、判断等试题类型间接对人的能力进行评价,表现性评价借助于评价任务来引导学生展现其所知所能,依据学生具体的行为表现直接地分析其解决问题的能力,判断学生建构知识的各方面特征或水平,从而实现对学生真实学业水平的评价。斯蒂金斯等学者认为表现性任务是为了检测学生在特定目标上的达成情况而设计的[7],他认为表现性任务的类型包括“建构反应题、书面报告、作文、演说、操作、实验、资料收集、作品展示”[8]等能够反映学生在真实情境中的学习结果的一系列活动。威金斯认为,学生如果能在真实的环境用所学的概念解决现实问题,则说明他真正掌握了概念[9],技能是情境、知识与任务的整合,是个体动态的建构和组织去适应变化的环境的能力,在教学中给学生提供表现的机会,使其能够展示多元化的技能,比如讨论、探究、合作、交流、设计等。因此,表现性评价应当设定一个具有情境性和真实性的任务,让学生展示运用知识和能力。设计表现任务时应当结合物理学科的特点来开展有吸引力和挑战性的任务[10],提高学生的参与度,比如制作物理模型、利用计算机建模软件绘制示意图来展示自己对物理原理的理解,开展探究实验来验证物理定理或规律等。
表现性任务的开放性、复杂性和情境性使学生的表现也是多样的,因此设计和开发的评分规则要与表现性任务相匹配,对学生的表现进行衡量,判断学生完成目标的情况及学习中存在的问题,实现学习证据判断的统一性和客观性。评分规则的制定应当依据相关的标准,描述出学生应达到的表现标准并划分等级进行判断。合理的评分规则要清晰明了,没有教师具体指导,学生也明确知道表现性任务的预期目标,知道该按照怎么样的步骤完成学习任务,知道自己应当如何表现,当学生完成表现性任务并收到某个表现的反馈时,这种有针对性的反馈就能使学生找到与预期目标的差距,自主自觉的去完善学习。
依据表现性评价的3个要素,在课程教学中实施表现性评价时,按以下4个环节进行设计:第一,要明确表现性目标;第二,构建具体的表现性任务;第三,设计科学的评分规则;最后,实施与反馈。具体设计流程如下。
明确表现性目标:美国教育家泰勒认为评价的作用在于确定课程与教学计划实际实现教育目标的程度问题[11],因此目标是评价的依据和标准,在实施评价时应当先明确目标。表现性目标和教育目标的发展方向是一致的,是通过具体的情境和任务表现出来的结果,结果能反映出学生的能力和品格。在设计具体的评价之前,应当明确要评价学生哪方面的表现,针对教学中需要评价的目标,选择合适的表现性评价方法。
构建表现性任务:根据不同的评价目标选择对应的任务类型,表现性任务要与目标期望的学习结果相匹配。表现性任务的功能在于把学生内在的实际建构水平“可视化”,引发学生展现深度学习的能力。比如在进行演示实验时想要评价学生的观察能力,则应给学生设置相应的表现其观察能力的任务,使学生通过任务的完成,从中获得对物理现象背后的原理、规律的认知,从而可以在学生完成任务的过程中,对其观察能力做出合理的判断。物理学科需要学生具有综合思维能力,想要评价学生的综合思考能力,表现性任务的设计就要考虑从点到线,由线到面,再由面到立体,使学生通过任务的完成,形成立体的物理思维能力。在任务设计的过程中,提供给学生思考和探索的机会有助于对学生综合思维能力的评价。合作开发有助于提高任务质量,让学生体验协作和沟通,也是深度学习所需要测量的重要目标。当学生面对复杂的物理表现任务时,有时需要将任务分解成一个个小任务,需要团队合作来完成。想要评价学生的合作能力,在构建任务的过程中就应提供沟通协作的支持,要保证表现任务的公平公正,设置合理的难度。
设置评分规则:表现性任务引发了学生的表现,而有效评估学生行为表现的关键在于依据表现性目标和任务提前设定标准和尺度,开发出科学的、合理的、可操作的评分规则,以此来衡量学生达成特定目标的情况[12]。在实际的评价过程中,可以根据评价的侧重点不同采用5分制、10分制、100分制等进行计分,也可以采用等级制如优、良、中、差等来评价学生的学业水平,将各个要素的得分按照一定的权重进行综合,计算出学生的综合得分。
实施与反馈:表现性评价强调评价主体的多元化,以学生自评、同伴互评以及教师评价为主体[13],让学生参与到评价中以提高评价的信度,使获取的数据更加公平、客观。评价的过程与结果固然重要,但在教学评一体化的背景下,在具体的实施中容易忽视对教和学的反馈,根据评价的结果反观教学目标的设置是否符合学生的认知能力,评价的任务能否真正促进学生学习,及时调整策略,不断修订完善。一方面,教师运用评分规则对学生完成任务情况进行评价,获得在评价任务过程中的表现信息,从而了解学生的总体水平,发现问题,并对出现的问题进行系统分析,最终形成解决方案,能更好地明确教学目标,细化课堂教学内容,实时监控课堂教学活动,改进教学。另一方面,根据评价结果,学生明确自己所处位置,从而适时调整学习状态。通过来自教师、同伴及自身的反馈,学生可以了解自己在学习中遇到的问题,合理设定下一步学习目标,调整学习行为。
长期以来,总结性评价在高等教育评价中占据主导地位,平常教师在课堂上讲授完新知识后,给学生布置一定量的课后作业,对学生的学业评价来自于平时的到课情况、作业完成情况及期中考试、期末考试的分数。这个过程,通常是教、学、评分离的,评价的结果没有形成有效正反馈,导致学生不能及时调整学习进程,教师也不能及时调整教学设计,从而无法发挥评价的导向和促进作用。因此,将表现性评价融入到“物理学”教学设计与考核中,分别对形成性评价与总结性评价赋以合理的权重,完善“物理学”教学评价体系。
为了在“物理学”课程教学评价中融入表现性评价,在教学设计时,需按照“明确表现性目标、构建表现性任务、设置评分规则、实施与反馈”这4个要素进行思考。
基于雨课堂的智慧教学环境,为实施表现性评价提供了科学的途径[14]。利用雨课堂进行教学设计时,要对课前、课中和课后分别设计好学习任务。课前,根据计划教学内容,设计好课前预习任务发布到雨课堂上。预习不要太难,学生通过阅读课本就能完成,比如,可以设计5道检测预习任务完成情况的检测题,然后以手机课件的形式上传到雨课堂进行发布,每一小题2分,共计10分。学生完成后,主观题分数在教师改过后自动统计,客观题的结果系统会自动统计给出得分。课中,根据学生预习情况,精讲学生未掌握的知识点和相关原理,并根据课程内容适当设计讨论题或思考题,借助雨课堂发布,学生当堂进行讨论。这时的讨论,线上线下可以同时进行,线上部分系统里有记录,针对线下部分,教师要做好同学们的表现记录。课后,根据课程适当布置课后作业。这类作业,根据所授课程的实际内容,可以是理论题,也可以是实践类的任务。对于实践任务,要明确实践所在达到的目标要求,比如形成作品、完成实验报告、做小组展示和讨论等。比如,上完光的衍射这部分后,可以布置同学们课后做一个观察光的衍射的小实验并拍照或录像提交。所有这些学习过程中形成的成绩都要随时记录,雨课堂上的成绩随时可以查看,根据结果随时将存在的问题进行反馈。其他成绩需要老师记录在电子表格上,以便将来统计算分。比如,在上光的干涉时,要明确这一课要达到的目标是让学生理解光是波,掌握波相干叠加的条件、现象及应用,然后根据这一目标,利用雨课堂发布学习任务(课前:测试题,观察现象,了解应用。课中:问题讨论,回答所观察到的现象及应用。课后:习题、合作设计并完成一个光的干涉实验),每一项任务给以一定的分值,并根据反馈的统计结果适时调整教学进度和内容。
基于雨课堂的教学设计能有效实施表现性评价,而教学方法则不拘泥于一种。清华大学王青老师在“费曼物理”教学中尝试翻转课堂的教学改革[15],可以培养大学生的创造性和批判性思维能力,解决学生不敢问、不善问的毛病[16],对探索“物理学”教学的表现性评价体系有借鉴作用。翻转课堂是指“在传统教室中发生的活动与教室外发生的活动进行调换”。在课堂实践中的具体做法是:课前给学生布置预习任务,观看讲课视频或搜集相关资料,比如让学生了解蒸汽机的工作原理并准备一个十分钟左右的演讲或者汇报;课堂上由同学们对需要解决的问题进行讨论和交流;课后再进行复习巩固、完成作业。这些任务与表现性任务的形式相一致,因此,在“物理学”课堂中采用翻转课堂的教学模式,也可为表现性评价的实施提供可操作的环境。
为了对学生的合作能力进行有效评价,还可以在教学中适当采取同伴教学法[17]。通过在教学中设置合作任务,将全班同学分成若干小组,一般设成5人一组。比如在上完一章节后,让同学们完成一个单元测试,等测试完成后,让同学们按组合作分析试卷,并在各小组随机抽同学上黑板进行演讲分析,老师进行评分,这个评分结果作为小组成绩计入每个同学的平时成绩。
当然,为了能有效地将表现性评价融入到“物理学”的教学评价中,在平时的课程教学设计上要科学合理,要有迹可查。因此,在进行课堂教学设计时,根据教学内容采取相应的教学方法。除了上面讨论的翻转课堂、同伴教学法,还可以采用任务驱动法等等,这些教学方法都以雨课堂作为教学平台加以实施。平时学生的每一次学习活动,在雨课堂上都有记录,包括到课率,因此,平时成绩的出处客观科学有效,反馈及时,有助于学生调整学习方法,也有利于老师随时调整教学内容和进度。
表现性评价主要是针对学生每节课堂上的行为表现进行的,从课前的预习、课堂上的小组讨论、到课后的作业及单元测试的完成都依赖于学生的配合,要想评价学生在一定阶段内的学习成果,应当将学生每个学习任务的表现综合起来进行评价。为了激励学生积极参与到平时各项学习任务当中来,在课前要进行充分的动员,引起他们足够的重视,让学生明确考核方式,平时成绩来自于学习过程中的哪些环节,有效地激励学生平时认真学习[18]。
国内大多数高校的“物理学”公共基础课程普遍采取大班授课方式,学生课程成绩的评定主要由平时成绩与期末考试成绩加权平均计算得到[19],既注重过程性考核,也注重结果性考核,这种将形成性评价和总结性评价结合起来的方法可以克服彼此的缺点,发挥各自的优点,解决了一考定成绩的弊端,但也存在一些问题,比如平时成绩的考核只占总成绩的30%,且仅以到课率和平时作业作为平时成绩的考核内容,无法有效地对学生学习过程进行评价;期末闭卷考试成绩分数占比高达70%,考试的内容多侧重对知识点的掌握,无法科学地全面考查学生能力水平。国外知名大学在高校课程考评中则更注重对学生进行综合评定,甚至在某些小班教学的课程中,平时成绩的考核在总成绩中的占比高达80%。因此需要构建一套科学合理的可操作的评价体系,这个体系包括平时成绩权重、平时成绩构成、成绩评定方式等方面。文献[20]报道了形成性评价量化考核问题方案,将形成性评价的权重设置为不同的比例分别进行了改革实验,结果表明,平时成绩权重占50%时,其期末考试成绩只有少数几个同学出现偏差,整体数据较合理,适用物理学的公共基础课程。因此,我们把物理学公共基础课程平时成绩的权重从30%提高到50%[20]。
结合之前的教学设计,平时成绩主要由表现性评价结果进行加权计算得到,这个成绩就是对学生学习进行的一个形成性评价。因为在教学设计时,学生的平时表现在雨课堂上都有记录。比如,签到情况,一学期51次课,学生到课多少次就记多少次,设置51次为满勤100分,不足51次的,假如为48次,对51进行归一化后再乘以100,即得到该位同学的考勤得分94分。课前预习,一节课,总分20分,一学期所有课前小测的成绩进行求和,得出每个同学该项的总分,然后把总分最高的记满分100分,其他同学的成绩对其归一化后乘100得出该同学的课前小测成绩。又如,雨课堂中的讨论话题,针对同学们参与讨论的情况,统计其参与情况,等等。各项表现性成绩都按以上规则进行归一化计分。然后将平时所有表现性成绩再按等权重相加求和,就得到每位同学的平时成绩。
某个同学的平时成绩运算公式:
其中,R表示总成绩,Ai表示某一项的实际分数,Amax是该项成绩最高分,λi表示该项成绩占总成绩的权重,n表示平时成绩总项目数。
表1为其中某一学期末班级学生的成绩表。平时成绩中,既有形成性评价结果,也有总结性评价结果,形式性评价结果由到课率、弹幕数、投稿数、单元测试演讲表现、小组合作、单元思维导图、课堂发言等组成;总结性评价主要来自各单元的测试、课后作业及期中考试等。因初步实践,所有项目的权重都取一样的值,这里共10项,所以各项权重为0.1。从表中可以看出,学生的考试成绩与平时成绩基本呈正相关关系,这种学生学业评价方法充分体现了学生学习过程中的表现,克服了传统成绩考核的不足,能较科学地反映学生的学习状态和过程。
表1 某一学期末学生成绩考核表(单位:分)
综上所述,本文阐述了表现性评价的基本要素,给出了表现性评价的设计流程,并尝试将表现性评价应用于“物理学”的教学中,融入到过程性考核和结果性考核中,形成科学的“物理学”学业评价的新形式,以实现对学生能力进行多方面的评估。表现性评价作为当今教育评价发展的新趋势,尽管已得到广泛的认可,但仍然存在不足。
第一,表现性评价评分规则的制定以及评分工具的使用都来自评价者的主观判断,有时评分标准缺乏精确的描述,导致在评分过程中出现偏见,会直接影响表现性评价结果的效度。一方面,可以利用评价主体的多元化来提高评价的效度,使评价更客观;另一方面,评价者在制定评分规则时,应当参考那些已开发的、可信度高的评价样本。
第二,虽然表现性评价是针对学生不同的表现进行的评分,但对班级的学生采取统一的评分规则并没有考虑到学生的差异性。先前的经验、学科背景等都会影响学生的表现,比如:某些地区高考改革导致学生在学习“物理学”前的高中阶段没有选修过物理,或只修过一部分,表现性评价给学生提供了更公平的机会,但表现性评价很可能加大了不同背景之间差距。
第三,教师自身需要具备较高的综合素质和能力,需要耗费大量的精力和时间进行表现性评价的设计。由于学生在课堂上的表现具有发散性,教师无法对每一个学生的行为表现准确地预知,这可能造成教学目标难以按预期的方向发展,因此在实施过程中要充分调动学生的积极性,使学生高度配合与参与。
第四,融入表现性评价的“物理学”教学设计和在形成性评价与总结性评价中融入表现性评价时,仅在平时成绩中进行了设计,且权重采取了较为简单的平均方式,而期末考试仍采用总结性评价,因此,在具体的赋分、权重设计等环节还有待进一步完善。
为了更好地促进表现性评价的运用,高校管理部门和教师都应当关注评价改革的导向,转变传统的评价方式,在教学实践中积极探索新的评价方式,加强相关的评价方法培训,同时建立专门的教育评价研究机构,指导教育评价的实践。