杨茜 李玲
在基础教育阶段,中小学生负担过重问题一直备受民众关注,导致这一问题出现的原因错综复杂,其中,不科学的评价制度是造成学生学业负担过重的最主要因素。进入新时代,国家出台“双减”政策,提出《深化新时代教育评价改革总体方案》,明确了教育评价改革是我国基础教育改革的一个重要方面,教育评价事关教育发展方向,有什么样的评价指挥棒,就有什么样的办学导向。针对教育评价这一问题,文本深刻分析了教育评价的本质,提出了新时代“双减”背景下教育评价的模式与趋势,从根本上解决评价机制不健全、不科学的局面。
进入21世纪,教育评价改革成为我国基础教育改革的一个重要方面。中共中央、国务院2020年发布的《深化新时代教育评价改革总体方案》提出要改革学生评价、促进学生德智体美劳全面发展。2021年5月21日中央全面深化改革委员会第十九次会议审议通过了《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,同年7月中共中央办公厅、国务院办公厅印发了此通知,并要求各地区各部门贯彻落实。这个文件的推出旨在减轻义务教育阶段学生过重的课业负担和日益严峻的校外培训负担,为学生减负的同时,也为家长减轻经济压力。
“双减”的核心就是重塑教育生态,引导基础教育回归科学的育人目标和教育评价体系,重新审视教育公平性问题,促进学生全面健康发展,最终推进教育的可持续发展和社会的公平正义、和谐进步。本研究正是基于“双减”背景下展开教育评价方式的改革探索。
1 教育评价的内涵
1.1 教育评价定义
“评价”一词在英语中所对应的是“evaluation”。按照维基百科引用1967年Michael Scriven在The Methodology of Evaluation中的定义为:评价是对提案或结果的预测或实际影响进行结构化解释并赋予其意义。它着眼于最初的目标,以及预测或检查完成的内容及完成方式。因此,评价可以是形成性的,即在概念或提案、项目或组织的发展过程中进行的,目的是提高提案、项目或组织的价值或有效性。它也可以是总结性的,以便从完成的行动、项目或组织中获取教训。英国的教学评价是指鉴别效果和判断某种学习经历或一门科目或一套完整课程的有效性。美国的教学评价是指教师或主考者试图确定学习者具有的知识、能力或技能的过程,是对学生学习经历前和经历后的成就的评定。
1.2 国外教育评价发展
国外系统的教育评价发端于19世纪下半叶,美国教育家泰勒提出的以教育目标为核心的编制原则,试图将社会的要求、学生的需要反映到课程与测验中。泰勒把评价解释为“确定教育目标在实际上被理解到何种程度的过程。”换言之,“评价过程在本质上,是一种测量课程和教学方案在多大程度上达到了教育目标的过程”。在泰勒的研究中评价的意图是以目标为导向,其优点是注重教育效果。1963年克龙巴赫在《通过评价改革课程》指出“评价的中心不应仅是目标,更应当是决策”,并认为教育活动过程评价也很重要,有助于不断对照评价方案找出差距和发现存在的问题,有利于教育者及时调整教学活动。这种评价方式的优点在于关注于教育活动过程,为形成性评价奠基。之后斯塔弗儿比姆结合了两者的优点提出了CIPP模式,即背景评价(Context Evaluation)、输入评价(Input Evaluation)、过程评价(Process Evaluation)、结果评价(Product Evaluation)。这种基本观点是评价最重要的目的不在证明,而在改进,突出了评价的发展性功能。1975年比贝提出“评价是系统地收集信息和解释证据的过程,在此基础上做出价值判断,目的在于行动”。斯塔克肯定了比贝的价值判断,并提出了应答评价模式,即如果教育评价应该更直接地指向方案的活动,如果它能应对评价者对信息的需求,或者更能反映人们不同的价值观念。其核心是评价人需要关心所有参与者的需要并能反映各方的价值观念。他的这种评价多元现实性拓展了评价的维度。1981年美国教育评价标准联合委员会统一为教育评价定义为:教育评价是对教育目标和它的优缺点与价值判断的系统调查,为教育决策提供依据的过程。
1.3 国内教育评价发展
我国教育评价在建国初期主要受苏联影响。对课堂教学的认识受到凯洛夫、斯卡特金、巴班斯基等“一堂好课的要求”。其内涵是课堂教学结构的五步教学法,即组织上课—检查复习—讲解新教材—巩固新教材—布置作业。20世纪80年代李秉德的《教学论》中系统地提出了教学评价的七项指标:教学思想、教学目标、教学内容、教学过程、教学效果、教师素养和教学机智。主要在评价标准的确定、评价信息的收集和评价结果上都给出了量化的结果。进入21世纪,随着基础教育课堂改革的推进,推出了发展性课堂教学评价,是以促进学生发展为宗旨,并关注到个体的差异。教育部根据《国务院关于基础教育改革与发展的决定》进一步提出对现有的课程体系、结构、内容进行改革和调整,构建符合素质教育要求的新的基础教育课程体系,对教学评价的方式也提出了新的要求。需要建立一个促进学生发展、教师成长为目的,评价对象和主体多元、方式多样的课堂教学评价体系。2020年10月中共中央、国务院印发了《深化新时代教育评价改革总体方案》,其中明确提出教育评价事关教育发展方向,有什么样的评价指挥棒,就有什么样的办学导向。方案提出的目标是完善立德树人体制机制,扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,提高教育治理能力和水平,加快推进教育现代化、建设教育强国、办好人民满意的教育。
2 教育评价方式的现实挑战
目前教育评价主要采用形成性评价和終结性评价两种方式。
2.1 形成性评价的现实挑战
形成性评价是在教学活动中由学生和教师共同参与的评价活动,是为了获得学生的学习反馈,对学生所学知识的掌握程度进行的一种系统评价。其目的是评价学生的学习行为、学习结果以及学习过程中的情感、态度、策略等方面的内容。形成性评价主要由学生互评、教师评价、学生自评、父母评价构成。学生互评是倡导同学间进行合理的交流,增加其团结力和凝聚力的方式。教师的评价主要是老师在学生学习过程中通过观察、鼓励学生表现自己,并激活学生学习的内驱力。学生自评是学生根据自己的兴趣爱好确定学习方向,并从自己学习的过程中找出学习方式、学习能力的不足,是主观意志判断,也是学习反思的结果。父母评价是基于父母是最了解孩子的家庭成员,他们的评估能够帮助学生树立正确的学习观念和学习目标,并能增强他们学习的自信心。
但是在实施过程中却有较多问题。首先,形成性评价的建设系统没有固定的框架,教师和家长难以把控,没有对标就无法确定是否评价有科学性。在實施过程中的评价主要是教师、学生和家长的主观判断,没有量化的依据。各学科和各教育阶段的差异性很大。第二,形成性评价中家长的反馈也是非常重要。但是在实施过程中,因为各种家庭教育水平参差不齐,部分家长非常配合学校的安排,积极参与到学生的家庭教育中。然而有的家庭父母忙于工作或其他事务,无暇管理孩子,很难配合老师的任务。第三,学生自我评价部分也较难量化。学生心智的发展往往不均衡。部分学生自律性很强,能够积极反思和自查,并能在学习上主动找出自己的缺陷和不足。但是大量学生,主要被动接受老师的教育和知识,对于学习主要是完成基本量和应付检查。因此,尽管形成性评价已经提了十几年,但还是难以贯彻。
2.2 终结性评价的现实挑战
终结性评价是一个学习阶段结束后,对学生学习结果的评价,如期末考试、毕业学业考试。布卢姆认为终结性评价的首要目标是给学生评定成绩,或为学生做证明,或是评定教学方法的有效性。其特点是在目标上对整个教程或某个重要部分上所取得的较大成果进行全面评定,并给学生评定成绩;在内容上着眼于学生对某门课程整个内容的掌握,分量大而频率低;在测试内容的概括性方面,概括性水平高,题目多为知识、技能、能力等多种因素的综合体。概括两者可以得出结论:终结性评价是学生在一定学业阶段后,通过检测而获知的知识、能力和技能方面的掌握情况。
现有终结性评价,主要体现在期中考试、期末考试和毕业考试。小学阶段终结性评价相对较好操作,孩子们因为没有太多学业负担,主要通过期中考试和期末考试实现。但是中学在操作时却更多为分数论。周考、月考、期中考、期末复习考、期末考、中考等,学生在面对门类繁多的考试方面,身心俱疲,压力山大。家长和老师的压力也巨大,往往学生成绩与学校未来招生挂钩,也加剧了学校之间的竞争和内卷。
综上,我们目前的评价手段主要聚焦于教育学习者对知识的掌握程度,而不是学习本身,教育系统非常重视标准化考试,而标准化考试只关注一种类型的智力和一个方面的学习。康奈尔大学心理学家罗伯特·J·斯腾伯格(Robert J.VSternberg,1985)提出了三种类型的智力:分析型智力(反映在IQ分值上)、实用型智力(与解决现实生活中的问题相关)和创造力。标准化考试只能衡量一种特定类型的智力——分析型智力。虽然培养分析型智力很重要,但学校的任务是让学习者为未来做好准备,而未来要求我们的学生要具备另外两种智力——实用型智力和创造力。因而,未来的教育评价应当是一种全面评价体系,将标准化考试和各种正式和非正式的评价手段相结合,包括定量和定性评价、终结性和形成性评价、自我和同伴评价、基于表现和结果的评价等。终结性评价发生在教学过程的最后,形成性评价随着教学过程的进行而持续进行,是师生用来评价和调整学习过程的一种依据。教师利用形成性评价来检查学生的学习情况,并以此为参考依据来指导和调整以后的教学。
3 “双减”政策下教育评价模式的改革路径
首先,在“双减”背景下,构建科学的教师评价机制是关键。当前的教师评价重结果、轻过程。很多学校教师评价仍只看学生考试成绩和升学率,至于学生的成绩是如何取得的,是否存在违规补课或加重学生课业负担的行为则不在评价之列。因此,要推动“双减”政策落地见效,必须改革教师评价制度,降低教学成绩在教师评价中的权重,多层次、全方面考查教师的综合教学能力。各级教育主管部门需建立以评价主体多元化、评价方式多样化为特征的发展性教师评价机制。未来教师不但是学生思维水平的评价者,更是学生的引导者,由此,应探索教师在教学、科研、思维等范畴的评价标准,充分调动教师的积极性、主动性和创造性,增强教师的职业幸福感、成就感。
其次,搭建学生评价平台,做好学生过程性评价是重点。要充分利用物联网技术对学生学习过程信息进行采集、管理和存储;利用大数据技术挖掘数字世界中存储的学生学习过程、学习结果、相关因素等数据,建立教育大数据预测、分类和智能评价模式;利用智能决策和可视化技术进行科学分析和决策,减轻学校、教师和家庭的评价负担,提高过程性评价的科学性和准确性,确保评价的常态化和规模化。
再次,创新考试评价制度机制是根本,需创新考试内容设置和考试结果评价方式。学校在进行必要的考试评价时,除了提高命题质量,还需要注重增加开放性、应用型、探究性试题比例,而非传统的标准化考试。义务教育阶段学校考试面对的是未成年学生,应主要发挥好在诊断学情教情、改进教学、评价教学质量等方面的功能。引导各级各类学校需准确把握考试功能特点,适当压减考试次数、进一步规范考试命题管理、完善学生学习过程性评价,鼓励老师进行实践性评价。学校和教师可采用课堂观测、随堂练习、课堂问答、实验操作、课后作业、小组讨论等方式开展学生学习情况的即时性评价。考试结果的评价可采取等级评价制,并将其与形成性评价相结合,且终结性评价的权重不超过形成性评价。这样的评价能够更全面激发每个学生的学习动力。
最后,国内外多项研究结果表明,学习品质对学生未来的学习与发展具有显著的预测作用,学习品质是影响学习效率的重要要素。学习品质的高低同样离不开评价,通过评价学习品质要素精准改进学习品质,可以从源头上解决减负提质的问题。目前天津师范大学研究团队开发了数学学习品质测评工具,建构了天津市学生数学学习品质要素常模,运用AI技术研发了数学学习品质智能测评与施策系统,通过实践检验证实数学学习品质智能测评与施策系统具有减负提质的功效。
4 教育双减下的初中英语评价方式案例分析
案例采用人教版八年级下册 Unit 2“How often do you exercise?”Grammar Focus 部分的作业设计为例,进一步说明教育评价方式的转变。
本部分是每个单元常见的语法讲解部分。通常来讲,英语老师的处理方式是让学生学习了本单元的语法重难点后,布置相应的语法模块题目。例如:AB句转换、单项选择题、根据要求转换句子或是语法填空等题型。但是实际上,这样的训练只是将语言割裂开,不利于学生应用所学知识到实践中。下面是改良后的作业方式:
(1)贴近生活,让作业生动实用。
贴近生活是让学生根据自我的特点和不同的生活状况,充分发挥他们的主观能动性,让学生在做中学,并能深刻理解作业的内涵,同时能够增强学生的兴趣和自信心,以及成就感。学生可以在与人交流时呈现自己的特长和优势。这样,他们更能了解学校的学习是为了将来的生活。
本题可以让学生采访父母试图了解父母的工作安排和平时的生活状态。
例如,设计询问父母的5个问题:
a. How often do you cook for the family?Do you cook for yourself when you are at home alone?
b. How often do you do sports in order to keep healthy?
c. How often do you buy clothes for your kids?
d. How often do you buy clothes for yourself?
e. How often do you go home to have lunch?
学生们通过询问自己父母的事物安排,能够体会到父母的不容易,生活的艰辛。能够让他们以后设身处地地为父母着想。
询问完毕后,可以让学生根据父母的答案,写一篇英语作文,谈谈与父母对话的感受。
(2)力求创新,激发兴趣
爱因斯坦曾说过:“教育应该是提供的东西,让学生作为一种宝贵的礼物来享受,而不是作为一种艰苦的任务要他负担”。兴趣是作业设计的核心考量。由此,英语家庭作业的设计需要充分考虑到学生的兴趣、爱好、愿望等要求和学生的心理需求,坚持创新,把作业与唱、画、玩、演结合起来。寓教于乐,在轻松的氛围中,培养学生的能力。
本题可以让学生出一份英语小报,描绘一下心目中周末的安排。
例如,提前思考几个问题:
a. How often do I need to play basketball with my friends?
b. How often can I play computer games?
c. How often can I have a picnic with my family?
d. How often can I go fishing with my father?
e. How often can I go hiking with my friends?
學生们在规划出周末活动后,用图画的方式描绘出自己周末的愿景,并将这些愿景与父母分享,争取让父母帮助得以实现。让父母能够更了解孩子的心愿,并增加陪伴孩子的时光。
(3)开拓视野,树立目标
英语作为一门工具性语言,具有及时传递最新资讯的作用。在如今瞬息万变的时代,紧跟时代的步伐,掌握大量信息,拓展思维空间,能够为学生将来发展提供方向指引。这样的英语知识不再是局限于课本之内,能够拓宽学生的眼界,与时俱进。
本题可以让学生通过互联网,查看国外名人的访谈。并归纳这些名人成功的秘诀。
例如,上网搜索艾隆·马斯克的英语访谈:
将访谈内容,简要记录下来,中间涉及到马斯克的日常活动安排、工作安排、兴趣安排等。可以先将相关问题草拟出来。
a. How often did Musk play sports?
b. How often did his SpaceX go to the space?
c. How often did he send man-made satellite into the space?
d. How often did he put a new model car into the market?
让学生事先准备好这些类似的问题,带着问题去听访谈,并记录下来,在班级分享。也可以让孩子们将相应的视频保存下来,在英语课上播放。这样将会大大提升学生们学习英语的热情,并能促进他们树立远大的目标,并能做好相应的规划。
4 结语
总而言之,教育评价改革为“双减”政策的落地明确了目标导向,有什么样的评价指挥棒,就有什么样的办学导向,只有紧紧抓住教育评价改革这个“牛鼻子”,“双减”政策才能真正落地见效。“双减”政策,归根结底“破”的是“分数至上、考试至上”的片面教育评价体系,“立”的是“立德树人、五育并举”的教育理念。学校只有建立科学系统的评价体系,把学生评价由单一的学科评价转向跨学科能力素养的评价,从过多关注学生学习成绩转向学生价值塑造与心智培养,坚决将立德树人的根本任务贯穿育人全过程,更好促进学生的全面发展。
本文系国家教育发展研究中心成都教育改革研究基地、四川省教育厅人文社会科学重点研究基地——统筹城乡教育发展研究中心资助项目“‘双减背景下可持续发展人才培养模式研究”(项目编号:TCCXJY-2022-E54)的阶段性成果。
(作者单位:1.成都大学国际合作与交流处;2.成都大学外国语学院)