王鼎
摘 要:针对国家“深化教育教学改革全面提高义务教育质量”的要求,并基于当下课程设置、评价理论和实践发展的需要,文章尝试以K-12科学测评为载体,思考和分析相应测评系统在框架设计、测评和课程实践关系处理等层面的内容。同时,就K-12测评系统在构建中存在的困难,如测评结果与学校教学及学生学习之间的整合、测评目标与现行课程标准之间的深度整合、科学评价系统内在一致性保证等问题进行深入分析,并尝试寻找解决方法。该研究也期待从评价实践角度出发,为其他学科测评系统的构建,以及进一步完善和提升义务教育质量,予以积极探索并提供科学的行动策略。
关键词:义务教育;K-12科学测评;系统
一、问题的提出
1.国家新教育质量观的确立,对评价体系构建提出新要求
2019年,中共中央国务院发布的《关于深化教育教学改革全面提高义务教育质量的意见》明确提出,建立以发展素质教育为导向的科学评价体系。由此可以看到,教育质量需求的全面性、多样性和发展性,对义务教育质量的评价提出了更高的要求。这就要求建立相应的质量评价标准来加强对学生全面发展质量的关注与阐释,利用指标体系说明学生全面发展的维度、具体表现、水平划分,并为学生全面发展质量的评价提供具体的方法手段。
基于21世纪社会发展对人才的需求,国家构建了“中国学生发展核心素养”总体框架。随之,我国高中阶段课程标准以学科核心素养为基本理念及培养目标加以修订。相应地,随着义务教育阶段课程改革的启动和深入,特别是随着中高考改革的深化,以素养和关键能力为主要特征的教育质量评价体系和评价标准也将逐步确立。这既是发展素质教育为导向的科学评价体系在课程层面的具体化,也是评价体系构建的新要求。
目前,虽然我国义务教育发展已有举世瞩目的成绩,但仍存在过分强调分数和升学率等现象,并以此作为教育质量衡量的相关指标。这就需要我们不断克服“唯分数”“唯升学率”的顽瘴痼疾,科学使用教育质量评价体系,从根本上解决教育指挥棒的问题,促进学生的全面发展,利用评价撬动与深化教学、课程、学校管理和教育行政等多领域的综合改革。
总之,以促进学生全面发展为目标,建立、完善和实践科学的、基于素养及关键能力的教育质量评价体系(包括质量标准建设等问题)刻不容缓。
2.课程设置为促进学生全面发展的评价,提出了客观和全新诉求
学校教育是促进学生全面发展不可或缺的主战场,其中,学校课程设置对于教育质量的实现和提升至关重要,也是目前评价体系构建中必须关注的领域和重要实践载体。
目前在上海义务教育阶段课程设置中,单学科和跨学科是两种主要的课程形式。其中,单学科是传统、常见的主要课程形式,占整个课程的大部分比例。除此之外,跨学科课程设置形式也同样存在,类似自然或科学等课程设置在义务教育阶段各类学校中普遍存在。
显然,跨学科教育不是对单学科教育的补充。单学科和跨学科课程都是为了促进人的全面发展及质量提升,有着共同的目标,但是却各有分工,相辅相成。它们是人学习发展的两个有力支点,缺一不可。我们习惯了单学科的学业评价和测量,但是义务教育阶段如何科学形成跨学科,对义务教育阶段教育质量评价体系的构建以及评价标准的确立,起到非常重要的作用。结合教师的教和学生的学,立足课程设计,科学评价学生发展,力求教、评、学的一致性,在相应的评价体系构建中得以兼顾并体现,具有重要意义。
3.认知理论和评价本质的认识,不断推进评价体系的重构
评价体系构建不断发生改变。随着近现代认知理论的发展和运用,教育评价领域日益关注学生认知结构的形成和发展,关注相关情境下学生认知结构的影响和变化。同时,基于结构主义的认识,“评价是基于证据的推断”12 这一评价的本质认识越来越得到广泛认可。如美国教育考试服务中心(简称ETS)基于对评价本质的认识,构建了K-12测评體系,利用相应构建的认知—观察—解释的三角测评框架,逐步成为国际大规模测评体系构建的理论基础和模型设计的基石。这一发展和认识,为现代评价和测量的技术运用和整合提供了更加广阔的平台和前景。这也为评价体系的综合性——多种技术的整合和融合、评价体系的内在一致性——体系中多个要素相互的联系性和功能体现、评价体系的连续性——不同时间上纵向的可比较性,奠定了可行性基础,也对评价体系的重构提出了新的视角和诉求。
基于上述问题,专业化考试机构面临的问题是:如何在学科核心素养培养目标下,整合认知发展和测量技术的最新发展,从评价的角度力求全面而精准地评价学生的学习状况,为学生的学习和教师教学提供足够的实证支撑。在跨学科领域,特别是义务教育阶段的自然科学上,相应评价系统的构建是一个很好的工作平台和实践载体。
二、科学评价系统框架的构建
评价是一个系统,系统的框架设计引领整个评价的目标及实施过程,对整个评价系统起统摄作用。科学评价系统框架的构建,需要我们对科学活动有本质理解,并基于课程实践梳理相关框架维度。
1.对科学活动构成要素的理解
科学的发展与人类生活休戚相关,并客观存在着相应知识和方法。这让人们通过相关科学知识概念和规律,以及解决问题的途径和方法,得以理性地观察、分析和解决问题。同时,科学的探究性和系统性,能让人质疑原有问题中已经确定或隐含的规律,进而发现新的观念和方法,并以此解决问题。甚至可以在多次积累的基础上,将相关经验整理并系统化,演绎出更为普遍的真理。基于此,杜威(Dewey)认为,在广义的人文意义上,科学是一种手段和工具;在思维过程的意义上,科学是一种方法;在思维的结果上,科学是一种知识体系。如果从过程的角度来看,科学的过程是知识整合并探究实践的过程,知识、思维、方法、能力都有效整合于其中,故而施瓦布(Schwab)提出,科学应该被视作一种概念结构,它随时可能因发现新的证据而被修改。3从这一角度来审视,知识的整合及探究实践过程是科学的本质特征。
科学对于当今社会的巨大影响,直接影响着科学教育及科学课程的目标和设置,因为这涉及“培养什么样的人”的问题。根据课程理念的不同,科学教育学界普遍认为,国际科学课程自二战以来历经三次改革。澳大利亚学者华莱士(J.Wallace)对这三次课程改革进行了概括:第一次改革称为“作为学科知识的科学”,目标在于培养科学家,聚焦科学知识的现代化和结构化;第二次改革称为“作为相关知识的科学”,目的是将科学作为改善个人和社会生活的工具,聚焦于理解科学与社会之间的关系;第三次改革称为“作为不完善知识的科学”,目的在于缩小计划课程与实施课程之间的差距,聚焦于个人、社会和文化对科学知识形成产生的影响。三次课程改革的重心从知识的掌握及科学精英的培养,转向以知识为载体、注重知识获取的过程和方法的运用,越来越注重科学对于人与社会的作用,体现社会公民科学素养的作用和培养。
正如2011年《K-12科学教育框架:实践、跨学科概念、学科核心理念》提出的科学教育的目标那样:(1)面向所有学生普及科学与工程教育;(2)为学生未来从事科学、工程、技术等专业领域职业奠定知识基础,能够进一步看出科学教育越来越注重学生的个人发展,体现用科学的本质观理解和探究、解决相应实际问题。显然,当今世界科学教育已经成为公民科学素养培养的重要途径。
综上所述,科学知识的整合与科学探究实践过程,反映了科学的本质特征,亦是当前科学教育的两个核心内容,科学素养的培养已成为当下科学教育目标的共识。
2.基于课程实践对科学测评目标的分析
鉴于上述对于科学本质及科学教育的理解,科学测评目标应关注科学知识整合与科学探究实践过程。为细化上述目标内容,并切合教学的实际情况,有必要对上海目前的科学教育现状进行梳理。
自改革开放以来,上海的科学教育经历了多次改革。1979年,上海率先从小学一至六年级开设了科技活动课;自1983年起,上海率先从一年级设置自然常识课和手工劳动课;自1989年起,则开始建设科学知识、方法和态度“三位一体”的学科体系。1999年,上海颁布《面向21世纪上海市中小学理科学科教育改革行动纲领》和《面向21世纪上海市小学自然学科教育改革行动纲领》,提出了“综合—分科—综合”的课程体系(如图1、图2)1,以科学素养(素质)为主线,从小学阶段到高中阶段,在知识、思想、能力和方法要求上体现出螺旋形上升的设计。其中,小学的科学素养主要表现出对观察、测量、分类和联想的能力要求,而初中阶段的科学素养则表现出对实验、类比、归纳和演绎能力的要求。
上海市于2002年和2004年分别颁布《上海市小学自然课程标准(征求意见稿)》《上海市初中科学课程标准(征求意见稿)》《上海市小学自然课程标准(试行稿)》《上海市初中科学课程标准(试行稿)》,凸显科学素养培养,突出科学探究过程的课程理念。相应地,在课堂实践中,基于课程标准的教学和评价日益得到重视。在教学实践过程中,则突出体现课程理念和目标,注重创设探究情景,合理开展探究学习,创新课堂实验,尝试教评同步,力求改变“重教轻学”“重知识轻能力”和“重结论轻过程”的状况,努力培养学生的创新精神、实践能力和科学态度。
可以说,目前我国科学课程理念和实践正与国际逐步接轨,关注科学过程和科学实践,并以此作为科学课程实施的核心所在。而这从评价角度来看,则要求突破原有熟悉的以知识体系为主线的学科评价模式;同时,科学过程的复杂现状和相应科学学习发展需求对现有评价体系提出新的挑战,要求在评价理念、系统构建、技术整合和解释上进行新的思考。
不论现状如何,科学测评应以“促进学生个体发展,关注科学探究和实践过程,体现知识的整合运用,并有效形成课程标准、课程实施及课程评价的一致性”为目标。这既是对于世界和国内科学课程发展的顺应,也是对我国科学教育评价的理论和实践层面的新探索。从评价结果的呈现角度,期望针对学生个体发展,在不同学年段,就共同内容领域,建立纵向量表。这一举措有助于明确学生在不同学习段上的定位點,清晰地呈现学生的学习进程。从测评维度上,以整合的知识、科学探究和实践过程为主线,构建不同学年的学生学业等级量表。
3.科学测评框架维度设计
以科学探究实践为核心,构建科学知识的整合以及科学探究实践过程的科学评价框架,如何落实在测评设计中?为保证测评对于课程标准与课程实施之间一致性的促进作用,首先需要分析相关课程标准的内容。这里,我们以上海科学课程标准(小学和初中,2004年版)、国家科学课程标准(小学2017年版,初中2011年版)和美国《新一代科学课程标准》(简称NGSS,2011年版)框架为例,比较分析如表1、表2所示。
从课程目标设置来看,国家和上海的课程标准虽然在名称表述上有所不同,但都基本体现了科学知识、科学探究及情感态度价值观三维的结构,只是个别之处做了适当的整合。同时三个课程标准在科学知识领域的细化方面存在相似,包括生命科学、物质科学、地球与宇宙(空间)科学,以及科学、技术、社会和环境(NGSS中称技术与工程)四个领域。
值得注意的是,虽然有相应领域的划分,但课程标准体现了两种整合方式,来进一步整合科学知识和技能要求,凸显学生的认知要求和相应知识内容的核心价值。一种以主题进行分类,如上海的课程标准和国家初中的课程标准;另一种以核心概念(core idea)或主要概念进行分类,如美国NGSS和国家小学课程标准。
另外,NGSS中单列了跨课程概念(crosscutting concept),这些内容从核心理念中提炼出来,用来连接不同领域,以进一步强化科学知识领域间的联系性,凸显科学知识领域的整合效果,这是中国国内课程标准尚且欠缺的。
国内课标与美国NGSS在科学知识整合及科学探究实践过程上的相似性,使得基于NGSS的CBAL科学测评可作为实践借鉴,以期其能力模型及框架设计能为我们研究思路及方法的运用提供借鉴。1这为我们借鉴国外先进科学测评设计及相应框架奠定了基础,也同时进一步明确在科学知识整合及科学探究实践过程两个维度上架构相应测评框架的设想。
三、科学评价系统构建实践中面临的问题
针对上述两个维度评价框架的设计,在相应评价系统构建的过程中,评价结果与学校教学和学习的关系问题值得关注。同时在实施层面,评价目标和课程目标在实践层面的整合问题,以及测评系统内在要素一致性等问题值得认真深入思考。
1.大规模测评结果与学校教学及学生学习之间的整合问题
不存在一个不考虑预设课程(如课程标准)及课程实施(如教师教学),但可与课堂教学有效衔接并对课堂教学和学生学习起到诊断和促进作用的大规模测评。为建立课程标准、课堂教学、学生学习和测评之间的联系,提升测评结果的解释力,国际测评界的常见做法是根据测评目标及结果需求来形成概念模型,如国际大规模测评TIMSS构建的概念模型(见图3)。
相应地,美国CABL(Cognitively Based Assessment of, for, and as Learning,简称CABL)科学测评(关于、为了和作为学习的认知测评)也有自己的能力模型,其目的在于尝试在学科标准、学习科学研究理论和实践之间建立桥梁(见图4)。
图3所示模型以“输入”“过程”及“输出”为三要素,集中体现对于学生学业结果表现相关影响因素的体现,以及相应因素之间可能存在的因果关系。该模型提供了影响学生学业结果的直接效应和间接效应。从教育管理的角度来看,这些效应的分析有利于教育结果相应“变量”的调控及教育问责。而图4所示模型相对于前者而言,更关注课堂实践微观层面,注重教师及学生学习在课程实施过程中的相互影响,以及测评对于两者的直接效应作用,但该模型容易忽视可能存在的间接效应因素、学生学习的社会及家庭影响效应。基于此,CBAL建立了行动理论(见图5)。
在基于CBAL模型的行动设计中,过程性评价和终结性评价、能力模型和专业支持作为四个重要的组成部分,针对“改善学生学习”以及对“教育效能”体现的预设目标,着重考虑相应的行动机制和预设的中介效应。这样的设置,呈现对不同要素的考量以及相互存在关系的预设。不可否认,上述设计中目标及框架设计、测评工具开发、结果呈现及反馈等环节,形成了可相互印证或调整的路径。
从科学测评系统构建相应概念模型中可得到启发:通过整合测评结果呈现、应用和结果的影响因素,并系统梳理内在因素之间的联系,为相应结果的解释奠定基础。
2.测评目标与现行课程标准(上海和国家)之间的深度整合问题
如前所述,科学的测评不以知识线索为主线,更强调科学探索和实践过程,凸显能力素养的需求。基于此思考,科學测评能力框架的设计显得非常重要,但这对于习惯以知识线索为主线的测试设计而言,该设计工作需要重新加以思考。首先需要考虑测评所基于的课程标准,其次需要考虑测评中科学知识的有效整合问题。知识的整合性既是科学的基本特征,也是学生科学能力及素养体现的基础之一。
如前文课程标准框架的比较分析所示,除了NGSS单列“跨课程概念”外,三者在“知识内容”和“探究实践过程”上,存在较强的相似性。在“探究实践过程”上,都是以探究的过程为确定要素,基本的过程描述类似。在“知识内容”上,国家课程标准和NGSS的相似性更强于国家课程标准与上海课程标准的相似性。这就要求上海的课程标准与国家的课程标准进行融合:或以国家为主,或以上海为主,或取两者的“交集”或“并集”。
对于科学知识整合,我们同样要注意的是,美国通过两个层面完成了这种整合性:其一,凸显核心理念。对于不同的知识领域,提炼相应的核心理念,并体现该领域内的横跨或整合。其二,以“跨学科概念”凸显不同领域之间的联系或共性。这种在国外以“大概念(big idea)”标识的内容整合形式,为能力及素养的凸显和测评解释提供了基础。这里整合的知识领域、科学探究实践过程以及能力之间,形成如下结构图(见图6)。
显然,在不同的学年阶段,在相同的整合知识领域,或许存在相应科学探究实践过程要求不同的情况,也存在着相应能力要求不同的情况。这就需要在相应整合的知识领域,或者在科学探究和实践过程中,个体在适应环境的活动中,对事物认知及面对问题情境时的思维方式及能力表现在不同时间(或学段)上改变的历程,能得以清晰地刻画。显然,针对相关领域中的重要概念、原理及科学探索要素,结合学生认知发展规律及基本特征,形成可供表征或解释的内容,是框架构建中需要进一步细致处理的技术工作,而这亦是一个不断修正、迭代的过程。
3.科学评价系统内在一致性保证问题
笔者试基于测评三角理论,对科学评价系统的内在一致性进行思考。
(1)评价的框架构建
这个问题主要解决的是科学评价的维度设计问题。框架对于整个测评系统具有统摄性,以及维度内涵的清晰性及可操作性是设计的关键。在知识整合与科学探究实践两个维度上,考虑到科学学习的整体性特征,上述两个维度的内涵阐述具有较大的困难。在内容维度上,需要凸显核心概念,强调知识的内在联系,同时整合学生的学习认知。在对来自不同学科的知识进行消枝强干的同时,需突出在问题解决过程中相关概念、原理的运用。在过程维度上,需要处理学习活动过程相关要素及关键能力之间的关系,并需要体现出相应表现特征,以便于凸显问题解决过程中相应影响要素对活动过程的作用。
在上述两个主要维度内涵的处理上,不仅需要清晰明确维度的具体内容标准,还要明确相应的表现标准。总体而言,在问题解决过程中,思维策略的多样性,以及知识联系和学习认知多样性,使得维度内涵的梳理有较大的难度。
(2)试题编制和组卷设计
对于测评框架所设计的维度,围绕实际情境中问题的解决,试题的设计不在注重知识的再现和简单运用,而在于相应问题解决活动中相关概念原理的运用和分析解释,甚至呈现不同的认知层次。基于学习认知的试题编制技术,需要非常扎实的理论基础和实证分析,这给试题编制和组卷设计带来很大的挑战。
同时,随着计算机网络技术的广泛应用,基于计算机的测试极大提升了测试认知的广度、深度和精准度。这给科学评价带来了新的机遇和实施空间,然而也为新试题编制和组卷设计带来了新的问题。静态的文本走向动态的文本呈现,给思维空间中的可重复性和可选择性带来无限可能,也使相应认知描述和特征分析变得更加复杂和困难。这些问题都需要我们进一步思考和进行技术准备。
(3)结果呈现和解释
这里主要是相关指标的呈现和解释。科学学习的整体性和认知过程的复杂性,使得相关指标的呈现及解释变得困难。这就需要对计量模型与认知模型的匹配性做出审视和分析。显然,这里对相关测试技术的综合性要求非常高。
针对义务教育阶段教育质量评价的需求,在当前课程改革的背景下,评价正在凸显越来越重要的作用,并被不断赋予新的内涵和意义。科学评价系统的研究和思考,不仅对跨学科评价具有借鉴作用,还可以积极映射其他学科,为其他学科的系统性评价提供整体思路和技术方法,而这也为全面评价学生的发展提供了有力的保证。