国内外义务教育质量监测项目的比较及启示*

2016-05-26 08:18詹春青
现代教育论丛 2016年1期
关键词:比较机制监测

詹春青



国内外义务教育质量监测项目的比较及启示*

詹春青

摘 要:随着世界各国对教育产出评估的关注,教育质量已成为国际关注的热点。不少国家都开展国内和国际的义务教育质量监测项目。NAEQ和PISA分别是我国国家教育质量监测项目和国际学生评估项目。两者在项目创立、实施概况以及项目结果公布与反馈三个方面既有相似点又存在差异。PISA对我国NAEQ的启示是树立促进学生终身发展、全面发展的价值取向,建立监测结果报告的公开反馈机制,建立对教育问题的快速反应机制以及逐步采用现代化的计算机测试方式。

关键词:NAEQ;PISA;比较;监测;机制

* 本文系2013-2014年广东省基础教育课程改革研究项目“建立广东义务教育质量监测体系研究”(项目编号:2013-2014JJKGYJ007)的阶段性成果。

在知识经济时代,世界各国都希望本国义务教育能切实增强学生的知识与技能水平,以提升国际竞争力,故教育质量成为国际关注的热点。开展大规模的外部统一学业测试是了解义务教育质量的重要途径。目前,许多国家都从国内和国际两个视野同时评估本国的义务教育质量,在开发本国的大规模学生学业测试的同时,引入国际性的大规模测试。如美国在开发本土长期的、全国性的国家教育进步评价项目的同时,也引入了国际学生评估项目(Programme for International Student Assessment,简称PISA)。在我国,上海市最早参加PISA测试,此后北京市、江苏省和广东省也参与了PISA2015测试。上海于2006年提出申请,2007年开发测试工具,2008年进行试测,2009年正式测试,并连续在PISA2009和PISA2012测试中夺冠。这一结果引起了国内外教育界及媒体的广泛关注。与此同时,我国于2007年也开发了本土的国家教育质量监测项目(National Assessment of Educational Quality,简称NAEQ),截至2015年已实施了8年。

NAEQ和PISA均为义务教育质量监测项目,NAEQ的开展与PISA在我国的引入时间上也基本同步。那么作为本土的NAEQ和国际性的PISA究竟有何异同,他们在建立义务教育质量评估体系、切实提高教育质量上有何作用?尤其是对于超越本国课程的PISA对NAEQ有何启示?本文将从项目创立概况、项目实施概况以及项目结果公布与反馈三个方面作出比较,并得出PISA对NAEQ的启示。

一、项目创立概况

PISA和NAEQ分别作为国际和国内大规模的义务教育质量评估项目,两者在项目创立的组织机构、监测目的以及监测技术三个方面存在相似和差异。

(一)组织机构

PISA由经济合作与发展组织(简称OECD)参与国委员会、国际委员会、各国项目主管等机构共同完成。[1]参与国委员会负责确定指标、测量工具和报告结果。调查的设计和执行则由国际委员会负责,包括澳大利亚教育研究委员会(ACER)和荷兰国家教育测量学会(CITO)及其它一些成果。各国项目主管负责该国项目的执行、调查结果的分析和报告。

NEAQ由政府、高校、科研机构等协同完成。国家教育督导委员会办公室负责统筹规划、政策指导;教育部基础教育质量监测中心(简称监测中心)负责日常的组织管理,相关高校、科研机构参与具体的研究、研发工作;地方各级督导部门和教育局配合完成监测数据的采集。[2]

可见,大规模教育质量评估项目的开展都需要借助多方合力共同完成。不同的是,NEAQ监测中心是教育部依托北京师范大学成立的第三方专业评价机构,它没有独立法人地位,也不具有政府机构的行政功能。[3]因此,作为第三方专业评价机构的NEAQ在开展工作过程中,要保持自身的相对独立性和权威性,避免工作性质上完全成为行政机构的附属和工作内容上与行政机构趋同的局面,以保证其监测的专业性和客观性。

(二)监测目的

目前,通过学生层面开展大规模的外部统一学业测试与评价是国际上推动教育质量提升和促进教育内涵发展的重要途径。OECD自1992年首次出版《教育概览:OECD指标》之后,对教育评价指标的关注重点从教育资源投入和教育内容设计转向教育产出评估。PISA正是为回应学生学业成绩跨国比较研究的需要而开发的项目。PISA显示了政府的职责所在,即定期在国际普遍接受的教育评价指标系统框架内,用学业成绩来监督教育结果。因此,PISA是以证据为本的政策研究,以改进教育政策为监测目的。PISA将学生学习结果的数据与其它影响因素联系起来,用经过科学研究得到的数据,提高教育决策的客观性和科学性。可以说,PISA为各参与国提供了国际比较的视角——通过把本国监测的结果放在国际大背景下进行比较,以了解本国的优势和不足,改进教育决策。

我国经过多年努力,基本上普及了义务教育,基本实现了从“有学上”向“上好学”转变和从教育规模发展向教育内涵发展转变。因此,保障和提升教育质量开始成为民众普遍关注的焦点。同时,为顺应我国新课程改革的趋势和国际教育测量与评价发展的浪潮,纠正以往“应试教育”的做法,引导社会树立科学全面的教育质量观,我国也开发了本土的义务教育质量监测与评价项目。NAEQ正是基于这样的背景成立的。它旨在全面监测义务教育阶段学生学业质量、身心健康及变化情况,深入分析其影响因素,为转变教育管理方式和改进学校教育教学提供参考,推动义务教育质量和学生健康水平不断提升。

综上,PISA和NAEQ的监测目的有相似之处,即两者都是把握教育现状为教育决策提供参考,诊断问题为决策调整提供依据的;不同的是,前者注重国际比较,后者重在舆论引导及为社会树立良好的教育价值导向。

(三)监测技术

采用科学规范的教育统计与测量技术对采集的样本信息进行有效地分析与处理是教育质量监测项目取得成功的重要技术保障。PISA综合应用了现代教育统计与测量技术。其抽样应用了按照概率与抽样元素的规模大小成比例的抽样法(Probability Proportionate to Size Sampling,简称PPS抽样方法),试题组卷采用了矩阵抽样方法。在试题分析和能力量表制定中应用了项目反应理论,在结果数据分析中采用了多层线性模型分析方法等国际上较前沿的数据分析方法。[4]

NAEQ通过加强国际交流与合作(如国家教育督导团办公室与法国教育部预测评估司共同主办教育监测与评估国际研讨会、邀请国际组织机构的知名专家短期讲学、开设研究生课程等方式),以PISA以及其它国际大型学生监测项目的经验为基础,同步跟进和吸收了国际相关标准化工具研制的测量技术,如采用了国际广泛使用的矩阵设计、锚题等值等技术。当然,NAEQ也对这些技术作出因地制宜的本土化改进。

二、项目实施概况

大规模教育质量监测项目的实施是项系统工程,具体涉及监测对象的选择、监测目的的定位、监测内容的制定监测周期的设计与监测样本的抽选等几个方面内容。

(一)监测对象和目的

PISA通过阅读素养、数学素养和科学素养三个领域,系统测试接近完成义务教育的15岁学生在多大程度上掌握了参与未来知识社会所必须的基础知识和基本技能。NAEQ参照国家义务教育课程标准,监测义务教育阶段的四年级与八年级学生的全面发展状况。测试包括语文、数学、科学、体育、德育和艺术共六个学科领域。PISA和NAEQ的监测对象和内容如表1所示。

表1 PISA和NAEQ的监测对象和目的

以PISA阅读素养监测为例,重点监测学生访问和检索、整合和解释、反思和评价等认知方面的能力,以及学生阅读参与度和学习策略。此外,还通过“电子阅读能力监测(Electronic Reading Assessment,简称ERA)”监测学生阅读电子媒体文本的能力。以NAEQ语文学科监测为例,重点监测语文基础、文本阅读、书面表达、识别与推论、整合与解释、评价与鉴赏、学习兴趣、学习信心和学习习惯。

PISA和NAEQ两者在监测学生学习态度、学习兴趣与学习信心方面如出一辙。但PISA对素养的定义是在不断发展,与时俱进的。PISA对学生进行的电子阅读能力以及学生基于计算机问题解决能力的监测是NAEQ所缺乏的。

(二)监测内容与周期

PISA从2000年开始,每三年进行一次,每次从三个学科领域中选择一个作为主要评估领域,另外两个作为次要评估领域。前三次PISA监测的主要评估领域分别是阅读(2000年)、数学(2003年)、科学(2006年),2009年主要评估领域又回到阅读,2003年和2012年另外附加测试问题解决(Problem Solving)能力(如表2所示)。值得一提的是,2012年PISA尝试用计算机的方式来监测问题解决能力。

表2 PISA的监测内容与周期

NAEQ从2007年开始,截至2015年连续九年开展监测,基本上每年选择两个学科领域作为监测领域(2011年和2012年除外)。2007-2015年NAEQ的监测内容如表3所示。[5]自2015年开始,NAEQ每三年开展一次,每年测试两个学科领域。第一年度测试数学和体育,第二年度测试语文和艺术,第三年度测试科学和德育。

表3 2007-2015年NAEQ的监测内容

从监测内容来看,PISA和NAEQ有异曲同工之妙,两者都涵盖学科知识,也涉及能力、素养,还将监测成绩与外部环境进行关联分析。从监测周期来看,PISA和NAEQ都以三年作为一个周期,既可以保证持续性,也可以避免因频率过高而对学校造成负担。另外,由于监测项目的复杂性,其监测指标、工具、报告等都需要不断进行修订。这种周期性实施的方式给监测项目自身的完善留有充足的时间。[6]

(三)监测样本

抽样在很大程度上决定了研究结果所适用的对象范围。可以说,科学、正确的样本保证了监测对象的有效性。PISA和NEAQ均采用PPS抽样法。

PISA抽样要求每个国家(地区)至少有150所学校、4500名学生参加测试。以上海参加的PISA2012为例,样本为155所学校,6374名学生参加测试。抽样分为学校抽样和学生抽样。上海严格按照PISA的抽样技术要求,在学校抽样中,学校类型包括初级中学、完全中学、实验性示范性高中、一般普通高中、重点中职、一般中职[7];区域分类包括中心城区和郊区;办学体制包括公办学校和民办学校。学生抽样中,基本覆盖七年级以上15岁在校生。

NEAQ采用分层不等概率方式分三个阶段抽取样本。首先是抽取全国十分之一左右的县(市、区),每个省(区、市)不少于6个样本县(市、区);接着是在样本县(市、区)采用按规模成比例概率抽样方法抽取样本学校,每个样本县(市、区)抽取的小学不少于12所,初中不少于8所;最后在每所样本校随机抽取不少于30名学生。以NEAQ2015为例,全国31个省、自治区、直辖市和新疆生产建设兵团323个样本县(市、区)6476所中小学的近20万名四、八年级学生参加了测试,近6500名中小学校长、十万余名数学、体育及班主任教师接受了问卷调查。[8]

(四)监测方式

PISA和NEAQ两者除了有学业测试外,均开展了调查问卷。PISA包括学生问卷、学校问卷和国家问卷,所收集的有关社会、文化、经济和教育因素的指标与学生的成就相联系,并从学习者、教学者、学校及教育体制四个层面进行分析。NAEQ包括学生、教师和校长问卷,用于调查影响学生学业水平的影响因素。PISA满足信息化时代的要求,自2015年起,全面实行基于计算机等移动终端的考试方式,及时追踪新的教育技术发展动态和展现前沿的教育发展成就。NEAQ采用纸笔测试和现场测试。纸笔测试分为学科试卷和调查问卷。现场测试主要用于体育、科学、艺术等学科领域,通过学生的现场演示和项目参与,考查其运动、操作、创作能力。

三、项目结果公布与反馈

项目监测结果如同一份全面的教育质量体检报告,同时为教育行政部门、学校以及社会公众提供了丰富的数据信息。该结果为教育行政部门把握教育现状和制定教育决策提供了参考;为校长和教师诊断教育问题和改进教学提供了依据;为社会公众引导舆论和树立良好的教育质量观发挥了导向作用。下面将分别介绍项目监测结果的公布形式和监测结果的反馈与政策调整两个方面。

(一)监测结果的公布形式

PISA监测结果的公布形式有两种。一是量化分数。阅读、数学和科学三个领域的分数一般设OECD国家学生的平均分为500,标准差为100,各个国家以此为标准得出相对的分数。上海及其它国家(地区)PISA2012学生平均成绩及排名(前五)如表4所示。二是量表难度等级,即学生精熟度水平。难度等级越高代表精熟度水平越高。PISA三个学科的等级划分稍有不同,基本上从水平1到水平6共有六个等级。

表4 上海及其它国家(地区)PISA2012学生平均成绩及排名

NAEQ监测结果的公布则采用水平划定的形式。NAEQ根据课程标准和学生答题的实际表现,对学生学业水平进行等级划分和具体描述。等级标准的划定,主要是参照我国教育教学中常用的“优、良、中、差”四个等级,借鉴国际通行办法,将学生学业表现划分为水平Ⅰ、水平Ⅱ、水平Ⅲ和水平Ⅳ四段,以反映学生达到课程标准及相关要求的程度。[9]

(二)监测结果的反馈与政策调整

PISA在测试后的第二年公开发布国际报告。如《面向明日世界的学习:国际学生评估项目PISA2012报告》、《PISA2012技术报告》等。这些报告都是公开的,均可以在OECD的官方网站下载或从相关权威媒体获得。

PISA监测结果公布之后,各参与国都清楚地知道本国的结果以及与其它国家的对比情况。如2001年PISA评估结果公布后,德国作为参与测试的国家,其学生在三个学科的测试分数都低于OECD的平均值,与芬兰、挪威、英国等欧洲其它国家相距甚远。该报告刺激德国政府开始实施教育改革,如统一教育标准,设定最低要求;加强学前教育,提早入学年龄;增加教育投入,调整优先教育投资等。[10]

NAEQ监测结果反馈采取了“个别反馈、分级报告、互不交叉”的方式。国家级报告根据监测发现问题的归口,分期、分批向相关负责部门呈送政策咨询报告和简报,成为中央和教育部制定教育政策的重要参考。[11]如2012年11月,监测中心向教育部呈报了关于《部分地区农村小学没有英语教师、不开英语课,学生英语学习质量地域差异悬殊》的报告。教育部督导办就该问题约谈了相关省份的负责人。同时,根据监测结果发现的各地学生英语学习条件、资源差异巨大,农村学生处于不利境地的状况,监测中心向教育部提出了“改革英语教学评价制度,降低中考英语所占的分值比例,确保教育公平”、“改革英语课程方案,减少义务教育阶段英语课程内容,降低学习难度”等建议。教育部予以高度重视,并在后续的中、高考制度改革中充分考虑了这些问题和建议。

通过对比发现,对于教育政策的调整,PISA参与国是自发的,自下而上的;而NAEQ参与省、县是被动的,自上而下的。但两者的共同之处都是基于科学的证据作出适切的教育决策改进与调整。

四、PISA对NAEQ的启示

《国家中长期教育改革和发展规划纲要(2010-2020年)》(以下简称《教育规划纲要》)明确提出,要“提高义务教育质量,建立国家义务教育质量基本标准和监测制度”,“成立国家教育质量监测、评估机构,定期发布监测评估报告”。NAEQ正是结合国情构建的具有本土特色的教育质量监测项目。PISA浓缩了国际上多个领域的集体智慧,具有先进的监测理念、严密的监测程序、科学的监测方法和精密的监测工具,是世界上著名的国际教育监测项目,对我国的义务教育质量监测无疑是重要的参考与借鉴。PISA对NAEQ的启示主要有以下四个方面:

(一)树立促进学生终身发展、全面发展的价值取向

价值取向问题是一切问题的根本。国际上越来越多的教育评价项目不是甄别学习者成绩的优劣,而是尊重个体差异,帮助学生挖掘与提高各项能力。PISA主要监测学生多大程度上掌握和适应未来社会发展所需的终身学习能力。NAEQ旨在改革我国现有的功利性、及时性、显性的价值取向,代之以促进学生终身发展、个性发展的价值取向。实际上,NAEQ对我国义务教育改革与发展具有直接的导向和引领作用,是义务教育发展的“风向标”。《教育规划纲要》指出,应该“把促进学生健康发展作为学校一切工作的出发点和落脚点”。为此,必须切实树立以“人的全面发展和适应社会发展需要”作为义务教育质量监测的根本价值取向,避免“唯分数论”[12]。

(二)建立监测结果报告的公开反馈机制

PISA的监测结果报告是面向公众公开的,其官方网站以及权威媒体都有相关的报道和公告,参与监测的国家(地区)可以清楚地知道本国(地区)的监测结果以及在国际上的排名。该报告还可以供研究人员做研究之用。美国联邦政府教育部为了充分利用PISA测试的研究成果以促进美国的教育改革,邀请OECD站在第三方的立场上,编撰可供美国学习的国际经验。为此,PISA专家专门为美国编撰了《优秀的表现者与有力的改革者:PISA给美国的教训》[13]。但NAEQ并非如此,监测中心的官方网站并没有任何监测结果报告。NAEQ是通过个别反馈、分级报告的形式向相关负责部门反馈政策咨询报告和简报的。尽管截至2015年4月,监测中心累计提供了600余份省、县报告,但是这些报告仅呈送监测省、县教育行政部门。作为参与监测的省、市(县)仅仅知道自己的监测结果以及在所有样本中的排位,无法和其它参与监测的具体单位进行横向比较。NAEQ既然已申明不是高利害考试,减弱甄别和选拔功能,那么这种不公开、不透明的保密行为无疑剥夺了公众的知情权和参与权。因此,建立监测结果报告的公开反馈机制对提高监测中心的权威性与公信度有极大的作用。也只有如此,才能保障该项目富有生命力地可持续发展下去。

(三)建立对教育问题的快速反应机制

PISA测试结果在参加国(地区)的公众、媒体与政府中产生较大的影响,尤其是对于成绩排位较后或者下滑的国家(地区)来说,关键是要建立对教育问题的快速反应机制。如,俄罗斯在PISA2000中学生成绩处于中等偏下的位置。意识到教育质量的下滑以及教育问题的出现,俄罗斯快速制定并出台了一系列教育标准:[14]2001年12月,出台了《2010年前俄罗斯实现教育现代化的构想》,提出了保证基础教育质量的国家社会机制,负责检查和监督教材质量,同时提出了建立独立于教育行政部门的国家教育质量评估体系;次年,相继出台了《普通基础教育国家教育标准(草案)》和《普通教育国家标准的联邦成分(草案)》等等。鉴于此,对教育问题的快速反应机制同样适用于NAEQ。教育部根据监测结果反馈的教育问题可以有针对性地制定适切的教育政策,以评促改,提高教育质量。

(四)逐步采用现代化的计算机测试方式

PISA为适应信息时代发展的需求,自从2015年开始摒弃纸笔测试,全面采用计算机测试的方式进行监测。而NAEQ2015采用的是纸笔测试和现场测试相结合的方式,而且应该在未来的几年也是沿用这种方式。从国际大型教育评价项目发展趋势来看,计算机测试将是未来教育质量监测的发展方向。NAEQ的测试试卷要由专人保密并邮递寄回监测中心。这个过程耗费很多人力、物力和财力。通过计算机监测可以缩短整体监测时间,提高效率,同时还可以监测学生基于计算机的问题解决能力。当然,这对样本学校的计算机配置、机房、数据提交与收集等计算机考试技术提出一定的要求。

综上所述,我们要客观地分析PISA和NAEQ的优势与不足,取PISA之精华,立足于我国本土实际,积极探索适合我国基础教育健康发展和不断发展的大规模教育质量监测体系。

参考文献:

[1] 辛涛,李峰,李凌艳. 基础教育质量监测的国际比较[J]. 北京师范大学学报(社会科学版),2007(6):5-10.

[2] 宋乃庆. 我国义务教育质量监测的“四个创新”[EB/OL]. http://www.moe.gov.cn/jyb_xwfb/xw_fbh/moe_2069/xwfbh_2015n/ xwfb_150415/150415_sfcl/201504/t20150415_187153.html.

[3] 梅松竹. 美国NAEP与我国NAEQ之比较研究[J]. 天津师范大学学报(基础教育版),2013(14):59-62.

[4] 陆璟. PISA2009上海实施报告[J]. 教育发展研究,2009(24):72-75.

[5] 教育部门户网. 我国义务教育质量监测进展情况[EB/OL] http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/s8677/2 01504/185889.html

[6] 李勇. 基础教育质量监测的特点及实施建议[J]. 教育测量与评价,2014(11):16-20.

[7] 陆璟. PISA测评的理论和实践[M]. 上海:华东师范大学出版社,2013:50-51.

[8] 教育部基础教育质量监测中心门户网站. 2015年国家义务教育质量监测测试顺利完成[EB/OL].http://www.eachina.org.cn /eac/dcdt/ff8080814cf569e6014e43cf649e026b.htm.

[9] 国务院教育督导委员会办公室. 国务院教育督导委员会办公室关于印发《国家义务教育质量监测方案》的通知(国教督办〔2015〕4号)[Z]. 2015-4-15.

[10] 孔祥娟:PISA对构建我国基础教育质量监测体系的启示[J].教育测量与评价(理论版),2009(7):34-36.

[11] 董奇. 基础教育质量监测体系体现中国特色和创新[N]. 光明日报,2012-10-15(13).

[12] 范涌峰,廖其发. 基础教育质量监测:国际经验与本土路向[J].教育导刊,2013(4):37-40.

[13] 张民选,等. 专业视野中的PISA[J]. 教育研究,2011(6):3-10.

[14] 李伟涛. 基于PISA测试结果的教育政策调整分析[J]. 教育发展研究,2012(4):44-47.

(责任编辑 于小艳)

Comparisons and Enlightenments Between Domestic and International Compulsory Education Quality Evaluation Projects

ZHAN Chunqing

Abstract:As countries around the world pay close attention to education output assessment, quality of education has become an international hot spots. Many countries have carried out both domestic and international education quality evaluation in compulsory education. The National Assessment of Educational Quality is short for NAEQ and The Programme for International Student Assessment is short for PISA.By comparing similarities and differences between the two among the establishment, implementation and results publish of projects, draws inspirations from PISA to NAEQ.It is first to set up the value for promoting students’lifelong and all-round development ;secondly to establish the public feedback mechanism of the evaluation results, thirdly to set up a rapid response mechanism to the problems of education, lastly to gradually adopt modern computer test way, in order to cause reflection to large-scale education assessment for our country.

Key Words:NAEQ; PISA; comparative research; education assessment; enlightenment

作者简介:詹春青,广东省教育研究院助理研究员(广东广州,510035)

收稿日期:2016-01-04

中图分类号:G512.3

文献标识码:A

文章编号:2095-6762(2016)01-0076-07

猜你喜欢
比较机制监测
特色“三四五六”返贫监测帮扶做实做细
自制力是一种很好的筛选机制
同曲异调共流芳
张爱玲的《金锁记》与居斯塔夫?福楼拜的《包法利夫人》比较研究
托福听力指南:如何搞定“比较”和“递进”结构的讲座题
网络安全监测数据分析——2015年12月
网络安全监测数据分析——2015年11月
破除旧机制要分步推进
不穿戴也能监测睡眠
注重机制的相互配合