义务教育数学教育质量监测的探索与思考

2018-04-04 00:42王烨晖史宁中宋乃庆
数学教育学报 2018年5期
关键词:监测数学质量

杨 涛,辛 涛,罗 良,王烨晖,史宁中,宋乃庆



义务教育数学教育质量监测的探索与思考

杨 涛1,辛 涛1,罗 良1,王烨晖1,史宁中2,宋乃庆3

(1.北京师范大学 中国基础教育质量监测协同创新中心,北京 100875;2.东北师范大学,吉林 长春 130024;3.西南大学,重庆 400715)

随着国家“人才强国”战略的实施,对基础教育质量内涵愈发关注,迫切需要回答国家数学教育质量的整体状况.借鉴国际数学教育质量测评经验,立足中国数学教育发展现状和需求,国家义务教育数学教育质量监测以提升中国数学教育质量为根本目标,坚持基础性和发展性结合、数学思维和问题解决导向、数学学业和非学业并重、标准参照、国际可比等基本原则.数学教育质量监测可从以下几方面进行改进:梳理和完善监测核心内容,深入挖掘监测结果和数据,开展跨年度比较研究,开发计算机测试.

数学教育质量;监测;大规模测评;质量提升

数学是一门研究数量关系和空间形式的科学,是人们生活、工作和学习必不可少的工具,也是一切重大技术发展的基础[1–2].研究表明,数学能力是个体基本认知能力的组成部分之一[3].数学教育可以使学生获得全面发展和终身发展的基本能力和素养,促进其思维能力和创新能力的发展,为学生未来生活、工作和学习奠定重要基础[1].

数学教育在中国基础教育体系中占有核心和重要的地位.数学课程设置贯穿了小学到高中的所有年级,数学课时在中小学阶段的所有课时中占15%左右[4],数学教与学也常常是各类考核评价中关注的重点领域之一.中国数学教育不断发展,尤其是21世纪初开始的数学课程改革,已经在全国开展了十几年.但是,迄今为止,中国数学教育发展状况如何,尤其是从国家层面,中国数学教育质量整体状况如何?如何有效地测量评价中国数学教育质量状况?并没有现存的答案.随着国家发展,对基础教育内涵发展提出了迫切需求,这些问题更加受到关注,迫切需要基于相关的理论和实践来回答.

1 数学教育发展状况及需要回答的问题

新中国成立以来,随着基础教育不断发展,数学教育的发展也经历了3个阶段.第一阶段(1949年至1976年),学习苏联经验,教学五环节、启发式教学、双基等开始出现,初步形成中国数学教育的特色;第二阶段(1976年至2000年),拨乱反正,引进欧美进步教育观念,中国数学教育有了自己独立的思考,但是应试教育愈演愈烈,数学素质教育艰难前行;第三阶段(2000年至今),新世纪课改自上而下,数学教育在不断地辩论、调整中,寻找“中国道路”,数学素质教育和创新教育进入新的时期[5].21世纪初开始的数学课程改革,对中国数学教育的发展,产生了广泛而深远的影响.

新课改伊始,明确提出了“培养学生终生学习的愿望和能力”的核心目标[6],整个数学教育界不得不重新审视传统的注重知识体系的倾向,重新认识学生在数学教育中应该得到怎样的发展.主要体现在以下3个方面.第一,数学课标颁布和修订.2001年,《全日制数学课程标准(实验稿)》发布,代替了使用近40年的数学教学大纲,2011年,修订后的课标,即《义务教育数学课标(2011年版)》发布,成为数学教育纲领性文件.课标明确指出,数学课程具有基础性、普及性、发展性;数学课程基本出发点是促进学生全面、持续、和谐地发展;是使学生掌握必备的基础知识和基本技能(数学基本思想、数学基本经验)、培养学生的创新意识和实践能力,促进学生在情感、态度与价值观等方面的发展,为学生未来生活、工作和学习奠定重要的基础.以学生为中心的基本理念贯穿始终.第二,与课标对应的教材,同时开始编写、修订和发行.不同于以往“一纲一本”的体制,课改后采用了按照课标要求编写、专家委员会审定的方式,出现了“多版本教材”可供选择的局面,如2005年通过审定的数学教材小学有6套、初中有9套[7].第三,在对课标认识、教材编写的基础上,数学课改真实地走进数学教与学活动中.在课标颁布当年9月,部分实验地区开始试行,到2005年底已在全国全面推行[8].之后短短几年内,以学生为中心的探究式、合作式、情境—探究、问题解决等教学方式开始出现,课堂教学方式发生改变.调查表明,数学课堂更活跃,学生学习积极性主动性更高,“面向每一个学生”的观念,被越来越多的数学教师接受,并在自己的教学实践中逐渐体现出来[8].

但是,新课改自课标发布起,就开始面对来自数学教育界内外的不同声音和讨论.如“初中平面几何内容的删减,推理证明的弱化,是否失去了数学本质的内容?”“‘自主、探究、合作’的引入和推行,是否有矫枉过正,绝对化、片面化的情况?”“增加统计概率等内容虽有合理性,但是学生课业负担加重,如何减负?”“新课改又如何与中高考衔接?”[9]等,大家从不同的角度提出了看法.但是无论理念如何改,课堂如何变,数学教育归根结底是要促进学生的发展[10].因此,中国中小学生通过数学学习,到底学到了什么、学了多少,在数学学习上发展状况如何?数学学习情感态度如何?逐渐成为了数学教育界内外共同关注的核心问题.显然,以选拔为目的的中高考无法回答这些问题[11].

随着国家“人才强国”战略的实施,对基础教育内涵发展愈发关注,也迫切需要从国家层面摸清中国数学教育的家底.具体而言,中国已做到让一亿多适龄儿童接受9年义务教育,但是,学生数学学习的结果到底如何?有多少学生达到了基本要求?不同地区的学生存在怎样的差异?可能的原因是什么?在全国范围,学校数学课时、教师状况如何?这些因素与学生的数学学习结果有什么样的关系?等等.这些情况并不完全清楚,也影响了相关政策的制定和完善,以及中国数学教育质量的整体提升.虽然,之前已有北京等地方尝试教学质量监控,积累了宝贵的经验,但主要是在区域范围了解教学相关的情况,无法回答国家关注的问题.因此,从国家层面看,数学教育课改以来,“中国数学教育质量整体状况如何?”“怎样了解这些整体状况?”成了中国数学教育发展过程中面临的新的、亟需回答的问题.

2 国际数学教育质量测评经验

20世纪国际教育领域的迅速发展,不仅涉及教育理论、课程、教与学,也涉及到评价等各个方面.随着教育实证研究的兴起,心理实验和测量技术的研究方法开始受到关注.桑代克在1904年出版的《心理和社会测量理论导论》中,将统计方法引入教育研究中,并编制了许多测量儿童学业的测验和量表.1915年成立的美国教育研究协会(AERA)明确主张把测量用于教育研究中,通过收集数据来进行描述和评价[12].测验、调查等方法在教育研究项目中越来越多被使用,从小样本的学校调查运动,逐渐到大规模的国家或国际评价项目.

1963—1964年,针对美国缺乏全国性学生学业水平评价,美国教育专员费朗西丝凯佩尔(Francis Keppel)呼吁建立全国性学生评价体系,并邀请著名心理学家、教育学家R. W泰勒(Ralph. W. Tyler)共同参与,开始设计美国国家教育进展评估(NAEP),并于1972年开展了美国国家数学教育测评[13].几乎同时,一些教育心理学、社会学和心理测量学家共同呼吁把教育的结果(知识、态度和参与水平,及有意义的、稳定的影响因素)也纳入到教育评价体系中,并于1967年成立国际教育成就协会(IEA),开始探索用测评的方法开展跨国比较项目——数学与科学趋势国际比较研究(TIMSS)[14].之后,越来越多的国家和国际组织开始探索国家层面的大规模的数学教育质量测评,如欧洲的法国、英国、芬兰,大洋洲的澳大利亚,亚洲的新西兰、日本等国家,以及迄今参与国家最多的世界经济合作组织的国际学生评价项目(PISA)等[15].据2015年联合国教科文组织统计,已有148个国家和国际组织开展了教育质量测评[16].其中,大多数国家和国际组织把数学作为教育质量测评的首次或重要领域.大规模测评逐渐成为了世界各国和国际组织开展数学教育质量测评的有效方式.

如何开展大规模测评?以上国家和国际组织,几十年的丰富的发展经验充分表明,由于社会经济状况不同,发展的需求不同,各个国家和国际组织的测评目的、测评理念各不相同,进而影响到其测评的内容、方法等也各具特色.但是,无论如何,这些大规模测评都需要基于测量理论和方法,解决测评中的基本问题,即“测什么”“如何测”“结果如何解释”,以及“如何用”.

2.1 测什么

测什么是任何测评项目首先要回答的重要问题之一,即测评的整体框架指标.虽然各个国家和国际测评的目的和理念各不相同,对教育质量内涵的理解并不完全相同,但是大家共同认可其核心是学生的学习结果,同时也包含与学生学习相关的环境因素[17].因此,几乎所有的数学测评框架都包含了两个基本部分——学生数学学习结果及其环境因素.

NAEP作为美国的国家教育进展评估,为了从国家层面掌握整体状况及发展趋势,并对结果进行比较、分析,揭示其背后可能的原因,进而为教育管理、政策制定、研究者提供重要的信息,数学测评框架从一开始就包含数学学业表现、环境因素两大部分.数学学业表现主要关注学生通过数学学习“知道什么”“能做什么”,是否达到国家的基本要求;环境因素主要包括学生家庭背景、学生学习机会、教师教学和学校特征等相关的环境信息[18].TIMSS作为国际数学教育测评,为了对各个参与国家的数学教育系统分析比较,提供可供参考借鉴的经验,在大量研究基础上建立了以课程为核心的测量模型,其测评框架除了获得课程,即学生数学学习结果外,还包含实施课程(教师教学、班级活动)、期望课程(课标、教材),作为与学生学习结果密切相关的环境因素[19].

2.2 如何测

用什么测评工具才能有效地测量出框架指标?各个国家和国际数学教育测评项目,都有一套基于测试框架的、有效的测评工具.总体来看,这些工具都包含:数学试卷、调查问卷,前者用于测评学生数学学习结果各项指标,后者用于测评环境指标.如TIMSS2015年数学测试,基于数学测试框架,研制了数学试题四年级169道、八年级212道,所有题目按一定规律组合成四年级14个题本、八年级14个题本;问卷有学生问卷、家长问卷、教师问卷和校长问卷[20].PISA2012年数学测试,基于数学素养框架,研制了110多道题目,按一定规律,与科学、阅读题目一起组成13个题本;问卷有学生问卷、校长问卷[21].

为保证测评工具的质量,提高工具的信效度,这些工具研制都应具备以下基本特点.(1)所有题目与测评指标都有明确的对应关系,学生在题目上的作答反应,可以说明对应该指标的掌握情况;(2)依据测评指标的不同特点,题目有多种类型,通常包括客观题(选择题等)、建构题(填空题、解答题等),不同题型按照一定比例分布,如PISA数学测试中约三分之一为解答题;(3)为了对所有学生的可能表现情况(如是否达标等)加以测量,题目难题分布较广,通常覆盖整个量尺;(4)为保障题目质量,所有题目既经学科专家判断审核,也有两次以上预测试及修订;(5)考虑到题目的广泛覆盖面和测试时间有限,通常采用多题本设计;(6)为实现跨年度趋势比较,不同年度间工具保持一定的内在连贯性.

2.3 结果如何解释

测评的评价标准是什么,这是数学教育质量测评面临的另一个问题.通常情况下,评价标准可以分为绝对标准和相对标准.在数学教育质量测评中,学生数学学业表现通常建立客观的量尺,该量尺反应了国家对学生数学学习后应达到的不同表现水平(或基准线)的要求,如NAEP数学表现量尺有4个表现水平,由低到高分别为基础以下、基础、熟练和卓越[22].PISA数学素养量尺有7个表现水平[23].利用该量尺,可以衡量一个国家的学生数学学习结果状况,如学生能达到量尺上的哪个具体位置,是否达到了最低要求,达到不同水平的学生比例及其具体知道什么、能做什么的描述和刻画,并据此进一步对区域或国家间比较、分析等.

部分测试结果也会采用相对标准,选取平均值或某个有一定意义的结果值,与之进行比较分析,如学生数学课时、数学作业时间等,以此说明某地区或国家的学生课业负担情况.总之,评价标准既有绝对标准也有相对标准,标准的选取要充分考虑测评目的、指标特征以及结果解释需要等.

2.4 如何使用

测评结果的使用,通常是多角度、多方位的.NAEP通常采用“国家成绩报告单”的形式,向社会各界呈现学生数学学业表现情况,主要包括学生在数、代数、几何等子领域以及不同等级(基础、熟练、优秀)情况;除了国家整体情况,也详细报告各个州的测试结果.还以此数据,监控《不让一个孩子掉队》法案(No Child Left Behind)的实施情况.如NAEP2003数据表明,在2014年100%的学生能够达到“熟练掌握”这一目标,看来已是不可实现的了,为此,专门制定了目标和要求,加强对各个州数学、阅读的指导[24].

TIMSS每次监测之后,除了学生数学测试结果外,另有专门的报告呈现教师准备等课程相关信息[25],许多参与国家正是依据这些信息,改进了本国教师培训课程(职前和职后),并对需要的地区提供附加资源(比如教师职业发展、支持和评估新教师)[24].

PISA测试结果公布之后,爱尔兰发布了15岁学生数学成就的教师指南(Shiel and others,2007),在描述学生数学成就同时,附上测试题目以及爱尔兰教师应该如何教授PISA类型数学题目,给教师提供3种建议.芬兰则进一步分析本国学生表现的优势与不足,以及相关资源、政策的需求,分别提供给教育规划人员、政策制定者以及国家工作专家小组,作为完善改进的重要参考依据[24].

总之,从以上国际数学测评经验可以看出,各个国家和国际组织通过开展大规模的数学教育质量测评来了解其数学教育质量状况,都有其主要共同点.第一,作为数学教育质量测评,其测评框架都包含了学生数学学习结果和相关环境因素两个基本部分,两者缺一不可;第二,测试工具与测试框架密切相关,除专家判断外,还采用预测试等方式保证工具良好的质量;第三,测评结果的解释主要有标准参照和常模参照,学生数学学业表现结果采用标准参照,即建立学生数学学业表现量尺来衡量其水平高低;第四,都很重视测评结果的使用,尤其是发挥结果在政策制定、教学资源配置、数学教学改进等方面的作用,达到提升教育质量的目的;第五,国际数学测评也还在不断发展完善中.

但是,各个国家和国际测评也有自己明显的特色,它们的测评目的不同、测评理念不同,具体表现在测评的各个方面,体现出不同的测评导向.

3 中国的数学教育质量监测

如何在学习借鉴国际数学测评理念和技术方法的基础上,立足于中国数学教育发展现状,结合中国数学教育发展特点和需要,开展国家层面的数学教育质量测评?受教育部委托,监测中心于2007年正式启动国家基础教育质量试点监测,首先开展数学教育质量的试点监测,在全国范围,组织具有教育政策、教育管理、教育研究与实践等领域丰富经验的专家学者共同参与,初步明确了监测指导思想和基本思路,并付诸实践,在实践中不断补充完善.

3.1 数学监测目的

在国家层面开展义务教育数学教育质量监测,首先要满足国家的需要,体现国家意志.《国家中长期教育改革和发展规划纲要》明确提出,要“提高义务教育质量,建立国家义务教育质量基本标准和监测制度”.因此,国家层面开展数学教育质量监测,其根本出发点和落脚点是提高国家义务教育数学教育质量.为此,数学教育质量监测的目的可以概括为:把握状况、分析原因、提出建议、促进提升.

(1)把握状况.有关教育质量的内涵,尽管当前世界各国的理解各不相同,但都普遍认可以学习者为中心,将学习者的发展结果作为核心的教育质量指标[17].

根据中国教育方针以及数学课标的规定,义务教育阶段数学教育总目标是通过数学教育,促进学生在知识技能、数学思维、问题解决和情感态度4个方面的发展.因此,监测通过抽取具有全国代表性的样本,全面系统地了解中国义务教育阶段学生在数学学习中数学知识与技能、数学能力、数学情感态度的整体状况和发展趋势.同时,基于国家教育均衡发展的考虑,了解和对比不同区域(例如城乡、省间、县间等)、不同群体(例如流动、留守等)学生数学学习的差异状况.

除学生数学学习结果外,还同时了解来自学生家庭、学校、区域的学生数学学习环境因素的状况.学生数学学习结果,及其环境因素的状况,共同刻画出中国数学教育质量的完整、真实的质量状况图.

(2)分析原因.在全面把握数学教育质量基本状况的基础上,分析其内在关系和变化规律,尤其是针对主要问题,分析其可能原因,是数学监测的第二个目的.首先,数学教育质量发展变化有其内在规律,“在来自学生家长、教师、学校等方面的众多环境因素中,起重要作用的因素是哪些?”“其作用的机制和特点是什么?”等,都是实现数学教育质量的提升,值得关注的重要问题.其次,从现阶段发展的角度,尤其是结合政策制定和落实,关注数学教育中的重点、难点问题(例如,教育经费投入、数学师资配备、数学课程开设、数学教学资源、数学教学方式、学生学业负担等对数学教育教学的影响),并深入分析其成因,可以作为数学教育质量改进的突破口.

(3)提出建议.在全面把握状况、分析原因的基础上,为国家和地方教育政策制定、教育管理部门、数学教研系统、学校数学教师等,提供客观准确的数据信息,提出有效建议等.如增加教育经费,最需要投入在哪里、哪些方面;怎样开设数学课程比较合理;学生负担主要来自哪些方面,如何对待其多样性等.一方面,通过监测数据信息,改变长期以来中国教育管理部门制定政策措施缺乏实证依据的状况,提高教育决策的科学性;另一方面,也使各级管理部门、数学教研系统、学校等,在落实具体改进方法时,更有针对性和时效性.

(4)促进提升.提升数学教育质量是一项需要多部门共同参与,并持续努力的长期工程.在中国现有教育体制下,通过教育督导与管理、数学课程研究、数学教研等系统的共同参与、协作,可以督促各级主管部门,合理配置教学资源、优化数学课程设计、指导学校数学教师,改进数学教学现状,逐步实现促进学生数学素养的提升,并进一步引导全社会,树立正确的数学教育观和数学学习质量观.

3.2 数学监测研发的基本原则

开展国家数学教育质量测评,不仅要借鉴国际数学教育测评的经验,更要立足中国数学教育的现实状况,体现国家数学教育目标,并对中国数学教育发展起到导向的作用.因此,在整个数学监测研发过程中,主要的依据是:国家教育方针政策相关规定,中国《义务教育数学课程标准(2011年版)》的具体内容要求,义务教育中小学十几套数学教材的深入分析比较结果,通过调研等方式,充分掌握中国数学教育教学发展的实际状况,尤其是地区差异状况,以及教育测量评价的基本理论和相关要求.监测研发中的基本原则主要如下.

(1)基础性与发展性相结合的原则.

数学监测以促进学生适应社会和提升教育质量为根本目的,不同于中考高考,不是为了选拔学生.为此,数学教育质量监测设计面向全体学生,既涵盖数学的基本要求,也关注学生在社会生存的必备基础,强调对学生成为合格公民所必备的数学知识和技能的基础要求;同时,数学教育质量监测还要考虑学生终身发展的需要,关注有利于学生未来发展的核心素养,充分考虑学生数学学习特点和认知发展规律,能引导学校、家长和社会,形成积极的数学教育质量发展观.

(2)数学思维与问题解决导向的原则.

数学教育质量监测指标要考虑数学学科的特点,体现出数学的本质.因此,数学监测不仅关注学生数学基础知识和基本技能的掌握,也同样关注学生抽象能力、推理能力和创新能力的发展;还要反映出社会发展对个体素养的要求,引导学生主动建立数学世界与外部现实世界的联系,充分发展提出问题、分析问题的能力,以及用数学思想和方法解决现实生活中问题的能力.数学教育质量监测指标既要能体现中国数学教育目标,也要能够发挥对数学学习和教学的导向作用,有利于贯彻落实素质教育理念.

(3)数学学业与非学业并重的原则.

数学教育质量监测以学生的学习结果为核心,它必然会受到环境因素的影响,是监测不可忽略的方面.学生数学学习结果,不仅包含学生的数学学业表现,还包含学生的数学学习情感态度,积极的情感态度对数学学业表现有积极的作用.值得关注的是,学生数学学习结果,离不开来自家庭、教师、学校等相关环境因素的影响,它们是提升数学学习结果不可缺少的方面.因此,数学教育质量监测既要关注学生数学学业表现,也要关注学生数学学习情感态度;既应关注学生数学学习结果,也应关注与数学学习相关的环境因素.

(4)标准参照的原则.

数学教育质量监测是对中国义务教育阶段四、八年级学生整体的数学教育质量的监测,不是对个别学生的评价,不用于学生的甄别、选拔等.在数学学业表现方面,监测强调以学生数学学习的达标程度来衡量学生数学学习质量,也就是要建立相对客观的评价参照系统,对学生数学学习质量所进行的准确描述和说明.既包括全面而明确的,能客观反映学生通过数学学习“知道什么,能做什么”的内容标准,也包括符合中国实际情况,界限明晰的,能说明学生能做到“什么程度”的表现水平.在相关因素方面,监测主要依据国家政策的相关规定,如数学课时、学生作业时间等,据此对结果进行分析、解释和说明.

(5)国际可比的原则.

数学教育质量监测既要充分体现中国数学教育目标和导向,符合中国数学教育实情,也要学习国际数学测评先进理念和设计思路,借鉴其数学测评框架研制的技术和方法,并且吸纳国际数学测评相关研究的最新发展成果,使数学监测指标体系既符合中国数学教育实情,有中国特色,又具有国际特点,能够与国际数学测评发展接轨.

3.3 数学监测的初步成果及其特点

监测作为一项综合性、系统性的工程,既要以教育理论和相关研究为基础,更需要在实践中接受检验,并不断地修正和完善,确保质量,最终实现目的.数学作为国家试点监测和正式监测的第一个领域,从零探索,自2007年启动以来,主要历经了两个阶段:2007—2014年试点监测,研发数学监测指标、监测工具,在4次试点监测的基础上,多轮次修订完善指标和工具;2015—2017年正式监测,抽取全国样本,收集数据,划定标准,完成数学监测的国家、省域和专题等各类报告.

数学监测不断改进完善,在借鉴国际数学测评经验基础上,立足中国数学教育现状和发展目标,初步形成系列成果,也体现出中国特色,其主要成果及特点如下.

(1)研发制定了中国数学教育质量监测指标体系.监测指标体系是监测的纲领性文件,也是监测工具研发、结果解释等各个环节的重要依据,它明确并细化了数学教育质量监测“测什么”.数学监测指标体系包含数学学习结果和环境因素两部分,其中数学学习结果分为数学能力、数学学习情感态度两个维度,及其具体测查指标;相关环境因素包括学生、家庭、教师、学校4个方面,及其具体测查要点.

数学监测指标建立在对中国数学课标、中小学数学教材的深入分析比较基础上.因此,它突出体现了中国数学课程标准的核心要求,如数学能力的5个指标,与课标的核心观念密切相关;它也体现了对中国数学教育的导向作用,如考虑到中国数学教学和评价中,长期以来对数学内容相对熟悉和关注,监测指标则强调对能力的测评,尽可能突出数学教育的核心.相关环境因素指标尽量反应与学生数学学习密切相关的环境因素,突出了对重要因素的测查;也反应了数学教育重点热点问题、政策需求等,如数学课时、数学作业时间等.

(2)研发形成了数学教育质量监测工具库.监测工具是监测指标的重要体现,它回答了“如何测”.数学监测工具包括数学试卷、相关因素问卷,其中数学试卷分为多个题本,主要测查学生数学能力,相关因素问卷分为学生、教师、校长问卷,主要用于收集与数学学习相关的来自学生、家庭、教师和学校等环境信息.到目前为止,已经积累了近千道数学测试题目,上千道问卷题目.

数学监测工具是监测指标的具体体现.因此,每道题目都对应着指标中的某个具体的测查点.数学题目突出对中国数学教育中“双基”的考查.考虑到中国数学教与学的现状,设计了有针对性、有引导作用的题目.如弱化计算速度,突出算理的题目;问题提出的题目;为鼓励学生展示思维过程,解答题比例在三分之一以上,并体现对解决生活情境问题、开放问题的能力的考查.问卷题目针对不同指标及其特点,设计了选择、量表、情境等多类型的题目.无论数学测试题,还是问卷题,除专家多轮次审核外,都经过两次以上预测试及修订,确保了所有题目具有良好的测量参数,良好的质量保障.

(3)建成了数学教育质量监测基础数据库.数据库包括学生、教师和校长数据库.仅2015年数学监测数据库,就有学生样本约二十万、教师样本两万多、校长样本六千多,共涉及一百多个数学测试变量,三百多个相关因素变量.

这是基于中国全国样本收集数据,建立的第一个国家数学教育质量数据库.数据库既包含学生数学学业表现的变量,同时涵盖了来自学生、教师、学校等各个方面的相关变量;同一年内变量间具有内在的关联,部分变量还可以进行跨年度比较.这样的数据库不仅有助我们对监测数据的深入挖掘和分析,还是今后持续开展国家数学教育质量监测,追踪分析中国数学教育质量发展趋势的重要且必备的基础.

(4)制定了学生数学学业表现水平标准.学生数学学业表现水平标准是衡量学生数学学业表现水平的量尺,由低到高分为4个水平,水平1最低,水平4最高.在每个水平上,可以对达到该水平的学生知道什么、能做什么及其熟练程度进一步描述和说明.

这是第一次建立的全国义务教育学生数学学业表现标准,它不仅基于中国数学课标要求,也充分考虑了中国数学教学的实际状况,尤其是地区的差异,并结合了学生实际作答表现结果.表现标准由来自全国各地,六十多位中小学优秀数学教师代表、数学教育研究者和管理者共同参与讨论,采用国际通行技术方法划定.利用该标准,既可以了解中国学生整体的数学能力发展水平,也可清晰刻画中国不同地区学生的数学能力状况,得到中国学生数学能力发展水平全景图.通过等值设计和处理方法,表现标准还可以保持不同年度间的稳定性,可以用于不同年度间发展趋势的比较.

(5)完成了多种类型数学监测结果报告,并提交教育部及地方教育管理部门.从试点监测到正式监测,根据监测数据结果,先后已撰写了多类数学监测结果报告,既有国家义务教育数学监测结果报告、省域和县域监测结果报告,也有专题报告、基础数据报告等类型,共约几百份.其中,数学监测结果报告、专题报告已提交教育部及其相关司局,省域和县域报告结合区域报告解读说明会,陆续反馈到所有参加测试的32个省份及各样本县的教育管理部门.

国家监测结果报告是第一次基于全国样本的监测数据,对中国数学教育质量状况的全面、客观呈现.无论是国家监测结果报告,还是专题报告等,都受到了教育部及相关司局的高度重视,部分专题报告,如有关学校数学课时等重点问题的分析,已成为相关政策完善、规定落实和改进的重要依据.

4 反思与展望

国家数学教育质量监测从试点到全国正式监测,不断改进完善,积累了宝贵经验,初步形成具有中国特色的成果,但也还有很多值得进一步思考和不断改进的方面.

4.1 监测核心内容的梳理和完善

随着数学课改推进,对数学教育本质及其作用的认识也不断丰富,数学课程的核心要求经历了“双基”“四基”“数学核心素养”的发展.国家数学测试在强调双基要求的基础上,如何更好地体现出基本数学思想、数学活动经验的要求,体现出数学核心素养的几个方面?如何从概念及其内涵上,梳理、论证清晰以上概念之间的关系?尤其是,针对这些指标,如何才能有效地测量出来?设计出有效的题目?如基本数学思想中的“抽象”,如何测量学生更有效?数学应用中的“提出问题”,如何设计让学生提问的任务?提出问题后又如何评判?

环境因素指标是国家数学监测中不可缺少的部分.在监测中,除了关注数学教育热点、难点问题外,学生数学学习有其内在发展规律,受到来自家庭、课堂、学校及社会环境中众多因素的影响,这些因素之间也可能相互影响,最终对学生数学学习结果起关键、核心影响的因素是哪些?怎样的作用机制?这些问题都还值得进一步分析、提炼,并改进这些指标的测量方法.

4.2 监测结果的使用和数据深入挖掘

数学测评从试点到正式监测,虽然已经撰写了各类结果报告几百份,为相关政策制定和修改提供了大量数据信息,但是,有关学生数学学习发展水平及其优劣、教师教学方法等方面的分析还不够深入,所提供的信息还不能充分满足地方、学校及教师的实际的需求.作为国家层面的教育质量监测,要完全满足不同层级需要具有一定的挑战,需要一个过程,但是可以选择1~2个主题做一些尝试和突破(如有关问题解决能力等),设计好测查指标和题目,对结果做出更深入的分析,引导和促进数学教学改进和提升.

另外,无论是试点监测还是正式监测的数据库,现有的报告对数据库的利用还非常有限,还有大量的数据信息可以深入分析,如进一步对数据分析和利用,不仅可以帮助研究者得到更多的有意义的结果,还非常有助于基于测试数据进行预研究,为后续的测试设计,如指标筛选、题目编写等提供重要的依据.

4.3 跨年度比较的设计和处理

作为国家层面的数学教育质量测评,不仅要了解测试当年的实际状况,还需要掌握质量的变化发展趋势,对不同年份的测评结果进行分析比较.既包括两年度之间的变化,也包括两年以上的变化趋势.如美国NAEP“国家成绩报告单”每次不仅报告学生成绩相对上一次的变化,还报告1992年以来国家整体数学学习成绩的变化趋势.PISA每次不仅报告测试国家相对前一次测试的变化,也同时报告参加测试以来历次成绩的变化情况,并与其它指标再进一步分析比较.

如何设计测试指标和工具、如何进行数据分析、如何建立不同年度间关联是测试中必须考虑的重要问题.如NAEP、TIMSS、PISA等国际数学测试中,大多采用共同题目的方法来实现年度间等值的目标.在中国传统考试文化背景下,这种方法是否合适?如何修改完善?除了两年度之间,两年以上的关联如何设计?等等,都需要更深入的预研究和精心设计.

4.4 计算机测试的开发

随着信息技术的迅速发展和在各领域的广泛应用,计算机化测评发展已经成为必然.计算机测评不仅可以简化测试组织过程,使数据收集、处理更方便快捷,更为重要的是,可以充分发挥其情境性、动态性、互动性、合作性等特点,设计出传统纸笔测试中不可能的任务,极大地改进测查内容和过程.

数学教育一直强调培养学生的数学思维能力,关注学生思维过程,但是如何测量更有效?在传统的纸笔试卷中,让学生展现不同水平的思维过程,并不是一件容易的事情.计算机技术提供了更多的可能性.如PISA数学计算机测试中,在分析实际情境中的函数关系时,学生可以通过反复的尝试,寻找变量之间的关系,不同的学生还可以有不同的具体尝试方式和策略,且学生所有作答过程数据均可实时完整地记录收集,供评估使用[26].因此,在数学测试中,尤其是有关学生思维过程、思维方法的测试,是否可以有一种新的方式和途径,值得深入研发和探索.这种新的方式和途径,有可能成为我们“打开学生思维的一扇窗”.

[1] 中华人民共和国教育部.义务教育数学课程标准(2011年版)[M].北京:北京师范大学出版社,2012:1-2.

[2] 中华人民共和国教育部.全日制义务教育数学课程标准(实验稿)[M].北京:北京师范大学出版社,2001:1.

[3] 董奇,林崇德.中国儿童青少年发育关键指标与测评[M].北京:科学出版社,2011:169-178.

[4] 中华人民共和国教育部.教育部关于印发《义务教育课程设置实验方案》的通知[EB/OL].(2001-11-19)[2018-07-20].http://old.moe.gov.cn//publicfiles/business/htmlfiles/moe/moe_711/201006/xxgk_88602.html.

[5] 张奠宙,于波.数学教育的“中国道路”[M].上海:上海教育出版社,2013:7-16.

[6] 中华人民共和国教育部.教育部关于印发《基础教育课程改革纲要(试行)》的通知[EB/OL].(2001-06-08)[2018-07-20].http://www.gov.cn/gongbao/content/2002/content_61386.htm.

[7] 孙晓天.近年来中国数学教育发展述要[J].数学通报,2007,46(6):14-19.

[8] 马云鹏.义务教育数学课程改革十年回顾与展望[J].基础教育课程,2011(7—8):38-42.

[9] 张奠宙.中国数学教育在改革与反思中前进[J].人民教育,2008(22):33-37.

[10]史宁中.《数学课程标准》的若干思考[J].数学通报,2007,46(5):1-5.

[11]李希贵,李凌艳.教育质量监测:为了国家教育目标[J].人民教育,2007(13):3-4.

[12]程建坤,陈婧.教育实证研究:历程、现状和走向[J].华东师范大学学报(教育科学版),2017(3):150-158.

[13]辛涛,李峰,李凌艳.基础教育质量监测的国际比较[J].北京师范大学学报(社会科学版),2007(6):5-10.

[14]  IEA. Brief history of the IEA [EB/OL]. (2018) [2018-07-20]. https://www.iea.nl/brief-history-iea.

[15]杨涛,李曙光,姜宇.国际基础教育质量监测实践与经验[M].北京:北京师范大学出版社,2015:1-6,19-32.

[16]联合国教科文组织.2000—2015年全民教育:成就与挑战[M].北京:教育科学出版社,2015:305-311.

[17]教育部基础教育质量监测中心.定义基础教育质量——结果和可测评的取向[R].北京:基础教育质量监测中心,2011:5-8.

[18]  NAEP. Survey Questionnaires [EB/OL]. (2018-08-06) [2018-08-10]. https://nces.ed.gov/nationsreportcard/experience/ survey_question naires.aspx.

[19] INA V S MULLIS, MICHAEL O MARTIN, TERESA A SMITH, et al. TIMSS assessment frameworks and specifications 2003 [M]. Boston: Boston College, 2003: 3-4, 73.

[20]  MICHAEL O MARTIN, INA V S MULLIS, MARTIN HOOPER. Methods and procedures in TIMSS 2015 [M]. Boston: Boston College and IEA, 2016: 9-37.

[21]  OECD. PISA 2012 technical report [M]. Pairs: OECD Publishing, 2014: 29-45.

[22]  NAEP. The NAEP Mathematics achievement levels by grade [EB/OL]. (2015-10-21) [2018-07-20]. https://nces.ed. gov/nations-reportcard/mathematics/achieve.aspx.

[23]  OECD. PISA 2012 Results: What students know and can do (Volume I) [M]. Paris: OECD Publishing, 2014: 44-46.

[24]辛涛,李勉,任晓琼.基础教育质量监测的报告撰写与结果应用[M].北京:北京师范大学出版社,2015:45-56,61-80.

[25]  MULLIS I V S, MARTIN M O, OLSON J F, et al. TIMSS 2007 encyclopedia [M]. Boston: Boston College, 2008: 3-44.

[26]  OECD. PISA 2012 assessment and analytical framework [M]. Paris: OECD Publishing, 2013: 119-136.

Introduction of the National Assessment of Education Quality-Math

YANG Tao1, XIN Tao1, LUO Liang1, WANG Ye-hui1, SHI Ning-zhong2, SONG Nai-qing3

(1. Collaborative Innovation Center of Assessment toward Basic Education Quality, Beijing Normal University, Beijing 100875, China; 2. Northeast Normal University, Jilin Changchun 130024, China; 3. Southwest Normal University, Chongqing 400715, China)

With the implementation of the national “talent power” strategy, more attention was paid to the quality of basic education. We urgently need to answer the question of education quality of national mathematics. Using the experience of international mathematics education assessment, more based on the development status and needs of China’s mathematics education, the national assessment of education quality-math takes improving the quality of our national mathematics education as the fundamental goal, adheres to basic principles such as the basic and developing, mathematical thinking and problem solving oriented, mathematics academic and non-academic pay equal attention to, standard reference, the international comparable. Since 2007, after the pilot monitoring and formal monitoring, the results of education quality monitoring series with Chinese characteristics have been preliminarily formed. It not only laid a solid foundation for follow-up monitoring, but also began to play an important role in improving the quality of national and local mathematics education.

the quality of mathematics education; assessment; large-scale assessment; quality improvement

2018–09–01

杨涛(1967—),女,四川成都人,副教授,主要从事教育测量与评价研究.

G420

A

1004–9894(2018)05–0001–07

杨涛,辛涛,罗良,等.义务教育数学教育质量监测的探索与思考[J].数学教育学报,2018,27(5):1-7.

[责任编校:陈汉君、陈隽]

猜你喜欢
监测数学质量
“质量”知识巩固
特色“三四五六”返贫监测帮扶做实做细
质量守恒定律考什么
做梦导致睡眠质量差吗
网络安全监测数据分析——2015年12月
网络安全监测数据分析——2015年11月
我为什么怕数学
数学到底有什么用?
质量投诉超六成
不穿戴也能监测睡眠