教育质量监测=考试?

2016-07-10 11:37龚春燕
人民教育 2016年2期
关键词:学业监测考试

龚春燕

中共中央关于“十三五”规划的建议中,“提高教育质量”成为教育板块的总标题。中国教育将步人把提高教育质量作为教育改革和发展的核心任务的时代。

在此时代,基础教育质量监测因其具有先导性功能,愈益受到重视。2015年4月,国务院教育督导委员会办公室颁布《国家义务教育质量监测方案》,标志着国家义务教育质量监测制度正式建立。国家义务教育质量监测工作将成为提高教育质量的新常态。

然而,由于我国教育质量监测事业起步较晚,对教育质量监测的专业性认识不足,社会公众对于“什么是教育质量监测”仍然存在较大误解,难以把握监测与考试的区别,很难真正建立起质量监测的概念。

监测是“医生”,考试是“裁判”

教育质量监测强调以促进学生全面发展为核心,通过对学生的公民与道德、学业成就、身心健康、艺术素养、兴趣爱好、学业负担等方面进行测量,全面了解学生的综合发展状况。同时,教育质量监测还将收集与学生相关的学校、教师、家庭等环境信息,深入探寻影响学生全面发展的关键因素,科学、客观地评价学生、教师、学校的发展状况。

由于教育质量监测强调过程导向功能,因此,其测试结果不作排名、不作评比,只侧重分析学生、教师、学校或区域在这段时间内发展的优势与不足,从而为学生、教师、学校以及教育行政部门分层提出改进建议,促进教育质量提升。

传统考试比如中考、高考,其目的往往在于甄别与选拔符合标准的优秀学生,并且由于传统考试强调结果导向功能,其考试结果往往作为学生、教师、学校评优评先的重要依据。这不仅导致学校过分重视升学率,过分重视对优秀学生的培养,在一定程度上忽视了较为后进的学生,忽视了不同环境的学生,忽视了学生的兴趣特长,而且使得学生、教师、学校为了应付考试而承受了较大的负担和压力。传统考试过分强调学生学业成绩的高利害性,不利于了解与评价学生、教师、学校的综合发展状况。

质量监测的主要功能是诊断,充当“医生”的角色,为学校或区域教育做“体检”、开处方。传统考试则是甄别,充当“裁判”的角色。这是两者在目的与功能上的最大不同。

教育质量监测要真实地收集学生、教师和学校的综合发展情况

传统考试的测查对象是全体学生,而教育质量监测是通过统计抽样的方法,抽取有代表性的学生、教师、学校为样本,以便有效地获得受测地区或学校的教育发展状况。

目前,全国很多地方采用全县(区、市)学科选择、年级选择进行所谓的监测,其实还是传统的考试。因为测试工具、分析方法还是过去的老传统,测试对象仍是整班,只不过把原来的所有学科、所有年级变成了某一个或几个学科与一个或几个年级而已。国家实行监测是三年一个周期,样本的选择必须科学性很强。首先按照经济发展、人口、民族及社会情况抽取有代表性的样本县,然后在样本县中按照城市、农村、公办、民办等因素抽取有代表性的样本学校,再在样本学校中按照男生、女生、独生子女、多子女、汉族、少数民族、寄宿、非寄宿、城市居住、农村居住等多种因素抽取样本学生,选择四年级与八年级学生。重庆六年的监测,也是通过这样的程序与因素,通过计算机自动抽取样本学校与学生、教师等。

在测量工具上,传统考试强调对具体知识点及重点内容进行考查,大部分试卷的编制,均只由当地教研员或学科教师自行完成,试卷的质量有待进一步控制,全体考试学生用一种工具,有时虽然分成A、B卷,也只是两种试卷的题目顺序做了变化,所有题目本身没有改变。教育质量监测的测量工具则包括学业成就测试与问卷调查两部分。具体而言,学业成就测试强调在国家学科课程标准范围内,重点考查学生综合运用所学知识解决实际问题的能力。教育质量监测要求测试尽可能覆盖学科的各知识点,因此其考查内容较考试更广,题量更大,为了不加重学生的答题负担,教育质量监测基于矩阵平衡设计技术,通过设置铆题,将测验工具拆分成了若干题本进行测试,以更为完整、稳定地测量学生的学业质量。

国际学生测试项目PISA有21種工具,我们国家教育质量监测每一个学科或领域有6种工具。重庆市有小学语文、小学数学、小学科学、小学英语和中学语文、中学数学、中学科学、中学英语等,每个学科6种工具,同时还有与学科配套的学生、教师、管理干部、校长、家长调查问卷若干。研发一套工具,从目标到最终形成需要1-2年时间,重庆市教育评估院研发这些工具,用了6年时间,上百人的专家团队开了150多次会议并还在不断修订中。与考试的工具相比,这些测试工具有更高的信度与效度。同样,教育质量监测调查问卷的编制也历经了数个标准化环节,保证问卷达到教育测量领域规定标准,以便真实地收集学生、教师和学校的综合发展情况。

5年前在重庆市政协年组的讨论会上,一位市领导问:“你们开发的监测体系与考试的最大不同在什么地方?”笔者以考查学生三角形面积公式这“知识点为例,我们传统的考试题,基本上是告诉三角形的底边与高的长度或通过其他条件求出底边或高,计算三角形的面积。教师给分点一般分三步:一是写出三角形面积公式,二是代数并正确计算,三是答案。如果是我们的监测,它首先是给出一个情景,如几个同学到河边跳绳,绳长有5米,请你围成一个三角形,计算三角形的面积。两者之间差距就很大了,“怎么围”是学生解决问题的关键,同时不同的学生因为围的方法不一样,结果不一样,没有标准答案。而且对学生的解答也只有代码,没有分数。围成了三角形是一个代码,然后能找出底边和高有正确的思路是另一个代码,写出三角形面积公式是一个代码。市领导与其他政协委员都知道它们的不同了。

与考试相比,教育质量监测更全面、更精细,有利于提升教育质量

教育质量监测与考试的另一显著区别在于其所采用的数据分析方法不同。传统考试采用分值计分的方式,直接累加计算每位学生在每套试卷上的总分,以此衡量学生学业质量的水平。然而,这种分析方法直接依赖于学生所完成的测验题目,也并未从计分匕区分“能力水平较低的学生答对一道容易的题目,与能力水平较高的学生答对一道高难度题目”的区别,因此存在一定的局限性。

教育质量监测的学业成就测验则依据项目反应理论来进行统计与分析,即通过对测验的主客观题进行编码,对锚题进行链接,采用项目反应模型来估计每个学生在该学科上的能力值,并将其转化为量尺分数来衡量学生的学业水平。同时,教育质量监测还通过表现水平划定、量尺分数等值、多层线性模型、增长模型等分析技术,多方面、多角度地反映学生的学业发展质量。此外,教育质量监测还重在通过描述性分析、均值比较等方法,详细描述学生、教师及学校在一段时间内的综合发展全貌,并通过方差分析、相关分析、回归分析、聚类分析、结构方程模型等多元统计分析技术,深入挖掘影响学生、教师、学校发展的关键因素。

与考试只注重呈现学业成绩的得分及排名不同,教育质量监测不仅注重从学业质量、身心健康、兴趣爱好、行为习惯、学业负担等方面综合性地描述与呈现学生、教师、学校的发展状况,而且注重图文并茂地呈现影响学生、教师、学校发展的关键因素,并基于数据结果,组织专家团队对症给出学生、教师、学校的改进建议。与考试相比,教育质量监测更全面、更精细,有利于提升教育质量。质量监测不能对个体进行评价,只能对群体进行评价。

猜你喜欢
学业监测考试
气囊测压表在腹内压监测中的应用
基于 WSN 的隧道健康监测研究
基于高中地理学科核心素养的学业质量评价与水平划分
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
Japanese Artificial Intelligence Robotto Take Entrance Examinations
大学生学业生涯规划的调研报告
业精于勤
学习监测手环
你考试焦虑吗?