任子朝 陈昂 单旭峰
高考分数的科学解释和利用
——ACT考试分数量表评介
任子朝 陈昂 单旭峰
高考虽然是选拔性考试,但需要应用标准参照考试的理论,深入细致地分析考试数据和考生答题情况,这样既可知道考生在群体中的地位,更可以知道考试分数的意义以及考生能力发展水平和知识掌握程度,对考生做出科学合理的评价。进而使招生的高校更加具体、深入地了解考生的学业水平和学科特长,挑选满足自身招生要求、适合本专业培养的考生,也将会更有利于人才的选拔,也更有利于人才的培养。
考试分数解释;分数量表;高考改革
每年高考之后,各省都要公布考生的单科分数和总分,同时公布本省重点、一本、二本、专科院校的录取分数线。但考生的分数究竟意味着什么?一个考生语文、数学、外语(满分各为150分)考到120分,或者文科综合、理科综合(满分各为300分)考到240分,分数的意义是什么?该考生究竟对知识掌握到什么程度?学科能力又发展到什么水平?还有同一所高校,即使同为理科的电子科学与技术专业与农业工程专业对考生的数学水平的要求应该一样吗?同为文科的古代汉语与比较文学专业对考生的外语水平要求应该一样吗?一本或二本院校的不同专业是否应该对考生的高考单科成绩提出不同的要求?在高考进行新一轮改革的今天,这些问题都需要进行深入的探索和分析。
早在30年前,就有学者提出了考试分数科学解释的问题。“对所取得的考试分数应如何科学地进行解释,这也是考试标准化中的一个颇为重要的环节。所谓分数解释包括两方面的问题:其一是如何使分数具有明确的意义;其二是怎样把有意义的信息传达给考生或有关方面。”[1]
高考属于常模参照测验,其分数更多地被用于确定考生在群体中的位置,以便高校根据考生成绩,由高到低,择优录取。“常模参照测验与标准参照测验的根本区别就在于解释分数的参照点不同。常模参照测验解释分数的参照点的选取赖以常模群体的水平,属于相对评价范畴。标准参照测验的参照点是被测群体之外预先确定的教育目标或任务领域,它独立于特定的群体,这种测验属绝对评价范畴。由此带来了一系列的差异,在编制与使用时,应当予以注意。”[2]
但在考试实际过程中,“在常模参照测验中,也借鉴了标准参照测验的一些思路,来深入细致的分析一些题目和数据,这样既可知道考生掌握了什么,又可知道他在群体中的地位。”[3]
因此应用标准参照测验的理论,深入分析考试数据,确定每个分数段的考生实际掌握知识的情况和能力发展水平,科学评价考生,进而让招生的高校更加具体、深入地了解考生的学业水平和学科特长,挑选满足自身招生要求、适合本专业培养的考生将会更有利于人才的选拔,也更有利于人才的培养,真正做到玉尺良裁,因材施教。
ACT考试(The ACT test)是美国大学和学院招生和录取的入学考试。ACT是基于课程(curricu⁃lum-based)的考试,侧重于对中学知识掌握程度的测试,以学科知识为基础,着重考查通过学习后所获得的学科能力。
3.1 ACT的考试科目、时间和题型
ACT考试包括英语、数学、阅读、科学四个部分。ACT考试以选择题为主要题型,除了供选做的写作考试外,英语、数学、阅读和科学这4科试卷一直采用选择题考试。ACT考试各学科试卷结构及考试时间如表1所示:
表1 ACT考试的试卷结构和考试时间
3.2 应用量表分报告成绩
ACT考试一年举办多次,为保证不同次考试的结果具有可比性,在ACT考试中,每个学科都建立了相对独立、客观、标准化的满分36分的分数量表(score scale)。无论每科试卷包含的试题数量多少,每次考试数据分布如何,都可以将考试的原始分数经过校正、拟合、等值等统计技术处理后,映射到同一量表上,转换成量表分数后再报告考试成绩,从而使不同考次的成绩具有可比性。ACT与美国高等教育执行办公室(SHEEO)合作研究开发了大学入学标准(College Readiness Standards),将英语、数学、阅读、科学的考试量表划分为6个分数区间(score range):13~15分,16~19分,20~23分,24~27分,28~32分和33~36分(写作分3~4分,5~6分,7~8分,9~10分和11~12分5个值域)。[4]并且对于每个区间,都详细规定了该学科应掌握的知识和能做之事,即考生考到相应的分数,可以进行哪些操作,具备哪些能力。下面列出数学和科学的分数量表。
3.3 数学考试分数量表[5]
ACT数学科考试分数量表包含数与量、代数、函数、几何、统计与概率五项内容,每项内容又包括众多的知识和能力表现,限于篇幅,本文摘要编译其各项中的内容,如表2所示。
需要注意的是,对考生个体而言,同样考到28分,可能有的考生在代数部分得分较多,有的考生在几何部分得分较多。但数学分数量表是在对大规模考生群体的统计分析后得出的考生能力表现,所以是统计意义的结论,即对考生群体而言,得到28分就掌握了相应的学科知识,达到相应的能力水平。
3.4 科学考试分数量表[5]
ACT学科考试分数量表包含数据解释、科学探究及模型、推断和实验结果评价三部分内容,具体如表3所示。
3.5 大学入学基准分
基于各学科的分数量表,ACT提出了能够顺利完成大学一年级基础课程所需的各学科ACT考试分数,即大学入学基准分(如表4所示)。例如考生如果希望顺利学好大学一年级的英语写作课程,其ACT的英语分数至少应达到18分;如果希望顺利学
好大学一年级的代数课程,其ACT的数学分数至少应达到22分。
表2 ACT数学考试分数量表(摘译)
表3 ACT科学考试分数量表
表4 ACT大学入学基准分
ACT在开考后的第二年(1961年)就实行了量表分数制度。建立分数量表,对试题进行等值,从而能够保证年度之间和不同考次之间分数的可比性,为科学命题、评价服务等起到了奠基性的作用,同时对考生的知识和能力水平做出科学的解释。随着我国高考制度改革的进一步深入,一年多次考试也已经进行改革试验,特别是从考试到评价的跃升,对科学报告高考分数提出了更高要求。[6]因此,建立科学的分数量表,实行科学的分数报告制度是推进高考制度改革、实行科学评价必须做好的工作。只有建立科学的分数量表才能更科学地评价考生,更有利于高校根据招生特点和要求招收合格新生。要建立科学的分数量表,必须做好以下的工作。
4.1 科学界定考试目标、能力要求和内容范围
要想科学评价考生的能力水平和知识程度,则考试本身必须首先科学界定考试目标、能力要求和内容范围。恢复高考近40年来,经过几代人的不懈能力,高考各学科已经形成科学的考试目标,清晰的能力框架和完整的内容体系,为建立分数量表奠定了科学的基础。[7]需要指出的是,考试的能力目标特别是知识内容要求需要保持相对的稳定,这样才能使命题者掌握考试要求,积累命题经验;同时也才可以积累一定量的考生表现和统计数据,为建立分数量表提供基础数据。如果考试内容经常变动,不但分数量表的具体内容需要随时调整,也不能形成稳定考生答题数据。
4.2 建立分数调整和等值制度
目前高考报告的考生分数是当次的考试数据,由于考生群体、试题难度的变化,年度间考试分数和试题难度不具有可比性。为了建立分数量表,必须进行等值处理,使每次的考试分数可比,同时使每次的相同的考试分数都代表考生相同的能力水平和对学科知识掌握的程度。
4.3 通过大规模考试数据的分析和研究,建立分数量表
我国高考实行国家和地方的两级管理体制,教育部考试中心负责多数省份的高考命题,各省级考试机构负责组织阅卷。这就造成了命题人员了解考试要求和试题水平,但不掌握考生的答题情况,也不知道达到一本线或二本线的考生的单科考试成绩。省级考试机构掌握考生的答题情况,而且有统计数据,但不了解学科考试要求,而且其数据只是本省的数据,没有全国的数据。因此需要国家层面的命题人员和地方层面的阅卷专家组成学科专家组,相互配合,资源共享。
根据我国高校录取中分为重点、一本、二本、三本、专科的层次要求,对总分为150分的语文、数学、英语,从60分开始,每15分一档,共6档;对总分为300分的文综、理综,可以从120分开始,每30分一档,共6档。这样的划分基本满足了不同层次高校的录取要求。在一个学科建立分数量表时,首先选取要统计的分数档次,然后大规模抽取该分数档考生的答卷,记录、分析其答题情况,确定其能够完成的工作,然后经过统计,确定多数考生的表现情况,建立该档考生的分数量表。对其他各分数档进行同样的工作,就可以建立该学科完整的分数量表。
4.4 高校提出明确的招生要求,有效利用考试分数
作为高考分数的直接使用者,高校招生不但要有一本线、二本线的要求,在此基础上,还应该对各招生专业提出明确的学科能力要求,例如一本院校中文专业其对语文的要求应该为最高一档或第二档,即语文分数不应低于135分或120分,或者具体的分数要求如132分或125分;二本院校的电子、无线电、计算机等专业对数学的要求应该为第二档,或不低于第三档的要求,即数学分数不应低于120分或105分。进一步,还可以对文科综合或理科综合中的单科成绩提出要求。这样就能进一步提高招生质量,招收到适合本专业培养的学生,可以尽量避免出现新生入学调换专业的情况,避免因为不能坚持学习而退学的情况。
《中共中央关于全面深化改革若干重大问题的决定》提出“加快推进职业院校分类招考或注册入学”、“逐步推行普通高校基于统一高考和高中学业水平考试成绩的综合评价多元录取机制。”[8]目的就是更好地贯彻党的教育方针,全面实施素质教育,促进学生全面而有个性地发展。把更多学习的选择权交给学生,有助于激发他们的学习兴趣、挖掘学习潜能,有助于学生自我发现专业性向、合理规划学习及发展方向,引导他们全面而有个性的发展。同时,高校可以根据办学特色和学科专业的要求提出对报考本校考生学业水平考试成绩的要求,有助于高校选拔适合自身培养要求的学生,有助于高校及学科专业办出特色,实现多样化发展。因此建立高考分数量表将是科学评价考生,有利于高校选拔的重要技术措施,需要下大力气,集合各方面的专家深入研究,取得突破。
[1]陶敏力.考试分数的解释[J].重庆师范学院学报,1986(2):99-103.
[2]郝若平.试论常模参照侧验与标准参照测验[J].山东教育科研,1995(4—5):141-143.
[3]罗莲.告别“标准参照测验”和“常模参照测验”的二元划分[J].中国考试,2007(6):18-22.
[4]柳博.ACT考试概观:分析与启示[J].北京师范大学学报(社会科学版),2012年增刊,148-152.
[5]www.act.org/standards.
[6]李勇.美国大学入学考试ACT与SAT比较研究——基于命题的视角[J].北京师范大学学报(社会科学版),2012年增刊,153-158.
[7]任子朝,陈昂.高考能力考查与内容改革创新研究[J].课程·教材·教法,2013,33(10):88-93.
[8]中共中央关于全面深化改革若干重大问题的决定[M].北京:人民出版社,2013:43-44.
Scientific Interpretation and Utilization of Scores in College Entrance Examination: The ACT Score Scale Review
REN Zizhao,CHEN Ang&SHAN Xufeng
Although College Entrance Examination is a selective examination,there is some value to studying the data analysis and interpretation system of standardized tests.The benefit of studying the standardized tests includes applying theory,analyze deeply and accurately the examination results and test-taker’s responses.Beneficial results include a better understanding of the status of the individual in a group,of the meaning of the test scores, and of the knowledge level and ability development of the test-takers,resulting in more reasonable evaluation of the individual.Further benefits include helping higher education institutions to develop accurate and deep evaluation of the academic capability and talents of the students so that the institutions could recruit students that are better prepared and more suitable for the subjects in college.The ultimate goal is to improve selection of the talented and education of the needed.
Examination Results Interpretation;Score Scale;College Entrance Examination Reform
G405
A
1005-8427(2015)11-0043-6
任子朝,男,教育部考试中心,研究员(北京 100084)
陈 昂,男,教育部考试中心,助理研究员(北京 100084)
单旭峰,男,教育部考试中心,副研究员(北京 100084)