摘要:澳大利亚高校招生考试具有多科目选考、“总分录取”的特点。各州的考试制度略有不同,以新南威尔士州较为典型。其计分体系包括高中毕业证书考试(HSC)计分和澳大利亚大学入学排名(ATAR)两个部分。主要特征包括:一是使用专家意见与数理统计相结合的方法多次调整原始分,并通过量表化科学地解决了不同选考科目之间的可比性问題;二是高校根据考生排名录取考生,合理地解决了总分录取中“分分计较”问题。其为我国新高考计分改革关键问题的解决,提供了可供参照的样本,具有较高的借鉴意义。
关键词:澳大利亚;高中毕业证书考试;大学入学排名;新高考;计分
澳大利亚是一个联邦制国家,各州的高考制度略有不同。其中新南威尔士州高中毕业证书(HighSchoolCertificate,HSC)较好地体现了科学性和公平性,得到社会的广泛认可。HSC考试相当于中国的高考,是由新州教学委员会组织的对高中毕业生进行的一项水平考试。[1]澳大利亚新南威尔士州“高中毕业证书”考试一共有86个科目,只有英语必考,其余全部为选考科目,考生可以根据需要任意选择科目参加考试。其中数学和35种语言科目中还包含不同难度的分科考试。与此相对应的计分体系,有效实现了人才的科学选拔,在保障考生选择权利、服务高校招生方面发挥了关键作用。研究澳大利亚高校招生计分体系有助于改进我国高考选择性科目考试计分方式,对回应新高考“怎样科学地选拔人才、怎样公平地选拔人才、怎样高效地选拔人才、怎样发挥选拔人才对基础教育的积极导向作用”[2]等问题,具有重要的理论与现实意义。
(一)HSC考试概况
自1967年起,HSC考试即提供了28个科目的1~3级课程供考生选择。1976年课程改革后,在1977年出台了“考试成绩*50%+中学评估成绩*50%”的分数合成标准。[3]考生需要完成预备课程后,通常在12年级才能开始学习相应的HSC课程。大多数HSC科目为2个单元,当前要通过高中毕业证书考试,考生必须完成至少12个预备课程单元和10个HSC课程单元(包括英语)的学习。
新南威尔士州教育标准管理局(NSWEducationStandardsAuthority,NESA)开发或认可的科目是HSC考试重要的组成部分。NESA开发的科目可以直接作为澳大利亚高等教育入学排名(AustralianTertiaryAdmissionRank,ATAR)的依据,主要包括英语、数学、科学、技术、创意艺术、健康和体育、人类社会及其环境、语言、职业教育与培训等。其认可的科目,则不能作为ATAR排名的依据。[4]
高中毕业证书考试鼓励考生根据兴趣特长、职业发展等需求自主选择科目。考生至少要完成12个单元的初步学习和10个单元的HSC学习。这两个模块的要求如下:6个单元的开发科目;2个单元的英语科目;3门课程(2个或更多单元);至少4个科目。[5]新南威尔士州从2020年开始实行HSC最低识字和数学标准。该标准设置在澳大利亚核心技能框架(ACSF)的第3级,HSC考生需要在阅读、写作和数学这三个领域达到HSC最低标准。[6]
(二)HSC计分与校准
HSC考试中一门科目通常为2学分,个别扩展科目(Extention)为1学分,学生一般选择总计10~13学分的科目参加考试,取10学分成绩较好的科目计入总成绩。HSC成绩是“校本学习测评”和“课程考试”的分数组合。其中,“校本学习测评”分数是以学校为主体而非外部机构组织,对学生表现进行评价,主要包括测试、书面或口头作业、实践活动等内容,学校在每门课程中为每个学生提交HSC测评分数。“课程考试分数”显示了该考生在HSC考试中的表现,考试内容包括书面试卷,部分科目还包括口语考试等内容。每个考生的成绩都会根据既定的标准进行评估和报告。[7]
HSC成绩的组成主要包括:“高中最后一年学校成绩”(50%)和“统考成绩”(50%)两个部分。学校成绩包括学校自主命题的课堂考试、写作和演讲、手工、实地操作、艺术类作品等,一年四个学期各考核一次。为解决不同学校之间成绩评定的可比性问题,需要对每个学校提交的原始成绩进行校准。其依据是以HSC考试成绩调整校本学习测评成绩,其参照系是“参加全州HSC考试的同一门科目的统一考试成绩”。在校准的过程中保持考生在本校的排名顺序不变,分数调整以后考生之间的分数差距与原始成绩的分数差距尽量保持相似。每个学校的测评分数都是根据同一组的考试成绩进行的。这个过程保持了学校组内考生的排名和相对差距(图1)。
成绩校准主要遵循以下三个条件:一是校本学习测评的平均值调整为“等于该组考生课程考试成绩的平均值”,即等于这些考生参加HSC考试分数所得的该科目的成绩总分与平均分;二是最高分被调整为等于该组中的任何考生获得的最高考试分数;三是最低分等于组内任何考生获得的最低考试分数。[8]
(三)HSC考试等级与划定程序
HSC考试根据预设的标准衡量考生的表现,其目的是为确保某一考生的成绩不受到其他考生的影响。HSC分数分为若干等级,每个等级与该考生在相应分数范围内的典型表现描述一致。原始分数与NESA使用的标准和报告分数相匹配。值得注意的是,英语(高级)和英语(标准)的等级是通用的,可以直接比较。而其他科目之间的成绩无法直接进行比较。具体等级如表1所示。
考试结果和评分标准每年都有差异,HSC考试使用“标准设置”程序匹配成绩和分数报告量表,并通过分数校准方式使其在同一个尺度内可以进行比较,以实现考生成绩和能力表现年度之间的可比。标准为每个等级设定了期望值,HSC考试共有六个等级,每个等级概述了其所需的知识、技能和理解能力。等级6和1分别代表最高水平和最低水平。專家委员会负责人建议一组分数或“评委”决定每门考试的最低分数线(cut-offscore),以达到相应的成绩标准,临界分数划定主要涉及四个阶段(表2)。[9]
澳大利亚各州有着不同的高中毕业证书考试,为方便大学招生,大多数州考生(昆士兰州除外)的成绩都会折算成ATAR供高校参考。ATAR不是指具体的分数,而是考生的分数在全澳同届考生当中的排名位置。HSC分数和ATAR分开计算,是两个不同的衡量标准。HSC分数衡量考生的学业表现,而ATAR则将考生列入整个七年级的群体。
ATAR主要是根据HSC成绩进行转换。在新南威尔士州,ATAR由大学招生中心(TheUniversitiesAdmissionsCentre,UAC)计算和发布。UAC使用HSC成绩来计算澳大利亚大学入学排名(ATAR)考生的排名顺序。该排名是一个介于0.00和99.95之间的数字(0.05的最小增量),表示考生相对于所有在七年级开始上高中的考生的排名。ATAR80.00意味着考生处于前20%的7年级组(非12年级组)位置,平均ATAR通常在70.00左右。
其他州与新南威尔士州的ATAR相当。新南威尔士州85.00的ATAR相当于其他州85.00的ATAR,各大学分数线指的即是ATAR分。如某大学某专业的分数线是95.65,就意味着考生要取得95.65的ATAR。
(一)量表化HSC分数
HSC考试存在约27000种不同的选考组合。由于不同科目分数之间缺乏可比性,考生在不同科目中的排名不一定具有相同的含义。因此,需要通过量表化(scaling)程序进行分数转化。其基本原则是“对考生而言,选择一种科目组合而不是另一种组合,应该既没有优势也没有劣势”;其算法假定是“如果所有考生都选考所有的科目,考生的分数应该是多少”。
在新南威尔士州,ATAR是基于10个ATAR科目单元中的量表分的总和,包括以下要求:一是2个单元的英语成绩;二是8个单元的选考科目成绩,其中可以包括不超过两个单元的B类科目;三是考生必须完成至少四门科目才有资格申请ATAR。
考生的量表分(非HSC分数)主要用于计算考生的ATAR。较高的HSC分数并不总是能够转化为较高的ATAR。事实上,对于大多数科目,考生的量表分往往低于其HSC分数。考生在某一科目中的量表分将受到其他考生的位置以及该科目量表分平均值的影响。下面的例子说明一组HSC分数和量表分,对应于每个科目的第90百分位的结果(表3)。
在量表化过程中,主要使用了AMS(Averagemarksscaling)方法将不同科目的HSC分数进行调整,以在统一的测量尺度下实现可比。[10]“社会和文化科目”为HSC分数的最高分,经过“量表化”之后,其得分为选考科目的最低分(英语为必考科目)。根据ATAR“必考科目(2个单元)+4个科目(8个单元)”共计10个单元的计算规则,该科目将不能参与到ATAR的计算过程中。[11]
(二)ATAR的计算流程
假定考生在这一科目中排名的位置取决于其“发展能力”和“竞争实力”,由于ATAR是一个反映学术成就的等级,因此“竞争力”是根据选择这一科目考生的整体学术成就来定义的,如图2所示。
在量表化之前,将线性变换应用于每个科目中的原始HSC分数,以将最高分设置为共同值。然后将每个科目中的分数以一个单位为基础,以平均值25和标准差12进行标准化。量表化首先调整每个科目的平均值、标准差和最高分数。然后对个别考生的分数进行调整,得出量表分。虽然量表分通常与原始分不同,但科目内的考生排名不会改变。原始分数量表化后,总分被用于计算ATAR资格,并以此确定符合ATAR资格的考生。在多数情况下,基于量表化总分的排序或优先顺序与使用基于HSC分数的总分的顺序是不同的。
最后根据澳大利亚统计局的数据将这些百分位数相对于加权年龄群体进行排序。在澳大利亚7年级至12年级为中学阶段,没有严格地区分初中与高中,但一般认为11年级与12年级是为大学入学准备的两年,因此这个序列反映的是五年前的7年级的排名。人口百分比从99.95开始以0.05的间隔截断。每个ATAR对应于一系列总分,每个ATAR的考生数量也会有所不同,部分取决于多少个候选人的总体。逻辑函数的具体形态取决于目标人群中符合ATAR条件的考生参与率。锚点频率是分配给99.95类别的数字N。最高类别应该包含目标人群的1/2000,因为所有最有能力的候选人都将学习12年级并申请ATAR。其使用的logistic模型为:
logPj1-Pj=a+bxj
其中NPj是ATARXj考生的目标频率,Xj少于99.95。
量表分并不假定一个科目本质上比另一个科目困难,或者考生的素质总是相同的。所有在某一年完成至少一门ATAR科目的考生都将被纳入该年度的排名。计算量表分的具体方法包括:数据验证、合并科目、标准初始化、计算量表化均值和标准差、设定量表化最高分、量表分、分数合成、计算ATARS、确认ATARS、公布ATARS等步骤。[12]
(三)ATAR在澳大利亚高校招生中的应用
澳大利亚高校在招生过程中为每门科目设置最低ATAR,已被考生广为接受,并且作为国家认可的入学依据。ATAR最高为99.95%,如果一个考生的ATAR排名是90%,表示这名考生的成绩在所有考生中排前10%。90%以上考生的比例也是衡量一所学校学术水平的标准。
ATAR是澳大利亚高校录取的重要参考,但并不是衡量考生潜力的唯一方法。澳大利亚高校普遍为申请人提供了一些替代途径,试图在考虑学习成绩的同时兼顾其他因素。如悉尼大学提供了未来领袖计划、百老汇计划、精英运动员和表演者计划等,使考生能够根据教育背景、经济水平以及选择考试科目的动机,有针对性报考。部分专业2017年入学ATAR录取线,如表4所示。[13]
我国高考自设置选择性科目以来,采用过原始分、标准分、调整分、等级赋分等多种计分方式,其选考科目之间的可比性问题一直是学术讨论的焦点。[14][15][16][17][18][19][20]作为世界上大规模选拔性考试之一,澳大利亚高校招生考试计分体系有着成熟的运行经验,能够为解决我国高考选择性科目考试计分问题提供可借鉴的样本与经验。
一方面,为实现我国新高考不同选考科目之间“可比”的计分设计提供方法上的参考。相关理论研究认为“基于假设总体的量表化”(ScalingonHypotheticalPopulation)和“基于锚测量的量表化”(ScalingtoAnchor)两类方法可以实现不同选考科目之间的可比。[21]“澳大利亚大学入学排名”与我国“香港中等文凭考试”分别采用这两类方法应用在选考科目的可比性设计中。新高考的统考科目设置为语文、数学、外语三科,其中外语包括若干选考语种,具有选考科目的性质,故公共科目为语文、数学两科。与我国香港中等文凭考试有四门公共科目(语文、英语、数学、通识教育)相比,新高考公共科目作为校准依据能否准确反映考生的一般能力水平,学界尚存在争议,有待于进一步研究。澳大利亚大学入学排名中使用的“基于假设总体的量表化”方法,有效规避了使用公共科目校准选考科目成绩的风险,在仅有一门必考科目的条件下实现了选考科目之间的可比,能够为新高考选考科目之间分数可比性的技术完善,提供有益的方案借鉴。
另一方面,为合理运用高考“总分录取”招生政策,避免“分分计较”提供了新的解决思路。长久以来,我国高考实行“总分录取”的招生政策,尽管该政策在江苏“08方案”①中有所突破,但改革经验表明,“非总分录取”模式在当前环境下尚不成熟,实际操作中尚缺乏有效的资源配置手段,高校自主确定录取标准所需的配套机制尚无法充分协调。“总分录取”的招生条件限制,进一步放大了新高考的分数合成问题、选考科目之间的可比性问题等。在新高考改革试点中,统考科目以原始分报告成绩、选考科目以“等级赋分”的方式进行分数合成,无论是在考试性质还是在分数报告形式上,都存在进一步讨论的空间。澳大利亚高校招生考试中使用的ATAR排名以“分数”形式呈现,高校根据“分数”高低设置不同的录取标准。该招生录取方式在形式上与我国高考“总分录取”的考试传统相类似,能够满足“分数面前人人平等”的社会心理,对提升“总分录取”的政策执行成效提供了改进思路。
面向未来,新高考要求计分设计需要进一步增强与其他政策的协调性,凸显出与选拔人才的要求相协调、与考试科目设置改革相协调、与录取方式改革相协调的改革逻辑,进而实现高考科学、合理选拔人才的首要功能。同时,应进一步提高计分体系的社会认可水平,以维护高考的公信力和权威性,维护教育公平。
注释:
①江苏“08方案”是指江苏省为配套2005年秋季开始的课程改革实验,2006年公布并在2008年实施及后期进行微调的高考改革方案。文科类考生与理科类考生都需要参加选修测试科目2门、必修测试科目4门,共6门学业水平测试。历史、物理分别作为文科类、理科类考生选修测试科目的必选科目;6门学业水平测试科目中,考生选定的2门选测科目之外的4门为必测科目。选测科目各科满分为120分,采用统考成绩与选考科目成绩并列报告的方式,按考生原始分成绩排名划出六个等级。
参考文献:
[1]一帆.澳大利亚新南威尔士州高中毕业证书考试(HSC):时间与内容[J].教育测量与评价(理论版),2016(2):22.
[2]袁振國.在改革中探索和完善具有中国特色的高考制度[J].华东师范大学学报(教育科学版),2018,36(3):1-12+166.
[3]NSWEducationStandardsAuthority.HistoryoftheHSC[EB/OL].[2017-08-06].http://educationstandards.nsw.edu.au/wps/portal/nesa/11-12/hsc/about-HSC/history-off-the-HSC.
[4]NSWEducationStandardsAuthority.HSCCourses[EB/OL].[2017-05-16].http://educationstandards.nsw.edu.au/wps/portal/nesa/11-12/hsc/about-HSC/hsc-courses.
[5]NSWEducationStandardsAuthority.AdviceforStudentsChoosingHSCCourses[EB/OL].[2017-02-09].http://educationstandards.nsw.edu.au/wps/portal/nesa/11-12/hsc/subject-selection.
[6]NSWEducationStandardsAuthority.WhatistheHSCMinimumStandard?[EB/OL].[2017-01-17].http://educationstandards.nsw.edu.au/wps/portal/nesa/11-12/hsc/hsc-minimum-standard/what-is-the-standard.
[7]NSWEducationStandardsAuthority.UnderstandingHSCResults[EB/OL].[2017-08-06].http://educationstandards.nsw.edu.au/wps/portal/nesa/11-12/hsc/results-certificates/understanding-results.
[8]NSWEducationStandardsAuthority.Moderation[EB/OL].[2017-09-12].http://educationstandards.nsw.edu.au/wps/portal/nesa/11-12/hsc/about-HSC/moderation.
[9]NSWEducationStandardsAuthority.DeterminingHSCResults[EB/OL].[2017-09-12].http://educationstandards.nsw.edu.au/wps/portal/nesa/11-12/hsc/about-HSC/determining-HSC-results.
[10]TertiaryInstitutionsServiceCentre.AverageMarksScaling[EB/OL].[2017-12-15].https://www.tisc.edu.au/static-fixed/statistics/misc/average-marks-scaling-2015.pdf.
[11]UniversitiesAdmissionsCentre.HowYourATARisCalculated[EB/OL].[2018-01-20].https://www.uac.edu.au/future-applicants/atar/how-your-atar-is-calculated.
[12]UniversitiesAdmissionsCentre.ATARTechnicalReport[EB/OL].[2017-11-15].https://www.uac.edu.au/assets/documents/atar/atar-technical-report.pdf.
[13]TheUniversityofSydney.2018ATARsforourcourses[EB/OL].[2018-04-15].https://sydney.edu.au/study/admissions/apply/entry-requirements/undergraduate-academic-requirements/atar-explained.html.
[14]張令魁,谭以奉.改革高考分类、科目设置与计分比例的建议[J].人民教育,1984(3):15.
[15]黄恕伯,刘志敏,刘同胜,宁革.广东省高考计分方法改革的设想[J].中国考试,2005(7):41-45.
[16]温忠麟,罗冠中.高考方案:考试方式与计分方式[J].中国考试(研究版),2008(3):3-8.
[17]韩裕娜,高凌飚.高考A+X科目方案的计分方法研究[J].上海教育科研,2008(11):53-56.
[18]刘志敏,刘同胜,宁革,黄恕伯.新课程高考选考科目计分方法研究[J].中国考试,2010(11):3-8.
[19]张磊.高考原始计分与标准计分的逻辑比较[N].中国教育报,2017-01-19(003).
[20]王森.新高考选考科目计分问题与政策调适[J].复旦教育论坛,2018,16(6):89-95.
[21]王森.新高考选考科目计分机制改进研究[J].教育科学,2018,34(2):14-20.
(责任编辑陈志萍)