人才选拔的关键在于选拔理念与技术的统一
——“强基计划”面临的技术困境及破解思路

2020-01-19 05:35杨琦蕙王玉梅
湖南师范大学教育科学学报 2020年6期
关键词:应试命题考查

周 序,杨琦蕙,王玉梅

(1.北京师范大学 教育学部,北京 100875;2.厦门大学 教育研究院,福建 厦门 361005)

2020年1月14日,教育部发布了《关于在部分高校开展基础学科招生改革试点工作的意见》(以下简称《意见》)。《意见》决定自2020年起,不再组织开展高校自主招生工作,而是改为在部分高校开展基础学科招生改革试点,聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域,以及国家人才紧缺的人文社会科学领域,为国家重大战略领域输送后备人才。由于招生对象集中于基础学科,因而被称为“强基计划”。

已经实施多年,甚至一度成为“网红”的高校自主招生考试,为什么会被“强基计划”取代?“强基计划”应当被视作自主招生考试的“升级版本”,还是一个完全不同的新方案?我们又应该如何看待“强基计划”的初衷及面临的挑战?对上述问题进行深入辨析,有利于高校人才选拔工作的顺利推进。

一、为什么要提出“强基计划”

现有关于“强基计划”的评论,多建立在对自主招生考试的批判之上。例如:有的自主招生高校的考核评价不够科学规范,“将高中生的论文、发明专利、奥赛成绩作为入围门槛或降分录取依据的做法,引发了高中教育的许多‘功利性’做法”[1];以个人提交材料作为审核依据,给考生特长造假留下了空间,导致个别高校的自主招生腐败[2];自主招生考试制度在执行过程中“被有的人钻了空子,异化为家长之间人脉、关系和社会资本的较量,为了帮助子女获得‘敲门砖’,一些家长在论文发表、专利获取等方面不遗余力。一件原本应该考生自力更生的事情,不少时候都环绕着‘拼爹’的背影”[3]。平心而论,上述批判的确说到了自主招生考试的痛处,但要把弄虚作假、招生腐败等罪名都扣在自主招生考试制度之上,指责“都是自主招生惹的祸”,却也并不公允。在历史上,类似的情况可以说是司空见惯。早在汉朝时候,“举孝廉”的措施便导致了“富者乘其财力,贵者阻其势要,以钱多为贤,以刚强为上”的局面[4];明太祖朱元璋“罢科举不用”的尝试带来的是“所举者多名实不称,徒应故事而已”的结果[5]。即使是在今天,保送生制度也导致了“送官不送民”的情况[6];甚至浙江高考还出现过航模加分者多为领导干部子女的腐败现象[7]……自主招生考试中出现的弄虚作假、招生腐败等问题并非该制度“首创”,不过是众多人才选拔实践中的普通一例而已。

尽管并非个例,但如果将招生舞弊视作人才选拔的孪生兄弟而不加控制,必然会招致反对。早在科举时期,我们就有了“一切以程文为去留”的说法。统治者也会对科举考试中的徇私舞弊行为予以严厉的处罚,例如清朝几场较大的科场案中,多名主考官被革职、流放,乃至处斩[8],表明了封建统治者对招生舞弊现象的痛恨。今天,考试作弊入刑的规定甚至被纳入刑法修正案当中,依法处置高考作弊行为已经上升到了保护“国家权威与公民权利的法治价值”的高度[9],可见追求公平、杜绝弄虚作假始终是改革的主旋律。可以说,招生考试既和腐败相伴而生,但也带有对腐败与生俱来的排斥。

在追求高考公平的大环境下,保送生制度、中学校长实名推荐制及自主招生考试制度,要么出现了招生腐败的丑闻,要么面临着徇私舞弊的质疑;然而另外一些高考改革举措,像3+X改革、不分文理高考、春季高考、网上阅卷等,虽然也毁誉并存,但很少听说这些改革举措会导致腐败。于是我们就要问:那些容易带来徇私舞弊的人才选拔方案,有没有什么特质、共性因而使得利益相关者有漏洞可钻?这些漏洞又能否避免?

我们发现,凡是容易导致弄虚作假、腐败舞弊的人才选拔方式,都带有较强的主观性。例如:保送生制度并没有一个判断学生是否达到保送资格的明确标准,因而谁能被保送谁不能被保送,往往由班主任的主观判断来决定,相较于客观标准,此时老师的个人意愿就会在决策中占据上风;中学校长实名推荐制也可能导致校长想推荐谁就推荐谁的情况,因为落选者永远无法证明“我在化学上的造诣比被推荐者在物理上的成就更好”,以至于有人质疑“信校长不如信考分”[10]。可见,一种人才选拔方式,如果缺失了客观、刚性、可见、可比较的标准,那就容易成为迎送往来、滋生腐败的温床,也使得结果与目标背道而驰。自主招生考试虽然并没有完全排除掉统一高考,但其初衷是为了给“有学科特长的学生开辟一条特别通道”[11],因而其本意就在于打破“分数面前人人平等”的束缚。大家对自主招生的关注也不在于“我能在高考中获得多少分”,而在于在高校考核时“能否出奇制胜”“能否展示出与众不同的特色”,以至于高中生发表过多篇学术论文之类的“拼爹”现象层出不穷[12]。即便是那些家庭资本不够雄厚、无“爹”可拼的学生,也会把他们的大部分时间和精力“都放在某一门学科竞赛辅导上,而放弃其他教育教学内容的学习,由此扰乱了宁静的教学环境,扰乱了高中学生的学习”[13]。说到底,人才选拔过程中的种种乱象,要么是因为跳出了高考分数的限制(如保送生制度),要么是因为高考分数未能扮演足够重要的角色,使得较强的主观性主导了选拔结果(如自主招生、中学校长实名推荐制)。从这个意义上看,我们一直批判的“唯分数论”,其实是守卫高考公平、减少招生腐败的重要原则。

而“强基计划”则不同。虽然它也有高校考核、综合素质评价等主观性的评价内容,但一方面它将学生的选拔放在高考分数公布之后进行,以便让学生首先关注的是自己的高考成绩——如果成绩不高,连参加“强基计划”选拔的资格都没有;另一方面,它要求高考成绩在参加“强基计划”选拔的学生的总成绩当中所占比例不得低于85%,从而凸显了统一高考优先的理念,能够避免自主招生带来的学生集中精力发展某方面的才能而战略性放弃其他学科的现象。因此,如果说统一高考虽然公平公正但具有“唯分数论”的弊端,自主招生在“不拘一格降人才”方面有所突破但却影响了人才选拔的公平性,那么“强基计划”则是站在了二者之间,既通过突出高考分数的重要性来保障公平,也力求通过高校考核、综合素质评定等来避免“高分低能”的现象,只不过在二者之间,更倾向于“保障公平”。一如《意见》所说,要把“促进公平公正”作为“强基计划”的指导思想和原则。

二、“强基计划”可能面临的问题

“强基计划”的初衷可嘉,但如果计划得不到很好的落实,那未免令人遗憾。《意见》强调:“强基计划”旨在“招收一批有志向、有兴趣、有天赋的青年学生”,而衡量方式为高考成绩+高校综合考核结果+综合素质评价情况,其中高考成绩所占比例不低于85%。志向、兴趣和天赋,虽可以通过高校综合考核来考查,但考核结果的可信度未必高。为了获得录取名额,原本不打算学习数学的学生可以在综合考核的时候介绍自己从小有志于数学,对人工智能不感兴趣的学生也会力陈自己对人工智能兴趣颇大。而综合素质评价由于存在着优势阶层和重点学校偏好[14],同样无法对考生的志向、兴趣和天赋进行合理衡量。因此,在录取中占据比重最大的高考分数,也必须肩负起衡量考生对于基础学科的志向、兴趣和天赋的职责。从理论上讲,学生的志向、兴趣和天赋,与高考分数之间存在着密切的联系。一个学生如果有志于某个领域,或对某个学科的兴趣较浓,或者在该方向的天赋较好,那么一般该学科的考试成绩也相对更高。但在现实当中,我们却无法排除“高分低能”案例的存在,甚至这种分数高,但并无志向、兴趣不大或者天赋一般的学生可能还大有人在。虽然“强基计划”试图通过补充高校综合考核结果与综合素质评价,来对分数这一衡量指标进行“中和”,但事实上,当一个学生高考分数高但综合考核与综合素质得分较低,或者高考分数低而综合考核与综合素质得分却比较高的时候,我们很难判断这个学生究竟是不是属于志向明确、兴趣浓厚、天赋突出的那一类,这自然就会影响人才选拔的科学性与公平性。造成这一问题的根源,就在于高考分数未必能对一个学生的基础知识掌握水平、专业兴趣和学习天赋进行准确衡量。

当然这一问题并不是随着“强基计划”的提出才浮出水面的,而是可谓“历史悠久”“影响深远”。早在唐朝,科考生员为了在诗赋、文章的比拼中脱颖而出,不肯钻研经史,从而导致了“先圣之道,湮郁不传”的局面[15]。这种情况甚至贯穿了整个科举制度的始终,以至于到了清朝,学子读书依然是“不根柢讲求……圣贤精义全无发明……经济实学,乃向来士子多不留心”[16]。直到今天,诸如“高分低能”“纸上谈兵”“百无一用是书生”之类的说法,也时常被用来形容那些考试分数虽然高,但却没有真才实学的人。这种说法绝非情绪化的“吐槽”。陈彬莉对高三“补习班”学生的研究发现,要让这些复读的学生在一年之内提高考试分数,复读班教师最常用的做法就是“在这一年之内培养学生的应试能力,也就是答题的方法和技巧,这个题怎么答,这个角度怎么入,遇到这类题怎么办,这都是技术,需要他们在这一年之内掌握”[17]。当学生们醉心于答题技巧、解题套路的时候,他们便可以依靠娴熟的应试技术在高考中获得高分,即使他们的综合能力难以令人放心。“高分高能”者固然不少,但“高分低能”却也并非个案,而且带有相当的普遍性。

凡是通过分数高低来评判的人才选拔方式,都面临着仅靠分数难以衡量一个人的真才实学、综合素质的问题。“强基计划”自然也不例外。虽然历年来的高考改革都试图在这方面有所突破,但总体上是雷声大雨点小。例如:历年高考的《考试大纲》大都规定,高考语文应考查考生的识记、理解、分析综合、鉴赏评价、表达应用和探究六种能力;高考数学则应考查数学概念、性质、法则、公式、公理、定理,以及由其内容反映的数学思想方法等内容。但在教学实践中,语文老师自有途径让不擅文学鉴赏的学生在“阅读鉴赏”题目中获得高分[18],数学老师也有办法让不知“导数”为何物的学生解答出关于“导数”的题目[19]。因而,无论是鉴赏评价也好,数学概念也罢,学生的能力都无法通过高考分数真实地反映出来。其他学科面临的局面也相差无几。于是,我们便不难理解,为什么不少一线教师纷纷呼吁“注重应试技巧训练”[20],加强“常规解题思路和通用方法的训练”[21],强调选择题的“选法”[22]和计算题的“算法”[23],甚至不惜让学生形成程序化而非个性化的思维方式[24]……一切以“综合能力”“综合素质”为考查对象的高考试题,在极致化、精细化发展的应试策略面前都显得苍白无力。

高考既要考查学生的知识掌握情况,还要衡量学生的能力素质,这属于高考“考什么”的问题。自恢复高考以来,旨在让高考从“考知识为主”变成“考能力优先”的改革措施络绎不绝。但无论是大范围实施的3+2、3+X、3+3,还是个别省份尝试的3+1+1、3+3+基础会考、3+文科基础/理科基础+X等方案,都有一个共同之处,即在不同科目的组合及各自所占比例上进行调整,这类改革措施可以在宏观上调节学生花在不同科目上的学习时间和精力。例如:当3+2改为3+文理小综合的时候,原本得不到关注的地理、生物便获得了和政治、历史、物理、化学同等的地位;当广东省推行3+文科基础/理科基础+X方案的时候,由于文科基础中含有30%的理科题目,而理科基础中含有30%的文科题目,因此无论文科生还是理科生,都必须将部分精力放在自己并不擅长的科目上。但是,这些改革并不能带来教师教学方式和考生备考方式的变化。无论是3+2的年代还是3+X的时候,死记硬背始终是考生备战高考的首位选择,唯一的区别不过是死记硬背的内容从历史、政治两科变成了“文科综合”而已。虽然3+X试图考查考生的“综合能力”,但实际上它能够检测出来的往往只是考生对“综合知识”的记忆情况,以及答题技术的熟练程度,而非真实的“综合能力”。这表明,我们面临的问题在于人才选拔理念和技术之间还存在着不小的差距。理念是考查“阅读鉴赏能力”,但技术上考生却可以通过“模板”“套路”来应对;理念是考查“数学概念的理解情况”,但事实上考生可以在并未理解概念的情况下通过“模仿”“步骤”来答题;理念是用分数来衡量“能力”,但技术上分数却往往无法客观反映能力的真实水平。

当人才选拔理念与技术之间的差距始终未能弥合,当“偏才”“怪才”在高校录取中不再受到青睐,当我们为了纠正自主招生的弊端而在“强基计划”中重提高考分数的重要性的时候,我们就有理由质疑:通过高考分数选拔出来的,究竟是真正在基础学科上有志向、有兴趣、有天赋的青年学生,还是一群只会考试的机器?秉持“分数优先”原则的“强基计划”,究竟能在多大程度上做到“强基”,能有几许希望落到实处?如何才能避免“强基计划”重蹈“唯分数论”“高分低能”的覆辙?

三、“强基计划”的出路何在

如果说“分数面前人人平等”是高考公平的基石,不可撼动;而对分数的追求却又容易导致学生片面应试、机械学习、关注应试技巧而非自己的真才实学,那么,高考改革在这里似乎就陷入了死胡同。在“不患寡而患不均”的社会传统中,试图让高考改革放弃公平原则,或者让公平不是通过分数这样的客观指标来体现,而是依靠“人人心中都有一杆秤”的主观评判,无疑都不太现实。因此,唯一的出路就在于:努力使分数体现出来的是一个人的综合能力强弱而不只是知识水平或应试技能的高低,以缓解学生通过片面应试、机械学习来进行备考的现象,从而降低出现“高分低能”的概率。

如何才能选拔出真正在基础学科上有志向、有兴趣、有天赋的青年学生?

高考语文要考查考生的理解、分析、鉴赏、应用等能力;数学要考查数学概念、公式、定理及其背后的思想方法等内容……这些都属于“考什么”的问题。哪些考查内容所占比例更大,哪些内容是新增的考查范围,反映出我们持有什么样的人才选拔理念。但在“考什么”之后,还有“怎么考”的问题,即我们的人才评价手段和技术,究竟能否将人才选拔理念落实到位,考出我们想考的东西。拿一篇八股文来考学生的经世治国之道,无疑是牛头不对马嘴,我们对科举考试的批判也多集中于此。虽然从理论上讲,一个人也可能以八股文的形式表达他的治理方略、表现他的管理才能,但事实上科举时期的考生普遍并未选择这一理想化的道路,而是纷纷通过“但取近时科举中选之文讽诵摹效”[25]、“窃取他人之文记之”[26]、“猎取诡异之词”以“敷衍成篇”[27]等措施来应对。可见,当命题技术无法满足人才选拔理念的需求时,各种应试策略、答题技巧便有了发挥作用的空间。考生未必会通过提升自身能力素质的方式来获取分数,这就容易造成能力强弱与得分高低不成正比的状况。

今日高考之科学性、严谨性虽远非昔日科举考试可比,但也不是无懈可击。考生可能看懂了英语阅读理解的原文却不认识题目四个选项中的关键词汇,由此这道题目考出来的就是考生的词汇量大小而非阅读理解能力;考生有时候明明可以用图像叠加的方式判断出函数图像中x等于几y可以取最大值,但题目却不是选择题或填空题,而是一道要让学生写出解题过程的计算题,那么这道题也就不可能考出考生的抽象思维、抽象运算能力。有人研究了我国高考英语阅读题目的设置,发现我国高考英语阅读理解试题的阅读材料句式较长、语法较难、生僻词较多,阅读材料比SAT、ACT考试更难,但根据测量理论,依靠增加阅读材料难度来提高试题难度、区分度的方式并不可取[28]。无论是从实践经验还是从学术研究来看,我国高考试卷的命题技术落后于考试理念都是不争的事实。但回顾历年关于考试的研究,命题技术得到的关注一直都远低于考试理念[29]。这也导致理念与技术之间的脱节非但未能弥合,反而有进一步加大的趋势。

因理念与技术脱节而导致的“高分低能”问题,其实就是试卷的效度低。衡量一套试卷的科学性有很多指标,一线师生更关心难度如何,阅卷者则更看重区分度是否合理,但效度这一指标往往不在公众的关注范围之内,甚至绝大部分公众都不知道效度为何物——就算一份试卷效度很低,但它最多考不出能力高低,只要不会影响录取的公平公正,就大可不必放在心上。在学术界关于高考试卷效度的研究中,有观点认为目前高考试卷的效度很高,但这部分研究均存在着校标的选择不恰当的问题,因此其结论说服力不足[30];而与之相反的研究结论,如高考语文试题引出的行为偏离了读写行为的本质,且题目不能科学地评定学生的阅读能力[31];英语听力题目对“理解主旨和要义”“理解说话者的意图、观点和态度”的考查不足[32],“阅读技能的考查没有完全反映考试说明和课程标准的要求”[33];综合科目“选才有效性最低”[34]等,反倒更值得重视。

因此,提升高考试卷的效度,使其“能够测出来的”和我们“希望它测出来的”相一致,就成为当务之急。当我们希望“强基计划”能够选拔出对基础学科有志向、有兴趣且有一定的知识积累的学生时,高考试卷就应提升涉及上述内容的题目的效度,努力使高考分数能够真实地反映出考生在上述指标方面的状况,而不只是应试技能技巧的高低。这只有通过加强高考命题技术改革才能实现。

通过应试技巧来获取分数,比依靠提高能力来获取分数更高效,更被广大师生接受,这是因为我们的高考试题在命题上有规律可循。例如:有生物老师发现,在“近几年的高考中,考查自由组合定律的试题屡见不鲜,命题人往往围绕这几个问题来命题:有关配子的计算问题、有关基因型的计算问题、有关表现型的计算问题、子代对亲代的推断问题”[35];也有老师钻研了高考作文话题的命题规律,预测下一年“高考话题作文的十大走向,并结合教学实践,对新课程标准下的作文备考提出了针对性的建议”[36]……诸如此类的情况,绝非个案。中学当中的“教研组”,普遍被异化为“考研组”[37],研究的核心问题不是如何教学,而是高考命题的思路、方向,以及应对策略。“考研组”的经验总结、研究结论,为答题的策略、思路和方向提供了依据。于是,各种各样的答题模板、套路大行其道,一线教师甚至可以有针对性地选择某些解题技巧让学生进行强化训练,从而酿成了“题海战术”。而这一切归根结底就在于高考的命题技术还不够精细,容易被应试技术所破解,从而让广大考生趋易避难,更多地注重应试技能技巧的训练而不是真实能力的提升。

通过命题技术的革新,来让应试策略失去作用,在这方面我们其实是有经验可循的。1999年高考作文,毫无征兆地打破了多年来议论文一统天下的局面,改为了话题作文,这让很多事先准备好议论文“模板”的考生措手不及。那些平时写作功底较强、文采更好的学生便展示出了写作能力上的优势,获得了更高的分数。可见,当命题技术革新,让应试技术失效的时候,我们才能真正考查出学生的能力水平。“强基计划”希望选拔出在基础学科上有兴趣和志向、有一定的知识和能力基础的学生,也就应当通过命题技术的革新,来破解考生掌握的应试技术,从而使考生的分数符合他们的真实能力水平。也就是说,革新命题技术,可以倒逼一线师生不得不以提升能力作为教学的核心。

命题技术的革新,绝非“一次性工程”。当1999年高考实行话题作文之后,针对话题作文的研究便如雨后春笋般地涌现,话题作文的“写作套路”也被开发了出来。有老师总结出概括法、形象法、引用法、问题法、符号法、口语法、文言法等多种话题作文的拟题技巧,甚至还针对“幸福”“批评或表扬”等话题列出了数十个“好题目”供学生选用[38];也有老师告诫学生,最好在话题作文题目的前面“设置一段有效的引语”,并详细介绍了引语的写作技巧[39],从而为话题作文提供了一种“套路”。当一线教师对命题技术的破解不遗余力时,我们对命题技术的革新就不是一个“完成时”,而是始终要作为“进行时”。

与此同时,革新的命题技术,不仅仅是求新的,更是高阶的、让应试者的应试技巧无法施展的。近期,“假如贾宝玉得了新型肺炎,最可能被传染的5个人会是谁”的语文阅读题走红网络[40]。这道没有标准答案的题目,不仅是在考学生对《红楼梦》内容的熟悉程度,而且调动了考生的联想和思考,可以避免考试中应试技巧掩盖真实能力的情况发生。分数的组成一部分在于记忆,而另一部分则留有可自由发挥的空间,也就留有了能力划分的可能。以高阶的学习任务带动低阶的学习活动,这种人才培养和人才评价的能力综合化导向,便有可能倒逼基础教育不再把知识拆分成一个一个的廉价柜台式知识点——因为这样无法再在考试中获得高分。对于“强基计划”而言,这样一种考查模式更能带动学生的健康发展,也更有可能选拔出符合需要的人才。

总而言之,革新了命题技术,让高考命题技术始终走在应试技巧的前面,让一线师生始终抓不到命题的特征和规律,从而无法依赖于套路、经验和模板,那么提升学生的真才实学、综合能力就成了获取高分的唯一途径。教师无法再要求学生“固化思维”以熟悉某种答题套路,而是得鼓励学生“脑洞大开”;也不能再提供答题模板供学生遵循,而是只能培养学生的分析能力、综合能力以便让学生给出有见解、有针对性的答案。当我们的命题技术达到了这样的高度,虽然分数还是选拔人才的最重要指标,但却不用再担心“高分低能”的问题。到了这个时候,“强基计划”或许便能选拔出真正符合国家需要的、有能力的人才。

猜你喜欢
应试命题考查
2021年高考《选修3—4》考点预测及应试策略
创新视角下高考中关于统计的考查
创新视角下高考中关于统计的考查
体育课“大翻身”须警惕陷入“应试”误区
例谈氯及其化合物的学习与考查
分析磁场应试中的四个易错点
钒及其化合物在高考中的考查
错别字先生
2012年“春季擂台”命题
2011年“冬季擂台”命题