杨志明 陈一龙 朱素珍
高考是一种典型的选拔性考试,其区分度受到大众的广泛关注。若区分度不够,会造成大量重分的问题,影响高考的人才选拔功能。不过,不少人对高考区分度的评价并不准确。有人认为作文题目的区分度不够理想,因此在语文和英语考试中应当压缩作文题目的分量;也有人认为只要题目出得好,任何题型都可以取得良好的区分度,并因此给命题人员提出一些不切实际的要求,给考试命题以及中小学教学等带来了一定的负面影响。如何正确评价高考试题区分度?区分度不够理想的题型是否应该削减其分量?中学教师如何根据不同题型的区分度特性改进自己的教学?为了回答这些问题,本文以某省新高考落地实施前后两年的高考英语考试数据为例,对其中的作文题进行区分度分析,以期为优化命题和改进教学提供一些有益的信息。
区分度分析主要包括题目和试卷两个层面的测量学分析。
在经典测验理论(classical testing theory,CTT)中,题目区分度被定义为总体的某个代表性考生群体的题目得分与测验总分的相关系数。其中,对于多级计分题目,一般使用斯皮尔曼(Spearman)积差相关系数;对于二级计分题目,一般使用点-二列相关系数。
题目区分度有时候也使用鉴别指数D 来定义,即在某道题目上,高分组考生群体的通过率PH与低分组考生群体的通过率PL之差的1/2。其中,高分组和低分组一般由代表性样本中总成绩最高的27%和总成绩最差的27%的群体构成,题目通过率可以是代表性考生群体中答对该题的人数与考生总人数之比(0/1 二级计分题目),或者为代表性考生群体在该题目上的平均得分与题目满分之比。
在题目反应理论(item response theory,IRT)中,题目区分度表现为题目特征曲线(item characteristic curve,ICC)在其拐点处切线的斜率。现以双参数logistic 模型为例,其数学模型公式如(1)所示,其相应的ICC 如图1 所示。
图1 双参数logistic模型的题目特征曲线(ICC)
其中,Pij表示考生j答对题目i的概率,D=1.7,ai为题目i 的区分度,bi为题目i 的难度,难度取值的理论范围通常设定为[-3,+3]或[-4,+4]。
在图1 中,纵坐标为考生答对题目的概率,横坐标为考生能力水平(θ),题目难度被定义为题目特征曲线拐点的横坐标值(b),曲线拐点切线的斜率被定义为题目的区分度(a)。
具体来说,基于IRT 框架的题目区分度指的是考生在曲线拐点附近答对题目概率的变化情况。区分度(a)值越大,ICC曲线越陡峭,表示该题目在曲线拐点附近区分考生水平的能力越强,反之则区分考生水平的能力越弱。例如,图1 中左边两条曲线拐点相同,但曲线的陡峭程度不同,说明这两道题目的难度相同(其b值都为-1),但区分度不同,曲线更为陡峭的题目区分度更大。
值得说明的是,根据IRT 理论,每道题目仅仅对能力水平与题目难度接近的考生具有最大的区分度,对能力水平远远高于或远远低于题目难度的考生而言,题目的区分度会很小。因为当考生能力水平远远高于题目难度时,绝大部分高水平考生能作答正确,这时的题目区分度会趋近于0;同理,当考生的能力水平远远低于题目难度时,绝大部分低水平考生基本上会作答错误,这时题目的区分度也会趋近于0。也就是说,针对不同能力水平的考生,同一道题目的区分度是不同的。而CTT 则认为,同一道题目对所有能力水平的人的区分度是相同的。这正是CTT“先天不足”和IRT独特优点之所在。
与题目层面的区分度概念不同,在评定试卷或某个题型的区分度时,一般使用代表性考生样本得分的离散程度——试卷得分的差异系数(coefficient of variation,CV)作为评价指标,其公式如(2)所示。
使用公式(2)评估试卷或题型区分度的好处是可以对分值不同的题型或科目的区分度进行直接比较。
现代教育测量学理论(如IRT)已经证明,同样一道试题对不同能力水平的人具有不同的区分度。难题往往可以有效区分出顶尖水平的考生,为一流高校选拔学生提供有力支持;中等偏易的题目往往可以有效区分出能力水平较低的考生,为高校淘汰不合格者提供精准信息。因此,评价一道题目或一门考试的区分度是否恰当,需要围绕考试目的展开,部分题目适合于为一流高校选才,部分题目适合于为普通本科院校选才等,抽象地讨论区分度并无实际意义。也说是说,一道题目或一次考试的区分度是否恰当,取决于考试的目的。
高考英语作文题的区分度分析可以采用CTT公式分析法和题目得分分布分析法来进行。由于缺乏题目层面的作答反应信息,所以本研究中的区分度分析无法采用基于IRT模型的方法。
根据CTT理论,本研究选取某省2020 年(新高考落地实施前一年,采用的是“3+综合”模式)和2021 年(新高考落地实施之年,采用“3+1+2”模式)高考英语作文题进行区分度分析。
表1 示意该省2020 年高考英语试卷中的短文改错和书面表达题型,以及2021 年高考英语试卷中的应用写作和读后续写题型的区分度估计值,即题目得分与测验总分的斯皮尔曼积差相关系数。
由表1 可知,无论是新高考落地实施后的2021 年,还是新高考落地实施前的2020 年,该省高考英语作文题目的区分度都相当不错。这说明该省高考英语作文题不存在区分度不够高的问题。同时,通过比较该省2020 年和2021 年的高考英语作文题,发现2020 年的书面表达题型和2021 年的应用写作题型的区分度稳定在0.80 左右,而短文改错题型和读后续写题型的区分度稳定在0.88 左右。这个结果表明,若要提升英语作文题的区分度,可尝试保留短文改错题型,同时多用读后续写题型。
表1 某省新高考落地实施前后两年高考英语作文题区分度估计
若使用差异系数评估这两年该省高考英语作文题目的区分度,则可以得到如表2 所示结果。
表2 使用差异系数评估的某省高考英语作文题区分度
由表2 可知,在这两年高考英语试卷中,区分度最好的作文题型是短文改错,差异系数为64.25%;其次是读后续写题型,差异系数为56.87%;书面表达和应用写作题型的差异系数比较接近,分别为36.97%和38.11%。这个结果与表1 得到的信息完全一致。
进一步分析该省2020 年高考英语短文改错题(满分10 分)和书面表达题(满分25 分)的得分分布情况,结果如图2 和图3 所示。
由图2 可知,短文改错题型对各种能力层次的考生都具有一定的区分度,但有很多考生(78082 人,约占本研究样本的21.68%)在这种题型上仅仅得了1~2 分。(参见图4)这可能意味着英语水平很低的考生无法发现并改正短文中的错误。
图2 某省2020 年高考英语短文改错题得分分布
由图3 可知,书面表达题型仅仅对中上水平的考生具有较好的区分度,而且阅卷教师的给分具有明显的趋中特征。如图5 所示,大约有45%的考生得分介于16 分到21 分之间,得16~17分的考生最多。与书面表达题型不同,考生在短文改错题型上的得分趋中特征并不明显。(参见图4)由图5 可知,考生在书面表达题型上得低分的人数也比较少(仅有27622 人,约占本研究样本的7.67%)。这说明,无论水平高低,考生在书面表达题上只要动笔了就可以拿到相应分数;短文改错题则不同,考生如果不懂就会“颗粒无收”。
图3 某省2020 年高考英语书面表达题得分分布
图4 某省2020 年高考英语短文改错题得分关键点
图5 某省2020 年高考英语书面表达题得分关键点
2021 年,该省高考英语作文的题型更新为应用写作(满分15 分)和读后续写(满分25 分)题型,其得分分布如图6 和图7 所示。
由图6 和图3 可知,该省2021 年高考英语应用写作题型与2020 年高考英语书面表达题型的得分分布比较接近,都仅对高水平考生具有一定的区分度,并表现出明显的趋中趋势。由图6 和图8 可知,在2021 年英语高考中,大约有45%的考生在应用写作题型上的得分介于10 分到13 分之间,得10~11 分的考生最多。另外,由图7 和图9 可知,考生在读后续写题型上得分的趋中趋势不如书面表达题型明显。
图6 某省2021 年高考英语应用写作题得分分布
图7 某省2021 年高考英语读后续写题得分分布
图8 某省2021 年高考英语应用写作题得分关键点
图9 某省2021 年高考英语读后续写题得分关键点
值得一提的是,2021 年高考英语试卷中的读后续写题型与2020 年高考英语试卷中的短文改错题型的得分分布有些类似,都有较多的考生几乎没有得分。其中,读后续写题型中共有61581 名考生(约占本研究样本的18.00%)仅得了1~2 分。这表明,相对来说,短文改错和读后续写题型能更好地区分考生。这或许是因为英语水平很低的考生可能无法识别并改正文本中的错误,也可能是因为低水平考生无法用准确的句子表达清楚一个观点或一件事情,还可能是因为低水平考生的英语思维能力没有得到较好的发展等。
针对上述高考英语作文题区分度分析的结果,笔者可以展开如下讨论。
根据真实数据的测量学分析,某省新高考落地实施前后两年的高考英语作文题区分度介于0.79 到0.89 之间,这个结果说明英语高考作文题目具有较高的区分度。换句话说,高考英语作文题能够很好地区分考生,基础扎实和综合能力强的学生基本上能得高分,基础知识积累不够和综合能力较弱的考生则很难得到高分。
这个结论带来的教学启示是:要提高学生的英语成绩,首先要重视英语写作教学,而不能局限在背诵单词和刷题,更不能局限在根据“内容”“结构”“词句”和“卷面”等评分框架的角度做“应试”训练。高中英语教师应采取切实可行的办法,加强学生英语基础知识的学习和巩固,并根据课程标准和学科素养模型,有意识地培养学生的语言能力、思维品质、文化意识和学习能力4 个学科素养。[1]过早根据评分标准所参考的“内容”“结构”“词句”和“卷面”4 个方面进行反复刷题训练,其效果必然是事倍功半。
事实证明,在新高考中增加读后续写题型,能有效提升高考作文题的区分度。数据表明,高考读后续写题型的区分度达到0.88 左右,这是十分了不起的表现。之所以有这么高的区分度,可能是因为读后续写题型同时兼顾了理解能力和表达能力的考查,完全符合二语习得中的“输入假说”[2]和“输出假说”[3]理论。事实上,读后续写题型兼具开放性和客观性试题的优点,不仅能考查学生的英语基础知识和英语能力,而且能考查学生语言背后的高阶思维能力,包括分析性思维、批判性思维和创造性思维。这显然会给各种英语水平层次的考生带来一定的挑战,从而表现出良好的区分效果。
由读后续写题型的良好表现可以得到的启示是:一方面,在今后的高考英语作文命题中,可以加大读后续写题型的使用力度,以保证英语作文考试的良好区分效果;另一方面,中学英语教学需要加大英语名著的阅读力度,扩大语言的“输入”数量和质量,同时加强英语名著的读后续写训练,使学生逐渐领悟英语写作的技能技巧,用“输出”倒逼“输入”,提升学生的英语写作水平。英语名著中有大量优秀的情境描写、环境描写、心理描写、动作描写等内容,提供了丰富的语言使用的准确性和得体性案例,为学生的英语写作通过模仿过渡到创新提供了有效的途径。此外,若能在“输入”和“输出”的训练中有意识地发展英语思维能力、领悟文化差异,定能提升学生的英语水平和学习能力,自然也能提高学生的英语成绩。
根据前文的数据分析可知,应用写作题型的区分度虽然也不错,达到了0.80 左右的水平,但与读后续写题型0.88 的区分度水平相比,还是存在一定差距。应用文写作是高中英语教学的重要内容,是学生语言表达能力和思维能力的综合体现。很多英语教师总结了一些常用应用文写作的方法和格式,并指导学生进行了大量的练习。这也在一定程度上造成教师阅卷时出现审美疲劳,给四平八稳的作文往往打上一个趋中的分数,从而降低了这种题型的区分度。
针对应用写作题型的这种表现,要想提升区分度,可以考虑进一步优化高考英语作文评分规则,打破目前的按模式答题的局面。建议参照《中国高考评价体系》[4-5](下文简称“高考评价体系”)和《中国英语能力等级量表》[6-7](下文简称“CSE 量表”),按照“四模块五维度”的框架[8-9],优化评分规则。高考评价体系把高考所要求的内容分成了必备知识、关键能力、学科素养和核心价值4 个层次。CSE 量表把英语必备知识分成了4 种,包括语法知识、篇章知识、功能知识和社会语言知识;把关键能力分成了5 个维度,包括理解能力、表达能力、语用能力、语言使用策略和翻译能力。若在作文评分准则中同时兼顾高考评价体系、CSE 量表以及课程标准、学科素养等方面的要求,则能破解套路作文的困局,减轻得分趋中的程度,提升应用写作的区分度。具体细则的研发可能需要通过标准设定或常模研发等手段,通过实验验证等方式给予确认。
前文的区分度分析结果表明,高考英语短文改错题型具有较好的区分度,达到了0.88 的水平。因此,在新高考中若放弃短文改错题型,则有些可惜。从教育心理学角度看,识别错误并改正错误,需要学生具有非常扎实的英语基础知识、良好的英语理解能力和表达能力。短文改错题中设置的错误往往来自英语语法知识(包括词汇、短语、惯用法等)、篇章知识、功能知识和社会语言知识,涉及语言能力、思维品质、文化意识和学习能力4 种英语学科素养。因此,短文改错题型可以非常全面地考查到学生的英语知识和能力,放弃这种题型可能不是最优选择。
笔者认为,在高中英语教学活动中,教师不必刻意设计大量的错误试题让学生练习,学生也不必在记住正确内容的同时,费神费力去记住各种错误,这样可以减少学生把正确内容与错误内容记混淆的风险。如果教师和学生所讨论的问题全是正确的内容,学生就比较容易形成正确的语言感觉,当遇到短文改错题型时,学生只要把没有感觉的内容剔除,就能得到正确的答案、使用恰当的词汇和句子。
前文的数据分析表明,书面表达题型的区分度也达到了0.80 左右的水平,但相对于读后续写题型来说,这种题型的区分度还有较大提升空间。书面表达是一种能够充分考查学生语言综合运用能力的题型。长期以来,英语书面表达题型的写作要求已经被广大师生所掌握,学生也进行了大量的书面表达练习,这在一定程度上造成了阅卷教师的审美疲劳,考生“循规蹈矩”的文章只能得到一个十分平常的分数,这也是书面表达题分数趋中的一个原因。从这个意义上看,在新高考中淘汰这种题型的做法值得肯定。
笔者认为,英语教师应该从夯实英语必备知识、提高英语关键能力和提升英语学科素养等方面着力,提高学生的语言综合运用能力。具体操作办法还需要理论联系实际,总结出科学有效的办法并得到实际工作的验证之后再进行推广应用。
总之,高考英语作文题具有良好的区分度。其中,短文改错和读后续写题型的区分能力相对更强,而书面表达和应用写作题型的区分能力稍弱,并出现了比较明显的分数趋中情形。要提升应用写作等题型的区分度,可参照CSE 量表、高考评价体系以及课程标准等的要求,进一步优化现行的英语作文题目评分规则。要提高学生的英语写作水平,需要加强英语语法知识、篇章知识、功能知识和社会语言知识的教学,让学生多读英文名著并进行读后续写训练,培养学生的理解能力、表达能力、语用能力、翻译能力和语言使用策略,提升学生的语言能力、思维品质、文化意识和学习能力。