河北
此次有幸为教学考试杂志社命制阅读理解原创试题,深深感受到高质量的团队研发能够带动每个成员理论和实践水平的双重提升。试题的每一个细节都被放大、被探讨。呈现在人前的不过是5篇阅读、20道题而已,可是,期间运用了多少理论作为标尺、修改了多少轮次、过程中淘汰了多少废品,只有命题者知道。看不见的劳动过程、不计成本的付出,让我几次觉得自己不是在出题,根本就是在“孵题”。
——题记
《2018年普通高等学校招生全国统一考试大纲(总纲)》指出:“普通高等学校招生全国统一考试是合格的高中毕业生和具有同等学力的考生参加的选拔性考试。高等学校根据考生成绩,按已确定的招生计划,德、智、体全面衡量,择优录取。因此,高考应具有较高的信度、效度,必要的区分度和适当的难度。”
信度是指使用同一试卷或两个平行试卷对考生重复测验时,所得测验分数的一致性和稳定性程度。效度是指考试有效性或正确性的质量指标,考试效度的高低反映着考试是否达到了它的预定目的,是否考了要考的内容,题目的设置是否真实地反映了考生的综合能力。信度和效度的测评较为复杂,需考虑到命题、分值占比、考试过程、评分过程等多种因素。
区分度是试题区分不同水平受试者的程度,即考出学生的不同水平,把优秀、一般、差三个层次的学生真正区分开来。区分度的常用公式:区分度= 2(高分组平均分-低分组平均分)÷总分。 例如阅读理解试题满分40,高分组平均分36,低分组平均分 28,则区分度为 2×(36 - 28)÷40 = 0.4。在标准化测验时,通常选取370个被试者作为预测样本,以27%作为分组标准,使高分组和低分组恰好各100名。区分度值越大,区分效果越好。试题的区分度在0.4以上表明此题区分度很好,在0.3~0.39之间表明此题区分度较好,在0.29以下表明此题需要修改或淘汰。难度指试卷的难易程度。常用难度计算公式:难度系数=试题平均得分/试题满分,或难度系数=正答人数/参加考试总人数。就高考来说,难度以适中为宜,单个试题的难度以0.3~0.7之间为好,整卷难度以0.5~0.6之间为最佳。
仅就命题过程而言,必要的区分度、适当的难度和试题效度是命题者必须关注的三个方面,其中效度是广大高中教师比较陌生的术语。本次在为教学考试杂志社命制阅读理解原创试题的过程中,笔者对阅读理解试题的效度进行了大量探索,做法粗浅,但感悟颇深。
选材,作为试题命制的第一步,是所有后续工作的基础。材料本身对阅读理解试题甚至整张试卷的信度、效度、区分度和难度起着控制性的作用。影响阅读材料效度的因素主要包括表面效度和内容效度。
表面效度是指测试应达到的卷面标准。影响阅读材料表面效度的因素主要有词汇量、词汇难度、语法句式覆盖面、语篇逻辑复杂程度。
1.词汇量
首先要注意阅读材料的词数。《考试说明》要求:第一节不少于900词,第二节约300词。但是,高考真题阅读材料到底多少词?近年变化趋势如何?原创模拟试题应该将阅读材料和设题分别控制在多少词才能与高考真题保持一致?这些问题都需要有准确的答案。如果模拟题中阅读文本的词数明显少于或多于高考真题词数,势必影响考生的作答时间,进而影响模拟题的信度和效度。依据教育部考试中心发布的《高考试题分析》,2016—2017年全国卷阅读理解的词数见下表:
2016—2017年全国卷阅读理解词数统计表
笔者对2018年全国卷阅读理解的词数进行了统计,具体如下:
2018年全国卷阅读理解词数统计表
在本次原创命题的过程中,笔者依据以上数据,遵循“替换词与原文写作风格保持一致、删除冗余信息以避免材料臃肿、补充必要信息以提升材料完整度或逻辑综合程度”的三个原则,对阅读理解文本进行了数次打磨,最后阅读文本总词数确定为1451,试题词数为541。
2.词汇难度
研究表明,读懂生词率3%的读物用时是生词率低于1%的读物的2倍时间,生词率5%的读物用时高达5倍,生词率7%的读物则可达到9倍。由此可见生词率对阅读文本效度的影响之大。原创模拟试题的生词率太低或太高都会偏离高考。为保证阅读材料的表面效度,笔者参照近年的高考真题,对纯生词量、同根词超纲词量、标注汉语注释生词量和不标注汉语注释生词量均做了严格把控。
3.语法句式覆盖面
语篇所含语法知识和句式的综合程度和难度对阅读材料的效度影响很大。所以,在选择阅读材料时,笔者注意选取语法知识丰富、互补的语篇。
如笔者选取的A、B两篇阅读材料包含了介词短语作后置定语、非限制性定语从句、插入语、状语从句等语法项目。那么,针对其余篇目,笔者就注意选取具有其他语法句式的阅读材料,如省略句、反问句、特殊句式、名词性从句等。必要时笔者对文章进行了适度修改,以避免考生因为某方面语言知识的擅长与否而影响其成绩的信度。
4.语篇逻辑复杂程度
首先需要指出的是,语篇逻辑的综合性不只是通过标志性逻辑词或逻辑性强的长句来体现。在研读高考真题的过程中笔者发现,高考真题中不管是说明文还是记叙文,即使从单个句子的角度来看长句不是很多,但上下句之间、段落之间的逻辑关系非常强。例如2015年全国卷Ⅰ七选五阅读:
Trust is a learned behavior that we gain from past experiences.36 . Trust is a risk.
B. It is putting confidence in someone.
译文:信任是我们从过去的经历中习得的行为,把信赖赋予某个人是有风险的。
这三个句子尽管很短,却存在着两种逻辑关系:1、2句为释义关系。2、3句为因果关系。
高考真题中类似不用逻辑标志词,但逻辑关系紧密的语段其实非常多。教育部《普通高中英语课程标准(2017年版)》将思维品质列入英语学科核心素养,将其界定为“思维的逻辑性、批判性、创造性方面所表现的能力和水平”。随着2017年版《课程标准》的深入落实,思维逻辑性在阅读理解选材和命题中越来越重要。因此,本次命题中,笔者特别注意选取了没有标志性逻辑词,但语段逻辑性非常强的语篇。
内容效度是指材料内容是否考了或多大程度地测试了《考试大纲》所规定的考试内容。本次原创命题,笔者特别从两方面确保阅读材料的内容效度。
1.题材和体裁
《考试大纲》在“考试目标与要求”中对阅读理解的题材和体裁做了具体说明:“要求考生能读懂书、报、杂志中关于一般性话题的简短文段以及公告、说明、广告等,并能从中获取相关信息。”
命制原创试题是一次钻研并实践语言测试学和《考试大纲》的创作过程。当理论以严苛的数据形式出现,选材必然挑剔得超乎寻常。浏览了英国、美国甚至澳大利亚、印度的数十家网站之后,笔者最终选取了不同题材和体裁的原味语篇作为命题素材。
2.科学性
在媒体发达的时代,网络资源很多,其中不乏博人眼球的虚假报道。为了不以讹传讹误导学生,在选材的时候,要时刻警惕,淘汰虚假新闻,查实可用材料。
在选择记叙文的时候,笔者第一眼就被一篇笔法独特的有关人与宠物龟的短文所吸引。该文以出售为目的,但全篇没有一个 sell, promote, buy, purchase 之类的词,更多的是以叙事笔法情文并茂地描述了人龟互动的情节,这样的手法为检测考生的分析推断能力提供了上佳机会。
为了确保原文作者对于自家宠物的描写属实而非虚夸,笔者查阅了近万词的关于宠物龟的相关资料,不但查实了文中对于宠物龟的生活习性、成长过程的描述,而且大胆删除了原文中乌龟具体年龄的信息,生成了一道以“Which of the following correctly describes the turtle?” 为问题、以“He is naughty and young.”为正确选项的推理判断题。这样,既避免了由于阅读材料效度不足,造成命题表面化,影响试题效度和信度,又将购买者需要分析出的信息和出售者所给予的信息通过试题进行匹配,考查学生的思维品质,体现学科核心素养,符合《普通高中英语课程标准(2017年版)》的导向。
为保证命题效度,达到模拟作用,在本次原创命题中,笔者特别遵循了以下两个方面的原则。
以《2018年普通高等学校招生全国统一考试大纲(英语)》和《普通高中英语课程标准(2017年版)》为宏观指导,以近3年高考真题为具体参照,确保原创命题与近年高考真题的相符度,并符合2019年高考变化趋势。
《2018年普通高等学校招生全国统一考试大纲(英语)》一直强调:阅读是我国考生学习和使用外语的最主要途径,因此,阅读理解在试卷中占权重较大。考生应能:1.理解主旨要义;2.理解文中具体信息;3.根据上下文推断单词和短语的含义;4.根据所读内容作出判断和推理;5.理解文章的基本结构;6.理解作者的意图、观点和态度。
《普通高中英语课程标准(2017年版)》中“立德树人”“学科素养”等导向性热词彰显了高考英语科命题的文化和思维方向。
结合以上方向性的指导,笔者在命题过程中特别注意语篇逻辑考查方面的设题,避免只考语言知识不考思维品质。努力做到“细节题精细化、逻辑题综合化、错误选项干扰性强”。
如A篇关于Knight棒球俱乐部比赛的消息公告:Second, congratulations to all the juniors on the Semi Final(半决赛) of April 20.
You played a great game of baseball in front of a large crowd at Ringwood. Well done to all, thanks to all the supporters and especially to Dylan, Anne & Melinda and Doug for the coffee! Although the result didn’t fall our way, we showed great spirit, sportsmanship and skill. Good luck to the Ringwood team this week.
如果设题为:Who won the Semi Final on April 20? 就必然成为一道二选一的简单推理判断题,学生只需找到“Knight”俱乐部队和“Ringwood”队就很容易作出判断。 反复思考,笔者设题为“What can we learn about the baseball match?”,此问法需要学生扩大逻辑思考范围。再将选项设置为:
A. Anne performed well in the Semi Final.
B. The Final will probably be held this week.
C. The junior baseball players won the Semi Final.
D. The Ringwood team was out of luck in the Semi Final.
这样,学生不但要推断出Ringwood team 赢了半决赛,而且要通过段落的最后一句推断出决赛将在本周举行。
在关于emoji产生和发展的一篇说明文中,针对文中“苹果手机上市之初由于没有表情包等功能在日本不畅销”的信息,笔者设置问题“What probably discouraged Japanese mobile users from iPhone?”,初设答案为:
A. That it didn’t include favorite functions of Japanese.
B. That it didn’t work automatically in Japanese.
C. Its outdated technology.
D. Its high price.
尽管选项相对工整,但笔者总觉得其直白浅陋。而且,that引导主语从句的知识点出现的选项过于突出知识,弱化了对思维品质的考查。经过再三打磨,最后将选项更改为:
A. The high price.
B. The outdated technology.
C. The absence of some functions.
D. The disappointing download speed.
这样的改动,将汉语的动宾结构“没有日本人喜欢的某些功能”转换成英语的名词短语“the absence of some functions”,弱化了语法知识且使选项的长短更趋一致,避免学生根据选项长短猜测答案,利于保证考试的效度和信度。
最后,需要补充的是,考试与教学是教学过程中相辅相成的两个组成部分。考试对教学过程的反拨效应不容忽视。考试命题,如果科学合理、与高考真题高度一致,可以促进教学过程效益的最大化,反之,可能误导教学。命题考试,值得更多人用更多精力进行更多探讨。