王家义 王心 孙凤桃
【摘要】阅读理解在大学英语四、六级考试中占有重要比重,其难度的控制情况直接影响到四、六级考试的信度和效度。本研究通过统计字词句数量、超纲词比率、Flesch Reading Ease指数和Flesch-Kincaid Grade Level指数等手段评价近十年(2007-2017)大学英语四、六级阅读语篇难易度。结果表明,四级阅读语篇的难度整体上小于六级阅读语篇,体现了四、六级考试不同要求对阅读语篇难度上的差异,符合预期。但历次考卷之间存在着一定的波动,且个别场次的波动过大,一定程度上影响了考试的信度和效度。本研究对四、六级阅读语篇选材和命题具有一定的参考价值。
【关键词】阅读语篇;易读性;四、六级考试
【作者简介】王家义(1977- ),湖南工程学院外国语学院副教授,研究方向:翻译学、语料库语言学;王心(1997- ),湖南工程学院外国语学院英语专业学生;孙凤桃(1996- ),湖南工程学院外国语学院英语专业学生。
一、引言
大学英语四、六级考试自1987年开始实施,是衡量我国大学生英语水平的重要标准,因此也成为了企业选拔人才的重要尺度之一。作为世界上最大的单科考试,大学英语四、六级考试大纲和题型经历了数次调整,但阅读理解的比重一直是最大的,凸显了其重要性。作为标准化语言能力测试,其信度和效度至关重要。因此,命题者会尽量控制其难度在基本相当的范围。本研究以近十年(2007-2017)大学英语四、六级真题的阅读语篇为语料,通过统计字词句数量、超纲词比率、Flesch Reading Ease指数和Flesch-Kincaid Grade Level指数对大学英语四、六级真题的阅读语篇难易度进行测量。
二、英文易读性的测量
易读性(readability)亦称可读性、易读度,指文本易于阅读和理解的程度或性质。易读性的研究对于阅读理论和阅读教学具有重要的意义,也因此引起了众多语言教学和研究者的关注。从20世纪20开始,国外学者就开始了英文易读性的研究。经过多年的努力,已经开发出了上百个易读性公式(readability formulas),比较知名的有:Flesch Reading Ease和Flesch-Kincaid Grade Level,Fry,Fog,Dale-Chall,Smog,Spache等。易读性公式主要通过定量的方法对文本的难易程度进行测定,本质上是用代数方程式来量化文本因素与易读性之间的关系。因此,大部分的可读性结果都以公式的形式来表达,通常附有可读性对照表,如:Flesch Reading Ease、Fry等。众多的可读性公式因其侧重点不同也存在一些差异,如对句子长度,平均音节数,熟悉词汇等影响语篇章的可读性因素权重方面的考量。另一方面,不同程式设计者在研发时所使用的样本材料不尽相同,不同公式的适应范围也就存在着一定的差异,其效度、精确度、计算难度和适用范围各不相同。虽然存在上述情况,有学者认为,就阅读材料本身的易读性而言,上述程式仍是目前最客观、准确、经济、实用的预测手段。
三、研究设计
1.研究问题。为了考察大学英语四、六级阅读语篇难度,我们提出如下问题:
(1)大学英语六级阅读语篇难度整体上是否大于四级阅讀语篇难度?
(2)不同真题中,大学英语四级阅读语篇是否存在难度差异?
(3)不同真题中,大学英语六级阅读语篇是否存在难度差异?
2.语料来源。本研究所选语料为近十年(2007-2017)大学英语四、六级真题的阅读语篇。为了准确测量语篇难度,我们剔除了其中文注释、数字题号、ABCD选项题号等干扰因素,仅保留阅读语篇的正文、提问问题和选项内容。
3.研究方法。我们从近十年大学英语四、六级考试真题中提取出阅读语篇,通过Microsoft Word内置Flesh-Kincar文本难度测量公式测量出字符数量、单词数量、平均单词字符数、句子数量、Flesch Reading Ease指数和Flesch-Kincaid Grade Level指数(图1)等相关数据信息,通过Roads to Academic Reading(图2)测量超纲词频率,然后进行综合对比分析。其中,Flesch-Kincaid Grade Level指数等越大,就说明其文本难度越大;Flesch Reading Ease指数越大,文本难度越小。Roads to Academic Reading是一个针对英语学习者的网站,它包含Text Profiler、AWL Sublists、Flashcards等工具,能够有效地对文本内容进行词频统计。其词频类别分为四类:类别一为BNC 1-2000词汇,是由英国国家语料库(BNC)统计的英语中最常见的两千个单词;类别二为AWL词汇,是在考克斯黑德学术词汇表(AWL)上的570个高频普通学术词汇;类别三为AWL和BNC 1-2000列表上共有的词;类别四为超纲词,即没有出现在前3个类别中的词。通常来说,同等条件下超纲词频率越高,文本的难度越大。本研究将采用超纲词比率(超纲词与语篇总词数比)考察语篇文本难度。
4.数据统计与分析。
(1)大学英语四、六级阅读语篇(2007-2017)难易度总体情况对比。表1为大学英语四、六级阅读语篇字、词、句等总体情况对比。表1中,大学英语四级阅读语篇(2007-2017)的字符数为281261,单词数为55637,单词平均字符数为4.5,句子数为3353;大学英语六级阅读语篇(2007-2017)的字符数为340389,单词数为65710,单词平均字符数为5,句子数为3666。表1表明,大学英语四级阅读语篇在字符数,单词数,单词平均字符数和句子数等指标上均小于六级阅读语篇,符合我们对大学英语四级阅读量小于六级的预期,一定程度上反映了大学英语四级阅读语篇难度小于大学英语六级阅读语篇。
Flesch Reading Ease指数、Flesch-Kincaid Grade Level和超纲词比率指数是反映文本难度的重要指标。Flesch Reading Ease指数则与文本难度成反比,即Flesch Reading Ease指数越大,文本难度越小;超纲词比率和Flesch-Kincaid Grade Level指数与文本难度成正比,即超纲词比率越高或Flesch-Kincaid Grade Level指数越大说明文本难度越大。
表2中,四级阅读语篇的Flesch Reading Ease指数为56.3,六级为49.7;四级阅读语篇的Flesch-Kincaid Grade Level指数为9.2,六级为10.4;四级阅读语篇的超纲词比率为11.8%,六级为13.6%。可见,四级阅读语篇的整体难度小于六级阅读语篇。这一结论也与表1中字、词、句总体情况的初步结论统计相吻合。本研究中四、六级阅读语篇的Flesch Reading Ease指数也与曾担任四、六级考试委员会主任的杨惠中教授(2004)的统计基本一致。在他的研究中,历年大学英语四级阅读语篇为57.7,六级为49.1。
(2)历次大学英四、六级阅读语篇难度对比。大学英语四、六级考试每年各两次,同一天进行。本研究对同批次四、六级阅读语篇(2007-2017)进行了统计。
图1为大学英语四、六级阅读语篇(同批次)超纲词频率对比。图1表明,在总共22次的四、六级考试阅读语篇中,六级有16次高于四级,说明整体上六级的阅读语篇超纲词大于四级语篇。
图2大学英语四、六级阅读语篇(同批次)Flesch Reading Ease指数对比。图2可知,四级阅读语篇Flesch Reading Ease指数19次高于六级阅读语篇。但有3次例外,分别为:2007年12月卷、2008年6月卷和2013年6月卷。
图3大学英语四、六级阅读语篇(同批次)Flesch-Kincaid Grade Level指数对比。图3可知,六级阅读语篇Flesch-Kincaid Grade Level指数21次高于四级阅读语篇,1次低于四级阅读语篇(2017年12月卷)。
图1、2、3的分析表明,除个别批次考卷外,六级阅读语篇超纲词的比率大于四级;Flesch-Kincaid Grade Level指数高于四级;Flesch-Kincaid Grade Level指数低于四级。可见,总体上六级阅读语篇难度在同批次考卷中大于四级阅读语篇。这与我们的预期也基本一致,同时也进一步验证了3.4.1的结论。
另一方面,图1、2、3也表明,无论是四级和是六级阅读语篇,超纲词比率、Flesch Reading Ease指数和Flesch-Kincaid Grade Level指数在历次考卷之间存在着一定的波动情况。个别场次的波动还很大,如2011年6月卷的超纲词比率不但在历次四级考卷中比率最大,也超过了历次六级考卷。可以推断,该次的四级考生在做阅读理解语篇时经历了很大的难词挑战。
按照Flesch Reading Ease的难度参考量表,0-30为很难,30-50为难,50-60为较难,60-70为标准,70-80为较容易,80-90为容易,90-100为很容易。依据以上标准,本研究的Flesch Reading Ease指数统计表明,四级阅读语篇难易度分为了三个区间。其中,2009年12月卷和2007年12月卷的四级阅读语篇处于“30-50”区间,等级为“难”,相当于本族语者的大学水平;2008年12月卷、2012年12月卷、2017年6月卷和2014年12月卷处于“60-70”区间,等级为“标准”,相当于本族语者7或8年级水平;其余14次卷处于“50-60”区间,等级为“较难”,相当于本族语者高中水平。六级级阅读语篇难易度分为两个区间,其中10次处于“50-60”区间的“较难”等级,12次处于“30-50”区间的“难”等级。这一结果也与Flesch-Kincaid Grade Level指数的统计基本吻合。可见,尽管四、六级考卷总体上体现了两个级别的考试中阅读语篇难度上的不同要求(如六级高于四级)。但仍然无法保证相同级别的不同考卷处于大致相同的难度区间。更令我们惊讶的是,个别批次的四级考卷中阅读语篇的难度还大于六级考卷。如2007年12月卷和2009年12卷的四级阅读语篇达到了“难”的等级,单就指数数值而言超过了17次考卷的六级阅读语篇。因此,参加2007年12和2009年12月两场次四级考试的考生会明显感觉到阅读语篇难度过大。
四、结语
不少学者提到重视四、六级考试的信度和效度问题(金艳,2006;何莲真和张洁,2008)。阅读理解在大学英语四、六级考试中占有重要比重,其难度的控制情况直接影响到四、六级考试的信度和效度。本研究通过统计字词句数量、超纲词比率、Flesch Reading Ease指数和Flesch-Kincaid Grade Level指数等手段评价近十年(2007-2017)大学英语四、六级阅读语篇难易度。研究结果表明,四级阅读语篇的整体难度小于六级阅读语篇;同批次比较中,四级阅读语篇的难度多数情况下小于六级阅读语篇。总体上体现了四、六级两个层次考试不同要求对阅读语篇难度上的差异,符合预期。但本研究的统计也表明,四、六级阅读语篇的历次考卷之间存在着一定的波动,且个别场次的波动过大,无疑将在一定程度上影响考试的信度和效度。因此,命题者在进行四、六级阅读语篇选材时既要对当次考卷中阅读语篇的难易度进行多层面测量,又要对历次考卷进行详细对比以确保阅读语篇既体现四、六级两层次上的差异又保证同层次的历次考卷之间难易程度基本相当。
参考文献:
[1]何莲珍,张洁.多层面Rasch模型下大學英语四、六级考试口语考试(CET-SET)信度研究[J].现代外语,2008(4):388-398.
[2]金艳.提高考试效度,改进考试后效——大学英语四、六级考试后效研究[J].外语界,2006(6):65-73.
[3]李绍山.易读性研究概述[J].解放军外国语学院学报,2000(4):1-5.
[4]杨惠中.从四、六级考试看我国大学生英语语言能力现状[J].中国外语,2004(1):56-60.