《全国大学英语四、六级考试改革方案（试行）》发布前后四级考试阅读语料差异性分析

2014-04-09 11:27刘娜娜

学周刊 2014年8期

刘娜娜

摘要：文章选择了部分四级阅读材料创建语料库，运用RANGE、AntConc、GoTagger等自然语言处理软件对语料进行了处理提取，并使用社会科学统计软件SPSS对数据进行计算分析。分析发现《全国大学英语四、六级考试改革方案（试行）》发布前后的四级阅读材料没有显著的差异性，但是，词汇难度有所增加。鉴于增加的词汇多为非常用词汇，建议降低该部分词汇数量。

关键词：四级阅读自然语言处理统计词汇

一、研究初衷

全国大学英语四级考试是教育部主管的全国性的教学考试，目的就是对大学生的实际英语能力进行客观、准确的测量，为大学英语教学提供服务。根据观察大连海事大学图书馆网站提供的银符考试题库B12的部分英语四级真题试卷，我们发现1998年6月到2006年1月的试卷分值为100分，2006年6月到2012年6月的试卷分值为710分。

教育部网站提供的《全国大学英语四、六级考试改革方案（试行）》指出，“自2005年6月考试（试点）起，四、六级考试成绩将采用满分为710分的计分体制，不设及格线；在考试内容和形式上，四、六级考试将加增加快速阅读理解测试。阅读理解部分比例调整为35%，其中仔细阅读部分（careful reading）占25%，快速阅读部分（fast reading）占10%。仔细阅读部分除测试篇章阅读理解外，还包括对篇章语境中的词汇理解的测试；快速阅读部分测试各种快速阅读技能。”（中国教育在线：20050325）

基于以上事实，我们搜集整理了1998年6月到2006年1月的四级阅读材料和2006年6月到2012年6月的四级阅读材料，建立了两个语料库，对比分析《全国大学英语四、六级考试改革方案（试行）》发布前后的四级阅读材料的差异性。

二、研究方法

（一）研究目的

通过语料分析，研究《全国大学英语四、六级考试改革方案（试行）》发布前后的四级阅读材料的差异性，为四级考试阅读材料的选用提供参考性意见。

（二）研究对象

本研究的对象是1998年6月到2006年1月的四级阅读材料（以下简称“语料1”）和2006年6月到2012年6月的四级阅读材料（以下简称“语料2”）。这些材料均来自大连海事大学图书馆银符考试题库B12英语四级真题题库。

（三）研究工具

本研究主要采用自然语言处理工具GoTagger、AntConc和Range对语料进行标注、抽取和对比分析，并使用社会科学统计软件SPSS对数据进行计算分析。

（四）数据的采集和分析

语料1共采集16次考试，64篇文章；语料2共采集14次考试，42篇文章。

三、结果分析

为了比较语料1和语料2的差异，我们将在词汇分布、句长频数、段长和词类分布四方面进行分析。

（一）词汇分布分析

1.类符型符比（TTR）

类符形符比可以考察语料用词的变化。类符（type）是语料库中不同的词语，形符（token）则是指语料库中所有的词形。类符形符比可以在一定程度上反映语料的用词变化情况。类符形符比越大，表明该语料覆盖的词汇量越大，反之则越少。利用自然语言处理工具AntConc，得出语料1和语料2的类符、型符数据。如下：

表1 类符型符数据比较

■

2.NATION三千词表比对

利用自然语言处理工具RANGE，得出语料1和语料2的类符、型符与NATION三千词表的对比数据。如下：

表2 NATION三千词表对比

■

表1和表2仅是提供了两个语料在类符、型符、类符型符比等方面的客观数据。为了比较二者的差异性，还需运用SPSS对其进行分析。经计算得出如下表格：

表3 词汇分布统计

■

经Mann-Whitney检验，概率值P（0.894），大于显著性水平0.05，因此语料1和语料2的单词分布没有典型性差别。

（二）句长频数比较

通过运用Search and Replace工具和Excel工具，我们对两篇语料进行了处理。语料1提取了1043个句子，语料2提取了1322个句子，并对每句话的单词数量进行了计算。一般情况下，平均句长越长，文本的句法結构越复杂；而平均句长越短，则文本的句法复杂程度就越低。句长是语料特征的一个重要方面。经SPSS计算分析后得出如下表格：

表4 句长分析

■

经Mann-Whitney检验，概率值P（0.155），大于显著性水平0.05，因此，语料1和语料2的句子长度没有典型性差别。

（三）段长比较

与句长频数一样，段落长度也是比较两个语料的重要参数。为此，我们首先统计了两个语料的段落数，并以字母为单位，计算了两个语料的段长。语料1和语料2的段落数分别是338和474。语料1的段落标准差（172.507）小于语料2的段落（222.836），段落长度更加均衡。经Mann-Whitney检验的概率值P（0.017）小于显著性水平0.05，样本变量观察值之间有显著性差异。具体表格如下：

表5 段落描述

■

表6 段长分析

■

（四）词类分布比较

实词包括名词、动词、形容词和副词。这些词反映了语料的信息承载量。为了更好地分析两个语料的差异，我们对词类的分布进行了分析。利用自然语言处理软件GoTagger对文本做完标注后，通过AntConc对两篇预料的名词、动词、形容词和副词的数量进行了提取，并做了计算分析。如下表所示：

表7 不同词性单词统计

■

表8 不同词性单词差异性分析

■

统计显示，在α=0.05，df=6时，卡方检验的关键值为7.8147，检验统计量2.418小于关键值，概率值P（0.490）大于显著性水平0.05，因此样本变量观察值之间没有显著性差异。

四、结论

为了比较《全国大学英语四、六级考试改革方案（试行）》发布前后的四级阅读材料的差异性，我们以2006年为界，对前后两部分四级阅读语料在词汇分布、句长频数、段长和词类分布四方面进行了分析。结果显示，改革方案发布前后的四级阅读语料在词汇分布、句长频数和词类分布方面没有显著性差异，仅有的区别存在于段长上。改革方案显示，新的四级阅读部分增加了快速阅读理解测试，这就解释了语料1的段落长度较之于语料2更加齐整，语料2段落长度长短不一。由此可见，改革方案发布之后，四级阅读的难度并没有显著增加。

我国大学英语课程的教学目标是培养学生的英语综合应用能力，使他们在今后的工作和社会交往中能用英语有效地进行口头和书面的信息交流。大学英语四、六级考试作为一种标准化考试，其目标就是更准确地测量我国在校大学生的英语综合应用能力，就是要对大学英语教学产生正面的导向作用，引导师生正确处理教学与考试的关系。但是，在词汇的分布分析中，尽管两个语料没有显著性差异，但是表2却揭示了一个不容忽视的事实：单词难度在增加。NATION最常用的一千个词中，语料2占40.1%，在接下里的第二个和第三个一千词中，则分别占14.8%和14.2%，较语料1都有所下降。而不在词表中的词，语料2已经上升到了30.9%。这部分词汇并不是常用词汇，所占比例却很大，无疑增加了学生的学习难度，且应用性不强。

大学英语考试目的在于测量我国在校大学生的英语综合应用能力，选用710分值标准分，可以检测考生个体原始分在整体中的分布情况。根据前述分析，若考生为了应试而掌握不常用的词汇，分数固然会升高，但并不能体现对英语的综合应用能力，考试也就难以实现对英语教学的正面导向作用。因此建议该部分词汇做大幅缩减，引导学生把注意力集中到英语的实际应用，而非应试性的记忆词汇。

参考文献：

[1]桂诗春，宁春岩.语言学研究方法[M].北京：外语教学与研究出版社， 2005.

[2]胡显耀.基于语料库的汉语翻译小说词语特征研究[J].外语教学与研究，2007（3）：214-220.

[3]刘康龙，穆雷.语料库语言学与翻译研究[J].中国翻译，2006（1）：59-64.

[4]王家义.译文分析的语料库途径[J].外语学刊，2011（1）：128-131.

[5]余国良.语料库语言学的研究与应用[M].四川：四川大学出版社，2008.

[6]中国教育在线.http：//www.eol.cn/article/20050325/3132232.shtml.

作者简介：

劉娜娜（1983- ），女，山东淄博人，硕士研究生，助理研究员。

（责编张亚欣）