大学英语四、六级快速阅读的文本分析
——基于自建小型语料库的实证研究

2012-05-29 03:05□郭
山西广播电视大学学报 2012年2期
关键词:形符平均数语料库

□郭 蕾

( 西南大学外国语学院,重庆 400715)

大学英语四级、六级考试,作为评价大学生英语能力的重要测试,一直备受学生、教师、学校和用人单位的关注。同时,随着社会的不断进步和发展,英语四级、六级考试也在不断地改进和完善。2006年出版了《大学英语四、六级考试大纲》(修订版)。2006年12月起,英语四级考试全面实行新题型。2007年6月起,英语六级考试全面实行新题型。启用的新题型中增设了快速阅读。与仔细阅读不同,快速阅读是以较快的速度在规定的时间内有目的、有方法、高效率地阅读材料,以便从中准确地获得所需的信息,其目的就是考察考生在短时间内获取篇章特定信息的能力,对于考生的阅读速度有较高的要求,但对于阅读的深度要求则相对较低。

国内许多学者已经围绕四、六级考试展开了深入的研究(杨慧中,1998;金艳、吴江,1998;马黎华、朱涌河,2002;张慧,2010;陶加辉、邬小琴,2010)。同时,关于四、六级考试与英语专业四、八级考试、雅思考试、托福考试的对比研究也有许多(周越美,2004;王勇旗,2007;郭世泉,2010)。然而,针对四、六级阅读文本的研究,特别是运用语料库资源和计算机辅助第二语言研究软件的文本分析还很少。因此,笔者收集了2008年-2011年英语四、六级考试快速阅读部分的文本,运用Wordsmith软件对快速阅读文本进行分析和对比:利用描述统计量分别研究四、六级快速阅读在形符数、类符数、类符/形符、标准化类符/形符、词长、句子数目方面的基本情况,纵向研究历年间的平均水平和差异程度;利用平均数差异的显著性检验对比四、六级快速阅读在形符数、类符数、标准化类符/形符方面的差异程度和具体差值,横向比较二者之间的差异。同时,对四、六级快速阅读形符数和类符数做出总体平均数的推断。

一、四、六级快速阅读基本情况

英语四、六级考试的阅读理解部分包括仔细阅读和快速阅读,所占分值比例为35%,其中快速阅读部分占10%。笔者收集了从2008年-2011年共 8 次考试的快速阅读材料,采用WordSmith4.0,利用词表(WordList)统计功能,创建了语料库中词汇使用频率列表。在统计文本的基本信息时,选择的信息项目包括:形符数、类符数、类符/形符、标准化类符/形符、平均词长和句子数目。其中形符类似于我们日常说的“词”,类符为不重复计算的形符数,即去掉重复使用后总的使用形符。换言之,在一个文本中,重复出现的形符只能记作一个类符。类符/形符是衡量文本中词汇密度的常用方法。然而,文本越长,功能词重复的次数越多,类符/形符也就会越低。因此,常用标准化类符/形符来计算词汇密度。软件默认为计算每1000词的类符/形符比。由于四、六级阅读材料文章篇幅较短,调整为每200词计算。平均词长是文本中单词的平均长度,即字母数。句子数目是文本所含句子的总数。

根据收集到的原始数据,阅读材料的词长几乎均为5,类符/形符不具有可比性,因此,利用SPSS13.0软件分别计算了形符数(表1)、类符数(表2)、标准化类符/形符(表3)和句子数目(表4)的描述统计量,其中包括集中量数和差异量数:平均数、最大值、最小值、全距、标准差、偏态指数和峰度。表中数据不在此一一赘述。

平均数最大值最小值全距标准差偏态指数峰度四级形符数1031.131082.00997.0085.0032.281.04-0.36六级形符数1268.631466.001189.00277.0087.071.994.53

表1快速阅读形符数的描述统计量

表2快速阅读类符数的描述统计量

表3快速阅读标准化类符/形符的描述统计量

表4快速阅读句子数的描述统计量

在快速阅读形符数方面,六级的标准差明显大于四级,说明四级快速阅读的历年阅读材料比六级更加稳定,快速阅读偏态指数大于1,说明数据的分布与标准正态分布有显著差异。在类符数方面,四级和六级的标准差比较接近,说明二者的稳定性相差不大。在标准化类符/形符方面,同样,四级与六级之间差异不大。在句子数方面,六级的标准差明显大于四级,说明历年四级快速阅读的句子数一致性更强。

二、平均数差异的显著性检验

为横向比较四级快速阅读与六级快速阅读的差异程度是否显著和它们之间的具体差值,本文利用了统计学中的平均数差异的显著性检验。在SPSS13.0中,独立样本t检验是用来比较不同数据的平均值,看它们之间的差异是随机差异还是本质上的差异的参数检验方法。因此,分别对四、六级快速阅读的形符数、类符数、标准化类符/形符进行了独立样本的t检验。

Levene’sTestt-testforEqualityofMeansFSig.tdfSig.(2-tailed)MD95%CIDLowerUpper形符数方差齐性方差不齐性2.050.17-7.64140.00-242.38-310.45-174.30-7.649.030.00-242.38-314.14-170.61类符数方差齐性方差不齐性0.030.86-4.38140.00-72.13-107.42-36.83-4.3813.970.00-72.13-107.42-36.82标准化类符/形符方差齐性方差不齐性0.150.70-0.28140.79-0.36-2.413.12-0.2813.960.79-0.36-2.413.12

表5平均数差异的显著性检验结果

在快速阅读形符数方面,平均数方差齐性(p=0.17>0.05),二者在形符数上存在极为显著的差异(p=0.00<0.01),四级与六级的形符数平均差值为-242.38。在快速阅读类符数方面,四级和六级平均数方差齐性(p=0.86>0.05),二者的平均数差异极为显著(p=0.00<0.01),说明二者在类符数上也存在极为显著的差异,四级与六级快速阅读的类符数平均差值为-72.13。由于类符/形符会受到文本长度的影响,不同长度的文本的类符/形符不具备可比性,故比较二者的标准化类符/形符。在快速阅读的标准化类符/形符方面,四级和六级的平均数方差齐性(p=0.70>0.05),二者的平均数差异不显著(p=0.79>0.05),说明在标准化类符/形符上,二者不存在显著差异。

三、总体平均数的推断

根据收集的2008年-2011年8次考试的数据,本文尝试进一步对四、六级快速阅读的整体情况进行推断和估计,使得研究结果更加有普遍性和实践价值。因此,利用SPSS13.0,根据样本的形符数、类符数对四、六级快速阅读的形符数、类符数做出总体平均数的推断,alpha值设为0.05,结果如下:

总体平均数置信区间四级形符数1004-1058四级类符数413-470六级形符数1206-1344六级类符数487-541

表6 快速阅读形符数、类符数的推断

教师和学生在平时的阅读教学和四、六级快速阅读训练中,可以根据表6对形符数和类符数的推断结果选择形符数、类符数在相应范围内的阅读材料,使得阅读教学和训练更具有针对性、有效性。

四、结语

目前,将语料库技术运用到语言测试的研究还比较少。王勇旗(2007)指出,随着新的语料分析方法的应用,语料库分析技术能够为教学中的感性知识提供实证研究支持,同时使得个人能通过语料分析发现更细微的语言特点。由于语料库语言学立足于大量真实的语言数据,对语料库做系统而穷尽的观察和概括所得到的结论对语言理论建设具有无可比拟的创新意义(梁茂成,2010)。

基于自建的小型语料库,本文对四、六级快速阅读的文本进行了词汇方面的分析。首先,采用WordSmith4.0获得文本的基本信息:形符数、类符数、类符/形符、标准化类符/形符、平均词长和句子数目。利用SPSS分别计算了原始数据的描述统计量。通过纵向比较历年考试发现:与六级相比,四级快速阅读材料的难易程度基本保持一致,稳定性更强,六级个别年份存在差异。其次,利用统计学中的平均数差异的显著性检验横向比较四级和六级的差异程度,并计算了具体的差值。在形符数和类符数两方面,四级和六级快速阅读存在极为显著的差异,而在标准化类符/形符方面,二者的差异并不显著。最后,根据样本数据对四、六级快速阅读的形符数和类符数做出总体平均数的推断,希望为教师和学生提供一些帮助,希望对阅读的教与学有一定的启发和指导作用。

由于本文所收集的样本数据有限,并且仅仅探讨了阅读材料词汇方面的情况,还有许多影响阅读文本难度的因素尚未涉及,因此,本研究还存在着很大的局限性和不足之处,还需要进一步的研究和探索。

[1]杨惠中.大学英语四、六级考试效度研究[M].上海:上海外语教育出版,1998.

[2]金 艳,吴 江.以“内省法”检验 CET 阅读理解测试的效度[J].外语界,1998,(2).

[3]梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社,2010.

[4]马黎华,朱涌河.大学英语四、六级阅读理解题型剖析[J].山东外语教学,2002,(2).

[5]陶加辉,邬小琴.大学英语新四级阅读理解内容效度研究[J].教育与考试,2010,(2).

[6]周越美.CET-4和TEM-4的对比研究[M].上海:上海外语教育出版社,2004.

[7]王勇旗.浅析雅思学术类阅读与大学英语六级阅读文章异同——基于自建小型语料库的实证研究[J].广东外语外贸大学学报,2007,(5).

[8]郭世泉.大学英语四、六级阅读测试与雅思阅读测试对比研究[D].哈尔滨:黑龙江大学,2010.

[9]张 慧.大学英语新四、六级快速阅读理解测试内容效度研究[D].桂林:广西师范大学,2010.

猜你喜欢
形符平均数语料库
从形符与字义的关系角度论《说文解字》中形声字分类
——以“人”“彳”字部为例
留学生形声字教学实践研究
——以满洲里学院为例
《语料库翻译文体学》评介
不一样的平均数
“形符”在小学数学课堂中的教学困境、功能与应用策略
关注加权平均数中的“权”
平均数应用举隅
说说加权平均数
如何利用《说文》中的形符教授留学生学习汉语
基于JAVAEE的维吾尔中介语语料库开发与实现