张艳妍
(中国科学院研究生院 外语系,北京 100049)
高水平学习者英语演讲语篇的词块分析
张艳妍
(中国科学院研究生院 外语系,北京 100049)
本文选取近十届“21世纪杯”全国英语演讲比赛前三名选手的演讲稿,自建中国高水平学习者英语演讲语料库,通过对词块的提取和分析,描述中国高水平学习者演讲体中词块使用的特点。
语料库;词块;演讲;语篇
随着计算机技术和语料库语言学的发展,基于语料库的词汇研究受到了广泛的关注。计算机语言学研究表明,人们大量使用词块构建句子词块作为模式化的结构,融合了句法和词汇的特征并且方便整体记忆、识别和提取,在学习者的语言习得和输出中起着弥足轻重的作用。Cortes(2004)指出,词块能力是衡量学习者语言水平的一个重要指标。本文选取近十届“21世纪杯”全国英语演讲比赛前三名选手共29篇演讲稿,以Altenberg(1998)的理论为依托,描述中国高水平英语学习者演讲语篇中词块使用的特征。
词块(Lexical Chunks)是一种多词现象,不同的研究者从各自的研究目的出发,对这种多词现象冠以不同的称谓和不同的定义。词块概念的称谓多达五十余种,如程式语(Formulae),复合语(Composites),预制语块(Prefabricated Routines and Patterns),词汇短语(Lexical Phrases),词束(Lexical Bundles),多词单位(Multi-word Units)等。虽然称谓不同,但是词块具有以下特征:词块是语言构成的基本单位;词块在语言中出现的频率高,可以被整体存储并且提取使用,方便记忆。
近几十年来,关于词块的研究主要集中在以下几个方面:语言习得与教学,语料库语言学,心理语言学等。Pawley&Syder(1983)指出,语言学习者的词块能力决定了目标语言的熟练程度。 Widdowson(1989)提出,提高词块能力比学习语法知识更重要。Wray(2002)则认为,语言的使用过程实际上是一个提取并运用词块的过程,而不是运用句法生成句子的过程。刁琳琳(2004)认为,学习者词块能力与目标语言能力之间存在着显著的相关关系。
Sinclair(1991)提出了语料库研究词块的研究方法,基于语料库的词块研究在近十年间广泛地展开。Biber(2004)比较了词块在大学课堂教学与教材的使用特征。Altenberg(1991)基于语料库,通过统计和分析发现,实际语言输出中的70%都是通过词块实现的。濮建忠(2003)基于中国英语学习者语料库(CLEC)研究了中国学生书面语种词块的使用特点。卫乃兴 (2004)基于中国学习者英语口语语料库(COLSEC),把词块研究拓宽到中国学生的口语表达。
本文参照濮建忠(2005)的研究,将词块定义为“以词为基本单位,由连续的或非连续的两个或多个词或词形组合而成、允许抽象度高于词、有一定的使用频率、结构相对完整、能表达一定意义的语言形式”。选取近十届“21世纪杯”全国英语演讲比赛前三名选手共29篇演讲稿(prepared speech),自建小型的 “高水平学习者演讲语料库”,使用Wordsmith 4.0在语料库中分别提取长度为二词、三词、四词的词块(试提取后,五词长度以上词块数量极少,故不纳入研究讨论范围),频数截断点依次为2、1、1,然后人工筛选所截得的词块,进行统计分析。基于Altenberg(1998)对口语语篇词块的研究,将本文研究的词块分为三类:完整分句、分句成分和不完全词组,对高水平学习者演讲语篇中词块的形式、意义和功能进行分析和讨论。
本研究共提取到长度为二词到四词的词块371个(Types),所有词块在语料库中出现的总频数为 1440(Tokens)。表1为各长度词块的总体分布数据。
表1 高水平学习者演讲语篇语料库词块的总体分布数据
表1显示,二词词块所占的比例最大,三词词块次之,四词词块较少,印证了词块频数和词块长度成反比的规律,揭示了各长度词块在语篇构建中所起的作用。然而,二词词块中有相当比例的词组,如my aunt,these people等,在篇章组织上没有显著的意义。因此,将所提取出的词块按结构分类,分为完整分句、分句成分和不完全词组,其中完整分句又分为独立分句和从属分句,分句成分又分为多种分句成分和单一分句成分。表2为各结构类词块的分布数据。
表2 词块的主要结构类及其数据
表2显示,在三个大的结构类中,分句成分在演讲语篇的构建中所占的比例高达82.85%,不完全词组占到14.24%,完整分句只占到2.91%。该数据表明,在演讲者话语构建中,分句成分所起的作用最大。对比 Altenberg(1998)对本族语者口语交际的词块研究结果 (完整分句10%;分句成分:76%;不完全词组:14%),本族语者和学习者口语语篇中的分句成分都具有显著主体地位。不同的是,相对于本族语者,学习者在完整分句的使用上明显低于本族语者。为了进一步探讨学习者与本族语在三个结构类词块的使用差异,将分析各结构类词块的高频词块。
完整分句类中,学习者使用的高频词块有Thank you,Good afternoon,When I was young,As a Chinese student等,表达了寒暄、致谢、陈述等功能,而相对于本族语者使用的完整分句词块,由于演讲文体不同于口语交际,学习者并未涉及具有询问、确认、赞同、歧见、肯定答语、否定答语、否认语、自我介绍和其它功能类。学习者演讲语篇中出现了大量的when引导的时间状语从句,如When I was young,When I was a little,用来铺开对往事的叙述,将个人经历与听众分享。
分句成分在学习者演讲语篇中所占的比重高于本族语口语语篇,部分原因是由于本研究自建语料库容量远不及本族语者口语语料库庞大,其中的二词词块不同于本族语者语料中的绝大部分为复合词(如“college education”),故将二词词块统计在内,使二词词块中的分句成分加大了分句成分在总体词块使用中的比重。其中,Let me tell you,there be,I(do/firmly)believe,I would like to,I want to,I still remember,last but not least等使用的频率极大,并且分布在绝大多数的语篇中,说明演讲者积极向听众传达信息以及表明立场,并且在演讲中保持着清晰的逻辑连接。
不完全词组在学习者演讲语篇中高频出现的主要有a lot of,all of the,all the,one of the,a chance to,as well as,part of等。值得注意的是,ladies and gentlemen出现的频率高,几乎分布在各篇演讲之中,而且在某一演讲中反复出现。利用Wordsmith的wordlist功能提取ladies and gentlemen的concordance line发现,ladies and gentlemen除在演讲开头与问候语连用以及在演讲末尾部分向听众提出倡议外,大多数演讲者在演讲中频繁使用ladies and gentlemen作插入语,为自己赢得时间,保持演讲的流畅。此外,学习者使用不完全词组的频率与本族语基本相同,由于语料库容量的差异,学习者使用不完全词组的丰富度远不及本族语者。
本族语者和学习者在口语语篇中都运用大量的词块,范围覆盖句子、分句以及词组,并且分句成分的使用占绝大多数。与本族语者不同的是,学习者语料库的取材虽为口语体,但鉴于演讲为准备演讲,即兴组织的语言极少,所以在语言架构上稍偏重书面用语,并且使用了相当数量的逻辑联系语,使篇章实现了较好的衔接和连贯,听众可以通过具有篇章组织功能的词块抓住演讲内容的层次。
[1]Altenberg,B.1998.On the phraseology of Spoken English:The Evidence of Recurrent Word-Combinations[A].In A.P.Cowie (ed).Phraseology:Theory,Analysis and Applications[C].Oxford:Oxford University Press.
[2]Biber.D.2004.If you look at lexical bundles in university teaching and textbooks[J].Applied Linguistics 25/ 3:371-405.
[3]Sinclair,J.1991.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press.
[4]濮建忠.英语词汇教学中的类连接、搭配与词块[J].外语教学与研究,2003,(6).
[5]卫乃兴.中国学生英语口语的短语学特征研究—COLSEC语料库的词块证据分析[J].现代外语,2007,(3).
H313
A
1008—3340(2011)01—0038—02
2010-12-22
张艳妍(1986-),女,汉族,籍贯江苏省海门市,中国科学院研究生院外国语言学及应用语言学学生,研究方向为词汇学,语料库语言学。