美国总统就职演说词中的词块研究

2013-06-23 16:25张宁
关键词:词块介词立场

张宁

(河南科技大学外国语学院,河南 洛阳 471023)

【语言琢玉】

美国总统就职演说词中的词块研究

张宁

(河南科技大学外国语学院,河南 洛阳 471023)

词块是包括语料库语言学在内诸多学科研究的一个热点,目前研究大多限于英语口语、英语写作、学术英语、教材及大学生英语演讲稿中的词块。基于自建语料库,对美国总统就职演说词中的词块进行的研究结果显示:词块的使用遵循“词块越长,频率越低”的规律,反映了语言使用的“成语原则”;词块的类型和功能跟语料的体裁有关。

词块;就职演说;语料库

词块(Lexical chunks),又叫“词束”(lexical bundles)、[1]990“词簇”(word cluster),[2]是可以整体储存、提取和产出的程式语,[3]是心理语言学、认知语言学、二语习得和语料库语言学等学科关注的一个热点。就语料库语言学而言,随着提取技术的改进,对词块的研究在过去20多年间发展很快,“在可预见的将来,它将会持续成为语料库研究的焦点”。[4]208

一、词块的界定与文献回顾

对于词块的定义,学者们仁者见仁、智者见智。本文沿用卫乃兴等学者的定义,具体表述为:“以一定结构在语料库中高频出现的不同长度的有意义的连续词语片段。”[5-6]如,the federal government,Iam about to,the nations of theworld,to the best ofmy ability。从定义中可以看出,词块具有5个界定特征:(1)词块具有相对良好的语法结构;(2)词块表达相对完整的意义;(3)词块的长度不等;(4)词块是在语料库中高频出现的语言序列;(5)词块是在文本中连续出现的词语片段。[5]第一个特征旨在排除检索软件切分出来的支离破碎的噪音序列;词块要表达相对完整的意义,因为没有意义的语言单位没有多少研究价值;词块的长度不等,可介于2至6词之间;语言使用遵循“成语原则”,[7]110因此词块在语料库中是高频出现的;由于目前检索技术所限,非连续的词语不易检索出来,故将词块暂定为连续出现的词语片段。

近年来,国内对词块的研究主要集中三个方面。第一,从理论层面或通过实证的方法证明词块在词汇学习中的作用,并强调词汇教学的重点应放在词块上。[8]第二,将学习者口、笔语中的词块与英语本族语者的词块使用进行对比,以期发现二者在语块使用上的异同,从而服务于语言教学。第三,中国大学生英语演讲词中的词块也受到一些学者(如王立非、钱娟)的关注。国内学者探讨英语本族语者词块使用的研究并不多见,因此,本文以美国总统就职演说词为语料,试图探讨演说词中词块使用的总体趋势及词块在分布和功能上的特点。

二、语料、检索工具及有关说明

研究所用语料来自已经建成的“英汉双语对应语料库”。该语料库以美国总统就职演说词及其四个汉译本为语料,是一个“一对四”的英汉双语平行语料库。语料库中的英语语料包括从乔治·华盛顿到比尔·克林顿的42篇就职演说词,①由于汉译本收录演说词不尽一致,无法涵盖美国建立以来所有总统的就职演说词。类符97 576个,型符8 373个,类符与形符比为8.58。

词块的提取工具为kfNgram,是一款专门用于语言研究的单机运行软件,不需其他语言支持。kfNgram功能强大,可生成n元词表,即n个单词序列,也称为“词串”、“词束”或“词元”。此外,还可生成n个字母串。

前面提到,词块长度在2至6词之间,但是“2词序列大多可以作为一般搭配研究”;[4]210此外,“2词词块的数目极大,而且主要是表示语法信息的序列或者是一些复合词”,[9]对表意作用不大;2词词块最后大都融于三词及三词以上词块中。鉴于此,我们只在讨论词块使用的总体倾向时涉及2词词块,研究词块分布和功能时主要集中在长度介于3至6词词块上。

此外,一般研究多词单位都设有一定的频率阈限(又称为“提取频点”),即达到这个频数才可视为一个多词单位,当然这会因语料库的大小而有所不同。如Biber等研究4词词块时把在100万词的语料库中出现10次及以上的多词单位才算作复现词束。[1]990而O’Keeffe等认为,在500万词的语料库中出现20次及以上的多词单位才有研究意义。[10]由于语料库较小,在综合考虑后,我们将出现10次及10次以上的3词语言片段作为3词词块,出现5次及5次以上的4至6词语言片段作为4至6词词块。使用kfNgram检索后,我们参照词块的5个界定特征,剔除了不符合要求的多词单位,如of the united,and to the(三词序列),constitution of the united(四词序列),to the best of my,are aided by all who(五词序列),defend the constitution of the united(六词序列)。

三、结果与讨论

(一)词块使用的趋势

通过软件检索、人工剔除等程序,我们最终得到2至6词词块521个,分布如表1所示。

表1 2至6词词块分布

从表1可以看出,词块越长出现的频率越小,这和前人的研究结果相同。如Biber等基于语料库的研究显示,一般而言,词语单位越长,在语料库中出现的频率越小。[1]990李文中对中国英语新闻报刊的研究也得出“词簇长度越大,复现频率越小”的结论。[2]这在某种程度上说明,“多词单位的长度与其出现的频率成反比”是语言使用的一个普遍规律。

此外,我们对2至6词词块与其各自出现的频数相乘,发现2词词块出现8 485次,3词词块出现1 929次,4词词块出现553次,5词词块出现78次,6词词块出现37次,2至6词词块一共出现11 082次,占总语料的11.4%。如果把词块的阈限降低(比如将2至3词词块频数定为不低于5次,4至6词词块定为不低于3次),那么词块在语料中出现的比率肯定会更高些。这说明,词块的使用在一定程度上折射出语言使用的“成语原则”。[7]110

(二)词块的类型分布

Biber等将学术体裁中的词束分为“名词短语+of短语片段”、“名词短语+其它后置修饰语”、“介词短语+嵌带of短语片段”等12类。[1]1014-1015而马广惠将词块分为动词类、名词类、介词类、从句类、连接词类、修饰语类和并列结语类等7大类。[11]我们借用马广惠的框架对检索到的3至6词词块进行了分类。

200个3至6词词块排序为:名词词块(69)>介词词块(60)>动词词块(39)>并列词块(21)>连接词词块(6)>从句词块(3)>修饰词块(2)。①词块类别后面括号内的数字表示词块出现的频数。这和马广惠的研究结果不一致。他的词块排序为动词词块>名词词块>介词词块>从句类词块>连接词块>修饰类词块>并列词块。这种差异主要归因于语料种类的不同。马广惠的语料是英语专业学生的作文,而我们的语料是美国总统就职演说词。此外,Biber等对对话与学术论文中词束的研究也表明,词束在种类和频数上也呈现出明显的差异。[1]996-997我们还对出现频数较高的3至6词的名词词块、介词词块、动词词块和并列词块进行了统计。结果表明,3词名词性词块为40个,如the united states(90),the will of(14),my fellow citizens(15);4词词块为21个,如the blessings of liberty(7),the declaration of independence(5);5、6词词块分别为6个和2个,如government of the united states(5),the constitution of the united states(13)。3词介词性词块为32个,如of the people(67),of the constitution(21);4词词块为25个,如of theUnited States(60),in the presence of(10);5、6词词块分别为2个和1个,如among the nations of the(5),to the best ofmy ability(7)。3词动词性词块为24个,如will not be(25),itmay be(15);4词词块为13个,如Iam about to(8),Ishall endeavor to(6);5、6词词块分别为2个和0个,如we are aided by all(5)。3词并列性词块为11个,如the constitution and(21),men and women(17);4词词块为8个,如and defend the constitution(6),at home and abroad(5);5、6词词块分别为1个和1个,分别是and defend the constitution of(5)和and defend the constitution of the(5)。

3至6词名词词块、介词词块、动词词块和并列词块的类型分布见表2。

表2 3至6词词块类型分布

从表2可以看出,词块的类型会随语料体裁的不同呈现出差异,但是基本上词块分布服从“词块越长,频率越低”这条规律。

(三)词块的功能研究

Biber,Concrad&Cortes区分了词束的三种功能:表述立场、组织语篇和指称。[12]表述立场是表明对命题肯定性的态度/评价;组织语篇是反映前后之间的关系;指称是直接指向具体/抽象的实体,或语篇语境本身,或者指认实体/把实体某一点特征凸现出来。[12]立场词束又分为认知立场词束,如are more likely to;态度/情态立场词束,如It’s important to。组织语篇词束又分为引入话题/重心词束,如Iwould like to;话题阐释/澄清词束,如what do you mean。指称词束分为辨认/聚焦词束,如one of the things;模糊化词束,如or something like that;特点的详述词束,如a lot of people;时间/地点/语篇指称词束,如at the same time,in the United States,as shown in figure等。

起初,参照Biber,Concrad&Cortes对词束的功能分析框架,[12]我们对3至6词词块按功能进行了分类,但是语料中没有表示组织语篇的词块及指称词块中的模糊化词块,最后只得将词块分为两大类(表述立场词块和指称)、五小类。表述立场词块包括认知立场词块和态度/情态立场词块,而指称词块包括辨认/聚焦词块、特点的详述词块、时间/地点词块。基于此,我们对词块的功能进行统计,结果表明表立场的词块有49个,其中认知词块23个,如it has been(21),there is no(17);态度/情态词块26个,如ought to be(20),it can be helped(5)。指称词块有151个,其中辨认/聚焦词块95个,如in the world(33),the federal government(30);特点的详述词块46个,如the people of(31),the policy of(18);时间/地点词块10个,如at the same time(10),at home and abroad(5)。另外,在立场词块中,3词词块为25个,如we have been(17),it can be(12);4词词块为17个,如defend the constitution of(5),I shall endeavor to(6);5、6词词块分别为5个和2个,如the best of my ability(7),and defend the constitution of the(5)。指称词块中,3词词块为87个,如the United States(90),of the country(31);4词词块为62个,如in the presence of(10),the blessings of liberty(7);5、6词词块分别为1个和3个,如government of the united states(5),to the best ofmy ability(7)。

3至6词词块的功能角度分布见表3。

表3 3至6词词块功能分布

从表3可见,除了5词指称词块多于6词指称词块,3词和4词及立场词块遵从“词块越长,频率越低”这条规律,此外,由于表达的功能不同,3至6词词块的使用呈现出较大的差异。

基于自建语料库,对美国总统就职演说词中的词块进行了研究。结果显示:随着词块长度的增加,词块的出现频率降低,词块使用在一定程度上表明语言的“成语原则”;词块的类型和功能跟语料体裁有关,但是基本上呈现出“词块越长,频率越低”的规律;由于词块在分布和功能上不同,3至6词词块的使用也呈现出明显的差异。本研究在某种程度上揭示出英语本族语者演说体裁中词块使用的一些特征,对理解和欣赏此类语篇有一定的帮助,也在某种意义上拓宽了词块的研究视野。然而,本研究也存在不足之处,比如词块研究没有自己比较成熟的理论框架,基本上借用的是词束研究的理论和分析框架;没有全自动的连续词块检索工具,必不可少的人工干预在一定程度上影响了词块研究的信度和效度;由于检索工具所限,未涉及非连续、位置变化的词块。

附表 排在前五的高频词块

[1]Biber D,S Johansson,G Leech,SConrad&E Finegan.Longman Grammar of Spoken and W ritten English[M].London:Pearson Education limited,1999:987-1036.

[2]李文中.中国英语新闻报刊中的词簇[J].中国外语,2007,(3):38-43.

[3]Wray A.Formulaic Language and the Lexicon[M].Cambridge:Cambridge University Press,2002:9.

[4]卫乃兴.词语学要义[M].上海:上海外语教育出版社,2011.

[5]卫乃兴,王晓婷.中国学生英语口语的词块特征分析[M]//杨惠中,卫乃兴.中国学习者口语语料库的建设与应用.上海:上海外语教育出版社,2005:59-69.

[6]卫乃兴.基于COLSEC的学习者英语口语特征研究[M]//杨惠中,卫乃兴.中国学习者口语语料库的建设与应用.上海:上海外语教育出版社,2005:97-110.

[7]Sinclair J.Corpus Concordance Collocation[M].上海:上海外语教育出版社,1999.

[8]濮建忠.英语词汇教学中的类联接、搭配及词块[J].外语教学与研究,2004,(6):438-445.

[9]卫乃兴.中国学生英语口语的短语学特征研究——COLSEC语料库的词块证据分析[J].现代外语,2007,(3):280-291.

[10]O’Keeffe A,McCarthy M J,Carter R.From Corpus to Classroom:Language Use and Language Teaching[M].Cambridge:Cambridge University Press,2007:64.

[11]马广惠.英语专业学生二语限时写作中的词块研究[J].外语教学与研究,2009,(1):55-57.

[12]Biber D,S Concrad&V Cortes.If you look at…:Lexical Bundles in University Teaching and Textbooks[J].Applied Linguistics,2004,25(3):385-388.

Lexical Chunks in American Presidential Inaugural Addresses

ZHANG Ning

(Foreign Languages College,Henan University of Science and Technology,Luoyang 471023,China)

Lexical chunks is a hot topic for several disciplines including corpus linguistics,and current studies focus on lexical chunks in oral English,English writing,academic English,texts of textbooks,and college students’speeches.Based on the self-constructed corpus,the present study explores lexical chunks in U.S.presidential inaugural addresses.The results show that use of lexical chunks follows the principle“the longer a lexical chunk is,the less frequent it occurs”which reflects Idiom Principle in language use,and that distribution and functions of lexical chunks are related to genre of the corpus.

lexical chunks;inaugural addresses;corpus

H319

:A

:1672-3910(2013)03-0071-04

2012-11-13

洛阳市社会科学规划项目(2012B233)

张宁(1978-),女,陕西西安人,讲师,硕士,主要从事语言学及应用语言学研究。

猜你喜欢
词块介词立场
介词和介词短语
设计立场和手工生产关系的辩证认识
武术研究的立场
扬 善
介词不能这样用
高中英语词块教学现状调查研究及应用策略分析
词块中心教学法在高职英语教学中的应用初探
词块理论与高职英语翻译教学研究
词块在初中英语写作教学中的应用研究
看图填写介词