基于语料库的奥巴马每周电台演讲文体分析

2016-04-28 15:52江雷
武昌理工学院学报 2016年1期
关键词:文体学语料库奥巴马

江雷

摘 要:语料库可弥补单凭直觉推断的缺陷,为人们提供自下而上的话语研究方法。从文体学的角度出发,运用语料库研究方法,对奥巴马每周电台演讲文本进行分析,揭示其在语法方面采用了长短句交替使用的结构,平均句长合理,增强了演讲的节奏感,且能充分地传达信息,以达到理想的演讲效果;在词汇采用上,除大家熟悉的词汇外,他还多次使用人称代词 “ we”和“our”,拉近了总统和听众之间的距离,频繁使用”can”、”will”等情态动词,体现奥巴马对现在和未来的重视;在语义特征方面,实义名词的高频次使用,体现出了政府和人民关注的话题,衔接连词的使用,使演讲组织十分有效。这些特征为读者提供了一个从文体学分析奥巴马每周电台演讲的视角,从而使读者更好地理解其演讲并更好地运用文体知识。

关键词:语料库;文体学;奥巴马;电台演讲

中图分类号:H08;H315 文献标识码: A

一、引言

随着语料库语言学的飞速发展,基于语料库的研究方法已成为文体学的重要研究范式。但是目前国内外的英语语体研究大多是对文学作品的定性描述,缺乏运用语料库对政治演讲文本的相关研究。公共演讲作为政治性语篇的一种,经常会被政治家当做有力的政治工具,推行本国政治要求、外交政策,获取各方支持,因为公共演讲的主要目的就是激起听众的热情,获得听众的支持,其优势在于它能够非常直接地与听众交流,是非常有效的外交工具。美国作为世界上最发达的国家,其政治理念颇受关注,因此美国总统演讲一直受到人们的广泛关注。国内学者基于对现任总统奥巴马演讲的研究并不少见,但基于语料库的研究不多,并且大多数是对其演讲的词汇衔接、主题词或话语分析方面的研究。运用语料库对个人的演讲文本进行定量分析,结合定性描述,可以更为客观地详尽分析个人的文体特征和语言风格。本文从文体学的角度出发,运用语料库研究方法,对现任美国总统奥巴马的每周电台演讲文本进行分析,揭示其在多个层面上的文体特点。

二、语料库语言学

语料库语言学出现于20世纪60年代,是在语料库的基础上对真实的语言数据进行分析和研究的学科。语料库为语言研究带来了实证和量化两个标志性特点。80年代开始,基于语料库的语言学研究得到了迅速发展。90年代至今,随着计算机技术的发展和语料库知识的普及,作为一门新兴的边缘学科,语料库语言学凭借大规模的语料和先进的语料库检索软件对语言材料进行加工和处理,为语言学的实证研究提供了一种全新的手段,已经被广泛地应用于语言研究的各个层面,如词语系统的研究、文学作品的分析以及语言教学的运用等。

三、语料的选取及研究方法

本研究的语料选自奥巴马2014年11月到2015年8月的每周电台演讲的转写文本,共40篇, 23406词 (2014年11月25日为奥巴马总统与米歇尔夫人的圣诞祝词,未列入语料库)。同时,本研究以英国国家语料库BNC为参照语料库。

在运用Microsoft word和 EditPlus 对生文本进行简单的合并空行,去除段首空格以及一些标点符号的整理,并加以人工检查,以确保正确。在不妨碍检索结果的基础上,本研究选用UAM Corpus Tool、 Editplus 3 、Antconc 3.2.3、Range、Readability Analyzer 1.0、Treetagger等语料库检索与统计软件从语法特点、词汇特点、语义特征等方面对奥巴马的每周电台演讲文本进行分析。

四、语料的分析与讨论

(一)语法特点

UAM Corpus Tool 是文本和图像语言标注的工具集,它可分析处于系统环境下的文本,是一款多功能的语料库工具,集建库、检索和统计等功能于一身。数据统计方面,它提供语料库的文本复合度、词汇密度、主观性分析和指称密度等基本统计。运用UAM Corpus Tool统计发现(如表1):平均句长为15.4词。平均词长是指语料库中单词所包含字母的平均数。一般而言,平均词长越长,文本越深奥复杂;词长越短,文本越浅显易懂。英语各类文体的平均句长为17.8词,公共演讲的平均句长为17.6词。奥巴马每周电台演讲的平均句长低于英语各类文体的平均句长和公共演讲的平均句长。因此,相对来说,奥巴马演讲简单、易于理解。

同时,运用Editplus 3软件(EditPlus是一款由韩国Sangil Kim出品的小巧但是功能强大的可处理文本、HTML和程序语言的Windows编辑器)处理文本,做到文本每个句子内容呈现在同一行,得出结果发现:文本长短句交错(如图1)。演讲内容长短句交错既避免了听觉的疲劳,又便于听众理解。通常而言,演讲中,短句语气重,多是陈述重要的事实和想法,表意简明扼要,起到强调突出的作用;长句多是准确表达复杂的思想,阐述观点和理论。奥巴马演讲中长短句交替使用,二者相得益彰,既加强了演讲的节奏感,又充分地传达了信息,以达到理想的演讲效果。

(二)词汇特点

Range软件主要是用来分析词汇的跨文本分布情况。其含有三级词汇表,词汇表文件名分别为BASEWRD1.txt、BASEWRD2.txt、BASEWRD3.txt。前两个词表中包涵的两千词族(word families)源自

Michael West所编的《通用英语词表》(A General Service of English Words)。第三个词表的570个词族源自Coxhead(2000)的“学术英语词表”(Academic Word List)(梁茂成,李文中,许家金,2010)。运用Range软件分析得出结果(如表2),可以计算出奥巴马就职演讲中英语基本词汇的比例是100%-29.8%=70.2%。可以看出:英语基本词汇在这些演讲中占很大比重,这是奥巴马每周电台演讲的一个非常突出的特点。

Readability Analyzer 1.0 是中国外语教育研究中心的许家金与贾云龙于2009年研制发布的语篇难/易读性性分析软件。形符(tokens)是一个语言单位,文本的词汇量就是形符数,总形符数是语料库容量的最常用的测量单位。类符(types)是一个统计单位,指不重复计算的形符数。一个文本的类符数就是该文本不同词形的数量。类符/形符比(TTR)常用来衡量文本的词汇密度。词汇密度在一定程度上反映了文本的某种本质特征,即用词的多样性。但采用类符/形符比计算长度不等的文本的词汇密度并不合理,常用的补救方法是用标准化类符/形符比(Std. TTR)来计算词汇密度。软件分析结果显示:形符数是23406;类符数是3006;类符形符比是0.1284;标准化类符形符比是0.1388。英语国家语料库类符形符比是33%,奥巴马每周电台演讲的类符形符比大约为13%。这说明奥巴马演讲用词较少,重复率较高,演讲难度也相对较低。这与其面向大众讲话,受众对象语言水平参差不齐的原因是相一致的。

AntConc 是日本早稻田大学实验室研发的多平台的语料库分析工具包,由最初一个相对简单的索引程序发展为目前一个非常有用的文本分析工具。AntConc工具选项众多,使用者可以检索词簇、搭配、词汇单,对被检索词汇及各种变化形态或短语的出现频率进行统计。运用Antconc3.2.3对词频进行统计,可见,高频使用词汇以虚词居多,虚词没有实际意义,而真正有实际意义的高频词是“we”(排第七)和“our”(排第十)。在BNC语料库中,“we”排第37位,“our”排第96位。人称代词“we”以及“our”,把听众放到第一位,这一人称代词拉近了总统和听众之间的距离,让二者置身同一立场,有利于陈述自己的观点,引起听众的共鸣,加强了与听众的情感交流,有利于唤醒听众的民族自尊心和自信心以及团结一致的爱国情绪,支持演讲者及其所发表的演讲内容。情态动词中,使用频次最高的是”can”(148次,第24),“will”(101次,第27)。在BNC中,“will”排第43位。奥巴马总统频繁地使用这些词表现出他注重现在和将来,体现对当前的社会问题得到进一步解决的预测以及对美国前景光明的信心。文本中还是用了“could”、“should”、“must”等情态动词。总统演讲的作用是表明立场、阐明观点以及宣扬政策,为了说服和激励民众,感情色彩浓厚的情态动词是达到这一目的的重要手段。

(三)语义特征

运用Antconc3.2.3统计词频,再对实义名词出现频次进行统计。由表3可见,奥巴马在演讲中提到最多的十个名词分别是:American、jobs、economy、families、world、people、work、time、health、house,体现出了美国政府与美国人民关心的话题:就业、经济、家庭、健康、住房等。

演讲文本使用了大量连接过渡词,用Treetagger软件(一款标注软件)标注后,在AntConc中检索该软件可识别的附码集“CC”(并列连接词),可得到并列连词998个,其中“and”818个,说明其演讲并不像其他类型的演讲那样正式。另外,使用过渡词可以承接或总结上面的内容,提示前后意思之间的联系,使它们有机联系起来,自然而然地由上文转入下文。文本中还有so,or,but,though, regardless,moreover,however等连接词。

五、结语

本文从文体学角度,运用语料库研究方法,对奥巴马总统每周电台演讲文本进行了分析。奥巴马总统通过在语法、词汇、语义等方面的精雕细琢,各种文体元素的应用使得其演讲既表明了立场、阐明了观点、宣扬了政策,又起到了说服和激励民众的作用。通过对其演讲文本的文体赏析,语言学习者也应该充分理解文体知识,掌握其中的技巧,更好地运用于语篇理解等。

参考文献:

[1] Teubert,W. My version of corpus linguistics [J]. International Journal of Corpus Linguistics, 2005(1).

[2] Wynne,M. Stylistics: corpus approaches [A].K. Brow n. Encyclopedia of Language and Linguistics ( 2nd edition) [ Z ].Oxford:Elsevier Science, 2006.

[3] 卢卫中,夏云.语料库文体学:文学文体学研究的新途径[J].外国语,2010(1).

[4] 王佐良,丁往道.英语文体学概论[M].北京:外语教学与研究出版社,2002.

[5] 梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社,2010.

[6] 李丹,张发祥.基于语料库的布什演讲文体研究[J].东莞理工学院学报,2008(04).

(本文审稿 余澄清)

猜你喜欢
文体学语料库奥巴马
文体学的学科特点和发展趋势研究
基于语料库翻译学的广告翻译平行语料库问题研究
叙事学与文体学双重视域下的小说“三要素”教学模式重构
叙事学与文体学双重视域下的小说“三要素”教学模式重构
运用语料库辅助高中英语写作
奥巴马道歉两边不讨好
语料库与译者培养探索
奥巴马增兵阿富汗饱受争议
奥巴马“舞剑”
A Stylistic Analysis of Dylan Thomas’“This Bread I Break”