美国总统就职演讲主题词的语料库分析

2011-01-16 08:10罗建平
浙江外国语学院学报 2011年5期
关键词:词频频数主题词

罗建平

(广东石油化工学院大学英语部,广东茂名525000)

美国总统就职演讲主题词的语料库分析

罗建平

(广东石油化工学院大学英语部,广东茂名525000)

语料库统计显示,美国总统就职演讲的主题词经历了显著变化:早期高频使用第一人称代词单数“我”,近100年来变化为高频使用复数“我们”;早期高频使用states(指美国国内)等词,后来频次陡然减少,而早期很少出现的world等词,近100年来的使用频次陡然增加;早期freedom,democracy等词几乎不使用,20世纪50年代后高频使用。另外,早期频繁使用station,methods所表达的意义,后来被position,ways等词取代。

语料库;美国总统就职演讲;主题词;历时分析

一、前言

美国自建国200多年来共出现44任总统(到奥巴马为止实际是43位总统,第22任和24任同为一人:Grover Cleveland——克利夫兰),经历了56届政府,有39位总统发表过正式的就职演讲(有4位从副总统职位继任时仅发表了继任演讲,竞选连任失败后无正式演讲)。

利用语料库技术对美国历届总统就职演讲进行统计分析,就笔者的检索而言,目前还不多见。现有研究多就某个演讲文本的文体风格、修辞隐喻等特点进行研究,其中又多以美国第1任黑人总统奥巴马的就职演讲为主。有些研究亦稍有不足,如把第22任和24任作为两位不同的总统[1]7而失准确等。

本文自建语料库,运用主题词检索功能对美国200多年来历届总统就职演说的文本进行统计调查,主要目的是从定量分析的视角来观察文本的主题词,探索它们经历的历时演变及所蕴含的意义。

二、语料准备

语料库分析是一种客观的定量分析,“可为研究提供可靠的范例保证”[2]。统计主题词需要两种语料,一是观察语料,二是参照语料。

观察语料。自建一个美国总统就职演讲辞语料库,从国内英语学习、翻译考试等网站(中大校网http://www.wang-xiao.cn;233 考试 http://www.examda.com;原版英语 http://www.en8848.com.cn)下载原文,经过校对,收集就职演讲辞、继任演讲或谈话(第38任福特自称“talk”)57篇,总容量为13.1 万多词(tokens)。

参照语料。使用外语教学与研究出版社的英语本族语者的通用语料[3],约150万词,用于对比分析所有美国总统就职演讲辞与普通语料之间的差异。另外,把观察语料分为四组,相互对比,求出历时差异。

三、研究目的和方法

研究目的。本文的目的是统计调查200多年来美国总统就职演讲主要有哪些主题词,历时差异如何,反映怎样的话语意义,试图通过定量分析来观察美国“每一个阶段的历史演变过程”[1]7。

研究方法。先对文本进行清洁处理,然后把文本分为四个历史时段,运用语料库主题词检索功能进行统计;与参照语料对比,先统计观察语料中单个文本频数有显著差异的主题词,在这基础上,再统计体现全体文本共性的关键主题词[4]147。本文讨论的主题词均是语料库意义的关键主题词。

四、主题词的历时变化

(一)历史时段划分

分四个历史时段统计主题词的历时变化,与资中筠的研究基本不谋而合(第一时段完全一致[1]8,第二、三时段大体相当[1]9-10,第四时段从小罗斯福起),但本文主要根据篇幅的总体特点。总体特点是:第一时段,时间从1789年到1813年,建国初期有7篇演讲比较简短,最长2300多词,最短只135个词,平均1450词;第二时段,时间从1817年到1865年,从第5任门罗开始,演讲篇幅大幅增加,最长的是第九任哈里森的演讲,8464个词,到南北战争结束时,平均篇幅是3135个词,这个时段门罗宣言出笼,国内矛盾恶化,内战爆发;第三时段,时间从1869年到1929年,南北战争之后,演讲篇幅有所降低,但仍然较长,最多有5366个词,至经济大萧条时,平均2682个词,此时是美国经济迅速发展、跻身世界列强时期;第四时段从第32任罗斯福到现任奥巴马,时间从1933年到2009年,演讲文本的最大特点是篇幅明显得到控制,基本在2000词左右,平均为1809个词,演讲时间大多不超过20分钟。

(二)主题词统计结果和讨论

第一时段:I、which、they、on、public、happiness、virtuous、mind、pleasing、station;

第二时段:union、powers、states、the、constitution、which、been、rights、confederacy、institutions;

第三时段:business、should、upon、law、the、enforcement、methods、citizenship、tariff、courts;

第四时段:we、Americans、world、today、freedom、new、let、know、work、democracy。

语料库也统计负主题词。负主题词是指使用频数明显偏少且差异显著的词,与正主题词共同反映文本的用词特点,也反映了四个时段的历时差异。下面用负号标出:

第一时段:-we、-our、-new、-upon、-must、-are、-great、-is、-for、-world;

第二时段:-we、-world、-America、-new、-us、-know、-freedom、-life、-business、-work;

第三时段:-you、-on、-union、-Americans、-together、-let、-yours、-his、-democracy、-friends;

第四时段:-the、-which、-should、-of、-be、-constitution、-states、-public、-upon、-been。

首先,第一人称代词的变化。演讲文本以“我”为中心向以“我们”为中心转变。建国初期位于首位的主题词是I,二战以后位于首位的是we。早期演讲者谈I的频次高,说we的频次低,因而I列于正主题词之首,we列于负主题词之首。人称代词具有重要的人际功能。复数可起到把听话者拉到身边作用,引发听者共鸣,单数则易引起拒人千里、孤芳自赏的消极感受。统计显示,第32任总统以后,美国的总统们使用“我们”的频次开始增加,说“我”的频次开始减少。

运行Clusters可检索词块,I组合的词块频数高的有:I have(101),I shall(96),I am(64),I will(37)等(括号内为频数,下同)。与my搭配频数高的有:my fellow(60),my countrymen(36),my country(23)等。

与 we的组合,频数高的有:we have(253),we are(161),we will(111),we must(107),we can(91),we shall(70)等。与 our搭配频数高的有:our own(104),our country(96),our people(80),our nation(53),our government(46)等。与 us搭配频数高的有:let us(192),of us(76),to us(66)等。

比较两组词块可发现,在聚合关系上使用“我”还是“我们”,效果不言而喻,如“my country”还是“our country”。“我”具有排他性,“我们”具有包容性。正因如此,“our country”的频次远高于“my country”的频次。

第二,关键主题词的演变。考察四个时段的前十个关键主题词:第一时段的日常用词较多,如happiness、virtuous、mind、pleasing等;第二时段的多与国家政治、宪法权利等相关,如 union、powers、states、constitution、rights、confederacy 等;第三时段的又多为经济、税收、法律之类,如 business、law、citizenship、tariff、courts等;第四时段的是日常用词与意识形态词语共存,如world、today、new和freedom、democracy等。

关键主题词中有两个词的变化比较突出,一是早期的states,二是后期的world。前者指美国或诸州,谈及频率很高,但到第四时段变为负主题词,说明谈得很少。后者在早期使用率很低,是负主题词,但在第四时段使用率显著升高。词频检索发现,states共使用327次,86.8%的频次落在1909年以前。而world共使用332次,81.7%的频次落在1917年以后。

使用N-gram检索,在100年以前的演说文本中,the United States词块是118次,of the government词块是74次,后来迅速降低,分别是27次和19次。而近100年以来,of the world和in the world两个词块共86次,以前分别只有14次和5次。

统计显示,19世纪及以前谈论国内问题频次高,“世界”谈论少;20世纪及以后,谈国内“states”的频次大减,世界“world”的频次陡然增加。

第三,语境共现的变化。研究语境共现有助于分析话语意义。美国建国初期的前十个关键主题词几乎无政治色彩,第二、第三时段的关键主题词主要涉及政治和经济,第四时段的“freedom”和“democracy”最具意识形态意义,反映了“美国要在全世界推行自由和民主”[1]16的意图。使用Concordance检索freedom,杰弗逊最先提到freedom时,搭配仅是freedom of religion(宗教自由),freedom of the press(出版自由),freedom and science(自由与科学)等;冷战以后,它的搭配截然不同。如:flame of freedom spreading throughout all the world(克林顿),the expansion of freedom in all the world(布什),this untamed fire of freedom will reach the darkest corners of our world(布什),carried forth that great gift of freedom(奥巴马)。

至于democracy,最早出现在第6任演讲,共现词块只是representative democracy(代表制民主)。20世纪50年代以后,democracy的使用频数迅速增加,语义韵也出现变化。如:more people on this planet live under democracy than dictatorship(克林顿),America’s faith in freedom and democracy was a rock in a raging sea(布什),effort of free nations to promote democracy is a prelude to our enemies’defeat(布什)等,布什声称要寻找和支持世界各地民主运动和团体(to seek and support the growth of democratic movements and institutions),以结束世上暴政统治(ending tyranny in our world)。

还有,用词方面的变化。分析标准化频率[4]10发现,20世纪以前,演讲中定冠词频率高达8.2%,但罗斯福以后只有5.7%。通用语料一般在7%左右。早期演讲which的频率也高,达1.3%,但20世纪初及以后只有0.3%。频繁使用功能词,讲话也就文绉绉。

早期演讲使用station、methods等词较多,后来的意义和用法发生了变化。现代英语station是车站的意思,而早期演讲指的是职务、职位等意思,如:for the station in which I am placed(第1任华盛顿),to be elected to a station(第2任亚当斯),to retire from this station(第3任杰弗逊),for official station(第14任皮尔斯)。到艾森豪威尔以后station不再出现,被position取代。

至于methods(和method),南北战争后频繁使用,如:the only sure method of returning(第18任格兰特),to seek public office by proper methods(第23任哈里森),every sound method of(第31任胡佛),they provide methods by which(第34任艾森豪威尔);但自艾森豪威尔之后,methods一词不再出现,被ways取代。

五、主题词词频的变化

把通用语料作为参照语料,可得观察文本的共时主题词,主题词的词频变化亦可反映历时差异。全体演讲文本的前十个关键主题词是:we、shall、nation、government、states、peace、constitution、freedom、people、I。此外,nations、powers、world、rights、wars、laws、duty 等词的主题值也位于前列。

这些主题词词频的历时变化大体有两个特点:一是早期频数很高,以后逐渐降低;二是早期使用率很低,后来逐渐上升。前一种以人称代词I为代表,名词有government、constitution、states、people、powers、rights、wars、laws、duty 等;后一种以人称代词 we 为代表,名词有 nation、peace,freedom、world 以及 nations,democracy 等。

本研究把观察语料44任总统共57次的就职演讲存为57个纯文本文件,为了明确显示演讲文本顺序与词频次数之间的对应关系,下文将以图示说明。下图中,纵坐标轴为词频次数;横坐标轴为按时间顺序排列的演讲文本的序号,如1表示首任总统华盛顿第一次就职演讲,57表示第44任总统奥巴马的就职演讲。

图1 主题词I(包括me、my)的词频变化

图2 主题词we(包括our、us)的词频变化

(一)第一人称代词的词频变化

人称代词I和we使用频数的历时变化分别见图1和图2。图1显示,早期演讲I(包括me、my等)使用频率很高。第1任(第1篇)华盛顿的演讲“我”用了57次,第9任(第14篇)总统使用最多,90次,后继者有所“克制”,频数呈下降趋势。第38任(第48篇)福特打破趋势,用了58次,他后来竞选连任被卡特打败。使用次数最少的是主张“大棒加胡萝卜”的第26任(第30篇)老罗斯福,只用一次。首位黑人总统奥巴马(第57篇)也只用5次(见横坐标轴57所示)。

相反,图2显示,we(包括 our、us等)开始很受“冷落”,后来才受“青睐”。第1任华盛顿“吝啬地”用了we、our、us各仅1次,历史最低。频数低的还有第2任、第4任、第16任(林肯)、第38任(福特)等的演讲(分别为第3、第6、第20、第48篇所示)。从第3任(第4篇)杰佛逊开始,“我们”的使用频数开始增加,总体呈上升趋势。频数最多的是第29任小哈里森(第34篇),164次,其次是第44任(第57篇)奥巴马,156次。在 we、our、us三个词中,our的使用频率最高。

奥巴马在就职演说中高频使用“我们”,在其他场合也不含糊。2009年在上海复旦大学演讲,面对中国学生,使用“我们”90次,高居主题词之首。人称代词有着不可替代的人际功能。显然,演讲中如何驾驭第一人称代词是个重要的语言技巧。美国总统似乎存在一个从“笨”到“精”的过程,而奥巴马无疑是一个“精明”的高手。

(二)主题词名词的词频变化

像“I”那样,government、constitution、states、nations、people、powers、rights的词频也是从高到低变化,wars、laws、duty等也是。像“we”那样,peace、freedom、world 的词频从低向高,nations、democracy 等也是。这种现象显然表明,19世纪及以前,前一种主题词占据话语主导地位,而20世纪及以后,后一种主题词成为主导话题。

美国建国后的100多年里,主要精力放在扩张领土和处理国内问题上,此时使用频数多的词是政府、宪法、权利和权力等词。进入20世纪后,美国成为世界列强并逐渐占据世界霸主地位,话语词频发生变化,“世界”“自由”“民主”的使用频次多起来。如“自由”一词总频数495次,平均8.6次,小布什第2任演讲就用了49次,占了十分之一,为历史之最。小布什上任不久发生9.11恐怖袭击,随后在反恐名义下进行伊拉克战争和阿富汗战争,然而第2任演讲“投鼠忌器”只字不提反恐,反而大谈“自由”。

检索发现,美国早期的总统们对democracy并不“喜好”,20世纪之前他们几乎不谈民主。最早提及的是第6任和第9任,此后100多年无人再提。1921年的第29任总统重拾话题,此后有8任总统频繁使用,最多的是罗斯福和杜鲁门。

图3 主题词states的词频变化

图4 主题词world的词频变化

另外,有两个关键主题词的频数变化呈现了相反的突变方式,它们是states和world,见图3和图4。

统计显示,美国建国100多年来至第27任总统塔夫脱,就职演说中谈到states(指美国)的次数总体上较高(见图3第1-31篇),此后频数突然下降并维持低频次。而world的词频,至1917年第28任总统威尔逊的就职演讲为止,一直很低(见图4中第1-33篇所示)。从第29任总统哈定开始,就职演讲提及world的词频突然上升并一直维持较高频次(见图4中第33篇以后所示)。

二战以后“美国自觉地承当起自由世界领导的天命”[1]14,world的使用频率必然高起来,甚至在听众的称谓中也有出现。第1任华盛顿称听众为“参、众议院的公民们”,第16任林肯把听众“定义”为“合众国的公民们”,近100年后第37任尼克松打破了这一“定义”,首次称my fellow citizens of the world community(世界的公民们)。美国近代总统念念不忘教导世界上其他国家的朋友们应该怎么做,敌人们又应该怎么做,这种“自觉”担当“世界师爷”的特点,到现任奥巴马也没有改变。

六、结语

以上分析,仅是从语料库的统计角度考察了美国总统就职演讲主题词的变化,观察的只是“冰山一角”。基于语料库的主题词是指统计意义上拥有特殊频率的词[5],使用频次异常地多的是正主题词,异常地少的是负主题词。“学术研究不要墨守成规”[6],词频没有无缘无故的多,也没有无缘无故的少,多与少的背后是深刻而又错综复杂的动因,这就需要“透过现象看本质”。本文从词频方面进行的统计调查,仅是呈现一个观察问题的视角而已。

[1]资中筠.从美国总统就职演说看美国的变与不变[J].美国研究,2005(2).

[2]罗建平,黄伶燕.名词非范畴化与副名结构的聚合关系[J].重庆交通大学学报:社会科学版,2010(3):128-132.

[3]《语料库在外语教学与研究中的应用研修班》的光盘语料库[DB].北京:中国外语教育研究中心、外语教学与研究出版社,2009.

[4]梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社.2010.

[5]钱毓芳.语料库与批判话语分析[J].外语教学与研究,2010(3):198-202.

[6]黄伶燕.高校课堂教学质量有感——兼议大学英语教学的重要意义[J].南方论坛,2011(9):102-103.

A Corpus-based Analysis of the Keywords in Inaugural Addresses of U.S.Presidents

LUO Jianping
(College English Department,Guangdong University of Petrochemical Technology,Maoming 525000,China)

Based on corpus data,the diachronic analysis shows that there are some significant changes taking place in the inaugural addresses of the U.S.Presidents.The use of the first personal pronounces,for example,has been changing from I to we;the keywords like states,nation referring to the United States are replaced by words like world,nations;and that some political words like freedom,democracy are used more and more frequently in the inaugural addresses after 1950s.Besides,some words like position,ways began to be used instead of station,methods since then.

corpus;inaugural addresses of U.S.presidents;keywords;diachronic analysis

H313

A

2095-2074(2011)05-0046-05

2011-07-07

罗建平(1954-),男,广东梅县人,广东石油化工学院大学英语部副教授。

是指使用频繁且频次差异显著的词,限于篇幅,按主题值高低列出每个时段的前十个,略去主题值不表;另外,对主题词作了必要归类,如代词包括了宾格、所有格(如I就包括me、my等),还有同义词,如 freedom、liberty、liberties、free等,为求简洁,只列一个(如 freedom)。如下:

猜你喜欢
词频频数主题词
关键词的提取与确定
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
中考频数分布直方图题型展示
25年来中国修辞研究的关键词词频统计*——基于国家社科与教育部社科课题立项数据
学习制作频数分布直方图三部曲
《中国骨与关节杂志》2016 年第五卷英文主题词索引
频数和频率
词频,一部隐秘的历史
盗汗病治疗药物性味归经频数分析
以关键词词频法透视《大学图书馆学报》学术研究特色