周 韵
(湖北科技学院 外国语学院,湖北 咸宁 437100)
自从第二次世界大战结束以后,英语在全球范围内持续扩张,一方面使它作为国际通用语的地位得到了进一步巩固;另一方面产生了大量带有浓厚地域特色的国际变体,使世界英语出现多元化的局面。英语的全球化研究的兴起是多角度的。一方面它是世界主要语言,国际交流的主要载体,是国际经济、外交、科学和媒体及个人交往中不可或缺的工具;一方面它被谴责是“杀手语言”(killer language),对全球本土语言、方言和文化造成伤害和毁灭。[1]尽管在英语变体研究上研究者持有不同的方法和态度,对各种变体特点的一个清醒的全面认识在英语教学和学习中的重要地位毋庸置疑。本文试图从语料库语言学的视角,借助有效的语料库工具,帮助语言学习者和研究者行之有效的对比各种英语变体在词汇、搭配、语义,句法等方面的特点,并根据对象的不同采用恰当的变体形式。
第一个现代意义上的语料库是Randolph Quirk于20世纪50年代末在伦敦大学学院建立的“英语用法调查”(Survey of English Usage)语料库。[2]二十世纪 60年代和70年代分别在美国和英国出现了一百万词库容的BROWN语料库和LOB语料库,这两个语料库都采用了相似的建库原则,对语料进行了分类和人工词性标注,对后期语料库的发展产生了重要的影响。20世纪90年代以来,语料库的发展呈超大规模趋势,类型更加丰富,应用更加广泛,其中典型代表有共建英语语料库(Cobuild Bank of English),朗文语料库(Longman),英语国家语料库(BNC)等等。
随着计算机技术的快速发展,语言学研究也揭开了其新的篇章进入到语料库语言学时代。作为一门年轻的、独具特色的语言研究学科,语料库语言学开始于20世纪60年代。在其萌芽阶段,语料库语言学的发展并非一帆风顺,而是受到了强烈的质疑和否定,因为当时语言学界正处于乔姆斯基转换生成语法学说占统治地位,具体的语料并不被当做是语言研究的对象。随着语言研究的不断深入,语言学家们逐渐认识到从实际使用的语言实例中观察语言规律的必要性,语料库语言学才逐渐成为语言学的主要分支。
美国杨百翰大学(Brigham Young University)成立于1875年,是位于美国犹他州的一所四年制的私立教会大学,计算机科学、初级教育、工程等学科在该校颇负盛名。杨百翰大学的Mark Davies教授主持开发了一系列的英语语料库,其中包括侧重于美国英语变迁的美国当代英语语料库(Corpus of Contemporary American English),专注于书面语的时代杂志语料库(TIME Magazine Corpus),反映口语用法的美国肥皂剧语料库(Corpus of American Soap Operas)。2013年4月,美国杨百翰大学语料库家族又增添了一位新成员——世界网络英语语料库(Corpus of Global Web-Based English),为英语学习者了解各国英语变体使用情况提供了方便。
世界网络英语语料库(http:∥corpus2.byu.edu/glowbe)的第一个特点是库容大,覆盖面广。该库库容达到19亿个词汇,是BNC语料库的近20倍,收集了包括美国、加拿大、英国、爱尔兰、澳大利亚、新西兰、印度、香港等20个国家和地区的网页资料。由于其库容大,能够提供丰富的语言资源,因此能够使小容量的语料库所无法体现的语言规律得以体现。语料库的第二个特点在于其语料来源的特殊性。语料来源的主要渠道是通过谷歌的general searches和博客内容获得,并通过谷歌高级搜索中的地域检索(region function)来确保语料来源于相应的国家,且通过域名和IP地址进一步确认,使用HTTrack下载网页内容并通过去重处理,最终构建语料。第三个特点则在于其使用的方便性。该语料库提供在线服务,只要能够连接网络,通过简单的注册就能登录该语料库并使用。语料库界面设计人性化,实现了语料与检索工具的结合,有效的提高了语料库使用的普及程度。
和杨百翰大学所提供的其他语料库一样,世界网络英语语料库的界面如图1所示,其主要功能分为DISPLAY,SEARCH STRING,SECTIONS 和 SORTING AND LIMITS四个大块。
图1 语料库检索主页面
这四个部分分别表示检索方式、检索对象、检索结果范围选择和检索结果排序的各项设置。在各检索项的右边均有问号标志,点击后向使用者提供帮助和示例。
词汇是一门语言的灵魂。虽然同属于英语这一门语言,但是在不同英语国家其用词则带有鲜明的地域特征,其中一个典型的的例子就是“lah”这个词的用法。在语料库中检索lah一词后得出其在语料库中的总频率为2696次,而其用法分布则表现出明显的趋中性。在马来西亚和新加坡英语中出现的频率最高,分别为1520和806次。在其他十八个英语国家和地区中出现的频率则均在100次以下。频率分布表明,lah一词是集中出现在马来西亚英语和新加坡英语中的特有的句法现象,通过观察该词的语境共现索引行可以得出:lah通常作为助词,基本上可以加在除疑问句之外的任何句子的末尾。lah不仅有强调的作用,还能增加说话人与听话人之间的亲近感,如“He is English major lah”;“It's something like being over the top lah”。有时也可用来表示安慰的语气。
正如英语学习者所熟知的那样,英式英语和美式英语在词汇、拼写、发音、句法等方面都有着显著差异,而这些差异中首当其冲引人注意的无疑是词汇上的差异。笔者以英语学习者耳熟能详的cab和taxi为例来观察其在各种英语变体中的使用情况,在检索结果中分别选取了两词使用频率最高的5个国家。尽管国内英语学习者普遍认为cab属于美式英语而taxi隶属英式用法,而下面的检索结果则与我们的预期值大相径庭。无论是taxi还是cab,在英国使用的频率都是最高的。从使用总频率来看,taxi的用法(35180次)要比cab的使用(13105次)更加普遍一些。尽管在二十个英语国家和地区中美国人使用cab的频率(2203次)排名第二,仅次于英国,但是如果将taxi和cab在美国的使用频率进行比较,taxi一词的用法(2808次)要更频繁一些。上述检索结果表明:在世界网络英语语料库中,taxi和cab并不能成为美式英语和英式英语的典型代表。
表1 cab和taxi在各英语变体中的使用频率分布
在写作或者是口语中适当运用习语,体现了学习者对英语这门语言的掌握程度。如果使用得好,很能够起到锦上添花的作用;但是如果忽略了在不同时期不同英语变体中习语使用的变化,则很容易导致语用失误。Rundell(1995)在其文章中曾提到,一位从荷兰到苏格兰来野营的女士操一口流利的英语,发音准确,用词地道,让人几乎以为她就是一名标准的英式英语的本族语使用者。然而,在即将结束谈话之前她说出的一个句子——because it was raining cats and dogs up there,让Rundell意识到她所使用的并不是英式英语表达,至少不是当前的主流表达。Rundell的证据则是:在库容为一亿词的BNC语料库中,该用法“raining cats and dogs”在整个语料库中仅仅出现了1次,而在BNC的口语语料库中则一次也没有出现。[3]朱乐红(2002)也指出他在新西兰留学时,以英语为母语的新西兰人竟然听不懂rain cats and dogs。通过在Brown和 LOB语料库中检索该词后,发现其仅在LOB中出现过一次。[4]笔者在 GloWbE 中输入[rain]cats and dogs表示检索以rain为词源的包括其各种屈折变化形式在内的用法。检索结果体现,包括 raining/rained/rains/rain cats and dogs用法在内的使用总频率为179次,其中raining cats and dogs以148次居于首位,表示该短语使用时有其约定俗成的形式。从其使用的总频率来看,在英国、美国、澳大利亚、印度、马来西亚和菲律宾等国家使用的频率较高。在巴基斯坦、香港等国家和地区则最低。从检索结果中可以发现该习语的用法虽然仍然存在,但是已经逐渐丧失其主流地位用法。语料库检索结果证明,在二十个以英语为母语或者是官方语言的国家和地区,rain cats and dogs的用法虽然没有被淘汰,但是其使用频率最高只到29次,最低低至3次,表明该用法处于逐渐消亡的状态中。
早在上个世纪中期,Firth就曾一针见血的指出,了解一个词的用法需要将其搭配用法纳入考虑范围,“You shall know a word by the company it keeps.”[5]书面语和口语语料库的对比研究结果显示,口语中的搭配用法更为频繁。[6]这种搭配关系,不仅体现在词与词位置上的共现,还包括语义上的配对。大量的语料库研究已经发现,词项的意义与其搭配形式以及分布形式密切相关。Firth及其追随者Halliday和Sinclair都将考察词项的搭配行为看作是词汇语义学的核心。[7]对于同一个词,在不同的变体中所表达的意义则各不相同。在语料库查询栏输入[scheme].[nn*],在搭配栏内选定左右四个词距跨度范围,在section部分分别选定美国和英国,表示检索美式英语和英式英语中以名词scheme为中心的左右四个词距范围内与之连用的形容词,笔者选取了检索结果中的前8项:
表2 英式英语和美式英语中scheme的主要搭配词
观察表2中的信息可以发现,美式英语中大多数与scheme连用的形容词包含有否定或消极的意味,表示对不好的事情的计划、安排;而英式英语中连用的形容词则相对中性,甚至带有褒义,如eligible、generous。因此,在美国使用scheme则可能表明说话人对于即将发生的事情不看好,持否定态度。因此,非本族语者在使用英语时,应该留意不同变体中单词的语义色彩,避免产生误解。
自从语言学研究完成了从规定式到描写式的转变后,句法研究者们的重点不再是忙着制定规则,而是要从语言使用的实例中归纳提取出句法规则,在这一点上,语料库可以使隐藏在字里行间的语言规律凸显出来,而这种规律很可能不是一成不变或是放之四海而皆准的。英语中的主谓一致历来是令学习者头痛的内容,笔者考察了在测试中经常涉及到的each of them和none of them作主语时谓语动词的单复数形态。
笔者分两次将each/none of them is/was和each/none of them are/were输入到语料库的检索框中,其中符号“/”表示一种并列的选择关系,each/none可被理解为each或者是none,检索的目的是查看当each of them或none of them作为主语时,与其连用的谓语动词的单复数使用情况。检索结果显示了一个非常有趣的结果,首先,在语料库所涉及到的二十个英语使用国家和地区的所有变体中,each/none of them作主语时谓语动词既可以使用单数,也可以使用复数,从各变体使用总频率的均值来看,单数用法(1.38)相较于复数用法要更为普遍些。按照各变体中每百万词中each/none of them的单复数用法使用频率的高低,笔者截取了前8项结果,如表3所示。
表3 each/none of them的单复数用法分布
观察表3中的数字,可以看到在主流英语使用国家,如美国、澳大利亚、新西兰、英国和加拿大,each/none of them通常接复数谓语动词,在马来西亚、印度、南非等国家则倾向于单数用法。孟加拉国和巴基斯坦两国的情况比较特殊,不管是单数用法还是复数用法,使用频率都很高,进入了前六项,其中巴基斯坦的单数性用法在所有变体中排名第一,而复数性用法也高达第三位。孟加拉国的复数性用法则排名第二,高于其单数性用法。从表中的信息可以看到,即使是同一个句法模式,在不同的变体中,也有其特殊规律。
句法特征也体现在各种英语变体中不同结构使用情况的差异。笔者以stop sb doing sth为例来观察这一句法结构在各国英语变体中的使用差异。该用法在语料库中使用的总次数为8050次,平均每百万词语料中出现的频率为4.27。在二十个国家与地区所使用的英语变体中,仅有英国、爱尔兰、澳大利亚和新西兰四个国家的使用频率高于平均值。该结构使用频率最高的是在英国,为11.45,而菲律宾的使用率最低,100万次用法中该结构使用甚至不到一次。上述结果体现了同一句法结构在各种不同英语变体中的使用差异。
作为一门在全球广泛使用的语言,英语的具体用法在各个国家各有差异,英语的学习者和使用者们需要清醒地认识到各个英语国家英语用法上的特点。世界网络英语语料库为英语学习和研究提供了一个有效的平台,使用者可以通过设置合理的检索条件来观察各类英语变体在词汇、搭配、句法等方面的共性与特性,以便最有效地掌握该变体的特点,使用最地道的表达。
[1]张荣建.未到尘埃落定时—英语变体研究的阶段性评述[J].山东外语教学,2008(1):32-38.
[2]王克非.语料库翻译学探索[M].上海:上海交通大学出版社,2012:9.
[3]RUNDELL M.The word on the street:spoken English and the BNC[J].English Today,1995(43):29 -35
[4]朱乐红.利用语料库研究不确定频度词[J].天津外国语学院学报,2002,9(3):34-37.
[5]FIRTH J R.Papers in Linguistics 1934 - 1951[M].London:Oxford University Press,1957:11.
[6]LEECH L.Grammars of Spoken English:New Outcomes of corpus-oriented research[J].Language Learning,2000(50):675 -724.
[7]潘璠.基于语料库的语言研究与教学应用[M].北京:中国社会科学出版社,2012:31.