邵斌,何莲珍
(1.浙江财经大学外国语学院,浙江 杭州 310018;2.浙江大学外国语言文化与国际交流学院,浙江 杭州 310058)
美国北亚利桑那大学语料库语言学家Douglas Biber是英语语体研究领域的著名学者,其倡导的多维度分析方法(Multi-Dimensional Analysis)在语体研究中独树一帜,影响很大。他和另两位学者在1998年合著的《语料库语言学》一书是语料库研究领域的经典著作。
2012年,Douglas Biber和Randi Reppen再度合作,编纂了《语料库语言学》手册,该书由Sage出版公司出版。整套书共四卷,多达1600余页,收录论文60篇,分为十五个部分,论文的时间跨度为1993年至2011年,内容涉及语料库语言学的多个方面,集中体现了西方语料库语言学的最新发展。下面对其主要内容和观点做一扼要述介。
全书四卷,各有侧重。卷一为“词汇研究”,卷二为“语法研究”,卷三为“变体研究”,卷四为“方法及应用”。Biber&Reppen(2012)在引言中指出,过去20年来的语料库语言学研究主要包含两大方面内容:一是描述语言特征,诸如词的使用、词汇型式、词汇组合和语法结构等;二是描述某一语言变体的整体特征,如语域变体或方言变体。因此,本书的卷一和卷二可视作第一类研究,描述的是微观的语言特征,卷三和卷四则可视作第二类研究,描述的是宏观的语言变体。
卷一词汇研究 本卷包括三部分,分别为“词的使用”、“搭配和语义韵”以及“短语学”,收文16篇,侧重词汇的语料库研究。
第一部分仅有1篇论文,Lindemann&Mauranen基于密歇根学术英语口语语料库(MICASE)对美国大学学术口语中just一词的用法、功能和语音进行了探讨。文章发现,just在学术口语中常用作“最低程度语”(m inim izer)①。索引行分析还表明just常用于元话语语境,而对整个口语事件的语境调查则表明,just做“最低程度语”使用时,常有语音弱化的现象,如出现“jus”、“jiss”和“jist”等变体。
第二部分收文7篇,分别聚焦论文引言中搭配的语篇功能、语料库驱动的教学语法、语义偏好和语义韵、高级英语学习者的搭配使用、语义相关词对在使用中的相互排斥性,以及语义韵的定量研究等。Hunston&Francis阐释了作为词汇语法统一体的“型式语法”(pattern grammar),Stubbs探讨了定量方法在语义韵研究中的使用,分别为各自领域的经典论文。更值得注意的是两篇最近的论文。Morley&Partington的“A few frequently asked questions about semantic—or evaluative—prosody”一文,探讨了语义韵的重要性、语义韵和评价意义的关系、语义韵的词汇属性和话语属性之争、语义韵和词语内涵意义的联系、语义韵的历时演变等重要问题,对语义韵领域长期具有争议的话题进行了梳理,不乏洞见。Renouf&Banerjee的“Lexical repulsion between sense-related pairs”一文从8亿词的英国报纸语料库中获取数据,以近义词和反义词等语义相关词对为例探索了词汇相斥现象(即不在同一语境中共现),将词的横聚合关系分为“强搭配”、“弱搭配”和“相排斥”三类,有别于以往多聚焦于词汇共现的研究,可谓独辟蹊径。
第三部分收文8篇,分别聚焦美国大学课堂教学和教材中的词串、同现词列②的短语倾向、狄更斯小说中词簇的语篇功能、作为通用语的英语(English as a lingua franca,简称ELF)中的词块、学术演讲中的词串和话语标记、学术书评中的短语、学术口语中的成语,以及学术程式语词表等。Cheng等以p lay/role为个案探讨了同现词列的多种变体(如p lay a leading/vital role以及role to be played等),文章借助ConcGram软件获取所有p lay和role两词同现的数据,以语料库驱动的方法揭示了词汇的短语趋向及其共选机制。Mahlberg通过对狄更斯小说中的主题词簇及其语篇功能的分析,探讨了狄更斯独特的写作风格,譬如在“身体部位”这一类型主题词簇中,“his hands in his pockets”是五词词簇中使用最频繁的,它主要起语境构建功能,叙事中用其增加故事的生动性,读者能据此想见故事发生的情境。Römer探讨如何揭示某文本或文本类型的“短语样态模式”(phraseological profile model),文章对库容为350万词的语言学书评语料库中的短语进行提取和分析,来探索语篇中的语义构建,其探索过程主要经历以下四大步骤:识别短语项;确定项内变异;分析短语项的功能;分析短语项在文本内的分布情况。
卷二语法研究 本卷包括四部分,分别为“语法特征和语法变异分析”、“语法变异的历时研究”、“语法和语用”以及“‘词汇语法’(lexico-grammatical)研究”,收文13篇,侧重语法的语料库研究。
第一部分收文5篇,分别聚焦立场结构中“名词+that从句”型式的使用、以-ic和-ical为后缀的形容词对比、论文摘要中的评价词that、存现句there’s主谓一致性的多因素分析,以及英语口语中which引导的非限定性从句等。Charles对政治学论文语料库和材料学论文语料库进行对比,分析了不同学科中的“名词+that从句”结构在表示立场功能上所体现的差异。比如政治学文本中的“idea/argument+that”结构呈现出相对较高的频率,而材料学文本中呈现高频性的则是“evidence+that”结构,这反映了前一学科常需通过对“观点”和“论据”的分析来构建知识,而后一学科则多通过实验方法得到“事实”,从而获取知识。Riordan以MICASE语料库为数据来源,对存现句there’s的主谓(不)一致现象进行了多因素分析研究,涉及语言、句子加工、话语和社会等四方面因素。
第二部分收文2篇,内容涉及英语所有格功能演变及频率变化以及英语动词补语结构的型式演进。两篇文章都以“布朗家族语料库”(Brown fam ily corpora)为数据来源,该语料库包含四大可比语料库,即在20世纪60年代初和90年代初建成的代表美国英语的Brown和Frown语料库以及相对应的代表英国英语的Lob和Flob语料库,该系列语料库可用于英语变体的对比研究及历时研究。Hinrichs&Szm recsanyi对英语所有格结构,即’s和of结构的功能和频率的变化进行了研究,论文对影响该结构的各种因素(如语义语用因素、音位因素、句子加工因素、语言经济性因素等)进行语料库标注,再以二元逻辑回归方法进行多因素分析。
第三部分收文4篇,内容涉及18世纪谦卑话语中的礼貌性和情态意义、历时言语行为分析、英语口语的语法,以及英语口语中的滞留现象(persistence)③。Leech介绍了一系列英语口语语料库,并基于语料库分析了口语语法和书面语语法的异同,着重探讨了“会话语法”的特征,如交互性、对实时加工需求的适应性、相对简单性和非完整句状态(non-sentencehood)等。Szm recsanyi以BNC语料库的口语分库和弗莱堡英语方言语料库(FRED)为数据来源,以比较结构、小品词位置和将来时态标记词为个案探讨英语口语中的滞留现象,从而以语料库方法验证了心理语言学中的假设。
第四部分收文2篇,内容涉及英语口语中表将来时的进行体动词,以及“构式搭配”(collostruction)。Nesselhauf&Römer从BNC语料库的口语分库中提取了100个表将来时的最高频进行体动词,对其共现的副词、主语、be动词的型式,以及其所处的句法环境进行考察,探索了英语口语中的词汇语法型式。Stefanowitsch和Gries以构式语法为理论基础,提出“构式搭配”的概念,即搭配(collocation)和构式(construction)的缩合形式,并从语料库定量角度对其进行细致分析。该研究为语料库语言学和认知语言学相结合的交叉研究,是颇具前景的研究领域。胡健、张佳易(2012)对其做了详细介绍,兹不赘述。
卷三变体研究 本卷包括四部分,分别为“语域描述”、“语域变异”、“方言变异”以及“国别变体和世界英语”,收文15篇,侧重英语变体的语料库研究。
第一部分收文5篇,内容涉及伦敦皇家学会主办的《自然科学会报》的社会历史语篇分析、外包呼叫中心语篇的语言变异、生物化学领域论文的修辞结构、历时视角下的医学病例报告写作特征、某体裁中的语步结构(discourse move)④的语料库分析等。Friginal从菲律宾的美国外包呼叫中心收集数据建立语料库,以多特征多维度分析方法对不同语篇的语言变异模式进行了定量分析,从而对呼叫中心语篇这类语体做出充分描述。
第二部分收文3篇,内容涉及美国大学生口笔语的多维度比较、西班牙语口笔语的多维度分析,以及基于语料库的英语进行时态演变分析。Biber&Davies等以多维度分析方法对西班牙语口语和书面语的语域变异进行了细致描写。他们设计并建设了西班牙语语料库(包含11个口语语域和8个书面语语域),对其中85项语言特征进行标注,之后将这些语言特征归为六大维度,最后从这些维度对口语和书面语的差异进行量化分析。
第三部分收文3篇,内容涉及标准英语演进过程中英语用法所体现的性别差异、区域性语法(community grammar)的频率和变异,以及基于语料库的方言计量学(dialectometry)。Tagliamonte&D’Arcy以引语导入语be like为研究对象,对加拿大多伦多地区199名年龄分布为9岁至87岁的市民进行采访,从中提取6300句引语,之后对不同年龄段的be like使用特征进行详尽分析,该研究是典型的“基于语料库的社会语言学研究”。Szm recsanyi以弗莱堡英语方言语料库为基础,对34种英语方言变体的57项语言特征进行标注,并提取它们的频率数据,将其转换为频率矩阵和距离矩阵,从而实现方言变异的地图可视化。该过程是基于语料库的变异研究和方言计量学定量分析的结合,也是语言变体研究中新的发展方向,比利时鲁汶大学的“定量词汇学与变异语言学”研究所也主要从事这方面的研究⑤(见Geeraerts,2010;Grieve,Speelman & Geeraerts,2011)。
第四部分收文4篇,内容涉及英语变体中集体名词和动词主谓一致现象、新英语变体中的动词补语样态、东非英语中的文化话语,以及英语附加问句等。Hundt着眼于内圈英语和外圈英语变体在集体名词主谓一致型式上的差异比较,她以国际英语语料库(ICE)的英国分库和新西兰分库作为内圈英语代表,以菲律宾分库和新加坡分库作为外圈英语代表,对该语言现象在上述四个分库的差异做了量化分析。
卷四 方法及应用 本卷包括四部分,分别为“语料库设计”、“分析方法”、“以应用为目的的语料库调查”以及“教学应用”,收文15篇,侧重语料库的设计、方法以及在应用语言学领域的应用研究。
第一部分收文3篇,内容涉及语料库的代表性、历史语用学中的数据,以及早期现代英语口语文本的语言学研究等。Culpeper&Kytö着眼于17世纪和口语相关的文本类型研究。他们以四种文本,即证人证词、审判记录、散文小说(prose fiction)和戏剧文本为研究对象,考察上述文本作为面对面口语文本的可行性,从共时和历时的角度探讨了以上文本的代表性问题。其考察点主要集中于口语文本的三个典型特征,即词汇反复、话轮转换(包含问答相邻配对和话语打断)、四类词语的交互特征(包含第一人称代词、第二人称代词、指示代词和表征只有说话者本人才能意识到的状态或行为的个人动词)。
第二部分收文4篇,内容涉及《罗密欧与朱丽叶》里角色对话中的词语、语料库的离散度计算和修正频率、可比语料库,以及从主题词到主题语义域等。Culpeper把主题词的概念延伸至主题词类和主题语义域。他以《罗密欧与朱丽叶》剧本中六个角色的对谈作为研究对象,研究人物对话中的主题词语、词类和语义域,试图揭示每个人物角色的独特性。与之类似的是Rayson的文章,他以兰卡斯特大学开发的Wmatrix软件对英国两党某次选举宣言的文本进行语义标注,对其主题词、词类和语义域进行了比较。该研究过程首先是建库,然后进行自动标注和分析,再对数据进行提取,之后再设计研究问题和研究思路,这和大多数需事先确定研究问题的语料库研究有所不同。他认为该模式可称作是“数据驱动”(data-driven)范式,是“基于语料库”和“语料库驱动”研究范式的结合。
第三部分收文5篇,内容涉及口语语篇中的词汇覆盖率、本族语和非本族语学生作文中的make一词的语法和词汇型式、频率和语法教学的关系、学术词表,以及本族语和非本族语学生作文中的连接词使用等。Biber&Reppen探讨了如何从语料库中发现新的语言使用现象,并将其应用于语法教材设计。他们选取了6种通行的语法教科书作为研究对象,以基于语料库编纂的《朗文英语口语和笔语语法》著作中的频率数据作为对照,从名词前修饰语、现在进行时和一般现在时的重要性对比,以及常用动词作为三个个案,探讨了语法教材的涵盖面、语法项目的编排次序、语法特征例句中的词汇常用程度等三方面的教材设计问题。该研究颇具实用意义,就笔者所知,基于语料库的语法教材在我国尚不多见。
第四部分收文4篇,内容涉及语料库索引行在课堂上的应用、通过语料库工具学习学术词汇、学习者语料库与学术用途英语(简称EAP)教学,以及语料库在初始教师教育(Initial Teacher Education)中的运用等。Gilquin,Granger和Paquot探讨了学习者语料库在学术用途英语教学中的应用。以往EAP教学一般利用本族语语料库,而此类语料库甚少涉及学习者写作时所面临的特殊问题,换句话说,EAP教学中存在着学习者语料库缺位的问题。论文以国际英语学习者语料库(ICLE)为数据来源,以BNC的学术英语部分为参照语料库,探讨了《麦克米伦高阶英语学习词典》第二版的编纂。她们经语料库对比发现了学习者写作中存在的频率、语域、词序、语义和短语等五大方面问题,该词典将上述问题一一明示,从而达到提高英语学习者学术英语写作能力的目的。
纵观全书,《语料库语言学》可谓是本领域自Teubert&Krishnamurthy(2007)编纂的《语料库语言学:语言学关键概念》以及Lüdeling&Kytö(2008,2009)所编纂的《语料库语言学:国际手册》之后的又一长篇巨制。其突出优点表现如下:一是选文新。90%的文章皆为21世纪以来发表的最新论文,集中体现近20年来语料库语言学研究的最新发展。二是覆盖面广,文章涉及语料库研究的各个方面,这从其选文的期刊来源亦可看出。文章来源分布主要有以下三类:其一为语料库语言学期刊,如International Journal of Corpus Linguistics(12篇)、Corpus Linguistics and Linguistic Theory(2篇)和Corpora(3篇);其二为应用语言学期刊,如Applied Linguistics(6篇)、English for Specific Purposes(7篇)和TESOL Quarterly(5篇);其三为英语语言学期刊,如Journal of English Linguistics(5篇)、English Language and Linguistics(3篇)和 World Englishes(2篇)。三是突出英语语体变异和英语变体研究,特别强调使用多维度分析方法进行语体变异分析,而这在国内语料库研究中尚不多见,较为突出的仅有桂诗春(2009)和潘璠(2012)。
本手册对国内语料库语言学研究的启示主要有二。一是本书聚焦语料库的应用研究。语料库是理论,是方法,还是学科?迄无定论。本书对此也不予置评,编者本着务实的态度,更关注语料库如何在语言研究及语言教学中发挥作用,因此属于“应用语料库语言学”(applied corpus linguistics)。这种关注其应用的脚踏实地的做法值得学界学习。二是本手册特别关注运用语料库来研究语言变异。语言的差异来自于各个方面:共时的或是历时的;年龄的、性别的、地域的或是社会阶层的;语域的、文体的或是文本类型的,等等。国内对语言差异的分析多基于定性研究,而利用语料库则可对影响语言差异的诸多因子进行综合分析,从而确定它们各自所起的作用,即上文所说的“多维度分析方法”。本书为语言变异研究提供了借鉴,指明了方法。
综上所述,Biber和Reppen主编的《语料库语言学》一书可谓是语料库领域颇具特色的最新巨著,通读全书,读者对语料库语言学的应用及其最新发展当会有更进一步的了解和认识。
注释:
① Quirk等(1985:445-446)把“强化语”(intensifier)分为“增强语”(amplifier)和“减弱语”(downtoner)。“最低程度语”为“减弱语”中的小类,如hardly、barely等,此类副词性表达方式可对句中另一成分的意义起极度减弱的作用。
②“同现词列”为语料库语言学术语“concgram”的汉译,它指的是“任意方向连续或非连续强搭配”,比如increase和 expenditure之间可能出现“expenditure will increase”、“increase expenditure”、“increase government expenditure”等排列形式,expenditure/increase即可视作一组“同现词列”。也有学者译为“框合结构”。
③“滞留现象”是指在一个人的话语中常有相同结构聚集的现象,这说明话语中的连续可变位点可能产生相互影响。譬如,诸多心理语言学实验表明,说话者倾向使用刚被使用过(或被激活)的语言型式,即所谓的“产出触发”(production priming),具体有“句法触发”、“语义触发”、“词汇触发”、“形态触发”、“形式触发”和“词序触发”等。
④体裁分析(genre analysis)研究中提出“语步”概念(也译作“话步”),认为语步是构成某体裁的基本部分。譬如,学术论文中一般包括四语步,即前言、研究方法、研究结果和讨论等。
⑤事实上,Benedikt Szmrecsanyi已于2013年加入鲁汶大学的“定量词汇学与变异语言学”研究所,该所将进一步推动其“基于语料库的语言变异多维度分析研究”。
[1]Biber,D.,S.Conrad & R.Reppen.Corpus Linguistics[M].Cambridge:Cambridge University Press.
[2]Biber,D.& R.Reppen(eds.).Corpus Linguistics[C].London:SAGE Publications,2012.
[3]Geeraerts,D.Ten Lectureson Cognitive Sociolinguistics[M].Beijing:Foreign Language Teaching and Research Press,2010.
[4]Grieve,J.,D.Speelman& D.Geeraerts.A statisticalmethod for the identification and aggregation of regional linguistic variation[J].Language Variation and Change,2011,(2):1 -29.
[5]Lüdeling,A.& M.Kytö(eds.).Corpus Linguistics:An International Handbook(Vol.1).Berlin:Mouton de Gruyter,2008.
[6]Lüdeling,A.& M.Kytö(eds.).Corpus Linguistics:An International Handbook(Vol.2).Berlin:Mouton de Gruyter,2009.
[7]Quirk,R.,S.Greenbaum,G.Leech& J.Svartvik.AComprehensive Grammar of the English Language[M].London:Longman,1985.
[8]Teubert,W.& R.Krishnamurthy.Corpus Linguistics:Critical Concepts in Linguistics[C].London:Routledge,2007.
[9]桂诗春.基于语料库的英语语言学语体分析[M].北京:外语教学与研究出版社,2009.
[10]胡健,张佳易.认知语言学与语料库语言学的结合:构式搭配分析法[J].外国语,2012,(4):61-69.
[11]潘璠.中国非英语专业本科生和研究生书面语体的多特征多维度调查[J].外语教学与研究,2012,(2):220-232.