《语料库与话语研究:整合话语和语料库》评介

2019-11-26 18:01赵永刚
英语知识 2019年4期
关键词:语料库话语分析

赵永刚

(北京外国语大学中国外语与教育研究中心,北京)

1. 引言

语料库语言学是基于对大量的电子文本检索,以词汇、短语为研究核心,以探索语言局部使用尤其是发掘语言潜在意义为研究目的,具有明显的方法论倾向的应用语言学学科。话语分析是以句子以上的语言单位为研究对象,以揭示言语交际中的意义协商为研究目的,有着明显社会学倾向的语言学学科。前者偏向定量分析,而后者偏向定性研究,但两者的共同点在于都研究意义、研究语言的实际使用。正是由于这个共同点,两者才可能优化组合,更好地研究语言的使用。本书即是继 Baker和McEnery (2013)之后又一本聚焦语料库语言学与话语分析结合的论文集。

2. 内容介绍

除第1章外,全书共收录了13篇文章。编者在第1章介绍了语料库语言学和话语分析的主要概念及两个研究领域结合的优势和挑战。接着,编者简介了本书的章节安排。第一部分(2—5章)的研究涉及新型文本类型或模式,如电脑辅助交际文本。第二部分(6—10章)探讨和社会实践相关的话语。第三部分(11—14章)则通过话语分析揭示意识形态或态度立场。

在第2章中,Dawn Knight考察了剑桥和诺丁汉e-语言语料库(CANELC)中情态动词的使用。通过比较和对比,作者发现在twitter中情态动词特别少用,而在e-mail和短信中则很常见;整体而言,CANELC中情态动词的频次高于BNC中口语和笔语子库,这一点是出乎意料的。作者认为,情态动词的使用与使用者对其交际对象的评估(群体大小、有无利害关系)有关:由于twitter的受众群体大且不确定,其作者便会较少使用情态动词;而e-mail和短信的受众群体小且一般有利害关系(亲友、生意伙伴等),因此其作者会更多地使用情态动词以维护交际双方的面子。而相对于口语,e-语言先天缺少当面交际时的手势、副语言和语言外线索,于是更多地使用情态动词以做补充。

在第3章中,Adolphs,Knight和Carter尝试将“非语言”数据流纳入口语语料库分析。三位作者认为由于自然发生的交际是碎片式的,交际者在交谈的过程中不断调整自己的交际目标,所以话语分析应该考虑语境的这种动态特征。作者使用Fieldwork Tracker(手机APP)来记录3对参观英国艺术展的受试在不同时间、不同地点的话语,形成具有多模态的动态语境口语语料库,以语料库驱动的方法,通过对高频词的分析逐步将研究重心从指示语转到评价语的使用,发现在展馆中人们更多地将like作为评价语使用,在展馆外则将更多地将其用作引言(quotative),而更多地使用love作评价语。作者们认为,这项研究提供了旨在研究超越常规概念的文本和语言的课题做出示范。

Bednarek在第4章讨论了用语料库方法分析另一种多模态文本——电影和电视时产生的问题。她不仅关心剧本,也关注视听媒介所展现的叙述、肢体语言、视觉交际和举止成为话语一部分的方式。在讨论了建立或获得这种语料库的方法,特别是转写问题后,她分析了美国电视连续剧Nurse Jackie中的一个场景,展示了图像和文本是如何结合起来创造意义的。镜头特写经常用来解释剧本中的元素,若非如此,这些元素就会让剧本“读者”不知所云。另外,眼动和眼神交流有助于人物性格刻画,这表明仅仅分析口语中的词语对这种多模态的媒介研究是不够的。

Karin Aijmer在第5章中研究了口语中的话语标记语。作者指出话语标记语由于位置灵活、表达的功能较多(如组织话语、调节交际双方关系、表达说话人态度情感等),给句法和语义分析带来了挑战。在案例中,她比较了ICE中英国英语、新西兰英语、新加坡英语和香港英语口语中actually的使用,通过比较词频和分布发现,actually在前两种变体中更多地出现在句子的中间位置(接近70%),而在后两种变体中更多地出现在句子起始位置(超过50%)。进一步比较发现,尽管actually有核心意义,但在不同的变体和位置中有明显差异:出现在句子右侧时用来纠正前面的宣称,而出现在左侧时则用来引出视角的转换;在香港英语和新加坡英语中,actually有主体意义,指示话语的理解和相关性,而在英国英语和新西兰英语中则具有主体间性,指向更早的宣称并对其进行纠正。作者对actually的分析展示了语料库分析要在多大程度上做定性分析,超越索引行去考察较长的对话片段以确定意义。

Bevitori在第6章对1960—2013年10位美国总统演讲中environment的意义演变做了历时考察。作者通过检索environment及其变体形式(environmental, environmentally)入手,得到其高频搭配词protect和clean,通过检索protect*及其近义词preserv*和conserv*得到高频搭配词energy,然后分别对energy和clean所在的索引行做了分析。结合社会和政治语境,作者展示了environment的意义是随着政治优先目标、历史事件和当权者的世界观的变化而不断变化的,并发现环保、节能和洁净三个概念随着时间推移逐渐交织在一起。

在第7章中,Hunt和Harvey通过语料库的常用技术,包括主题词、搭配和索引行分析发现并描述了人们用以表达其对自身饮食疾病的担忧和协商其厌食症患者身份的语言的突出特征。作者收集了两个在线论坛中的信息,建立了THF(Teenage Health Freak)语料库和anorexia.net语料库,发现在前者中主题词am, I’m, anorexic和stone突出了疾病和健康异常情况,构建了医疗话语,而在后者中围绕ED(eating disorder)的语法型式更少地用于将饮食性疾病构建成个人的所有物或特征,而是构建成和患者分离的、独立的实体,即饮食性疾病被赋予语法上的主体地位。通过对比,作者发现了两个论坛中关于饮食疾病话语的一系列差异,并讨论了这类研究对于医疗从业者了解病人的话语、在诊疗时调整话语策略以达到更好的医患沟通的积极意义。

在第8章中,Jack Hardy研究了不同年级和不同学科的学生学术写作中语言使用的差异。作者采用多维度分析方法研究了Michigan Corpus of Upper-level Student Papers中四大学科门类中大四、研究生一、二、三年级学生的学术论文在四个维度的异同。研究发现,在第一个维度(参与性学术叙述vs.描述性信息型话语)中,不同专业有明显差异:哲学和教育专业的学生倾向于使用更多的与参与性叙述有关的话语特征,而生物和物理专业的学生更多地使用名词、形容词和长词等和描述性信息型话语有关的特征。在年级差异方面,大四的学生使用最多的参与性学术叙述,而研一学生使用最多的描述性信息型话语,研二、研三学生的论文中则又再次体现较多的参与性。在其他三个维度中也发现了类似的情况。这表明从本科生到研究生的转变导致了写作风格上的“突变”,然后逐渐回到“中间状态”,这可能和研一学生对研究生写作的“学术”期待并做了过量的补充努力有关。

在第9章中,Walker和McIntyre借助Semino和Short(2004)的话语呈现(Discourse Presentation)模型,以当代英语新闻为参照,研究了Corpus of Early Modern English News Writing(1500-1750)中的话语呈现模式(引语呈现、写作呈现和思想呈现),发现在早期英语报道中,一个突出而有趣的特点是呈现被报道人物的思想和情感状态,而思想呈现往往或用作新闻总结和大众观点,或用作宣传或用来增加新闻报道的戏剧性,并解释这些特点可能与当时媒体自由没有保障,发表不同政见会受到严惩有关,也可能与报道作者的意识形态立场有关。本文显示通过小规模、大量标注的语料库可以用来发现型式、做出假设,而后在更大规模的、未经标注的语料库中验证、探索是对不以形式为基础(form-based)的范畴进行研究的有效方法。

在第10章中,Hocking尝试将语料库工具与社会学和话语分析方法结合来对职业或机构场景中的话语进行多视角研究(multi-perspectival study)。为了考察在一个高等艺术与设计项目中创造性实践是如何发生的,作者收集了一系列不同类型的文本:学生简报、教师简报、教师讨论、师生讨论的录音和对教师、学生的采访的录音,以及已发表的关于艺术家和设计师的艺术实践和感悟的文本。作者通过对学生简报的通读确定ideas为研究核心,采用NVivo工具对参与者对ideas的特征表述进行分类,并对ideas的搭配型式进行索引行分析,发现关于ideas的表述包含两个隐喻——导管模型和转移/转换过程,即学生简报中的抽象概念通过导管(简报或师生讨论)进入学生的认知,并转化成创造性的作品。在社会-历史语境下,作者讨论了不同时期的知名艺术家如梵高对ideas这个概念的认识,以解释本研究语料库中围绕ideas的话语。

在第11章中,Partington首先讨论了塑造之塑造的概念(representations of representations),指出媒体对实体的报道是塑造,而研究者对媒体文本的分析是对实体的另一重塑造。接着作者比较了英国两家报纸与阿联酋和埃及的英文报纸对Arab World的塑造。作者以Arab World为检索词,比较了其在2010和2013年报道中的型式,并对这些型式进行了及物性分析,发现2010年在四家报纸中,Arab World都被塑造成被动的接收者,对外界的刺激特别敏感,进而做出反应。形成对比的是,尽管在英国报纸中也有对western world的批评和负面塑造,western world更多的是被塑造成主动的施事。同时发现,在2013年四家报纸的报道中,Arab World的被动形象大大减少。Parting-ton指出批评话语分析要特别注意区分新闻报道中的负面塑造(negative reporting)和歧视塑造(prejudiced reporting),揭示负面现象是新闻的价值所在,而对比语料库分析有助于这种区分。

在第12章,Baker和McEnery建成了有关系列纪录片Benefits Street的twitter语料库。通过对这个专用语料库的前100个主题词的分析和分类,而后对主题词建立搭配网络(collocational network),并通过索引行分析对搭配网络进行语境解释,作者发现了语料库中三个主要的话语,即“懒散穷人”话语、“穷人是受害者”话语和“富人变得更富”话语,同时也发现了与之相关的话语群体。一些主题词指向特定的话语,如fags通常被用来批评那些受到政府援助却浪费钱去买香烟等非生活必需品的人;而其它主题词如depression则有多种不同甚至相互竞争的意义。最后作者讨论了互动媒体如twitter是如何对话语的发出和传播造成影响的。

Hunt在第13章结合语料库技术和批评话语分析,研究了《哈利波特》系列中(语料库包括《魔法石》、《阿兹卡班的囚徒》和《死亡圣器》三个文本)对男女人物的身体部位的描写。通过对hand, feet, fingers, legs和face等词的索引行分析发现男性人物的身体部位被更多地提及,与这些部位相关的动作更加积极和灵活,对推动故事的发展起到重要的作用;而女性人物的身体部位则用来体现女性的被动,对外界的影响不大。通过这种综合的方法解读隐藏在儿童读物中性别角色的塑造,对纠正将女性塑造成二等公民的做法有积极的推动作用。

在第14章中,Potts收集关于飓风Katrina的美国新闻文章建成语料库,在话语-历史观框架内聚焦高频谓语指示策略以分析其对人类参与者身份的构建。通过对people的搭配词的分析,作者展示了围绕种族和阶级的话语相互交叉,造成双重变异现象,即社会行动者的其他特质如poor和black混在一起,达到将这些行动者排除在圈外的效果,受到飓风影响的人们最终被报纸塑造成社会秩序和国民福利的威胁。Potts指出,在青睐一些身份特征的同时,另外一些特征(如情感和身体状态)被淡化,而团结和赋权的建构也被忽视,这反映了媒体偏离社会和谐的意识形态。

3. 简要评价

3.1 特色与优点

综观全文,本书有以下几个特色和优点:(1)覆盖领域较广,视野开阔,囊括了对不同语域和不同语类的研究。(2)研究方法多样,结合了语料库技术和多模态分析、多维度分析、多视角分析,尤其是第三章展示的利用多种技术将“非语言数据流”纳入口语分析的方法,展现了语料库语言学和话语分析在不同层次上的容和。(3)认识论层面较客观,多数强调定量研究和定性研究的结合。语料库语言学近几十年蓬勃发展,得益于其对大数据的检索和批量处理功能,但同时也受到不少诟病,最多的批评就是语料库式研究和统计分析,而对实际内容关注不够。本书的绝大多数文章都做到了定量和定性分析的结合,在很大程度上避免了上述缺陷。(4)共时和历时研究兼有,关注专用语料库,讨论发人深省。本书收录的论文既有共时研究,也有历时研究。在大数据时代,语料库的“大”已经不再是问题,但对特定领域或话题的讨论,小型的专用语料库则更为合适。话语分析的目的在于揭示和解释社会现象,因此,如何做深刻的讨论是研究者的难题,需要哲学和社会学层面的思考,这点在Partington对新闻负面报道价值的肯定和Potts对于新闻媒体缺乏向心、偏离和谐的意识形态的批评中可见一斑。

3.2 疏漏与瑕疵

本论文集的优点非常突出,但也存在一些疏漏与瑕疵。(1)本书的题目中用了术语discourse studies,而在第一章中编者并未说明discourse studies和discourse analysis的区别,而是直接用了discourse analysis(p. 3)。尽管很多学者将两个术语互换使用,但作为全书的一个关键术语,编者不能想当然地认为所有人都将两个术语等同,尤其是Tannen et al(2015)编写的话语分析手册The Handbook of Discourse Analysis仍然使用了术语discourse analysis。(2)个别报告不够严谨、论证不够清晰。如第5章即对英国英语、新西兰英语与新加坡英语、香港英语中actually非常明显的位置差异没有做任何解释,而仅仅说“很难就位置和话语标记语做出一般总结”;第6章对高频搭配词的搭配强度计算未做说明,并且对environment的另外几个重要搭配词如economy, health未做任何说明。

3.3 启示与思考

毋庸讳言,本书是由基于语料库的话语分析权威学者编著的权威文集,在该领域具有相当的引领作用。本书所收录的一些研究如第3章对动态语境的细致分析是开创性的,是语料驱动的,自然可以避免Widdowson(2004)关于传统话语分析“摘樱桃式的(cherry-picking)”的选取语料的方法,但正如Adolphs,Knight和Carter所意识到的,他们在录音采集语料时,受事是有自我意识的,这种语料在多大程度上是“真实的”就值得考虑,因为这关乎语料库的“真实性、样本性和平衡性”原则。另外,基于口语语料库的话语分析和多模态话语分析高度依赖技术,也需要大量的人力和资金,是个体研究者难以企及的,这也是制约国内相关研究的重要原因。因此,组建由话语分析学者与语料库技术人员组成的研究团队,开发口语语料库和多模态语料库并在其基础上开展话语研究,或是国内研究可以借鉴的路径。

可能受编者自身研究兴趣的影响,本书收录的研究有三分之一是批评话语分析,而批评话语分析是有价值取向的,需要就文本的隐性评价做出判断,而这是超越索引行的即时共文(immediate co-text)的。尽管相关学者如Baker和McEnery(2013)和Partington et al(2013)坦言,对隐性评价的判断有时需要扩展索引行甚至通读全文,但在什么时候扩展,扩展到什么程度则取决于分析者的经验。国内基于语料库的批评话语分析尽管已经取得了一些成果,如唐丽萍(2016)采用该方法研究了美国大报对中国形象的构建,但如本书所示,在环境话语(第6章)、社会群体话语(第12、14章)和不同性别话语方面(第13章)的研究还需进一步拓展。

总体来看,正如Cadlin在前言中所说,本书提供了基于语料库的话语分析领域的权威地图(p.xi),具有前瞻性和引领作用,是一部拓展语料库语言学应用和话语分析范式的佳作。

猜你喜欢
语料库话语分析
画与理
基于语料库的清末民初日源外来词汉化研究
分析:是谁要过节
《漫漫圣诞归家路》中的叙述者与叙述话语
回头潮
雷人话语
运用语料库辅助高中英语写作
雷人话语
语料库与译者培养探索
Units 13—14解题分析