李雪萍
摘要:本文用了大篇幅的内容重点阐述了语言文本的重要性及其理论来源,立足于把语料库作为一门独立的学科进行研究(即Corpus driven linguistics),主要介绍了许多有关语料库语言学的理论观点和相关研究。虽然這些观点都是上个世纪六十年代至九十年代的研究成果,但是对于目前的语料库语言学研究仍具有一定的影响力,比如可应用于教材,词典和语法等书籍的编写以及文学鉴赏和话语分析等等领域。因此,本文首先对该书的主要内容一一作简要介绍,随后对其予以相应的分析和评价。
关键词:文本;语料库;话语分析;John Sinclair
1.引言
自第一个计算机语料库Brown语料库问世以来,语料库语言学已走过五十多年的历程。在这五十年时间里,由于在语料编辑与加工、研究工具和分析技术上的长足进步,语料库语言学的版图不断扩大,几乎触及到了语言研究的各个分支领域,并呈现出蓬勃发展之态。Ronald Carter主编的 “Trust Text:Language, Corpus, Discourse”这本书中主要收录了John Sinlair在二十世纪六十年代以来所发表的关于语料库语言学研究的所有论文集,主要介绍了有关自然语言处理的关键问题和语料库语言学理论与实践的具体研究案例。
John Sinclair所研究的语料库的语言学理论传统来源于J.R. Firth 和Michael Halliday。Sinclair认为应该对真实的语境中自然发生的语言进行研究,并对可扩展性的例子(这里主要指的是完整的文本)的意义进行分析。这与当时五六十年代盛行的Chomsky的理论传统不同,Chomsky认为语言是认知和生物本能的现象,研究方法更侧重于关注研究人员的直观感受和反映,并认为这种直觉体现了语言使用者的语言能力。同时不太关注真实语境中的所产生的语言现象,更多侧重于那些被人为创造出来符合研究目的语言(主要运用于对比研究),这些句子有些符合语法的要求,而有些则不合法。后来在20世纪60年代,Sinclair提出了语言词汇集中性的问题,而相对而言忽略语法和语音上的分析,因此,这样的研究则需要收集大量的语料。早在1991年,Sinclair所发表的 “Corpus, Concordance and Collocation”一文中就反映了其对语料库初步处理的思想和方法(主要体现在对词汇的研究上)。
2.内容简介
“Trust Text:Language, Corpus, Discourse”该书一共由引言和三个章节等四个部分组成,第一章基础,一共有两个小节,即文本可信度和意义单位的扩展,前者主要介绍了基于尊重和信任文本的整合原则,对语言进行分析描述以及理论构建,后者介绍了词汇组织方式和模式变化的主要理论,该章节是后两个章节语料库语言学研究与实践的理论基础;第二章文本的组织,一共有五个小节,在这一部分内容中,作者深入分析了随着文本类型的变化,文本结构与交互式对话之间的关系的转变。前两小节(即话语平面,语言描述的整合)的内容为所有情景交际语言分析提供了研究框架和思路,对口语和书面语之间的整合做了详细分析和介绍;第三章词汇和语法,详细介绍了对词汇的描述,以及与语法和语料库分析之间的关系。
第一部分,引言介绍了John Sinclair的个人经历和研究成果,然后简述了这本书的理论和主要思想,最后就是对该书的主要内容进行了粗略的梳理和总结。
第一章(1-2节)首先介绍了作者的两个观点,第一猜想和事实之间的关系(假设被有限数据验证的过程),即话语分析研究;第二关于可供观察研究的数据的语言意义探究和充分利用,即语料库的研究。对于话语分析研究而言,通过建立话语模型探索交际语言的组织方式和结构特征。在这一过程中需要选择合适的工具和软件,这就要求电脑技术的灵活运用以反映话语显著特征。Sinclair认为这种具有一定规模且分类别的投射尝试展示口语交际内在结构的组成方式。Louis Ravelli(1991)的动态语法研究尝试对熟悉领域进行理论研究的创新,如话语的研究向语言形式方面的转化。同时作者提出口语与书面语之间的差异,前者假设验证的过程(即话语暗示和意图,语言功能研究),后者可通过眼动研究、查找、分析文本,该研究方法更容易寻找书面语文本的规律,如连贯性,重复,指称,替代等方面指标。书面语尤其侧重对文本的处理和分析,Emmott(1997)提出的“图层框架(primed frames)”准则十分具有前瞻性。他认为文本心理表征的形式和文本内容就存在于在一个具备基本理解能力的读者头脑之中,同时也具有一定能力将文本所体现的意义进行有效的解释。另外Sinclair还区分了句子与文本的关系,前面的句子对后面的内容起到铺垫作用,后面的句子补充前面的内容,所有的句子构成一个文本。还有就是从词汇层面来看,第一,词根化(lemmatization)就是同一词根进行曲折变化后形成各个不同形式的单词,如move,moving,moved等;第二,同一个单词属于不同词类但意义与其所属词类相关,例如combat既可作动词有可作名词;第三,词语共现,词语组成短语并多次共现于句子和文章当中,如名词作为介词的宾语共现,这一类词汇的共现与配价研究息息相关;第四,传统词类受到冲击,例如与传统概念不一样,of不以介词的身份出现在句子当中;第五,词型的出现与语境密切相关,如在词库中检索happen后,所出现的索引行当中大部分都是发生不详的事情(nasty things),从而判断这个词的使用情况;第六,短语与词的意义共享,即搭配意义(collocation)。在第二节意义扩展的例子中,作者介绍了三种最小意义单位模型,即Item and Arrangement Model(IA),Item and Process(IP)和Word and Paradigm(WP)。在组织和收集语料这一方面,更加注重词汇的重复频率。Clear(1993, pp. 271–292)认为目前有关词汇重要性的测试最有成效的是语言事件的重复,通过频率比较探索句子词汇之间的组织方式和内部结构特征。另外作者通过检索the naked eyes, true feeling和brook等三个例子进一步说明词频,词之间的搭配关系,语义韵和类连接的分析和应用。
第二章(3-7节)文本的组织,这一部分主要阐述了语言与文学之间的关系,而文体学则是以语言学的视角分析文学。第三节话语平面,详细介绍了语言使用的两个方面,第一,参与者之间连续的交流和对话;交流谈判方面强调互动,称之为话语的互动平面;第二,不断发展变化的经验的记录和保存,也就是,话语从互动平面向自主平面的转化而完成平面改变。作者以“How Far can you go”的小说为例详细解释了话语平面的交互性和自主性的特点。第四节语言描述的整合,介绍了在文本与话语中,揭示其结构相似性的描述系统,而这个系统是一个动态话语模型,这与传统的静态模型有区别:第一,动态话语模型展示的是话语如何从上一个话题切换到下一个,如何进行自然地过渡;第二,动态话语模型如何展示某个部分话语在实现交流目的过程中所扮演的角色。在语境中,时间是一个很重要的特征,保证对话的进行和促进参与者的理解,同时简述了口语与书面语文本结构的特征和差异。将其相异行为描述的基本内容进行整合,随后在此基础上需要将其抽象化,并通过这样的整合工作了解和区分口语与书面之间的显著差异。接下里详细介绍了Dijk为代表的学者所提出来的话语动态模型以及应用。Dijk(1985)从五个步骤详细介绍了话语动态模型的应用情况:互动标示,参考文本中作者的态度,叙述者的属性,论述标示,自我参照标示,支配动词形式。第五节书面语结构,论述了单个句子对文本的解释,并通过逻辑连接词(logical operator,如so,therefore)和互动信号(interactive signals,如well,ah,anyway)展示相同的话语功能。第六节对话的内化,交际互动特征的内化可以用以解释句子语法的复杂程度,从最大的语法单元(即句子)到最小的单元(即词)逐步说明其内化过程,如分析小说中的第一人称叙事者的人物变化。第七节文本解释的工具介绍,回顾了有关文本的交际影响的描述规则,并从大型的文本语料库中查找数据并对其进行分析证明。
第三章(8-12节)词汇与语法,收录了五篇关于词汇与语法相关研究的论文,并在第二章有关词汇研究的基础上进一步介绍了利用现代电脑技术手段(也就是语料库的创建)的词汇与语法及其之间关系的研究。首先介绍了词汇该如何进入适合的结构模型,列举了一系列词典编撰的理论和原则加以说明,如《柯林斯英语词典》以及影响词汇意义的因素,如词语组合方式和语境变化等等。对于从词汇与语法的关系层面上来看,词汇和语法这两种模式的关系被认为是语言创造意义的手段,分别从句法意义,跨语法类别,语义韵,词类和词法结构等方面展开论述。短语学介绍了在不同国家表示相同意思却用不同的介词来表达,比如用于中的“of”,德语用“für”,法语用“de”,但是由于句法的要求会使用“for”来替代“of”,文章当中同时也通过语料库(The bank of English)对这些介词的使用进行检验。最后对语料库语言学研究的现状也做了一定的介绍,例如自然语言的处理,词语之间的搭配,次语言的消亡,同时也提出了目前語料库语言学研究出现的一系列问题,如语料库规模大小,语料库的标记等。尤其强调了语言分析的两种观点,即第一,语言是信息的载体;第二,语言文本具有“解码”意义的特征,即意义具有文本的部分语义,与“从文本到意义”过程是“从意义到文本”过程的反向推导过程。
3.简要评价
作为语料库语言学方面研究的早期著作,本书从理论的角度对语料库语言学中的理论现象进行了较为系统的介绍,本书特色突出表现在以下三点:
议题丰富,拓展了语料库语言学研究的理论范畴。综合全书来看,一共收录了十二篇论文或者研究会议记录文章,主要论述了以功能语言学为理论基础,探讨了话语分析及所涉及到的描述模型,文本到句子再到词之间的理论研究。本书最大的亮点在于运用具体的例子来阐述对理论的实际应用,主要以语料库数据的收集和检索为主。比如在第二章的内容中探讨语言学和文学之间的关系,并提出了新的跨学科方向,即文体学(stylistics),文中就以“How Far can you go”的小说为例详细解释了话语平面的交互性和自主性的特点。
理论具有一定的权威性,对本领域的研究仍然具有一定的参考价值。就目前而言,关于语料库方面的研究,国内外都已经做出了相当丰硕的成果,尤其是将语料库作为一项语言研究方法来看,如语料库与外语教学的研究,语料库与计量语言学的研究,语料库与翻译方面的研究,语料库与词汇编撰的研究等等。相比之下,对于语料库的理论建设方面则显得颇有不足。因此,本书中所提及到的有关语料库语言学的理论研究基本为学科建设起到了引领性作用,同时也受到了大家的普遍认可,换句话说,算得上是目前语料库方向研究的理论支撑,如本书中第一章对文本的研究,第二章当中对动态话语模型的介绍,以及第三章当中对词汇的详细说明和探究等。
视角多元化,注重多方观点的互动争鸣。本书的观点来自于世界的多个国家的学者,从各个不同的层面对文本到句再到词分别进行分析和研究。例如,在第一章当中,有学者就提出话语的研究向语言形式方面的转化。在第一章第二节中意义扩展的例子中,Sinclair介绍了三种最小意义单位模型,即IA,IP和WP。不同的学者从不同的视角对词和文本进行了探索。
从本书可以看出,学者们在初期还是对语料库语言学的理论进行了深入的讨论和研究,具有一定的权威性,虽然语料库语言学的研究与当时所盛行的乔姆斯基理论相左,但是学者们通过努力依然找到了支撑其观点的理论,并且使现在的语料库应用研究受到更多的关注,而运用的领域也更加广泛。
参考文献
[1]Clear, J. H. (1993). “From Firth principles computational tools for the study of collocation” in Bakeretal.(eds). Text and Technology, pp. 271–292.
[2]Dijk, S. C. (1985). Functional Grammar (North-Holland Linguistic Seriesno.37), Amsterdam: North-Holland.
[3]Emmott , C. (1997). Narrative Comprehension: A Discourse Perspective. Oxford: Clarendon Press.
[4]Ravelli, L. J. (1991). “Language from a dynamic perspective: model singeneral and grammar in particular” . unpublished doctoral dissertation. thesis, School of English, Universityo Birmingham.
[5]Sinclair, J. M. (1991). Corpus, Concordance, Collocation. Oxford: Oxford University Press.