语料库语言学的本体论思考及阐释

2012-04-13 22:23
关键词:语料语言学语料库

刘 国 兵

(北京外国语大学 中国外语教育研究中心,北京 100089)

语料库语言学的本体论思考及阐释

刘 国 兵

(北京外国语大学 中国外语教育研究中心,北京 100089)

语料库语言学的快速发展要求我们认真思考和探讨其学科属性等基本问题。语料库语言学是一门独立的学科,它以语料数据为出发点,基于现有理论和假设,根据真实数据对其进行验证;语料库研究采用自上而下与自下而上相结合的综合方法,研究过程涵盖归纳与演绎两个步骤,实际操作过程包括理论假设、数据验证、完善理论、逻辑类推等具体环节;语料库语言学的研究对象是实际语境中给定的语言使用系统,语言意义蕴含于语言运用之中,但我们不完全赞同“语言一元论”说法;从意义单位出发观察文本意义是语料库语言学研究的基本视角,但对意义单位进行研究时把书面语和口语区别开来,这种做法有些不妥,在对这两种文本进行解读时不存在本质上的差异。

语料库语言学;本体论思考;阐释

虽然语料库语言学在过去四五十年中得到快速发展,时至今日其影响还在不断扩大,但不同的研究视角、目的以及语料库研究者内部的认识分歧等,都给语料库语言学带来了研究方法的日益分化。过去几十年来困扰语料库研究的一系列问题不但没有得以解决,而且随着语料库语言学的发展,这些问题又凸显出来。问题不仅来自语料库研究领域以外的学者,语料库研究者内部的声音也不尽一致:语料库语言学是否已成为一门独立学科,抑或是一种研究方法甚至工具?语料库语言学的研究对象、研究方法及研究视角是什么?对于这些基本问题,学者们给出的答案不尽相同。在此情况下,认真思考和探讨语料库语言学的学科属性等本体论问题就显得尤为亟需。

一、语料库语言学的学科地位

关于语料库语言学的学科地位问题,目前主要有三种观点。一种观点认为语料库语言学没有发展成为一个新的学科,而是研究方法的一个新视角,或者说是一种新的研究方法。持有此种观点的学者以英国语言学家McEnery为代表。McEnery等人认为,语料库语言学只是一种研究方法,与音位学、句法学、语义学等语言学的分支学科有着根本不同。语料库语言学可以定义为将语料库应用于语言研究及教学的一系列方法。所以它有一定的理论基础,但理论基础并不等于理论本身[1]。第二种观点认为语料库语言学有自己的研究对象和理论体系,但要具有独立的学科地位从而成为语言学的一个分支学科还有些为时尚早。从目前发展态势来看,语料库语言学具有发展成为一门独立学科的巨大潜力[2]。第三种观点与前两种截然不同,持此观点的学者们认为语料库语言学已经完全发展成为一门新兴的学科,其学科地位毋庸置疑。语料库语言学拥有明确的研究目标和独特的研究方法,拥有具体的研究对象及完整的研究理念,因此已经成为具有全新研究视野的新学科[3]。我们不禁会问,同属一个研究领域,学者们为何会有如此大的分歧呢?究其原因,持第一种观点和第三种观点的研究者在对待语料库数据的作用及态度上存在根本差异。持第一种观点的研究者采取基于语料库的方法(Corpus-Based Approach),即基于先前的理论或假设,利用所得数据对已有理论或假设进行验证,从而实现对语言学理论的证实或证伪。这种做法明显体现了语料库的工具性价值及方法学意义,也基本继承了提出假设、找出数据从而验证假设的传统科学研究过程。持第三种观点的研究者完全采用语料库驱动方法(Corpus-Driven Approach),研究过程重视语言的自给自足性,认为语言本身构成了一个完备的自参照体系。语言学家不需要基于已有先验假设,研究过程中也不需要到语料库之外寻找证据,任何已有的理论或假设都是多余的。研究者唯一而又重要的工作就是认真观察语料,从语料中总结和概括理论。这两种观点鲜明地体现了英国语料库语言学历来的学派之争。第二种观点则介于以上两种研究方法之间,既不承认语料库语言学的独立学科属性,也不把它仅仅看做一套方法或原则,因此在认识上具有明显的折中性。

基于近年来所做的研究,我们认为,以上三种观点都有道理,也都有科学性的成分。但语料库语言学内部出现“学科地位之争”,根本原因在于学者们对语料库语言学缺乏宏观认识,争论过程中缺少辩证思维。特别是持第三种观点的研究者,他们在评价对方研究立场时,往往只关注对方研究范式的缺点与不足,没有对其长处及优势给予充分认识和肯定。语料库驱动研究中,任何理论都是在观察和分析语料过程中形成的,而不是预设的、先验的。所以,语料库驱动研究提倡干净文本原则,极力反对文本标注,认为标注时人们不可避免地对文本附加了预设信息。这一研究范式要求研究者对建立在直觉基础上的语言学理论持反对态度。分析语料时,抛弃已有理论和假设,从语料本身总结能够反映语言事实的理论及描述。但我们知道,人类语言是一种极其复杂的生理与社会现象。近一个世纪以来,人们已从音位、词素、短语、句子及篇章等诸多语言内部层面以及社会、心理、认知、神经及解剖等外部层面对其进行过深入研究,并且取得了丰硕成果。从一定程度上来说,这些成果在指导着我们今天的诸多研究,今天的语言研究很大程度上是对过去研究的继续与深入。试想在今天的研究中,如果抛弃已有成果,把理论产生的可能完全依托于对现有语料的分析上,我们的研究恐怕会举步维艰,其结论也会失之偏颇。再看基于语料库的方法。采取这一方法的学者们在研究中,依据已有理论或假设,借助其内部的分类框架,选择性地使用语料库证据,并以此对理论或假设进行证实或证伪。这一方法本身并无可厚非,但问题在于,很多采用此种方法的研究者经常陷入一种认识误区,即理论是预设的,具有已知的主体性,而证据是补充的,证据为了验证理论而存在。这种认识框架下,语料库就沦为验证理论的一种工具或方法。这显然突出了其工具性及方法论特征,从而忽视了语料库本身具有的意义及价值。持第二种观点的研究者在申明立场时,只是对另外两种观点做了综述,表达态度上有些含糊,也没有提出自己明确的主张。

总之,语料库语言学发展至今,虽然只有短短几十年时间,但其作为一门新兴的独立学科,其学科地位是毋庸置疑的。我们的理由是,判断语料库语言学是否成为一个独立学科,根本标准不在于对待数据的态度,而在于研究对象的确立。语料库语言学的研究对象就是具体文化环境与实际语境中给定的语言使用系统。我们主张以语料库数据为根本出发点,参考现有理论与语言直觉,基于语料数据对理论和假设进行验证和判断,从而实现语言学理论的丰富、完善、创新及发展。这是语言研究的基本范式,也是语料库语言学研究的根本内涵。

二、语料库语言学的研究方法

人类用于科学研究的方法,基本上可以概括为两类:一类是自上而下;一类是自下而上。这里所谓的上下与逻辑学上的上下在指称上大体相同,具体说来,上指抽象的语言学理论;下指来自真实语料的数据。对于语言研究来说,很多学者认为,自下而上的方法适合于语料库语言学研究,而自上而下的方法则广泛应用于传统语言学研究。例如卫乃兴提出,语料库语言学的基本研究方法是自下而上,其一切问题探索都源于对数据的处理和观察。它体现为语料的提取、观察、概括和解释这样的基本研究过程,这一过程与已有理论及假设无关[4]。之所以得出此种结论,显然是受语料库驱动思想的影响。语料库驱动研究主张摈弃所有先验理论,一切从语料数据出发,通过检索及统计软件提取、观察、分析语料,根据观察到的语料特征概括相关理论。这是一种典型的自下而上的归纳方法。那么,在语言学研究中,还有可能采用自上而下的研究方法。具体说来,很多问题的探索始于某些理论或假设,由预设的理论或假设驱动研究步骤及相关环节;从语言材料中寻找与理论及假设有关的数据,整理并进行分类;能够支持该理论的证据被充分挖掘,不支持该理论的证据则弃之不用。证据的作用在于用来支撑或反驳某个理论。由此看来,自上而下的研究具有极强的演绎方法特征。

在此问题上,我们认为,语料库语言学采用的是自上而下与自下而上相结合的综合研究方法。对于很多研究,我们通常基于某种理论或假设,依靠直觉寻找支撑该理论的有效证据范围;然后在语料库中进行检索,收集大量人类肉眼无法捕捉到的数据信息,从而对原有理论或假设进行证实或证伪。在语料库语言学研究中,片面地采用一种方法,反对与抛弃另一种方法,其研究框架都是站不住脚的,得出的结果也是不可靠的。科学发展到今天,任何研究要想有所创新和突破,都需要基于前人的成果。语言学研究也不例外,已有理论对我们的研究起着重要的指导作用。语料库语言学与传统语言学相比,在对待语料数据的态度上存在根本不同,语料库数据的作用是主导的而不是辅助的,更不是为了验证理论而存在。所以从方法论上来讲,二者在语料库语言学的研究中应该是一种既各具特色又互为补充的关系。研究者要根据实际需要,采用二者相结合的方法并实时对其进行调整,真正实现二者的优势互补。某种研究方法从一定程度上说可能更适合于某类研究,但方法与研究之间不存在必然联系。对于语料库语言学来说,采用自上而下与自下而上相结合的研究方法,一是能够充分发挥现有理论对研究的实际指导作用,避免我们在研究过程中走弯路;同时也能够充分发挥此方法的演绎作用,因为语料库无论大小,都是语言的抽样,由语言抽样得出的语言学理论适用于同类语言现象,也同样适用于抽样所在的语言整体。二是该方法能够充分体现归纳的优势,研究者根据大量语料数据,不但可以对现有理论进行验证,而且还可以在归纳的基础上发展现有理论,从而有效实现理论创新。采用二者相结合的研究方法,其操作过程应该包括理论假设、数据验证、完善理论、逻辑类推等具体环节,这本质上也是一种归纳与演绎的综合过程。

三、语料库语言学的研究对象

语料库语言学的研究对象是具体文化环境与实际语境中给定的语言使用系统,或者说是语言的运用即意义。语言运用之外的语言现象不是语料库语言学的研究内容。语料库语言学研究者认为,语言运用是一种社会现象,语言意义蕴含于语言运用之中。从弗斯到韩礼德和辛克莱,这种立场表述基本一致。弗斯曾对索绪尔的语言/言语二分法进行过猛烈抨击。他认为,在语言运用之外,不可能存在一个独立于言语的系统,也就是言语之外没有语言[5]。弗斯实际上是从根本上抛弃了在语言运用之外寻求语言解释的做法。根据他的观点,语言的意义就是语言成分在其使用系统内部的相互解释,语料库语言学研究中,文本是唯一的数据源,也是研究对象的唯一载体。所以,语料库语言学与传统语言学的真正区别在于,在研究意义时,它既不去寻求语言运用之外的“理想语言”“心智语言”以及“与生俱来的语言”,也不去寻求超越现实的“思想语言”或“心理语言”,更不会通过一套形式化算法和逻辑公式,进而建立一套描述语言本身的概念本体。

较之索绪尔,虽然弗斯的语言观更有说服力,在实际研究中也具有较强的可操作性,但我们并不完全认可和接受弗斯对索绪尔的批评。这是因为,由于时代局限及后人阐释等原因,索绪尔的语言二分法尽管存在问题,时至今日也没有证据让我们充分相信语言的二分实体确实存在,但弗斯所倡导的语言一元论也未必能够完全站得住脚。一部分语料库研究者认为,一切语言事实和证据,包括知识、意义和解释都在文本和话语中。这种认识本身并无问题,但把语言的意义、使用、文本解释等概念都等同于语言,即语言运用之外不存在任何独立的系统,也不存在解释语言的可能,这种观点就走向了语言本体认识的另一个极端。所以,有些研究者提出,语言和言语之间的关系并非泾渭分明,而是一个连续的统一[6],但统一不等于一元。在能够找到充分证据让我们相信一元论或二元论之前,语言研究的对象理应包括语言和言语两个方面。我们认为,弗斯及其后来的追随者(后人称之为新弗斯学者[7])所坚持的语言观只是采用一种新的方法、从一个新的视角去研究和描述语言,而不是对以往传统语言观的革命性颠覆。直到今天,坚持语言二元划分观点的学者不占少数,这从语言研究的其他学科如认知语言学、心理语言学以及传统的语言哲学等对语言的解释中可见一斑。我们暂且不去评判谁是谁非,基于目前对语言的认识,也无法给出令人信服的判断。我们只想表明,语料库语言学与传统的语言二元论之间并没有根本的矛盾,二者并非水火不容。语料库语言学从一个新的视角来解释语言现象,它所能解释的是言语抽样中出现的现象,但直到今天也没有科学证明,这就是语言的全部。语言尽管不像索绪尔阐述的那样存在二分实体,但同样也不一定是弗斯主张的一元语言体系。语言运用之外还应该存在某些独立或非独立的因素,它既不同于语言运用,也不同于索绪尔声称的语言。它是除语言运用之外构成整个人类语言系统不可或缺的特定要素或子系统。对于语料库语言学来说,因为文本是语言运用即言语的抽样,既然抽样就不可能是总体或全部;而且语言总体除了语言运用之外,还应包括其他要素。换句话说,语言总体不但包括说过的,而且也应该包括可能说、有能力说但没有说出的语言。所以,作为语料库研究者,我们不能夸下海口,把研究视域之外的所有语言要素都等同于语言运用。当然,我们也不能期望语料库语言学解决所有语言问题,对语料库中语料的研究与对语言整体的研究也不应该完全等同。

四、语料库语言学的研究视角

语料库语言学研究的基本着眼点是“意义单位”(Unit of Meaning),从意义单位出发来考察文本的意义是其独特的研究视角。语料库驱动研究的代表人物辛克莱最先提出并使用意义单位的概念,但对这一概念给出明确定义的是其继任者Teubert。他认为,意义单位是具有特定结构模式的词语项,该词语项在具体使用中可大可小。它可以是单个词、词组、短语、习语以及多词单位等[8]。意义单位具有意义的单一性和无歧义性等特征,它是文本中最小的、可用于解释的实际词汇及语法意义载体,也是人类进行文本意义研究的基本切入点。在Teubert看来,语料库语言学的研究任务就是通过检索和分析这些意义单位,从而达到研究语言及分析意义的目的。关于语料库语言学的研究视角,我们基本认同和接受Teubert以上有关意义单位的阐述。

但在文本的划分上,我们对Teubert的做法持保留意见。在研究意义时,Teubert进一步区分了口语和笔语两种语言表现形式的不同,认为书面语文本与交际中的话语在意义解读上存在很大差异。对书面语进行解读时,作者处于离场状态,所以作者的意图与文本的解读之间不存在必然联系。而在口语交际中,交际的直接目的就是说话人意图的有效实现,口语话语的解读很大程度上依赖于说话人的意图,同时交际现场、话题参与人的角色及其相互关系都会对话语的解读产生很大影响[9]。我们认为,Teubert对二者的区分有些不妥。在语料库语言学研究框架内,作为研究对象的语料不管是书面语文本还是转写后的口语文本,其表现方式都是文字,所以对文本进行解读时二者不存在本质上的差别。我们已经把口语话语通过转写,进而转化为“书面的”的口语文本。这种做法是语料库语言学研究的一大优势。因为转写语料后,我们可以借助强大的检索工具对口语语言进行分析,从宏观层面总结和概括人类语言的口语特征。但这种做法也存在一定缺陷。缺陷在于转写后的文本只保留了必要的语言信息,失去了话语产生的场景及对说话人关系的详细描述,而这些信息恰恰在口语语言的意义传递和解读中起着非常重要的作用。

[1]McEnery,A.,R. Xiao & Y. Tono.Corpus-based Language Studies:An Advanced Resource Book[M].London and New York:Routledge,2006:7-8.

[2]Knowles,G. Corpora,Databases and the Organization of Linguistic Data[M]//In J. Thomas & M. Short.Using Corpora for Language Research:Studies in Honour of Geoffrey Leech.London:Longman,1996:36-53.

[3]李文中.语料库语言学的研究视野[J].解放军外国语学院学报,2010(2).

[4]卫乃兴.语料库语言学的方法论及相关理念[J].中国外语,2009(5).

[5]Firth,J. R. Papers in Linguistics,1934-1951[M].London:Oxford University Press,1957:198.

[6]梁茂成.理性主义、经验主义与语料库语言学[J].中国外语,2010(4).

[7]卫乃兴.词语学要义[M].上海:上海外语教育出版社,2011:6.

[8]Teubert,W.My Version of Corpus Linguistics[J].International Journal of Corpus Linguistics,2005(1).

[9]Teubert,W. Writing,Hermeneutics and Corpus Linguistics[M]//W. Teubert & R. Krishnamurthy.Corpus Linguistics:Critical Concepts in Linguistics.London:Routledge,2007:145.

[责任编辑许昌]

H0-09

A

1000-2359(2012)02-0240-04

刘国兵(1978-),河南滑县人,北京外国语大学中国外语教育研究中心博士生,河南师范大学外国语学院讲师,主要从事语料库语言学及应用语言学研究。

教育部人文社科项目(12YJC740062),中央高校基本科研业务费专项资金项目(2010XX007)

2011-10-18

猜你喜欢
语料语言学语料库
《语料库翻译文体学》评介
基于语料调查的“连……都(也)……”出现的语义背景分析
认知语言学与对外汉语教学
华语电影作为真实语料在翻译教学中的应用
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
社会语言学名词
语料库语言学未来发展趋势
基于认知语言学的“认知修辞学”——从认知语言学与修辞学的兼容、互补看认知修辞学的可行性