房印杰
北京邮电大学
提 要: 学界对构式范畴的争议源于没有厘清其理论 /操作层面,本文提出基于频次的认知固化可以作为构式的操作界定。认知固化的渐变性、层级性、动态性对应构式的原型性、抽象度、动态性。通过对英语本族语者的关系代词取舍开展基于条件概率的共现词分析发现:1) 隐性 /显性关系代词从句呈现基于条件概率的认知固化,可以被界定为构式;2) 隐性关系代词从句比显性关系代词从句更加靠近具体词语层面,认知加工负载更小。
构式语法自诞生以来显现出强大的生命力,被应用于语言学理论层面(Barlow & Kemmer, 2000)、儿童语言习得(Tomasello, 2003)和二语习得研究(Ellis, 2003; Ellis et al., 2016),但是学界对构式的认识存在明显分歧(刘玉梅,2010;陆俭明,2016a;侯国金、邢秋红,2017)。构式语法内部先后提出过狭义定义(Goldberg, 1995)与广义定义(Goldberg, 2006)两种构式定义(1)本文所讨论的构式语法主要指以Goldberg (1995; 2006)为代表的基于使用的非形式化构式语法理论(Usage-based non-formalized Construction Grammar)。。狭义定义下的构式具有不可预测性(Unpredictable Property),广义定义将该特征剔除,代之以‘足够频次’(Goldberg, 2006:5)作为构式的界定标准,这使得构式的涵盖范围扩大,但在具体研究中对构式的认定出现困难。针对学界对构式界定的不同认识,本文提出,构式的广义定义是对狭义定义的拓展,二者均属于在理论层面框定构式的范畴;学界对构式认识上的分歧在很大程度上源自构式语法没有展现出显著的方法论价值(陈满华,2016:16),导致构式的界定标准模糊。鉴于此,本文尝试从操作层面论证认知固化与条件概率在构式界定中的作用,并以英语本族语者的关系代词取舍结构为研究对象,通过开展基于条件概率的共现词分析,初步证明认知固化与条件概率在构式界定中的价值。
1. 狭义 /广义构式定义
构式语法将构式界定为形式—意义对应。Goldberg(1995:4)提出,该形式—意义对应具有不可预测性,这符合心理学和认知科学“整体大于部分之和”的格式塔(Gestalt)观点(陆俭明,2016a:7)。狭义定义下的构式与习语较为相似,涵盖范围较为狭窄、具体。Langacker(2005:140)对构式的‘不可预测性’提出质疑,指出狭义构式定义将大量规则的、可预测的语言结构排除在了构式语法的研究范畴之外。面对该质疑,Goldberg(2006)对狭义构式定义进行了扩展,提出了广义构式定义:构式存在于语言使用的各个层面,只要某个语法结构具有‘足够的出现频次’,便可被界定为构式。在广义构式定义下,构式的不可预测性被‘足够频次’所取代,构式似乎变得无所不包,从词素、词、复合词到从句均可被称为构式。
从狭义定义(Goldberg, 1995)到广义定义(Goldberg, 2006),构式的涵盖范畴迅速扩展,超越了原有的习语范畴,对构式的界定开始转向以频次为基础,但是‘足够频次’仍然缺乏客观评判标准(施春宏,2016:19)。广义定义虽然拓展了构式的范畴,但是降低了构式的解释力。
2. 学界对构式的认识
构式语法学家多采用广义构式定义(Ellis et al., 2016; Gilquin & De Knop, 2016;梁君英,2014),这源自他们对构式语法基本观点的认同:构式语法排斥语言的内在加工模型,认为语言加工过程与非语言的认知加工并无本质区别,语言习得过程始于具体的语言输入,并通过高频次的输入不断抽象出语言结构,抽象语言结构与具体的语言使用并存于使用者头脑中。这一核心观点表明:1) 语言结构从具体的语言使用中浮现而出;2) 语言知识由一系列处于不同抽象程度的构式组成;3) 语言的认知处于不断的动态变化之中。这表明构式中存在一个由具体构式和抽象构式组成的构式连续统,构式之间可以相互影响,组成新的构式,构式的习得和使用具有概率性特征。构式语法的这一论断将研究范畴扩大到语言使用的各个层面,即构式存在于语言的各个层面,而非仅限于类习语结构。
广义定义虽然契合了构式语法的核心论断,但是它没有给出明确的构式界定标准,虽然它提出‘足够频次’标准,但是对于何为‘足够频次’并未言明。构式涵盖范围的扩大与具体认定标准的模糊使得部分学者对构式的解释力产生质疑,进而提出构式语法没有体现出显著的方法论价值(陈满华,2016;施春宏,2016)。
针对构式语法方法论价值不足的认识,可以概括为三种观点:1) 构式是一种语言观,属于理论层面,无法对语言现象进行准确分析、描写(陈满华,2016);2) ‘广义构式’是构式语法研究的主体路径,但是‘足够频次’标准缺乏可操作性,需要重视类符 /型符频率(施春宏,2016);3) ‘广义构式’处于理论层面,实际研究中不可操作,需要采用‘狭义构式’,基于语块来开展分析(陆俭明,2016b)。第一种观点基本放弃对构式语法方法论价值的探讨;第二种观点认可频次在构式界定中的作用,但是认为应深入探究基于频次的方法;第三种观点则只承认狭义构式定义,以语块作为构式的操作标准。
上述三种观点的共同之处在于:构式语法的方法论价值不足,对于构式缺乏明确的操作性界定标准。鉴于此,本文尝试从操作层面论证认知固化与条件概率在构式界定中的价值,强化构式语法的方法论价值。
1. 认知固化
不同于将频次与构式界定直接挂钩的做法(Goldberg, 2006),Gilquin & De Knop(2016:8)将认知固化作为判定构式的标准。Langacker(1987:59)将构式界定为基于频次的认知固化,伴随输入频次的不断增加,语言形式会在头脑中形成不同程度的认知固化,并最终被界定为一个独立单位。相对于直接以使用频次界定构式的做法,认知固化表征构式在语言使用者头脑中的认知—心理属性体现出动态性和层级性特征(Blumenthal-Dramé, 2012)。鉴于对认知固化的判定具有主观性,需基于语言使用中的输入频次对其客观界定,语言使用中的高频输入会导致相应认知加工负载逐步减小,形成较高程度的认知固化(Blumenthal-Dramé, 2012:68; Divjak & Caldwell-Harris, 2015)。
2. 条件概率
针对构式的具体界定本质上是确定其在形式和意义两个层面基于输入频次的认知固化程度。一系列研究表明,语言使用并非随机(Kilgarriff, 2005),语言学习经历了从具体语言使用到抽象语言知识的抽象和概括(Bannard & Matthews, 2008:241),语言使用中的输入频次在上述过程中发挥关键作用,其与头脑中的认知机制紧密相关(Hasher & Zacks, 1984:1379; Baayen, 1992)。高频次语言输入使得语言结构在语言使用者头脑中实现不同程度的认知固化,并逐步抽象、概括为语言知识。前人研究(Gries, 2003; Ellis et al., 2016)已经初步证明,输入频次使得语言形式、语言意义呈现概率性特征。因此,对构式的界定可以转化为对认知固化程度的界定,后者进一步转化为对其形式、意义的统计学分布特征的测定(Gries, 2014a:43)。在构式的形式—意义对应原则下,其在形式、意义上所体现出的分布特征相互叠加,从而区分不同构式、同一构式内部的原型性。
与构式、认知固化相似,频次概念自身也具有一定程度的模糊性。频次可以进一步分为原始频次(Raw Frequency)、正态频次(Normalised Frequency)、类符频次(Type Frequency)、型符频次(Token Frequency)和条件概率(Conditional Probability)等。对认知固化程度的界定在很大程度上是在选择频次标准。基于实验法(Blumenthal-Dramé, 2012:211)和基于语料库(Divjak & Caldwell-Harris, 2015:67;Stefanowitsch & Flach, 2016)的研究均发现,基于条件概率的相关性分析对于论证认知固化程度最为准确。在这一前提下,Gries(2014a)将构式解释为基于条件概率的凸显性 /认知固化。
条件概率指事件A在事件B已经发生条件下的发生概率。Gries (2013)以of course为例,阐述了条件概率在语言学研究中的重要价值。相比‘足够频次’(Goldberg, 2006),条件概率能够更加准确地测量词语间的共现关系,为论证构式的认知固化程度提供客观依据。
基于构式的复杂度和抽象度标准(Stefanowitsch & Flach, 2016:106),本文以关系代词取舍这一高复杂度、高抽象度结构为研究对象,尝试以基于条件概率的共现词分析,说明条件概率在界定认知固化、构式中的作用。作为关系从句中的一个核心成分,关系代词在非主语型限定性关系从句中可以出现省略形式。例句(1)a中,先行词price后面的关系代词被省略,本文将其称为隐性关系代词;(1)b中victims后面的关系代词which并未省略,称为显性关系代词。包含隐性 /显性关系代词的从句是否存在规律性,二者是否可以被明确区分,这是语言学研究中的一个长期热点问题。
(1) a. Thepricea builder will be willing to offer a land owner is frequently referred to as the residual. (NESSIE)
(1) b. 70% homicides were inflicted onvictimswhich the perpetrator knew. (LOCNESS)
前人研究(Jespersen, 1933;Fox & Thompson, 2007等)发现了一系列与隐性 /显性关系代词从句存在相关性的影响因素,如关系从句长度、先行词词性、从句主语词性等。本文从构式语法视角,测量先行词 /关系从句主语与整个从句间的相互预测性。构式语法提出,构式与组成构式的词语存在结构和意义层面上的一致性,能够出现在特定构式中的词语具有概率性,构式与词语间存在一定程度的相互预测性(Gries & Stefanowitsch, 2004; Stefanowitsch, 2013)。基于构式语法的非同义原则(Principle of No Synonymy),隐性 /显性关系代词从句应当不属于同义结构。
本文在关系代词取舍研究中旨在探究:1) 基于条件概率的共现词分析能否测定先行词 /从句主语与隐性 /显性关系代词从句的相互预测性,论证其认知固化程度,进而确定其构式属性;2) 共现词分析能否客观区分隐性 /显性关系代词从句。在宏观层面,本文基于案例研究结果尝试论证条件概率与认知固化在具体构式界定中的价值。
1. 语料与工具
本研究以英语本族语者为研究对象,选取LOCNESS(型符数:326092),NESSIE(2)NESSIE语料库由北京外国语大学许家金教授主持建立。(型符数:291509)两个本族语者议论文语料库,与ICNALE(3)ICNALE语料库由日本神户大学Dr. Shin Ishikawa主持建立。语料库中本族语者的议论文部分(型符数:91013)共同组成英语本族语者语料集,合计库容708614个单词。在获得三个语料库后,以PowerGREP对其进行文本整理,使用Stanford Parser进行句法剖析,然后采用Tregex树库检索软件,编写树型正则表达式(NP 表1. 非主语型限定性关系从句在语料库中的分布 在获取上述语料后,抽取出672句语料中充当先行词 /关系从句主语的具体词语,然后分别与其所在的隐性 /显性关系代词从句组成数据矩阵,之后采用Coll.Analysis 3.5函数(Gries, 2014b)开展共现词(Collexeme)分析,自动计算在先行词 /关系从句主语位置上的具体词语与隐性 /显性关系代词从句的潜在预测性。共现词分析的原理在于,通过计算某一位置上的词语在两个近义构式中出现的预测频次和观测频次,求取它与该构式的关联性(Gries & Stefanowitsch, 2004)。在构式语法体系下,显性 /隐性关系代词从句可以被看作一对近义句法结构。选用共现词分析法来剖析该近义句法结构的词语层差异较为适宜。共现词分析的核心是基于条件概率的相关性分析。 2. 研究结果 1) 先行词 针对先行词与隐性 /显性关系代词从句的共现词分析(表2)显示,先行词与两类关系从句有着较好的相互预测性。与隐性关系代词从句显著相关的先行词多为不定代词或表达泛化意义的名词,something、anything、everything三个不定代词与隐性关系代词从句高度相关,具有较强的认知固化程度,可以被认定为隐性关系从句在先行词位置上的原型性属性。不同于隐性关系代词从句,先行词与显性关系代词从句的预测性明显减弱,这是由于能够充当先行词的具体词语的型符 /类符比(255 /141)显著低于隐性关系代词从句(417 /172)。换言之,在显性关系代词从句中,先行词位置的能产性过高,导致其预测性下降。 表2. 隐性 /显性关系代词结构中先行词共现词(4)在共现词分析中,所有显著共现词按照其与隐性 /显性关系代词构式的搭配强调排列,每个词后面的数字分别代表其在隐性关系代词构式和显性关系代词构式中的观测频次,例如,something在隐性 /显性关系代词从句中的原始频次分别为22次和4次,搭配强度>3对应p<0.001,搭配强度>2对应 p<0.01,搭配强度>1.3对应 p<0.05。 在先行词功能层面,隐性关系代词从句中的先行词所表达的意义较为空乏,在语篇中更多充当标记作用,用于引导整个从句(Diessel, 2004);显性关系代词从句中的先行词所表达的意义较为具体,被赋予较高的信息值,从而使得对先行词的认知加工负载增大,之后的关系代词多不省略。共现词分析的统计结果从形式和意义两个层面反映出先行词与整个隐性 /显性关系代词从句的相互预测性。该预测性对应较强的认知固化程度,为判定关系从句的构式属性提供了客观依据。在本研究中,隐性关系代词从句的界定、原型性判定更为准确,这源于其自身的高型符频次、低能产性、高认知固化程度,这表明对隐性关系代词从句的习得难度应当小于显性关系代词从句。这一点可以从隐性关系代词从句的使用频次显著高于显性关系代词从句得到初步验证(表1)。 2) 关系从句主语 从句主语与隐性 /显性关系代词从句同样具有较好的预测性(表3)。可以通过关系从句主语位置上的具体词语,来客观区分隐性 /显性关系代词从句。在隐性关系代词从句中,从句主语位置上的具体词语的型符 /类符比(417 /50)显著大于显性关系代词从句中从句主语的型符 /类符比(255 /69)。型符 /类符比值的差异表明两种从句构式的能产性存在差异(Bardal, 2008)。具体而言,隐性关系代词从句的能产性低于显性关系代词从句,其在构式的抽象度连续统中更加接近具体词语构式层面。 表3. 隐性 /显性关系代词结构中从句主语共现词 在从句主语位置上的具体词语与隐性 /显性关系代词从句存在相互预测性。在隐性关系代词从句中,一系列代词与其显著相关,其中,人称代词he、they和we的相关性最高,认知固化程度也最高。在显性关系代词从句中,从句主语多由名词充当,虽然在隐性 /显性关系代词从句中,从句主语位置多由有灵词语充当,但是二者仍然体现出显著差异,因为代词相对于名词属于已知信息,对已知信息的认知加工负载要显著低于未知信息(Ariel, 1990),认知加工负载差异最终决定代词与隐性关系代词从句的显著预测性。 共现词分析表明,条件概率可以较为准确、客观地界定语言结构的认知固化程度及其构式属性,从而作为界定构式的操作标准。虽然理论上任何名词均可充当关系从句的先行词 /从句主语位置,但是基于条件概率的共现词分析已经证明,从句构式的分布并非随机,隐性 /显性关系代词从句的差异是客观存在的,具有理据性,并且可以通过条件概率加以准确量化。 1. 认知固化与条件概率在构式的操作界定中的作用 通过分析英语本族语者使用隐性 /显性关系代词从句的内在差异,可以发现:认知固化与条件概率可以较好地界定构式范畴,从而尝试解决构式界定的争议。基于条件概率的共现词分析在理论层面依托构式语法体系,探讨词语与其所处的构式的共现 /条件概率;在操作层面,共现词分析以统计学为基础,初步实现了对研究对象的描写、预测。对比条件概率和‘足够频次’(Goldberg, 2006:5),不难发现‘足够频次’是指语料库语言学研究中常用的原始频次或正态频次,它仅仅考察某一语言结构在整个语料库中的出现频次,对该语言结构与其他语言结构的共现性关注不足,换言之,对语境的考察不足。条件概率是对原始频次的进一步拓展,其充分考虑了每个语言结构在语料库中的频次以及语言结构之间的共现频次,并以此为基础计算不同语言结构间的搭配强度,最终表征为语言结构之间的相互吸引 /排斥程度,该程度对应其认知固化程度。具体而言,在先行词位置上,不定代词在隐性关系代词从句中体现出更高的显著性,该显著性可以被解释为其具有更高程度的认知固化;在从句主语位置上,人称代词具有更高程度的认知固化。伴随显著性的下降(表2 /3),认知固化程度逐步减弱,构式的边界开始变得模糊。认知固化程度较高的词语(如关系代词 /人称代词)对应特定构式中该位置的原型性特征,认知固化程度的逐步降低表征构式的概率性和动态性,认知固化程度的层级性则对应构式中不同先行词 /从句主语的抽象度。 概言之,在构式语法体系下,条件概率可以客观、准确地计算词语与构式,构式与构式之间的共现概率,为界定认知固化程度提供客观依据,而认知固化自身的渐变性、层级性、动态性对应构式的原型性、抽象度、动态性(Blumenthal-Dramé, 2012)。条件概率与认知固化相结合能够从操作层面较为客观地界定构式。这一界定方法相比基于语块的构式界定标准(陆俭明,2016b)更为客观,具有认知—心理层面的理据性,涵盖了具体构式—半抽象构式—抽象构式的连续统(Ellis, 2003)。 2. 隐性 /显性关系代词从句的区分度 针对隐性 /显性关系代词从句在先行词和关系从句主语两个位置上的共现词分析表明,条件概率可以较为准确地区分不同构式,并提取出构式的潜在原型。结合针对先行词和从句主语的共现词分析,可以发现,隐性 /显性关系代词从句并非同义构式,二者在具体使用中的形式 /意义分布呈现显著差异。其中,隐性关系代词从句的潜在原型可以被总结为不定代词+隐性关系代词+人称代词,如例(2)所示,something we take for granted体现了隐性关系代词从句的潜在原型,在该关系从句中,something所表达的语义值较低,主要发挥标记作用,(2)a完全可以被转化为(2)b的表达方式,二者意义并无明显差异。 (2) a. Security issomethingwe all take for granted on our campuses but this cannot be guaranteed off-campus. (NESSIE) (2) b. We take security for granted on our campuses but this cannot be guaranteed off-campus. 基于认知加工理论(Rohdenburg, 1996)的观点,当语言结构的认知加工负载较大时,该结构倾向使用较为明晰的表达方式(如显性关系代词从句);反之,省略结构(隐性关系代词从句)具有更高的倾向性。在隐性关系代词从句的潜在原型结构中,不定代词充当的先行词语义丰富度较低,从句主语的人称代词属于有灵词语,二者所对应的认知加工负载均较低,因此连接整个关系从句的关系代词倾向使用省略(隐性关系代词)形式。伴随认知加工负载的不断增大,显性关系代词的使用概率显著上升。概言之,语言结构的信息值与该结构出现省略形式的概率呈现负相关性(Cohen Priva, 2017:27)。在两种关系从句中,先行词和从句主语在形式 /意义层面展现的高认知固化程度使得本研究得以准确区分两种关系从句。 构式界定的分歧在本质上源于:1) 没有厘清构式界定的理论层面和操作层面,没有以科学的操作标准来检验构式的理论阐述;2) 将频次与构式直接挂钩,而未对频次进行科学界定。鉴于此,本文基于前人研究,从操作层面将构式界定为基于频次的认知固化程度,并详细探讨认知固化程度与频次自身的界定,提出基于条件概率的相关性分析可以作为界定认知固化程度、构式的操作标准。本研究以英语本族语者的隐性 /显性关系代词从句为研究对象,通过基于条件概率的共现词分析,从具体词语层面较为客观地界定了两种从句构式,显性 /隐性关系代词从句可以被界定为其在形式 /意义层面的认知固化程度,条件概率和大规模语料相结合可以作为判定其认知固化程度的操作标准。 构式的界定涉及构式语法理论的核心,本研究结合认知固化与基于条件概率的相关性分析尝试对其进行探讨,初步证明了认知固化与条件概率在界定构式中的重要作用。本研究在两个方面存在拓展空间:1) 基于条件概率的相关性分析可以采取具体词语层面和抽象特征层面两种路径,本文只是基于具体词语层面开展的共现词分析,对抽象特征层面并未涉及;2) 本研究的共现词分析主要基于词型,对词语的功能层面涉及不多。对上述问题,我们将在今后作进一步探讨。五、 讨论
六、 结语