魏 琛,倪盛俭
(1.武夷学院 人文与教师教育学院,福建 武夷山 354300;2.华东师范大学 外语学院,上海 200241; 3.贵州财经大学 文法学院,贵州 贵阳 511300)
为了便于叙述词汇语义学的各大流派,笔者在《词汇语义的根本问题及其回答——经典词汇语义学视角》一文中权且将词汇语义学流派中的历史语文语义学、结构主义语义学和生成主义语义学统称为词汇语义学的经典理论[1]47-60,原因在于历史语文语义学倡导的历时观、语境观和心理因素观等,结构主义语义学提出的共时观、系统观和结构观等,以及生成主义语义学强调的形式观等都呈现出延续式发展与互为支撑作用,而且也都成为诸如新结构主义语义学和认知语义学等后续研究的基础和起点[1-2]。前文指出,经典词汇语义学理论通过它们对Paradis提出的词汇语义学的五大根本问题[3]3347-3356的不同回答,在主要观点、理论基础、研究方法等方面存在互补式发展与多重承继关系。
Paradis根据有关学科理论对词汇语义学发展的内在要求提出了词汇语义学必须回答的五大根本问题:①语言意义的本质;②词义之间的关系;③词义的习得与存储;④词义的理解与传达;⑤词义的变化机制及其理据性,其中①②最为基本[3]3347-3356。Paradis认为上述五个问题对于声称在其理论框架内可对词义进行连贯性描述和解释的任何一个词汇语义学流派都是至关重要的,对它们的回答构成了各大流派之间相互联系且区分的基础[3-4]。对这五个问题的不同回答不仅成为不同词汇语义学理论的基本理论假设和承诺,而且还构成了它们方法选择和解释词语的基础[1]47-60[3]3347-3356。
历史语文语义学注重对语境因素、心理因素和历时因素的研究,主要对Paradis提出的词汇语义学的五大根本问题中的①④⑤做了回答;结构主义语义学认为语言意义的本质在于语言单位之间的关系,其所有理论的主线都是对关系的描述,因而仅对词汇语义学根本问题的①②做了回答;而作为生成语义学代表的卡茨语义学(又称卡茨模型,Katz’ Model)则持心智主义意义观,主张在语境中刻画形式化语义,主要对词汇根本问题的①②④做了回答,对③有所触及,但未深入其中,对⑤仅涉及共时语境下的语义变化,未涉及历时视角下的语义变化[1]47-60。
本文将承继前文的论述模式,以Geeraerts的TheoriesofLexicalSemantics[5]为框架,通过论述新结构主义语义学对词汇语义学的贡献与不足,以分解法和关系方法两个准则分别介绍新结构主义语义学的七大支流,力求较为全面地梳理、厘清各个理论的不足以及它们之间的互补式发展与多重承继关系。其中分解法涉及自然语义元语言理论(Natural Semantics Metalanguage, NSM)、概念语义学(Conceptual Semantics, CS)、双层语义学(Two-Level Semantics, TLS)、生成词库理论(Generative Lexicon Theory, GLT)等理论视角;关系方法则囊括了WordNet、意义—文本理论(Meaning-Text Theory, MTT)、分布语料分析(Distribution Corpus Analysis, DCA)等方面。
作为结构主义语义学和生成语法相结合产物的新结构主义语义学,开拓了语义研究的新疆域,同时也激发了人们对其仍未解决的某些问题作出重新思考。其中以下两个问题是新结构主义研究的出发点和重点:语言知识与语言外知识的区分、自然语言意义形式化的可能性。
Geeraerts提出三个划分新结构主义语义学的角度[5]145-146,而从它们对结构主义现象关注的角度看,我们认为新结构主义语义学可以分为两类。第一类理论有成分分析(分解法)的取向,如Wierzbicka的自然语义元语言理论(NSM)是经典成分分析法(Constitution Analysis,CA)的替代物。它舍弃了语义成分来自词汇场的区别性对立的主张,并假定存在一套普适的、可借助还原改述法(reductive paraphrase)来定义词语过程中发现的语义元。语义分解方法也是Jackendoff的概念语义学、Bierwisch的双层语义学和Pustejovsky的生成词库理论的基础。相比NSM,这三个理论注重词语意义的形式化表示;但和NSM一样,它们在更广泛的认知语境中对意义进行分解分析,聚焦于语境中语义的选择确定机制和调节机制。
分解法具有还原主义倾向。一方面,它把语义描述简化为一套元意义的成分,采取了纯语言层次的描述,未考虑到百科知识层面的内容。另一方面,它考虑到了心理充分性,不得不面对语言使用的模糊性和灵活性。新结构主义语义学理论采取以下观点协调这种矛盾:(1)心智的明晰性与世界的模糊性;(2)概念知识的精简性与感知知识的丰富性;(3)语义学的静态稳定性与语用学的动态灵活性。第一种观点是NSM所采用的,它暗示尽管世界是模糊的,但是人脑对概念的区分是清楚的,世界的模糊并不会干扰大脑的清晰。第二种观点属于CS,它暗示语言层次中稀疏、离散的概念表征可以与丰富且具有灵活性的感知或非概念内容相结合:如果接受概念层次和视觉、运动图式(motor schemas)及其他非概念认知模式之间的密切联系,语言层面的分解描述就可以保持整齐和清楚的描述。第三种观点是TLS的典型特征,即意义具有在语境中的动态调制性[6]70-76。但意义的这一特性在一定程度上也为GLT所共享,它意味着定义明确的语义描述在语境因素的影响下,可以在语用层次加以调整和细化:如果能对产生特定语用意义的机制加以描述,就可以保证语义描写的整洁性。事实上GLT的理论和方法涵盖了CS和TLS,下面结合相关理论对这些观点加以详述并指出可能存在的问题。
1.自然语义元语言理论(NSM)
该理论由Wierzbicka于1972年始创,之后主要经其本人的努力又有多次的发展,是当代语义学中尝试建立普适的基元概念(简称“语义元”或“义元”)最先进的尝试,其语义描述基于两点:普适基元概念的词表和以“还原改述”为特点的定义方法。Wierzbicka坚持自然、非技术化、非形式化的定义,认为义元应该是普适的、能被所有语言所表达和拥有[7]15(Goddard称之为“强词汇化假设”[8]7-29)。Wierzbicka的还原改述试图从主观视角出发来充分体现概念的认知内容。Wierzbicka认为,尽管外部世界具有模糊性,词语的用法具有动态变化性,但是词语和外部世界反映在人脑中的概念是不变的,概念之间的区分也是清晰的,语言使用者可从自身认知视角出发,采用界限分明、定义明确的概念来命名和描述相对不确定、表现不那么好的世界[7]18[9]33。
然而,原型范畴理论的相关研究指出,像NSM这样离散的、连接的定义模型,在评估概念的普适性方面所起的作用是微乎其微的[10]108。Geeraerts指出,NSM未采用明确的方法来评估概念的普适性,而是仅凭借语言使用者的主观判断[5]135。另外,Goddard的“强词汇化假设”要求对比大量(原则上要求对比所有)不同的语言,并在此基础上提取普适性的义元[8]7-29。事实上,NSM不仅没有这样做,即使是基于主观提取的现有的60多个义元,也并不都具有普适性,比如其中很多与中文相对应的词语只有概念上的交叉,而句法实现形式却存在差异,这些义元所具有的特征至多只能是英语所特有的,即这些基元具有各民族语言特异性,并不具有普遍性。NSM采用的主观性视角以及缺乏充足的语言事实,使其所提取的义元数量频繁变动,具体表现为:首先,在NSM中语义完全是语言的、概念的,语义与感觉、知觉等无关,从而从主观层面上割裂了语言与心智、世界的联系。其次,NSM对词语的解释过于烦琐、复杂,抓不住真正的区别性语义特征,比如对“cup”和“mug”的定义分别占用了两页的篇幅,这不仅反映出NSM对词语的定义存在过于繁复的问题,也影响了它在实际应用层面上的适用性。
2.概念语义学(CS)
Jackendoff的概念语义学主要考虑了语言意义和语言外知识之间结合的可能性,提出了区分两者的方法。CS认为关于语言使用的知识表征不必全部落在词语表征上,部分的任务(比如视觉记忆、感知知识)完全可以交给其他的认知模块。形式的语义表征不必包含所有跟解释语言使用者的概念能力相关的信息[11]33。CS强调语义信息应该放在“概念结构”层。在这样的概念结构中,其他形式的认知如感知知识和运动图式可能和语言知识共同作用[12]34。语言语义不再具有特权地位,概念结构成了语言形式结构和非语言知识之间的界面[13]93-129。“界面”则是感知知识、运动图式和语言知识一起活动、相互作用的一个“平台”。比如在语音和句法上,Jackendoff采取Chomsky的自治观,强调语义研究应引入认知心理学的研究成果,认为句法层和语义层之间存在接口[14]411-418,即可将语义放在句法层面上加以解决其多义性问题。其界面功能在下面这样的词条中得以体现(见图1)。
图1中,i表示thing是主语,j表示thing,LIQUID是宾语。这个概念结构表示动词“drink”的内部语义结构呈现为一个事件,表示主语(施事)致使液态的东西(沿着某一路径)进入到宾语(受事)的口中(路径终点)。该形式化描写的语义结构体现了语义与句法的结合。其中,语义描述基于有限的义元,如事件类型、状态、事物、路径、地点、性质和数量等构成一个个本体。它们被认为是内在于人类认知、具有普适性的范畴,可以同时用于描述概念、感知和运动信息。这样,概念结构扮演着界面的角色:它既连接着自治的句构层,又连接着非语言的信息即世界知识层。Jackendoff指出要完整表示词义,还需要结合语音、句法、概念结构和感知知识等不同方面的内容[11]33,因而上述概念结构至多只是表示了语言与语言外知识之间的界面。
图1 Jackendoff对“drink”的概念结构表示[11]139
实际上,Jackendoff更多地把注意力放在句法和语义之间的界面,对词语的灵活用法或概念结构与语言外知识之间的界面关注较少。CS理论的后半部分没有像以语法为主导的其他部分那样,按严格的形式要求加以详述。和NSM一样,CS原则上接受词语用法的灵活性和模糊性,但并未激发人们对这种意义的可变性及其可能影响语义在哪些方面呈现出最大限度活跃度方面的语义研究。
关于普适性义元的构造方法,CS比NSM更加语焉不详。CS强调的与语言外知识的联系只是一个规定性的原则,并未赋予其一个完整的描写框架。因而CS这种通过语言与其他认知模式的联系来说明其模糊性和灵活性的主张,还存在以下问题:(1)没有区分概念特征和非概念信息的明确标准;(2)如果要区分概念知识和其他形式的认知,那么词语语义颗粒度的精细化描写信息是否总属于感知或至少它不是概念的,这还是一个极具开放性的问题;(3)CS的论证基于这个假设:概念信息和感知之间没有交叉。因为认知科学的研究已证明感觉、知觉、表象是形成概念的基础[15]28。认知语义学则把这些称为前概念,它们与概念之间没有清晰的界限,两者之间存在交叉关系,其中感知包括感觉、知觉、表象等内容[10,16-17]。
3.双层语义学(TLS)
认知科学认为,记忆系统包括语言系统和情景[15]28,尝试从信息编码的角度将记忆分为两个系统:言语系统和表象系统。后者是前者理解的语境,仅表示前者是不够的;而且长时记忆的提取是外部刺激和记忆内容相互作用的动态过程[15]30。因而,概念语义学(CS)对语言知识和世界知识之间的区分实际上是对长时记忆的一种静态划分[15]31。没有体现两种知识之间在具体语境中呈现出来的动态性、社会性和交互性[6]70-76。
由Manfred Bierwisch[18-22]发起、后经Ewald Lang发展的双层语义学[23]127-167(TLS)尝试调和二者之间的这种交互作用[22]1-66。与CS一样,TLS也采取了模块化的认知观:认知行为由大部分属于自动心智模块的系统或分系统之间的相互作用决定[18]410-435。尤其是自然语言中的一词多义现象可以通过区分“语义形式”和“概念结构”两个层次的知识表示加以充分地区分。处于第一层位置的语义形式可看作是一个语言实体[19]56-79。它既是对词条语言特有内容的描述,也是词库内容形式化的结果;它既包括通过跟概念结构相互作用可以确定的变量、参数,还包括特定词条如何对复杂句子结构做出贡献的语法信息及其所规定的在概念结构层次上词条与其他实体搭配的条件。处于第二层的是由独立于语言的概念信息要素和系统组成的概念结构[20]1-39。比如对应于具体对象的概念可被表示成“对象图式”,用来详细说明空间对象类的本质特征,以帮助在语义形式层次定义词条时填入变量和参数[21]645-667。这就要求区分语义形式和概念结构。每个词在语义形式层面只有单一的意思,但借助于与语境特有的概念因素之间的相互作用,该词可以得到一系列基于语境的不同解释[6]70-76。可见,TLS注重语境与词语之间的动态关系,关注语义变化。下面请看一个说明双层语义表示方法的例子。
λx[PURPOSE[x w]]是一个抽象的逻辑表达式,以PURPOSE作为语义特征的词语,可以代入这个表达式,如university理解为提供“高等教学”(advanced study and teaching)的机构,就具有“目的”的语义特征,表示为:
λx [PURPOSE[x w] & advanced study and teaching [w]][22]1-66
这个表达式理解为:存在一个x,它具有PURPOSE这样一个语义特征,这个特征在独立于语言的空间表现为advanced study and teaching这样一个“对象图式”。这里“[PURPOSE[x w]”就是“语义形式”层内容,“advanced study and teaching [w]]”就是“概念结构”层,这两层通过w(代表对象在外部空间的图式体现)产生联系。如果要同时表达university的另一个语义特征“大学所在的地方或建筑物”,那么,university表示为:
λx [building [x] & purpose [x w]][22]1-66
Geeraerts指出,双层语义范式与NSM、CS一样,都属于词汇语义学的“节俭模型”[5]144:考虑到语义随语境所具有的可变性,但又试图通过把大部分的可变性归到另一层次的描述,把实际的定义描述保持在一定的范围内,因而它采用了特有的、整体的语义定义把语言层从语境层中区别开来,即在语境层面依语境因素对词语整体语义或部分凸显的语义进行调节和细化。
实际上,考虑语用的灵活性和语境的创造性是非常有必要的。但是,Geeraerts指出TLS对语义动态性的解释存在许多不足和困难[5]144-147。首先,TLS对语义的定义存在充分性不足问题。如果存在整体语义,那么不能仅仅假设它们的存在,还要证明它们的恰当性。从描述的角度看,整体语义覆盖词条所有用法,同时整体语义与这些用法之间还应做出足够的区分。从对university一词的形式化表示看,TLS显然没有达到这个要求。其次,TLS所强调的有关“语义特征”既不具有本质性,也不具有区分性。基于此,采用节俭的方法通常意味着相当抽象和简略的定义:定义越是抽象和简略,就越笼统,从而导致其缺乏足够的区分。再者,不参考更广的百科知识,语境化过程到底可以被理解到什么程度,很值得怀疑。最后,语义变化是一个渐变的连续性过程。语用虽会在词语中留下痕迹,但反复出现的语境会导致中间地带或模糊现象的出现,甚至可能赋予词语新的意义,并造成词义的突变或增值,因而TLS不能很好地解决这种历时的语义变迁现象[5]146-147,即TLS对词语的语法化历程和发生机制以及语义的历时变化性都无法做出很好的解释。
4.生成词库理论(GLT)
生成词库理论(GLT)由Pustejovsky于1992年创立[24]1-2。GLT是当代语义学中最详尽的形式化分解方法模式[25-26]。本节论述该理论中至关重要的四点:该理论的总特点、表示样式、该理论的发展和评论。
GLT的总特点有二:其一,相比上述的理论,GLT更加注重对一词多义现象和创造性语言用法的描述,它明显关注了词义的常规多义性或逻辑多义性现象,为词语多义面的选择性凸显机制研究奠定了基础[10]86[27]202-221。其二,GLT在词汇语义学学科中具有特殊的地位。GLT源自生成语义学,不仅在形式语法的背景下提出词汇分解模式,而且试图通过超越“义项枚举词库(方法)”(Semantics Enumeration Lexicon, SEL)实现对卡茨语义学的全面赶超[26]8[28]34-39。SEL是一种仅仅列出词语义项而不解释语言动态性的形式词库。GLT将词库作为基础来描述语言动态、创造性的用法,它超越卡茨语义学之处包括:(1)GLT的逻辑多义性解释维度明显与语义逻辑表征产生联系,对表征进行分层使其所表征的内容更丰富、细致[26]817-818[28]34-39;(2)GLT的逻辑语义表征模式主要面向计算语言学,从而提出更具可操作性的语义表示方式和语义生成机制[24]152[29-31]。以GLT对动词“kill”的词语表示模式为例,阐释详见图2。
图2 GLT对动词“kill”内部语义结构的表示[24]109
GLT使用EVENTSTR(事件结构)来表示事件的类型或词汇内部结构。GLT中的事件类型有三种:状态、过程和转变。事件结构主要针对动词或由动词转化、派生过来的名词,不针对普通名词的原因在于表示具体事物名称的普通名词通常没有事件内容。
Pustejovsky区分了三种不同类型的分事件之间约束关系:(1)<∞表示两事件相继发生,时间上没有重叠;(2) 而ARGSTR表示的是论元结构,其内容参照物性结构(Qualia Structure)和实际表示的需要,可以表示论元的不同特征。配价语法认为论元是针对动词而言的[32]3-6,事实上形容词和名词也有配价[33-34]。虽然GLT没有明确提出形容词和名词的配价问题,但在其词语表示模式中有所体现,即GLT的物性结构拓展了论元结构理论,将针对动词的配价值拓展到了名词和形容词的配价值上。 如图2所示,动词kill有两个论元:论元1(ARG1)为施事,具有“个体”(ind)和“物理实体”(physobj)特征;论元2(ARG2)为受事,具有“有生命”(animate)、“个体”和“物理实体”等特征[24]78-83。在这里,kill的论元都是“真论元”(true argument),相当于通常所说的论元概念。在GLT中,还有“默认论元”(default argument)和“影子论元”(shadow argument),前者蕴涵于事件中,可以不体现在句法中。如句子“John is building the house [out of bricks].”中,“out of bricks”就是默认论元,在句中可以省略而不必明示出来。而“影子论元”是对相关词语的“复印”,其前面必须有表示小类或修饰的词语,影子论元才能出现在句法中。如“Mary buttered her toast with an expensive butter.”中,“expensive”后的“butter”就是影子论元,是对前面动词“butter”的语义复印,强调Mary所使用的是昂贵的“黄油”而不是普通或廉价的“黄油”来涂抹她的吐司;在这里若将expensive去掉,该句的语义则显异常。 物性结构是用来描述、刻画语义特征成分的,其内容源于亚里士多德的四因说:质料因、形式因、目的因和动力因[27]202-221。从根本上说,物性结构是对“实体”实义特征的描述,不管它是出现在动词、形容词还是名词的语义表示中[26-27]。图2包含了GLT对词语内容表示的三个层次,其实还有一个表示词语之间的分类关系和概念继承关系的层次没有表示出来。这便是词汇承继结构,它表示词语之间的分类关系,使词语之间的一些特征能够相互继承或传递;而词汇承继理论是贯穿于GLT的主题[35-36]。 GLT真正的生成能力来自谓词和论元的结合、组合方式,体现为三种不同的语义生成机制[24]57-59,涉及函项(function)概念。函项表达谓词和论元之间的关系,相当于逻辑中的谓词。在GLT中“词汇函数”(lexical function)则指表示词语之间的各种关系[24]105-106。第一种是类型匹配(Type Matching),它满足函项要求的类型直接从已经编码的论元中选取。比如动词flow要求它的第一个论元是液体,如果beer具有液体的特征,那么the beer flows就是一个合法的结构。第二种是类型调节(Type Accommodation),函项要求的类型借助词汇继承结构由论元继承得到。比如,如果动词drive要求的直接宾语是car,那么“No linguist drives a SUV.”则被认为是可接受的,因为SUV作为car的下义词,继承了car的典型特征。从本质上看,类型调节体现的是换喻机制的一种:上义词替代下义词或部分代替整体。第三种是类型压制(Type Coercion)。如果上述两种机制都不能解释合法结构中的函项要求,则存在类型压制,即函项要求强加于论元上,强制论元改变类型以满足函项的要求,否则将存在结构或语义异常[29]39-76[31]115-118。类型压制分为两类:利用(Exploitation)和引入(Introduction)。“利用”是提取论元的部分类型来满足谓词表达的函项,即根据语境,论元被突显的部分被选择用来满足函项。这适用于把两个独立甚至不相容语义解释放在一起的复杂类型语义描写。比如,“book”既具有“物体”也具有“信息”这样的类型意义,用“·”表示两个类型意义的并列关系:physobj·info(表示物质和信息的并列关系)。GLT称这种复杂类型为“带点类型”。根据谓词要求,“利用”从复杂类型中选取合适的部分内容满足句法要求。如“John tears the book into pieces.”中,tear要求受事具有physobj特性,“利用”就从book的physobj·info中选取physobj,而不必涉及“info”。“引入”通过扩大已经编码的意义类型来满足谓词的要求,这是类推加换喻的语义扩展,体现的是转喻机制中的逻辑语义关系。而动词“read”则要求直接宾语具有“带点类型”意义,如“book”。通常rumour只有info义,但在句子“We all read the rumour about the cook and the headmaster.”中,由于read的要求,参照book中被凸显的信息义,physobj被引入rumour的语义,info被扩展为physobj·info。 在新结构主义语义学的理论中,GLT是最精密、最富有成效的后生成主义形式分解语义学[5]147。与它相比,TSL和CS显得相对有限,GLT多方面发展了之前的相关理论。目前Pustejovsky带领其课题组,正在构建基于语料库的一个语义体系——Brandeis Semantic Ontology(BSO)[27]202-221[31]108-110。当然,GLT本身也不是完善的。学者们对GLT进行了多方面的探讨和发展。第一,GLT基于思辨的方法,缺乏实验基础,因而学者们建议GLT引入基于语料的统计方法,使GLT的实验/实证基础变得扎实。第二,GLT的形式手段还不够精练,因而其形式手段还需进一步提炼。如Copestake & Briscoe建议在GLT中引入词汇规则(lexical rules)以便更经济地解决规则一词多义现象[37]15-67。第三,GLT中仅仅体现了换喻的部分情况,对于隐喻基本没有涉及。Asher & Lascarides则建议GLT再利用词汇规则来体现隐喻机制[38]69-108。如针对运动动词,可以基于对其适当的图式描述,用词汇规则对隐喻机制加以描述。第四,GLT主要考虑有直接联系的词语之间的逻辑语义关系,对于篇章、语用层面则考虑得并不充分,因而GLT对语境语义变化性的考虑本质上还是静态的[5]。第五,与其他理论一样,GLT对语义信息与语用信息或语言外知识之间的区分原则和分法仍然是一个未能解决的问题,这种区分涉及物性结构的内容及其在语义机制中的生成能力,由于语言内外知识区分不清,物性结构的生成能力如同Chomsky早期的生成规则那样,有时过于强大而有时又显得不足[5]153-155。第六,GLT中成分分析的基本语义构建材料性质、分类等是如何确定的?是否需要建立一个系统的概念本体来明确相关的概念的划分和归属?GLT对这些问题都给出明确的回答。第七,从认知科学和认知语言学看,GLT缺乏对情景系统、表象系统或意象图式的描述,而这些正是语义理解中语境和隐喻、转喻的基础。当然,这个问题也是新结构主义的其他分解法共同的缺点。 NSM、CS、TLS和GLT同属于成分分解方法,是对结构主义成分分析法(Constitution Analysis, CA)的继承,并因生成语义学的影响(即Katz和Fodor把CA引入形式语法)而具有形式化的特征。下面介绍结构主义关系方法的新发展和应用,介绍的三个方法都和计算语义学相关。其中WordNet和意义—文本理论(MTT)为形式化词库构建提供数据和描述模式。由于词语可以承载语言许多方面的相关信息,语言工程技术在计算应用方面要求有机器可读词典或词库(Machine Readable Dictionary / Lexicon, MRD/MRL)。 和GLT一样,WordNet和MTT都直接或间接地提供了生产词典或词库的想法。MRD或MRL是基于规则自然语言信息处理(Natural Language Processing, NLP)的重要基础资源,而分布语料分析(DCA)则与NLP中的统计模式相联系。从20世纪60年代到80年代,规则方法占主导地位;而20世纪90年代至今,统计方法占主导。实际上,NLP的处理方法经历了从规则主导到统计主导再到规则和统计相结合的发展历程。以规则占主导的NLP中的表示形式通常源于词汇功能语法和中心驱动短语结构语法等。而以统计占主导的NLP中,语言知识则主要以模板(pattern)的形式出现,可以通过统计方法从大量的语料中抽取,借此得到大量语言知识。随着数字化文本资源的不断扩大,计算语言学中基于语料的机器学习研究成果剧增。利用统计学习算法,不必借助形式语言表示就可以从语料中检索到语言信息。但是单纯依靠规则或统计的算法是有缺陷的,当代的NLP强调规则与统计相结合的方法促进了语义表征更为精确地表达。 1.WordNet WordNet是语义关系概念实践的结果。它以心理学为理论基础,由心理语言学家George Miller发起,最初提供英语词汇资料库,现在更多的语言有了WordNet,还专门成立了“全球词网组织”。 WordNet中,名词、动词、形容词和副词被分组为各种同义集(synsets),这些同义集及其包含的词条彼此通过意义关系联系起来。WordNet中的词条内容由两个部分构成:一部分包括一个同义集、一个定义和一个例子,如多义词的每个义项各占一个条目,而同义词不是严格意义上的同义而只是近似义词语的集合。另一部分按词条词性和所属领域提供同义关系之外各种关系的词语,其中名词词条提供上下义、部分—整体和反义关系的词语,动词词条提供上下义、方式、蕴涵和反义关系词语,而形容词和副词的词条则提供反义关系词。WordNet还包括多词结构,但不包括虚词。除了语义关系,WordNet还包括词语之间的派生关系、动词出现的句子框架和词语的相对频率等信息。WordNet采取Lyons所说的“最大化同形异义”(maximize homonymy)方法[39]138,不区分一词多义和同形异义现象[26]3-6。尽管WordNet对词语语义的描述,最初目标是要达到心理充分性,但由于各方面条件限制,不得不放弃这样的目标。因此WordNet只是计算词典学的一个MRD,而不是心理语言学的一个心智词库。 由于WordNet是免费的、大规模的、涉及语言众多的,因而成为目前NLP中应用最广的词汇资源。WordNet的不足有:缺乏对组合关系的表示;已经表示的聚合关系有待完善;忽略对一词多义现象的本质及其生成机制的研究;采用义项列举的方法,导致Ignatow & Mihalcea所说的下列结果“其所例举的一些词义彼此接近到连人类都无法区别其差异”[40]10。尽管如此,仍无法穷尽义项出现的所有语境,特别是新语境下的词义变化性。由此可见,从理论上讲,自然语言语义在动态语境中具有无限的生成性和创造性。换言之,语境变化对词义的调节作用是强大的[26]19。 2. 意义—文本理论(MTT) 此外,LF在描述词语—句法模板也有作用。比如,在函项“Magn (to laugh) = heartily, one’s head off”中[41]103,函数Magn表示“加强程度”,Magn (to laugh)表示加强to laugh的修饰语,等号后面是函数取值,即加强to laugh程度的有heartily或one’s head off。该例子说明LF也可以描述组合关系。此外,LF还可以描述逻辑关系,如:函数Pred(to be L)表示导致结果的动作,如Pred (to be drunk) = to drink表示导致“drunk”的原因是“to drink”[42]37-102。LF具有相当的普适性,适用于不同语言的描述。 到目前为止,MTT主要应用于俄语和法语,它区分了60多种LF,这些函数是MTT主要实践成果——“解释性组合词典”(ExplanatoryCombinatorialDictionary,ECD)的核心[43]8。LF为词汇语义描述提供丰富、多面的框架。从实践的角度看,基于传统语义关系概念的ECD构成了比WordNet丰富得多的信息来源,引起了词典编纂者和计算语言学家的强烈兴趣。但是,它在NLP中的应用并没有WordNet广泛,主要原因在于其描写体系的构建非常费力费时,目前它所能提供的词汇量和语言数量均不能与WordNet相提并论。为此,我们认为MTT的不足之处主要有:(1)语言知识和百科知识的分界尚未涉及;(2)部分—整体关系因被认为属于百科知识而没有被包括在LF中;(3)描写体系过于繁复,牺牲了语言经济性表征的终极目标。事实上,分界问题存在于所有试图用一种受限、还原的元语言对语义进行描述的框架。 3. 分布语料分析(DCA) WordNet仅表示聚合关系,MTT的LF同时表达聚合和组合关系,但LF对组合关系的表示还不够全面、深入,缺乏广泛的基于语料库的统计分布的事实基础,而DCA则弥补了MTT在这方面的不足。由于其不断的革新性和动态性,自1990年代起至今DCA一直是NLP中占绝对主导地位的方法。 从概念语义学[13-14]和Levin对英语动词的研究[44-45]已可看出其基于语言是自治系统的分布思想,而词汇语义学分布法的主要进步来自分布思想在大规模语料库中的应用。DCA采取一种激进的、自下而上的、基于用法的方法:对实际使用的语言行为的分析被认为是语言学的终极方法基础。DCA始于1970年代,其发展受到许多影响。影响之一,DCA受Firth著名格言“You shall know a word by the company it keeps.”[46]168和Harris的“分布假设”[47]146-162的影响:出现在相同语境中的词语通常有相同的意义。换言之,一个词语的意义与其相邻的词语的意义之间存在互动和选择限制关系,即词义受与其相邻的词语的影响,因使用频率而固化形成固定的搭配意义。影响之二,DCA强调语言是一种个体使用者的言语行动的集合体,即DCA持典型的言语行为观。人类学家Malinowski认为不仅要在语境中研究语言,而且语言被认为是行动的方式[48]7,而Wittgenstein则认为意义即用法[49]168。影响之三,DCA受一些基于语料的词典编撰理论的深刻影响。 DCA根据搭配来区分词语的意义。Stubbs将搭配定义为:流动文本中两个及以上词语之间趋向于同现的一种词汇关系[50]1-36。在这种定义下,Sinclair区分了四种搭配关系:搭配(collocation)、类联接(colligation)、语义倾向(semantic preference)和语义韵律(semantic prosody)[51-52]。“搭配”是从词汇角度看线性文本中词语的共现关系,其中目标词(被研究的词)被称为“节点”,同现词被称为“搭配词”(collocate)。常用检查搭配的方法是按字母表顺序为文本产生一个“语境关键词索引行”(concordance)[51]81-83。根据索引行,可以直观地看到目标词与其他词语的配置关系。配置分析节点还可以是大于词语的单位。索引行中可能会出现对于理解目标词没有多大意义的虚词——“停止词”(stop word),它们可以当作过滤器来调整配置分析的结果。“类联接”通常被定义为“语法选择同现关系”[52]75-106,强调节点与同现词之间语法上的相互选择与限制关系。“语义倾向”关注节点与同现词语之间的语义联系。“语义韵律”不是从通常的语义(特征)角度,而是从隐含义或附加义如情感、评价态度等出发来看节点词与周围词语的关系[53]105-108。 DCA依赖于信息技术:资料数字化、信息检索软件,而且与计量语言学有着紧密的联系。这与基于语料库的传统词典编撰有较大的差异。比如,在处理“停止词”的时候,用到“逐点互信息”[54-55]或tf-idf等统计方法来解决,有效克服了确定同现关系中的主观性。语境分布的统计转向使得词语搭配处理与另一种定量分布模型——“词语空间模型(2)向量模型不容易表达词语的各种关系。近几年,出现了不少基于图的统计方法,专门研究图在NLP中应用的TextGraphs国际研讨会。该研讨会于2006年在纽约举办了第一届会议,2011年第六届会议将在波特兰(Portland)举行(http://www.textgraphs. org/ws11/)。”(Word Space Model, WSM)的结合成为可能。WSM指所有用于词汇语义学、通过模型确定语境中词语意义的所有方法,其中,词语的意义通过语境向量分析而得到。向量包括目标词各种语境特征的值,根据这些语境特征的本质,可以分出三种WSM。第一种是基于词语的模型,仅考虑目标词语境中出现的其他词语,不考虑它们之间的句法联系。这就是上面介绍的搭配方法:目标词的语境被定义为其周围多个词语,如果被研究的不同目标词的附近经常出现相同的词语,则它们是相似的。第二种是基于句法的模型,其焦点是目标词参与的句法关系。如果两个目标词经常充当同样的句法角色,则它们是相似的。第三种是基于文档的模型,利用某种文本实体作为特征,其语境向量记录目标词所出现于其中的文档、章节、文章、句子或类似的文本。如果两个词语经常出现在相同的、同等级的文本中,则它们具有分布相似性。 上述三种模型的过程框架的共同点在于:它们可按以下程序寻找语义相关词语。首先,为目标词建立语境向量,计算、记录每一个目标词与每个语境特征(3)语境特征就是与目标词同现的其他词语、句子、文档、章节、文章或类似的文本。共现的次数,所有语境向量共同构成“词语特征矩阵”。矩阵中的值最初仅表示目标词和语境特征简单的同现频率,根据一定的条件和算法,对它们进行加权计算,排除“停止词”的干扰,使所得值更能体现目标词和语境特征之间的统计联系。其次,必要时可对词语特征矩阵进行降维处理,所用数学方法有“奇异值分解”“非负矩阵分解”“隐含语义分析”等[56]157-159,这些方法不仅可以减少计算词语之间分布相似性的时间,还常常可以发现一些比原有语境特征包含更多语义信息的维度。最后,基于数学函数如余弦来计算两个目标词之间的分布相似性:向量的夹角越小,余弦值越大;目标词之间分布越相似,语义也越相似。 DCA的应用非常广泛。它可以应用于NLP的同义词词典的抽取、自动文章评估、问题回答、文本分类、句子理解、词语歧义区分(WSD)(4)据我们了解,1990年以来,NLP中的WSD还没有见到以规则为主的方法。、隐喻过程分析和同义词的自动发现等等。DCA中,基本上见不到词汇语义学理论的影子,而计算词汇语义学对于理论词汇语义学的反馈也是有限的,难怪Geeraerts指出,整体而言,词汇语义学与计算词汇语义学之间的相互作用是相当有限的[5]175-178。 DCA具有三个特点。首先,在新结构主义的方法中,DCA是最不具有结构主义特征的,因为它脱离了主流结构主义方法,发展了其非主流的因素,主要着眼于对组合关系的处理。DCA的组合关系本质上是基于语境的,是动态的,这与主流结构主义主张语言是自治的静态系统观相矛盾。其次,DCA与NLP自1990年代以来的统计趋势相结合。尽管其他形式化语义特别是各种形式成分分析方法,尝试把规则类的计算语言学和NLP联系起来,但有两大难题它们至今无法解决:(1)义元的界定、选择和义元系统的建立(5)义元系统的建立,NLP的实践可能比词汇语义学理论做得好,如HowNet拥有1 500多个义元的义元系统,尽管它不一定具有很好的离散性、完整性和简洁性,但要比本文介绍的基于思辨的相关理论做得好得多。;(2)语言知识、心智内容和世界知识之间的区分,以及词语表示中是否应该包括心智和世界内容,具体应该包括哪些内容。由于其他方法也存在这些问题,使得DCA在与计算语言学中的盖然范式结合时具有明显的优势。最后,DCA基于大量的语料,具有广泛的实验基础,其客观性和全面性等方面更显优势。 Geeraerts认为DCA有以下不足:第一,DCA主要是一种方法,而不是模式,其方法的理论基础并不总是清晰的。有时候DCA缺乏对数据的理论解释,还没有形成稳定、系统的方法程序对特定问题进行描述。第二,DCA主要考虑语言本身,对于语言外的内容基本上未充分考虑到。克服这些缺点将会使DCA的前景更美好、更令人兴奋[5]175-178。 总体而言,新结构主义语义学主要对Paradis提出的词汇语义学的五大根本问题的①②和④作了较为全面的回答,对于③仅对语义储藏作了部分回答,未涉及语义习得,对于⑤只回答了共时语义变化,未涉及历时语义变化;但它比生成语义学的解释加更充分,特别是生成词库理论,提出了更具体、更丰富的语义表示方法和语义生成机制。在具有成分分析取向的理论中,NSM和GL是比较能产的方法,颇有影响,TLS和CS则处于相对封闭的地位。在注重关系的语义学中,WordNet被广泛应用,而LF则未能广泛地为人所知,目前发展最快的当数DCA。这些理论大部分与认知语言学同时存在,尽管从理论研究角度看,目前认知语言学占主导地位。 总而言之,新结构主义语义学内部7大支流,在主要观点、理论立场和研究范式上也呈现出互补式发展与多重承继关系[1]47-60。Geeraerts认为,在这7大支流中,Jackendoff、Bierwisch和Pustejovsky的理论实际上是“新生成主义”,而其他理论则是“新结构主义”[5]124-126。原因在于新结构主义语义学基于结构主义的研究框架,对词语内部结构中各种语义成分之前的关系采取了更为精密的形式化刻画,是更为典型的结构主义研究框架。可以说,新结构主义语义学进一步发展了结构主义的语义分解范式,其构成了NSM、CS、TWL以及GLT的基础。如NSM摒弃了意义成分源于语义场内部的区别观,通过其所假设的基元概念来定义词义,而CS、TWL和GLT显然对词义的形式化表征更感兴趣,如GLT对词语内部语义结构的精细化形式表征成为当代语义学形式化分析的典范。而WordNet、MTT、LF以及DCA则更加关注词语间的组合关系,它们都采取了具有可选择性的分布范式,为当代语言学研究中基于语料库的定量研究开辟了新疆域,为计算词汇语义学贡献了力量。最后,CS、TWL和GLT还致力于探讨词汇和认知之间的互动关系,在语义和语境之间的接口处寻求语义的认知基础。必须指出的是,上述7大支流之间的关系突然间呈现于我们面前,它们在理论立场间具有关联性,互为连接、互为支撑,一种支流只是构成另一支流发展线索的暂时支点或起点,即前人的探索与后来者的探究之间似乎存在某种内在的逻辑性从而将这7大支流连接起来[5]125-126,并统一纳入新结构主义语义学的大框架之内,实现其内部学术传统的多重承继关系。 有鉴于此,未来的语言学研究应在不同学科之间或同一学科不同流派之间寻求互动,开展切实有效的合作机制,借鉴其他学科或不同流派中成熟的观点、研究方法,开展学科间或流派间的深度对话,取长补短,走融合发展的共进路径[57]39-50,携手对语义这一既具复杂性又具多维性、既古老又新颖的话题展开跨学科、跨领域的深度研究。同时,中国学者还应积极将西方的词汇语义学理论应用于汉语语言事实的研究之中,使之趋向本土化[58]1-10,努力创建符合汉语实情的汉语词汇语义学理论,寻求中国语义理论创新的突破,从而在世界词汇语义学理论之林中发出中国学派的声音,做出中国语言学界的贡献。(二)关系方法
三、结语