《构式词典学:跨语言构式库开发》评介

2021-12-16 04:28江南大学严敏芬
外文研究 2021年4期
关键词:构式语料库语义

江南大学 严敏芬 张 馨

1. 引言

构式库(constructicon)是Charles. J. Fillmore构式语法的核心概念。作为对英语框架网(FrameNet)的补充,英语构式库开发(Fillmoreetal. 2012)逐渐受到学界的关注,出现了全球大学间的国际交流与合作。瑞典和巴西团队组织的国际框架网工作坊、伯克利框架网团队参与的系列国际研讨会、“多语框架网与构式库”等众多学术研讨,促进了全球范围内不同语种构式库开发的研究与实践。在这样的背景下,本杰明出版公司于2018年出版由Lyngfelt、Borin、Ohara和Torrent联合汇编的《构式词典学:跨语言构式库开发》一书。该书首次对跨语言构式库开发进行了系统介绍,不仅回答了构式库及构式资源开发的理论和实际操作问题,包括框架网与构式库、构式标注与构式库标注、构式库开发与语言技术的关系等,而且也是对已故框架语义学和构式语法创始人Charles J. Fillmore的纪念。

2. 主要内容

该书共9章。第一章是引言。该章作者Lyngfelt围绕构式库概念,从“构式与构式语法”和“框架语义与框架网”两对关系出发,阐明了语义角色在框架语义中的组成特点,及其在构式语法发展中的中心作用。构式库和框架网通过构式和框架之间的链接建立联系。因此,构式库不仅是一种语言理论,是构式的结构化清单,而且是构式描写的集合,是对构式实例的实践。为解决“实践性构式库开发”这一迄今亟待解决的难题,作者提出了“构式词典学”(Constructicography)这一术语,对进一步理解构式库(即语法构式词典)的内涵提供了指导,同时也为该书各个章节的展开奠定了基础。

第二章是“行动中的框架网络构式库”。该章作者Lee-Goldman & Petruck以be-recip构式(如Paul is friends with Chuck)为例,介绍了构式选择过程的方法,尤其是构式罩(construction-hood)的确定,包括定义构式的边界、构式组成部分的句法和语义限制。作者强调,对自然语言语料库中的构式实例进行注释,需要考虑语式(construct)、构式唤起成分(CEE)、语式成分(CE)等关键信息。案例分析验证了该文的假设:构式库可以与基于框架的词库并行开发,实现构式、词汇项和语义框架之间的链接。

第三章是“运作中的构式词典学:理论与瑞典语构式库实践”。该章作者Lyngfelt等人以瑞典语构式库项目(SweCcn)为例,首先讨论了SweCcn及相关资源的相互关联和协同。然后重点介绍了SweCcn构式库开发途径:1)确定构式词条编写的3个要素:定义、构式特征和列举;明确构式描写的4个维度:语法构式、语义、语用和分布;2)确定构式的选择来源:真实的语言使用和二手资源;3)开发基于语料库的构式分析工具:Karp和Korp;4)创建便于导航的结构化构式网络:构式承继等级和识别构式组;关注构式变异的描写格式及处理。

第四章是“走向巴西框架网的词汇与构式连续性”。该章作者Torrent等人以个案方法,分析了dative_with_infinitive构式和开始体构式(the Inceptive Aspect Construction)的实例,旨在说明通用数据库FN-Br 2.0计算解决方案的可操作性及面临的新挑战。作者指出,巴西葡萄牙语框架网整合了基于框架的词库和构式库两个资源,并将其集成到通用数据库中。这一做法,既是对伯克利框架数据库的扩展,又实现了构式库开发的本土化。在此基础上,作者讨论了计算建模的4个关键问题:构式如何激发框架;网络中的构式如何相互联系;哪类词汇材料的能产性限制能够填补构式槽位;如何建模语法和词汇之间的连续性。

第五章是“框架与构式的关系:日语框架网构式库方案”。围绕日语框架网(JFN)中的构式库建设项目,该章作者Ohara探讨了框架与语法构式的关系。作者发现,框架网注释与构式库注释都关注句法和语义。两者的唯一区别是:构式库注释的构式义,可以带框架也可以不带框架。作者提出了基于框架的5种构式分类:3种非框架唤起构式,如head-complement构式、the-X-er,_the_Y-er构式、shared_completion构式;两种框架唤起构式,如语义框架和交互框架。

第七章是“建构德语构式库:实证、理论和方法论问题”。该章作者Boas & Ziem对比分析了德语与英语对应的3种构式:准同义构式、感叹构式家族和way构式。研究发现,这3种构式在句法和语义方面存在3种不同的特点(形义相同、义同形不同和形义不同),存在“构式对应连续统”。据此,作者提出了适合德语构式库开发的新路径:融合标注驱动方法和语料库方法,为德语提供详细的词汇—句法构式条目,同时将这些条目链接到更大的(系列)构式网络中,实现“识别和描述德语语法所有构式”的总目标。

第八章是“构式库建构与使用中的语言学vs.语言技术”。该章作者Borin等人以瑞典语构式库项目为例,说明语言学和语言技术学科之间融合的可能性。一方面,词汇宏资源的中心词汇资源——支点,可用来链接其他词汇资源,实现构式库组件资源的信息共享,为自然语言处理和语言学发展提供机会;自动识别构式工具的开发,为改进自动语言分析系统、挖掘语料库中的候选构式提供便利。另一方面,构式库中所描写的结构化语言知识,也为语言技术基础建设提供信息。因此,语言技术能够从形式化的、计算式的构式中受益,促成语法—词汇接口中非合成成分的再次合成。

第九章是“跨语言构式库对齐:英语、瑞典语和巴西葡萄牙语三语比较”。该文以英语、瑞典语和巴西葡萄牙语为研究对象,以英语构式库中现有的构式条目为基础,采取四步对比构式分析法,围绕源构式和目标构式之间的关系,讨论了多语构式库如何做到(近似)对等的问题。作者发现,3种语言之间存在对等程度连续体,即高中低3个等价层次。作者建议,应从LT应用程序和用户两个方面解决多语构式的对齐:通过计算对齐,解决链接问题;通过确定元语言(英语)和设计用户界面,解决用户资源。

3. 简评

该书的贡献和特色主要表现在以下几个方面:

第一,该书以构式库开发实践为线索,以构式和框架关系为研究对象,实现了CxG与词典学的有效结合,回答了“除了框架网,为什么还需要构式库”这一实践问题。CxG发端于1980年代(Lakoff 1987; Fillmoreetal. 1988),其发展经历了认知语法(Langacker 1987,2008)、认知构式语法(Goldberg 1995,2006)等其他构式主义方法。Goldberg(2013)概括了构式主义方法的5大主旨:1)语法构式;2)表层结构;3)构式网络;4)跨语言变异性和概括性;5)基于用法。该书吸收CxG的核心思想,建立了构式库开发指导原则。具体表现在以下几个方面:

1)与框架网不同,该书将构式(形式和意义/功能的配对)视作构式库描写的基本单元。由于构式具有不同抽象度和复杂度,因此超越词汇的构式单元(如多词构式、双及物构式、感叹构式家族)也可以作为资源纳入构式库开发,从而有效弥补框架网仅关注词汇资源的不足。

2)与传统的词典学不同,该书将“基于用法”的方法视作发现可能构式的主要依据。基于用法的构式语法认为,基于频次和显著性,构式是在对实例概括的过程中逐渐形成的。依据这一思想,构式库开发发展了传统词典学方法,通过语式识别并挖掘真实文本中潜在的构式,确定候选构式选择的理据性。另外,基于用法的方法能够有效解决构式的多义性问题、变异问题和承继问题,扩展框架语义的内涵,使构式库发展成为表征整个语言的构式网络。这是该书区别于构式语法和传统词典学的贡献之一。

3)与传统语法不同,该书吸收了认知语言学关于“语法—词汇连续统”(以下简称“连续统”)思想,并将其视作构式库开发实践中语法描写和词典学结合的依据,避免任意区分词与非词,确保框架网词库和框架网构式库中的信息均衡。“连续统”思想认为,所有的构式都是有意义的,并且能与是否唤起框架结合起来,从而有效地避免框架网注释不能处理纯语法模式和不带框架构式的注释问题。

第二,该书接受Fillmore(2008)的“构式描写库”概念,发展了Fillmore的框架语义学思想,形成了基本完善的构式词典学术语系统。构式和框架之间的联系可以追溯到Fillmore(1968)早期关于语义角色的研究,这是框架语义的组成特征,也是构式语法发展的一个核心概念,框架语义经常被用来表征构式语法分析的语义特征。

具体地说,该书围绕构式库开发,结合CxG、框架网和传统词典编辑,形成了术语层级网络:

1)以CxG核心假设为依据,形成了“基于构式”的构式词典学术语,以指导构式库开发。具体包括:构式、语法构式、表层结构、构式网络、跨语言变异性和概括性、基于用法的方法、构式承继性等。

2)结合CxG、框架语义学和词典学,形成了构式库中构式架构方面的术语。具体包括:语式成分、语式成分承继性、语式成分与构式成分的链接;结构草图、构式与框架链接、构式唤起成分;框架、语法框架、带框架构式、不带框架构式、框架唤起、框架唤起构式、非框架唤起构式;构式罩、构式库、框架网构式库等。

3)将构式与语料库结合起来,形成了构式库开发中对构式进行深度加工的术语。具体包括:标注、框架网标注、构式库标注等。

4)将单语构式库与多语构式库结合起来,形成构式库理论及跨语言构式库开发方面的术语。具体包括:构式词典学、语际构式词典学(对比构式语法和语际词典学的结合)、基于框架的计算词典学、对比构式语法等。如此丰富的术语系统,也是该书区别于其他单语构式库开发的主要特色之一。

第三,该书围绕构式库开发项目,以不同语言中具有代表性的构式为研究对象,以语料库为数据来源,采取语料库等方法,形成了构式词典学的方法论基础。具体表现在以下几个方面:

1)该书采取定量语料库方法,引入计算语言学方法和类型学方法,依据构式语法理论及其核心假设,通过频次、实例发现和识别构式,一方面对具体构式实例进行定性分析,确定构式标注的成分和要素,另一方面寻找构式标注的工具和方法,最大限度地穷尽对可能构式的挖掘和利用。

2)与单语中的构式对比不同,该书从多语或跨语言构式对比的角度出发,结合双语词典编辑的特点,形成了基于(近似)对等的构式对比方法。一方面,该方法接受了CxG研究基于默认的假设,即构式具有语言特殊性(language-specific)。即是说,在承认构式是规约化的形式——功能配对的同时,又强调数据——驱动方法在构式库开发中的作用。另一方面,该方法是对跨语言构式主义方法的实践,有效弥补了传统构式语法研究仅关注单语个案研究的不足,为今后开展大规模全套构式条目比较提供方法论启示。

第四,该书在对构式库及构式词典学进行介绍的基础上,重点展示了不同语言构式库开发的特色和方法,形成了可复制的实践构式库开发的案例。该书的案例研究不仅为读者呈现了丰富而直观的图表体验,而且提供了30余个可供链接的网址,包括框架网网址(p. 10)、瑞典语构式库网址(p. 41)、Swe FN++宏资源网址(p. 46)、Korp语料库基础设施网址(p. 48)、日语框架网项目网址(p. 141)、多词词汇单位语料库词典网址(p. 168)、俄语框架库网址(p.171)、德语构式库项目网址(p. 215)、英语构式库词条详解网址(p. 293)等。另外,该书研究并分析了约169个来自不同语种的构式。可以说,该书本身也可被视作跨语言构式的集合。

当然,该书也存在不足之处。首先,该书接受构式主义理论中有关词汇——语法连续统思想,认为cxn是一个连续体,词库是构式库的一个子类,即词汇cxn的组成部分。但正如该书所指出的那样,“出于实际原因,本卷中处理的所有ccn资源确实区分了词库和构式库”(p. 9),导致该书构式库开发实践中,更多地关注了语法构式,对如何处理词汇和语法构式的衔接,并没有给予可操作的指导。其次,该书明确提出了构式库具有理论和实践两个方面的内涵,但侧重构式库开发的实际案例,并没有形成完整的构式库开发理论。语际构式词典学、基于框架的计算词典学、对比构式语法等概念仅散见于某些章节中。也许这是该书的论文集性质所致。

总的来说,该书内容丰富,数据翔实,图表展示清晰易懂,可读性强。毫无疑问,该书是构式词典学研究的奠基之作。

猜你喜欢
构式语料库语义
语言与语义
《语料库翻译文体学》评介
“不可推导性”作为标准的虚妄:兼评“修辞构式观”
“社会”一词的语义流动与新陈代谢
“上”与“下”语义的不对称性及其认知阐释
从语法构式到修辞构式再到语法构式
“吃+NP”的语义生成机制研究
主观性在口语构式中的非常规表达——以口语构式“V+他2+NumP”为例
基于JAVAEE的维吾尔中介语语料库开发与实现
强化显义与突出内涵:当代流行构式“不是所有的X都叫(是)Y”研究