赫德森的词语法理论

2018-06-26 07:24冯志伟周建
现代语文 2018年3期

冯志伟 周建

摘 要:本文介绍语言学家理查德·赫德森提出的词语法,着重分析了“语言网络”(language network)和“缺省传承”(default inheritance)的概念,说明了词语法与依存语法的关系。

关键词:词语法 语言网络 缺省传承 依存语法

理查德·赫德森(Richard Anthony Hudson,1939-)是英国著名语言学家,他曾在拉夫堡文法学校(Loughborough Grammar School)、剑桥大学圣体学院学习。1964年,在伦敦亚非学院获得博士学位,博士论文研究的是碧雅语(Beja)的语法体系。1964-2004的四十年间,赫德森一直在伦敦大学学院(University College London,简称UCL)任教。曾经担任英国语言学会主席(1997-2000)。目前为伦敦大学学院荣休教授、英国社会科学院(The British Academy)院士。

赫德森

赫德森的主要著作有:

《英语复杂句》(English Complex Sentences,1971),《非转换语法研究》(Arguments for a Non-Transformational Grammar,1976),《社会语言学》(Sociolinguistics, 1980初版,1996二版),《词语法》(Word Grammar,1984),《英语词语法》(English Word Gramm ar,1990),《英语语法》(English Grammar,1998),《语言网络》(Language Networks,2007)等。

赫德森最重要的学术贡献是创立了“词语法”(Word Grammar)理论①。

词语法是一种关于语言结构的一般理论②。尽管目前有关词语法的研究大多与句法有关,但也与语义、形态、社会语言学、历史语言学和语言处理等方面的研究有关。

词语法也是认知语言学的一个分支。

词语法的名称就说明了“词”在这种理论中的中心地位。

词语法认为,词是唯一的句法单位,句子结构是由词间依存关系构成的一个整体。因此,词语法也是一种依存语法理论。

词语法最重要的特点是“语言网络”(language network)的概念和“缺省传承”(default inheritance)的概念。

在本文中,我们重点介绍一下这两个概念。

詞语法认为,语言网络如同其它知识网络一样,也是一种“传承网络”(inheritance network)。这意味着,语言网络具有如下特征:

“is-a”可以表示分类关系,这样的分类关系“is-a”可以通过缺省传承进行概念的泛化,因此这种关系在语言网络中具有特殊的地位。

语言网络中的每一个结点是至少一个由“is-a”关系连接在一起的“传承层级”的一部分。因此,在语言网络中的所有结点都是被分了类的。例如:TAKE is-a Verb is-a Word(“TAKE”是一个“Verb”,而“Verb”是一个“Word”)意味着“TAKE”属于“Verb”这个类,而“Verb”属于“Word”这个类。

每一个连接至少是“传承层级”的一部分。例如,Object is-a Complement is-a Dependent(Object是一种Complement,而Complement是一种Dependent)是一个连接,这个连接属于“传承”的一个“层级”,在这种情况下,不仅将语言网络中的结点进行了分类,语言网络中的连接也进行了分类。

考虑到“is-a”关系的特殊地位,词语法使用一个特殊的符号来表示它:这个特殊的符号是一个小三角形,其底边靠近上一级范畴。

图1是上面所举例子的词语法简图。左边表示语言网络中结点之间的传承层级,右边表示语言网络中连接的传承层级。

在词语法的结构图里,结点的功能是非常单一的,它只表示在两个或多个连接之间存在一种关联关系。也就是说,结点是没有内容的,是没有什么内部结构的。

但是,每一个通向另一结点的连接都定义了某种“属性”。例如,一条从“TAKE”出来的“object”连接表示“TAKE”需要一个“宾语”的属性,一条从“Verb”出来的“complement”连接表示“Verb”需要一个“补足语”的连接,一条从“Word”出来的“dependent”连接表示“Word”需要一个“从属成分”的连接。

事实上,每一条连接给它所连接的每一个结点定义了一种属性,对于结点而言,连接如同一种数学函数,函数的值是随变元而变的,连接的值是随着结点而变的。

例如,object(宾语)函数的值是随动词和词例而变的,因此在表示所有动词的宾语一般化层级,这个值必须是一个变量。词语法中用点“··”或“?”来表示变量。图2是把图1中的依存关系和结点(词型)连在一起所形成的一个简单网络。

从图2我们可以看出,“词”(Word)一般是没有“补足语”(complement)的,因此它的数量(用“#”表示)为0。对“补足语”(complement)的这种约束也可以说明补足语是由“词”(Word)来选择的。例如,“TAKE”必须有一个“object”,而且,这个“object”应该是“Noun”。“宾语”(object)的这种属性通过传承决定了“TAKE”宾语的词性。

传承网络的主要特点就是可通过缺省传承进行概念的泛化推理。

这种方法在日常推理中常常用到,为了猜测我们无法观察到的信息,人们一般都会采用将特殊情况泛化的操作。例如,当我们认为某个东西是一只“狗”的时候,我们假设这只“狗”如同一只真正的“狗”一样,它有四条腿。换言之,这只狗通过缺省传承这种方式,传承了我们大脑中关于“狗”的这一典型属性。但是,如果我们已经看到了这只狗只有三条腿,那么,这个信息会取代通过缺省传承得来的信息,从而使我们可以继续将其看作为一只狗,尽管它只有三条腿。

总的说来,传承层级越低,优先级越高。图3更清楚地说明了缺省传承的机理。

从图3可以看出,如果A'不为C,则A'通过传承得到B',反之,A'为C。

图3的(3)、(4)部分列举了一个关于蘑菇颜色的例子。

按照我们的一般知识,植物(plant)都有颜色(colour),而且是绿色的(green)。蘑菇(mushroom)是一种植物(plant),所以它也应该有颜色(colour)。按照缺省推理,蘑菇(mushroom)的颜色(colour)应该是绿的,但由于我们看到的事实是:蘑菇的颜色(colour)是灰色的(grey),因此这个信息会代替“蘑菇是绿色(green)”的信息。

词语法通过对实体(entities)和关系(relation)的分类来区分语言的层级,旨在避免传统语言学中各个层级之间的边界不清问题。

词语法中采用的结点类型有:词(words)、形(forms)、音(sound)、字母(letters)以及其它可表词义的实体(entity)和关系(relation)。主要的关系有:意义(meaning)和实现(realization)。这样,词语法所表示的语言结构如图4所示。

图4中,右边用虚线隔开的语言学层级(从上至下)是:语义学(semantics)、句法学(syntax)、形态学(morphology)、音系学(phonology)和文字學(graphology)。

值得注意的是,在图4没有一个独立的词表。这意味着,词语法和其它认知语言学理论一样,词汇信息和其它事实之间的差别只是一种程度上的差别。

我们来看一个用词语法处理动词“put”的例子④:

PUT

PUT isa verb.

stem of PUT =.

whole of ed-form of PUT = stem of it.

NOT:whole of ed-form of PUT = + mEd.

sense of PUT = put.

PUT has[1-1]object.

PUT has[1-1]adjunct-complement.

NOT:PUT has[0-0]complement.

type of sense of adjunct-complement of PUT = place.

referent of adjunct-complement of PUT = position of sense of it.

referent of object of PUT = put-ee of sense of it.

由此可见,词语法力图采用简单的英语来描述词的句法和语义规则。

在句法层面,词语法的最大特点是放弃了短语的概念,只采用了依存结构。词语法这样做不仅考虑了依存关系和语言网络之间的亲和性,也考虑了依存关系是一种更具心理现实性的结构。

在句法研究中,在舍弃短语结构后,词语法衡量句子是否合乎语法的方式也有所变化。词语法采用依存关系(弧)不可相交的方法来表示一个句子合乎语法的程度。

由于图6中出现依存弧交叉的情况,因此,我们说的“I complicated like sentences”不是一个合乎语法的英语句子。

值得指出的是,用这种方式判断句子的语法性不具有普适性。因为,在有些语言中允许出现交叉弧(例如,荷兰语)。这时,就需要考虑采用一种新的方法来衡量句子是否合乎语法。一般而言,在这些允许交叉弧的语言中,人们也不能用短语结构语法来判定句子的语法性。

另外一个问题是并列结构的句法处理,这对所有基于依存关系的句法理论都是一个问题。

尽管并列结构的处理,特别是复杂并列结构的处理对所有的句法理论来说都不是一件容易的事情,但由于依存关系是非对称的,这种非对称性使并列结构的处理在依存句法中遇到比短语结构语法更大的困难。

目前,各种主要的依存句法理论都有相对的并列结构处理方式,这些方式可以归为三大类:并列连词作为并列结构的中心词,并列结构中的第一个词作为整个结构的中心词,并列结构中所有的词具有平等的地位。

词语法是第三种方法的代表性理论。图7所示为词语法处理一个英语并列结构的依存图。

图7中的并列结构看似简单,实际上是比较复杂的。因为图7中构成并列结构的成分并不是受同一个词支配的。如,London和Manchester的支配词是介词in,而today和tomorrow的支配词则是is。

从图7还可看出,并列连词and在词语法中是没有位置的。对并列连词and的这种处理方式略微修改,就可以满足所有的词语应在依存结构中出现的原则,这个原则是依存句法的一般原则。

词语法是一种非模块化的语言学理论。也就是说,词语法中,在句法、语义等语言层面之间是没有明确边界的。

图8为英语句子“The dog hid a bone for a week”(狗把骨头藏了一个星期)的句法和语义结构。

与句法结构相比,语义结构更为复杂,因为一个词的意义不仅需要通过其它概念来限定,而且语义分析还牵涉到使用者的认知结构。在图8中,紧挨着词上面的实线弧所构成的依存图表示句子的句法结构,从每个词引出来的虚线把词与其语义结构连在一起。

尽管图8所表示的语义结构经过了简化,但仍保留了词语法中语义描述的主要成分。图中的“1”用来表示单个词次,字母下标只是为了便于区分所指的成分。虚线有两种,直的虚线表示单词的意义,曲的虚线表示单词的所指。

这种方法最重要的特点是,同一方法可用于所有词类的分析,包括动词。如,“1b”表示只有一只“狗”(dog),“1e”表示只“藏”(hiding)了一次。有定性(definiteness)是用长等号“==”表示的,它是定冠词the的主要语义构成,用于表明the和其后面的名词dog共享网络中的相关结点。为了说明时间状语for a week的功能,把“藏”(hiding)这个单词分解为“活动”(er是活动者的后缀)和“结果”(result)两种意义是很有必要的。因为,hiding本身作为一种活动是不能持续一星期的,这一星期的“持续时间”(duration)针对的是“藏”(hiding)的“结果”。“藏”的结果是使得“骨头”(bone)成为“不可见”(invisible)的。

总的说来,词语法是一种以词为中心的语法理论,同时含有依存语法、认知语言学和构式语法(construction grammar)的思想。

在词语法里,语法就是由一种语言中所有的词构成的网络。词语法认为语法没有天然的边界,也就是说,不存在语法甚至语言模块。

语法网络只是有关词汇知识的整个网络的一部分,它和这个网络中的有关百科知识、社会结构、语音等子网络密切相关。

“语法”和“词汇”在描写上没有什么本质的区别,只不过前者处理的是一般性的模式,后者描述的是有关单个词素的事实。从形式上看,一般模式虽然涉及的是有关词类方面的事情,但表现方式与描写词素的方法并没有什么不同。

词语法是被引用最多的依存语法理论之一,词语法中使用的“依存有向图”成为了很多计算语言学家表示依存关系的一种常规手段。

虽然词间依存是构成词语法的基础,但不能把词语法理论简单地看成是一种句法理论,它是一种几乎涵盖了共时语言学各个分支的语言学理论。词语法将这些研究领域统一在一面旗帜之下,这一面旗帜上写着:“语言是一个概念网络”。

尽管语言网络的概念有助于提升语言学研究的普遍价值,有利于改善语言学理论的心理现实性,但语言网络的概念也向许多传统的语言学方法提出了挑战。例如,我们是如何通过这种语言网络进行语言理解和生成的?怎样用计算机来模拟这种语言认知过程?等等。这些都涉及到语言网络的可操作性问题,有待进一步研究。

不过,词语法的创立者赫德森坚信,我们可以构造一种计算机模型来模拟人脑处理语言的过程,他自己要做的工作就是尽可能做出这样一种模型来。目前在人工智能领域提出的“词矢量”(word vector)和“词嵌入”(word embedding)等方法,用单詞在上下文中的分布来表示单词的特性,把单词与上下文紧密地结合起来,其思路与词语法相差无几。

注释:

①Richard Hudson,Word Grammar.Keith Brown

(ed.)Encyclopedia of Language and Linguistics,Second Edition.Elsevier.pp.633-642,2006.

②Richard Hudson,Word Grammar.Kensei Sugayama

(ed).Studies in Word Grammar(Kobe: Research Institute of Foreign Studies,Kobe City University of Foreign Studies)pp.7-32,2002.

③Hudson,R.Language Networks[M].USA:Oxford

University Press,2007.

④Hudson,R.A.English Word Grammar,pp264,

1991.

⑤Richard Hudson.Word Grammar[A].Bernd Heine

and Heiko Narrog.Oxford Handbook of Linguistic Analysis[C].Oxford University Press,2009.

参考文献:

[1]Richard Hudson,Word Grammar[A].Keith Brown.

Encyclopedia of Language and Linguistics(Second Edition)[C].Netherlands:Elsevier,2006.

[2]Richard Hudson,Word Grammar.Kensei

Sugayama(ed).Studies in Word Grammar(Kobe:Research Institute of Foreign Studies,Kobe City University of Foreign Studies)pp.7-32,2002.