分段式话语表现理论

2013-08-15 00:53:20高芸

重庆理工大学学报(社会科学) 2013年12期

高芸

(宜春学院外国语学院，江西宜春 336000)

在20世纪80年代，关于话语解释的研究有两种重要的观点:一是动态语义学把话语的内容看作是上下文的一种关系，如Kamp(1981)，Groenendijk和Stokhof(1991);二是基于人工智能的研究证明话语结构是话语解释的一个必要成分，如Hobbs(1985)，Mann 和 Thompson(1987)，Grosz和Sidner(1986)。虽然两种观点都对当前句子的解释如何依靠其先前句子的解释的模型提出了要求，但是它们的目的和技巧却各不相同。动态语义学关注各种前指的逻辑结构的作用，通常探讨语用现象的相对狭义的集合，其话语结构是由as if，not，every等语言表达式来决定。建构逻辑形式的过程相当简单，或者使用句法和小句的逻辑形式的形式，或者使用一致性和信息增加这样一些概念。而关于话语解释的许多人工智能的研究方法通常试图做出会话含义的模型，这些理论强调领域知识和认知状态等非语言信息的常识推理的作用［1］。分段式话语表现理论(Segmented Discourse Representation Theory，简称SDRT)把这两种研究方法结合起来，试图用一种体系的优势改善另一种体系的劣势。

一、动态语义学需要修辞结构

动态语义学理论话语表现理论(Discourse Representation Theory，简称DRT)刻画了名词短语和人称代词的照应关系，名词短语的量化意义以及英语句子系列在时间方面的复杂性和联系性，但相对于自然语言的语义呈现来说，还存在一些局限性，主要表现在以下几个方面［2］。

1.时间性前指

话语中的语句所描述的事件有相应的时间关系和由此而形成的时间结构，分别称为话语的时间关系和时间结构。这个关系或结构往往是复杂多样的，不能仅仅依据语句的时态来表达［2］。如:

(1)Max fell.John helped him up.(马克斯摔倒了，约翰扶他起来。)

(2)Max fell.John pushed him.(马克斯摔倒了，约翰推了他。)

话语(1)和(2)有着相同的时态形式和时体类别，要区别它们的解释，仅仅靠组合性的语义形式是不够的。我们要运用与句子的顺序、句法和组合性的语义不同的一些信息来计算话语的时间结构，这些不同的信息就是修辞关系。话语意义依赖于修辞结构，并与修辞结构相互影响。修辞结构是由修辞关系组成的，修辞关系，又称话语关系，描绘话语在上下文中所起的修辞作用［2］。修辞关系将话语的内容联系在一起。

话语(1)中的两个句子是按事件发生的先后顺序排列的，第一个句子描述的事件在时间上先于第二个句子所描述的事件，我们称这种修辞关系为叙述。这种关系会影响它所在结构的真值条件的内容:马克斯摔倒发生在约翰扶他起来之前。在(2)中，第二个句子对第一个句子起着解释的作用，这种修辞连接有着不同的时间效果:马克斯的摔倒发生在约翰推他之后。我们用一种不同的修辞关系——解释来表示这种修辞功能。用修辞关系来表示(1)和(2)的逻辑形式让我们发现两者不同的时间结构，而话语表现理论所能处理的语句序列是有限的，当语句序列中各语句所描述的事件不按先后顺序排列时，它就无能为力了。

2.代词前指

话语表现理论对代词前指有所涉及，但处理得仍不周全。如:

(3)a.马克斯昨晚过得很愉快。

b.他美餐了一顿。

c.他吃了三文鱼。

d.他还赢了一场跳舞比赛。

e.它是一种美丽的桃红色。

话语表现理论对前指的确认主要是建立在对句子的逻辑结构，特别是量化特征词的分析上。这个话语系列没有什么量化特征词，根据语义特征，话语表现理论会把(3e)中“它”的先行词确认为(3c)中的“三文鱼”。但事实上，(3e)在这个话语系列中会产生融贯方面的问题，认为“它”是先前话语中的某个个体更是难以接受，而修辞关系能够解决这个问题。根据右边界限制，话语代词的先行词必须由前一句话语或者在话语结构中统制该话语的话语引入。这就解释了为什么(3c)中的三文鱼是不可及的，因为它是在(3c)中引入的，而(3c)不是(3e)的右边界。

3.搭桥推理

搭桥是在话语中所引入的、没有明确陈述却又相互关联的两个物体或事件之间建立联系的一种推理［3］。搭桥常常反映了自然语言中整体与局部的关系。如:

(4)王珍有一栋新房子，前门是蓝色的。

显然，我们会将(4)中的前门理解为王珍新房子的前门，这便是王珍的新房子与王珍新房子的前门之间的整体与部分的联系在起作用。这种指涉DRT也不能处理。

4.动词短语的省略

动词短语的省略也是一种照应现象。如:(5)李平说王珍哭了，但是是刘强。

(6)李平说王珍哭了，刘强也是。

人们常常把(5)中“是刘强”解释为“是刘强哭了”，而(6)中的“刘强也是”解释为“刘强也说王珍哭了”，产生这一差异的原因是“但是”和“也”的不同的语义效果。“但是”反映的是对比的修辞关系，而“也”反映的是并列的修辞关系，这一差异在话语表现理论中是反映不出来的。

DRT能解决的前指现象其实很有限，主要是典型的代词、无定名词短语、有定名词短语等在有量化特征词的话语中的前指，但无法解释或者错误解释话语中出现的更复杂的前指现象。为了研究更广泛意义上的话语现象，Asher和Lascarides认为，在传统的分析句子逻辑式的基础上，还应该关注语句与语句之间的修辞关系。他们提出了一种超越DRT的新的语义理论——分段式话语表现理论，这标志着动态语义学进入了一个新的发展阶段［2］。SDRT包含了两种逻辑，一种是解释话语逻辑形式的逻辑，另一种是建构逻辑形式的逻辑，前者称为信息内容的逻辑，后者称为粘着逻辑(glue logic)。

二、信息内容的逻辑

对信息内容的逻辑指派动态的语义解释，运用语境变化潜在性，SDRT和动态语义学结合起来。通过对修辞关系指派精确的动态语义，SDRT拓展了先前的关于话语结构的工作。

(一)SDRS-公式

SDRT引入了两个新的表达式:言语行为话语所指和修辞关系。前者标记小句或语段的内容，后者使言语行为话语所指相互关联。所产生的结构就是分段式话语表现结构(Segmented Discourse Representation Structure，简称 SDRS)。

定义1 SDRS-公式

合式公式SDRS-公式是从以下的词汇中建构的:

①DRSs的词汇;

② 标记或者言语行为话语所指 π，π1，π2，…

③ 话语关系的关系符号集:R，R1，R2，…

合式SDRS-公式集Φ定义如下:

①DRSs的集合;

②如果R是一个二元修辞关系符号，π1和π2是标记，则 R(π1，π2)是 SDRS-公式;

③ 如果φ和φ'是SDRS-公式，那么 (φ∧φ')和﹁φ也是SDRS-公式，其中∧和﹁都动态地被解释。

(二)SDRS或话语结构

定义2 SDRS或话语结构

任何一个SDRS或一个话语结构都是一个三元组〈A，F，LAST〉，其中:

①A是言语行为话语所指的集合;

②LAST是A中的一个成员(直观上看，这是加在逻辑形式中的最后一个小句的内容的标记);

③F是函项，该函项对A中的每一成员指派一个SDRS-公式。

在不会混淆的情况下，三元组〈A，F，LAST〉也可写作〈A，F〉。

另外，以下的限制被强加在 A上:只有在F(π)包含 R(π'，π″)或 R(π″，π')的情况下，Succ(π，π')才有效(Succ又被称为直接主导(immediate dominance))。那么A上的一个偏序Succ是传递封闭的，并且有一个唯一的上确界π0∈A。

我们用例(2)来阐述SDRS的定义。(2')是(2)的SDRS:

(2')〈A，F，LAST 〉，其中:

A={π0，π1，π2}

F(π1)= 〈{x，eπ1}，{Max(x)，fall(eπ1，x)，eπ1〈 n}〉

F(π2)= 〈{y，eπ2}，{John(y)，push(eπ2，y，x)，eπ2〈 n}〉

F(π0)=解释(π1，π2)

LAST=π2

eπ1和 eπ2之间的时间关系没有明确地表达出来，但是从F(π0)的语义可知，约翰推马克斯这一事件发生在马克斯摔倒这一事件之前。

(三)可及性

定义3 可及性

令〈A，F，LAST 〉是一个 SDRS，Kβ(我们标记Kβ为β)是新信息。那么用某种修辞关系，β可以粘贴到:

①标记α=LAST;②任何标记γ使得

(a)Succ(γ，α);或者

(b)对于标记 λ，F(λ)=R(γ，α)，其中 R是从属话语关系，如详述、解释等。

我们把这个注释成α〈γ。

③ 传递封闭:通过标记 γ1，…，γn的序列统制α 的任何标记 γ，使得 α 〈 γ1，γ1〈 γ2，…，γn〈 γ。

令Kβ包括一个前指条件φ，那么可及的先行词是:

①在Kβ中和在φ可及的DRS中;或者

②在Kα中，在Kα中任何条件可及的DRS中，并且在SDRS中有条件R(α，γ)，使得γ=β或者outscopes(γ，β)(其中R不是结构话语关系)。

这个定义确保前指的先行词一定是话语结构右边界上可及的DRS，这就表明例(3)中(3e)是不可接受的。被三文鱼引入的话语所指是在Kπ3中，而π3不是(3e)的右边界，因此(3e)不可粘贴到Kπ3。因此，关于前指的限制，SDRT比DRT处理得更加精确。

(四)SDRSs的动态语义

通过对所有的SDRS-公式提供真定义，我们能够对公式F(π0)指派解释，其中标记π0辖域覆盖SDRS中其他所有的标记。通常F(π0)是形如R(πi，πj)的公式的结合。根据 Kπi和 Kπj(即 F(πi)和 F(πj))，我们也定义了 R(πi，πj)的解释。解释小句的内容，能够递归地揭示SDRS的语义。

我们对修辞关系指派语义，真实修辞关系满足以下图式:

(w，f)［R(π1，π2)］M(w'，g)当且仅当(w，f)［Kπ1∧Kπ2∧φR(π1，π2)］M(w'，g)

其中“∧”是动态合取式，φR(π1，π2)表达了与特定的修辞关系R(π1，π2)相关的语义限制，因此R(π1，π2)是真的当且仅当 Kπ1，Kπ2和 φR(π1，π2)是真的。

真实关系包括叙述、解释、详述、背景、平行和对比等，这个图式确保这些关系衍推它们所连接的两个命题。修辞关系如同复杂的更新算子，它们的解释反映了修辞关系对它们所连接的命题所产生的特殊的语义影响。

对于各种各样的关系R，解释SDRSs涉及定义 φR(π1，π2)的值。对于大多数关系来说，是根据Kπ1和Kπ2或者在它们中被引入的话语所指来定义φR(π1，π2)的。如 φ叙述(π1，π2)表示 Kπ1中主要事件 eπ1的终点在空间和时间上与Kπ2中主要事件eπ2的始点交迭。这就确保只要例(1)的逻辑形式包含了叙述(π1，π2)，这种逻辑形式的解释就衍推了事件的时间进展，即马克斯摔倒发生在约翰扶他起来之前。

φ解释(π1，π2)衍推 eπ2引起了 eπ1，例(2)的逻辑形式衍推约翰推的动作引起了马克斯摔倒的动作。我们来看看例(2)是如何被解释的。这个SDRS使输入变元指派函数f和g相联系，当且仅当f［Kπ0］Mg，其中 Kπ0是解释 (π1，π2)。因此，f［Kπ0］Mg当且仅当 f［解释(π1，π2)］Mg。根据解释的定义，f［解释(π1，π2)］Mg有效当且仅当:

①有一个 h，使得 f［Kπ1］Mh，并且

② 有一个 i，使得 h［Kπ2］Mi，并且

③ i［引起(eπ2，eπ1)］Mg。

式①有效当且仅当对于x和eπ1来说，h被定义，并且〈h(eπ1)，h(x)〉 ∈IM(fall)等。式②有效当且仅当 i扩展 h，使得〈 i(eπ2)，i(y)，i(x)〉∈IM(push)等。式③有效当且仅当i=g并且〈i(eπ2)，i(eπ1)〉 ∈IM(原因)。也就是说，马克斯摔倒，约翰推马克斯，“约翰推马克斯”引起“马克斯摔倒”。

三、建构逻辑形式

为了从概念上清楚地描述如何推断话语结构和建构逻辑形式，SDRT区分了话语结构本身和描述话语结构的语言。当试图重建话语预期的逻辑形式时，我们一定会遇到许多歧义，比如由于语义辖域歧义，语法和词汇语义通常不足以确定预期的逻辑形式、代词和预设等各种前指和词汇歧义等。SDRT包含了一种描述语言Lulf(ulf表示未具体化的逻辑形式)，这种语言允许我们对这种未确定性进行分析和推理。SDRT的粘着逻辑定义了解决语义未具体化陈述的语用上更可取的方法。

(一)语义未具体化陈述的语言Lulf

语义未具体化陈述的语言部分地描述了SDRSs的形式，它允许我们表达语法是如何产生内容的部分信息。我们以小句为例。

(7)Many problems preoccupy every politician.(许多问题使每一个政治家着迷。)

句(7)的两种可能的逻辑形式是:

(7')a.many(x，problem(x)，∀(y，politician(y)，preoccupy(x，y)))

b.∀(y，politician(y)，many(x，problem(x)，preoccupy(x，y)))

令l1标记广义量词 many problemsx，l2标记every politiciany，l3标记 preoccupy(x，y)，并且在这些标记中给出辖域覆盖的限制:outscopes(l1，l3)和outscopes(l2，l3)。outscopes(li，lj)指的是 li标记内容的语义辖域覆盖了lj标记内容的语义辖域。其结果就是基础语言中逻辑形式的部分描述。说它是部分的，是因为它没有确定outscopes(l1，l2)是真的，也没有确定outscopes(l2，l1)是真的。量词的辖域不是由语法确定的，辖域覆盖的顺序可能是l1-l2-l3或者可能是l2-l1-l3。

然而，标记逻辑形式和提供标记的部分辖域覆盖顺序并不足以表示未具体化表征的特性。我们不知道many problems和every politician的相关辖域，也不知道这些广义量词核心辖域的值。换言之，基本逻辑形式包括many(x，problem(x)，px)和∀(y，politician(y)，py)，但是语法没有完全确定px和py的值。既然两个辖域歧义和未消解的前指涉及到自变量的值是未知的条件，那么在逻辑形式的部分描述中我们需要一种表征这样的空位(holes)的方法。

假如自变量有一个未知的值，那么我们用一个标记标示空位所在的位置。标记标示一个空位，是因为语法不能认定它与任何标示逻辑形式的标记一致。实际上，这样的自变量标记是标记上的变元。未具体化的逻辑形式和它的解释把限制放在这些标记变元可能是什么值上。例如，句(7)的未具体化的逻辑形式包括l1:many(x，problem(x)，l4)，其中l4是变元;l4不等同于实际上标记着内容的任何其他的未具体化逻辑形式标记，这表明量词的核心辖域的内容目前是未知的。为了使逻辑形式的部分描述转变为一个完全的描述，被语法产生的辖域覆盖关系足以确定标记变元能被哪些标记常元所代替。句(7)的未具体化逻辑形式是(7″):

(7″)∃l4∃l5(l1:many(x，problem(x)，l4)∧

l2:∀(y，politician(y)，l5)∧

l3:preoccupy(x，y)∧

outscopes(l1，l3)∧outscopes(l2，l3))

用真值代替标记变元的限制确保(7″)中辖域限制恰恰通过两个解决方案得到满足:1)l4=l3且l5=l1;或2)l4=l2且 l5=l3。(7″)能看作是(7)的逻辑形式的部分描述，说它是部分的，是因为它在基础的、未加标记的语言中没有区别两种可能的逻辑形式。

(二)粘着逻辑

为了把小句的逻辑形式粘贴在一起形成话语逻辑形式，我们用粘着语言进行推理，因此这种逻辑被称为粘着逻辑。粘着语言的词汇包括来自SDRSs的标记、修辞关系符号和表达逻辑形式部分描述的方法。粘着语言扩展了未具体化逻辑形式的基本词汇:它增加了一个模态连接词〉，A〉B表示“如果A，那么通常B”。这就表达了关于未具体化条件的语用上更可取的值的信息。

粘着逻辑定义了非单调的推断关系|～g，连同最大化话语融贯性原则，粘着逻辑定义了未具体化逻辑形式的语用上更可取的解释。最大化话语融贯性原则指的是话语的逻辑形式总是偏序中值最大的那个逻辑形式［4］。话语中修辞关系越多，更可取的修辞关系越多，未具体化陈述的条件越少，结构越简单，话语解释就越融贯。一般来说，语用上更可取的解释是可能解释的一个子集。

许多粘着逻辑公理是形如(8)的图式，其中α，β 和 λ 是 SDRS-标记 π1、π2等的元变元:

(8)(?(α，β，λ)∧Info(α，β，λ))〉R(α，β，λ)

式(8)表达的是:用一种修辞关系把β和α联系起来，其结果标记为λ，并且关于α，β和λ的信息有效，那么这种修辞关系通常是R。

我们来看看叙述公理。

(9)(?(α，β，λ)∧occasion(α，β))〉Narration(α，β，λ)

式(9)表示如果β和α联系起来，并且α引起β，那么修辞关系通常是叙述。那么我们如何推论occasion(α，β)?如果两个事件类型(φ和ψ)相互关联，那么诱因(occasion)通常能够被推论:

(?(α，β，λ)∧φ(α)∧ψ(β))〉occasion(α，β)

比如，我们假设“x摔跤”和“y扶x起来”是相互联系的，那么前者是后者的诱因。

(三)话语更新

话语更新是一系列简单的、单调递减的更新运算+，+是在粘着逻辑推断关系|～g方面被定义的。简单更新运算研究话语结构集σ(σ表示旧信息)和一些新信息。描述话语结构集的未具体化逻辑形式在Lulf中是σ理论，写作Th(σ)。新信息或者是一个未具体化的逻辑形式Kβ，或者是关于粘贴的假设?(α，β，λ)，其中 Th(σ)╞lKβ，l是Lulf的简写，即Kβ是逻辑形式描述的部分。

定义4 简单更新+

令σ是一个完全明确的话语结构集，ψ或者是未具体化的逻辑形式Kβ，或者是关于粘贴的公式?(α，β，λ)，其中 Th(σ)╞lKβ，那么 σ +ψ 是被定义为如下的话语结构集:

①假如结果不是空集，那么σ+ψ={τ:如果Th(σ)，ψ|～gφ，那么 τ╞lφ};

② 否则σ+ψ=σ。

实际上，话语结构是未具体化逻辑形式逻辑的模型。τ╞lφ表示φ部分地描述τ。因此简单更新定义了满足话语逻辑形式部分描述的话语结构集，部分描述是|～g-推断的联言支。简单更新定义了以限制为主建构逻辑形式的一种方法:它运用旧信息和新信息逐渐增加话语结构形式的限制，这种形式最终表示已更新话语的解释。

假设对于新信息β，A是旧信息σ中可及粘贴点的集合，那么幂集P(A)表示β粘贴到σ中的标记αi所有可能的选择。话语更新对P(A)的哪一个成员是正确的选择保持中立，因为话语更新是对于P(A)的每一个成员的一系列简单更新而产生的话语结构的合并。话语更新是根据简单更新而被定义的，所以话语更新也是一个单调递减函数，解释话语相当于信息单调地逐渐增加。

在话语处理过程中，如果想解释话语，我们需要建立满足描述的所有的语用上更可取的话语结构。粘着逻辑使用语用信息来计算修辞关系，因此确保简单更新消除了一些语用上不允许的逻辑形式。根据最大化话语融贯性原则以及我们更喜欢最少标记的话语结构，我们在更新中排列模型的顺序。更新中排列在最前的模型是:最少的标记，最多的修辞联系，最少的未解决的语义歧义(包括前指条件)以及没有不一致性。

四、结束语

SDRT不同于其他的动态语义理论。SDRT包括了修辞关系，使逻辑形式更加丰富。SDRT对修辞关系指派语义，使修辞关系成为复杂的更新算子。实际上，所有的逻辑形式都是组合地、动态地被解释。

SDRT使用语义未具体化陈述的语言Lulf来描述话语的逻辑形式，Lulf尽管知道话语结构的形式，却不知道它的动态解释。我们可以用这种语言表达关于语义未具体化陈述的信息，Lulf的推论关系抓住了未具体化逻辑形式和所有可能的解释之间的关系。通过粘着逻辑和最大化话语融贯性原则，话语更新定义了未具体化逻辑形式和语用上更可取的解释之间的关系。

目前SDRT在国际逻辑学界、语言学界和人工智能界得到了充分的肯定并产生了深远的影响，已成为关于研究处理自然语言的新方向和前沿领域。笔者希望起着抛砖引玉的作用，汉语中的许多语义问题能在这种理论的指导下得到更妥善的解决。

［1］Alex Lascarides，Nicholas Asher.Segmented Discourse Representation Theory:Dynamic Semantics with Discourse Structure［EB/OL］.［2012-08-16］.available from http://homepages.inf.ed.ac.uk/alex/papers/iwcs4.pdf，2009.

［2］高芸.从SDRT的视角探析汉语话语结构的修辞格式［D］.重庆:西南大学，2011.

［3］Nicholas Asher，Alex Lascarides.Logics of Conversation［M］.Cambridge:Cambridge University Press，2003.

［4］夏年喜.从DRT到SDRT——动态语义理论的新发展［J］.哲学动态，2006(6):52-56.

(责任编辑张佑法)