邢锟
自然语言意义(meaning)的形式化讨论始于弗雷格([5,23])。通过分析一些例子如“晨星和昏星(the morning star and the evening star)”,弗雷格区分了意谓(reference)和涵义(sense)两种不同的意义。([5,23])1英文sense由德文sinn所译,中文一般译为“涵义”;英文reference由德文Bedeuteng所译,而中文有“指称”,“所指”和“意谓”等多种翻译,本文参考王路老师的翻译([23,24])。简单地说,意谓是自然语言表达式(natural language expressions)所指的对象,包括具体的对象,抽象的实体或概念等等([24]);比如说,“晨星”指代某颗行星a,“苏格拉底”指代某个人c,“六”指代数字6,等等。特别的,弗雷格认为句子的意谓是抽象对象真(T)或假(F)。如果使用某个逻辑模型M作为自然语言的语义模型,并假设模型的论域为D,那么M=〈D,···〉,且a,c,6,T,F∈D。自然语言表达式也可以指代各种抽象概念,由论域D的子集、子集的集合、论域元素之间的关系等来刻画。比如说,“人”指代所有个体的人的集合,“朋友”指代所有具有朋友关系的个体的有序对的集合,等等。
依据替换法则(the principle of substitution),即意义相同的自然语言表达式可以在其它表达式中相互替换而不改变被替换表达式的意义,弗雷格论证了意谓不足以构成自然语言表达式的完备的意义([5,23])。众所周知,“晨星”和“昏星”指代同一颗行星a。如果意谓是唯一而完备的意义,则“晨星是晨星”和“晨星是昏星”这两句话的意义相同,即a=a的真值T。但是,常识或直观一般认为这两句话的意义是不同的。弗雷格认为,是这两个句子涵义的不同造成了这两句话意义的不同。([5,23])那么,什么是涵义呢?弗雷格讨论了不少篇幅,但遗憾的是,他没能给出涵义的精确定义。([5,23])
上个世纪五十年代到七十年代,随着可能世界语义学(Possible World Semantics)的发展,卡尔纳普(R.Carnap)、蒙塔古(R.Montague)、刘易斯(D.Lewis)等逻辑学家和哲学家定义了内涵(intension)作为自然语言更为完备的意义,产生了蒙塔古语义学(Montague Semantics)。([3,13,14,26])内涵刻画了不同语境下自然语言表达式意谓的变化。定义内涵需要先定义语境。语境的完整定义包含很多参数,通常考虑的有可能世界、时间、空间等。([6,18])假如C是所有可能的语境的集合,语义模型则变成了
其中,E是基于论域D的所有可能的意谓的集合,F是所有可能的内涵的集合:一个表达式的内涵是从语境集C到E的一个函数。特别的,一个句子的内涵是从C到{T,F}的函数。2等价的定义:一个句子的内涵是使得该句子为真的所有语境的集合,即C的一个子集。同时,形式语义学(Formal Semantics)认为自然语言的语义形成遵守组合原则(compositionality):一个复合表达式的意义是由其各个部分的意义复合而成的。([6,7,28,29])
如果把意义定义为内涵,则可以解释为何“晨星是晨星”和“晨星是昏星”具有不同的意义。想象在某个可能世界中,人们清晨和黄昏在特定方位分别看到的是两颗不同的星星。换句话说,在这个可能世界中,“晨星”和“昏星”具有不同的意谓。因此,只要语义模型的语境集C中包含这样的可能世界,则“晨星”和“昏星”具有不同的内涵,不能相互替换。于是,“晨星是晨星”和“晨星是昏星”具有了不同的意义。
目前,形式语义学的主流理论大都使用内涵作为自然语言意义的定义。([6,7])然而,定义内涵所需语境的精确而完备的刻画很难实现。([6,13,14])即使其实现了,内涵也并没有完全解决弗雷格留下的问题。前面提到,句子的内涵是从语境到真值(T/F)的函数。然而,许多句子的真假不随语境而变化。比如说:
1.3+5=8
2.3×5=15
可以合理地假设,在所有的语境下,专名3、5、8、15、+、×、=都指代相同的数学对象。于是,上面两个句子在所有的语境下都为真,即它们具有相同的内涵。然而,这两个句子说的显然是不同的事情,传递了不同的信息,具有不同的意义。因此,内涵并不能构成自然语言表达式的完备的意义。这个问题被称为超内涵问题(hyperintensional problem)。
为了解决超内涵问题或更一般的弗雷格问题(Frege’s Puzzle)([22]),人们发展了多种理论。这些理论大致可以归为三类。第一类理论引入不同的意义等价关系来限定替换法则的使用,包括各种内涵逻辑(intensional logics)、超内涵逻辑(hyperintensional logics)、苏支科(R.Suszko)的带等词的命题逻辑(sentential calculus with identity(SCI))及其后续发展等。([2,4,20,25])虽然这类理论可以解决超内涵问题或弗雷格问题,但它们大多将句子的意义作为模型的初始对象(primitives),而没有说明句子的意义具体是什么,以及它们如何由词的意义复合而成。从这个角度来讲,这类理论作为自然语言的语义理论是不完整的,因此本文暂不考虑。
第二类理论则对可能世界语义学作各种修改,比如说引入不可能世界(impossible world)([9]),或如情境语义学(Situation Semantics)一样考虑可能世界的组成部分等([1,12,27])。然而,这类理论或者自身存在一些难以克服的困难([4,19]),或者具有一个共同的特点,即仍然把句子的意义——命题定义为使得这个句子为真的各种可能的情境(circumstance)的集合。3情境可以是语境,也可以包含其它非语境要素。针对后面这个共同点,哲学家索姆斯(S.Soames)用一个简单的例子论证了这类理论所面临的困难。([16,17])
下面是索姆斯问题的一个中文变种。除了前面提到的替换法则,我们作如下假设或事实预设:
A1.在特定语境下句子的意义(即句子所表达的命题)是在该语境下使得这个句子为真的各种可能的情境的集合。
A2.在特定语境和赋值下专名、代词和变元的意义是在该语境和赋值下该专名、代词或变元直接指称(directly referential)的对象。
A3.命题态度(propositional attitude reports)表达的是主体与命题之间的某种关系。比如说,“X知道S”为真当且仅当主体X知道句子S所表达的命题。
A4.命题态度对合取分配。比如说,“X知道S1且S2”可以推出“X知道S1且X 知道S2”。
A5.除非有特殊说明,同一语境下同一个词的不同出现具有相同的意义。这个基本假设在本文中称为符号规则。
A6.在当前语境下,“鲁迅”和“周树人”的意谓相同,即它们指称相同的对象。但是,智力正常的李明并不知道这个事实。
由事实预设A6可知,下面的句子1为真,句子2为假。
1.李明知道:“鲁迅”指称(refer to)鲁迅,且“周树人”指称周树人。4索姆斯的原文是英文,使用的词是“refer to”,所以这里翻译为“指称”而非“意谓”,后面相同。
2.李明知道:存在一个个体x,“鲁迅”指称x且“周树人”指称x。
由假设A2和替换法则,从句子1为真可以推出句子3为真。
3.李明知道:“鲁迅”指称鲁迅,且“周树人”指称鲁迅。
由假设A5和假设A2可知,在任何情境下,句子4为真当且仅当句子5为真。然后由假设A1可知,句子4和5表达相同的命题,具有相同的意义。
4.“鲁迅”指称鲁迅,且“周树人”指称鲁迅。
5.“鲁迅”指称鲁迅,“周树人”指称鲁迅,且存在一个个体x,“鲁迅”指称x且“周树人”指称x。
由于句子4和5具有相同的意义,由假设A3和替换法则,从句子3为真可以推出句子6为真。
6.李明知道:“鲁迅”指称鲁迅,“周树人”指称鲁迅,且存在一个个体x,“鲁迅”指称x且“周树人”指称x。
依据假设A4,从句子6为真可以推出句子2为真。然而,前面已经论证说句子2为假,因此得出矛盾。
上面的例子说明,假设A1–A5和事实预设A6不相容。问题出在哪儿呢?事实预设A6显然是一种合理的假设;符号规则A5是人们使用语言都会遵守的基本规则;假设A4和A3是关于命题态度的基本常识;替换法则是对意义的基本要求之一。因此,问题应当出在假设A1或A2。A1和A2分别出现在上面论证的关键两步:从句子1推出句子3使用了假设A2,从句子3推出句子6使用了假设A1。这说明,关于句子或词的意义的基本假设A1和A2需要得到修改,或至少修改其中之一。5索姆斯认为只有假设A1有问题。但是,基于更一般的弗雷格问题的考虑(从句子1到句子3的推论可以说是弗雷格问题的一个例子)([22]),本文作者认为A1和A2都有问题。
解决超内涵问题或弗雷格问题的第三类理论采用的是结构化命题方法(structured propositions)([11])。其基本的想法是,自然语言表达式的意义是由这个表达式的各个组成部分的意义依据表达式的语法结构递归地复合而成。比如说,考虑句子“鲁迅是周树人”。这个句子的语法结构很简单:
右边是句子中出现的各个词的意谓。假设在当前语境下,“鲁迅”和“周树人”指称同一个人a;“是”指称相等关系“=”。于是,“是周树人”的意义可以形式地定义为(=,a),“鲁迅是周树人”的意义则可以定义为(a,(=,a)),或简单地写为a=a。
然而,这样的结构化命题并不能完全解决弗雷格问题。比如说,考虑下面两个句子:
1.鲁迅是周树人。
2.鲁迅是鲁迅。
即使采用结构化命题,由于“鲁迅”和“周树人”指称同一个人a,上面两个句子所表达的命题相同,都是a=a(或等价的形式(a,(=,a)))。但是,这两个句子显然传递了不同的信息,具有不同的意义。当然,上面这种结构化命题的构建方法只是一种最简单的方法,实际所采用的方法往往更为复杂([11])。比如说,可以考虑使用各个词的内涵而非在特定语境下的意谓来构造命题。然而,即使使用内涵,弗雷格问题也不能完全得到解决。考虑下面这个例子。
3.小明知道五等于五。
4.小明知道five equals five。
可以合理地假定,在所有语境下“五”和“five”都指称同一个自然数5,而“等于”和“equals”都指称相等关系“=”。6如果读者觉得这样的假定有问题,那么可以使用一些全新的符号并规定其在所有语境下的意谓相同。后面的论证同样有效。换句话说,“五”和“five”,“等于”和“equals”具有相同的内涵。另外,“五等于五”和“five equals five”显然具有完全相同的语法结构。组合原则告诉我们,如果两个自然语言表达式具有相同的语法结构,且组成这两个表达式的在语法结构中所对应的各个词或短语具有相同的意义,那么这两个表达式具有相同的意义。因此,不论采用什么样的结构化方法来构造命题,“五等于五”和“five equals five”都表达相同的命题。于是,句子3和句子4也表达相同的命题,具有相同的真值。然而,可以合理地假定小明只认识汉语,学过数学,但没有学过英语。这样,他就不知道“five equals five”,从而上面的句子3为真,句子4为假。这与先前的结论相矛盾。
要解决前面例子中的问题,句子“五等于五”和“five equals five”必须具有不同的意义,从而不能相互替换。然而,从前面的讨论可以看出,形式语义学所定义的意谓,内涵,或者以意谓和内涵为构成要素的结构化命题都不能实现这一点。因此,必须给自然语言表达式定义全新的且符合直观的意义。这如何可能?
考虑下面这个问题:“鲁迅是鲁迅”和“鲁迅是周树人”这两个句子的意义究竟有什么不同?语言最基本的功能是传递信息。因此,这个问题相当于,这两句话传递给听众的信息究竟有什么不同?不需要特别复杂的思考即可以明白:
•“鲁迅是鲁迅”这个句子所传递的完整的信息是:“鲁迅”这个词指称某个个体a,“鲁迅”这个词指称某个个体b,并且a=b。7严格来说,一个词的不同的出现可以有不同的意谓,除非有别的假设,比如前面提到的符号规则。为了强调同一个词的不同出现,鲁迅的第二次出现在这里被更换了字体。
•“鲁迅是周树人”这个句子所传递的完整的信息是:“鲁迅”这个词指称某个个体a,“周树人”这个词指称某个个体b,并且a=b。
人们使用自然语言时通常遵循前面提到的符号规则A5。因此,直观通常认为第一句话“鲁迅是鲁迅”是重言式,并没有传递更多的信息,而只是符号规则的一个特例。但是,第二句话“鲁迅是周树人”则传递了额外的信息,即“鲁迅”和“周树人”这两个不同的词指称相同的个体。假定后面的讨论都遵循符号规则。
上面的分析同样适用于其它的例子。比如说:
•“五等于五”这个句子所传递的信息是:“五”这个词的第一次出现指称自然数5,其第二次出现也指称自然数5,“等于”这个词指称等价关系=,并且5=5。
•“five equals five”这个句子所传递的信息是:“five”这个词的第一次出现指称自然数5,其第二次出现也指称自然数5,“equals”这个词指称等价关系=,并且5=5。
这样就能很清楚地看出这两句话所传递的信息的不同:它们真正的不同不在于最后所表达的命题5=5,而在于前面对于组成句子的各个词的解释。换句话说,这两句话所传递的信息的关键组成部分是,句中所出现的词被解释到模型中的某些对象而不是别的对象。因此,自然语言表达式的各个组成部分到它们所指称的对象的解释这样一种对应关系是使用自然语言所传达的重要信息。当对话双方都知道这些信息时往往忽略它们,但是在某些特定的情境中,尤其是考虑带有命题态度的句子的意义时,这类信息往往变得很重要,甚至成为唯一重要的信息。
然而,过去几乎所有的形式语义学理论在定义自然语言的意义时都把这些信息忽略掉了:不论是意谓、内涵,还是以意谓、内涵为基础的结构化命题,都没有把自然语言表达式的各个组成部分与它们被解释到的意谓或内涵之间的对应关系包含进来。完整的意义定义应当包含这些信息。本文把包含了这些信息的自然语言的意义称为解释义。下面给出解释义的一种形式定义。为了简化讨论,我们作如下假设。
假设1.每一个自然语言表达式都可以通过语法分析得到其唯一的二元语法分析树(binary grammar tree)。
由于绝大多数自然语言都遵守某种上下文无关文法(context-free grammar),而上下文无关文法都具有乔姆斯基正则形式(Chomsky Normal Form)([8,10]),所以在不考虑语法歧义的情况下,上面的假设成立。
定义1.语义模型M是如下的一个数学结构
其中,C是语境的集合,D是论域,E是所有可能的意谓的集合,F是所有可能的内涵的集合,即所有从C到E的函数的集合。
语境和意谓的完整的定义比较复杂,超出了本文的范围。读者可以把它们当作初始对象。一般而言,语境的组成要素至少包含了可能世界、时间、空间位置等参数;意谓集则包含了论域元素、论域的子集(一阶性质)、论域子集的集合(二阶性质)、一阶或高阶关系等。更多的讨论可以参考文献[6,7]。简单起见,本文也不考虑自然语言的多义现象,即如下假设成立:
假设2.给定一个语义模型后,自然语言的每一个初始表达式(primitiveexpression)都被映射到唯一的意谓或内涵。
一个表达式是初始表达式当且仅当该表达式的意谓或内涵是直接赋予的,而不是由它的各个组成部分的意谓或内涵复合而成的。单个的词一般都是初始表达式。由多个词组成的初始表达式包括各种俗语、成语、惯用语等。比如说,“喝西北风”并不是指呼吸西北刮来的风,而是指没东西吃;“穿小鞋”往往不是指穿了一双小码的鞋,而是指暗中给人刁难、约束或限制。下面就可以递归地定义自然语言表达式的解释义。同时,下面还定义一种不包含短语意谓对应关系的结构化的意义——结构义。
定义2.假定u是自然语言的一个表达式,T是u的二元语法分析树,语义模型是M。则
•假设u是一个初始表达式,并假设u被映射到某个意谓或内涵a,则a是u的一个结构义,(u:a)是u的一个解释义,读作u被解释为a。
•假设u是由两个表达式v1,v2复合而成,并且v1,v2的结构义分别是s1,s2,则u的结构义是(s1,s2).
•假设u是由两个表达式v1,v2复合而成,并且v1,v2的解释义分别是(v1:x1),(v2:x2),则u的解释义是
假设1.结构义中没有包含从自然语言表达式到它们的意谓或内涵的映射关系;解释义中包含了组成自然语言表达式的初始表达式到它们的意谓或内涵的映射关系;一个复合而成的表达式的解释义由它的各组成部分的解释义依语法树递归复合而成,因此包含了该表达式完整的语法结构信息。8不过,解释义没有告诉我们如何从子表达式的意谓或内涵得到它们所复合而成的表达式的意谓或内涵。这个问题可以参考形式语义学的基本教材[6,7]。
下面用一个例子来说明如何得到句子的解释义。假定“鲁迅”和“周树人”指称同一个对象a,“是”指称等价关系“=”。下面的语法树中字体较小的部分为相应表达式的解释义。
如果采用解释义作为自然语言的意义,那么即使“鲁迅”和“周树人”在所有语境或情境下指称同一个对象,“鲁迅是鲁迅”和“鲁迅是周树人”这两句话的解释义是不同的,即它们的意义是不同的,因此不能相互替换。所以,“小明知道鲁迅是鲁迅”并不等价于“小明知道鲁迅是周树人”。同样的道理,“五等于五”和“five equals five”具有不同的解释义,因此“小明知道五等于五”并不等价于“小明知道five equals five”。
解释义和结构义的最重要的应用是理解包含命题态度的句子。9命题态度往往制造内涵语境,而这正是解释义和结构义的主要应用之处。如果在外延语境中使用解释义或结构义,则会造成替换法则在大多数情况下都不成立,与直观相悖。因此,外延语境中通常仍然使用意谓、内涵或类似的意义。换句话说,意义有多种,在不同语境下使用不同种类的意义。包含命题态度的句子的讨论一直是自然语言语义理论中最为困难的部分之一,往往也是引起最多困惑、分歧和争议的部分之一。([15])之所以会引起困惑,是因为当听到一个包含有命题态度的句子时,如果没有具体的情境,人们难以完全确定这个句子究竟传递了哪些信息。比如A对B说
(i)李明知道肖凯昨天去过办公室。
假定这句话为真。那么,李明知道“肖凯”这个名字指称谁吗?通常的情境下,李明很可能知道这个名字指称哪个人。然而考虑下面这样一种合理的情境:A、B是两个间谍,跟踪代号为肖凯的某个人a,这个代号只有A、B两个人知道,李明并不知道,因为李明不是这个间谍机构内部的人,甚至恰好是需要保密的对象。在这样的情境下,李明显然不知道“肖凯”这个名字指称的是谁。因此,“李明知道肖凯昨天去过办公室”并不能推出李明知道“肖凯”这个词指称哪个对象。那么,句子(i)究竟告诉了我们什么,传递了哪些信息呢?它至少告诉我们李明这个人知道a这个人昨天去过办公室这个事实。
假定a是某个主体(比如说李明),u是某个句子(比如说“肖凯昨天去过办公室”),则“a知道u”是一个的含有命题态度的句子。上面这个例子说明了两个一般的结论。
•如果“a知道u”为真,那么a知道句子u所描述的事实。
•如果“a知道u”为真,那么a不一定知道句子u中某个词或短语的解释义(即从该词或短语到它的意谓或内涵的映射关系)。
比如说,在句子(i)成立的情况下,下面的句子(ii)和(iii)都可能成立。
(ii)李明知道肖凯指称a。
(iii)李明不知道肖凯指称a。
于是,句子(i)是有歧义的,它传递的信息需要由具体的情境来确定。有的情境下,它告诉我们李明知道a这个人昨天去过办公室这个事实,同时也告诉我们李明知道肖凯指称a。然而,在某些情境下,它却只告诉我们李明知道a这个人昨天去过办公室这个事实。上一节定义的解释义和结构义可以很好地区分这两种不同的意义,即能很好地刻画带命题态度的同一个句子所传递的不同的信息。10前面提到的“小明知道五等于五”和“小明知道five equals five”这两句话其实也是有歧义的。有时候人们会觉得这两句话说的是一回事(即意义相同),这时他们对这两句话的理解应当是:小明所知道的是“五等于五”和“five equals five”的结构义。然而,有时候人们又认为这两句话的意义是不同的,这时他们的理解是:小明所知道的是“五等于五”和“five equals five”的解释义。简单地说,
•如果句子(i)成立可以推出句子(ii)也成立,那么句子(i)所传递的信息是:李明知道a昨天去过办公室,并且知道肖凯这个词指称a,办公室这个词指称某个地点等。这时,李明所知道的是“肖凯昨天去过办公室”这个句子的解释义。
•如果句子(i)不能推出句子(ii),那么句子(i)所传递的信息只是李明知道a昨天去过办公室。这时,李明所知道的是“肖凯昨天去过办公室”这个句子的结构义。
除了“知道”以外,其它命题态度可以做类似的分析,这里不再赘述。最后,让我们回到索姆斯问题或弗雷格问题的关键一步:从句子1推出句子3。
1.李明知道:“鲁迅”指称鲁迅且“周树人”指称周树人。
3.李明知道:“鲁迅”指称鲁迅且“周树人”指称鲁迅。
为什么不能从句子1推出句子3呢?从1推出3需要用“鲁迅”这个词替代“周树人”这个词。这种替代只有在这两个词的意义完全相同的情况下才能进行。虽然假定了“鲁迅”和“周树人”的意谓相同,但在“知道”这个词制造的内涵语境下,往往需要使用词的解释义而非意谓。这两个词的解释义是不同的,所以它们在该语境下不能相互替代。替代以后就更改了这个句子的意义,从而更改了李明所知道的事实。
这种更改是如何进行的呢?如前面所分析,“a知道u”为真,a不一定知道句子u中某个词或短语的解释义(即从该词或短语到它的意谓或内涵的映射关系)。应用到这里,就是“李明知道:“鲁迅”指称鲁迅且“周树人”指称周树人。”这句话推不出李明知道鲁迅或周树人这个词究竟指称哪个对象。11同样为了醒目,这儿更换了字体。
那么李明究竟知道什么呢?换句话说,句子1究竟传递了什么信息呢?因为李明不一定知道鲁迅或周树人指称哪个对象,所以只能根据最弱的假设,认为句子1等价于说,存在个体y,鲁迅指称y,且存在个体z周树人指称z,李明知道“鲁迅”指称y且李明知道“周树人”指称z。
同样的分析可以应用于句子3,因而句子3等同于说,李明知道:存在一个个体x,“鲁迅”指称x且“周树人”指称x。可以很明显地看出句子1和句子3所传递的信息是不同的,从句子1推不出句子3。
本文讨论了使用内涵作为自然语言的意义所带来的问题,然后定义了两种新的意义——解释义和结构义,以解决这些问题。从信息传递的角度来说,解释义是最为完整的意义,结构义其次,再则是内涵和意谓。实际上,还可以定义许多介于解释义和结构义之间的意义,可称之为部分解释义,但这里不再赘述。解释义和结构义最重要的应用是解决语言哲学的一些悖论,理解包含命题态度的句子,因为这类句子往往具有歧义,会造成不少困惑。由于篇幅所限,本文所定义的解释义和结构义是大为简化了的。这种简化的处理其实会产生其它的问题,更为详尽完整的讨论可以参考作者未出版的手稿([21])或将来的博士论文。