杨英锐
语言能力,是心理生命最基础的功能,没有之一。我曾选过一门古希腊哲学,讲到希腊诸神是怎么被一个一个创造出来的。其中阿波罗与荷米斯都兼管着一点儿有关语言的事务,但不是其主业。我以为哲学先贤漏造了一个专神,主司语言,这可能是因为造神本源于对未知的敬畏。然而语言之神与我们时时相伴,平易近人,倒使人们淡却了敬畏之心。其实,语言与语言行为是人间,也是万物之间最为神秘的存在,我们对其自以为熟识,实则陌生,其奥秘是最难的谜题,那岂是数学千禧谜题所能攀比,又岂是物理学中爱因斯坦统一场论迷径所能项背。
常言道,听话听音,文如其人。语言最深刻地影响着人们的心理,成为心理生命赖以生存的根基,不任须暇。天下多少事,都因语言而起。从家庭琐事到国际关系,语言可以化干戈为玉帛,也可以生出各种误解,激化矛盾,乃至唇枪舌剑。人类心智,由语言而理性;人类心态,由语言而情绪;人类知识,由语言而积累;人类认知,由语言而传承;人类思维,由语言而内容;人类信息,由语言而累积;人类交流,由语言而神往;人类交际,由语言而施行。人类个体,我语故而我在;人类社会,无言何以共享?如此种种,层层纱幔,背后面目,雾中庐山。一方面,语言无处不在;另一方面,语言行为多样纷呈。
概言之,语言是力,波动着心理漪涟,是一种心理生命力。语言亦是力的载体,激发成粒,粒粒偶合互动,断续着心理生命周期。语言还是一种场,场与场相互作用,揭示着心理实在的本体论承诺。语言又是一种算子,作用于心理意向,呈现出心智认知的内容。语言仍是一种能量,支撑着心理活动,反映出心理生活的质量。最后,语言却是一种元逻辑,可以生成自指语句,引领心理生命去反思与自省。
本文对于语言的讨论,伴随有三条脉络,贯穿其中:第一条脉络是布尔巴基结构主义在语言及语言行为分析中的具体体现与新生影响;第二条脉络是理论物理在语言及语言行为模型化中的刻画能力与奇妙作用;第三条脉络是维特根斯坦语言哲学的历史迁移与新意诠释。这三条脉络互为经纬,通幽跌宕,使我们得窥语言世界一些未曾披露的秘密。有趣的是,维特根斯坦的语言哲学发展轨迹,竟然可以被嵌入规范场论的框架结构。规范场论明确地区分了全局和局域两个层次。前期维特根斯坦语言哲学关注的是语言的全局结构,而其后期转而关注的是语言行为的局域分析。这般奇遇,增加了我们理解心理生命语言期的工具。
全文分为三个部分。第一部分题为“前期维氏语言哲学:均衡与全局”。讨论语言,特别是科学语言的规定性、稳定性与确定性。在前期维特根斯坦语言哲学框架下,这些性质是其青年时期的追求与问询。在牛顿力学框架下,这些性质与均衡概念息息相通,并可为其所刻画。在规范场论框架下,这些性质与全局层面脉脉相联,并在其上模型化。我们将讨论一种最基础性的特殊语言结构,即由句法与语义构成的“双腿结构“。这种双腿结构可以作为一种语言特征化工具,跨越逻辑语言、决策论语言、博弈论语言、量子力学语言、规范场论语言和内禀动力学几何化语言。
第二部分题为“维特根斯坦与哥德尔:论争与转折”。语言的双腿结构不是只用来摆姿势照相的,而是成就了语言的运动功能。那么,这双腿结构是否健全,双腿一样长,还是一腿长,一腿短呢?这在逻辑学里,称为元性质,也就是系统的整体性质。对于系统元性质的研究,称为元逻辑或元数学。著名的哥德尔不完全性定理与塔斯基不可定义性定理,亦称双子定理,用布尔巴基结构主义的话说,达到了构造双腿结构的极致,推出了非对称双腿结构,揭示出语言结构的维纳斯美。用理论物理的话说,双子定理表现了语言系统在全局层面的自发对称破缺机制。这是一种语言结构的元性质。后期维特根斯坦与哥德尔的论争,预示了维氏语言哲学向语言系统的局域化转向,表现了对个体语言行为的关注,揭开了行为主义语言学的新篇章。作为对句法学和语义学双腿结构的心智认知协调,维氏语言哲学的这个转向,也为语用学和心理语言学铺垫了道路。
第三部分题为“超越维特根斯坦:结构与模型”。语言游戏是维特根斯坦语言哲学的代表性概念,意指语言交流可被视为语言游戏,维氏甚至认为,语言游戏本身就是语言,因为语言体现的是生活形式。语言游戏和生活形式是通过心理游戏相互转换的。但是,中期维特根斯坦发现,难以找到一组规则来完全定义语言游戏,以致他成为20世纪怀疑论哲学的领袖。后期维特根斯坦,转而认为语言游戏应该是有规则可循的,并为之苦苦求索。笔者以为,维氏未竟全功,本文意在有所助益。
对于语言游戏的深层结构,与语用学关系密切,其模型化超出本文范围。本文只为其表层结构提供若干模型化路径。在知识论意义下,维特根斯坦与柏拉图传统有模式的不同。语言游戏,因人而异,因情而易,因景而移,结构上局域特征明显。惟其如此,必有因果可言,并有限定范围,这可由狭义相对论所模型化。语言行为对顺序敏感,哪句话先说,哪句话后说,效果不同。即便是字面含义,屡战屡败,屡败屡战,其意不同,曾文正也强调修辞顺序。这就是说,对语言行为的观测效果不满足对易关系,而满足非对易关系,这是量子化条件,为量子力学所模型化。其实,语言游戏本身就是一种波函数,为量子场论所刻画。语言行为是社会化的。在语言行为社会中,个体语言能力有强弱可言,语言优势属于稀缺资源。这就是说,语言社会是不平等的竞争性社会。于此,标准教育考试是一个典型例子。这种分析可由广义相对论模型化。本文最后提供一个一般讨论。
人类社会离不开语言的服务。为了支持语言服务,科学家,包括语言学家、心理学家、哲学家、认知科学家等,长期以来做了艰苦的语言维护工作。早期的维特根斯坦师从逻辑学家罗素,做的就是一种语言维护工作,叫做语言哲学。从句法语法和语义学的区别抽象出语言双腿结构的概念,可以帮助我们理解为什么语言具有稳定性和确定性。语言双腿结构的平衡性,相当于牛顿力学中的均衡性概念。可以说,语言的稳定性和确定性要求,正与牛顿科学传统遥相呼应,一脉相承。我们这里所说牛顿科学传统的特征,是泛指现象的可直接观测性,理论的确定性和系统的稳定性。设计铁路桥梁,计算弹道轨迹,甚至做个桌椅板凳,都会用到牛顿力学,牛顿力学满足了我们生活中大部分物理需求。类似地,正常的语言表达也能满足我们大部分日常生活中的语言需求。与人平常交流,开会发言,上超市买东西,用电邮发通知,在微信上沟通,写博客短文,甚至高考作文,都要求表达清晰,让人听得懂,看得明白。用心理语言学的话说,就是要求语言行为具有直接可观测性。如果有人说话词不达意,写东西词法句法语法混乱,逻辑不通,意思不明,就会被视为语言能力不足。
自然语言的稳定性依赖于其句法和语法结构的稳定性,而自然语言的确定性表现在其语义学的确定性。可见,自然语言的稳定性和确定性是建立在的句法语法结构与其语义学相互剥离的基础上的。这种剥离是语言长期进化进入高级阶段形成的。人们常常忽视了句法语法结构的形成,在人类语言进化中是一件多么神奇的事情,相当于人类把上帝的活儿给做了。更不可思议的是,人类居然还发明了语义学,把语言表达的意思或意义都给确定了,真是巧夺天工。这使得人类在心智世界里学会了只用两条语言之腿站立行走,这样才能腾出两只心智之手来做别的更复杂的事情。直立行走,是人类进化的里程碑,也是人类语言进化的里程碑。
我的博士导师,已故纽约大学心理系教授马丁·布芮恩(Martin D.S.Brain),曾是两个领域的权威学者,一个领域是推理心理学,另一个领域是发展心理学。在推理心理学领域,他构建了心智逻辑理论,并发展了实验方法。在发展心理学领域,他由研究儿童语言习得而著名。心智逻辑理论认为人们是应用推理模式进行推理,而这些推理模式是基于语言能力,在阅读理解过程中被自动激发的。所以,心智逻辑理论又被认为是一个句法推理理论。
认知革命的先驱乔姆斯基,首先区分了语言习得的先天能力(competence)和后天表现(performance)。乔姆斯基认为人类具有与生俱来的内在语言习得配置,这种内在配置是人类物种独特的、长期进化的结果。一个四岁的儿童可以用语言自由交流,不仅是四年语言习得之功,还源于其内在语言习得功能配置。你不可能训练任何其他物种习得语言,因为其没有所需的内在功能配置。那么,儿童是怎么启动其内在配置而发生语言表现呢?这曾经是一个谜题。布芮恩教授持续观察了他自己孩子的语言发展过程。他发现,儿童在正式学习约定语法之前,会提前自主生成一种儿童语法以便做出语言表现。这种儿童语法表现了儿童语言的相对稳定性,使语言交流成为可能。
我的博士后导师,原普林斯顿大学心理系教授菲力普·约翰逊-莱尔德(Philip Johnson-Laird),提出并发展了心智模型理论,主张人们推理是由构造心智模型进行的。心智模型的构建基于推理者对于前提语句意义的理解。而这种理解,又是基于人们对语言的感知。认知革命另一位先驱乔治·米勒(George Miller)教授也是心理语言学的开创者之一。米勒和约翰逊-莱尔德合著的巨著《语言与感知》(Language and Perception),我认为其实是心智模型理论的思想前奏。关于这一点,20 多年前,我曾问过约翰逊-莱尔德教授,他并不认可。学术权威的意见,只能作为参考,而不能奉若神明。比如他还说过,心智世界中没有量子事件;我显然无法认同这种认知。学术权威也有局限。同时,心智模型的形式表达与逻辑语义学具有可比性。所以,心智模型理论被认为是一种语义推理理论。正是心智逻辑理论和心智模型理论,为推理心理学提供了语法稳定性和语义确定性。而推理是心智的核心能力,也是其代表性的语言表现。在实验心理学中,推理实验任务都是使用语言任务。
由句法语法结构及其语义学,即所谓语言的双腿构造所带来的稳定性和确定性,在形式语言与科学语言中表现得更为清晰。我经常在课上告诉学生,学习一门学科,首先要熟悉其学科语言,将其句法语法结构与其语义学先做剥离,再理解将二者结合的元性质。在我教授的课程里,至少要讲到八种这样的科学语言双腿构造分析,第一种涉及逻辑学,第二种涉及决策论,第三种涉及博弈论,第四种涉及元数学,第五种涉及量子力学波函数,第六种涉及规范场论,第七种涉及集合论,而第八种涉及粒子物理标准模型的几何化纲领。
在科学语言王国中,逻辑学是率先使用语言双腿结构直立行走的学科。当代形式逻辑,也叫标准逻辑或符号逻辑,是由各种形式系统刻画的。一种逻辑,就是一个形式系统,有其特制的形式语言。对自然语言做逻辑分析,有三个基本层次:最简单的是命题逻辑,也叫命题演算,另一个层次称为量词谓词逻辑,再一个层次称为模态逻辑。
1.命题逻辑与真值语义学
先看一个例句:“如果所有的珠子都是红的,那么汤姆和一些女孩玩游戏”。在命题逻辑层次,将一个简单语句“所有的珠子都是红的”视为一个整体,叫做命题,而不深入分析其内部的句法结构。将语句联结起来的词叫逻辑联结词,也叫逻辑算子、计有合取(并且)、析取(或者)、蕴含(如果、则)、等价(当且仅当)以及否定(非)等五个。所以,在命题逻辑的词汇表中,有可数无穷多个命题变元、五个逻辑联结词以及作为标点符号的双括号。有了这些以符号表示的词汇,就可以形成无穷多的有穷符号串。为了能够机械地判别哪些符号串是符合语法的合适公式,包括原子公式与复合公式,哪些符号串是不合语法的非合适公式,需要引入一套形成规则。形成规则也只能是归纳定义的。逻辑学研究推理,而演绎推理是从若干给定的前提出发,一步步地推出结论,而推理过程的每一步都会应用一条推理规则,这称为证明。如上可见,命题逻辑语言的形式句法由词汇表、形成规则与推理规则组成。
那么,这一套命题逻辑句法的逻辑意义是什么呢?在逻辑学中,逻辑意义只有一种,那就是或真或假,叫做真值。只有那些有真假可言的句子才算是命题,这叫做命题态度。命题逻辑的语义学叫做真值语义学。命题逻辑系统中的命题变元叫做原子公式。真值语义学规定了如何由原子公式的真值算出具有任意复杂度的有穷复合公式的真值。真值语义学为一个真值表所规定。具体地说,一个合取式为真当且仅当两个合取项都为真;一个析取式为假当且仅当两个析取项均为假;一个条件式为假当且仅当其前件为真而后件为假;一个等价式为真当且仅当前后两项真值相同;最后,一个公式与其否定真值相反。
不要因为其简单而小看了真值表,它在现代科学史上起到里程碑的作用。首先,它是第一个真正意义上的科学语义学,将关于意义的理论分离出来并将其形式化。第二,它为五个逻辑联结词规定了其逻辑意义,而这五个联结词体现了自然语言核心表达功能。很难想象,如果失去这五个逻辑联结词,自然语言的表达功能会何等残缺;同时,如果这五个逻辑联结词意义不清,语言表达会变得何等费劲混乱。另外,把真值换为1,将假值换为0,真值表就变成布尔代数。布尔代数是计算机科学的发源,也是电路设计乃至集成电路中“与非门”的原典。
在逻辑学中有两个中心概念,一个是前面说过的“证明”,这是一个纯句法的概念;另一个“有效性”,这是一个纯语义的概念。有的作者甚至认为,逻辑学就是关于有效性的科学。有效性由一个条件句所定义:如果一个推理的所有前提都是真的,那么其结论也必须是真的。换句话说,在一个推理中,如果掺入一个或若干个假前提,那么无论其结论是真是假,这个推理总是有效的。
如此这般,一个逻辑系统的双腿结构有两个标准组分,一个是形式句法,一个是形式语义学(也叫模型)。标准逻辑有其逻辑标准,即要求其句法结构和其语义学是对偶等权的,而这种等权对偶关系是通过可证性和有效性之间的关系建立的。如果所有的证明都是有效的,我们说这个逻辑系统是语义协调的,如果所有的有效公式或推理都是可证明的,我们说这个逻辑系统是完全的。可见,协调性和完全性是关于逻辑系统的整体性质,亦称元性质,就像一架双向桥梁沟通了逻辑句法及其语义学,虽然两者是独立构造出来的。命题逻辑具有协调性与完全性。
2.谓词逻辑与赋值语义学
在命题逻辑的基础上,谓词逻辑要对语句的内部结构做分析。再用前面用过的例句,“如果所有的珠子都是红的,那么汤姆和一些女孩玩游戏”:句中“是红的”由一元谓词(是,to be)带一个形容词(红的)组成,叫做一条性质;另外,“玩游戏”(严格地说是“玩”)是一个二元谓词,表示汤姆和一些孩子之间的二元关系。珠子和孩子都是个体变元,而汤姆是一个个体常项;另外,“所有”是全称量词,而“一些”是特称量词;注意,在英文表达中,这个句子里还包含一个定冠词“the”,定冠词常起到代词的作用。将这些句子成分增加到形式语言的词汇表中,再制定相应的形成规则与推理规则,就组成了谓词逻辑的形式句法。
以上所增加的这些句法内容,显然超出了命题逻辑真值语义学的解释范围。这就需要为谓词逻辑设计一种新的语义学,叫做赋值语义学,也就是一种新的模型。为此,首先要引入一个包罗万象的一般个体域,即所有事物的集合,包括实在的事物和任意想象的虚物。然后对于每一个谓词,规定一个真值条件。以一元谓词为例,其真值条件就是个体域的一个子集。例如一个全称语句,所有的东西都是红的,为真当且仅当其真值条件集等于一般个体域。又例如一个特称语句,有些东西是红的,为真当且仅当其真值条件集是非空集,等等。1930 年,哥德尔证明了一阶谓词逻辑是完全的,即其中任意有效公式都是可证的。谓词逻辑功能强大,覆盖了大部分数学语言。
3.模态逻辑与可能世界语义学
在标准命题逻辑和谓词逻辑中,所研究的都是直陈句,不含模态词(亦称情态词)。模态词包括:可能、必然、必须、承诺、允许、道义、虚拟语气、条件、时态,等等。正是这些情态词,使自然语言变得丰富多彩,富有弹性,功能多样,表达适当,进退得体,留有余地。将模态词引入标准逻辑,增设相应的形成规则与推理规则,就形成了模态逻辑句法结构。
模态逻辑的语义学称为可能世界语义学。比如,模态命题逻辑的可能世界语义学,由一可能世界与定义在其上的一种二元可及关系组成。对于不同的公理化方式,这个可及关系要满足一些具体的性质,如传递性或自返性等。这样,一个必然语句,“必然A”,在某可能世界为真,当且仅当语句A 在由此可能世界可及的所有可能世界是真的。一个可能语句,“可能A”,在某可能世界为真,当且仅当存在一个由此可能世界可及的可能世界,使得语句A 在其上为真。可能世界语义学也叫克里普克语义学,缘于可及关系的概念是由原普林斯顿逻辑学家克里普克引入的,并由其证明了模态逻辑的一种完全性。
在科学语言中,历来并没有区别句法语法结构与其语义学的传统。这样的科学语言,就像生活在水中的美人鱼,悠游优美,观赏性强但却难以亲近。你又怎么知道,那美人鱼不想进化出双腿结构,漫步陆上,与人类共舞呢?我都能时时听到美人鱼的幽怨,那些科学家在陆地上奔跑快活,却把她困在水宫之中,或深海墨绿青灯昏暗,或浅洋深蓝光栅迷乱,茫茫然,眼望穿,何处是人间那般。终于,有一个心理语言外科医生,拿起柳叶刀,开创了为科学语言构建双腿结构的手术方法。多年的教学经验告诉我,学生们更容易接受被赋予双腿结构的科学语言。我自己每次在学习一个新领域的时候,第一件事就是努力熟悉它的学科语言,并试图找到它的双腿结构及其元性质。我近年来在理解一些领域,例如在思考理论物理谜题中取得的进展,正是得益于此。这是逻辑学家的本能习惯。
经典公理化决策论句法是一个三层结构:第一层是选择的集合,或称选项;第二层是说,每一个选择可以产生一可能结果点集合;第三层是说,每一后果由两个性质也仅由两个性质所刻画,即欲望与可行性。要提出一个决策论问题,就要把问题置入这个句法结构。解决一个决策论问题,要求在选择集上建立全序的偏好关系,即对任意两个选择,必须偏好其一,而不能偏好“不予偏好”。偏好是一个句法概念。可以看到,经典决策论句法的词汇表包括五个且仅五个概念:选择、结果、欲望、可行性与偏好,由其组成三层语法结构与解决条件。少一个概念,不成其为一个经典决策问题,多一个概念,说明尚未提炼出合适的决策问题。那么这个经典决策论是什么意思,又如何建立经典偏好关系呢?这叫做语义学问询。
经典决策论句法结构是由上向下构建的,其语义学要由下向上规定决策论意义。首先,欲望的决策论意义只有一个,那就是钱数。无论是什么欲望,在决策论的意义下,都必须折算成值多少钱。您可能听这话不舒服,觉得这不是侮辱人吗?拿我当什么人了,你以为我是拜金狂吗?我热爱我的祖国,那是无价的!我有我的信仰,那是无条件的!这当然可以理解。可是,人们一般不会说,我“决定”爱我的祖国,因为爱祖国是伦理论题。人们一般也不会说,我“决定”信仰上帝,因为那是宗教论题。伦理学和宗教学都超出了决策论框架。这就是决策论的边界,没有边界的理论不是科学,没有明确边界的科学不是成熟的学科。
下一个概念是一个可能结果的可行性。你想要买一辆新车,你甚至想要买下一个汽车公司,两者的可行性显然不同。可行性自然的数学刻画是概率,可是在标准概率论中,一个单独的独立事件没有概率可言。当然,心理学中有关于主观概率的理论,为一个孤立的独立事件配置概率,也叫或然率,这会在其他上下文中说到,但那不宜放入标准决策论中。注意,一个选择可以产生若干个甚至许多可能的结果,决策者对这些可能结果的看重程度不同,也就是所赋予的权重不同。对于一个选择,所有可能结果被赋予的权重分布,叫做一个策略。要将这个策略转换成一个概率分布,在数学上要做归一化处理,也就是要求一个分布中的所有概率相加等于1。原因是,所涉可能结果都是从属于同一个选择,若视此选择为最优偏好,它即成为现实,而现实事件的概率为1。有了这个归一化的概率分布,就可以为一个可能结果配置概率了。这样,我们才可以说,语法可行性的决策论语义是其概率。
一个可能结果由其欲望与可行性两种句法属性刻画。欲望的决策论语义是钱数,可行性的决策论语义是概率,两者相乘,叫做效用。所以,一个句法可能结果的决策论语义就是其效用。这是决策论效用语义学得名的由来。这是第二层,称为结果层。再往上走一层,就回到选项层。一个选项可以产生若干个或许多个可能结果,每个可能结果有其语义效用;这些效用的加和,叫做数学期望。所以,一个句法选项的决策论语义就是其数学期望。
强调一句,钱数是数,概率是数,两者相乘所得效用也是数,效用相加还是数,所以,效用语义学也叫数字语义学。决策论的系统元性质要求其句法结构与效用语义学强度相当,不多不少,刚刚好。这个元性质由决策论表示定理所刻画:对于任意两个选项,偏好其中此选项之于彼选项,当且仅当此选项的数学期望大于彼选项的数学期望。可以看到,类似这种元性质的要求,正是从标准逻辑模仿来的。为什么用数字语义学来解释决策论句法结构呢?原因是,我们不熟悉两个选项之间的偏好关系是什么意思,难以确定,但我们知道两个数之间的大于关系是什么意思,所以用后者解释前者,这就是语义学的功能。
冯·诺依曼和摩根斯坦在其经典著作《博弈论与经济行为》(1944)中发展了博弈论思想,不仅定义了博弈的概念,并确切地区分了合作与非合作两类博弈,从而奠定了博弈论的基础。然而,现代博弈论却是在所称纳什框架(Nash framework)下才得以蓬勃发展。纳什不仅用数学语言严格定义了合作博弈与非合作博弈,还证明了其系统性元性质,即纳什解决与纳什均衡,从而建立了博弈论研究的基本框架。
非合作博弈的句法结构并不复杂,但在概念上有一个难点。第一,假设N 为博弈者的个数。第二,每个博弈者都有一个可能行动集合,记为Ai。这与个体决策论的情形类似,没有认知困难。第三,考虑一个可能行动的n元组(a1,…ai,…,an),其中每个博弈者从自己的可能行动集中贡献一个行动。这样的n元组叫做一个情景。一种博弈,就是所有可能情景的集合,也就是所有博弈者的可能行动集的笛卡尔乘积,记为Ai。这就像一个电影的胶片,由一个个片段组成。与个体决策论有本质区别的是,每个博弈者并不是在自己的可能行动集上建立偏好关系,而是要在所有情景的集合上建立偏好关系。这在博弈者心理上容易造成认知困扰,因为心智是以个体为单位具身注册的,所以在个体决策论中,决策者在自己的可能行动集上建立偏好关系比较自然。现在,每个博弈者要在任意两个情景问题建立偏好关系,而每个情景都涉及所有其他博弈者可能行动,这是造成认知困扰的心理原因。据我的教学经验,把这个心理语言的困扰克服了,博弈论语言就变得舒服了。
非合作博弈的元性质就是人们常听说的纳什均衡,这是一个纯句法的性质。纳什均衡是一个特殊的情景,必须对每一个博弈者说话,所以记为(,),满足以下条件:对于每个博弈者i,≻iai,对于所有的ai∈Ai。
一个情景的博弈论意义叫做效益。与决策论情形类似,效益也是价值和概率两者的线性函数,所以非合作博弈的语义学称为效益语义学。注意,与决策论语言不同的是,对任一情景中的某个行动单独赋值或赋予概率没有意义,有意义的是为情景中所有行动同时赋予一组值和一个归一化的概率分布。人们很少注意到一个有趣的现象,即博弈论语言的双腿结构,还表现在非合作博弈与合作博弈的陈述方式的区别。
合作博弈由一可能协议集合所刻画。以二人谈判为例,在讨价还价过程中,开价值和砍价值形成一轮价格对,记为(u,v)也就是一个可能协议。理论上,可能协议可以有很多。合作博弈的一个重要概念叫做可谈判点,或叫转折点更通俗。可以理解,不是所有的可能协议都具有可谈判的意义。如果u或v过大,即u值和v值差别过于悬殊,将使其中一方失去谈判兴趣。所以,应该存在一个转折点来界定可谈判的协议范围。在这个范围内,会存在一个特殊的可能协议,叫做纳什解决,使得其中两个值的乘积最大,即大于其他可谈判范围内可能协议的相应两值乘积。
以上所述就是一般博弈论教科书介绍非合作博弈和合作博弈的方式。我在课上讲授这部分内容时,发现一个有趣的现象。我注意到,非合作博弈是以句法方式引入的,可能行动集和情景n元行动组和纳什均衡,都是句法组分。而合作博弈,是以语义方式引入的,可能协议、价值和纳什解决都是语义组分。这样一种特别双腿结构,句法足踏在非合作博弈领土上,语义足踏在合作博弈领土上,使博弈论框架得以直立行走。这个现象在现实生活甚至在国际关系中比比皆是,有着显著的心理后承。想象人们在打架冲突时,常常威胁说,你要是做这个,我就做那个。某国对另一国说,如果你继续这样做,我就制裁你。另一国反怼,你若制裁我,我就轰炸某第三国。这就是非合作博弈的行动语言话语方式。当某一方开始开价谈条件时,提到价值,就开始释放出有意合作的信号。所以,教科书中的介绍方式,不像是巧合也不像是疏忽,而应该是反映了这些作者对博弈论框架的心理认知。
集合论是当代数学的通用语言。为此,布尔巴基结构主义学派曾作出巨大贡献。作者最近提出一种从集合直接生成双腿结构的方法。考虑一个集合A,其幂集是A 的所有子集的集合,记为P(A)。设a 是A 的一个任意给定元素(成员),记为a∈A,读做:a 属于A,符号∈表示属于关系。另设B 是A 的一个任意给定子集,记为B⊆A,读做:A 包含B,或B 含于A,符号⊆表示包含关系。显然,B∈P(A)。现在写出幂集的定义如下:P(A)={B}B⊆A,意即B∈P(A)当且仅当B⊆A。用逻辑学语言说,B∈(A)称为(A)的外延,B⊆A称为(A)的内涵。这样,通过关于幂集的言语分析,我们就构造出了集合论语言的外延句法及其内涵语义学,亦称为“属于句法”和“包含语义学”,分别记为∈句法和⊂语义学。这是一种由集合论语言内在结构自我生成的双腿结构,所以具有一般性。这样生成的双腿结构,其元性质是自明的,既完全又协调,因为幂集的每一个成员都指称本集的一个唯一的子集。对于一个范畴,所有指称方式的集合,在范畴论中称为指数集。
集合论双腿结构具有基础性意义,并在经验科学统计语言中具有很强的刻画能力。在经验科学中,之所以必须用也只能用统计语言说话,是因为假设了总体的不可观测性。我们能够观测的,是随机抽取的样本。样本与总体之间,是包含关系。而样本与总体的幂集之间,是属于关系。后者是统计语言的样本句法,前者是样本语义学。在传统经验科学方法中,实验的统计意义在于用样本均值预测总体均值,而样本语言的双腿结构恰好刻画了这个系统性特征。
集合论双腿结构的想法,简略地说,在热力学统计方法中,假设数据总体无穷大,其中每个单个事件没有独立的统计意义,因为单个独立事件没有测度。而一个数据样本是可测的,进而在总体的幂集中,也就是在样本集中,可以形成测度的密度函数,找到其概率分布。这种双腿结构,称为样本句法的测度语义学。
以上介绍的几种语言双腿结构,都是依附于形式科学或分析科学的。这里选择介绍三种量子物理中局部语言的双腿结构,前两种属于比较成熟的处理,在另文中有详细说明,这里的讨论较为简要,第三种属于尚在研究思考中的题目,未必成熟,需要多说几句。
1.波函数的双腿结构
我们知道,经典量子力学有三个等价的版本。第一个版本是海森堡矩阵力学,用非对易关系和测不准原理为原始语言说话。第二个版本是薛定谔波动力学,以波函数的汉密尔顿方程为原始语言说话。第三个版本,亦被认为是最具一般化的版本,是狄拉克的bra-ket 形式语言,这里,bra 表示左括号,ket表示右括号。狄拉克指出:在观测中的干扰度越高,我们所能观测到的世界就越小。在这个意义下,量子力学是关于微观观测的理论。狄拉克形式语言正是抓住了这个本质。记为φ|Ai|ϕ。以标准教育考试为例,考生能力是一种难以直接观测的现象ϕ,所以只能给一个考试φ,用一道道试题Ai作为刺激,ϕ会给出一个个答案作为反应。这样,变量ϕ成为变量φ的函数,记为ϕ(φ),称为波函数。狄拉克形式φ|Ai|ϕ即为波函数语言的句法。
波函数有一个哥本哈根学派的概率诠释,振幅语义学(亦称复数语义学)。波函数的任意两个函数值可以表达为一个复数,表示一种可能性。这个复数的模方称为波函数的振幅,也就是其概率。用狄拉克的话说,可能性的平方等于概率。这个概率诠释,点出了波函数的意义,称为波函数的振幅语义学。我们看到,波函数的狄拉克句法与哥本哈根振幅语义学,构成了波函数语言的双腿结构。
2.规范变换语言的双腿结构
在规范场论话语中,波函数被置于一个双层双级四格结构中。双层是指区别全局与局域两个层次,双级是指在全局层面和局域层面,各有规范势与规范场强两级。由规范势求规范场强,要对波函数应用适当的微分算子。波函数是变化的,其规范势从一个状态变换到另一个状态,要乘上一个变换系数eiθ,即φ→φ‘ =eiθφ。相应地,在微分算子的作用下,其规范场强也会做变换,即∂μφ→∂μeiθφ=eiθ∂μφ。在全局层面,这样的变换称为第一类规范变换,其中,变换系数eiθ是一个任意常数。在局域层面,变换系数成为一个函数eiθ(x),相应的规范变换称为第二类规范变换。综合两类规范变换,就构成了规范变换的句法结构与语法规则。
规范变换的意义在于保形。保形的意思是,保持变换系数的唯一性和前置性。前置性要求,在规范势变换中,变换系数是前置于波函数状态的,那么在规范场强的相应变换中,变换系数也必须是前置于波函数导数的。唯一性要求在规范场强的变换中,不能产生冗余项。这两个要求,在全局层面的第一类规范变换中,没有问题,因为变换系数是一个常数。可是,在局域层面的第二类规范变换中,就会产生冗余项,因为这时变换系数是一个函数。为了消去冗余项,必须引入协变导数和规范场这样的语义技巧。所以,规范变换的语义学称为保形语义学。规范变换的句法结构与其保形语义学构成了规范变换语言的双腿结构。规范变换有一条元性质,即规范原理,内容为:如果第一类规范变换不成立,则第二类规范变换也不成立。也就是说,虽然前者比后者简单,但前者是后者的必要条件。
3.相位语言的双腿结构
当代粒子物理标准模型,是由几个动力学系统组成的,包括量子电动力学、量子色动力学、同位旋动力学、电弱动力学,以及希格斯机制,统一由规范场论语言刻画。动力学分析是有源分析,源头就是各种荷,比如电子载有电荷,夸克载有色荷并载有分数电荷,等等。粒子载荷,就被赋予了内部空间。一般所载可能荷数就是内部空间的维数。比如电子只载有电荷,其内部空间就是一维的,夸克可能载的色荷有三种,其内部空间就是三维的。粒子从一个状态变换到另一个状态,其内部空间就发生转动。由这种转动,相位就会改变。这里的相位,叫做动力学相位。相位的变化有速度大小可言,这个变化率称为动量,也就是自旋概念的由来。在量子力学中,自旋是粒子的内禀性质,在牛顿力学中没有对应,因为其不假设粒子有内部空间。
在量子场论中,粒子由其波函数刻画,所以相位语言自然是波函数的母语。前文说过,在规范场论语言中,波函数被置于给定的双层双级四格框架中。由于微分算子的作用,要做两类规范变换,其目的是使波函数在演变中保形,保形的目的是实现规范对称,而规范对称性是由对称群所刻画。对称群是一种代数结构,在此意义下,相位语言的句法结构是代数的,称为相位语言的代数句法。
为了使第二类规范变换保形,必须引入协变导数和规范场,分别写出如下:
我们看到,协变导数里套着规范场,两个状态规范场的差别恰恰是动力学相位函数的微分。换句话说,规范场的积分也表示一种相位,叫做贝里(Berry)相位。杨振宁称之为不可积相因子。如果说,波函数动力学相位是内部空间相位,那么贝里相位就是外部相位。用纤维丛理论话说,贝里相位是粒子在底流形上行走的轨迹。用社会科学的话说,动力学相位刻画的是个体心智活动和行为的变化,而贝里相位刻画的是你在社会中造成的影响。贝里相位是一种几何相位。规范场是用来平衡动力学相位变化的,而贝里相位与杨振宁不可积相因子的理论是粒子物理几何化纲领的重要内容。所以,这是相位语言一种几何语义学。现在我们理解了,粒子物理相位语言的双腿结构是由其代数句法及其几何语义学构成的。
在维特根斯坦与哥德尔之间,曾有过一场无解但有建设性的学术论争。说其无解,是因为在规范场论框架下,论争的本质涉及对语言做全局性处理或局域性处理的层次分歧。说其有建设性,是因为此论争意味着对构建两者统一理论框架的历史诉求与哲学问询。其实,在此论争的前后,数学已经准备好了微分几何纤维丛理论,物理学正孕育着规范场论,两者都可以同时满足维特根斯坦和哥德尔的语言哲学诉求。下文将分别介绍哥德尔不完全性定理、塔斯基不可定义性定理,以及维特根斯坦关于语言游戏的不完全规则性原理。粗略地说,这三者分别涵盖语言学的三个范畴,即句法语法学、语义学和语用学。
希尔伯特在1900 年国际数学家大会上提出了23 个待解决的数学猜想,包括黎曼猜想和连续统假设等,世称希尔伯特计划。关于数学大厦的逻辑基础问题,即数学大厦的一致性问题,是23个谜题之一。对此,1931年,奥地利数学家和逻辑学家哥德尔给出了否定性结果,他证明了一阶理论的不完全性定理,世称哥德尔不完全性定理或简称哥德尔定理。
哥德尔定理有着广泛的应用,如计算机科学中的“停机问题”即是其版本之一。哥德尔不完全性定理是一个最广为流传的数学定理名称,见诸各种书中。哥德尔定理本身确是一个思想丰富引人入胜的故事,但其内容较之其他著名数学定理与证明要简单。本节不预设任何预备知识。我们将从介绍哥德尔定理以及塔斯基定理的概念定义、函项构造及其证明技巧中,赏析其蕴含的深刻思想和无双智慧。
本节在叙述中,时而穿插一点春秋笔法,是有意为之,有认知上的考量。知识习得不仅在于理解,还涉及注意力、记忆、品味与体会。所以教与学都要有节奏上的把握。知识论中的柏拉图传统讲究求真求信求证三要素。心智力学告诉我们,对一般学人来说,三者难以同时并进,需要递次反复而行。哥德尔定理和塔斯基定理,不仅耐人寻味,而且品味幽深,值得作为个人的知识积淀。以下介绍理解哥德尔不完全性定理八个步骤。
1.一阶理论
讲哥徳尔不完全性定理,说是什么预备知识都不用也不准确。唯一要预设的就是一阶逻辑。一个逻辑就是一个形式系统,数理逻辑就是对数学语言的形式化逻辑化处理。比如,数学语言说,“A(x),对所有的x”,逻辑的形式语言就表达为,∀xA(x)。这里的符号“∀”叫做全称量词。A(x)表示一个谓词结构;其中,A是一个谓词,x是一个个体变元。当量词被规定只能量化个体变元时,逻辑就是一阶的。当量词还被允许量化谓词时,逻辑就是二阶的。二阶逻辑和集合论等价,再加上选择公理和连续统假设,就能描述整个数学大厦。注意,一阶逻辑是完全的,这是哥德尔1930年就证明了的,叫做哥德尔完全性定理。所以哥德尔首先是一个逻辑学家。这件事,要小心别和哥徳尔1931年的不完全性定理闹混了。
逻辑中有逻辑联结词,如合取、析取、蕴含和否定,这些亦称为逻辑算子。数学中有数学运算,如加法和乘法。逻辑算子与数学运算有本质的不同,这通过以下简单比较可以看出来。先看逻辑算子。析取,P或者非P,是重言式,可用于定义布尔代数的单位元1。用式子写出来就有,P∨~P=T≡1。为了方便,这里的等号可表示等价或者等于。合取,P并且非P,是矛盾式,可用于定义布尔代数的单位元0。用式子写出来就有,P∧~P=F≡0。再看数学运算。加法,a+(-a)=0。乘法,a×a-1=1。不难看出,析取与加法,合取与乘法都是不能互相置换功能的,因为得出的单位元不同。进一步看,析取和乘法,合取与加法也都不能做功能置换。因为,真与Q的析取还是真,而1 乘b 却等于b。类似的,假与Q 的合取还是假,而0 加b 却等于b。究其原因,竟是逻辑里的单位元与数学中的单位元有本质的不同。真是一言不合,便使逻辑与数学分家,成楚河汉界之隔。在后面第四步骤中,我们会看到以哥德尔命名的一种“配数法”,如何教一桥飞架南北,使天堑变通途。
在前述一阶逻辑中加入两个(一个不够)数学运算,加法和乘法,再行形式化处理为一个新的形式系统,即是所称“一阶理论”;其原型就是所谓皮亚诺算术,是一个公理化系统。哥德尔不完全性定理就是刻画了一阶理论的二条元性质,即系统性性质。另外要补充的是,一阶理论是一个很基本但又很特殊的数学层面,哥德尔不完全性定理也表明在此层面上我们的公理化手段是有限的。往下看,一阶逻辑不需要更强的公理化方法;往上看,如实数或复数等更为复杂的数域反而允许更丰富的公理化方法,其完备性定理稍后为塔斯基所证明。
另外,读者在心里最好准备区别三个庭苑,对摸清本节苑中路径绝对有帮助。一个是普通素朴算术;这里,对于一个n元关系,只能用“是否成立”的概念说话。另一个是规定的算术结构,在一阶理论中表示语义模型;这里,对于一个n元函项或公式只能用“是否为真”的概念说话。最后一个是一阶理论的句法形式系统,记为N;这里,对于一个函项或公式,只能用“是否可证”的概念说话。三者同门,都是自然数出身或带有自然数血统,却界限分明。在哥德尔定理中用到的可表达性概念,是在普通素朴算术与一阶理论的句法形式系统之间说话。在塔斯基定理中用到的算术可定义性概念,是在普通素朴算术与一阶理论语义模型之间说话。最后,哥德尔定理和塔斯基定理本身,又都是在一阶理论语义模型与句法形式系统之间说话。
2.自然数与枚举数
自然数集是个可数无穷:0,1,2,3,…,以至无穷,这谁都知道,在文献中叫做直观自然数。自然数原来除了在数论里被当成自己人,出去到别的数学豪门中就像个灰姑娘,只能做些伺候人的活计。其主要工作就是给人当脚标,上标下标明标暗标还有爱因斯坦约定上下标;张量变换中因为来来回回的走标繁复,没少让学者们白眼厌烦。这灰姑娘倒是心态平衡,但看你们实数复数虽然数不胜数,生态连续,极限涟漪,可微处处。不过,话说回来,游动其上的变元数总得可数吧,那就少不得我自然数沿街走标的一口饭吃。这看似是何等的无奈。谁承想,哥德尔独具慧眼,发现这自然数竟是个少林扫地僧,身怀绝技深藏不露。在后文中,一个哥德尔配数法将天下证明前后一网收尽,一个自指语句将世间公式内外覆雨翻云。令人未及说此神来一笔,已是结舌当下。
在现代数学中,自然数也是要被定义构造出来的,这样构造出来的自然数被定义为枚举数。具体做法是从空集ϕ 出发,通过后继函数归纳定义。空集里面没有元素,定义为第一个枚举数0。下一个枚举数是以空集为唯一元素的集合{ϕ},定义为第二个枚举数1。以此类推,后面每一个枚举数都被一个以其前面所有出现的枚举数为元素的集合所定义,记为n。这个构造方法称为后继函数。
不去深想,直观自然数和枚举数的区别不过是把自然数用集合论语言重新定义出来。不说这是花拳绣腿,充其量也就是平凡功夫。可哥德尔偏就能从无痕处发微,引出下面可表达性的概念来。
3. 可表达性
可表达性建立了算术关系与一阶理论可证性之间的联系。这里算术中的一个n元关系R对应着一阶理论中的一个n元函项P。要问n个自然数是否满关系R,就相当于问将相应的n个枚举数代入函项P后在一阶理论N 中是否可证。可表达性同时说了两句话,第一句,如果R(a1,…,an)为真,则P(a1,…,an)在N中可证。第二句,若R(a1,…,an)为假,则¬P(a1,…,an)在N中可证,这里“¬”是否定算符。
在可表达性的两个条件句中,交叉使用逻辑排中律,每一句中由此及彼,两句之间非此即彼,让读者可能陡然产生强烈的逻辑感,感受到逻辑概念化的跨越力量,感受到逻辑处理手法的生硬与无情,让人爱恨交织。任何一种科学抽象都是有边界的,有所得便会有所失,这是波普尔的科学哲学思想。这在数学里叫做平凡化处理,为建立两个不同维度,就只能舍弃某些缠绕,以使二者正交起来。
尤其是可表达性的第二句话,由R假强行过渡到¬P在N 中可证,是一个很强的条件,甚至有悖直观。这在推理心理学中,无分相互竞争的心智逻辑理论还是心智模型理论,都有不同的处理方式。可表达性定义了一个由素朴算术到语法表示的历史性转折,其中既表现了似敦刻尔克大撤退的悲剧美,又预示着似诺曼底登陆的人类心智使命担当。
我们上面用到了“若关系为真”的语义修辞,那是为了上下文的叙述方便。等到后面续接塔斯基不可定义性定理时,就会看到,一个“谓词真”会掀起何等波澜。
4.哥德尔配数法
这是20 世纪人类心智的绝唱,数学美的无双巅峰。比之爱因斯坦广义相对论中的等效原理,哥德尔配数法异曲同工,却不输妙悟,胜在严格精密。难怪爱因斯坦说,他每天去普林斯顿高等研究院上班,就为了和哥德尔一起散步呢。哥德尔配数法可以分三步介绍。
第一步,每个符号可机械地配以一个唯一奇数。一个形式系统,比如一阶逻辑或一阶理论,其形式语言的可用符号可以无穷多,却总是可数的。这样,总可以安排某种机械的方式,按顺序为每个符号配上一个唯一的奇数,称为这个符号的哥德尔数。
第二步,每个公式是一个有穷符号串,可为每一个公式机械地配以唯一的一个合数,即其哥德尔数。生成此哥德尔数的方式非常神圣,谨怀敬畏之心写出如下:
上面等式的左边,标明是公式L的哥德尔数。右边是一串共n个指数的乘积,由初始素数打头排下去,第n个指数的底是第n个素数,其肩膀上扛的是公式L中第n个符号的哥德尔数。
第三步,每个证明是一个有穷公式集的有序序列。可以为每一个证明机械地配以一个唯一的合数,即其哥德尔数。生成此哥德尔数的方式更加神圣,仍怀敬畏之心写出如下:
上面等式的左边,标明是一个证明的哥德尔数,也是一个合数;Bew是德文“证明”的缩写。右边仍是一有穷串指数的乘积,而这次第i个素数肩膀上扛的,却换成了此证明序列中第i个公式ui的哥德尔数g(ui)。
这就是哥德尔配数法。其神奇之处在于,反过来从一个证明的哥德尔数,亦即一个合数出发,由素数分解唯一性定理,可以找到产生这个哥德尔数的唯一指数串。同理,再由其中每个指数肩上的,关于相应公式的哥德尔数,可以找到产生此哥德尔数的指数串;同理,又由其中每个指数的肩上,可以找到关于相应符号的哥德尔数。由此,我们可复原每个符号,复原表达每个公式的符号串,直至复原表达一个证明的公式序列。这样,我们就可以在一阶理论与其算术模型之间双向转换了。
5.自指语句
哥德尔配数法的妙用之一是可用来生成自指语句。设P(x)是一个只含一个自由变元的公式,令其哥德尔数为n。将此哥德尔数代入x,得到一个闭项P(n)。P(n)就是一个自指语句,它含有其母公式的哥德尔数。假设P(n)是可证的,它应该有一个证明,记为Bew(P(n)),这个证明也会有自己的哥德尔数。
我们现在可以引入一个二元算术关系,G(i,j),这里i是一个只含有一个自由变元的母公式P(x)的哥德尔数,而j是由其生成的自指语句P(n)之证明的哥德尔数,即j=g[BewP(n)]。只要i和j满足以上条件,G(i,j)成立,则由可表达性定义,G(i,j)在N中可证。
这看上去是很建设性的进展,很正面啊。谁能想到哥德尔明修栈道却暗度陈仓,在G(i,j)前加了一个否定算子,由此情势立变,攻防逆转。其结果是将希尔伯特之链上23 颗参悟佛珠中的一颗反拧,如断臂维纳斯,给后人留下无尽的哲学思辨与本体论问询。他妙手构造的公式P(x)明确地说:对于所有的y,并非G(x,y),写出来就有∀y¬G(x,y)。回忆函项G的定义,这公式明白告诉我们,任何y都不是某个证明的哥德尔数。现在令公式P(x)的哥德尔数为i,即可构造出自指语句:
此式便是哥德尔定理的主角。这个公式落落大方,既身怀母公式P(x)的自指,又手按函项G(i,y)的非门,却自然而然不留违和之感。S唯一没交代的,就是它自己的身份可有证明。哥德尔不完全性定理及其证明,就都是拿这个自指语句S的身份证明说事。
哥德尔配数法和自指语句构造还有一层意境,那就是从美学的角度把东西方古代数学文化传统融为一体。西方数学文化,从欧几里得《几何原本》溯源,有讲究一般化分析的传统。东方古代数学文化,讲究的是用例子,但不是普通的例子,而是具有一般性的例证,比如中国的《九章算术》,又比如(现代)印度的拉马努金。这个道理,已故逻辑学家沈有鼎先生曾跟我讲过。一个数学证明,居然成为一个哥德尔数,这简直是例证化到了极限。
6.协调性与ω-协调性
做了这么多的准备工作和前期铺垫,就快进入主题了。我们说一个形式系统是语法协调的(亦称一致性),是指对于任何公式来说,要么这个公式是可证的,要么这个公式的否定是可证的。既排中,又周延。哥德尔定理的证明还要用到一个缺之不可的概念,即ω-协调性。它是说,考虑任意给定的,带一个自由变元的公式P(x);如果对于任何n,P(n)都是可证的,那¬∀xP(x)就是不可证的。有一条引理后面要用到;它是说ω-协调性蕴含协调性。
7.哥德尔独立性定理
(陈述一)若N协调,则S不可证。用反证法,设S可证,则有其证明Bew(S),并有其证明之哥德尔数j满足G(i,j),由其可表达性则有G(i,j);但由S的构造,对所有y,¬G(i,j),这不可能。这个矛盾推翻了反证法假设,故S不可证。
(陈述二)如果N 是ω-协调的,则¬S不可证。用反证法,假设¬S可证。那么由引理,N 是协调的,所以,由假设推出S不可证。也就是说,不存在S的证明,所以也不存在所谓S之证明的哥德尔数。由此,对于任何j,关系G(i,j)都不成立;反过来说,就是对于任意j,关系G(i,j),都成立,而这正符合S的公式表达:S=P(i)=∀y¬G(i,y)。这样,由ω-协调性定义,S就成为可证的。前面刚由反证法假设推出S不可证,现在又改口说S可证,这个矛盾推翻了反证法假设,证明了¬S不可证。
由陈述一和陈述二的证明,可知语句S在一阶理论N 中确实是既不可证又不可否证的;我们说,它是独立于一阶理论的。这个结果被称为哥德尔独立性定理,亦称为哥德尔第一定理。这是个具有一般性的结果;如果试图把S作为公理加到一阶理论N 中,还可以继续构造出新独立语句来。
8.哥德尔不完全性定理
思辨一下,S的句子构造说的是自己不可证。以上我们证明了S确实不可证,所以S说的是真的。好了,S是真的却不可证,说明一阶理论N是不完全的。这就是著名的哥德尔不完全性定理。最后,别忘了交待完全性的定义:对于N中任何语句S如果S是真的,那么S是可证的。
哥德尔不完全性定理自希尔伯特雄伟计划出发,最终达到了一个始料未及的境界。我们前面为了叙述方便说到过:“一个关系是真的”,又说到“S是真的”。真是“真”吗?“真”是什么意思?这在逻辑哲学上叫做真理论问询。下面接着要讲的塔斯基不可定义性定理,是哥德尔不完全性定理的姐妹篇。
按当代形式科学的要求,一个形式系统,如一个逻辑系统,有两个标准组分,即其语法和语义学。这反映了形式语言的本质。在系统的形式语法中,讲究的是可证性;而在其语义学中,是用“真值”说话,真值只能为真或为假,是排中的,故又称为命题态度。一阶理论的语义学,亦称其模型,就是一个算术结构。语法及其语义学要等权,也就是在可证性与有效性之间要有当且仅当的关系,这是元逻辑关于系统整体性质的要求。任意一个公式可证则其有效,称语义可靠性。任意一个有效公式都是可证明的,称为完全性。我们希望一个系统的语法和语义学是等权的。前者强后者弱称为形式化不充分或模型化过分,前者弱而后者强则为模型化不充分或形式化过分。在决策论中,不完全性也称为对应非理性,非可靠性也称为反映非理性。以下是理解塔斯基定理的四个步骤。
1.算术可定义性
前文定义了由哥德尔所引入的可表达性概念,那是讲大家都知道的所谓在素朴算术中成立的关系和一阶理论语法中可证性之间的联系。塔斯基引入了算术可定义性的概念,说的是素朴算术中成立的关系与一阶理论语义学(即作为模型的给定算术结构)之间的联系。它说,如果一个n元关系在素朴算术中成立,那么其相应的函项在一阶理论模型中断言为真,由此就说关系R在此模型中是算术可定义的。
考虑只带一个自由变元的公式A(x),称为母公式,并令其哥德尔数为m。将m代入x,得到一个新的公式B(m),这是一个闭项(不带自由变元),是A(x)的一个自指语句。如此,还可以再令n为B(m)的哥德尔数。认真说来,塔斯基定理较之哥德尔定理,有一个概念上的难点。哥德尔定理中用到两个哥德尔数,一个是母公式的哥德尔数,另一个是其自指语句之证明的哥德尔数,两件事容易分开,在认知和记忆中没有阻碍。在塔斯基定理中也要用到两个哥德尔数,一个是母公式的哥德尔数,另一个是其自指语句的哥德尔数,这在概念上自相缠绕,这在心理学上就需要更强的认知努力以避免思维中造成记忆上的认知堵塞。我在讲课中注意到这个问题。所以,为了便于区分,我们称一个母公式的哥德尔数为一阶哥德尔数,而称由母公式及其哥德尔数而生成的自指语句的哥德尔数为二阶哥德尔数。
造出二阶哥德尔数,塔斯基算是把哥德尔配数法发挥得淋漓尽致。背后的动机,是他要引入一个自然数关系,记为d(m,n),其中m是母公式的一阶哥德尔数,n是其自指语句的二阶哥德尔数。进一步,由d(m,n),在一阶理论及其模型中可算术定义一个函项D(m,n),也可说后者为前者所算术定义。这又是一道怎样的苦心,双重自指,必有后用。值得指出的是,d(m,n),是一个具有一般性的二元关系,对任何带有一个自由变元的公式都成立;所以D(m,n)亦是一个具有一般性的二元谓词函项。
塔斯基显然受到哥德尔工作的影响,使用哥德尔配数法就是明证。不过,天才就是天才。哥德尔是天才,是一代语法剑圣;塔斯基也是天才,是一代语义刀魂。他们都具有数学逻辑基础的学术情怀,也具备与天机唇语的使命,更身怀逢山开山遇水搭桥的本领。
2.真谓词与语义模型
真值在数理逻辑中本来是个语义的概念,只在模型中说话。一日,刀魂塔斯基做天才想:如果以刀为剑,对命题态度“真”做句法处理,又该是怎样一番意境?于是,塔斯基在原来一阶理论的形式语言N 中添加了一个真谓词T,由此,有了带真谓词的假想一阶理论,N+=(N,T)。可就这惊鸿一瞥,骤起波澜。
注意,有了真谓词T,就可以构造带有T的语句。同时,也就要为之而扩张原有模型。真谓词是个一元谓词。作为动词,中文“是”的英文就是“to be”,后面跟上一个形容词或名词就表示一条性质,如“是红的”,“是圆的”,“是塑料的”。既然如此,生造出一条性质,“是真的”,似无不妥。
为叙述方便,先引入三个记法。首先,将闭项B(m)记为L。其次,既然在语法中加入了真谓词,按理说就该有在其模型中预释为真的真语句,记为Lt。最后,这个Lt是一个语句,它应该有哥德尔数,记为Lg。这样,如果X是真谓词的一个算术模型,就会有,Lg属于X的外延,当且仅当Lt在X内涵下预释为真。真谓词的模型用一个集合的定义表达出来既清楚又简单:
即X的外延是一集哥德尔数,而X的内涵是说其中每一个都是也只能是某个在模型中解释为真的公式的哥德尔数。
3.说谎者悖论
常有人误以为哥德尔不完全性定理像是一个悖论,其实不是。可塔斯基定理不同,它确实是世称“说谎者悖论”的形式化翻新版。说谎者悖论起源于这样一句话:“此话为假”。思辨一下,若视这句话为真,则可导出其为假;若视这句话为假,则可导出其为真。这就是说谎者悖论。塔斯基匠心独具,把说谎者悖论翻写到一阶理论中,精心构造出以下语句:对于所有的y,如果D(x,y),则有¬T(y),写成公式,就有:
这个公式带有一个自由变元x,所以是一个开公式。这个式子当然有唯一的哥德尔数,可令g(A)=m。将m取代此公式中所含的自由变元x,可得一个闭项B(m)。这是一个自指语句,形如:
此式便是塔斯基定理的主角。这个式子又有唯一的哥德尔数,可令g(B(m)=n),这是一个二阶哥德尔数。我们后面且看塔斯基如何用之开阖雄辩。
4.塔斯基定理
塔斯基满怀激情地把真谓词写入一阶理论,是何等的眼光悟性,又是何等的胆气魄力。结果,却发现为这个真谓词找不到模型。也许有人会说,人家塔斯基的初衷没准儿就要做一个否定性结果呢。这种说法一般都是后话(post hoc saying)。很少有数学家上来就想做否定性结果的。哥德尔当年本来也是意欲在希尔伯特计划中建立功勋,为当时蓬勃发展的数学大厦打下稳固的逻辑根基,那是悲剧美背后的壮烈。
简而言之,塔斯基定理就是说,在一阶理论框架下,真谓词没有算术模型。其证明用的是反证法,我们还是分三步走:
第一步,用反证法,假设存在一个如前定义的模型X={Lg}Lt在X下预释为真};
第二步,既然存在一个如前定义的模型X,则X应预释Lt为真,于是应有Lg属于X;
第三步,既然Lg为Lt的哥德尔数,即Lg为B(m)的二阶哥德尔数。由前第九诀中d(m,n)的定义,则应有d(m,Lg),由此可算术定义D(m,Lg) 。可是,回忆前面刻画B(m)的条件句结构,就可推出¬T(Lg),这说的是Lt在X下不真,所以Lg不属于X。
由于以上第二步和第三步结果矛盾,可见第一步中的反证法假设不成立。也就是说,真谓词还真就在一阶理论框架下找不到模型,即真谓词是不可算术定义的。这就是世称塔斯基不可定义性定理。
塔斯基后来发展了语言层次理论,认为关于一个给定系统的真谓词是在本系统内不可定义的。也就是说,关于一个给定语言层次的真理论刻画超越了本层次规定的描述配置,需要动用更高语言层次的陈述装置力量。哥德尔与塔斯基双子定理,刀剑合璧。读来波澜壮阔,步步惊心,余味却是经典优雅,衔接无痕。哥德尔在数理哲学上主张客观唯心主义,反映了其对心智世界的本体论承诺。
我们可以找到很多词汇去赞美哥德尔和塔斯基,但有一项桂冠是属于维特根斯坦的,他是语言研究的英雄。维氏曾师从罗素,算是学逻辑出身。在哥德尔和塔斯基的巅峰年代,研究各种数理逻辑技术是那时候的潮流,这种学术文化氛围下,维特根斯坦勇敢地转向研究日常语言和人们的日常语言交流,难能可贵。我以为,维特根斯坦是心理语言学和行为主义语言学的先驱。
维特根斯坦发现,人们使用日常语言进行交流时,近乎是在做语言游戏。作为受过专业训练的逻辑学家,他当然有学术冲动去定义这种语言游戏。可是,类似于哥德尔和塔斯基的经历,他进一步发现,语言游戏居然是难以完美定义的,因为游戏要有一组规则,但对语言游戏来说,规则似有似无,似隐似现,有而不全;而在他看来,这正是语言的本质。他认为,不存在独立于语言游戏的语言。这个发现,可称为语言游戏的规则不完全性原理。这在行为主义语言学中,是一个重要的发现。
语言游戏的状态,因具体情景而变化,并因个体差异而不同。所以,在规范场论框架中语言游戏属于局域层面。哥德尔定理和塔斯基定理都是关于语言的一般化处理,不涉及语言行为的个体差异,所以,属于全局层面。我们知道,逻辑学定理是由逻辑学家创造的,所以,逻辑学家是逻辑学定理的规范势。不同的逻辑学家可以证明同一个逻辑定理,叫做“多一映射”。规范场强就是被证明了的定理。在局域层面,即在语言博弈中,对话者的心思、语言能力、表达方式、认知水平以及潜意识中的冲动强弱等,都可能是构成规范势的因素。而对话者的实际语言行为,则是规范场强。这样,哥德尔和维特根斯坦的学术路径,就被置于一个统一的规范场论四格框架结构中了。规范场论是为研究波函数而设的。其实,语言游戏的不完全规则性,说明语言游戏就是一种波函数。这层意思,将在本文第三部分中讨论。
维特根斯坦认为语言是公共的,没有私人语言。我认为,这是其语言哲学的局限性,历史原因也许是因为他的学术生命多半处在行为主义研究范式占主流地位的年代,这从他与维也纳实证主义学派的密切关系可以想见。他刚好错过了1950 年代中期兴起的认知科学革命,如果他有机会了解乔姆斯基语言习得理论,和福德后来关于思想语言的论证,他也许会再次改变其观点。
由于发现了语言游戏的规则不完全性,使得维特根斯坦的语言哲学中期带有怀疑论色彩。这里需要强调一个语言哲学上的分歧:我们习惯于以为,哥德尔是在一阶理论的语言框架下,构造了其定理,并在形式语言技术上,创造了新的语言结构,例如自指语句;但维特根斯坦认为预设一个语言框架没有意义;他认为,哥德尔定理只是哥德尔做的一个语言游戏,其语言行为本身就体现了一阶语言,而哥德尔定理是这个语言游戏活动的融贯性(coherence)内容。他甚至认为,将语言形式化的任何努力都是错误的。笔者以为,这也许过于偏激了。问题是,在维特根斯坦与哥德尔的学术论争中,两者是在做各自的两个不同的语言游戏呢,还是一个统一的游戏呢,抑或是三个游戏同时进行呢?进一步的问题是,这里涉及的是两个还是三个融贯性标准呢?另外指出,这个语言哲学分歧,是一种知识论意义下的结构性分歧,这些问题我们会在后文讨论。
维特根斯坦的学生们后来编辑出版了他晚期的笔记,此书篇幅不长,书名为《论确定性》。其中主要收集的是他关于摩尔的外部世界存在的反怀疑论证明。维特根斯坦的后期思想提出了一种反怀疑论证明。他说,怀疑一切不是一种怀疑,你只能怀疑曾经相信过的事情。在其书中提出了主观确定性的概念。这提示了语言游戏不完全是没有确定性基础的。这提供了一个挑战,我们可以找到一些将语言游戏结构化并模型化的路径吗?在下面将提供三种这样的路径,分别是狭义相对论路径、量子化路径和广义相对论路径。
在本文第一部分中,我们通过数种语言的双腿结构,解释了语言的确定性和稳定性。在第二部分中,我们通过哥德尔与塔斯基双子定理看到他们如何将逻辑语言发挥到极致,以致揭示了语言的局限性,事情好像有些悲观。正当人们为此忙于做各种哲学开脱的时候,维特根斯坦为语言研究注入了新的活力。他认为逻辑语言只是人为制造的理想语言,而日常语言的不确定性正是语言的活力所在。他提出的语言游戏不可规则化原理,正是将日常语言的不确定性视为其固有无限魅力。那么,人工语言和日常语言活动的功能区别到底是什么呢?这就要说到两者在知识论意义下的二种路径,即“知道路径”(knowing path)与“作为路径”(doing path)。
在知识论(epistemology)中,有一个柏拉图传统。它说的是,所谓你知道一条知识,记为P,意味着要同时满足三个条件:第一,P是真的;第二,你相信P;第三,你有适当理由(justifications)。如果其中有一个条件不满足,你就不能认为你知道了此条知识。所以对于一条知识的认知,只有两种模式,即知道与不知道。这个知道路径,延伸地说,也就是哥德尔的逻辑路径,考究知识的可证与否,或者塔斯基的逻辑路径,辩证知识的真与假。这条路径,如果以语言为标的,则可称为语言路径,其携带的是一种双模式知识论结构。逻辑学语言的所谓命题态度,即真值或为真或为假,是这种双模式结构一种表现。
同样在知识论的意义下,维特根斯坦关注的不是知道,而是做事,即语言行为或语言作为。他提出,语言行为,如语言游戏,会携带三种模式。假设语言游戏是有规则的,其可能行为模式有三:模式1 是指遵守规则,即事情做得正确;模式2 是指违反规则,即事情做得不正确;此外,还有模式3,指的是既没遵守规则又没违反规则,即事情做得无正确与否可言。比如,在球类比赛中,把球随便抛上抛下,再开个玩笑,就无对错可言。又如,正在考试,你去一下洗手间,与答题对错无关,也就是俗称“跑题了”。跑题言语行为其实正是言语的活力所在。天下多少新话题,科学中的多少新发现,不正是由于跑题造成的吗?这一点,用本文内容就可以说明。
哥德尔不完全性定理,缘起于试图解决希尔伯特数学计划中提出的问题之一,即数学大厦的逻辑基础协调性问题。如果哥德尔做出肯定性结果,算是对应了模式1。现在哥德尔证出了意外的结果,算是对应了模式2。那么对于解决希尔伯特问题这个语言游戏来说,维特根斯坦的语言游戏理论,在很多人看来,就应该算是跑题了。然而,我们应当意识到,维氏语言游戏理论本身对应的其实就是模式3。正是由于识别了这第三种模式,使维特根斯坦脱离了柏拉图传统,与哥德尔的逻辑路径分道扬镳。也正是由于这第三种模式,使语言游戏充满活力。这条维氏路径,讲究的是语言行为的三模式分类,以语言行为作为语言本身的本质,可称其为语言行为路径,携带的是一种三模式知识论结构。这样,我们可以清楚地看到,语言路径和言语行为路径的知识论差异首先在于两者所承诺的模式数不同,一个是二维模式空间,另一个是三维模式空间。
所谓超越维特根斯坦不是摒弃维特根斯坦语言哲学,而是在其概念框架内,说出新意来。新意之一,就是将其语言概念系统与其他概念系统,如与理论物理中的概念系统相整合,称为模型化。我们首先来理解维特根斯坦语言哲学的几个概念:第一个概念是私人语言。维氏认为没有私人语言这回事,这当然是有争论的。前文我们介绍了哥德尔不完全性定理。此定理在文献中大量记载,很多人知道或至少听说过。本文在介绍中也尽量兼顾科学的严谨性和文字的可读性,作者还有意识地穿插了一些故事语言,舒缓一下一般读者看到数学公式时的紧张感。文章是白纸黑字写下来的文稿,准备发表出来给人看的。总之,文章用的是公共语言,不是说给自己听的自言自语。因此,这里不涉及关于有否私人语言的学术讨论。
第二个概念是语言游戏。关于本文介绍哥德尔定理的内容,叙述中有无漏洞,是否精彩,这些不是维特根斯坦主要关注的事情。他关注的是,你为什么要在此文中谈到哥德尔定理。有很多文章都谈到哥德尔定理,你这文章里的上下文和别人文章里的上下文有什么不同。维特根斯坦早期管这叫“哥德尔定理”这个语词的意义,后来改称为语言游戏。这是一个极具描述力的概念,洞见深刻,视角独特,令人击节。在维特根斯坦看来,哥德尔定理就是哥德尔语言游戏的内容意义,表现了很高的融贯性标准。
第三个概念是语法。维特根斯坦的语法概念,有其特殊的含义,不是指我们通常理解的“事物的秩序”或“语言表达的逻辑安排”,而是所有规则的整体,或者说,是在语言游戏背后起支配作用的规则样态。它是以显现的方式向我们表明了它的存在,但我们在语言游戏中却无法直接感受到它的存在。这类似于我们心中的概念地图,我们无法说出为何我们会使用某个概念,但我们却可以很好地理解和使用这个概念。例如,当我们使用时间或空间这些概念时,我们无法明确指出这些概念究竟来自哪里以及意味着什么,但我们却可以很好地使用这些概念。语法概念主要用于维特根斯坦的中期哲学中,到他的晚期则主要使用“生活形式“或“世界图式”等,它们表达的是相近的意思。
任何一种语言哲学,都不会否认语言的存在及其运动。这是语言动力学的源头,称为语言荷。那么语言和语言表达到底有何异同呢?中期维特根斯坦长于辨其同,却疏于察其异,这应该与他当时对形式语言的批判状态有关。后期维特根斯坦有心察其异,遗憾的是,笔者以为,他缺乏一个理论框架使得两者可以求同存异,熔于一炉。这个理论框架在1950年代晚期出现了,那就是杨振宁的规范场论。在此框架下,可以精美地构造出语言动力学系统,其中语言是全局规范势,而语言表达是全局规范场强。说其同,两者同属全局层面。说其异,前者是规范势,而后者是规范场强。相应地,在局域层面,要考虑具体语言行为者的个体差异。一个个体的语言能力是局域规范势,而其具体的语言行为是局域规范场强。理解规范势与规范场强最一般的路径是微积分。任给一个不定积分公式,其中的被积函数是规范场强,而整个不定积分公式就是规范势。注意,不定积分公式后面都带着一个常项,称为规范自由度。这说明,从规范势到规范场强是多一映射。通过适当的微分算子,总可以消去规范自由度,例如,常数的导数为零。更多关于社会科学动力学分析的内容,我们将在另一篇文章(心理生命与理论物理之三)中专门介绍。
下面,围绕语言游戏,以理论物理为模型化方法,我们引进入三条模型化路径,分别为狭义相对论路径、量子化路径与广义相对论路径。
1.光锥和语言锥
我们在另文中对狭义相对论做过较详细介绍①在本节中,凡提到“另文”之处,均指杨英锐:《心理特征期与社会——心理生命与理论物理之一》,《科学·经济·社会》2022年第1期。,这里为方便读者阅读,再简单复习一下。狭义相对论以光速不变原理为基础,引入一个不变量。所以,在任何其他领域要应用狭义相对论结构做模型,首先要引入一个具有类光性的不变量。这里,所要引入的类光性不变量,就是语言速度。虽然维特根斯坦语言哲学研究的是语言行为,他的书也必须用德语写出来,要在世界流行,还得被翻译成其他语言,英语汉语,皆为自然语言。
言语行为,无论写作或说话交流,都是有内容的,而至少其字面内容,是用语言表达的。即使是言外之意或言下之意,也得通过字面表达或原话去体会延伸。所以语言有内容的全覆盖性,即使有些内容意境一时难以表达,也得用自然语言说些诸如“难以用语言形容”这样的表述。还记得小说《简·爱》中有一句话:“我认为自己无比幸福——幸福到无法言喻。”(I hold myself supremely blest—blest beyond what language can express.)这么精彩的表述,不也得用语言表述出来吗?在集合论中,从全集出发或从空集出发做出的公理系统是等价的。从语言的内容全覆盖性抽象出语言的可无内容性,是自不待言的概念化手法。简而言之,语言在语言行为世界具有类光性是因为其具有无内容性,正如光速最快是因为光子的无质量性。这里所谓的全内容性与无内容性,是指语言行为的字面表达,不考虑具体语境。狭义相对论的数学是闵氏空间,这是一种四维平直空间。语言的类光性是在狭义相对论的框架下说话。如果考虑具体语境,语境的变化将使语言空间弯曲,那将引领我们进入广义相对论的领域,其背后的数学是黎曼几何。
由于光速最快,可以假设它以直线传播,向四周所有方向散射。给定一个光源,其激发向下各个方向散射形成锥状,称为下锥;同理,向上散射亦成锥状,称为上锥。上下锥在光源对顶,合称光锥。以任何轨迹,穿过下锥,过对顶点,再穿过上锥的曲线叫世界线,反映了事件的局域因果性。建立了语言的类光性,就可相应地将如此这般的光锥转换为如此那般的语言锥。内容不同而理同,同的是结构。
2.语言游戏的标准与锥形
在维特根斯坦看来,语言游戏表明我们的语言活动类似于游戏一样,不存在一种脱离了游戏活动本身的语言。或者说,我们无法先假定一种语言,然后再去用这种语言去做语言游戏。相反,他认为,当我们从事语言活动的时候,如同我们从事其他人类活动一样,不过是按照规则在从事一种游戏而已。因此,语言的本质就在于语言活动,语言游戏就是语言得以存在的根据和理由。这样,任何试图把语言形式化并把语言的形式作为理解语言的方式的企图,在维特根斯坦看来都是错误的。所以,前面说到的语言锥,就应该是语言游戏锥。对语言游戏锥的要求就是要反映人们的生活形式。
我们说(不是维特根斯坦说),语言游戏锥(以下简称游戏锥)是由语言锥变通而来。所不同的是,语言锥的锥形预设了规则是完全的,而游戏锥的锥形应该是规则不完全的,这是维特根斯坦规则不完全性原理的几何版。何以如此,会在下文中解释。维特根斯坦对于语言游戏是有标准要求的,称为融贯性标准(criteria of coherence)。为叙述方便,在维氏语言哲学的演进中,语言游戏的概念是由意义的概念演化而来。所以,游戏锥其实也是意义锥。一个语言行为,何以由点而锥呢?用维特根斯坦的话说,语言游戏总是会携带着一个更大的心理游戏锥体,下锥中的事件是语言游戏的心理诱因,上锥中的事件是语言游戏的心理后果。
在另文中,我们还较详细地介绍了闵可夫斯基空间中的间隔概念,这里是其的公式定义:
给定一个游戏锥,锥内事件说明一个语言行为足以满足其融贯性标准,间隔大于零,称为类时事件,即言语行为正确与不正确都是锥内事件。锥外事件说明某语言行为不满足其融贯性标准,间隔小于零,称为类空事件。注意,维氏言语行为的第一模式和第二模式都属于锥内事件,而第三模式属于锥外事件。在锥体上的事件,说明此语言行为恰好满足融贯性标准,间隔等于零,称为空值(null)事件。在维特根斯坦看来,语言游戏总是具体的,每个语言游戏自有其不同的融贯性标准。标准不同,其游戏锥体内所能含纳的事件多寡亦不同,所以或宽或窄,其锥形无规则可言。以某语言行为做激发点,下锥是原因意义,上锥是结果意义,因果性就是两者要满足相同融贯性。一个具体的语言游戏有不同的故事因果性,且应该允许其融贯性强弱各异。
3.固有锥与拟合锥
在另文中,我们介绍过,在狭义相对论中有固有时(亦称时钟时间)的概念。固有时与速度有关,运行速度变快,则固有时相对变慢,成反比关系。固有时是个体化的,是典型的局域概念。在间隔概念的定义中,每一项都除以固有时,所得称为动量。相应地,假设每个游戏者都具备个体化的固有意义,即语言游戏中的固有融贯性标准,由此得到个体化的固有游戏锥。下面先讨论单人固有游戏锥,再讨论多人多个固有游戏锥。
语言是心智的体现,语言行为更是由心智的激发所支撑。而心智是个体化的,心智世界首先是以个体注册的,这是认知科学的常识。一个人写文章说话做讲演,都是语言行为,在维氏看来,自然是做单人语言游戏。写文章要考虑结构布局,每层意思的章节安排等,写文章,不是只写给自己看的,还有其公共意义,考虑到对读者的公共影响。这些都是更大心理游戏的内容。也就是说,写文章就是做单人语言游戏。于此,游戏者自有对其语言游戏的融贯性的独特考量。而这不是可以事先预测的。所以,单人语言游戏锥的锥形也是规则不完全的。
当人们通过语言行为讨论或交流时,就会形成多人语言游戏。维特根斯坦语言哲学假设了多人语言游戏融贯性的存在性。笔者认为,多人语言游戏的融贯性应该是诸游戏参与者个人游戏的某种函数。相应地,多人语言游戏的游戏锥形,应该是诸游戏参与者的个体游戏锥形的拟合。为什么说在言语游戏中嵌入一个锥形,就开始将其结构化了呢?我们知道,数学结构可简可繁,且越简单的结构越基本。最简单的数学结构是所谓的度规结构。例如,在三维空间中,可以定义距离的概念。它是由三个平方项相加后再开方所得。其中,三个平方项都是正的。这是因为三维空间的度规是(+,+,+),这是一个集合上被赋予的最基本代数结构。在狭义相对论中,光锥的概念是通过间隔的概念引入的。现在回去看一下间隔的定义公式中的四个项,你会发现其四维时空度规变成了(+,-,-,-)。这就是游戏锥所携带的基本数学结构。也就是说,在语言锥的心理几何结构之下,还有一个代数结构,表明言语对象之间如何进行代数运算。
如果说要将语言量子化,在概念上是有困难的。这困难其实就是要引入某种类似于语言游戏的概念。现在直接将语言游戏量子化,真是天设地造,好像量子力学是专为语言游戏量身定制一般。我们这里只讨论三种量子化结构,即非对易关系、波函数和狄拉克δ-函数。
1.非对易关系
对于一种现象,找到其中的某种非对易关系(简单说,就是不满足交换律的意思),就意味着将其量子化,学名叫正则量子化。数学中的矩阵乘法AB=BA 不成立,不满足对易关系,而满足非对易关系,所以最初海森堡量子力学又称为矩阵力学。两个语言行为,孰先孰后,显然结果不同,对顺序敏感。这里以广为人知的“20问题游戏”为例,说明何以如此。
所谓“20 问题游戏”,是个两人游戏。其中一人心里想定某事或某物,另一人通过顺序地问些“是否”类问题。比如对方心里想定的是苹果,你可以顺序地问,是用的吗,是活物吗,能吃吗,是蔬菜吗,是水果吗等等。显而易见,问题的顺序不同,离猜出是苹果的远近也会不同。所以,问题序列对顺序敏感,满足非对易关系。这样的语言游戏,当然是一种常见的生活形式。一个小孩哭了,大人会问,是饿了吗,要上厕所吗,要玩具吗,等等。最后发现,孩子就是想让大人抱抱,要的是大人的注意力和安全感。20 问题游戏具有清楚明确的融贯性标准,是典型的语言游戏。在非对易关系的意义下,语言游戏是量子化的。非对易关系,是一种代数结构。换言之,语言游戏携带一种代数结构。
2.波函数
波函数是量子力学和量子场论的基础性概念。可以说,语言游戏正可为波函数所刻画。我们以标准教育考试,例如美国SAT考试和中国的高考,来说明这一点。一个考试,相当于一个语言游戏,既是常见的生活形式,又有清晰的融贯性标准,尤其是考试的阅读理解部分,是考查考生的语言能力。在维特根斯坦看来,语言就是语言游戏,语言游戏就是语言。所以,标准教育考试是典型的语言游戏。
一个考试,无论考题内容是什么,只要考题内容是用文字给出的,并要求以文字作答,用实验心理学的话说,就叫做语言任务(verbal task)。语言任务,考察对象并不一定是,且多半不是语言能力本身,可以是推理能力、决策能力、理解能力,或任何其他能力。这些能力都是生活形式,也都有其融贯性标准。也就是说,这些语言任务,就相当于语言游戏。这些语言任务都带有自不待言的规则。从心理学的角度说,正是这些规则,区分了推理任务与决策任务。
为什么要考试呢?因为考生的能力是不可直接观测的。假设考生能力是A,考试是b,考试一道道题给出去,考生一个个答案给出来,考生能力就成为考试的一种函数,在物理学中称为波函数。量子力学研究的就是波函数的动力学状态演化。所以,这里的波函数是语言游戏携带的一种物理学结构。前面讲过,波函数的意义是其振幅;所以,这里的语言游戏又可称为振幅游戏。波函数的振幅是复数的模方,所以,这里的语言游戏还携带有数学的复数域结构。
一般地,尽量贴近维特根斯坦的概念,语言游戏是生活形式的语言化表现。这其实相当于认为,语言游戏本身就是生活形式的波函数。生活形式不是先验的,而应该是经验的。所以生活形式不是确定的,例如,没有人能预料元宇宙中所有可能的生活形式。用物理学的话说,就是对可能生活形式的观测,尤其是未来生活形式的观测,具有很高干扰度。但是,每当出现一种可表达的生活形式,就会伴随性地出现一种语言游戏。所以,语言游戏是生活形式的函数。由于在观测中具有高干扰度,用狄拉克的话说,我们所能观测到的,或可能经验的生活形式或世界图式只能是微观世界。所以,语言游戏作为生活形式的函数,只能是波函数。
3.狄拉克δ-函数
假设在考试中,每道题都有正确答案。这个正确答案叫作这道题的支撑点。用度量理论的话说,这里,一道考题把考生能力压缩成了一个点,教科书里说可以将支撑点想象成一条项链的坠子。按照冯诺依曼的说法,量子力学实验都是“是/非”类实验。设有一套实验装置和一个粒子捕捉器。当实验装置“认为”自己激发了一个粒子,如果这个粒子被捕捉器探测到了,则说这个粒子进了“是门”。如果这个粒子未被捕捉到,量子物理说这个粒子进了“非门”。而牛顿物理则说这个粒子压根就未曾被激发,实验装置不能自认为任何事情发生或未发生。这就是两种物理学之间的区别。这样的“是/非”类实验由数学狄拉克δ-函数所刻画,其公式表达如下:
注意,狄拉克δ-函数最初不是一个良定义的间断函数。当x=x0时,δ(x)=∞,可以直观地理解为,将一把尺子的所有质量都压缩到一点,好像成为一条项链。那一点上的质量被假设为无穷大。这层意思,可在数学泛函分析中找到。理论物理中的重整化方法,就是为了消去某点上可能出现的无穷大能量。这是所谓类点数学的一个局限性,也是发展弦论数学的动机之一。公式中的x0就是支撑点。注意,δ-函数由两条公式组成,第二条公式是一个积分式,意思是说,无论在认识论的意义下,粒子被激发后进了是门还是非门,在本体论的意义下,我们都要承诺粒子被激发了。这就像一个考生,无论把题做对了还是做错了,我们都承认他确实努力解题了。用西方法哲学的话说,量子力学奉行的是无罪推论原则。我们注意到,在上面的积分公式中,δ-函数成为一个被积函数,在度量理论中称为检测函数。检测函数要求存在至少一个支撑点。
按照维特根斯坦的说法,语言游戏总是伴随着一个更大的心理游戏。这个心理游戏是由生活形式转换成语言游戏的中间过程。很难想象,如果没有了各种支撑点,一个心理生命还能否延续。而如果心理生命不在了,又还有什么心理游戏可言。由此可见,作为一个命题,语言游戏,至少一大类语言游戏,携带δ-函数数学结构,简称狄拉克结构。换句话说,当语言游戏为量子力学或量子场论模型化时,它被赋予了狄拉克结构。再换句话说,狄拉克结构是语言游戏的题中应有之义。
1.语言优势与弯曲空间
我们现在暂时离开语言游戏概念。也就是说,这里假设我们没有读过维特根斯坦语言哲学,而要直接讨论我们习惯于称之为日常语言的语言。从心理学的角度说,人们的语言能力是不同的,存在着显著的个体差异。我们知道,无论是在日常生活中,还是在某些特定的场合,比如标准教育考试中,个体语言优势都是一种稀缺资源。在这个意义下,语言社会是不平等的。从几何学说,语言社会不是平直空间,而是凹凸不平的弯曲空间。广义相对论的数学背景是黎曼几何,而黎曼空间是一种弯曲空间。所以在物理学中,广义相对论被称为物理学的几何化纲领。在本节中,将应用广义相对论来讨论语言社会的模型化。在讨论中,将应用一些经济学中的概念
既然语言优势是一种稀缺资源,就会存在竞争。这是语言社会的张力。还是用维特根斯坦的话说,语言游戏总是伴随着更大的心理游戏。语言优势往往是心理优势的根源,语言劣势也往往是心理劣势的根源。有人说,语言优势是自信的底气,就是这个意思。所以,语言期是心理生命的重要体征。既然存在语言优势的竞争,语言社会就自然会涉及语言优势资源的有效配置问题,也就是要涉及效率的概念,可称之为语言经济学。这不是故作玄虚,想想中国高考和美国标准教育考试,你的神经就会紧张起来了,迅速找到一种经济感。
在福利经济学中,有一个重要的理论基石,叫做帕累托效率。意思是说,社会福利配置达到了这样一个状态,其中不能在提高某个个体福利时,而不同时降低其他个体的福利。这样的状态,称为帕累托效率状态,简称帕累托状态。帕累托状态是经济学中的一个基础性概念。它显然是一种理论上的理想状态,在现实中难以实现,也从来没有实现过。然而,无论在自然科学还是在社会科学中,模型化从来都意味着对现象的某种理想化处理。这有点像蒙眼摸象,要设法争取摸到鼻子,因为一摸到鼻子就可判断出这只能是大象鼻子而不会是其他动物的鼻子。模型化同时意味着特征化。
2.语言社会的引力
现在,让我们来构造一个语言社会的帕累托状态。考虑一个纯语言类考试,类似于美国托福或中国英语六级考试。假设考试测评是动态平衡的,即所有考生成绩加在一起的总分数是给定的。这样,如果改动任何一个考生的成绩,就不能不改变某个或某些其他考生的成绩。这就是一个帕累托福利状态,因为成绩即是福利。然后,将每个考生的成绩以任意方式连接起来(显然连接方式不是唯一的),将得到一条曲线,称其为帕累托路径。每个考生在考前或考后,都会对自己的成绩有所期待或希望有所改进,这个意向以帕累托路径上每点的切向量表示。这种切向量一般方向不同,但长度为零,因为这是帕累托状态,每个考生的成绩是不能变动的。长度为零的向量称为退缩向量(isovector)。我们说,所有退缩向量都是拟平行的,所以帕累托路径是一条最短径,几何上称为测地线。然而,考生的期待或改进意向与其在测地线上标示的成绩是有差异的。这个差异,用费曼在其《物理学讲义》里的话简略地说,就是曲率。在广义相对论中,爱因斯坦说引力就是曲率。这样,我们就在不平等的语言社会中,引入了引力概念,称其为语言引力。
语言游戏这个词组的英文是language game,game 又可译为博弈。在维特根斯坦的用法里,语言游戏没有输赢可言,没有博弈的意思。在维氏语言哲学中,语言游戏总是伴随着心理游戏。从上例中关于语言考试的分析中,我们先在语言游戏中引入博弈机制。这在逻辑上没有障碍,因为在维氏语言哲学中,语言是公共的,没有私人语言。可是,我们知道,心理是私人的。那么,如何在心理游戏中植入博弈机制呢?下面将解释,两者是通过规范变换而相互联络的。
3.规范变换与联络我们通过图1来直观地说明什么是规范变换。这张图坐落在一个称为底流形(微分几何概念)的范围内。如图1所示,区域X为个体x的语言能力邻域,区域Y 为个体y 的语言能力邻域。分别对两个单独邻域做测试没有博弈意义。从邻域X生出的竖线A 表示个体x 的心理规范势,而竖线B是个体y 的心理规范势。注意,势点a 和势点b 是不可直接比较的,因势线A 与势线B 不相交,两者之间没有数学运算可言。要在个体x 和个体y 的语言能力之间做比较,就只能在X和Y两个邻域的交集C上给一个考试。令c点表示一道考题。映射α将势点a 映射到考点c,再将其通过β逆射到势点b,使得将势点a 变换到势点b。这种变换,gαβ=αβ-1,称为规范变换。这里的考试,应该是一种较复杂的投影,其内部机制值得后续扩充讨论。
图1
以上图示及其概括解释,用的是数学微分几何中的纤维丛语言。广义相对论的数学是黎曼几何。黎曼空间是一种弯曲空间,在其上已经失去了笛卡尔平直坐标系。这就要求在每一点的小邻域上建立局域标架,还要建立局域标架之间的联络。这些内容,超出了本文范围。要点是,当在语言社会中引入竞争机制并为广义相对论所模型化时,就在语言社会中嵌入了黎曼空间结构。这些,当然已经超越了维特根斯坦语言哲学的范围。
我们在前言中说过,本文在讨论语言和语言行为的陈述中有三条脉络。第一条脉络是布尔巴基学派结构主义。本文引入了语言,特别是科学语言中的句法/语义双腿结构,涵盖了逻辑学、决策论、博弈论、集合论和规范场论。我们介绍了哥德尔和塔斯基双子定理中创造的各种精细形式结构和元数学结构。我们在对语言游戏的考察中,引入了语言锥结构以及语言游戏固有锥结构,引入了非对易关系代数结构,代数空间的度规结构,波函数与狄拉克δ-函数结构,黎曼几何局域标架结构,规范变换的纤维丛结构。尤其重要的,是规范场论的双层双级四格结构。
第二条脉络是应用理论物理对语言和语言行为的模型化。第一,我们发现了语言的全局性和语言行为的局域性,从而建立了两者统一的规范场论模型。第二,在假设语言无内容性的条件下,我们对语言和语言行为分别做了几何锥化处理,从而建立了语言与语言行为的狭义相对论模型。第三,我们发现了语言行为的非对易关系,语言游戏的波函数本质,以及对语言行为公共观测的狄拉克结构。在此基础上,我们引入了语言和语言行为的量子化模型。第四,引入了语言优势的概念作为稀缺资源,注意了语言社会的不平等现象,从而将语言社会做了弯曲化处理。在语言游戏中引入竞争机制和帕累托效率,进而定义了弯曲语言社会的曲率和引力。于是,引入黎曼几何中的局域标架与联络成为题中应有之义。这是语言社会的广义相对论模型。
第三条脉络是维特根斯坦语言哲学的变迁与发展。首先,我们注意到了早期维特根斯坦对语言,尤其是形式语言规则化的追随与训练。其次,我们还注意了中期维特根斯坦的挣扎与求索。从对形式语言的哥德尔不完性定理,悟到了语言游戏的规则不完全性原理。从语言行为提炼出语言游戏的概念,是天才的神来之笔。进而,我们注意了后期维特根斯坦对主观确定性的回归,及其对语言游戏规则化的追求与信仰。最后,在语言游戏和生活形式的概念转换之间,他终于在其世界图式中找到了心理游戏不可或缺的位置。这样,维特根斯坦就为我们蹚出了语言和语言行为的心理化路径。
一个多世纪前,希尔伯特的理想是为数学大厦构筑坚实的逻辑基础,半个多世纪前,爱因斯坦的理想是为四种自然力建立统一场论,笔者的理想是凿穿社会科学与自然科学尤其是数学物理之间的壁垒,架设两者之间的桥梁,为知识生命追求更美好的生活。经过努力,这个理想正在逐步实现。
致谢:江怡教授曾为本文涉及维特根斯坦部分提供中肯意见和有益讨论。作者在美国伦斯勒理工学院的课程中讲授过本文内容,也感受到学生的鼓励。作者感谢匿名审稿人专业中肯的修改建议。