曾 量
(北京大学 数学科学学院,北京 100871)
从中文屋谈句法与语义的一致性
曾 量
(北京大学 数学科学学院,北京 100871)
句法与语义的关系在语言学研究与对于人工智能的哲学思考等方面占有重要地位。从著名的中文屋实验入手,通过探讨语言系统在完备化条件下句法与语义的关系,证明反映句法与语义一致性的定理;反驳“句法不足以确定语义”的观点,并由此反驳由中文屋实验推出的“强人工智能不存在”的结论;最后对定理的应用进行探讨。
中文屋;句法;语义;一致性;人工智能;悖论
“中文屋”是约翰·塞尔于1980年提出的思想实验,用于反驳“人脑是一台数字计算机,人心是一种计算机程序的观点”。在本文中,我们重点关注其论证前提中与句法相关的一条。
1.实验内容
“设想一个完全不懂中文、母语为英语的人被锁在房间里,房间里装满了中文符号箱(数据库)和一本操作这些符号的指令手册(程序)。设想房间外的人递进来其他的中文符号,它们是用中文书写的问题(输入),但房间里的人并不知道。再设想房间里的人遵照程序中的指令能递出一些中文符号,它们是这些问题的正确答案(输出)。这个程序使房间里的人能通过有关理解中文的图灵测试,但他对中文一窍不通。”[1]
2.与句法与语义的联系
在《悖论研究》中,陈波对中文屋论证的逻辑结构的转述中有如下一条,作为论证的前提之一:
“P2:句法不足以确定语义。(这是一个概念真理,它明确了我们关于纯形式的和有内容的概念的区分。)”[2]276
这一条前提(按《悖论研究》中的编号,我们在接下来的讨论中称其为“P2”)及紧接其后的括号中的解释,在我看来,在中文屋问题中是不恰当的。
在中文屋这个思想实验中,为了对应于“程序”等计算机概念,我们需要合适地确定句法与语义的概念,且这种概念应该是对所有语言系统通用的,不应依赖于句法与语义所在的具体语言系统是中文、拉丁文或者其他语言。
《悖论研究》中有如下的论述:“程序是纯形式的(句法的);人的心灵有心理内容(语义的)。”[2]277以此为限制条件,我们可以如下规定句法与语义:
在一个语言系统中,句法是该系统中所有字符及字符串的操作规则,操作包括输入、查找、替换、连接、删除、输出等。例如,“吃饭”可以看作“吃”与“饭”的合法连接,对“你是谁?”的回答可看作经过一系列替换后对中文屋内置数据库中“我”的查找、替换与输出。而语义则是系统中的字符及字符串与认知中概念的对应。例如,“馒头”的语义仅仅是对应于现实生活中的某种食物,而“吃”可以与“馒头”连接是属于句法而不属于语义的内容。
此种定义明确反映了句法对形式的决定性与语义对内容的决定性,从而恰当地体现了“中文”在“程序”与“心灵”两个层面上的区别,因此在中文屋的论证中是恰当的。
在此种定义下,P2相当于认为形式结构不足以唯一确定一个语言系统的语义。例如对于中文,P2认为可能存在一个系统,它的句法与中文一模一样,在某些词的语义上与中文存在分歧。
对于不完备的语言系统(这里的不完备系统指,存在此系统无法描述而其他系统可以描述的概念的系统),这确实是可能的。例如,只有一个词“甲”表示存在,只有仅用“甲”表示“甲”这一条的语义的语言系统;而在另一个语言系统里面,只有一个词“乙”,只有仅用“乙”表示“乙”这一条语义的语言系统。这两个系统句法结构一致,或者用抽象代数来说,这两个系统在句法意义上同构,但所指是不同的。这种不同需要在同时包含“甲”与“乙”的系统(如中文)中才能甄别。
虽然我们要讨论的“中文”如果指现实生活中的中文,那有可能属于这种不完备的语言系统,从而可能存在中文不能描述的概念(正如“甲”系统中无法描述“乙”),于是有可能通过概念的同地位替换等手法来满足P2,但是现实中中文的这些缺陷,是不影响中文屋实验的。
在中文屋的实验中,一个关键是房间里的人对中文的理解问题,而中文无法描述的概念在这个关键的范围外,从而无法影响这个实验及其涉及的讨论。我们应该明确的是,在此实验范围内,P2中指的语言系统可以认为是完备的。在下面的讨论中,我们只讨论完备的语言系统。
对于此完备的系统L,我们设其字符串集为W,W的幂集记为PW,句法函数集为G,语义函数为h,而C中的每个句法函数把PW中的一个字符串集映射成W中的一个字符串,而每个语义函数把W中的每个字符串映射成认识中的某个物体或事件,同时把语言系统中的句法变成人的认识里的事物关系。
考虑P2,我们需要考虑两个语言系统间的“句法同构”映射,对语言系统L=(W,G,h)与L′=(W′,G′,h′),我们可以把某个句法同构映射 f 定义为从L到L′的一一映射,包括字符集间的一一映射与句法函数集间的一一映射两个映射分量,且满足如下条件:
对任意s∈PW,s′∈PW′,g∈G,g′∈G′,若满足 f(s,g)= f(s′,g′),则g(s)在 f 的字符串分量映射下对应于g′(s′)。
这个定义意味着“句法同构”映射不会改变建立在句法函数上的字符串间关系,存在句法同构映射的两个系统因此可以视为拥有同样的句法,我们也说这两个系统是句法同构的。
接下来我们要证明:
句法与语义一致性定理:若语言系统L=(W,G,h)与L′=(W′,G′,h′)是句法同构的,对于L中的字符串w与句法函数g,与其在句法同构作用下L′中的字符串w′与句法函数g′,都满足h(w,g)=h(w′,g′),满足此等式的两个系统记为语义同构的,易知这个由等式定义的同构是等价关系。
此定理是说句法同构不会改变语义函数的象,也就是说,相同的句法确定相同的语义,语义与句法一致,从而反驳了P2。
为了证明“句法与语义一致性定理”(下面简称“一致性定理”),我们还需要用到一条公理:
公理:没有“真正的同义词”。或者说,没有多个词是彼此同义的但它们合起来不能被整体替代而不影响原先语言系统的句法函数与语义函数。
注:这里的“真正的”,不仅指表面的词义,还指此词的方方面面。事实上,不同的字符串对应于不同的概念,即使是所谓的“近义词”“同义词”“异形词”,字形或拼写的不同也联系着其在用法、使用频率、历史渊源、传播途径方面的不同。再退一步,即使存在“真正的同义词”,我们可以将它们“捆绑”在一起,将这些词合在一起看作一个新词,来代替原先那些词,此时,新词与旧词无论在句法还是语义上都保持一致,语言系统没有实质性改变(可能符号会变化),但是取代旧词后该词没有“真正的同义词”。即使存在所谓的“真正的同义词”,我们可以通过替换让其不再有“真正的同义词”,并且不会损害到原语言系统中的句法与语义。因此,此公理是合理的。
以下是对一致性定理的证明过程:
我们来考虑最特殊的语法系统,即人的认识,记为L0=(W0,G0,h0)。
在L0中,所有的概念或事件作为字符串,表示它们本身,即h0是一个恒等映射。
首先,对语言系统L=(W,G,h)与L′=(W′,G′,h′),假设它们是句法同构的,由于我们已经约束了其在本问题中的完备性,没有在讨论范围内却无法被描述的认知概念,因此h与h′都是满射。另一方面,由于“没有‘真正的同义词’”,它们是单射,是一一映射。
其次,语言系统需要能够描述认知,于是句法需要与认知中事物的关系相协调,也就是说,h与h′把L与L′映射到L0不改变建立在句法函数上的原字符串间的关系。
假如这种关系改变了,不妨设在h的作用下,L与L0中句法关系是不同构的,则L中至少存在两个字符串,它们之间的关系与L0(即人的认知)中对应的概念之间的关系不同,这说明这个语言系统与人的认知不一致,难以正确表达人的认知,与本文中严格的“语言系统”定义相矛盾。因此,h是L映到L0的句法同构。
同理,h′是L′映到L0的句法同构。
于是,h与h′是映到L0的两个句法同构,同时由于h与h′是语义函数,因而这两个句法同构同时也是语义同构,从而L与L0这两个系统满足一致性定理,它们语义同构,而L′与L0也是如此。由于语义同构这种等价关系的传递性,L与L′语义同构,证毕。
注:根据此定理,句法在满足一定条件的情况下在语言系统中可以完全确定语义,并且相同的句法在相同的条件下确定相同的语义,而中文屋问题中的“中文”与“人的认知”作为两个语言系统满足一致性定理的条件,从而P2,即“句法不足以确定语义”在中文屋问题中不成立。反驳成立。
对于一致性定理在现实生活中的表现,我们先举一个数学上的例子。
数学中,我们用皮亚诺公理系统中的5条公理来定义自然数,例如根据定理定义的自然数0,事实上与空集是同一事物,只是用于不同方面时往往不会注意到这一点。就拿0来说,在数学这个语言系统中,0满足许多性质,而且满足所有这些性质的只有0。那么,当我们有一个“数学房间”,对于向这个房间中输入的数学信息中所有的“0”,在房间中对其进行的所有的操作与变换都需要满足0在数学中满足的所有规则与性质;一旦有一条规则不满足,则输入判断该条规则是否满足的命题时会输出不同于数学语言系统规范的答案。
现在我们关注0的意义。上一段的讨论翻译成定理中的符号:对于数学语言系统L=(W,G,h)与“数学房间”语言系统L′=(W′,G′,h′)中,对于任意g∈G与对应的g′∈G′,h(g(0))=h′(g′(0′)),这意味着在房间内外,“0”的意义在同构的意义下是相同的。对于其他的数学概念,也是同样的道理,即性质(也就是句法)决定对象(也就是语义)。
根据一致性公理,要研究一个对象,只需要关注其结构以及它与其他对象的联系即可。事实上,在这种“形式决定内容”思想的指导下,当今的数学已经发展出范畴论(作为实变与泛函等抽象理论的进一步抽象,被称为计算机的前沿科学)这种抽象地处理数学结构以及结构之间联系的数学理论,并且凭借这种理论解决了软件设计等领域中的许多问题。研究范畴就是试图以“公理化”的方法抓住在各种相关连的“数学结构”中的共同特性,并以结构间的“结构保持函数”将这些结构相关起来。这种只关注“数学结构”这种句法的理论无需担心因为“忽视”语义而后院失火,其实就是一致性定理的功劳。
1.对中文屋问题本身
在中文屋的情景下,此定理说明句法足以确定语义,而整个中文屋本身作为一个整体是知道中文的句法的,于是它可以利用此句法唯一确定中文的语义,从而理解中文,于是我们虽然不能说中文屋里的人会中文,但我们可以说中文屋是会中文的。
2.与人工智能的联系
常见的观点认为,中文屋实验是反驳强人工智能可行性的有力论据,因为在“句法不足以确定语义”的“前提”下,中文屋只知句法而不知语义,从而无法理解传入屋中的句子的意思,于是不是强人工智能,这说明程序本身不是心灵。
对于这种观点,根据我们的一致性定理,“句法不足以确定语义”是不对的,所以论证是不成立的。在此基础上,强人工智能仍然具有可行性。我们只需要通过对某个语言系统不断的研究,挖掘出语言内部结构输入程序,或是使程序能够通过某种学习或训练过程逐渐掌握这些结构与关系,则程序就能通过这些结构与关系实现对整个语言系统的理解。而做到了理解,也就是给人工智能赋予“心灵”,实现了强人工智能。
3.与其他学科领域的联系
延伸开来,在特定条件下(如中文屋条件),结构决定内涵的规律不止限于语言系统。比如在编程时,不同的代码只要是实现的同样的数据结构,就有着一致的功能。在数学的各个领域都存在同构,同构刻画的就是各个数学系统在结构上的相似性,同构的数学系统被视为等价的。此外在物理上,有较成熟理论将各种粒子视为时空结构的涟漪,并且从时空结构的角度给出了许多物理现象的解释,如广义相对论中用时空结构扭曲解释了牛顿时空观下不能解释的引力“异常”现象。这一切都说明了结构的本质性。
一致性定理虽然可以确定句法在语言系统中的决定性地位,但在应用上仍具有一定的局限性,体现在如下两个方面:
1.使用条件苛刻
一致性定理中的语言系统需要具有完备性,或者说至少可正确描述在人类认知范围内的事物,这种语言在中文屋实验中能够找到,即实验中的中文“理想版”——一种描述能力上几乎无所不能的语言,但现实生活中是难以见到的。现实生活中的语言,就拿中文举例,往往存在难以正确描述的事物或句子,例如《哈姆雷特》中的名句“To be or not to be:that is the question”,朱生豪将其翻译为“生存还是毁灭,这是一个值得考虑的问题”。这种翻译广为流传,但被指出并不是完美的翻译——这是因为在英文中“be”有多种意思,因此这句话有多种符合上下文的翻译方法。但是,目前还没有出现受到广泛认同的能完全表达作者原意的版本——这是由于文化背景、语言习惯、用词等差异导致了中文在此句话上完备性的缺失。又如《道德经》中所说的“道可道,非常道;名可名,非常名”,一种解释是:道是可以说出来的,说出来的却不是永恒的道;万物是可以去命名的,但却不是万物永恒的名。也就是说,在这种解释下,“道”这个概念破坏了中文的完备性。而事实上,我们现实生活中存在的语言,确实都在表达上存在一定偏差,从而无法严格满足一致性定理的条件。即使是数学语言与形式逻辑语言这种极端严格化的语言,也无法避免哥德尔不完备定理的限制,常因保持自洽性而牺牲了完备性(相对于包含了初等数论的那些语言系统)。
2.结论过于理论化
在一致性定理中,我们由两个语言系统句法的同构推出了其语义的同构,而语义的这个同构是依赖于两个语言系统各自的语义函数的。但是,这两个语义函数或者他们的反函数在现实生活中的语言系统中是表现得不明显的,因为在现实生活中,一个字符串因为歧义、引申义之类现象,往往不是与一般理解的“语义”一一对应,而是与包含多个相互关联的“语义”的“语义集”一一对应,例如“头”对应于{“人最上端的身体部位”“首领”等},这种对应在实际操作中是复杂而难以全面掌握的。因此,从这些语义函数中推出系统间语义同构仅仅在理论上是可行的,在实际应用中却有着操作上的困难,这是难以避免的。
一致性定理是对于两个语言系统的定理,这个定理对于多个语言系统也是适用的,只需要对这些语言系统两两使用一致性定理即可。除此之外,此定理还可推广到更大的范围内——我们注意到,根据定理的论证,一致性定理的成立依赖于3个条件:
(1)对于语言系统,我们需要句法集的同构。推广来说,需要所讨论系统内部结构函数群的同构。
(2)对于语言系统,需要句法函数与语义函数的交换性,即语义函数与人的认知的句法函数的复合等于人的认知的句法函数与语义函数的复合。推广来说,即所讨论系统的标准输出与基准系统的内部结构函数的复合等于所讨论系统的内部结构函数与所讨论系统标准输出的复合。
(3)对于语言系统,要满足没有“真正的同义词”这一公理。推广来说,即系统内部没有无法辨别但需要辨别的概念。
于是,满足上述3个条件的系统便可利用本文中的证明逻辑证明其标准输出与系统间的句法同构映射是可交换的,即满足一致性定理。
举个例子,计算机系统。无论计算机有何物理化学基础,无论是普通的数字计算机,还是DNA计算机,又或是量子计算机,只要它们内部储存与计算架构彼此同构,标准输出被控制使得表现一致,结合计算机本身对概念判断的确定性,则可得出它们满足推广了的一致性定理,即它们作为计算机系统有着同样的功能。这说明,从本质上来看,计算机系统的功能由其抽象结构决定,尽管各种抽象结构在实现可能性上依赖于物理化学实在,比如量子计算机利用量子物理学中的成果使得存储单元可以存储特殊的叠加态(这是一般的数字计算机在物理层面上无法达到的结构优势),但在结构已经确定、标准输出也调试为符合人的认知的情况下,再在这些条件不改变的情况下改变实现计算机的物理化学实在,是不会影响计算机的功能的。
在这个观点下,将大脑看作一台图灵机,如果我们可以成功模拟某人大脑的结构,同时调整好对“模拟大脑”输出的识别,则这个“模拟大脑”在功能的层面上与该人的大脑没有区别,若该人换上此“模拟大脑”,则排除掉因为外观、重量、身体的排异等非思维因素的影响的话,该人的思考、决策、对外界的反映、对自身的认识等方面不会有任何变化。同时,假如“换脑”猜想能够实现,则人类可通过对“电子脑”的维修与替换来延长自身意识存在时间,同时因为电子脑可以与机械更好的对接,人类甚至可以把自身身体也用机械替代,使得先天或者后天残疾或患上绝症的人不至于只能迎接一个遗憾的人生。
这种想法自然会带来自我认同等伦理问题,这时就是一致性定理出场的时候了。我们已经将一致性定理从语言系统旁推到计算机系统,而自然也能推广到人脑,乃至整个人。一个人在物理与化学实现改变前后作为两个系统满足前面讨论中3个条件中的前两点(即结构与语法),而只有第三点存在疑问——类似于忒修斯之船的辨别问题。所以,我们需要减弱定理的结论来应用,此时我们要讨论“最大完备”的人,即人这个系统的认知中,最大的完备子集(因为空集完备,全集不完备,物理基础导致人的认知结构基础是原子性/量子性而非连续型,因此“最大完备”子集存在)。这个“最大完备”的人是满足一致性定理的各种条件的,因为其完备性使得其认知中不存在没有意义(指在语法函数的映射中找不到原像或有多个原像等,而不是指没有“现实意义”)的问题,于是在“换脑”或者“换身体”等对自身的结构同构的改动下,这个“最大完备”的人没有改变。一致性定理向他/她保证:在任何有意义的认识上,就其判断推理等思维过程和对外交互过程而言,这个人没有改变。但是,一致性定理的局限性也在这里体现出来:类似于忒修斯之船,这类没有结构上有严格可辨别标准的解决方案的问题在现实中具有一定的实际意义,不过一致性定理无法保证人在进行物理或化学上的“非抽象结构性”的改造前后在这类问题上保持一致,这虽然可以解决一部分自我认知问题,却难以彻底解决。或许这意味着大脑的“不可复制性”,或许更有可能的是:这意味着一致性定理可以进一步发展。篇幅有限,本文不再继续探讨。
[1]SEARLEJ.ChineseRoomArgument[M]//TheMITencyclopediaofthecognitivesciences.Cambridge,MA:MITPress,1999:115.
[2] 陈波.悖论研究[M].北京:北京大学出版社,2014.
(责任编辑 张佑法)
Research on the Conformity of Syntax and Semantics Based on the Chinese Room Argument
ZENG Liang
(School of Mathematical Sciences, Peking University, Beijing 100871, China)
The relationship of syntax and semantics is of vital importance in study of linguistics and the philosophical thinking about the artificial intelligence. This article is an attempt, based on the Chinese room argument, to prove the conformity of syntax and semantics by a discussion of the relationship of these two when the linguistic system is in its theoretical perfection. The objective of this attempt is to refute the viewpoint that syntax is not sufficient to determine the semantics and the conclusion of the inexistence of a “strong AI” set forward by the Chinese room argument. The application of this theorem will be given in the end.
the Chinese room argument; syntax; semantics; conformity; artificial intelligence; paradox
2017-02-07 作者简介:曾量(1996—),男,重庆人,研究方向:计算数学。
曾量.从中文屋谈句法与语义的一致性[J].重庆理工大学学报(社会科学),2017(3):25-29.
format:ZENG Liang.Research on the Conformity of Syntax and Semantics Based on the Chinese Room Argument[J].Journal of Chongqing University of Technology(Social Science),2017(3):25-29.
10.3969/j.issn.1674-8425(s).2017.03.005
B81
A
1674-8425(2017)03-0025-05