黑格尔“逻辑学”对人工智能的启示

2018-11-24 01:26徐英瑾
复旦学报(社会科学版) 2018年6期
关键词:逻辑学谓词黑格尔

徐英瑾

(复旦大学 哲学学院,上海 200433)

一、 导 论

按照一般人的理解,作为一门与逻辑学、统计学等学科有着密切关系的综合学科,“人工智能”(Artificial Intelligence, 简称AI)应当在精神气质上更接近于同样重视逻辑分析的分析哲学,而不是欧陆哲学。但多少具有一点讽刺意味的是,使得“人工智能哲学”(Philosophy of Artificial Intelligence)这个学术分支得以在英语世界确立的两位重磅级思想家——德瑞福斯(Hubert Dreyfus)与郝格兰(John Haugeland)——其实都主要是欧陆哲学背景的,尽管两者对于分析传统也并不陌生。特别是德瑞福斯,他从海德格尔的角度重新梳理AI的研究路数,已在西方学界催生出了一个叫“海德格尔式的人工智能/认知科学”(Heideggerian AI/cognitive science)的研究路向,并衍生出大量相关研究成果。[注]相关作品有:H. Dreyfus, What Computers Still Can’T Do (Cambridge, MA: The MIT Press, 1992); J. Haugeland (ed), Artificial Intelligence: The Very Idea (Montgomery: Bradford Books, 1985); J. Kiverstein and M. Wheeler (eds.), Heidegger and Cognitive Science (London: Palgrave, Macmillan, 2012).这样的研究方式自然也促进了整个现象学与认知科学之间的互动,并使得“现象学的认知科学化”成为最近三十年来西方哲学界最让人激动的发展趋势之一。[注]这方面的代表作品有:F. Varela, The Embodied Mind: Cognitive Science and Human Experience (Cambridge, MA: The MIT Press, 1992); E. Thompson, Mind in Life: Biology, Phenomenology, and the Sciences of Mind, (Cambridge, MA: Belknap Press, 2010); J. Petitot, et al. (eds.), Naturalizing Phenomenology: Issues in Contemporary Phenomenology and Cognitive Science (Stanford, CA: Stanford University Press, 2000). S. Gallagher & D. Schmicking, eds. Handbook of Phenomenology and Cognitive Science (Dordrecht: Springer, 2010).

然而,相比海德格尔与其他现象学家而言,同样作为欧陆哲学大师的黑格尔却几乎受到了人工智能哲学家的集体忽视。譬如,在人工智能哲学方面的另一位领军人物玛格丽特·博登(Margaret Boden)女士所撰写的厚达1631页的认知科学史巨著《作为机器的心灵》[注]M. Boden, Minds as Machine: A History of Cognitive Science (Oxford: Oxford University Press, 2006).的“人名索引”中,“黑格尔”的名字仅仅被提到1次——与之相比较,同样作为欧陆系哲学家的康德则被提到5次,海德格尔被提到3次,梅洛-庞蒂被提到8次。有人或许会说,黑格尔之所以被忽视,是因为他文风晦涩,难以被后世的AI研究者理解;而他对于辩证逻辑的推崇,也使得崇尚“知性思维”的AI专家们唯恐避之而不及。不过,若再仔细一想,其实这样的理由未必就非常站得住脚,因为就文风的晦涩度与就对于“知性思维”的批判力度而言,海德格尔哲学比黑格尔哲学其实是有过之而无不及。另外,从某种意义上说,黑格尔对于自然科学的友好程度,其实比海德格尔还略胜一筹。[注]譬如,黑格尔的《自然哲学》充分表明了他对于当时科学发展最新情况的熟悉程度(尽管这也是一部引发很多争议的作品),而海德格尔却缺乏一部与黑格尔《自然哲学》相对应的富有经验科学内容的作品。在这样的情况下,在讨论传统欧陆哲学与AI关系时排除黑格尔的做法,就显得多少有点怪异了。

而在笔者看来,黑格尔之所以被主流的AI哲学专家所忽略,仅仅是基于一个非常偶然的事实:即使在全球范围内,同时了解黑格尔哲学与AI发展的文理复合型人才也是相对缺乏的。在这方面,海德格尔之所以比黑格尔更容易得到大家的垂青,也是基于如下这样一个同样非常偶然的事实:德瑞福斯与郝格兰在转向AI哲学研究之前,就已经是海德格尔哲学研究方向上的优秀专家了。换言之,倘若在另外一个可能世界中,德瑞福斯与郝格兰在转向AI哲学研究之前首先研究的就是黑格尔哲学的话,那么,也许目下笔者就需要为“为何海德格尔在AI哲学研究中受到歧视”这一“现状”而鸣不平了。

读者或许还要问:既然我们已经有了“海德格尔式的AI”研究了,我们为何还需要一种“黑格尔式的AI研究”来画蛇添足呢?难道后一种研究进路能够提供前者所不能够提供的某种新视角吗?

对于上述疑问的回答乃是肯定的。概而言之,黑格尔哲学与海氏(即指海德格尔,下同)哲学虽然在表述的晦涩性上彼此相近,却在哲学内核上有所分别。大体而言,黑格尔哲学是一种基于概念表征之间关系的“概念型哲学”,而海氏哲学则是一种探讨概念关系之下的现象学根据的“前概念型哲学”。因此,海氏哲学更容易与认知科学中对于“具身性”(embodiment)问题的讨论发生亲缘关系,而黑格尔哲学则与传统认知科学或AI中的“符号主义纲领”具有更多的可类比性。若从AI研究自身的学术分工角度看,黑格尔哲学与“知识表征”、“日常推理”、“自然语言处理”等分支关系更为密切,而海氏哲学则与“计算机知觉”、“非确定环境下的推理”等话题更为相关(尽管这些研究议题之间的分界线有时候并不是那么清楚的)。这也就是说,如果我们认为“知识表征”、“日常推理”、“自然语言处理”等分支依然是AI研究的核心话题之一的话,那么,黑格尔哲学就具有某种海氏哲学所无法取代的价值。

读者或许还会问:既然我们需要黑格尔哲学为目下的人工智能发展“把脉”,这就预设了当下的人工智能研究的确是出现了某些需要从哲学角度加以把握的重大问题。那么,到底是什么问题需要我们请出黑格尔哲学呢?

这个问题就是“框架问题”。

二、 让人讨厌的“框架问题”

众所周知,美国哲学家塞尔(John Searle)在经典论文《心智、语言和机器》[注]J.Searle, “Minds, Brains, and Programs,” Behavioral and Brain Sciences 3 (1980): 417-424.中区分了“强AI”与“弱AI”这两个概念:前者指的是一个真正具有人类心智能力的计算机器,而后者指涉的仅仅是能够模拟人类心智能力的计算机器。塞尔进一步认为“强AI”是不可能实现的,因为任何一台计算机器都只能够在“句法层次”(syntactic level)上规定机器的运作,而无法由此达到智能活动所必然会牵涉到的“语义层次”(semantic level)(在塞尔的语境中,形容词“句法的”几乎同义于“机械的”,而不仅仅取其在语言学领域内的意义)。

笔者认为塞尔的观点具有部分的真理,也具有部分的谬误。具体而言,诚如塞尔所言,“语义落地”问题的确是人工智能研究的一个核心问题,而目下AI学界对于该问题的主流处理方案的确不算高明(详后)。但笔者却无法赞同塞尔所给出的如下终极审判——“未来的AI将永远无法具有一个能够理解语义内容的人类心智系统”,因为塞尔赖以支持该终极审判意见的论据(即所谓的“汉字屋思想实验”)本身是站不住脚的。[注]限于篇幅,笔者不在此详细讨论这个论证为何不对。请参看拙著《心智、语言和机器——维特根斯坦哲学与人工智能科学的对话》(人民出版社2013年10月出版)第三章。而且,塞尔对于AI的这种悲观态度,在相当程度上也会使得人类智能在演化历程中的出现成为了一件难解之事。换言之,如果“随附式物理主义”是对的话,那么我们就难以按照塞尔的理路来解释,为何人类神经元的机械运作能够在高层面催生语义智能呢?[注]对于这个问题,塞尔本人在其《心灵导论》(徐英瑾译,上海人民出版社2008年版)中提出了一种叫“生物学自然主义”的解释方案。根据这种解释方案,人类大脑的特定的生化反应能够引发智能,而人工编程的硅基体则无力达到这一点。但笔者认为这个观点的表述有“乞题”(begging the question)的嫌疑,也就是说,如果没有来自“汉字屋论证”的外部支援,这个观点本身只是在表达一种态度而已。

那么,我们又该如何在回避塞尔的“汉字屋论证”的情况下,更为恰当地表达出对于所谓“语义落地问题”的理论忧虑呢?

一种更为合适的表达路径是“框架问题”(frame problem)。[注]对于框架问题的一个比较技术化的介绍,请参看《斯坦福哲学百科全书》的相关词条:M. Shanahan, “The Frame Problem,” The Stanford Encyclopedia of Philosophy (Spring 2016 edition), Edward N. Zalta (ed.), (2016).URL=.对于该问题的一种非技术化的表达便是:一个AI系统在给出某个操作的时候,它又该如何自动确定其中的某些操作(如住在上海的张三按下传真机的按钮这一操作)不会导致某些后果(如住在墨尔本的琼斯的小狗的心律之波动)的发生呢?这个问题在实践上之所以具有重要意义,乃是因为如下张力的存在:一方面,任何一个智能体都应当能够对其做出的任何行为的后果进行预估,由此进行“趋利避害”(否则其表现就不足以体现真正的智能);另一方面,它又必须能够将那些明显不相关于当下决策或行为的“非后果”(non-effects)明确排斥出当下的考虑行为,以加强决策的效率(否则其行为依然不足以表现出足够的智能)。而依据此方式被理解的“框架问题”,则可以被抽象为如下形式:编程者该如何设计智能体,才能够使其在进行趋利避害的考量中,尽量避免过多地考虑不相关的事项,以此提高其整体行为效率呢?

而对于“框架问题”的上述抽象形式,显然已经涉及了“语义相关性”这个奠基于“语义内容”之上的复合概念。这也就是说,框架问题恰恰是以它自己的方式,切中了塞尔所提出的那个原初的哲学问题:计算机在句法层面上的机械操作是如何规定出那种超越于机械运作的语义内容的呢?很显然,如果塞尔对于整个“句法—语义”关系的消极判断是正确的,那么从原则上说,框架问题本身也应当是无解的,而这一点本身似乎就足以宣判强AI的死刑。

不过,正如笔者不相信“汉字屋思想实验”足以宣判强AI的死刑一样,笔者也不相信“框架问题”足以宣判强AI的死刑——尽管从经验角度看,该问题对于目下主流AI研究的挑战的确是足够强大的。非常粗略地说,框架问题对于符号AI进路的挑战就在于:除非编程者事先以“框架公理”的方式,手动输入关于“何事与何事不相关”的信息,否则系统本身是无法自行判断“何事与何事不相关”的。而即使手动输入“框架公理”的做法勉强可行,这一做法又会带来如下深层次困难:能够与“何事与何事不相关”的信息所对应的可能的框架公理数量乃是无穷多的(譬如,既然你能想到喝豆浆与读黑格尔不那么相关,那么你就能再想到吃羊腰子与读海德格尔也不那么相关,由此,你也就能再联想到无数个“非相关项”)。在这种情况下,要么编程者自己会因罗列这些无穷无尽的框架公理而苦不堪言,要么系统本身也会因为逐一检索这些框架公理而变得不堪重负。甚至对于貌似比符号AI更为“先进”的人工神经元网络技术(以及作为其“进化版”的深度学习技术)来说,“框架问题”也是一个难解的问题。其背后的道理乃是:即使一个深度学习系统能够通过海量的语料学习建立起了一个所谓的“向量空间模型”(Vector Space Model)[注]这个技术路线的最早期的代表文献是:G. Salton, A. Wong, and C. S. Yang, “A Vector Space Model for Automatic Indexing,” Communications of the ACM 18.11 (1975): 613-620., 并通过这个模型来使两个语词之间的“语义距离”的度量成为可能,如下问题也会阻挠这样的模型成为一种对于“框架问题”的有效解决方案:由于我们人类具有从简单词项构造出无数个复合词项的能力(比如从“糕”出发构造出“一块热腾腾的粢饭糕”的能力),一个针对所有的词项(包含复合词项)的“语义向量空间模型”在原则上便是无法被构建出来的。而一种被勉强构建出来的语义空间模型,则也会因为忽略了复合词项的存在,而无法计算出两个新出现的复合词项之间的语义距离。而出现这种情况的深层次原因则是:深度学习机制在骨子里就是一个统计学系统,而所有的统计学系统(无论是贝叶斯网络还是神经网络)其实都只能“由旧揣新”而无法“推陈出新”——因此,如果系统所面临的新的复合词项在学习语料库中未曾出现过的话,系统肯定就会变得手足无措。反过来说,如果这样的系统要学会人类“推陈出新”的语言构造能力,它就必须理解语言中基本范畴的使用规则——而这种能力却又恰恰是基于统计学的整个运作机制所无法涵盖的(因为规则自身的权威性并不能被还原为相关表达式出现的统计学频度)。

但以上说的这些,与黑格尔又有什么关系呢?

从表面上看来,“框架问题”的存在,似乎并不能够证明在AI研究中引入黑格尔哲学思想资源的必要性,反而能证明黑格尔哲学的无力性。相关理由如下:正如前文所指出的,解决框架问题的要害,乃在于如何使得系统在处理当下问题时不涉及知识库中过多的事项,以便提高系统的运作效率。因此,这种解决方案肯定包含着某种“做减法”的要求。然而,黑格尔哲学给人的印象却是“整体主义”,也就是那种从所谓的“感性确定性”中牵扯出整个“绝对知识”的宏大叙述风格。要向这样的哲学寻找“框架问题”的解决方案,难道不是在缘木求鱼吗?

但这种批评意见其实并不能真正站得住脚。严格地说,黑格尔本人说的“绝对知识”并不是像前面所说的“语义向量空间模型”那样的经验知识大全,而是某种纯粹思维层面上的高阶知识。这也就是说,黑格尔所真正看重的,乃是使得经验知识得以被组织起来的某种“元知识”。不难想见,如果AI也能够获取这种元知识的话,那么这样的系统或许就能以更为灵活的方式组织经验知识,以此规避框架问题。由此,黑格尔哲学与AI之间的思想交流管道,也能够被顺利疏通。

但到底是哪些黑格尔式的“元知识”内容才对AI有特别的借鉴意义呢?要回答这一问题,我们需要以一种新的眼光来复习黑格尔的《逻辑学》体系。而在下面的讨论中,笔者将具体采取这样的讨论策略:首先,笔者将暂时搁置对于AI问题的讨论,而着力将黑格尔《逻辑学》的核心理论命意加以“祛魅化”;然后,笔者再将AI的视角重新切入现场,以便构成黑格尔与AI之间的积极对话。

三、 黑格尔的“语义逻辑”及其与人工智能之间的关联

在本文中,笔者之所以选择目前有点受到学界冷落的《逻辑学》——而不是在二十世纪的西方哲学史中更受推崇的《精神现象学》——作为考察的重点,乃是因为笔者认为《逻辑学》的关涉与本文的论题更为相关。换言之,恰恰是因为现代意义上的人工智能与逻辑学及统计学的发展有着莫大的关系,同样对逻辑学问题有着深入探讨的黑格尔版本的《逻辑学》才更可能为一种“黑格尔式的AI哲学”提供思想养料。[注]众所周知,黑格尔的《逻辑学》分《小逻辑》与《大逻辑》,前者是在其生前发表的《哲学科学的百科全书纲要》中的第一部分,后者则是相应内容的扩增版。本文在正式行文中统一称为“《逻辑学》”,除非需要给出直接引文,不再区分《大逻辑》与《小逻辑》。本文主要参考的《小逻辑》、《大逻辑》的版本都是英文版,二者的版本信息分别如下:Georg Wilhelm Friedrich Hegel, Encyclopedia of the Philosophical Sciences in Basic Outline: Part Ⅰ: Science of Logic, trans. & ed. Klaus Brinkmann and Daniel Dahlstrom (Cambridge: Cambridge University Press, 2010). Georg Wilhelm Friedrich Hegel, The Science of Logic, trans. George Di Giovanni (Cambridge: Cambridge University Press, 2010).

不过,众所周知,现代意义上的符号主义AI与弗雷格在形式逻辑领域开创的革命颇有关联,而与之相比较,按照一种通常哲学史意见,黑格尔的《逻辑学》所研究的并不是形式逻辑意义上的“逻辑学”,而是人类思维的基本形式——范畴。用黑格尔自己的话来说,即使在像“这是一片绿叶”这样的包含有明显的经验内容的判断中,诸如“单称性”、“是”这样的范畴依然会起到某种“骨架支撑”的作用。[注]《小逻辑》英文版,第31页。不过,要说清楚“范畴”与形式逻辑家所说的“逻辑常项”(如“或”、“非”等)之间的关系,的确不是那么容易。虽然很难说形式逻辑家完全不研究黑格尔所提到的这些范畴,但在黑格尔范畴表中所覆盖的很多内容(如在《逻辑学》之“是论”中所涉及的“定在”,“本质论”里面涉及的“现象”、“根据”,以及“概念论”所涉及的“机械论”、“目的论”,等等),似乎都不是普通的形式逻辑教科书所应涉及的事项。也正由于黑格尔的“逻辑学”与传统逻辑之种种不同,学界过去常用“辩证逻辑”一词来称谓之,以此彰显辩证法思维与知性思维之间的分野。按照上述见解,黑格尔对于整个德国古典哲学的“逻辑”观所作出的贡献也就体现在:他在先驱康德所开出的“普通逻辑”(包含处理“先天分析判断”的演绎逻辑与处理“后天综合判断”的归纳逻辑)与“先验逻辑”(专门用于“先天综合判断”)之间的二分法之外,再开出了“辩证逻辑”这一新分支(见图1)。

图1 通常学界所理解的黑格尔辩证逻辑与康德的逻辑观之间的关系

不过,在笔者看来,上述提法除了将本可以说得更清楚的问题弄得更为混乱之外,并无任何裨益。从文本学角度看,图1所不能解释的一个非常反常的现象是:亚里士多德的三段论推理所对应的那种逻辑显然属于“普通逻辑”而不是“辩证逻辑”,因此,黑格尔的《逻辑学》似乎就不应该讨论三段论——但我们恰恰在该书的第三部分“概念论”里找到了黑格尔对于三段论的大段讨论。由此看来,“辩证逻辑”应当是涵摄了“普通逻辑”的,而不是与之并列的。与之相类似的一个问题是:倘若“辩证逻辑”应当是与“先验逻辑”相互并列,我们又该怎么解释《逻辑学》的第二部分“本质论”对于康德范畴表的全面覆盖呢?因此,就像“辩证逻辑”应当是涵摄了“普通逻辑”一样,它应当也是涵摄了“先验逻辑”的。换言之,“辩证逻辑”根本就不是与“普通逻辑”以及“先验逻辑”并列的一种新逻辑。毋宁说,在黑格尔看来,世界上只有一种逻辑,也就是他自己的《逻辑学》所展现的那种逻辑,而“普通逻辑”与“先验逻辑”只是它在不同阶段上的不同显现形式罢了。而且,与康德的想法不同的是,黑格尔还试图将那种被康德高度边缘化的“归纳逻辑”独立为一个新板块,即《逻辑学》之“是论”。[注]“是论”(the doctrine of being)一般翻译为“存在论”,但“存在论”的英文对应词很容易被联想成“ontology”,所以不是一个理想的翻译。另外,将英文“being”或德文“Sein”翻译为“是”,能够强调该词的系词作用,方便具有语言分析哲学背景的当代诠释者对黑格尔进行“祛魅化”处理。用“是”来系统地替换掉“存在”的翻译方案,曾被王路先生系统地辩护过(参看王路:《是与真》,人民出版社2003年),本文作者也深受其影响。这样一来,图1所给出的逻辑分类表,就极为戏剧性地被转化为了图2。有鉴于图1与图2之间的巨大差异,我们甚至很难说黑格尔从康德那里积极地继承了任何体系性的思想——毋宁说,他是摧毁了康德的整个思想构架,并用由此得到的碎片构建出了他自己的思想大厦。

图2 笔者所理解的黑格尔辩证逻辑与康德的逻辑观之间的关系

面对图1与图2之间的这种惊人反差,我们切不可轻描淡写地认为黑格尔只是重组了康德思想元素的次序,并在由此得到的新大厦上涂抹上一种叫“辩证法”的外墙用油漆。毋宁说,正如意大利裔的黑格尔专家乔治·迪·乔凡尼(George Di Giovanni)在给《大逻辑》写英文版导言时所指出的,在《逻辑学》的正式文本中,黑格尔本人其实反倒不那么喜欢使用“辩证的”这一形容词——因此,他自己的“逻辑”的本质恐怕不在于其“辩证性”,而在于其“推演性”(discursiveness),也就是某种能够历经不同阶段而始终维持自身线索统一性的推演思路。[注]《大逻辑》英文版,第xxxix页。这也就是说,黑格尔其实是提出了一个康德主义者很难回答的问题:如果“普通逻辑”与“先验逻辑”之间真是这么泾渭分明的话,那么,我们又该如何解释任何一个智能正常的人都能在任何一个典型的日常问题处理语境中自由调用这些逻辑工具呢?不同的逻辑工具之所以能够被引入同一个问题语境,难道不正是因为其背后有某种统一的“调用平台”在起作用吗?——但除了将康德所提到的那些不同的“逻辑”都视为某种统一的“逻辑”的不同面相,难道我们还有对于上述“调用平台”的更完美的说明方案吗?

那么,这种更具“统一性”的“逻辑”本身究竟是什么呢?

为了避免继续使用“辩证逻辑”这个词所带来的思想混乱(这种混乱往往是通俗哲学读物对于“辩证法”的种种庸俗解释所带来的),笔者提出了对黑格尔的“逻辑”概念的如下祛魅化解释方案:黑格尔的“逻辑”在实质上是一种“语义逻辑”,或者说,是一种关于语义内容的推理逻辑。由于黑格尔式的“语义”概念本身就带有克服“语义—形式”二分法的意蕴,所以这种逻辑才可能同时涵盖康德所说的“先验逻辑”与“普通逻辑”。

那么,到底什么才叫“语义逻辑”呢?为了避免我们立即就陷入黑格尔自身的哲学文本所自带的晦涩性,下面笔者将举一个来自于维特根斯坦哲学的例子来说明之。

维特根斯坦(或称为“维氏”)的早期哲学是建立在弗雷格所锻造的数理逻辑基础之上的,而数理逻辑本身就是康德所说的“普通逻辑”在二十世纪最重要的演化形式。具体而言,早年维氏根据这种“新普通逻辑”而在《逻辑哲学论》中提出了这样的形而上学观点:对于世界的描述可以被分解为那些自身不能够被分解的原子命题的真值函项——也就是说,按照该理论,我们若欲获知复合命题的真假,仅仅需要先获知:(甲)该命题所下属的所有原子命题的真假;(乙)该复合命题自身的逻辑构造形式(以及其所对应的真值函项的真值表)。很显然,无论是这里所提到的事项(甲),还是事项(乙),都没有牵涉到原子命题的语义内容。不过,让维特根斯坦感到头疼,并促使他开始怀疑整个《逻辑哲学论》的真值函项理论的,则恰恰是真值函项理论对于语义问题的上述全面回避。请试想下面这样一个推理:“视野中的这个色块是红色的,因此它非绿的。”[注]参看《逻辑哲学论》论题6.3751。从直觉上看,该推理显然是有效的,但其有效性却明显依赖于“红”与“绿”在语义内容上的相互排斥,而非任何一种真值表规定。在经过种种将上述语义排斥关系还原为真值函项关系的失败尝试之后[注]参看Ludwig Wittgenstein, “Some Remarks on Logical Form,” Proceedings of the Aristotelian Society, Supplementary 9 (1929): 162-171。,维特根斯坦最终认定这些还原是不可能成功的,并由此提出了“语法”概念,以取代“逻辑”本来所占据的那个核心理论地位。[注]维特根斯坦在思想转向期讨论“语法”问题的核心文献是:Ludwig Wittgenstein, Philosophical Grammar, ed. Rush Rhees, trans. Anthony Kenny (Oxford: Basil Blackwell, 1974).至于后期维氏在《哲学研究》中所提到的著名的“语言游戏规则”,则只是对于前述“语法”概念的一种更具语用学色彩的表达罢了。

依据笔者浅见,维氏的“语法—逻辑”对子,为我们理解黑格尔式的“语义逻辑”的真正含义,提供了一扇方便法门。具体而言,就像维氏的“语法”概念不得不牵涉到具体经验词项之间的谱系关系一样,黑格尔式的“语义逻辑”也将不得不牵涉到纯粹思维规定之间的语义关系,而这些语义关系本身是无法被彻底外延化为真值函项的操作的。不过,这也并非是说维氏所说的“语法”与黑格尔所说的“语义逻辑”就完全是一回事了。两者之间的差别体现在:第一,经历过命题逻辑革命之洗礼的维氏,即使在其后期思想中也依然表露出对于命题式思维的依赖,并由此将“语法”与“规则”视为其思考的用力点。而依然处在词项逻辑阶段的黑格尔则更喜欢谈论“范畴”,并将“判断”(此即“命题”在德国古典哲学时代的对应物)视为更为简单的范畴的语义衍生物(黑格尔是在《逻辑学》的第三部分“概念论”才开始正面处理“判断”的)。第二,与作为日常语言学派代表人物的后期维特根斯坦不同,黑格尔并不是一个非常痴迷于日常语用细节的哲学家。就其本人意图而言,他还是试图让其“逻辑学”具有更为鲜明的“祛经验化”色彩,即使其自身与颜色、形状、声音等感性内容拉开距离。依据这一思路,黑格尔并未在其“逻辑学”中像晚年维氏那样纠结于“颜色语法”的种种细节。毋宁说,在黑格尔看来,讨论“颜色”这一话题的恰当场所乃是他自己的“自然哲学”,而非“逻辑学”。有鉴于此,黑格尔“逻辑学”的真正含义,似乎应当被更为准确地界定为“纯粹语义逻辑学”,而“语义逻辑”是这一表达的缩略形式而已。

那么,在维特根斯坦的“语法研究”与黑格尔的“语义逻辑”之间,究竟何者才对今日的AI研究更具启发价值呢?不得不承认,尽管笔者曾经花费大量篇幅论证维氏哲学对于今日AI研究的启发意义[注]请参看拙著:《心智、语言和机器——维特根斯坦哲学与人工智能科学的对话》,北京:人民出版社,2013年。,但现在笔者却更倾向于将自己的同情票投给黑格尔。相关理由如下:

第一,基本的语言学常识能够告诉我们,任何一门经验语言的常用词项都是一个相对小的数字,而由此能够被构造出来的语句或复合词项的总数却肯定是一个天文数字。这一分析也同样适用于维特根斯坦。虽然他所讨论的“语法命题”只是我们能够从基本词项中构造出来的所有语句中的一小部分,但按照排列组合规则,其总数已经非常惊人。[注]譬如,你如果能够构造出“红色比绿色来得更饱和”这一颜色语法规则,你就肯定能够得到大量衍生于该规则的新规则:“绯红比橄榄绿来得更饱和”;“粉红比翡翠绿来得更饱和”,等等。在这样的情况下,如果一个AI专家将维氏“语法命题”视为编程工作的逻辑起点的话,那么这就等于重复了前人在系统的知识库中将所有“框架公理”预先予以“锁死”的错误。与之相比较,一种黑格尔式的从范畴出发的编程思路,却可能会因为避免了对于大量命题知识的过早涉及而大大降低AI编程工作的负担。

第二,避免过早涉及诸如“颜色”这样的感性内容的做法,也同时会带给一个笃信黑格尔主义的AI研究者以这样的理论红利:他所设计的系统完全可以被自由地安插上各种各样的感官系统,而不必处处与人类相同——譬如,他完全可以去设计一个视力极为薄弱的、并仅仅依靠回声定位的AI系统。不过,按照黑格尔主义者的观点,即使是这样的系统,也必须具备运用诸如“是”、“否”、“因果”等抽象范畴的能力,否则它就无法进行自主思考,因此也就不可能是智能的。因此,黑格尔在“逻辑学”名目下对于“范畴”的研究成果,也就具有了一种横跨人类与机器的普遍性。

有了上面的讨论做预备,我们也就不难将《逻辑学》所列出的那些范畴对于AI语言表征的意义大致解释如下了:

第一部分“是论”(the doctrine of being)讨论的主要范畴分“质的规定性”与“量的规定性”两大类,前者的代表范畴有“是”、“否”、“变”,后者的代表范畴是“纯粹量”、“定量”、“比例”等。从AI角度看,这一部分要解决的任务是如何为系统编制最简单的主—谓判断,以便为后续的语义建模提供基本的“建材”。由于这一部分对于“质”、“量”与“度”之间“正—反—合”关系的讨论实际上非常接近归纳逻辑的运作细节,所以笔者将其视为黑格尔“逻辑学”中所处理的任务最接近所谓“统计学进路的AI”(如贝叶斯网络与人工神经元网络)的部分(尽管这些技术路径其实是无法完美地完成日常生活中的归纳任务的)。

第二部分“本质论”(the doctrine of essence),也就是对于判断自身的模态性质的再判断(尽管对于“判断”这个概念自身的反思性运用,要到“概念论”才会成为可能)。所谓“模态性质”,也就是一个主—谓判断自身在模态空间中的地位的判断——它究竟是可能为真的,还是必然为真的,还是偶然为真的呢?要回答这个问题,系统就必须对该判断之所以被断定的“根据”进行追问,由此必然又会牵涉到“假象”、“现实性”、“本质”、“因果性”等范畴。从AI的角度看,“本质论”所涉及的这些概念工具如果能够被算法化的话,自然能够帮助相关的AI系统自动地去伪存真,以便提高其在外部环境中的适应性。这也是黑格尔的“逻辑学”体系中所处理的任务比较接近所谓“符号主义AI”的那部分(尽管主流的符号AI其实是无法完美地完成被交付给它的相关任务的)。

第三部分“概念论”(the doctrine of concept)处理的是对于主体所处的整个环境的整体形势的高阶评估,以及这些评估所需要使用到的概念工具。诸如“判断”、“三段论”、“机械论”、“生命”等高度抽象的概念,都是在这个板块中被讨论的。就相对低级的AI产品而言,对于这部分的概念工具的算法化并不显得那么必要,因为对于一台按照机械论原理运作的计算机来说,它未必需要在反思的层面上学会使用“机械论”这个概念。但对于比较高级的AI产品来说,对于“概念论”所涉及的概念工具的算法化,或许就会成为一件必要之事了。[注]从表面上看来,《逻辑学》的这种章节安排显然构成与目下主流心灵哲学中的计算主义思潮的某种颠倒:计算主义者会将机械运作视为心智活动的“随附基”,并因此将其视为自己的立论出发点;而黑格尔则认为,作为一个高级的抽象概念,“机械性”只能出现在《逻辑学》三大板块中的最后一个板块里。但严格地说,这种相互颠倒并不意味着黑格尔的思想就必定不能被当代计算主义所“顺化”,因为黑格尔在此更关心的是某种自在且自为的“机械性”概念在反思活动中的涌现,而不是某种纯然自在的、客观的机械性活动。而当计算主义者说“心智活动随附于图灵机的机械运作”的时候,他们所指涉的,也仅仅是那种纯然自在的、客观的机械性活动而已。同样的分析也适用于《逻辑学》对“三段论”的处理。很显然,黑格尔在“概念”这个板块里谈论的是“三段论”概念在反思活动中的涌现,而不是某种纯然自在的、客观的、实现为机械性活动的三段论推理。譬如,我们可以设想一台正在参与图灵测验的计算机,正在被问及一些关于宇宙学、神学与形而上学的抽象问题,而对这些问题的讨论显然需要动用“概念论”这个工具箱。再譬如,我们也可以设想这么一种情况:一台本来仅仅按照“是论”与“本质论”提供的概念工具进行工作的机器,突然发现现有的概念工具不够用,因而不得不转而去追问使得这些工具得以被发明出来的那些“元工具”,并试图在诸种“元工具”所提供的模态空间中寻找更合适的推理平台。而机器要实现这样的一个“思想飞跃”,显然也需要编程者预先为上述“元工具”的算法化预留空间。

读到这里,读者或许会问:我们引出黑格尔的哲学资源的原初目的,本是为了解决“框架问题”,而上述对于《逻辑学》三大板块内容的分析,到底又在哪个方面与“框架问题”相关呢?

以下便是笔者对于该问题的简要回复:前文已指出,“框架问题”的实质乃是使得智能体能够在有限的计算资源与时间资源中进行“相关性”判断,以此提高系统的运作效率。而从黑格尔哲学的角度看,“相关性”本身乃是一个很模糊的概念,因为不同层面上的“相关性”将牵涉到不同的概念工具箱。具体而言,“是论”层面上的“相关性”相对简单与朴素,它主要牵涉到主、谓之间的联系或此类联系的缺失(其在语言学上的表达,便是系词的出场,或是否定词的出场)。而“本质论”之上的“相关性”则相对复杂,这主要牵涉到根据的出现或者缺失,以及判断这种出现或缺失所需要的一整套推理运作。“概念论”层面上的“相关性”则最为复杂,因为这将驱使智能体对使得前述的“相关性判断”得以可能的工具——如“判断”概念本身——进行反思,由此磨砺用以处理“框架问题”的武器。这也就是说,一种黑格尔式的针对“框架问题”的处理方案本身,也将带有某种鲜明的反思性特征:这种处理方案将不会满足于通过某种工程学技巧,来暂时满足对于“框架问题”的某一具体变种在某些限制性条件下的“解决”,而会以一种更具野心的姿态,来一一构建对于“相关性判断”得以被给出的全套概念工具。

以上便是笔者对于黑格尔式“逻辑学”与AI之间的关联性的最为粗疏的说明。而为了向这一说明提供更多的细节,在下面的讨论中,笔者将试图从AI的视角提炼出黑格尔在“是论”中给出的一些“思想亮点”。

四、 从人工智能角度重读“是论”

众所周知,“是论”是《逻辑学》体系三大板块中的第一板块,也是后两个板块得以逐步展开的理论基础。因此,将本文有限的篇幅预算用在“是论”(而不是“本质论”或“概念论”)之上,也将起到某种“四两拨千斤”的作用。下面,我们将主要从AI自身的兴趣点出发,通过三个问题,就“是论”自身的几点“反常之处”进行提点,并通过对于这些“反常”的解释来逐一展现黑格尔思想的深刻之处。

问题一:如何从AI的角度理解“是论”的开场第一个范畴乃是“是”?

对于这个问题的一种常见的教科书式解答乃是这样的:黑格尔不满足于像亚里士多德与康德那样,机械地、外在地将范畴予以展列,而试图向读者展现诸范畴逐步发展自己的整个辩证过程。而“是”恰恰就意味着某种展开为各种种类的判断的可能性,同时其表面形式亦是最简单的。在这样的情况下,将“是”视为整个范畴表的出发点,便是一件非常自然而然的事情了。

但这样的解答,显然很难让一个深受数理逻辑思维影响的AI专家所信服。他或许会搬出早年维特根斯坦在《逻辑哲学论》)(参论题3.323)中的说辞,认定像黑格尔这样的传统哲学家对于像“是”这样的系词的依赖其实是将不同的含义——“同一性”、“属于”、“存在”——归属到了相同的语词下,并因为这种混淆而导致了大量后续的哲学混乱。那么,一个黑格尔主义者又当如何回应后人的这种批评呢?

回应之一:早期维氏提议将“是”的含义分置于不同的技术谓词的想法,本身乃是预设了这么一种观点:存在着一种一劳永逸地将世间所有基本谓词加以确定的终极技术方案。很显然,正是这种有点天真的想法,促发了后世AI专家海耶斯(Patrick Hayes)去用一阶谓词逻辑来整编整个人类常识。[注]Patrick Hayes, “The Naïve Physics Manifesto,” ed. Margaret Boden, The Philosophy of Artificial Intelligence (New York: Oxford University Press, 1990) 248-280.但正如另一位人工智能专家麦克德默特(Drew McDermott)所认识到的那样,这样的思路必然会带来“基本谓词膨胀”的问题[注]Drew McDermott, “A Critique of Pure Reason,” Computational Intelligence (1987) 3: 151-160.——也就是说,由于人类常识的驳杂性与开放性,AI专家们将很难确定怎样的“基本谓词表”才是足够完整的。而一种黑格尔式的解决思路则是“化繁为简”的——也就是说,与其一开始就将所有的基本谓词列出,还不如先来观察一下所有这些基本谓词所具有的共相,也就是将不同的经验表象综合在一起的“统一性”功能。很显然,没有比用“是”来表达这种统一性功能显得更为自然的了。[注]顺便说一句,在这里我们又发现了黑格尔对于康德思路的某种颠倒:在《纯粹理性批判》中,康德是先给出范畴表,再从中“先验演绎”出执行统一性功能的“我思”;而在《逻辑学》中,黑格尔则是先给出执行统一性功能的“我思”,再在“本质论”中回头讨论康德的范畴表。说得更具体一点,表示“属于”的“是”之所以体现了这种“综合经验表象”的功能,乃是因为在像“这朵花是红色的”这样的判断中,“是”所扮演的角色便是将“这朵花”这个表象与“红色的”这个表象结合在了一起;在“这朵花就是这朵花”这个判断中,“是”至少是将“是”左边的语言记号(token)与“是”右边的语言记号在类型(type)层面上结合在了一起,而在“这朵花存在”这个判断中,变身为“存在”的“是”则至少将主词“这朵花”与一系列支持其存在、却未必被直接表述出来的谓词(比如“被张三看到过”这样的谓词)联系到了一起。[注]当西语中的系动词直接跟在主语背后而不直接接续谓述的时候,一般就被翻译为“存在”,尽管在西语中它还是“是”。可以认为这种意义上的“存在”依然是“是”的衍生物,因为它依然联系着某些未被明述出来的谓述。譬如,在说“大禹存在”这句话时,我们依然是将一系列感性的谓词以缄默的方式联系到了这个判断,并因此使得这个判断成为了一个经验判断。

回应之二:被早期分析哲学家所看重的“是”的核心功用——表征“属于”——就未必能够涵盖我们在日常生活中使用“是”时的真正用意。说得更具体一点,早期分析哲学家所说的“属于”是在纯粹外延主义立场上被使用的,因此,当他说“苏格拉底是人”的时候,他想说的仅仅是:对于“人”这个集合而言,“苏格拉底”乃是其成员。然而,这个说法却根本没有涉及“人”这个集合本身的内部结构特征,也没有涉及“苏格拉底”与“人”这个集合的其他成员之间的关系。与之相比较,当我们一般人(在某种意义上,还包括后期维氏)说“苏格拉底是人”这句话的时候,我们其实是作出了这样的一个断言:对于“人”这个集合的外延的其他对象来说,“苏格拉底”所具有的某种性质至少是具有足够的典型性的——而“具有足够的典型性”这个表达显然涉及了“人”这个集合的某种内部结构(无论它是晚期维氏所说的“家族相似”结构或是别的什么结构)。这也就是说,数理逻辑与集合论所提供的源初谓词,除非经过某种重大的改造,其实是无法令人满意地刻画日常语言中的“是”的。因此,我们必须从对于这些现代表述工具的迷信态度中抽离而出,直接地表达出“是”本身。

对于上述回应,不太同情黑格尔哲学立场的读者或许会反驳说:简单地给出“是”,并不能够帮助我们理解被“是”所联接的谓项自身的内部各个成员之间的家族相似结构;而如果我们要对所谓“家族相似”理论进行技术层面上的刻画的话,那么学界业已提供的成熟刻画方案则还是会将我们引向目下如火如荼的“语义向量空间模型”[注]“语义向量空间模型”的一个思想源头就是后期维特根斯坦的“家族相似理论”,以及作为其技术改进版的“原型理论”(prototype theory)。,而不是什么神秘兮兮的黑格尔哲学。

但这一反击本身还是有两个破绽。第一,就其本质而言,“语义向量空间模型”只是在深度学习的技术平台上复演了海耶斯在符号AI的平台上所做的那类春秋大梦,即要以某种一劳永逸的方式穷尽某种语言的所有语义知识。故而,与海耶斯的规划一样,这样的技术路径依然无法完美地处理人类经验的开放性与驳杂性。与之相比,黑格尔对于“是”进行预先呈报(并在同时不立即给出完整的范畴表)的方案,的确是对从“是”中衍生出种种新谓词的可能性保持了足够的开放性——而且,也恰恰是这种开放性,才使得其思想更有可能与人类所面临的种种具体的问题处理语境发生有机的关联。第二,对于“是”的原始地位进行肯定的做法,本身并不一定就是与AI的技术刻画方案格格不入的。比如,在颇有影响的一个AI技术路线——贝叶斯网络——中,贝叶斯网的构建者在构建所谓的“有向无环图”之时,几乎就仅仅使用了一类谓词,即联接一个事件表征与另一个事件表征的有向箭头。同样的道理,在“语义向量空间模型”中,建模者对于不同词项之间语义距离的谈论,也能够被视为对于某种统一的基本谓词的不同量化方式。这也就是说,黑格尔的反击者们所试图驳倒的,恰恰就是他们在自己的新方案中所预设的东西。而更糟糕的是,由于这些建模者试图一开始就确定使得语义推理得以可能的所有充分知识,他们所设定的这种基本谓词一开始就被剥夺了从中衍生出新谓词的可能性,并因此使得自己的建模成果被锁定在比黑格尔所说的“是”更不具普遍性的那个层面上。

问题二:如何理解黑格尔所说的“变”?

我们知道,在“是论”出场的前三个范畴分别是“是”、“否”与“变”。从“是”引出“否”,似乎并不会引发后世的AI技术专家们足够的惊讶,因为“否”既可以在一阶谓词逻辑中被勉强理解为“否定”,也可以在贝叶斯网络中被勉强理解为两个事件节点之间连线的缺失。而相对难以理解的是“变”,因为现有的AI技术缺乏刻画“变”的基本技术手段。那么,关于“是”、“否”、“变”三者之间的关系,以及引出“变”的必要性,黑格尔本人是怎么说的呢?我们可以在《小逻辑》中找到这样的文字:

反过来说,“否”,作为这种直接的自我等同的范畴,就好似是与“是”等同者。“是”的真理,以及“否”的真理,因此也就是对于二者的联系:这一联系就是“变”。[注]《小逻辑》英文版,第140、141页。

这段话的字面意思的确有点晦涩。好在黑格尔还在《小逻辑》中给出了对于此段表述的大段说明。[注]《小逻辑》英文版,第140、141页。根据这些说明,笔者重构出了如下论证,以证明“变”这个范畴的不可或缺性:

1. 当我们使用“是”与“否”这两个范畴时,我们已经预设了某种更深的背景知识,以使得作出上述肯定与否定的行为本身变得有意义。

2. 因为该背景是“是”与“否”所共享的,所以它也可以被视为对于此二者的“统一者”。

3. 我们必须找到一个范畴,以便能够刻画这一统一性背景的本质特征。

4. “变”很适合成为满足上述条件的一个范畴,因为当我们说“甲在变”的时候,这话即蕴含了对于甲之存在的肯定(即“是”),又蕴含了对于甲之先前存在状态的否定(即“非”)。

5. 所以,“变”是一个在对于“是”与“否”进行初步反思后就必然会被揭露的新范畴。

这里需要指出的是,黑格尔对于“变”的基础地位的这种肯定,与德语中的对应词汇——“Werden”——的灵活用法是有一定关联的。比如,这个词既可以像英文中的“become”那样成为一个实意动词,在其他动词不介入的前提下直接接续名词(比如例句“Seine Tochter wird Krankenschwester.”,意即“他女儿成为了一名护士”),也可以成为一个助动词,以便表示“第一将来时”(比如例句“Was wirst du an diesem Wochenende machen?”,意即“本周末你将做点什么?”),或表示“过程被动态”(比如例句“Der Verletzte wurde sofort ins Krankenhaus gebraucht.”,意即“这位伤员被立即送往医院”)也就是说,“Werden”同时涵盖了汉语中“变”、“将”、“被”三个词的含义,具有强烈的时间流变意味与主—客颠倒意味。此外,虽然对于英语与汉语的言说者来说,“Werden”这一范畴的上述活用的确是有点令人难以理解的,但是这也并不意味着黑格尔在这里是在玩弄某种隐性的“德语霸权主义”。譬如,就与德语在亲缘关系上极为疏远的日语而言,“なる”(罗马音“naru”,一般也只能被勉强汉译为“变”)这个动词的活用范围虽然没有德语“Werden”那么广,但也承担了远比汉语中的“变”或者英语中的“become”更为广泛的语法角色,因此更具有黑格尔所说的“Werden”的意味。[注]日语虽然没有严格意义上的未来时态,而日语表达被动态的典型方式(即把动词本身改成“れる”结尾的形式)也不需要“なる”来参与,但在某种情况下,“なる”既可以表示被动,也可以表示未来状态。比如在“……ことになる”这个句型中,表达人需要说的意思便是“某某事件以一种当事人不可抗的方式将要发生了”,因此,当事人在此中所扮演的角色乃是消极与被动的。故而,从某种意义上说,与德语中的“Werden”类似,“なる”在日语中也承担了“变”、“将”、“被”这三个概念的含义。这也就是说,黑格尔对于“Werden”的强调,未必只能为懂德语者所领会。

但说到这一步,“Werden”对于AI研究的启示意义,似乎还没有被清楚地凸显出来。故而,我们还必须对这个范畴的真正含义进行进一步的抽象。非常粗略地说,“Werden”是对所有包含可被察觉的时间因子的谓述表达(如“开始”、“结束”、“增强”、“变弱”、“生长”、“腐败”,等等)所作的一种抽象,而这种抽象之所以对AI有启发意义,恰恰是因为目前主流的符号AI与人工神经元网络研究都是“无时间”(并因此是“无变化”)的。譬如,在符号AI系统之公理系统中,所有的结论都被视为通过逻辑手段而一步步演绎出来的自然结果,而这一结果甚至在演绎发生之前,实际上就已经被自动蕴含于前提之中,而不会对这些前提进行任何实质性的修正与变化。至于传统符号AI所依赖的一阶谓词逻辑,其实也无法刻画“变”,因为像“Werden(x)”这样的函项结构在句法表达上根本就没有办法告诉我们它与“Sein(x)”的任何区分。甚至对于人工神经元网络与贝叶斯网络来说,“变”也不是一个能够被确切刻画出来的范畴。我们固然可以说在训练一个人工神经元网络的过程中,网络中计算单元之间的联系权重一直在“变”,但一旦网络被训练完成了,除了按照规定的模式对新输入的性质进行映射之外,这样的网络的技术性能根本就不会“变”了(比如,一个专用于语音识别的深度学习网络,是无法“变”得可以用于图像识别的);而且,这样的网络所能够识别的抽象谓词也很难包容“变”(你能够让这样的一个网络去识别一张衰老的男人的脸,却不能让其识别一张衰老的男人的脸的衰变过程本身)。与之同理,贝叶斯网络也很难对自身的“有向无环图”进行反思性的“变通”(你能够让这样的一个网络在特定的“有向无环图”的拓扑学结构中改变特定事件连线的权重,却无法让这样的拓扑学结构本身被颠覆性地改变)。[注]比如在“司马光砸缸”的案例中,少年司马光对于“能够砸缸的石头”这一事件节点的意义的发现,就具有某种现有的贝叶斯网络技术所难以复制的创造性。这也就是说,贝叶斯网络的事件节点勾勒只能以“事后追认”的方式去模拟人类创造性探索的成果,而无法自行给出这种创造性的探索活动。这在相当程度上也解释了为何“框架问题”能够对传统AI构成那么大的麻烦。说得更具体一点,对于“框架问题”的任何一种理想的解决方案,显然都应使得智能体能够灵活地使用“变”这个范畴——换言之,这样的智能体将应当有能力去了解:在语境甲中,事项A与B之间的不相关性,在语境乙中,却已经变得相关了,或反之。然而,无论是符号AI,还是人工神经元网络,显然都无法真正地展现语境变迁——其实质是时间流逝——与范畴变化自身的种种微妙关联。[注]麦卡锡(John McCarthy)的流演算(fluent calculus)是这种思路的典型技术体现,其核心思路是将每一个动作的时间因子对象化为一个变量,因此追踪动作本身发生的真值与特定时间因子之间的捆绑关系。相关典型文献有:J.McCarthy & P.J.Hayes, “Some Philosophical Problems from the Standpoint of Artificial Intelligence,” Machine Intelligence 4 (1969): 463-502.因此,黑格尔对于“变”范畴的界说,其实是对整个主流AI界对于“变”的冷漠构成了一种颇具理论威胁性的批评。

问题三:人工智能该如何看待从“是”到“否”再到“变”的辩证推演关系?

笔者对于黑格尔上述思想的重构过程,都始终回避了“辩证逻辑”这个提法,以免后世借着该名目所作出的种种庸俗化解释来干扰我们的思路。但即使如此,笔者也不否认,以“是—否—变”的演进过程为典型的“正—反—合”结构,乃是黑格尔哲学叙述中被反复使用的套路,而这些套路恰恰又是俗常所说的“辩证逻辑”的基本内核。对于这一内核的初步形式化表达如下:

正题:S是P。

反题:S非P。

合题:S与P是一个新谓词Q的两个面相。

上述推理过程——尤其是“正题”与“反题”之间的明显矛盾——当然是很难被形式逻辑家所理解的,并因此被笃信形式逻辑并厌恶矛盾的分析哲学家们所嘲笑。但我们的确在日常谈话中会经常使用这样的带有准黑格尔气息的表达:“张三是个好人,不过他也算个坏人。好吧,怎么说呢?他就是这么一个复杂的人。”有趣的是,虽然分析哲学家恐怕也很难否认此类表达在日常语言中的普遍存在,他们却坚决否定这种表达能够为黑格尔式逻辑的合法性提供任何辩护。相反,他们竭力使用进一步的分析策略,来使日常语言的上述表达顺化成无矛盾的表达。譬如这样的方案:在时刻t,张三是一个好人,而在时刻t*,张三是一个坏人。而当我们说“张三是个复杂的人”的时候,我们实际上说的,乃是在不同时刻被给出的不同描述谓词所构成的某种复杂的被构建物。

笔者承认,在形而上学的层面上,这样的“祛辩证法化”的说话方式是值得发展为一种精致的学说的,譬如笔者在别处详细讨论过的“蕴相殊论”(trope theory)。[注]请参考拙文:《如何奠定历史唯物主义的理论哲学基础?——一种基于“蕴相殊理论”的重构方案》,《学术月刊》2017年第9期。但是若我们转而站在AI或者认知科学的立场上重新审视这种“祛辩证法化”的方案的话,那么我们就会再次迎来麻烦的“框架问题”。其理由如下:为了尽量避免将意义彼此冲突的谓词指派给同样的主词以造成矛盾,“祛辩证法化操作”的实施者只能小心翼翼地将不同的时间谓词(作为某种二阶谓词)指派给每一个一阶判断。但这显然会导致智能体记忆库所需要记忆的基本信息量的增大,并使其更难在局促的时间预算下给出合理的“相关性”指派。与之相比较,黑格尔的方案——即略去时间因子而直接表述主—谓关系——则可以大大精简系统所需要储存的基本信息,并使之能够有充分的计算资源来解决“框架问题”。

在这里我们无疑发现了一个很有趣的反差。我们已经知道,“框架问题”实质上是一个关于智能体在有限的时间资源中如何进行“相关性”指派的问题,因此,这个问题其实已经牵涉到了时间与认知范畴之间的某种隐秘与深刻的联系。虽然黑格尔与后世进行“祛辩证法化操作”的AI专家与分析哲学家其实都意识到了这种联系的存在,但两者阐述这种关系的方式却是完全不同的。从表面上看来,更重视时间问题的乃是“祛辩证法化操作”的执行者,因为在他们的具体刻画方案——如麦卡锡所提出的“流演算”——中,时间因子的确是得到了对象化的投射;而在黑格尔的《逻辑学》中,时间因素仅仅是被诸如像“变”这样的范畴所预设了,而没有以“被对象化”的方式展现出来。不过,这或许并不意味着黑格尔无视时间问题的重要性——毋宁说,谙熟古希腊哲学(并因此谙熟由机械切割时间所造成的“芝诺悖论”)的黑格尔其实是意识到了时间问题本身的艰难性,以及那种“通过切割时间来回避矛盾”的做法的粗鄙性。换言之,从黑格尔哲学的立场上看,这种切割将难以解释:为何在认知活动中,跨时间片段的对象可以被表征为同一个主词,以及为何我们会允许同样一个主词具有不同的、彼此冲突的面相。而在黑格尔看来,最简单的替代性处理方法就是姑且允许矛盾的存在(并因此省略了为回避矛盾而引入的“对象化时间片段”的做法),并通过对于这样的矛盾的揭示来显示引出更深层谓词的必要性。

说到这一步,黑格尔的所谓“辩证逻辑”在AI或者认知科学语境中的真义也就呼之欲出了。严格地说,黑格尔的“辩证逻辑”根本就不是与形式逻辑并列的一种新逻辑,而是对于认知主体探索真理的基本步骤的一种概括。因此,与之能够相提并论的AI对应物也并不是一阶谓词逻辑或是贝叶斯网络或是人工神经元网络,而是可以被图示化为“流程图”的某种宏观问题解决策略,譬如司马贺与纽埃尔的“通用问题求解器”所涉及的“目标—手段”进路。说得更详细一点,这种黑格尔式的问题探索策略的基本流程可以被概述如下:

第一步,主体通过某些经验观察(E),得到“S是P”这个判断。

第二步,主体通过采集新的经验观察(E*),得到“S非P”这个判断。

第三步,主体发现上述两个判断是有矛盾的。

第四步,主体努力寻找一个中介性谓词Q,以便为使得观察E与观察E*都能够成为“S是Q”这个新判断的证据集的成员,由此消除前面所发现的矛盾。

第五步:但在一个更高的层面上,主体又发现了新证据,以支持“S非Q”这个判断。

第六步:为了消除这个新层面上的矛盾,重启步骤四。

…………

第n步:主体终于得到了某种超级谓词,使得各种矛盾都可以在其中得到调和。由这种超级谓词所构成的判断所组成的知识,就是“绝对知识”。

关于笔者所重构出来的上述步骤,还有如下几点深入说明:

第一,矛盾不是黑格尔式逻辑所真正容忍的东西,而是引发智能体进一步进行探索的动力。因此,就“对矛盾感到不满”这一点而言,黑格尔与形式逻辑学家并没有本质分歧。黑格尔的贡献乃在于:他并不急于引入对于时间因子的对象化以便一开始就去消灭矛盾,而是采用了“养寇自重”的策略,让作为同一性对立面的矛盾自身引发认知的深刻化。从这个角度看,黑格尔式的逻辑,其实比形式逻辑更适合用来刻画认知的进展过程,因为形式逻辑会在一开始就消灭掉认知主体进行前行的动力。

第二,按照笔者的重构,“S是P”与“S非P”之间的对立,并不是依靠纯粹的思维游戏被演绎出来的,而是通过不同的经验证据而被经验地归纳出来的,因此,“反题”并非“正题”的逻辑蕴含物。笔者的这种经验论色彩浓郁的解释,显然会颠覆很多读者对于黑格尔的“反经验论者”的刻板印象。但这种刻板印象的产生本身,也是完全可以被解释的。具体而言,如果智能主体对特定证据经验的局限性有某种先验的认识的话,那么,这样的主体就能够在得到证据证明“S是P”之后,自然地期待未来会有新证据来证明“S非P”,而无论这些新证据是否已经到手。而这种暂时脱离了经验大地的先验期待,也就会给一部分人造成了这样的假象:从“S是P”中,我们可以直接推出“S非P”。

第三,使得笔者重构的整个认知流程能够被执行的一个隐蔽前提是:认知主体有足够的“认知野心”来得到对于世界(包括其自身)的某种统一性认识。很显然,这个前提并不是来自逻辑的要求,因为一个缺乏此类认知野心的、随波逐流的“佛系”认知主体的存在,本身并不构成对于形式逻辑之有效性的任何威胁。这个前提的真正来源毋宁说是欲望与生命,这也就是黑格尔以后的叔本华、尼采、伯格森从人文科学角度,以及黑格尔以后的达尔文、道金斯与丹尼特从自然科学角度所试图阐明的道理。缺乏对于这个问题的足够自觉意识,的确是作为理性主义哲学家的黑格尔的一个疏漏。不过,从AI与认知科学的立场上看,对于这一疏漏的弥补并不会导致对于黑格尔的辩证逻辑的主体部分的颠覆,而只会导致对于它的补充。这也就是说,一个成熟的AI专家需要在思考“如何为智能体的认知活动提供认知动力”这一问题时参考人文科学与自然科学对于“生命”与“欲望”的既有讨论,并由此使得“人工智能”与“人工生命”的研究能够在某个层面达成知识汇通。

第四,站在AI立场上看,黑格尔式辩证逻辑即使得到了笔者的上述重构,其中的第四步恐怕依然是最为模糊的,因为关于如何通过引入一个新谓词来调和两类分别支持彼此矛盾的判断的证据,黑格尔本人也好,笔者的重构也罢,都没有提供任何可被程序化的细节。另外,对于自然语言是否能够始终为彼此矛盾的两个谓词找到一个调和性谓词,我们也没有确切的语言学证据。对此,一个可以想到的补救措施是引入某种统计学机制,以便就正、反两方面的证据进行计量,并由此重新分配新判断的真值(在这里笔者预设在统计学进路中,真值当然是可以被量化的)。

第五,在主体的认知欲望足够强大的情况下,我们可以假设任何一个问题都没有被彻底求解的那一天,所以笔者所刻画的黑格尔式问题求解路径才会一步步导向“绝对知识”。不难想见,如果今天的自然主义者不喜欢黑格尔式“绝对知识”提法包含肯定性的神学意蕴而宁愿姑且将其解释为某种康德式的“范导式原理”的话,那么黑格尔式的问题求解路径所会占据的计算步骤就将是无限多。这一理解无疑是符合科学史发展现实的,因为人类对于物理实在的终极理解似乎就像对于神的知识的获取一样,可望而不可及:我们既无法预估这样的终极解释方案将满足怎样的条件,更无法预估我们需要执行多少步骤才能够满足这些条件。但主流AI所说的“问题求解”却肯定不是这个意思,因为主流AI必须对任何一个问题的“被解决状态”进行预先定义,才能够反过来设计其解决流程。因此,这样的AI系统恐怕就很难理解人类科学家所经常发出的下述评论了:“这个问题貌似已经得到了尚且令人满意的解决,因此不妨暂时先写一篇论文向学界汇报——至于更深入的研究,则可以被托付给未来”。而看得更深一点,主流AI系统对于人类此类评论的不理解,恐怕又是“框架问题”在更高层面上的一个体现。换言之,主流AI系统无法理解“哪些解决标准在哪些语境中更相关或更不相关”。不得不承认,从宏观上看,黑格尔哲学在这个问题上能够给出的帮助的确有限,因为其对于“绝对知识”的最终指向,在很大程度上的确是将“问题解决”的最终标准高度理想化了,并由此脱离了日常生活的实际。不过,从微观上看,黑格尔哲学内部的高度层次感,却又为设置不同层面上的“问题解决”标准提供了某种指引,并使得一种局部模拟黑格尔哲学的AI系统可能以一种接近人类探索者的工作方式,给出“大致令人满意”的工作结果。不过,如何从黑格尔哲学的宏大结构中找到一个层次合适的片段以便为AI研究提供切实的指导,则需要AI哲学的研究者对博大精深的黑格尔哲学的细部投入更为细致的观察,而本节对《逻辑学》“是论”部分的相关挖掘工作,也仅仅是为一个更为系统的“黑格尔式人工智能哲学”的展开提供了某些预研而已。

五、 总结性评论

本文至此所完成的评论,其关照的对象虽是黑格尔,但其立足点却是AI或认知科学。而在本文的末尾,笔者将简述本项研究对于黑格尔哲学研究的反哺意义。

按照学界关于黑格尔哲学的教科书式意见,作为“哲学科学的百科全书”的核心部分,“逻辑学”体现了认识论、形而上学与逻辑学三者的统一,而并不是一部仅仅讨论认知的作品。此外,黑格尔对于康德的“现象界与智思体界截然二分”这一论点的频繁反驳,也强化了我们关于“黑格尔的逻辑学就是形而上学”的印象。与之相比较,作为整个“哲学科学的百科全书”的导论,《精神现象学》所展现的从“感性确定性”到“绝对知识”的步步演进历程,反倒是更接近于我们通常赋予“认识论研究”的那种理论形象。

但这种传统理解,显然为我们在当代哲学的词汇表中安顿黑格尔的“逻辑学”造成了巨大的障碍。譬如,按照现代哲学家对于“形而上学”的一般理解,形而上学研究的核心部分乃是本体论,而按照奎因的思想,本体论研究的核心便是对于何物存在的承诺(譬如要么对于“共相”的存在作出承诺,要么就否定这种承诺)。不过,我们如果真按照这个标准去解读《逻辑学》的话,我们又将如何找到一个明晰的“本体论承诺”的方案呢?说得具体一点,黑格尔对于“是”、“非”、变”等范畴的讨论,难道就一定只能为柏拉图主义者所独享吗?一个温和的唯名论者为何不能去使用这些范畴呢(只要他们不去设定与这些范畴对应的外部对象的存在)?很显然,对于这些问题,黑格尔自己并没有给出非常清楚的答案。这也就是说,虽然“逻辑学”本身一直被披上了“形而上学”的外衣,但是我们却很难说它是货真价实的形而上学。而更富讽刺意味的是,倘若我们真将其视为形而上学,并由此进一步断言世界中存在着像“是”与“非”这样的外部对象的话,那么这反而会使得黑格尔的整个哲学形象变得荒谬无比。此外,现代自然科学对于外部世界的发现——比如量子力学与场论所给出的那些发现——的确也对贯彻于整部《逻辑学》的主—谓词逻辑思维方式非常不利,而对彻底放弃这种思维方式的现代蕴相殊理论相对有利。

由此看来,拯救黑格尔《逻辑学》价值的唯一方法,就是仅仅承认它是一个关于认知逻辑(而不是世界自身之逻辑)的学说。而展现这种作为认知逻辑的黑格尔式逻辑学之实用价值的最有效方式,就是证明它能够比经典的一阶谓词逻辑及其变种更适合用以解决智能体所面临的认知任务。至于AI与认知科学的资源之所以在此被引进来,也正是出于如下考量:第一,有鉴于AI及认知科学与这里所说的“认知逻辑”一样,均着力于对于主体的建模而非对于世界的建模,因此,对于这些资源的引用,就为重述黑格尔的思想提供了一个合适的思想平台;第二,有鉴于经典一阶谓词逻辑的思维方式对主流AI与认知科学的深入影响,对于这些资源的引用,同时也为展现这些思维方式的缺陷(以及黑格尔式逻辑的相对魅力),提供了一个非常合适的对比对象。因此,从上述分析来看,AI与黑格尔哲学的对话,不仅仅是出于AI研究的目的,同时也将为拯救黑格尔哲学的声誉提供了良机。

当然,如果我们需要一种更彻底的方式来挽救黑格尔式逻辑的声誉的话,我们就必须诉诸于真正的计算机编程工作,并让真正的机器来执行这些程序,由此验证这样的逻辑的有效性。譬如说,这样的计算机语言需要像黑格尔式逻辑那样能够支持智能体完成从“S是P”到“S非P”再到“S是Q”的推演,由此以足够灵活的方式完成对于经验的概括。好在这样的企望并不是在痴人说梦。在AI界目前所能够提供的技术工具中,王培先生发明的“非公理化推演系统”[注]纳思系统的英文全称为“Non-Axiomatic Reasoning System”(非公理推理系统),“NARS”为其缩写,“纳思”为该缩写的汉语音译。大体而言,纳思系统乃是一个具有通用用途的计算机推理系统,而且在如下意义上与传统的推理系统有所分别:纳思系统能够对其过去的经验加以学习,并能够在资源约束的条件下对给定的问题进行实时解答。从技术角度看,纳思系统是由诸多层次的技术结构构成的(这就有点类似于黑格尔的《逻辑学》的嵌套式结构),每个层次均有其自身的推理规则,而这些规则又都基于作为一种新词项逻辑的“纳思式逻辑”。整个系统之所以被说成是“非公理的”,则是得缘于如下理由:尽管系统的构造者会在一开始为系统的每个层次预先设置一些推理规则,但他既不会将整个系统的知识库锁死,也不赋予知识库中的任何一个命题以公理的形式。毋宁说,纳思自身的知识库是可以随着系统的经验的增加而被不断修正和丰富的(这些修正本身则是在纳思推理规则的指导下进行的)。关于纳思系统的文献很多,其中最重要的是:Pei Wang, Rigid Flexibility: The Logic of Intelligence (Netherlands: Springer, 2006)。是最接近上述目的的——尽管由于篇幅的限制,本文已无法就该计算平台实现黑格尔式逻辑规划的细节进行描述了。

猜你喜欢
逻辑学谓词黑格尔
绝对者何以作为实存者?——从后期谢林对黑格尔哲学的批判来看
浅析《逻辑学》的教学方法
被遮蔽的逻辑谓词
——论胡好对逻辑谓词的误读
论马克思《黑格尔法哲学批判》的三大层次
党项语谓词前缀的分裂式
杰文斯逻辑学思想及其在中国的传播
《简单的逻辑学》
国内逻辑学教育普及理论模型的建构研究
也谈“语言是存在的家”——从语言的主词与谓词看存在的殊相与共相
简述黑格尔的哲学史观与方法论