当代智能计算机的语义困境——兼论本体论语义学

2010-03-21 00:33:03赵泽林

武汉科技大学学报（社会科学版） 2010年2期

赵泽林

(中南民族大学思想政治教育学院,湖北武汉430074)

20世纪中期诞生的人工智能是人类认识世界、改造世界史上最具影响力的事件之一。究竟如何能使智能计算机的智能表现与人没有差别?毫无疑问,这不仅是当代人工智能科学研究的中心问题,同时也是诸多人工智能研究相关领域必须面对的课题。在当今跨学科的研究中,许多专家、学者都不约而同地聚焦到了当代智能计算机的语义理解方面。当代智能计算机在语言理解上的无法实现,已经成为困扰当代智能计算机的重大问题。正视并反思这一问题成为促进人工智能相关研究获得进一步发展的必要工作。

一

回顾历史,人工智能研究并非一帆风顺。尤其是在当下,从事智能研究的专家遇到了前所未有的困境。越来越多的人认识到,要达到科研人员所确定的创造出像人一样聪明的智能机器的目标,不仅一直还只是个梦想,甚至离这个宏伟的目标似乎越来越远。弗里德曼(David Freedman)认为,“传统的人工智能研究,即希望开发出能够以高度有序、按部就班的方式进行思考的电脑系统,已经在几乎所有曾经看来大有可为的领域止步不前,这些领域包括物体识别、机器人控制、数理研究、理解故事、听懂演说以及其他许多涉及机器智能的方面。在近四十年光景里,人工智能领域并没有什么实质性的突破”[1]29。人工智能先驱者之一西蒙(Herbert Alexander Simon)在回忆他数十年来力图重创人类智能工作时认为,最令他惊讶的是做“难”的事情是多么的容易,而做“容易”的事情是多么的“难”。他的第一个人工智能程序完成于1955年,可以让计算机推导出简单的逻辑定理。从那以后,计算机的逻辑功能有了长足的进步,但至今仍无人能造出可自动穿越拥挤的房间或能理解儿童故事的智能机器来。一部分学者认为,机器具有的技能尽管非常实用,能够部分地完成和人一样的工作,有些甚至是超过了人类的智能,但与真正的智能仍是不同的。智能机器能做的原来属于人类的工作越多,越显得它们在某些方面非常突出,而在另一些方面却非常低能。

为了解决这一问题,人工智能、计算机科学和心灵哲学等学科从不同方面作了大量探讨,建立了许多新的智能理论和模型,但依然没有从根本上走出困境。要解决这一问题,我们必须回到现实的计算机世界。当代许多关心智能的哲学家和科学家都将焦点转向了智能计算机的语义理解方面。正如第一台现代计算机的缔造者冯·诺伊曼(John von Neumann)所言：“继续追踪这个课题,使我们必须探讨语言的问题。”[2]59这也许是合理的选择之一。

从语言学的角度来看,实际上,现有的计算机有两个本质特征：一是计算机的认知和操作符号仅仅基于符号的句法属性。例如：在人们常用的Word文件中,我可以利用软件的“查找”功能迅速在我的文档中定位于“福多”这个语词。我的计算机通过“福多”二字的句法结构(或者有的人会说是根据符号形式)认知了这些符号。而并不必惊奇却常常被我们所忽视的特别重要的事实,是计算机不能通过符号的语义来认知这些符号。所有现有的计算机并不知道“福多”究竟指向的是什么,它并不知道它所“查找”到的“福多”究竟指向的是一个哲学家还是一只猫。如此一来,经过多年成长的计算机原来笨得出奇。因此,通过符号的句法与语义属性,人们可以将计算机的智能与人的智能明晰地分离开。计算机只是一个“句法引擎”,它基于符号的句法属性来驱动计算机模拟人的认知行为和达到对符号的操作。

计算机的认知和符号操作过程是基于符号的句法属性进行的,这一点业已被许多哲学家类似于中文屋的思想试验所证明。尽管计算机能对符号进行特定的排列,甚至对符号的排列关联到了这些符号的语义属性,但是,它并不能合理地得到这些符号所必然推理出的语义真值。计算机可以很容易地对符号作出如下有序排列：①所有的哲学家都很幸福;②福多是一个哲学家;③福多很幸福。计算机对这些符号通过句法属性能够排列得很规范,但它并不是通过符号的语义属性达到了第③个结论。毕竟,计算机不知道福多是谁,也不知道什么是哲学家,更不知道什么是幸福。当然,计算机也可以完成从①和②得到③的处理,不过,计算机进行这种转换处理是在这个意义上完成的：前两个复杂符号串为第三个符号串提供了前提的句法条件和形式证据。这个例子表明,计算机能够通过适当的程序完成某些合理的推理,但是,计算机却不能自明地知道,在这一处理过程中蕴含了这样一种逻辑：如果①和②的语义为真值,则③的语义为真值。这些连小学生都显而易见的语义逻辑关系并不被计算机本身所“发现”。

如此一来,无论是对于单个符号的处理,还是一串符号的整体处理,计算机都无法明知其义。因此,“我想强调的是,意义在计算机系统怎样工作中并不起作用。计算机是基于物理装置之上的一系列编码形式符号操作,但是这种编码并不像‘意义’”[3]195。计算机基于符号的句法属性达到了对符号的操作和“认知”,不过,这种认知却有着明显的缺陷,它一直缺乏对符号真值的语义理解。正因如此,计算机的智能对人的智能大有可望而不可及之势。对比人类智能的心灵而言,“意向性是心灵的一个重要特征——即使不是别的心灵的重要特征,也是人类心灵的重要特征。……它是‘关于’(或表征)某些现实的、可能的和不可能的非心理的、心理的事物和事态的东西”[4]665。简言之,如果我有一个关于布什的想法,这是因为,这个想法是与指向布什的心理语义表征相关联的;如果我思考“布什在2006年是总统”,这是因为,这个想法是一个特殊的功能关联(相信的特性),即它有一个内容是“布什在2006年是总统”的语义内容本身及其“相信”的内容必然存在。然而,计算机并不能像人类一样理解蕴含在自然语言中的语义内容,计算机最终把所有的信息都当作0、1的字符串进行简单的形式处理。如何使具有本体地位的语义信息能够成为机器可理解的呢?这一问题的研究将决定计算机智能的发展命运。

二

虽然语义内容究竟产生于外部世界还是内部世界在哲学界仍有争议,但“一个人在进行自然语言交流时都会加上社会角色的信息”[5]216已被广泛认可,说明人的语言表达与语义间存在着必然的联系,语义内容具有实在性。然而,在本体论上,整个世界并不能被最终化解为无数离散的原子事实,也不能被分解为类似于电流的通与断的两种基本情况。柏拉图、莱布尼兹、罗素等哲学传统承认世界可以分为最终的“经验的原子”或者其他“原子事实”。海德格尔(Martin Heidegger)把它称为“计算思维”,认为这种“事物可彻底计算性”排斥了人的存在。现实也表明,人栖身的人类世界是人的目的和目标所组织起来的各种工具相互作用的聚合模型,这种聚合模型有着对歧义的容忍性和对自然的特殊灵活性。计算机并不能够实现人类世界道德上的、实践上的不确定性。这是否表明智能计算机完全不可能实现呢?世界万物是普遍联系的。坚持计算主义的哲学家认为,意识空间里所有本体的相互联系就是用计算来精确表达的,即计算的本质是脱离生物体的意识系统,是一种人所具有的对世界的抽象现象。计算就是通过人脑实现的本体以及本体的相互关系的抽象表达,即计算精确刻画本体及本体的联系。这里人们一定会提出质疑：意识是什么尚未搞懂,如何来用计算表达?然而,人类的认识总是一步一步地向前发展的。语言是(显式)意识的表达,人们可以从语言的规律窥探意识的本质。语言并非仅是符号系统,现代语法学家认为自然语言符号理论包括语义学和语用学两个基本维度。

在已有的计算机时代,人们恰恰忽略了语言的语义部分,而仅仅只是强调了计算机程序语言的“替代标示”功能。这实际上是只发挥了语言的语用方面。然而,更为重要的另一个问题焦点是语义本体。就本体而言,这个上古的哲学概念至今仍为计算机工程界的科学家们所津津乐道。物理世界的“个体”可以是你所关心的任意对象：一座相对静止的房子,一架飞行中的飞机,甚至一只正在捕捉昆虫的青蛙。而意识主观空间里的“个体”也是“本体”之一,因为意识主观空间中的“印像”是你意识到的一种真正存在。但意识空间并不就是物理世界的简单映像,本体并不就是“个体”的简单概念化和心理图式化。虽然所有的个体都可能在意识空间里有本体,但反之不成立,并不是意识空间里的本体都与物理世界的个体相对应,即有些本体没有原像,例如“独角兽”。意识对客观物理世界有自己独特的分解与重构过程;计算机领域的软件工程之需求分析的任务正是用计算机的语言来对应用环境的分解与重构,即重新认识与重新构造客观物理世界。然而,这里一直被智能计算机科学家们所遗忘的意识的主观部分(客观存在的主观特性,例如,对对象能动地解构与重构)本身我们该怎样描述呢?

现有计算机程序设计语言实际上提出了表达符号的语义学要求。因为现有程序设计语言是对客观物理世界的描述,程序代码仅在于从形式上替代物理世界的外在个体,代码与物理世界个体的关系在于简单地“替代”而不是“解构与重构”。而语义学研究符号系统里面主观的逻辑因素,即意识的主观方面。维特根斯坦(Ludwig Wittgenstein)认为：“‘一个词的意义乃是对该意义的说明所说明的东西。’即：如果你要理解‘意义’这个词的使用,就要去找被称为‘对意义的说明’的东西。”[6]226回到产生意识的大脑,描述大脑中央神经系统真正使用什么样的语言,我们现有的数学式的程序代码语言是不完全满足要求的。现有描述体系并不能清晰地描述整个世界,必须将语义置于本体论地位寻找新的描述方法,这是语义在本体概念的升华。新的程序设计语言就应该是符号语法理论里面所阐述的语义学语言,它赋予了计算机使用语言时的能动主观因素,计算机通过这种语言语义的操作(解构与重构)而达到智能。如果就语言处理领域而言,计算机智能的基本目标之一就是要达到计算机能够如人一样地进行自然语言的处理。

自然语言处理(natural language processing,NLP)的研究成果在早期主要是应用于机器翻译,而最近被尝试性地应用于问题解答和基于文本意义的理解。如果这些目标不能达成,很难说人们在NLP取得了真正的突破。本体论语义学(ontological semantics)正是要使计算机通过语义理解来完成自然语言的处理,这项新的研究正受到与日俱增的关注。本体论语义学是一套复杂的理论,包含新的方法论和描述理论。这是因为在计算机领域讨论本体,首先就面临着本体究竟是如何描述的,亦即概念的形式化问题。对应的具体研究内容就是本体的描述语言及描述方法。“本体论语义学的理论是对一系列现象有明显限制和声明的形式化描述意义的理论处理”[7]XIV。它包含获得一系列与准确而适当描述相联系的方法,并利用这些理论,对计算机系统能够解决在文本处理过程中的种种特殊问题作出合适的描述。本体论语义学的实现还与像机器翻译或者信息提取等其他一些信息处理系统的应用技术紧紧联系在一起。本体论语义学真的能帮助实现真正的计算机智能吗?

三

著名心灵哲学家塞尔(John R·Searle)认为,“诸如意义、理解、解释、信念、欲望与经验等的意向现象,只有在一系列本身不是意向的背景能力中起作用。”[8]146进而,他认为,一个人对言语的直接的、正常的和即时的理解总是只相对于一个背景而成为可能的,但不能从此得出结论说,在正常的理解中有某个单独的逻辑步骤、某个单独的解释行为,而是从不断增长的知识库中的选择与提炼行为。人类对语言的处理是一个复杂的系统处理。要使计算机能够如人一样的处理语言,首先我们应该建立合适的模型。在这方面,本体论语义学的倡导者尼伦伯格(S·Nirenburg)和拉斯金(V·Raskin)具有前瞻性的研究,为人们提供了较为成熟的范例。

本体论语义学试图像一个精神分析家一样建立一个自然语言处理模型。要建立一个有效的自然语言处理系统,最好用智能代理者作为隐喻,这个模型的整体是一个智能代理。因此,所建立的理论必须说明这个智能代理者作为整个的和倾向的行为,要能充分体现意识的种种主观特性。每一个语言行为都是由这些部分组成的：动词性的行为、知觉、心理活动和物理行为,构成智能代理者的整个有效作用的行为。这个智能代理者必须能够记住在应对现实实体世界每件事情的态度和客观物体的相关知识,在它的记忆里建立一个相应的背景知识库。不仅仅这些态度经常决定了一些发现,而且它们影响到其他行为的发现方式。我们要强调的是在认知过程中的背景知识库的意义表征理论,而不是像现有计算机那样仅仅是一个单纯的逻辑处理者。基于简单的基本术语,我们可以描述智能代理者系统中的每个成员,并且每个成员行为又受到整体的影响。这个代理者系统至少包含两个基本单位,一是讨论的产品(文本、语音),二是讨论者(文本、语音的阅读者)。而不是像现有计算机那样仅仅只有第一种单位的形式系统。两个单位的交流环境包含了讨论自身是在某个环境中、或在某篇文本中,更多的时候是在不规则变化的情景下。变化的环境信息不断地指导讨论者的行为倾向并最终引起智能代理者的整体行为变化。

根据最满意的自然语言处理模型：先是对文本的意义进行表征,形成合适的文本;进而进行词汇和句法选择,经过语形实现后,形成有序而准确无误的语言输出,我们可以为意义处理建立一个适当的平面模型。模型分为文本或语音输入、分析处理、文本意义表征三个基本层次。这三个层次构成了一个完整的语义分析网络。第二个分析处理模块是最为重要的核心层次,这个层次包括了对语言的生态学分析处理、语形、语法、句法、语义的处理,并将这些处理结果按各自不同而适当的意义表征规则直接转换为意义表征,最终由第三个层次输出意义表征。在这个平面模型中,各个局部的模块都同时会产生各自的操作和记录响应信息。因为有些反应“缓慢”的模块经常需要“先前”完成的模块维持内部系统自动地调整或者消除有歧义的候选分析。无论如何,这些模块都会产生一个局部结果,这些单个模块的操作规则及结果为下一步的意义表征规则提供了基础,为语义的形式化提供了必要条件。系统的适当性将在动态的规则调整中不断生成,并最终生成可供输出的文本意义表征。然而,意义该如何表征呢?这就需要人们找出语义的本体,并采用适当的语言和方法来解构和重构本体,将自然语言的语义本体概念化;明确给出概念及它们之间联系都被精确定义(确定语义与世界关系);用精确的数学描述形式化(让语义表征能被计算机所学习),并使得本体中反映的知识被使用者共同认可,可供人机共享与交流。

由此,意义表征的产生是经过了这样几个步骤的：首先是对目标的整体知觉发现,对这些目标进行环境、概念分析,初步确定其产生意义的范围和可能的组织结构;然后对先前环境的初步分析,进行提取必要的原始数据,并按不同规则的分析分类,形成不同的意义表征规则,从这些意义表征中形成初步的语义本体;最后进行必要的精确和优化工作,形成意义表征输出。值得注意的是,如何找到一种体系庞大而非常灵活的知识描述语言而能为各个层次服务呢?至今,已经有许多计算机专家在为此而努力。正是如此,当冯·诺伊曼计算机还没有建立起合适的意义表征策略时,智能计算机就将始终面临着语义理解的困境。因为,没有对知识环境的生态学分析,就不会有关于“福多也是哲学家”等背景知识的分析;进而,就无法破解智能计算机对语言意义的理解难题。这种智能计算机的智能就不是真正意义上的“智能”。

智能计算机在现有科技条件下并不能如我一样地思考,因为这台计算机原来遗漏了语言本身的许多重要部分,至少它忽略了语言中重要的语义表征,而这恰恰是人与当代计算机重大而具有本质意义的区别。当代已有的智能计算机只是注重了语言处理的形式化方面,而忽略了语言重要的语义方面,人类还未教会它如何对语义本体进行精确的意义表征。如何消除这些区别将是决定未来智能计算机能否真正实现的重要问题,是当前人工智能发展的瓶颈问题。即使是反映当前自然语言处理最新思路的本体论语义学也面临着一些理论上的难题。本体论语义学尽管是为了回应塞尔中文屋论证和其他关于人工智能责难而提出的一种方案,但仍会受到这样的责难：它的自然语言系统所处理的意义和所生成的意义,好像仍离不开设计操作人员的解释。如果是这样,那么它充其量只有派生的意向性、语义性。其次,最大的问题是：这种理论建立的系统仍没有主动性、自觉性、意识性、目的性,而这些性质恰恰是人类智能固有的特征。因此,要让机器成为像人类那样有智能的自主系统看来还有很长的路要走。由此可见,当代智能计算机所面临的困境并没有得到彻底解决。“语言是存在的家”。未来的人工智能计算机研究首先要能够建立语言符号的语义认知智能实现方案,这个方案的实现必将推动人工智能的巨大发展,也必将是一次重大的科技革命。

[1] 戴维·弗里德曼.制脑者[M].张陌,译.上海：三联书店,2001.

[2] 冯·诺伊曼.计算机与人脑[M].甘子玉,译.北京：商务印书馆,2002.

[3] Drew McDermott.Mind and mechanism[M].London：The MIT Press,2001.

[4] 普莱尔·雅各布.心灵能做什么：非意向世界中的意向性[M]//高新民,储昭华.心灵哲学.北京：商务印书馆,2002.

[5] Alexander Riegler.Understanding representation in the cognitive sciences[M].New York：Kluwer Academic/Plenum Publishers,1999.

[6] 维特根斯坦.哲学研究[M].李步楼,译.北京：商务印书馆,2004.

[7] Sergei Nirenburg,Victor Raskin.Ontological semantics[M].London：The MIT Press,2004.

[8] 塞尔.心灵的再发现[M].王巍,译.北京：中国人民大学出版社,2005.