方 芳,刘成科
(1.中国科学技术大学 人文与社会科学学院,合肥 230026;2.合肥学院 外国语学院, 合肥 230601;3.安徽农业大学 外国语学院,合肥 230036 )
机器智能(1)本文用“机器智能”代替“人工智能”的提法,理由是机器智能体无法完全模拟人类的生物属性,而是有其独特的思维特征和运行方式。是一个具有无限可能的领域,自20世纪50年代开始,经历了通用问题求解、专家系统等发展阶段之后,目前已掀起第三次基于深度学习技术的浪潮。随着生物识别、自然语言处理、大数据驱动等智能技术的不断发展和深入,机器智能的各个领域取得了重要突破。而在机器智能研究发展的过程中,“智能”的概念也在发生着变化,从对人类解决问题能力形式上的模仿过渡到一种深层次的模拟。
那么,究竟何谓“智能”?当前一些观点认为“智能”是指像人脑那样解决问题的能力。初始阶段,受时代和技术限制,“智能”被简化为“解决问题的能力”,而问题的解决过程不甚明了,好似被置于一个“黑匣子”当中,研究者不问中间过程,只问结果。2017年,AlphaGo Zero击败人类棋手,成为机器智能领域划时代的事件,从这一突破来看,“智能”已经不再限于“解决问题的能力”,而是增加了一个重要的前提——在资源有限的前提下。
当前机器智能的发展显得有些无序,其根本原因是对“智能”的理解差异,有关“智能”的哲学信念决定了它今后的发展方向,只有方向正确,技术才能有真正意义上的突破。Hammer把“智能”看作是“一个适应系统在知识和资源不足的条件下工作的能力”[1]。实际上,“智能”不是解决具体问题的能力,而是在不同情境和条件下应对问题的元能力,简单来说,是否“智能”不在于能做什么,而在于在什么条件下做到[2]。我们认为,AlphaGo Zero的设计符合新的智能定义。它的胜利标志着机器智能离人类智能又近了一步,搁置已久的“黑匣子”有可能在第四次浪潮中被打开。
按照图灵的分类,人工智能涉及到三个层面:知识层(knowledge level)、数据层(data level)和现实层(reality level),不涉及现实层的研究属于机器思维研究。为了使问题的讨论更加聚焦,本文只涉及机器思维层面,即从哲学层面展开分析和讨论,寻找机器智能研究新路向的哲学基础,暂不考虑感知和行动能力等更为复杂的情况。
机器智能的发展历经符号主义(symbolism)、联结主义(connectionism)和行为主义(behaviorism)三种范式[3]。符号主义路线用符号来表示知识,在计算机上通过处理符号来模拟人的认知过程,于是发展出基于规则的机器智能系统。这种路线的局限在于,有限的规则无法对人类的知识(比如自然语言处理中的语形)进行全面的概括。联结主义路线是对人的脑结构的一种模拟,这种路线的局限在于没有把“语义”考虑在内,而是过于依赖高质量的语料库。自然语言的翻译,不仅要求具有词汇和语法的知识,而且需要语义知识,抛开了“语义”也只能是一种形式上的智能模拟。行为主义路线也是一种模拟,模拟的是人的感知和行动,在智能体的意向性不参与其中的情况下,这种模拟只能是一种高层次的“刺激—反应”。对于机器思维方面的研究来说,符号主义和联结主义是主要的两种范式。下面以机器翻译为例来说明这些范式存在的局限性。
机器翻译(Machine Translation,MT)开始于利用机器实现自然语言之间自动转换的奇思妙想。MT属于机器智能研究的一个子领域,也是机器智能研究的开端。从基于规则的机器翻译到统计机器翻译对规则的突破,再到神经网络机器翻译,机器翻译的质量得到了很大提升。机器翻译是不是已经实现了真正意义上的智能化?如果把“智能”定义为“有限资源”条件下“适应新环境”的能力,以机器翻译为代表的机器智能还远未达到智能化的目标。即便是技术上不断取得突破的深层神经网络技术,仍然存在着至少以下3个方面的问题:
一是机器翻译的质量取决于语料库的成熟度。信息资源的不断累积以及其他信息技术手段的不断突破,使得人的智慧得以以一种前所未有的方式呈现出来。当前的机器翻译还只能说是“人类智能”的体现,而非“机器智能”的体现。一个有力的证据是,对于语料资源有限的小语种而言(如Google系统中的德语、日语等翻译),机器翻译的质量要逊色许多。只有在语料库技术得到飞速发展之后,机器翻译才有突破的可能。这样看来,这只是“人类智能”换了一种呈现方式,而不是实现了真正意义上的“智能”。
二是机器翻译无法用语言学理论解释。当前的统计翻译技术,在不涉及语言学理论的情况下,依靠大数据、统计技术和深度学习能力就可以成功地实现。它的基本原理是,先将输入端的概念或语词用词向量表示,再基于数学统计模型,通过一套复杂的计算方法,输出目标语言的翻译结果。这种翻译技术的实现秘诀在于“词向量”表示,而用“词向量”来表达语词网络,充其量是一种数据的关系表示,其背后并没有语言学理论作为支撑。
“词向量”的概念来源于语言学中的“价值”(value)和“分布”(distribution)的概念[4]。价值和分布虽无法计算,但有了词向量的表示和统计方法,且基于不断改进的语言模型计算,甚至可表示出单词之间在多大程度上是接近的。一个常用的表示方法是词向量夹角的余弦值,余弦值越大,单词的相近程度越高。比如,“桌子”与“椅子”的相近程度高于“桌子”与“医生”的相近程度。
三是机器翻译没有解决语义问题。从当前来看,似乎绕开了语义问题机器智能也能有令人惊喜的表现。如果机器智能模拟的是人类在有限的资源和条件下智能体适应新环境的能力,那么,机译研究的起点首先不应当是某种给定的、僵死的词汇或句法结构,也不应当是完全脱离语言的向量化的关系表示,而应当是语言和生活世界之间的那种初始的关联。机器翻译的语义问题没有解决,就不能说是达到了“智能”的程度。规则翻译法重视句法,但忽略了语义;统计翻译法从形式上保留了句法,但核心是“数据”;两者都抛开了“语义”。即便是到了神经网络翻译阶段,也只是在数据挖掘和建模的方法上更加巧妙而已。现阶段,把“句法”和“语义”分割开来是一种无奈之举,但哲学的思考却告诉我们,两者有着不可分割的联系。
从语言层面来看,规则进路的机器翻译主要基于乔姆斯基的规则转换,而统计进路的机器翻译所实现的是索绪尔所说的“关系”系统。索绪尔的语言学更加强调结构关系,或者说句法关系。索绪尔认为,语言无本质,语言符号的价值存在于系统中,存在于系统中各要素之间的关系中。统计进路比规则进路前进了一大步。以神经网络翻译为代表的统计进路用巧妙的方式绕过了一些难题(框架难题、认知难题以及意向性问题等),提升了翻译质量。但正是这种规避难题的解决方式反而背离了“智能化”的初衷。其中,最关键的问题是“输入贫乏”问题。真正意义上的“智能”是在有限输入的条件下解决问题,并从问题解决中获得知识和经验。这个过程和人类儿童习得语言的过程类似。在这一领域想要有所突破,不能不考虑语义问题。
当前,机器智能研究领域出现了“语义进路的联结主义”新范式,这是机器智能研究在经过长期探索后出现的新路向。新范式开始考虑语义问题,这是区别于基于统计的神经网络机器翻译的关键之处。仍以机器翻译为例来说明。所谓语义问题首先是概念(语词)用什么方式得到表征的问题。亚里士多德以来,对语词采用“属加种差”的界定方式存在着弊端,取而代之的应当是“百科全书式”的语义观。语义的表征应当是基于某个特定视角的[5];其次,要把泛在的联结主义转向限定的联结主义,否则就无法解决“输入贫乏”问题。维特根斯坦的语言哲学为新范式提供了哲学上的解释。
维特根斯坦的后期哲学已经蕴含着关于机器智能的真知灼见。维氏所处的时代正逢机器智能的萌芽时期,他虽然没有见证真正意义上的机器智能,却捕捉到了它出现的迹象。在《哲学研究》《哲学语法》和《蓝皮书》中,维氏对此都有所提及。机器智能的关键是,如何让智能体具有生命体才独有的思维。直觉和常识告诉我们,硅胶材料制造出的智能体无法完全达到生物学意义上的智能,而一直纠缠于感觉、意向性等问题会陷于僵局之中,因为,机器智能中的智能体需要有理解的能力,完全抛开“语义”的智能不是真正意义上的智能。在两难的情形下,维特根斯坦的语言哲学中的一些观点为机器智能问题提供了重要的哲学启思:
其一,在对“智能”概念的外延意义解释方面。很多时候,我们是在错误地使用语言,对“智能”的理解上产生了偏差。“我们的语言可以被看作是一座老城,错综的小巷和广场,新旧房舍,以及在不同时期增建改建过的房舍。这座老城四周是一个个新城区,街道笔直规则,房舍整齐划一”[6]。机器智能与人类智能属于不同的语言游戏,有各自的游戏规则,只要遵守规则,便可参与到游戏之中。机器智能甚至有可能具备人类智能所不具备的特点。维氏对机器智能完全模拟人类智能是持否定态度的,但对机器智能的“游戏”,维氏却并没有提出反对。
其二,对语义的强调方面。与索绪尔不同的是,维氏强调动态的“语义”。他提出的语言的意义在于用法,更符合世界的真实情况。维氏认为,语言自身不但无本质可言,并且意义也是随着语境的变化而改变的。后期维氏的“语言游戏”说把包括意义“用法论”在内的核心思想贯穿在他的整个哲学中。
其三,对“关系”问题的洞见方面。在以《哲学研究》为代表的后期哲学思想中,维氏主要关注认识的过程。在他看来,人对事物的认识过程是一种相伴而生的内、外在关系的“语言游戏”。
维特根斯坦后期哲学的核心思想是他提出的“语言是一种游戏”的观点。维氏用“家族相似”“生活形式”等概念来阐释他的“语言游戏”。近年来,哈尔克(M T Hark)、马查(Mácha)等学者发现,“语言游戏”的底层是他对语词(概念)所涉及的“关系”的解释。维氏在《哲学研究》《论颜色》以及未发表的遗著中都讨论过关系问题。大多关于“语言游戏”的讨论是将其作为真实的生活图景来描述,强调游戏自然性的一面,却忽略了游戏创建性的一面。维氏对语词(概念)所涉及内、外在关系的讨论,揭示出游戏创建的动态过程。综观维特根斯坦不同时期的论著中的观点,他的“关系”思想可以主要概括为:
关系是一个系统;“语言游戏”是内、外在关系的游戏;语词充当了内、外在关系的粘合剂;内在关系可存在于复合物中;内在关系只在概念之间实现,是一种语法关系;内在关系来自于实践;内在关系无中介;我们只能认识关系, 而不能认识事物的属性。
以上观点可以进一步概括为:1.对内在关系性质的界定。“内在关系”只存在于概念之间,即只能在语法中建构。“内在关系”既不是抽象的形而上的存在,也并非是以心理为中介,而是来自于人类实践。维氏把“实践”引入意向性,用对预期行动的估算的解释来替代因果解释。2.对外在关系层次的划分。外在关系存在于概念之间、概念与对象之间或对象之间。3.内外在关系的相互作用。内外在关系是一种语言游戏,同一描述可以属于不同的语言游戏。4.维氏关于遵守规则的解释。遵守规则并非是人们的约定,而是人们的反应方式、行为方式的一致。
我们认为,维氏语言哲学中的一些观点具有前瞻性,对一些科学问题的出现及解决具有启发意义。“语义的联结主义”是一种兼顾基于实践的动态“语义”(即“用法”意义观)和“网络”的联结,而不是一种形式上的仅仅基于统计规则和运算的“联结主义”。维氏的思想带有一种综合的气质,同时具备了“基于统计”“基于规则”和“基于实例”等理论倾向,却又不能简单归结为其中任何一个[7]。这种综合气质源自于他对人的认识过程的深刻洞察。就机器智能领域而言,他的“关系”思想可为当前的“语义的联结主义”提供哲学支撑。
“框架问题”一直是机器智能研究领域的一个瓶颈问题,而维氏的“关系”思想有助于解决一直困扰机器智能研究的“框架问题”。智能体在完成一个动作后,引起某种环境上的变化,或者说,智能体的行动(action)会产生某种效果(effect),在设计智能系统时,需要表征出这种变化或者效果。比如,把茶杯放在一个摇晃的架子上,架子倒了。架子的倾倒和放茶杯是有关联的,是需要被表征的。而此时,一只幼鸟被风从树上吹落到了地上,幼鸟的掉落和前一个行动并没有直接关联,不需要被表征。这就存在一个表征的界限的问题。对于人类而言,通过常识推理很容易推知哪些事情会发生变化,而哪些事情不受其影响。但当机器面对动态的、开放的世界时,由于世界时刻处于动态变化之中,如何避免表征那些不是因为行动所带来的变化?这时,框架问题便成了一个棘手的问题。
智能体虽无法完全拥有人类智能,却可以在机器智能的“语言游戏”中,以类似于人类的方式完成对世界的建构。维氏提出的语言和行为(实践)交织而成的“语言游戏”,为机器智能提供了一种不同于规则进路和统计学进路的潜在解决方案。这个方案的独特之处在于其模拟了人的认识过程,既有理性抽象又有经验尝试。理性的一面体现在,其给出了“语言规则”,但不是规则进路那种“僵死的框架”。维氏告诉我们,我们需要的是具有一定开放性的规则,在内、外关系的相互作用中既有“立”又有“破”。经验的一面表现在“实践”上,在实践中对从“关系”中抽象出的规则不断进行调整和扩展。一旦规则被确定下来,就应当至少暂时认定它的可接受性。维氏通过“老师”与“学生”的比喻强调接受现有规则的重要性[8]。如果学生不断质疑事物是否存在或对字词的意义究竟如何发问,整个知识传授的过程就无法正常进行。因此,学生先要认可老师所定义的语义规则。
已有学者对维氏晚期哲学中的“关系”思想有所探讨。徐英瑾认为,维特根斯坦用他独特的方式为机器智能问题,尤其是最令人困扰的“框架问题”提供了一种统一解决方案。他将维氏的思想重述为:信念网络中节点之间的远近关系是由联结的权重决定的;信念网络是开放的,可以通过某些方式丰富信息;在经历学习过程后,结构会表现出一种稳定性,即系统具有收敛性;语义推理的结果需要有贮存的机制,以保证信息处理的稳定性[9]。这些观点已经在机器智能领域的非公理推理系统(2)非公理推理系统,如美国天普大学王培教授开发的纳思系统(NARS)。中初步实现。
如前所述,维氏的“关系”思想兼顾了“语义”和“联结主义”,是两者的结合。基于此,可以把机器智能设想为一个开放的,在某个时空中具有一定稳定性的信念网络系统,网络中的节点之间的远近关系是由联结的权重决定的。重要的是,信念网络是基于“语义”的,而不是抛开语义完全依赖于数据和计算的“黑箱”。我们认为,相较于以往任何一种范式,“语义的联结主义”更接近于人类认知世界的方式。
新范式在纳思系统中得到了初步的实现。纳思系统(NARS)是美国天普大学王培开发的一种非公理推理系统。一般而言,系统一旦预先设定了某些规则,这些规则就被确定下来并在系统运行的整个过程中发挥作用。“非公理”纳思系统尽管预先设定一些规则,但这些规则却是开放的。随着系统经验的增长,这些规则会不断得到修正以适应新的情境。纳思系统的一个突出特点是,系统具有较强的学习能力,并且能够在资源有限的条件下寻找问题的求解方法。在实现的原理上,不同于统计学进路的神经网络技术,神经网络技术发挥作用的前提是占有丰富的语料资源。当语料贫乏时,系统就无法进行有效的深度学习。
由于纳思进路把语义网络考虑在内,因而较好地解决了“框架问题”。纳思是一种基于经验的语义学理论的机器智能系统。在纳思语义网中,任何一个词项的涵义,都会随着系统学习经验的不断丰富而得到修正[10]。语义网中用“继承关系”来实现它的可计算化。由此,纳思系统解决了由于输入有限带来的系统输出质量不高的问题。此外,纳思系统模拟了人类智能结构的设计,既有规则推理的逻辑系统也包括负责规则的实际应用的控制系统。从工作原理来看,纳思系统更接近于真正意义上的人类智能。
综上,“智能”的概念在发生着变化,从对人类解决问题能力形式上的模仿过渡到一种深层次的模拟。“语义进路的联结主义”是优于符号主义、联结主义或两者简单结合的范式。未来智能技术是否会有更大的突破?这仍然是个未解的问题。对机器智能的未来作出准确预测仍然为时过早,但可以有所预见的是:基于神经网络和深度学习的机器智能技术的发展缺乏可持续性。机器智能领域如想有所突破,潜在的新进路或许是“语义进路的联结主义”。我们认为,维氏语言观及“关系”思想为第四代浪潮下机器智能的发展提供了重要的哲学启示。当然,这一进路还处在探索阶段,实现真正意义上的智能化,需要语言学、机器智能领域专家联手在此领域展开深入研究。