人机对话系统的困境与解决

2022-03-22 16:23:13张帆

哲学分析 2022年6期

张帆

自20世纪70年代人机对话系统开发以来，尽管计算机科学界一直在调整技术路线，以期实现人与计算机之间流畅的对话的目标，但迄今为止该目标仍未能得以实现。在反思已有的技术策略基础上，计算机科学界强调人机对话应当以人类对话为模本，回归到对“对话”本性的反思上。其中，涉及对对话的内在本性及其社会性的反思两部分。

一、人机对话系统及其当前困境

人机对话系统，作为人机交互方式的一种，目前在技术上已经实现了从“对话智能体”（conversational agent）到“涉身对话智能”（embodied conversational agent）的技术转型，反映出计算机科学界在对于“对话”的理解上已经不再把对话视为语言的交互，而将其视作一种社会技能的这一根本性转变。

所谓“对话智能体”，是一种通过语言输入、输出形式来实现人与机器对话的一种对话系统。该系统主要以1966年由美国麻省理工学院的计算机教授约瑟夫·维森鲍姆（Joseph Weizenbaum）所开发的人机对话软件“伊莉莎”（ELIZA）为代表。它是维森鲍姆在IBM7094计算机上使用“MAD-SLIP”语言开发出来的人机对话软件。虽然，当时已经有一些数字语言生成器了，但是“伊莉莎”程序是第一个成功实现了人机对话的计算机软件。

“伊莉莎”软件的设计非常简单，所有程序加起来一共不过二百多行。原理就是在编写“伊莉莎”程序之前尽可能预设所有在对话中可能会遇到的问题，然后根据这些问题将答案以编程的形式来编写“伊莉莎”程序。具体说来，就是以用户输入的文本作为脚本，从中提取关键词，然后针对提取的关键词作出系统反馈。然而，“伊莉莎”软件一经问世，它的对话效果却出奇的好。在“伊莉莎”软件刚问世的几年间，它被放在麻省理工学院的人工智能实验室里，当时就吸引了很多学术界和新闻界的人来和“伊莉莎”对话。甚至于，维森鲍姆的一个女秘书和“伊莉莎”软件对话成瘾，每天都要来和它对话。而“伊莉莎”软件的设计者维森鲍姆则把“伊莉莎”的成功主要归功于其所使用的语言——他是仿造心理学家卡尔·罗杰斯（Carl Rogerians）的语言风格来设计“伊莉莎”软件的，他说：“之所以选择这种对话模式是因为，心理学的对话模式是一种少有的二元语言交流模式，能够允许一方的对话者对这个世界几乎一无所知。”①Joseph Weizenbaum，“ ELIZA—A Computer Programme for the Study of Natural Language Communication Between Man and Machine”， Communications of the ACM， Vol. 9， No. 1， 1966， p. 42.同时，维森鲍姆也认识到“伊莉莎的‘理解’能力是有限的，这仅针对伊莉莎而言的，不涉及其他程序。……到目前为止，在伊莉莎的使用中，其主要目标之一就是要掩盖其缺乏理解”②Ibid.， p. 43.。

鉴于以“伊莉莎”为代表的对话软件的成功，使得“对话智能体”技术在人机对话的系统的开发上占据了很长时间。但是，随着人机对话系统的使用日益普及，“对话智能体”技术囿于问题域的局限性使得其对话“适应性”（adaptivity）的缺陷逐渐暴露出来。特别是在受到奥斯汀和塞尔等语言哲学家的影响下，计算机科学界逐渐把“言语行动”理念同人机对话系统联系起来，追求人机对话系统要达到一种类似于人与人之间对话的“全面沟通”（full-blown communication）的目标——“所谓全面沟通是指在信息传输时，（人）智能体有一定程度的意识，能够进行全面的交流。”①Kristiina Jokinen， Constructive Dialogue Modelling， Chichester：John Wiley & Sons， Ltd， 2009， p. 65.在此背景下，在计算机科学中开始强调“成员之间的对话包含了来源于不同经验所形成的认知差异——掌握和实践技能”②Bo Göranzon，“ The Practice of the Use of Computers. A Paradoxical Encounter between Different Traditions of Knowledge”， in Bo Goranzon and Ingela Josefson（eds）， Knowledge， Skill and Artificial Intelligence， London：Springer-Verlag， 1988， p. 16.。于是，开发出了第二代人机对话技术——“涉身对话智能体”，“通过对人类行为模式的研究，包括手势和言语的研究，形成了一个多模态系统，从而产生了涉身对话智能体。它们是‘计算机生成的卡通人物，在面对面对话中表现出许多与人类相同的特性，产生出语言和非语言交流的能力，并能作出反应’。伊莉莎使用的是文本、而涉身对话智能体使用的则是图形，展示出‘对话的视觉特征，就像人类面对面对话中的脸和手一样’”③Satinder Gill， Tacit Engagement， Cham：Springer， 2015， p. 4.。

人机对话系统的“涉身对话智能体”技术的实施主要分两个阶段：在早期阶段，主要是奠定了“涉身对话智能体”技术要以人与人之间的对话为范本这一基本信条，并且强调要尽量捕捉人类对话的要素，输入到“涉身对话智能体”技术中去。例如，1976年，美国麻省理工学院的计算机教授尼克尔森（Raymond Nickerson）将人类的对话要素概括为16点④包括双向性（bidirectionality）、混合主导（mixed initiative）、是由谁在控制的显现（apparentness of who is in control）、控制权转移的规则（rules for transfer of control）、存在感（sense of presence）、非言语交互（nonverbal communication）、不能冷场（intolerance for silence）、结构（structure）、时间尺度的特征（characteristic time scale）、宽带（Wide bandwidth）、非正式语言（informal language）、共享的情境化语境（shared situational context）、共享的特殊知识的历史（Shared special knowledge History）、参与者的状态（peer status of participants）。参见Raymond Nickerson，“ On Conversational Interaction with Computers”，in Proceedings of the ACM/SIGGRAPH Workshop on Useroriented Design of Interactive Graphics Systems（ UODIGS ’76）， New York：Association for Computing Machinery， October 14， 1976， pp. 101—113。。在尼克尔森的基础上，2000年，同为麻省理工学院的贾斯汀·卡塞尔（Justine Casell）认为“人类的对话技能能够实现是基于其独特的身体的功能可见性（affordance）”⑤Justine Cassell， Joseph Sullivan， Scott Prevost and Elizabeth Churchill， Embodied Conversational Agents， MA.Cambridge： the MIT Press， 2000， p. 1.。因此，卡塞尔强调机器要想模仿人类实现良好的人机对话效果，不仅要模仿语言还应当注意非言语行动在对话中所发挥的重要作用：一方面，卡塞尔强调了对话中手势的重要性：“在用语言来表达意义时常同时伴随着手势。但是手势传达了哪些意义，手势与语言所传达的意义之间是什么关系？手势能够传达出语言所无法传达的未尽意义；对于成年人来说，用手势与用语言来传达并不矛盾（就成年人而言，政治家可能是个例外）。从语义层面上来说，这意味着构成概念的语义特征是分布在语言和手势中的。”⑥Ibid.， p. 13.另一方面，卡塞尔也注意到“同手势一样，在传递信息时，由于话语不同以及所表达的意义不同，所呈现出的面部表情也是不同的”①Justine Cassell， Joseph Sullivan， Scott Prevost and Elizabeth Churchill， Embodied Conversational Agents， p. 17.。在此基础上，卡塞尔在麻省理工学院的计算机实验室里开发出了第一台具有人类形象的“涉身对话智能体”软件——“房产经纪人”（real estate agent）软件。“房产经纪人”软件简称“REA”，是以一名女性形象出现的，它拥有一个清晰的三维图像的身体，在用语言与客户交流的同时能够使用表情，并且能够用手势来描述房子的特征，也能够对用户的语言和行动作出反应。用户在与“REA”对话时，可以随时打断“REA”的话，然后“REA”能够接着没说完的话和用户继续进行对话。

尽管在技术上人机对话系统已经有了长足进步，但是在当前的阶段上，“与涉身对话智能体的交互不是多模态的，而是更多地基于语音命令，这是现有对话组件不够灵活的一个主要原因。另外，涉身对话智能体没有完全达到用户的预期。我们注意到主要是口头的沟通能力不匹配。事实上，大多数目标用户在面对类人角色时，都希望在对话方面能进行更自然的互动。这包括自动自然语音识别，也包括对话本身的灵活性”②Erinc Merdivan， Deepika Singh， Sten Hanke， Andreas Holzinger，“ Dialogue Systems for Intelligent Human Computer Interactions”， Electronic Notes in Theoretical Computer Science， Vol. 343， 2019， p. 60.。为了解决上述问题，人机对话系统试图用增大数据库的方法来加强机器对话能力，如当下“涉身对话智能体”所采用的“强化学习方法”（reinforcement learning）和“深度强化学习方法”（deep reinforcement learning）来训练计算机。其中，“强化学习方法是一种机器学习方法，在这种方法中，智能体通过学习不同状态下需要采取的行动来学习如何适应环境。”③Ibid.， p. 64.“深度强化学习算法是采用相互对抗的方式进行训练，使其即使处于一个非常高的状态空间下也能够完成后人类操作。”④Ibid.但是，无论是对“强化学习方法”，还是对“深度强化学习方法”而言，它们都是以“大数据”技术作为基础的。但“大数据”并不等于“全数据”，当前的人机对话系统尚无法搜集到与对话有关的所有的数据，因为“……在对话任务中，动作空间是高维度的。这种高维度是因为无论采用何种语言进行对话所涉及的句子的数量都是巨大的。这种巨大的行动数量，加大了用强化学习方法来完成对话任务的难度。通常，强化学习方法所需的训练样本数量并不那么重要。即使是简单的数据方法，也需要10K的训练数据，因为人类对话的复杂性和多样性，使得从人类身上收集到这些数据是不切实际的。”⑤Ibid.， p. 65.

二、“有形计算”算法与对话的内在本性

针对当前人机对话系统对话不够流畅的情况，美国施乐帕罗奥多研究中心（Xerox Palo Alto Research Center）的计算机科学家保罗·多里什（Paul Dorish）提出要想使人机对话系统实现真正的流畅的对话，就要对人机对话系统的算法进行根本性改革：首先，多里什强调对话作为一种交流方式，其本质不是信息交互、而是一种涉身交互（embodied interaction）。受到海德格尔等现象学传统的影响，多里什强调“涉身交互”是一种身处于世界中的情境性交互方式。而多里什之所以要强调对话是一种“涉身性交互”，目的在于改变传统把计算机视为机器的看法、将其视作是一种“涉身智能体”（embodied agent），并让其参考人类对话的技能来实现与人类进行流畅对话的任务。其次，多里什强调涉身智能体的“涉身性”恰恰来自交互过程，而所谓的“交互”过程既包含物理性交互也包括社会性交互。因为从人类的交流过程来看，人既是一个物理存在，同时又兼具社会属性。再次，多里什强调应当把上述对“交互”的理解，即包括将物理性交互与社会性交互的方式融入到人机对话系统的算法设计中去。因此，多里什将人机对话系统的算法分成两部分——“有形社会计算”（tangible and social computing）。

“有形计算着眼于获得我们的物理技能与熟悉现实世界的客体。”①Paul Dourish， Where the Action Is， MA. Cambridge：The MIT Press， 2004， p. 102.因此，“有形计算”算法的设计所针对的主要是人类对话的本性。而谈及人类对话的本性，无论是在计算机科学中还是哲学上对该问题都缺乏清晰的说明，因此20世纪80年代，围绕着如何来理解人类对话技能，以及如何让计算机掌握这种对话技能，以瑞典哲学家波·戈兰宗（Bo Göranzon）为首，包括计算机科学家、心理学家、教育学家等在内形成了一个“对话研究小组”（dialogue seminar）专门来讨论上述相关问题。

大体上，对话的本性的反思主要涉及四个层面：首先，对话具有现实性，它是澄清问题、获得真理的一种手段。如在著名的《柏拉图对话录》中，它所记载的就是一个真实的世界。通常这些对话的开场是从对场景的描述开始的，比如《欧梯佛洛》篇的开场是在法院、《克里同》篇的开场是在关押苏格拉底的监狱、《斐多》篇的对话发生在裴来阿斯（Philius）等。而出场的人物在历史上也都确有其人的，比如苏格拉底和欧梯佛洛、克里同、斐多等。此外，柏拉图所讨论的问题都是现实问题，而并非闲聊。比如，苏格拉底和欧梯佛洛的对话讨论的是欧梯佛洛要控告他自己的父亲的事；苏格拉底和克里同的对话讨论的是他要不要逃跑的事；苏格拉底和刻比斯的对话讨论的是他即将要被处死的事等等。并且，虽然柏拉图的对话是从对事实的讨论开始的，但这并不是他的终点，他的最终目标是通过对事实的讨论而得出普遍的真理。比如苏格拉底和欧梯佛洛的对话是从是否要控告他的父亲的事的讨论开始，然后上升到对正义的讨论；苏格拉底和克里同的对话从苏格拉底是否要越狱的事的讨论开始，上升到对道德的讨论；苏格拉底和刻比斯的对话从对他即将要被处死的事的讨论上升到对灵魂的讨论。

其次，对话具有艺术性。伽达默尔曾强调：“谈话是一种检验的艺术。但是检验艺术就是提问艺术。”①伽达默尔：《真理与方法》，洪汉鼎译，上海：上海译文出版社1999年版，第472页。伽达默尔之所以要强调对话中的“提问”的角色，是因为在他看来“提出问题比答复问题还要困难”。以柏拉图对话为例，“当苏格拉底的对话者不能答复苏格拉底的麻烦问题，倒转矛头，主张他们所谓的提问者的有利地位时，他们是完全失败的。在柏拉图对话的这种戏谑性动机背后存在对真正谈话和非真正谈话的批判性区分。对于那些在谈话中只是想证明自身正确而不是想得到有关事情的见解的人来说，提出问题当然比答复问题更容易。他不能答复问题，对他来说构不成什么危险。但是谈话对方再次的拒绝却实际表明，那个认为自己更好地知道一切的人根本不能提出正确的问题。为了能够提出问题，我们必须要知道，但这也就是说，知道我们并不知道。因此在柏拉图所描述的问题和答复、知识和无知之间的戏谑性的替换中，包含承认问题对于一切有揭示事情意义的认识和谈话的优先性。”②同上书，第466页。也就是说，提问的难度就在于提问要有艺术性，其所谓“艺术性”主要体现在两方面：一方面，提问要具有开放性。即“被提问东西的开放性在于回答的不固定性。被提问东西必须是悬而未决的，才能有一种确定的和决定性的答复。以这种方式显露被提问东西的有问题性，构成了提问的意义。被问的东西必须被带到悬而未决的状态，以致正和反之间保持均衡。每一个问题必须途经这种使它成为开放的问题的悬而未决通道才完成其意义。”③同上书，第466—667页。伽达默尔认为缺少开放性的对话，是一个假问题。另一方面，“问题的开放性并不是无边际的。其实包含了由问题是律所划定的某种界限。没有这种界限的问题乃是空的问题。”④同上书，第467页。这样，在对话的问答之间，“经常包括肯定地被判断的东西和否定地被判断的东西”⑤同上书，第468页。。从而，“讲话者总是一直被要求着，直到所讲东西的真理最后涌现”⑥同上书，第472页。。即得到确证的知识。

第三，对话具有对称性，对话的一问一答的形式就决定了对话在结构上具有对称性。一方面，对话双方在话语权上是对称的，即拥有平等的话语权。关于这一点，伽达默尔在强调对话中的提问的艺术性的同时，就强调了“提问的艺术并不是避免意见压力的艺术”“不是那种制服任何人的论证艺术”而是“继续提问的艺术”或者说“思考的艺术”。“进行谈话并不要求否证别人，而是相反地要求真正考虑别人意见的实际力量。”①伽达默尔：《真理与方法》，第472页。即“要进行谈话，首先要求谈话的伙伴彼此不相互抵牾。因此谈话必然具有问和答的结构。谈话艺术的第一个条件是确保谈话伙伴与谈话人有同样的发言权”②同上书，第471页。，哈贝马斯也认为：“对话角色的无限制互换性要求任何一方在履行这些角色时都不享有特权：只有当在交流的双方之间的主张和争议、揭露和隐藏、规定和遵从完全对称时，才会产生纯粹的主体间性。只有有了对称性存在，交流才不会受制于其自身结构的约束。”③Jurgen Habermas，“ Towards a theory of communicative competence”， Inquiry， Vol. 13， 1970， p. 371.

另一方面，对话结构上的对称性，又决定了对话关系具有对称性。德国哲学家马丁·布伯（Martin Buber）将对话关系进行了区分——分为“我—你”关系和“我—它”关系，前者指代关系世界，后者指代经验世界。布伯对于对话关系是以语言为基础的，他首先认为在对话中涉及两种类型的基本词，即“我—你”和“我—它”。其中，布伯认为在基本词项“你”出现之前，基本词项“我”和“它”是独立存在的。这时，我们作为认识世界的主体，是将自己隔离在世界之外的。或者说，世界与我们的经验之间也是毫无关联的。只有当对话产生，即出现了基本词项“你”出现之后，尽管“一个人说出‘你’的时候，并不意味着他拥有了什么具象的事物，‘你’字并不赋予他任何所有物。然而，‘你’字被说出口的时候，意味着讲话的人身处一段关系之中”。通过这种对话关系，能够把经验世界同我们的关系世界联系在一起。比如说，树作为一个物理实体，它是存在于经验世界当中的。但是，在我们的对话中，当我们谈及“树”时，“树存在于我们之外，却与我们心神交汇，正如我们对它亦心有戚戚，所不同者，仅仅在于方式而已”。

第四，对话具有规范性。虽然，布伯对对话关系的区分是以语言为基础的，但是在布伯看来对话关系并不是一个纯粹的语言问题、它同时是一个实践性问题，正如他说：“关系既意味着被选择，也意味着选择，关系是被动和主动的综合体。当一个主动行为是发自完整本质的时候，就等于舍弃了局部性的行为，那么这种整体化（只以其自身边界为限）的主动，就必然会非常类似于被动。”④马丁·布伯：《我与你》，任兵译，北京：北京联合出版公司2018年版，第90页。对话作为一种人类行为，要受到社会规范性的约束。因为“人类不可能在沉默中生存，滋养人类不可能靠错误的词，而只能靠真实的词。男男女女都用真实的词来改造世界。”①保罗·弗莱雷：《被压迫者教育学》，顾建新，赵友华，何曙荣译，上海：华东师范大学出版社2001年版，第38页。语言学家巴赫金同样认为：“言语的语言实际单位不是孤立的个体的独白，而至少是两种话语的相互关系，即对话。”②巴赫金：《巴赫金全集》（第二卷），李辉凡，张捷，张杰华昶等译，石家庄：河北教育出版社2009年版，第460页。因为“语言反应的不是主观心理上的犹疑。而是说话人稳定的社会相互关系。在不同的语言中，在不同的时期里，在不同的社会团体中，在目的不同的语言环境中，占上风的一会儿是这种形式，一会儿是另一种形式，一会儿是这些形式的一些变体，一会儿是这些形式的另一些变体。所有这些说的是，说话者们那些社会的相互理解意向的强弱，这些形式都是那些意向长期固定不变的遗存”。具体来说，哈贝马斯把对话应当遵循的规范概括为以下三点：“（1）只有在不受限制的讨论中（既不接受也不质疑无偏见的意见）才能够获得无限制的共识；（2）排除双方不能够被侵犯的条件，基于未被破坏的自我表征的相互性（包括承认另一方的自我表征）才能够相处融洽，这意味着要在承认个体的条件下进行沟通；（3）在期望完全互补的情况下（排除片面的强制性规范），存在普遍理解和普遍规范。上述三种对称性代表了我们从传统意义上所理解的真理、自由和正义的概念。”③Jurgen Habermas，“ Towards a theory of communicative competence”， pp. 371—372.

三、“社会计算”算法与对话的外在社会性

所谓“社会计算”，即“试图将对社会世界的理解纳入人机交互系统中”④Paul Dourish， Where the Action Is， p. 16.。对对话来说，其作为一种社会实践，主要是以语言为工具来实现的。因此，对话的社会实践性依赖于对话者运用语言的语言胜任能力。谈到人类的语言胜任能力，乔姆斯基认为语言能力就是一种学习能力，这种学习能力的形成主要是依赖于人的认知机制，而与外在因素无关。例如他说：“一个系统不是通过反映人的能力的语言习得机制可以学到的，这时我们不是说，这个系统如果是当作某种智力测验或智力练习的问题的话，人是不可以通过某种其他方法掌握它的。语言习得机制不过是可用于解决问题和构成概念的智力结构的整个系统的一个组成部分，换言之，‘语言能力’只是若干心理官能之一种。”①诺姆·乔姆斯基：《句法理论的若干问题》，黄长著、林书武、沈家煊译，北京：中国社会科学出版社1986年版，第56页。“事情似乎很清楚，语言习得建立的基础，是小孩发现了从形式观点来说难懂而抽象的理论，即他的语言的生成语法，这种理论的许多概念和原则只是借助无意识的、类似推理的手段才和经验松散地联系在一起，这些手段就像一条长长的和错综复杂的链条。对所获得的语法的特点的考虑，可利用的数据变得不合用和受到严格限制的范围，作为结果得出的语法的惊人的一致性，以及这些语法在很大的变化范围里都不依赖于智力、动机和感情状况，上述种种情况使得起初对于该语言结构总的特点不了解的有机体在学习许多语言结构时，成功的希望甚微。”②同上书，第58页。“总之，各种语言的结构很可能主要是由个人无意识地控制的各种因素所确定的，关于这些因素，社会几乎没有多少选择的余地，或几乎没有自主权。根据现在可以得到的最好的材料，做如下假设似乎是合理的：小孩子不得不建立某种转换语法，以便说明给他提出来的数据，就像他能够控制自己对实在物体的概念，或控制他对线和角的注意一样。因此，完全可以说，语言结构的普遍特性与其说是反映人的经验过程，毋宁说是反映人获得知识的能力（从传统的意义上说，即人固有的观念和原则）的普遍特性。”③同上书，第59页。

但是，“布迪厄反对乔姆斯基的地方在于把胜任能力的概念理解成是说话者生成语法结构良好的句子的能力的这种说法，实在太抽象了。实际上说话者所拥有的胜任能力并不是生成语法结构良好的句子的能力。而是产生适合于特定情境的表达能力，也就是说，产生表达的能力。布迪厄的观点并不是要否认胜任的说话者具有生成语法句子的能力；他的主要观点是认为这种能力不足以表征实际的讲话者所具备的能力。因为真正的演讲者有一种实践性的胜任能力（practical competence），一种‘实践感’，凭借这一点，他们能够在适当的情况下发表适当的言论；这种实践性的胜任能力不能从乔姆斯基的理想的说话者的能力中推演或产生出来。因此，实际的说话者能够在制造句子或表达方面运用实践策略，这些实践策略具有多种功能，能够默默地调整说话者与听者之间的权力关系。他们的实践能力不仅包括制造符合语法的话语的能力，还包括使他人倾听、相信、服从自己的能力。说话者必须确保自己在这种情况下讲话，而倾听者必须认可说话者值得被关注”④John Thompson，“ Editor’s Introduction”， in Pierre Bourdieu， Language and Symbolic Power， Cambridge：Polity Press， 1991， pp. 9—10.。

在维特根斯坦那里，他就强调“……用语言来说话是某种行为举止的一部分，或某种生活形式的一部分”①维特根斯坦：《哲学研究》，陈嘉映译，上海：上海人民出版社2001年版，第19页。。不过，维特根斯坦并没有给所谓的“生活形式”一个明确的界定，通常认为维特斯坦所谓的“生活形式”指的是社会文化。在维特根斯坦的影响下，当代学者们进一步讨论了社会文化是如何对语言的胜任能力产生影响的。比如美国的语言学家，同时也是人类学家的丹尼尔·埃弗雷特（Daniel Everett）同样反对乔姆斯基关于语言能力来自个体认知的观点，强调“我们的思想和文化是共生的。文化和心理之间的关系不是偶发的，它们相互影响、塑造和增强”②Daniel Everett， Dark Matter of the Mind: The Culturally Articulated Unconscious，Chicago：The University of Chicago Press， 2016， p. 13.。

在埃弗雷特看来，一方面社会文化对语言的影响是潜移默化的、或者说是默会的，而社会文化对语言的这种默会的影响会导致在我们的认知中形成一种类似于“暗物质”（dark matter）的东西：“人类共同体通过被人类学家称之为‘文化’的活动，塑造了我们生活的方式包括我们的思维方式、交流方式、道德判断方式、科学行为方式和寻找幸福的方式——在一个受他人价值观和观念约束的共同体中行动。塑造我们的力量有价值观、隐性信息、文化、背景等。这些力量比我们所认为的更神秘、更强大。我用‘暗物质’来形容这些力量。”③Ibid.，p. 13.“暗物质”这个概念的提出是借鉴了天体物理学上研究的成果，因为事实上在宇宙中人类可观察到了物质仅占5%左右，而余下的大部分是暗物质。埃弗雷特之所借鉴这个概念是想说明暗物质虽然不可见，但它真实存在，就好似社会文化对人类的影响一样。这个概念对于埃弗雷特而言，类似于库恩在“科学革命”理论中所提出的“范式”的概念，或者说它是波兰尼的“默会知识”理念在文化人类学上的一个“翻版”，它所反映的是在社会文化的影响下，在我们的认知中会凝结出的一种语言使用规范。

另一方面，埃弗雷特强调“暗物质”发挥作用的机理是社会文化对人类的直觉产生影响——在认知上具有一种“灵活性”，而这种灵活性会在人类语言上有所体现。比如，当看到树叶晃动，会下意识地使人联想到“风吹树叶”，继而能够使人判断出刮得是什么风，以及我们所处的季节，随即人类能够用语言描述出“风吹树叶”的场景。因此，埃弗雷特认为，人与动物的区别并不在于物理和心理机制，因为人和动物在生理上是有着相似的生理结构和功能的，比如任何动物都有大脑皮层、神经网络……“最重要的认知问题不是‘大脑中有什么’而是大脑中的（文化/社会/环境）是什么样的。人类的灵活性和认知资源存在于我们大脑的暗物质中——我们从生活经验中获得的默会知识。这些知识来自很多方面。文化，是其中的一个方面、物理环境是一方面、任务是一个方面。但文化在曾经被认为无关紧要的领域中，对于理解我们自己和我们的物种至关重要。”①Daniel Everett， Dark Matter of the Mind: The Culturally Articulated Unconscious，p. 24.

并且，埃弗雷特以他对巴西雨林中的皮哈拉部落（Piraha）的田野调查，作为对上述观点的经验证据。在深入到皮哈拉部落之后，埃弗雷特发现当地部落的语言异常复杂。与其他语言相比，皮哈拉部落语言除了有正常的音调和语法规则之外，语言体系中还包括了非正式语言形式如哼唱、喊叫、音乐和口哨等。这就意味着，如果对皮哈拉部落的文化缺乏足够的认识的话，是根本没有办法理解和掌握皮哈拉部落的语言的。此外，皮哈拉部落的语言并不是特例，在巴布亚新几内亚高地语言中，在动词中嵌入了大量具有文化意义的特征，比如在芒特哈根（Mount Hagen）语中，中缀“nde”代表的是其他人所完成的行动或导致的行动；词根“menem”表示“携带”，那么“mendenem”这个词就表示“他人携带”。在这些语言中，“说话者自然的表现出对社会导向行为的强调，由此语法成为了暗物质的载体。这样，暗物质的概念在语言和文化的普遍主义和特殊主义观点之间架起了一座桥梁”②Andrew Strathern & Pamela Stewart， Language & Culture in Dialogue， London： Bloomsbury Academic， 2019， p. 4.。

总之，当前“有形和社会计算”的算法仍处于系统开发的初级阶段。正如其设计者多里什所言，要想使人机对话系统能够流畅的对话，需要以人类对话为范本，从根本上理解人类对话所涉及的包括对话的内在本性及其社会性的特征。但是，目前对于上述两个层面的对话本性的讨论仍不完善，需要从包括哲学、社会学等在内的跨学科的研究视角下对其进行深入的、系统性的反思。

哲学分析2022年6期

哲学分析的其它文章: 公共理性至善论如何可能？
——兼回应陈肖生; 何种尊重？如何扩展？
——反对公共理性与至善论的结盟; “生生”与“名名”
——论中国哲学的“底本”; 延异断裂与技术踪迹
——论斯蒂格勒对德里达延异概念的狭义化解释; 格沃斯对于道德规范性的论证及其理论困难; AI护理机器人能够替代人类护理者吗？
——来自关怀伦理学的建议