朱林蕃 叶浩生
(1 复旦大学哲学学院,上海 200433; 2 广州大学教育学院,广州 510006)
“人类生存于时空约束的特定情境之中”, 这一命题或许会得到人们的经验层面的认同。而且,我们越是试图反思这一命题,越会给予它肯定的答复:我们确实通过身体生活在具体的物理世界中。然而,伴随着虚拟现实(virtue reality,简称VR)、现实增强(augmented reality,简称AR)与混合现实(mixed reality,简称MR)等技术的发展,这一命题却遇到了挑战——在未来,我们或许并不全然地生活在“真实”的物理时空情境中,虚拟时空、虚拟身体与虚拟体验技术向我们敞开了步入全息虚拟时代与后人类时代的入口。2021 年美国脸书公司(Facebook Co.)创始人扎克伯格(Mark Zuckerberg)忽然宣称公司运营的重点将转变为基于VR,AR 与MR 基础之上的元宇宙(metaverse)技术。在他的描述中,元宇宙被定义为“一个虚拟环境,你可以在其中与数字空间中的人一起出现”,同时,它也是“一个具身的互联网(embodied Internet),(人们)置身其中,而不仅仅是观看……这将成为移动互联网的继任者”。元宇宙技术带来的挑战或许不仅仅在于人类生存方式的转变, 也包括我们用何种心理学的或认知的视角去看待这种转变。
无独有偶,早在1997 年,哲学家克拉克与查尔莫斯(Clark & Chalmers,后简称C&C)在“延展心灵”(The Extended Mind)一文中提出“延展认知假说”(the hypothesis of extended mind),认为人的认知过程并不全然发生在脑内, 而是可以扩展到颅外环境中的部分工具与设备中, 并共同构建起认知的耦合系统(coupled system)。 在这个耦合系统中,人类颅内的认知过程与外部的过程形成同一个认知回路,这也使得过去被理解为内部化处理的认知过程,转变为内部要素与外部要素混合的处理过程。然而,延展认知的支持者如克拉克(Clark, 2011)或威勒(Wheeler, 2007) 多次暗示延展认知需要依赖具身认知理论(theory of embodied cognition)来实现,但是却对实现范式的解释付之阙如。与此同时,伴随人类对外部信息设备的依赖, 一些学者(Heersmink,2015)认为延展认知逐渐成为了当代认知增强(cognitive enhancement) 的良好例证, 而另一些学者(Smart, 2022) 则更多关注如何借助元宇宙技术解释延展认知假说的可实现性问题。
基于以上讨论,本文立意解答两个核心问题,即(1) 延展认知如何通过具身认知实现认知的扩展?(2) 延展认知如何成为元宇宙技术与认知增强的良好例证?若要解答这两个问题,我们必须解释延展认知假说可以实现的条件与原则,并说明,延展的认知系统如何将内部与外部系统建立起耦合信息回路。在解答这些问题之后, 我们将进一步解释延展认知如何通过延展体验实现对元宇宙技术的补充, 并为后人类生存提供可能性。
经典认知科学的认知模型认为, 人的认知过程是一个内部化的计算处理过程, 即将感知信号通过认知处理,最终输出到行动的“经典三明治”(classic sandwich) 模 型 (Colheart, 1999; Fodor, 1975,1980; Hurley, 2001)。 在图1 模型中,认知的边界即计算的边界, 而由于人类的计算与表征过程恰好在颅内,因而,认知的边界恰好是颅骨与皮肤组成的生理学边界。
图1 苏珊·赫利(Susan Hurley)示例的经典三明治模型
这个模型在很长时间内占据了认知科学主流教科书的核心位置。 然而,1990 年代以来经典三明治模型遭到持具身认知观点的学者反对。 在他们(Haugeland, 1998; Shapiro, 2004, 2011 et al.,Varela, et al, 1992)看来,由于经典认知科学将认知概念定义得过于狭窄, 使得这种模型难以逃脱现代怀疑论与心物二元论的暗影。一方面,如果将全部认知过程视作脑过程, 认知加工即对外部世界表征信号的加工,那么我们无法通过“自证”的方式表明我们是具体的人, 而不是浸泡在营养缸中且接受刺激的大脑(brain in a vat)。 这就是入缸怀疑论(the skepticism of envatment)带来的挑战。 另一方面,经典三明治模型中,由于感知与行动都是身体的属性,而身体恰好是物理的(占据时空的),而认知过程由于仅仅是发生在颅内的心灵状态(mental states),这样一来, 认知过程似乎被视作了一个与物理世界相互割裂的而且神秘的暗箱。 这一点被豪格兰德(John Haugeland)称作笛卡尔主义的当代遗留。
基于上面两种挑战, 具身认知理论的支持者认为,认知过程不仅涉及颅内的符号表征或计算,也涉及身体、 环境与文化。 这就引发了认知是内在(internal; intracranial)还是外在的(external; extracranial)争论。 延展认知假说即在此理论背景中出现。
C&C 提供了两个 “思想实验”(thought experiments)来帮助我们理解这个假说。 第一个思想实验关于“对等原则”(parity principle),如果一个人可以通过手和遥感在屏幕前完成类似“俄罗斯方块”这样的游戏任务,那么在未来,如果一个人可以用大脑直接控制屏幕中的方块完成这个任务,我们或许会说,外在的手眼联动(eye-hand coordination)机制替换了部分的脑功能。这个案例引发了功能主义的猜想:由于俄罗斯方块游戏完成的结果都是等同的,那么,手眼联动操纵方块与脑直接思考一个方块在效用上是对等的,我们只是将脑中的任务下载(off-load)到环境中去处理。
第二个思想实验基于延展的信念(extended belief)。假设一个普通人如果要前往某个地方,仅仅依赖大脑中的记忆功能即可实现; 而一个阿尔兹海默症患者的记忆则需要依赖一个笔记本来完成。 笔记本部分地取代了大脑中的长期记忆功能,与此同时,笔记本上的内容可以驱动认知主体去完成相应的任务。这就是说,笔记本上的内容是一段可以驱动行动的延展信念。 而笔记本也是脑中记忆功能下载到环境中的延展的载体(extended vehicle)。
以上两个思想实验不仅示例了延展认知的功能主义与“通过外部信念驱动行动、完成认知任务”这两个侧面,更进一步暗示,认知过程或许并不是一个全然在颅内完成的过程, 而是一个内部系统与外部系统密切联系的耦合系统。
耦合(coupling)本来试图刻画这样的一种状态,即两个物体或系统出现紧密联系彼此定义且交互的状态。 例如,如果我们假设一个耦合系统S 由A 与B 两种子物理系统构成, 两个系统中各自的状态应该由它们所处共同系统的关系来定义, 而不是独立定义,且当系统S 中任意子系统的变化,另一个子系统都会发生交互式变化。 例如,在由A 和B 子系统组成耦合系统 S (A |B) 中,如果A 发生变化成为A’,则B 也会随之变为B’。整个耦合系统由二者密切交互关系定义和制约。
C&C 在刻画心智系统与外部状态的耦合系统的时候,试图说明等价效应并非在于A、B 的物理构造等价,而是两边信息处理的功能效用等价,且信息加工的要素可以在心智的内部系统与环境的外部系统之间自由流动(见图2)。 因此,延展认知假说试图说明,认知并不是内部的过程,而是在一个可以离开颅内环境, 由颅内信息加工系统与环境中手眼联动信息加工系统共同组成的耦合信息回路中实现的。
图2 耦合系统示例及其演变型
与延展认知类似的一个可理解的版本是广义计算主义 (wide computationalism)。 经典计算主义认为,认知的计算功能仅是神经内部计算的过程,而广义计算则撷取人类普遍存在的行为, 即手眼联动基础的笔算。哲学家威尔森(Wilson, 2004)注意到,当人类进行复杂演算的时候, 直觉上并不会在脑内穷尽能量进行演算, 而是会倾向于将部分计算内容和步骤分拆为笔算, 并借助手眼联动的作用实现认知经济学(cognitive economy)框架下最便捷地实现认知任务。 例如,在计算386×417 这道数学题的时候,穷尽人脑资源的演算不仅耗时耗力,而且精度欠佳,而通过笔算可以简单且快速地完成任务。
表1 狭义vs.广义计算主义:步骤对照(Wilson, 1994, 2004)
综上所述, 延展认知假说在两个层面上挑战了经典认知科学:首先,认知本身并不是一个内部化的表征过程,而是一个与身体、环境中某些设备和工具密切相关的复杂系统和过程;其次,认知的可扩展性带来了我们重新思考经典三明治模型的契机,即,认知的全过程可以包含感知与行动, 或者说一些特定感知与行动方式(例如,阿尔兹海默症患者依赖笔记本)塑造了特定的信息加工方式。这就引发了延展体验 (extended feeling) 或延展的身体归属感(body ownership)的观点的萌发。
“延展体验” 直觉上是一个令人感到怪异的概念, 因为就像我们在本文开始所提到的那个命题——“人类生存于时空约束的特定情境之中”——除非在某些特殊情形下, 一般我们不会怀疑感官向我们呈现的内容。我们是一个存在于物理世界的、具有经验的人,并可以感受到时间的流逝。 然而,在一些心理学实验中, 延展体验又是关于身体归属感研究中一系列实验设计的中心内容。即,我们的身体感知如何在一些刺激和错觉情境下脱离身体的边界,使得我们的体验在一个扩展和延伸了的(身体边界之外)物理世界中获得相应的经验内容。
与此相对,“延展意识” 概念则并不是想要说明所有的意识内容延展到环境中, 延展意识中所说的“意识”概念是一种主观意识,即“成为xx 是一种什么体验”(what-is-like-to-be) 这样的第一人称视角的主观意识。和延展体验一样,它试图说明的是一种扩展了的第一人称主观体验如何延伸和扩展到身体的物理边界之外。
无论延展体验还是延展意识, 都似乎与中国道家文化中“身外有身”的意境相似。 不过,在科学上,还需要我们厘定这些概念的具体内容与边界。 这就需要我们从身体归属感(body ownership)概念开始慢慢展开讨论。
身体归属感与相应的实验早期受到身体图像(body image)与身体图式(body schema)概念区分的启发。身体图像即我们观察我们自己,我们对自己的身体与环境的边界具有一定知识和表征。 而身体图式则代表我们驱动身体去完成认知任务的可能规定性,我们并不会时刻表征我们的行动,且身体不平均地被任务激活。例如,足球运动员的身体图式可能集中在腿与手臂的平衡感上, 而忽略其它部位等(Gallagher, 2005)。
身体归属感融合了上面一组概念的讨论。 一般而言,我们确证(verify)我们的身体感知,且我们知道我的身体由哪些部分组成, 并为这一判断提供充足的知识辩护(justification)。 然而,我们也确实可以发现一些反例,例如,异手综合征(Alien hand syndrome)患者即使看到自己的手与小臂相连,却仍然认为那不是他的手(Panikkath et al, 2014)。 又例如,在讨论幻肢(phantom limb)案例与镜箱(mirror box)治疗的时候,我们会引导幻肢症患者将疼痛从镜子中本不存在的肢体转移到其它部位(Ramachandran & Blakeslee, 2005)。 或者我们思考一个更加简单的例子,我们总拥有一些奇怪的梦境,在这些梦境中我们从第三人称视角看到了我们自己,但是梦境中的喜怒哀乐却是主观的——我们确实可以在不同视角和思维边界上了解到感知的边界与身体的物理边界常常是可以分开的。 这些案例也从不同侧面展示胡塞尔(Edmond Husserl)在一个世纪之前已经做出的努力:在讨论认知活动的时候,应当区分人的物理身体(der Körper)与“感觉自己所拥有的身体”(Leib)(罗志达, 2017)。
基于身体归属感的心理学实验在最近二十年也方兴未艾(张静, 2017)。 较早的版本即我们所熟知的橡胶手错觉实验。 实验者要求被试(健康被试)坐在桌前,他的左手放在桌边,并用一个挡板将手臂挡在视野之外。这时候,将一个与真手的尺寸相当的橡胶手(a life-size rubber hand)放在被试胸前较近的一个位置,并处在被试左侧视野中(如图3 所示)。这个案例需要在两个实验状态中报告自己的感受。 被试的手与橡胶手同时感受到羽毛刷的刺激, 但他仅能看到假手。 随着羽毛刷刺激的时间延长,他逐渐感觉到那个橡胶手才是自己的手——“我发现自己正在看着橡胶手, 认为它实际上是我自己的”(“I found myself looking at the dummy hand thinking it was actually my own”)(Botvinick and Cohen, 1998)。
图3 橡胶手错觉实验图示(Nicolelis, 2001)
除了橡胶手错觉实验之外,体外碰触错觉/体外感知(out-of-body experiences) 是阐明身体归属感与证明延展体验的一个中介性案例(见图4)。 认知神经科学家艾尔森(Ehrsson, 2007)在被试头上戴上头戴式显示器, 显示器展示的是他身后一米外的摄影机拍摄的内容。实验者拿出两只白色笔杆同时、同频率刺激(戳)被试的胸部和摄影机,而由于被试并不能看到触碰自己的那支笔,他会产生一种错觉,即自己站在自己的身体之外一段距离观看自己,几乎就像在观看别人一样(“I experienced that I was located at some distance behind the visual image of myself, almost as if I was looking at someone else”)。
在以上体外感知实验出现的时代,AR,VR 与MR 技术还并不那么完善, 但至少我们可以看到当第一人称视角 (the first person perspective, 简称FPP)的感官输入被外部仪器提供的信息所垄断,经验上我们会仍然倾向于接受FPP 给我们的内容(Huang, 2017)。 依照“感知—认知—行动”的认知架构, 我们的认知处理的内容依赖于感知觉为我们提供的所与(given)。 当外部设备对FPP 的感官剥夺(sensory deprivation)越是彻底,我们在认知加工的内容上越是容易依赖提供虚拟经验的仪器所提供的信号。 穿着头戴设备的人体在这个意义上成为了扩展的缸中之脑, 我们仅对仪器提供的种种模拟信号的刺激做出反应。 而感官剥夺后的模拟信号被沉浸式体验(flow experience)所取代的时候,早期AR,MR 和VR 等技术的开端也从此处涌现, 成为我们今天讨论元宇宙与延展体验的基础。
从延展体验这一概念, 以及一些借助身体归属感获得的实验案例,我们不难发现,人类的感知觉边界与人类身体的边界并不总是重合的, 我们可以借助一些仪器使得我们的感知觉超越身体的物理边界。 那么,除了感知觉之外,我们的主体是否能够超越这个边界呢?
1984 年,作家吉布森(William Gibson)在小说《神经漫游者》(Neuromancer)中描绘了这样的图景:主人公凯斯(Case)因为神经系统受损,为了追查罪犯,他不得不通过技术将自己的身体虚拟化,成为深入到互联网深处的数码漫游者, 经历一系列艰难险阻实现正义使命。 这个作品一经出版就被人们称作“后人类主义哲学”(post-humanist philosophy) 的典范。因为在作品中,作者不仅预见了人机融合的赛博格(cyborg)人类形态,而且认为认知主体的生存形态更可以脱离生物基底,进入硅基互联网中,且使得主体成为在不同形态之间穿梭的漫游者(Hayles,1999)。
当代元宇宙技术虽然并没有预设人机深度融合的超前图景,但仅就我们上面提到的,当感官剥夺与沉浸式体验不断提升, 且当虚拟空间为我们塑造出足够具身经验的互联网 (the internet of embodied experience)形态的时候,人类很难抗拒这种技术带来的诱惑。毕竟,这种虚拟体验技术帮助我们超越了现实生活的贫乏, 为无数新奇的超时空体验敞开了无限可能。不过,元宇宙概念下的延展体验并没有带来主体的迁移,而仅仅局限在感知觉边界的扩展、虚拟、与现实融合这三个维度上。
Smart (2022) 在讨论微软最新的元宇宙产品Microsoft HoloLens 的时候提到了一种新的、基于延展认知的 “混合认知回路”(hybrid cognitive circuits)。 HoloLens 具有虚拟和真实两套不同的传感器,并巧妙融合。一方面它支持对本地物理环境并尝试跟踪用户行为, 同时不断对环境进行物理全息建模:一边模拟佩戴者所在环境,一边将虚拟的环境与真实场景进行融合(佩戴者因此也就无需担心面前的障碍物)。另一方面佩戴者的第一人称视角体验可以完全融合在虚拟的跨时空环境中,例如,可以移植太空会议室场景到家庭书房中, 虽然眼前桌子或杯子是真实环境的物理对象, 但是与会者与太空环境却是虚拟的。这样一来,佩戴者在环境中的行动既发生在虚拟环境中,也发生在真实环境中,两种环境/情景得到了融合。
佩戴者的交互方式仍然依赖全感官输入和输出的接口,视觉输入、注意力和语音识别都成为与全息界面交互的途径。而用户所面对的,不仅仅是全息虚构模型那么简单,而是面对HoloLens 与互联网中央算法,以及与其它HoloLens 设备之间共同构造出来的交互式互联网体验。与过去非沉浸式体验相比,该产品的特征恰在于它通过混合现实, 使得佩戴者获得了部分现实环境中的具身体验。
正如我们之前所担忧的, 如果延展认知假说仅仅被理解为载体外在主义(vehicle externalism)的话(承载意识的物理实现者可以在扩展到身体和环境中),那么(主体的)意识内容并不会延展,我们仅仅通过论证人与环境特定工具的密切耦合特征即可说明该假说的合理性。而如果从延展体验、延展意识的层面讨论,我们或许会有限地支持这样的观点,即部分以第一人称视角的现象意识 (phenomenon consciousness)可以离开我们所熟悉的身体环境,与环境中不同的设备构造出身体外的感知或塑造出某种更高级的超身体体验(trans-bodily experience,例如在虚拟体验中将自己设定为飞翔的鸟或超人)等。不过,仅仅说HoloLens 是延展体验的良好例证,并进一步说明元宇宙即延展体验,或混合现实体验,似乎显得过于简单。例证仅仅解释了延展体验的合理性,却没有提供良好的理论辩护。
我们不妨将前面关于耦合的定义放到这里,来判定延展体验(以及与此相关的元宇宙)能否作为延展认知的合理例证。混合现实版耦合系统定义:假设混合现实的耦合系统C 中由A,B 两个子部分构成。A 为现实状态子系统,B 为虚拟状态子系统。存在一个现实状态A1→A2,则其属性为P(A1→A2),那么与A 构成耦合态的B 状态B1→B2 的属性则为P(B1→B2)。 如果A、B 处在耦合系统中,C(A, B)则可表示为C[P(A1)*P(B1)→P(A2)*P(B2)]。 但由于B 是虚拟态,B1 仅能推导出B2 状态, 而不能推导出真实的A2 状态, 所以A、B 之间的耦合是松散的弱耦合系统,子系统B 仅仅是子系统A 的某种随附性(supervenience)状态(虚拟态伴随物理实现的状态改变而改变, 而不能影响到物理层的存在与变化),如图5 所示。
图5 元宇宙弱耦合关系示例
也就是说,耦合系统从现实物理状态下的A、B子系统转变为混合现实的真实虚拟系统的耦合。 在这种耦合态中,B 系统只能是A 系统的随附状态,因而这就造成了一个尴尬的结果:A、B 子系统塑造的并不是一个“完全耦合的系统”(fully coupled system),而是一个单向度耦合态:现实系统A 可以推导出虚拟系统B 的状态,但是B 的状态却不能决定A 的状态。 这就是说,当现实叠加虚拟的时候,我们或许可以在混合环境中完成一些任务, 因为真实的任务可以上传到虚拟空间中完成, 但虚拟的任务需要现实承担者(realizer)才能实现,因而虚拟任务并不一定可以在现实中得到“实现”。 通过一个简单的例子解释这一点: 假设艺术家在现实中创作了一幅画, 我们可以通过全息模拟技术将作品同步到虚拟世界中,并在虚拟世界进行再加工;但如果我们仅通过虚拟人在虚拟空间绘制一副图画, 除非借助现实世界的打印机, 否则这幅画将仅能在虚拟状态中永存,而无法在现实世界中真实存在,遑论再加工了。因而, 我们才说混合现实下的主体与设备之间组成的耦合系统仅是一种不完全的耦合状态。
另一个潜在的担心会认为延展体验为基础的第一人称意识是否会在不同的人之间进行交互, 从而破坏意识的私密性原则。那么,从如上的论证我们可以看出, 既然元宇宙设备佩戴者与设备之间尚且不会出现强耦合状态, 设备与设备之间的信息私密性就更不用担心了。
讲到这里,我们或许会感到有一些悲观,元宇宙似乎并不能像延展认知那样实现子系统(认知主体与特定设备)之间强耦合。 不过,元宇宙设备与认知主体之间的弱耦合例证仍然可以被视作积极的。 人与元宇宙之间的弱耦合状态说明, 现实与虚拟之间仍然有不可跨越的鸿沟,虚拟状态实现的精神产品,仍然需要现实的实现者(realizer)才能转化为实在。
克拉克在谈论延展认知的时候, 曾经说过一句很著名的话:在1998 年很多人会认为延展认知假说是天方夜谭,但是到了智能手机时代,大多数人倾向于认为它是真的。 我们今天谈论元宇宙或许也面临同样的情况,在新的技术没有出现的时候,我们仅仅从一个假想的角度去思考混合现实与沉浸式生存的时候, 或许仍然有那么一点点乌托邦气质。 德勒兹(2019)曾经断言,虚拟并不是虚假,虚拟本身就是真实的生活。纵然我们上面说明,今日的元宇宙技术仅仅可以在VR 与MR 技术的帮助下部分地实现与认知者在真实状态下部分耦合,但是,我们也能看到以元宇宙为媒介的后人类生存的脚步已经真实地开始影响到了人类的生活。 混合了虚拟与现实的远程医疗(远程手术)、远程无人机驾驶、脑机接口与人机融合技术、虚拟人物社区、区块链代币等技术已经真实地走进了我们的生活, 人类主体从现实的存在转变为现实与虚拟之间穿梭着的共在(朱林蕃, 2021)。
不过, 在对现有的元宇宙技术表达保守悲观情绪与对未来技术革新表达谨慎乐观之后, 我们或许还需要看到的是,扩展的生存方式与生活经验,一定会带来人类智性反思的重要变革。 如果我们接受这样的一个假设, 即感知觉输入与认知之间存在某种正向对应关系的话, 那么生存经验与生活经验的拓展, 一定会带来人们自身存在意义和心智奥秘的更多反思。由于生活经验成倍地增加了,那么我们关于生活经验的思考也会相应变得丰富; 新的反思可以为人类的生存提供新的行动指引。 借用苏格拉底那句名言,“未经省察的生活是不值得的”,在后人类时代, 我们或许要改写这句话为,“无论真实生活或虚拟生活,未经省察都是不值得过的”。