刘兆明
“元宇宙”作为2021 年资本市场的新概念,被广泛描述为基于交互形式革命的下一代互联网。正如其他任何新媒体技术一样,当被引入社会和市场后,在一定时期内,有一种张力势必会出现在元宇宙和现存的“媒体的仪式化惯例”①L.Gitelman&G.B.Pingree,New media,1740-1915,Cambridge,MA:The MIT Press,2003,p.xii.之间。
随着每一种新媒体技术的引入,都可以反复看到同样张力,②L.Manovich,“New Media from Borges to HTML”,in N.Wardrip-Fruim & N.Montfort(Eds.),The New Media Reader,Cambridge,MA:The MIT Press,2003,pp.13-25.如17 世纪出现的新通信技术在当时所引发的状况。③A.Golub,“Being in the World(of Warcraft):Raiding,Realism,and Knowledge Production in a Massively Multiplayer Online Game”,Anthropological Quarterly,vol.83,No.1,2010,pp.17-45.这一张力激发了公众和学术界对研究新技术的兴趣。任何新媒体技术、内容或流派的引入,常常会引起学术界和公众提出类似的问题:这种新技术是关于什么的?它是如何实现的?这种新技术如何影响人们,人们如何使用它,以及它如何有益地融入社会和文化?
对于元宇宙,以上问题并没有形成一致见解。
如果在元宇宙的某个方面能达成共识,那就是它基于虚拟世界。①Ball Matthew,The Metaverse:And How It Will Revolutionize Everything,New York:Liveright Publishing,2022,p.29.元宇宙概念紧密联系着沉浸式3D 虚拟世界,人们在其中使用化身交互。自20 世纪90 年代互联网普及以来,已经创建了“各种以计算机为媒介的虚拟环境,包括社交网络、视频会议、虚拟3D 世界和增强现实(AR)应用程序”。②Lee,et al,“All One Needs to Know about Metaverse:A Complete Survey on Technological Singularity,Virtual Ecosystem,and Research Agenda”,https://doi.org/10.13140/RG.2.2.11200.05124/8.从早期的纯文本游戏到身临其境的元宇宙,虚拟世界(环境)在海外的代际更替已成为梳理数字空间发展的重要线索。选择由其间的支撑技术或参与者来定义,基本决定了虚拟世界不同的发展方向和类型。
从这一观点出发,意味着元宇宙的基础构架是虚拟世界。虚拟世界是元宇宙的基石,对于促成元宇宙概念以及实现概念构想起着核心作用。这些虚拟世界可以是沉浸式、互动性强且广阔的数字环境,在其中的个体可以参与各种活动、社交并体验数字内容。它们可能涵盖虚拟现实(VR)、增强现实(AR)或实现两者的结合。这一观点表明,虚拟世界是元宇宙基础设施和功能的关键组成部分,它为元宇宙的存在和发展提供了空间、互动和体验的框架,并有助于建立讨论元宇宙概念和进一步探索的共同基础。
本文尝试从虚拟世界发展历史来纵向考察元宇宙,在历史脉络中讨论人与技术的交互关系,并且借鉴之前的研究和实践成果,构建基于人与技术相互作用的元宇宙观察模型,探索元宇宙如何转变人机交互范式。
单从词汇本身而言,Metaverse 即“元宇宙”一词最初是由科幻作家尼尔·斯蒂芬森在其1992 年的著作《雪崩》(SnowCrash)中创造的。元宇宙研究者,同时也是第一位嵌入虚拟世界的记者瓦格纳·詹姆斯·奥(Wagner James Au)③https://www.harpercollins.com/blogs/authors/wagner-james-au-880000031257.将《雪崩》的文本分析和对其作者的采访结合起来,把元宇宙定义为“一个巨大的、身临其境的虚拟世界,数百万人可以通过高度可定制的化身和强大的体验创造工具同时访问它,这些工具通过虚拟经济和外部技术与线下世界集成在一起”。④Wagner James Au,Making a Metaverse That Matters:From Snow Crash & Second Life to a Virtual World Worth Fighting For,Hoboken,New Jersey:Wiley,2023,p.34.回到元宇宙概念的源头来看,本文认为探讨元宇宙内涵必须先厘清“虚拟世界”这一概念。
简单而言,虚拟世界可以被认为是对线下世界可识别的模拟,包括山脉、海洋和城市等,视觉上很吸引人,而且种类繁多。在学术界,有观点认为虚拟世界是对三维空间的模拟,在这个空间内可以实现不同渠道的“虚拟传播媒介”;⑤G.Wadley,M.R.Gibbs& N.Ducheneaut,“You can be Too Rich:Mediated Communication in a Virtual World”,in Proceedings of the 21st Annual Conference of the Australian Computer-Human Interaction Special Interest Group,Design:Open,2009.另有观点认为虚拟世界超出了现代媒介概念所允许的范围,相比之前其他媒介,虚拟世界为人类文化的发展提供了“地方”(places)。⑥T.Boellstorff,Coming of Age in Second Life:An Anthropologist Explores the Virtually Human,Princeton,NJ:Princeton University Press,2008,p.17.这两派观点或者偏向媒介技术,或者偏向人类互动。一个相对折中的观点将虚拟世界视为“一个同步的、持久的人际网络,以化身表示,由联网的计算机推动”。⑦M.W.Bell,“Towards a Definition of Virtual Worlds”,Journal of Virtual Worlds Research,No.1,2008.伴随《第二人生》(SecondLife)、OpenSimulator 和VR 头戴式显示器的出现,用户可以通过使用化身进行交互,虚拟世界逐渐被认为是一个受现实启发的、数字的、多媒体的3D 在线环境。⑧Leenders Chandra,“User Innovation and Entrepreneurship in the Virtual World:A Study of Second Life Residents”,Technovation,Vol.32,No.7,2012,pp.464-476.
虚拟世界的发展包含了文学想象与游戏创新推动下开展的开放式、社交导向的虚拟平台进步。有研究将其分为五个阶段(见图1)。①Gilbert Dionisio,“3D Virtual Worlds and the Metaverse:Current Status and Future 3D Virtual Worlds and the Metaverse:Current Status and Future Possibilities”,ACM Computing Surveys,Vol.45,No.34,2013,pp.1-38.
本文在此基础上,以虚拟世界发展的阶段特征作为焦点,考察其背后的技术发展逻辑,将虚拟世界延续至元宇宙概念被炒作的这一段历史分为四个阶段:
(1)以文本为中心的虚拟世界
其时间范围在20 世纪50 年代到70 年代末。可以细分为两种类型:基于想象性文本的虚拟世界和基于网络化文本的虚拟世界。前一类型的代表是托尔金的《指环王》(LordoftheRings)。虽然在宽泛的意义上,所有基于想象的文学文本都构成了虚拟世界,但是,《指环王》中的虚拟世界设定非常详细且复杂,在文学之外也有衍生产品,比如跨媒介形态的游戏。在这个意义上,《指环王》可被视为一种元宇宙语境下基于想象性文本的虚拟世界。后一类型的代表是多用户迷宫游戏MUDs(Multi-User Dungeons)和多用户共享幻觉游戏MUSHs(Multi-User Shared Hallucinations),两者都是基于文本的网络化虚拟世界,多个用户可以在其中交互并与环境交互。就两者的共同点而言,MUSHs 通常是使用MUDs 服务器创建的,也可以将其理解为MUDs 的一种变体。两者之间也存在一些关键差异(见表1),归根结底,主要区别在于它们对角色扮演的关注差别。MUDs 的核心是基于文本的游戏,与聊天室没有什么不同(见图2)。大多数情况下,用户通过telnet 客户端连接,在虚拟世界中扮演角色。在虚拟世界中,每个房间、物体和生物的描述,都可能会在用户最喜欢的小说中找到。这些虚拟世界不受图形的限制,仅受游戏创造者和用户想象力的限制。
表1 MUDs 与MUSHs 比较表③刘兆明制表。
图2 MUDs 游戏《遗忘王国》(Forgotten Kingdoms)的登录界面①Fred Williamson,“Multi-User Dungeons(MUDs):What Are They? And How to Play”,https://medium.com/@williamson.f93/multiuser-dungeons-muds-what-are-they-and-how-to-play-af3ec0f29f4a.
(2)以图形为中心的虚拟世界
大约从20 世纪80 年代中期持续到21 世纪。也可以细分为两种类型:基于2D 图形的虚拟世界与基于3D 图形的虚拟世界。前一类型的代表是卢卡斯影业(Lucasfilm)1985 年推出的Habitat。它是首个采用图形界面的虚拟世界(见图3)。当然,这只是2D 图形界面,其在线环境对于用户而言就像一个原始的卡通片,在调制解调器拨号的低网速时代,其反应相对比较迟滞。作为图形化的MUDs,Habitat 也被认为是现代大型多人在线角色扮演游戏(MMORPG)的先驱。不同于当时的其他虚拟世界(即基于文本界面的MUDs),Habitat 被认为是更类似于VR 风格的应用程序。②Lucasfilm,Wiki,“Habitat”,https://lucasfilm.fandom.com/wiki/Habitat.另外,Habitat 还是首个使用“化身”(avatar)一词来描述其数字居民的虚拟世界。它拥有一个图形用户界面(GUI)和庞大用户群,还拥有自己成熟的经济体系,包括银行和货币,货币单位是代币(Token)。这些元素使Habitat 被公认为当今虚拟世界经济体系设计的基准。后一类型的代表是1994 年创建的Worlds(http://www.worlds.com)。1999年,Worlds 为著名歌手大卫·鲍伊(David Bowie)建立了Bowie World,这是首个完全基于全3D 图形公开可用的虚拟世界(见图4)。Bowie World 让大卫·鲍伊有机会与来自世界各地的粉丝在3D 虚拟世界中以化身形式沉浸式互动。3D 虚拟世界由计算机图形技术进步推动,其标志是3D 图形和用户创建内容(UGC)的模式。用户创建基础内容的工具运用引发了虚拟世界发展的范式转变,即从预先创建的虚拟环境到由参与者实时贡献、改变和构建在线环境。通过用户在3D 虚拟世界中进行社交,Worlds 重新启动了开放式、非游戏基础的类型体裁(最初出现在基于文本的MUSHs 中),从而将虚拟世界从游戏模式中更进一步地转变为一个提供替代性环境或文化的地方(places)。因此,彼时虚拟世界中的活动范围和多样性与整个互联网类似,仅以是否具备3D 和相应的互动模式为区别。
图3 首个采用图形界面的虚拟世界Habitat①Colin Lecher,“Lucasfilm Games' Forgotten 1986 Online Game is Making a Surprising Return”,https://www.theverge.com/2016/7/9/12134996/lucasfilm-games-habitat.
图4 首个完全基于全3D 图形的虚拟世界Worlds②https://www.worlds.com/.
(3)基于大规模商业化的虚拟世界
从21 世纪初延续至今。同样细分为两种类型:大型多人在线角色扮演游戏(MMORPG,即massively multiplayer online role-playing game)和多用户虚拟环境(MUVE,即Multi-User Virtual Environment)。前一类型的代表是《魔兽世界》(WorldofWarcraft),一款大型多人在线角色扮演游戏。该游戏设计出了一个开放的环境,着重向其参与者呈现这种环境的相关技术,提供令人惊叹的视觉效果、动画、角色扮演机会和引人入胜的3D 环境。游戏中的任务是可选的,旨在引导玩家,提升角色,允许玩家自定义游戏界面和控制方式,并且可以安装插件和做出其他修改。后一类型的代表是《第二人生》,被视为“一个多方参与的环境,对于其居民(用户)来说,重要的是他们可用的能力、他们在那里遇到的其他人的特征,以及这些不同的参与者之间相互影响的方式”。③Chip Morningstar & F.Randall Farmer,“The Lessons of Lucasfilm's Habitat”,in Cyberspace:First Steps,Cambridge,MA:The MIT Press,1991,pp.273-302.相比《魔兽世界》目标导向的封闭结构,《第二人生》“没有人为制造的冲突,也没有既定目标,这是一种完全开放式的体验”。④Kalning Kristin,“If Second Life isn't a Game,What is It?”,https://www.nbcnews.com/id/wbna17538999.这是一个3D 在线虚拟世界,其中的化身可以做真人在现实生活中做的事情,如购物、听音乐、看电影、交友、工作、买卖房产、玩游戏等。整体而言,这一阶段商业化虚拟世界用户基础的惊人扩张增强了虚拟世界的内容创作工具,来自现实世界的大型机构(例如企业、大学和非营利组织)更多地参与其中,发展了先进的虚拟经济,并逐步提高了图形逼真度。
(4)基于去中心化架构的虚拟世界
这是近年来正在发展的,主要借助的技术是点对点(peer to peer)技术和区块链技术。就前者言,始于2007 年的Solipsis 项目提供了第一个开源的虚拟世界系统,点对点技术和Raynet 通信协议的使用,使虚拟空间中存在的各个节点之间被允许分配通信和计算结果。Solipsis 主要由用户社区拥有和运营,主要特征之一是去中心化架构,这意味着它不受任何单一公司或组织的控制。它的另一个主要特征是专注于创造力和协作,旨在成为一个用户可以聚集在一起创建和共享内容的地方。Solipsis 拥有许多支持此功能的工具和资源,例如内置3D 建模工具和共享工作区。就后者言,中本聪在2008 年《比特币白皮书》中提出“区块链”(blockchain)概念。宽泛意义上说,区块链是点对点技术的延伸,是借由密码学与共识机制等技术创建与存储庞大交易资料区块的点对点网络系统。每一个区块包含了前一个区块的加密散列、相应时间戳记以及交易资料。这样的设计使得区块内容具有难以篡改的特性。区块链可用于创建去中心化经济,这意味着中心机构难以控制虚拟世界的经济系统。
从以上这四个阶段的发展来看,虚拟世界的演变可谓一个持续不断的用户需求导向的技术迭代过程。在技术水平提升和用户需求结合的推动下,虚拟世界从最初的基于文本的形态逐渐演变为全3D 图形的虚拟世界,直至今天的元宇宙概念。从这个意义上说,元宇宙特征和愿景的形成,既是虚拟世界历史演化的结果,亦有其自身的动力机制。
第一阶段,从形态看是以文本为中心的虚拟世界,但更本质的意义在于从基于想象性文本的虚拟世界到基于网络化文本的虚拟世界的演变,凸显了“连接”(Connected)和“网络化”(Networked)的价值,它们对于虚拟世界发展起到了驱动作用。
在基于网络化文本的虚拟世界之中,玩家能够连接并实时互动,营造一种社区感和共享体验。相比之下,基于想象性文本的虚拟世界是一种静止和孤独的体验,不能与其他读者互动或以任何方式影响故事。另外,基于网络化文本的虚拟世界是动态且不断发展的,玩家可以创建自己的角色,建立自己的社区,甚至创建自己的内容。这意味着基于网络化文本的虚拟世界是由玩家的行为塑造和影响的,而不是由单个作者预先确定的。
简而言之,“连接”是一种物理性(通常是电子性)的联系,这是虚拟世界发展的技术逻辑起点和基础,而“网络化”则意味着与其他人建立关系,成为人际网络的一部分。这种进阶就表现在理查德·巴图和罗伊·特鲁布肖(Richard Bartle&Roy Trubshaw)创建的第一个多用户程序MUD1 上。在此之前,大规模计算是由批处理管理程序控制的大型计算机主导的连接,而多用户程序MUD1 则允许多个用户同时访问一台计算机的不同资源从而形成联系。这一技术奠基形成了初期的虚拟社区,在这些社区能够体验到许多与实际社区相同的特征,如战斗、友谊、团结、争端等。
第二阶段,从形态上看是以图形为中心的虚拟世界,但从2D 图形到3D 图形的演变,不只是用户对于真实感的需求,更重要的是提出了虚拟世界究竟是被其背后的支撑技术还是其中的参与者之间的互动所定义的问题。
从2D 图形到3D 图形的演变使得虚拟世界更加复杂和逼真,用户能够更充分地参与到他们正在探索的环境中。当用户感觉他们是虚拟世界的一部分并且他们的行为能够对环境产生真正的影响时,就会产生沉浸感。在此基础上,MUDs 发展成为更复杂的程序,例如MOO(目标导向的MUDs)、MMORPG和MUVE,直至元宇宙概念的出现。
从发展序列上看,元宇宙即以MUVE 为基础,其中影响最深远的是Habitat。虽然Habitat 在技术架构上的探索相当超前,但有研究者指出,“从Habitat 的经验中汲取的重要教训是,网络空间更多地是由其中参与者之间的互动来定义的,而不是由实施它的技术来定义的”。①Chip Morningstar & F.Randall Farmer,“The Lessons of Lucasfilm's Habitat”,in Cyberspace:First Steps,Cambridge,MA:The MIT Press,1991,pp.273-302.更具体地说,这一观点认为虚拟世界是被其中参与者之间的互动及其所引发的想象力定义的。这一洞见后来被《我的世界》(Minecraft)印证。它被认为是历史上最畅销的视频游戏,其块状图形颠覆了游戏行业对最逼真图形的传统期望,因为领导开发团队的佩尔松(Persson)认为简单的图形有助于让体验更加个性化。事实证明,佩尔松对图形的看法是正确的。抽象到足以鼓励孩子们用自己的想象力填充他们的角色和冒险的细节,《我的世界》的沉浸感是由它的第一人称视角点燃的,世界的丰富性以及一种基于自然世界的物理感觉似乎一直可以伸展。②Wagner James Au,Making a Metaverse That Matters:From Snow Crash & Second Life to a Virtual World Worth Fighting For,Hoboken,New Jersey:Wiley,2023,p.112.
第三阶段,大规模商业化的虚拟世界也正是基于对虚拟世界究竟为支撑技术所定义还是被其中的参与者之间的互动定义的问题的不同理解,形成多样化的发展路径,具体表现为对沉浸感认知和标准的差异,即感官沉浸或社交沉浸。
感官沉浸是指虚拟世界刺激用户感官的能力,它可以通过使用高质量的图形、声音和触觉反馈来实现,旨在创造一种令人信服的临场感和真实感,让用户感觉自己真的是虚拟世界的一部分。社交沉浸则是指虚拟世界在用户之间创造社区感和互动感的能力,它可以通过使用语音聊天、多人游戏和其他形式的社交连接等功能来实现。社交沉浸旨在为用户创造归属感和共享体验,让他们与其他玩家建立联系或关系。
《魔兽世界》《第二人生》都是大规模商业化的虚拟世界,但它们偏向不同的沉浸感营造方式。《魔兽世界》通过其高度详细和身临其境的3D 图形、动态音效和响应控制代表感官沉浸。其游戏世界具有逼真的纹理和动画,营造出令人信服的临场感和沉浸感。该游戏还具有广泛的可定制选项,允许玩家根据自己的喜好和游戏风格定制他们的体验。相比之下,《第二人生》通过其高度可定制和用户驱动的方法来实现社交沉浸,允许用户创建和定制自己的化身,可与其他用户实时互动;并且具有广泛的创作工具,允许用户创建和共享自己的内容,在此基础上与其他用户协作并围绕共同的兴趣形成社区。
自从马克·扎克伯格宣布Facebook 投资元宇宙并更名为Meta 以来,它就被拿来与《第二人生》进行比较。①Diami Virgilio,“What Comparisons Between Second Life and the Metaverse Miss”,https://slate.com/technology/2022/02/second-lifemetaverse-facebook-comparisons.html.从基本形态而言,《第二人生》可以被视为后来科技公司元宇宙架构的雏形。有研究者认为,2021 年前的元宇宙研究都是基于《第二人生》的研究。②Sang-Min Park & Young-Gab Kim,“A Metaverse:Taxonomy,Components,Applications,and Open Challenges”,IEEE Access,Vol.10,No.4209-4251,2022,https://doi.org/10.1109/ACCESS.2021.3140175.由此可见,元宇宙是一个连续体,是一系列基于不断发展的数字技术且重视人与人以及人与技术互动的虚拟世界。
第四阶段,发展到Solipsis 项目和区块链技术引发的去中心化趋势。
从四个阶段的发展历程中,浮现出塑造虚拟世界的四种张力关系:技术与个人参与者的关系;个人参与者(用户)与机构的关系;感官沉浸与社交沉浸的关系;中心化与去中心化的关系。其中最根本的是个人与技术的关系,体现为人与计算机的交互范式。
总体而言,通过虚拟世界发展的历史视角,我们可以观察到人与计算机交互范式的变化是一种持续演进的过程。从简单的文本交互到图形化界面,再到沉浸式体验、自由创造和社交互动,交互方式不断向更直观、个性化和社交化的方向发展。社交性成为人机交互范式的重要组成部分。从Habitat 和Worlds 的社交虚拟环境到现代的MMORPG、MUVE,人们越来越重视与其他用户的交互和合作。虚拟世界提供了与他人共享体验、社交互动和合作创作的机会,使人机交互变得更加社交化和群体化。
另外,值得注意的是,从早期开始,虚拟世界的社区建设就呈现出一种自治叙事,即用户可以创造和探索自己的世界,并通过互动和社交与其他用户交流与合作。因为虚拟世界是一个由用户创造和掌控的空间,用户可以在其中建立自己的规则和价值体系,并以交互的方式共同维护和发展这个空间。这一叙事贯穿在整个虚拟世界的发展历程中,也进入上述这四对张力关系里。在自治叙事中,用户可以建立自己的规则和价值体系,其实也意味着早期虚拟世界往往没有明确的结构和规则。借用查尔斯·泰勒(Charles Taylor)在《世俗时代》中对源自维克多·特纳(Victor Turner)论点的引申“所有结构都需要反结构”,③Charles Taylor,A Secular Age,Belknap Press:An Imprint of Harvard University Press,2018,p.47.本文认为早期虚拟世界所代表的数字文化可能未必是反结构的,但也并非复制或映射日常生活中的结构,更像是一种“非结构”。在“非结构”中,虚拟世界的参与者之间的互动和创造往往是自由的,没有明确的目标和约束,某种意义上成为他们的数字乌托邦。由此可见,虚拟世界发展背后的人机交互范式,不是让人沉浸在某个特定的数字空间中,而是让人通过技术的帮助来建立外在于人的“联系”,不只是与另一个人的联系,也可能是与另一种文化或另一种实践的联系。
作为元宇宙原型的虚拟世界,经历了为支撑技术所定义到被其中的参与者和技术共同定义的历程,从而延展出不同的类型。相应地,对虚拟世界以及元宇宙的研究也基本遵循两条路径:技术中心路径和“社会—技术”交互路径,也由此衍生出各具代表性的元宇宙研究模型。需要说明的是,模型与理论的不同之处在于,理论用于解释,模型则用于表达。在元宇宙研究领域,大部分模型应当属于描述性的或预测性的。描述性研究模型经常被用来描述元宇宙这个复杂体系中的众多变量和各种关系。预测性研究模型则被用来预测元宇宙发展的趋势和场景。
以被引数据而言,最有影响力的元宇宙研究模型由元宇宙研究高地之一的美国内布拉斯加大学奥马哈分校团队提出(见图5),这是一个描述性模型。该模型基于五个交互组件:(1)元宇宙本身,(2)人/化身,(3)元宇宙技术能力,(4)行为,以及(5)结果。①Davis,et al,“Avatars,People,and Virtual Worlds:Foundations for Research in Metaverses”,Journal of the Association for Information Systems,Vol.10,No.2,2009.建构这一模型的学理基础源自适应性结构化理论(AST),该理论认为先进的信息技术(元宇宙就是一个例子)会触发适应性结构化过程,从而导致技术和/或群体最初提供的规则和资源发生变化。②Geradine De Sanctis&M.Poole Scott,“Capturing the Complexity in Advanced Technology Use:Adaptive Structuration Theory”,Organization Science,Vol.5,No.2,1994,p.121.适应性结构化理论将技术与社会过程之间的相互作用作为核心概念,因此该模型采用交互论的观点,将元宇宙技术能力作为起点并展示持续的社会互动如何影响和改变这些技术能力。
图5 “社会—技术”交互路径的元宇宙研究模型③Davis,et al,“Avatars,People,and Virtual Worlds:Foundations for Research in Metaverses”.
笔者将五个交互组件构成的这一元宇宙研究模型视为理解元宇宙环境中团队合作的基础,换言之,这一研究的着重点其实是虚拟团队(Vritual Team),即探索技术发展背后人类参与者的作用以及他们通过彼此的交互和与技术的交互可以采用的多种潜在路径。这一描述性研究模型和其背后的理论视角为元宇宙研究奠定了一个学理研究的规范性框架,但是其阐释力被局限在一个比较狭小的范围,在元宇宙概念和实践的不断拓展趋势下略显单薄。
同样具有影响力却在一定程度上被学术界忽视的元宇宙研究模型来自美国非营利机构Acceleration Studies Foundation 牵头研究并在2007 年推出的元宇宙路线图(见图6)。①John Smart,Jamais Cascio & Jerry Paffendorf,“Metaverse Roadmap :Pathways to the 3D Web”,https://www.metaverseroadmap.org/overview/.这是一个基于情境方法(Scenario Approaches)并强调元宇宙相关技术特征的预测性模型。情境被用来在规划者和利益相关者之间激发新的思维方式。情境描绘了未来故事的愿景或可能的替代方案,并用于评估决策和政策的影响。②McMillan Chakraborty,“Scenario Planning for Urban Planners:Toward a Practitioner's Guide”,Journal of the American Planning Association,Vol.81,No.1,2015,pp.18-29.
图6 技术中心路径的元宇宙研究模型
该模型为了构建情境集(scenario set),选择了两个可能影响元宇宙展开方式的关键连续体:从增强(augmentation)到模拟(simulation)的技术和应用范围,以及从贴身(以身份为中心)到外部(以世界为中心)的范围。这里实际牵涉四种技术:增强现实技术、模拟(或平行现实)技术、贴身(Intimate)技术和外部(External)技术。
根据不同的技术维度和组合,这个元宇宙模型有四个关键组成部分:虚拟世界(Virtual Worlds)、镜像世界(Mirror Worlds)、增强现实(Augmented Reality)和生命记录(Lifelogging)。这四种情境强调了不同的功能、类型或元宇宙技术。相对而言,实时3D 的虚拟世界是最容易和元宇宙概念及愿景联系起来的;镜像世界是对现实世界的虚拟建模;增强现实是通过使用位置感知系统和界面,在人们对物理环境的感知中添加控制或信息层;生命记录则是以增强技术来记录、报告用户的贴身状态及生活历史,以支持用户的自我记忆、观察、交流和行为建模。
笔者结合上述理论与实践研究,尝试构建一个以共时性视角为主,呈现人与技术相互作用、相互聚合的动态过程的研究模型。元宇宙是发生在物理和数字世界的混合中,动态地由用户控制并受社会文化影响的人机交互实践,通过数字化技术增强和改善用户的体验,帮助用户更好地解决日常生活中的实际问题。元宇宙技术的重点不仅仅是构建逼真化身带来的沉浸感,而且在于重塑用户身份并推动更深层次的多元互动。通过技术的连接,数字空间与现实世界的互动,构成相互关联的平行现实。在这一认识的基础上,从人机交互实践和技术本质特征两个维度切入,本文构建的元宇宙研究模型包括数字增强的物理世界(Augmented Space)、网络世界(CyberSpace)、虚拟世界(Virtual World)和镜像世界(Mirror World)四象限在内的模型(见图7),形成动态的互联交互。
图7 “技术—”交互路径的元宇宙研究模型④刘兆明制图。
(1)作为问题解决方案的技术
当下的元宇宙所处的时代相当于互联网发展的20 世纪90 年代中期,很多人在谈论它,一些人已经在构建它,但没有人能真正说明它到底是什么,或者它将成为什么,能够为我们做什么。简而言之,元宇宙究竟解决了什么问题?
目前来看,元宇宙有潜力解决的问题之一是人机交互中注意力的锁定。基于2D 屏幕的人机交互,人必须使用视觉和认知注意力来接触计算机、平板电脑或手机屏幕,从而将自身的观察和思考从物理世界以及周围的人、地方和事物中抽离出来。一个直接结果就是现代人在社交媒体和游戏屏幕上花费了太多时间。换而言之,智能手机和电脑的成功正在于其高效且个性化地解决了信息和娱乐供给的问题,不知不觉让人付出了高昂的时间成本。
如果要解决的问题之一是电脑和智能手机所引起的注意力锁定,那么旨在提供沉浸感的元宇宙如何解决呢?理论上说,需要以一种改善生活的方式从视觉上融入人的物理世界,而不是将人从物理世界中抽离出来。这需要破除元宇宙与沉浸感体验的机械联系,将元宇宙想象成两端分别是数字和物理世界的光谱。依据当下所服务的目的,这既可以让人完全沉浸在数字化世界中,也可以让人停留在数字增强的物理世界中。从这一认识出发,在技术上增强现实眼镜将解决注意力锁定的问题,允许用户在使用技术时重新与他们的环境连接,并腾出双手去做其他事情。但这一解决方案也有局限性,即在公共空间使用会带来公众对隐私刺探的担忧。谷歌眼镜项目在商业上的失败,也说明了对新技术的接受有一个比较长的文化调适过程。
从这个意义而言,元宇宙不是静态的事物或产品,而是发生在物理和数字世界的混合中,动态地由用户控制并受社会文化影响的人机交互实践。无论沉浸感如何,重点是通过数字化技术增强和改善用户的体验,帮助用户更好地解决日常生活中的实际问题。
从问题解决导向的实践视角来看待元宇宙,是一部分学术界和产业界人士的共识。《融合文化》的作者、资深媒介学者亨利·詹金斯(Henry Jekins)认为,相比生成式人工智能,对元宇宙究竟解决了什么问题以及如何解决问题的答案还不是十分清晰。①源自笔者与亨利·詹金斯的私下讨论。诺基亚公司出身的硅谷未来学家莱斯利·香农(Leslie Shannon)也认为,除非元宇宙解决了一个问题,否则它不会流行起来。②Leslie Shannon,“How the Metaverse will Mimic The Physical World”,https://meetaverse.com/podcasts/leslie-shannon-how-the-metaverse-will-mimic-the-physical-world/.
在以上基于实践情境的定义中,元宇宙更指向人类和计算机交互的新范式。元宇宙不只是与物理世界分离的特定数字世界,而且是用超越物理世界的方式将来自互联网世界的数字信息(或娱乐)与物理环境实时结合,以解决相关问题。
(2)外部技术与贴身技术
在以往的元宇宙研究中,以技术为中心的路径较占优势。由于元宇宙依赖于不同技术组合,这一研究路径也可能导致具有相似技术特征的技术之间的混淆,比如Acceleration Studies Foundation 的元宇宙路线图中所谓的外部技术和增强现实技术。毕竟,任何技术都是更广泛环境中的人工制品。因此,技术的定义需要考虑使用它时的活动和实践,以及围绕它使用的社会安排和组织形式。基于这样的考虑,本文只引入相对更具备区隔性的技术概念——外部技术和贴身技术来帮助建构模型。贴身技术应用于“技术--人”交互路径的元宇宙研究模型的右半边象限,而外部技术应用于该模型的左半边象限。
外部技术,指面向整个身体之外的技术,能提供给用户周围环境的有关信息和控制能力。在这个意义上往前追溯,常见的外部技术包括过去的大众传媒技术和当下的增强现实技术。增强现实技术当下主要以某种方式在视觉上向用户提供额外信息以改变用户对现实世界的感知,主要的好处是它设法将数字和三维(3D)组件与个人对现实世界的感知相结合,达成数字信息与用户环境的集成。如谷歌地球(Google Earth)是一种基于网络的开放标准数字地球地图,在其中用户可以借助SketchUp 等程序将3D建筑数据添加到任何地理信息系统(GIS)叠加层(旅游景点、房地产地图、道路、企业等)中。
贴身技术,即向内聚焦关注个人(或物体)的身份和行为的技术,在元宇宙中这意味着用户要么通过使用化身出现,要么通过直接作为系统中的参与者出现。在更早之前,贴身技术以耳机等设备的形式与身体紧密相连,直至成了生活的一部分。将虚拟世界与其他技术区分开的关键组成部分是化身,即贴身技术的高级阶段形态。贝尔(Bell)明确区分了用于Facebook 等应用程序中代表用户的化身以及虚拟世界中的化身,前者的化身是网站上用户的静态表现物,后者的化身则是具有能动性的代理。①M.W.Bell,“Towards a Definition of Virtual Worlds”,Journal of Virtual Worlds Research,No.1,2008,https://journals.tdl.org/jvwr/article/view/283.
贴身技术的关键不只在于技术实现的难度,更在于理解技术变革对人的身份意识和行为逻辑的影响。这集中表现在化身是否需要基于用户真实外观的假设差异。
Facebook 偏向于强调化身逼真还原用户真实形象,其观点部分体现为宣传片中扎克伯格高还原度的化身形象。毕竟,Facebook 最初就是围绕现实世界的互动而构建的,其系统核心在于网络身份和现实身份的映射关系。在更名为Meta 后,也始终在原有框架中按技术升级逻辑思考,没有完全意识到其背后是人机交互范式的转变。
其他元宇宙平台则持另一种假设,即用户未必喜欢基于真实外观的化身。最流行的元宇宙平台里的化身并不是用户的镜像,比如《我的世界》(Minecraft)和《罗布乐思》(Roblox)都具有块状或类似乐高积木的头像。《堡垒之夜》(Fortnite)还具有表现力十足的程式化卡通人物。非镜像化身的流行反映了核心用户群的内在动机:从虚拟世界脱身而来的元宇宙,其吸引力在于可以在日常生活以外探索、创造和发展新的身份。尤其是,很多用户还处在由监护人甚至同龄人线下监控他们的外表和行为的年龄阶段,面临着似乎无休止的审查和自我审查,一旦使用更逼真的化身,或许会导致将相关压力和焦虑带入元宇宙中。而在这些流行的元宇宙平台中,用户相互之间的任何互动都无关各自的家庭,也不牵涉身体和外表,而只是在其间呈现出他们各自的技能、创造力和社交状态。
简而言之,贴身技术对于元宇宙的价值在于重塑用户身份,推动用户的社交互动进入更深层次。从这个意义而言,实时互动相比逼真化身带来的沉浸感,更有利于推动元宇宙的发展。元宇宙入口并不必然是相对昂贵的头显设备,只要有能接入互联网的PC 和移动智能终端,就可以进入元宇宙。
(3)相互关联的平行现实
“平行现实”(Alternative Reality)是指与我们日常所经历的现实世界平行存在的替代现实。它是一种通过计算机技术驱动的与现实世界相互作用的数字空间,为人们提供了与现实世界不同的体验和互动方式。增强世界、网络世界、虚拟世界和镜像世界都可以被视为平行现实。以技术标准判断是否具备实时双向传播,以及是否具备沉浸感体验,构成了四组内容不同的平行现实:增强世界非实时且非沉浸;网络世界实时且非沉浸;虚拟世界实时且沉浸;镜像世界非实时且沉浸。
增强世界即数字化增强的物理世界。严格意义上说,物理世界和网络世界应该是有明确界限的,但在以媒介为中心的考察中,可以将物理世界视为屏幕之外有物理属性的网络世界,网络世界则可视为以互联网为基础设施的物理世界。其间的区别在于,数字化增强的物理世界的媒介价值在于预置的“信息”,而网络世界的核心价值在于跨越物理距离的实时“对话”。这其中的区隔在于web2.0 技术赋权的参与感。从广义而言,Cyberspace 的概念本应包含网络世界和虚拟世界/镜像世界,能够将其区分开来的是技术元素及其带来的沉浸感。
镜像世界通常是指通过传感器、相机等技术预先采集物理世界数据,然后经过计算机处理,用户可以在其中进行沉浸式的互动和体验。镜像世界主要侧重于模拟物理世界,以虚拟模型对物理世界进行“映射”,让用户可以通过数字化的方式在物理世界中进行体验和互动。如果说虚拟世界涉及可能与地球相似或截然不同的平行现实,镜像世界则模拟我们周围的物理世界,为物理世界信息添加了精确的空间背景,“像镜像图景一样嵌入电脑之中,通过它能看到和理解这个世界的全貌”。①Kevin Kelly,“AR Will Spark the Next Big Tech Platform—Call It Mirrorworld”,https://www.wired.com/story/mirrorworld-ar-next-bigtech-platform/.
基于实时沉浸式内容的虚拟世界最接近当今广为接受的元宇宙定义。虚拟世界是一个完全数字化的世界,用户通过化身,出于各种目的,与其他化身、地点和事物进行交互。交互基于三个技术元素:跟踪、渲染和显示。跟踪是测量身体运动的过程;显示是我们用数字信息代替物理感官的方式;渲染是采用3D 模型为新跟踪的位置实例化适当的视觉和其他感官信息。在理想化的愿景中,每次跟踪运动时,场景中的数字信息都需要针对新位置进行实时渲染并显示。这是一个有待突破的技术难题和发展方向,但正如前文所述,对实时3D 沉浸的技术追求,不应该成为元宇宙发展的迷思和自我陷阱。
从社会—技术交互逻辑看,技术发展是沿着不断赋能用户的路径进行的。从元宇宙的实际发展路径中看,更多是致力于以数字物理结合或者全数字化等超越物理世界的方式,将用户和其他不同的人、地点、事物、信息联系起来;通过这种联系,即为了双方的利益将一种平行现实与另一种平行现实结合起来,形成相互关联的平行现实。就当下的理论和实践状况而言,所谓元宇宙,更容易被视为“技术—人”交互路径的研究模型里下半象限的镜像世界和虚拟世界,而未来的元宇宙势必会把该模型上半象限的增强世界和网络世界一并囊括,形成互相连接、交互和影响的动态机制(Dynamics)。
元宇宙脱胎自虚拟世界,处在互联网和虚拟世界两条技术形态发展序列的交汇点上,并由此产生了基于不同目的的平行现实。元宇宙不只是特定的数字空间,更是变革中的人机交互范式。在实践情境中,用户通过超越物理世界的方式,将自身所处的物理世界和其他的人、地点和信息联系在一起,解决某一领域的问题,包括但不限于游戏、社交、教育、商业、政务等,并由此构成了元宇宙的子类别。简而言之,元宇宙可被视为互联的平行现实。
元宇宙的发展对人与计算机交互的关系有着深远的影响,它提供了一种更直观、更直接的交互方式,使人们能够以更自然的方式表达和实现自己的意图。这种全新的交互体验将进一步缩小人与计算机之间的鸿沟,使技术更加无缝地融入人们的生活和工作中。当然,随着元宇宙的发展,也引发了一些伦理、隐私和安全等方面的问题。
元宇宙并不脱离已有的技术和媒介经验,可以被视为在日常生活中接触的另一种媒介。从媒介技术的角度看,脱胎自虚拟世界的元宇宙至少涉及三种技术:计算机网络技术、数字环境的视听传达技术、集成大众传播和人际传播的通信技术。以单独的技术体验而论,它们都早已渗透到日常生活之中。所有媒体技术都因其技术结构而具有可供性和限制性,这些技术结构可能与其他媒体技术一致或不同。
元宇宙的设想来自虚拟世界,但虚拟世界并不是独立于人们日常生活的非虚拟世界:构成虚拟世界的系统在其结构和意义上依赖于构成非虚拟世界的预先建立的系统。②J.Malpas,“On the Non-autonomy of the Virtual Convergence”,The International Journal of Research into New Media Technologies,NO.15,2009,pp.135-139.因此,我们如何理解虚拟世界,类似于我们如何理解人与其他媒介(技术)的互动,这也与我们如何理解日常生活中的非媒介体验有关。从这个意义而言,没有虚拟世界和现实世界,只有“世界”;没有线上生活和线下生活,只有“生活”。
大多数关于元宇宙的对话都过多地围绕技术基础设施展开,忽略了使元宇宙变得更有价值的基本部分。事实上,几乎每个成功的虚拟世界(元宇宙平台)都会唤起情感共鸣,从探索新世界的惊奇和敬畏到分享用户创造力的满足和喜悦。
本文基于虚拟世界发展的纵向历史考察元宇宙的兴起,在历史脉络中讨论用户与技术或与其他(人与物)的交互关系,发现了塑造虚拟世界的四种并峙的张力关系以及背后的情感力量。Meta 宣示打造元宇宙,将虚拟世界带到公众关注的前沿,并引发政府和大型企业入局。这不但扭转了以往虚拟世界的发展路径,而且,随着治理水平的提升和规则的完善,可能还会导致早期虚拟世界所代表的数字文化的褪色,即自治性叙事和非结构之维消失。某种程度上说,元宇宙的兴起既是虚拟世界的再发现,也是对虚拟世界的再建。
本文认为,不应将元宇宙视为与现实世界分离的独特数字空间,而应视之为变革中的新型人机交互范式。元宇宙不只是在创造一个新世界,也是在重建一个失落的世界,它在技术和实践情境上呈现为互联平行现实。元宇宙的关键是联系而非沉浸感。它不只是与另一个人的联系,也可能是与另一种文化或另一种实践的联系,并且,捕捉和保存物理世界中所流失的情感力量,包括爱、快乐、成就和独特的世界观。