我们这个时代是感性之物去个体化(disindividuating)的时代。据中国信通院公布的数据,2025年全球算力规模将达到3300EFlops(亿亿次浮点运算)。当Open AI基于新文本转视频模型Sora生成60秒的长视频,并且在这个过程中,还能够自己切换镜头,甚至给出特写时,这种技术图像给观看带来了前所未有的挑战。20世纪末,威廉·弗卢塞尔(Vilém Flusser)在《书写还有未来吗?》(Does Writing Have a Future?)一书开宗明义地自忖:“书写”这种古老的媒介形式在数字化、图像化的信息时代的未来在哪里?我们今天或许正面临一个颇为类似的问题:在人工智能时代,影像艺术这一“生不满百”的艺术的未来在哪里?本文试图从算法图像(制作逻辑)、非人图像(感知逻辑)和强权图像(政治逻辑)三个方面,探讨人工智能时代影像艺术发展的逻辑转向,而这一新的图像逻辑也许昭示了影像的未来之路。
一、从面对时间到面对算法
简要梳理人工智能发展的历史,从1950年“人工智能之父”艾伦·图灵著名的“图灵测试”——如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么这台机器便具有智能——到2024年可以生成动态视频的Open AI最新迭代的Sora版本,相关领域的发展和更迭速度令人震惊。当下基于AIGC(Artificial Intelligence Generated Cotent)技术生产的图像内容完全颠覆了之前的图像生产逻辑。我们到底如何理解这种基于算法生成的图像?
即使不以距今15000年的拉斯科洞穴壁画为参照,只有100多年的艺术史研究也落后人工智能生成图像本身太远。但我们仍可从艺术史学者乔治·迪迪-于贝尔曼的写作中得到一些启发,尤其是“不安的相似”(ressemblance inquiète)这一概念。从1995年出版的《无形之相似,或乔治·巴塔耶令人愉快的视觉知识》(La Ressemblance informe,ou le gai savoir visuel selon Georges Bataille),到2008年的《相触达及相似:考古学、错时主义与印记的现代性》,以及2023年和2024年刚出版的两卷本“不安的相似”——《改变了的人文主义:不安的相似Ⅰ》(L’humanisme altéré)和《床单之间的面孔:不安的相似Ⅱ》(Des visages entre les draps),迪迪-于贝尔曼系统扩展了他的“相似性”理论。我们可以从他《面对时间》中的经典案例窥探这一理论,他将意大利文艺复兴早期的弗拉·安吉利科(Fra Angelico)的壁画《阴影圣母》(Madonna delle Ombre)中颜料飞溅的斑点(图1)与杰克逊·波洛克(Jackson Pollock)的现代滴画联系在一起。虽然两者在时间上相隔数百年,艺术风格和创作方法也截然不同,但迪迪-于贝尔曼在他们的作品中找到了相似的视觉形式。一般认为,在15世纪绘画的“非正式”(底座)部分与波洛克的抽象画之间建立直接的亲缘关系显然是不可能或荒谬的,但这两个图像之间的相似性仍然构成了一个问题——一个艺术史的“错时性”(anachronique)问题。一定程度上,“相似”是他借由瓦尔堡而提炼创造的“遗存”(survivante)的艺术史方法论的另一重化身,他们共享着“错时”的时间模型。他将瓦尔堡遗存的图像认识模式概括为一种错时的艺术史认识论,也就是他在《面对图像》的开篇时所讲:“当我们面对图像,我们总是在面对着时间。”[1]
人工智能生成的图像一个最大的特点就是相似性,因为算法图像的本质正是基于海量图像的学习之后模拟生成新的图像。当我们面对这些技术生成的图像时,我们面对的不再是时间,而是算法。也就是说,人工智能图像与以往艺术史所处理的人工图像虽然共享着相似性这一“症候”,但它们的本质却迥然有别:前者满足于统一的多样性,即对“相同的相似性”(ressemblance du même)或者说“没有时间的相似性”感兴趣,而后者关注的是差异的相似性或“遗存”的相似性。对相似性不同的认识成为理解人工智能生成的算法图像的关键。比如雷菲克·阿纳多尔工作室(Refik Anadol Studio)2020年创作的《量子记忆》(Quantum Memories),利用最前沿的Google AI公开的量子计算研究数据和算法,通过人工智能处理大约2亿张自然和风景图像(图2)。这件作品堪称是对Google AI量子至上实验、机器学习和概率美学之间交集的史诗级创作。除了维多利亚国家美术馆的《量子记忆》外,阿纳尔多还创作了在纽约现代艺术博物馆展出的《无人监督》(Unsupervised),通过将现代艺术博物馆庞大藏品的元数据(138151件作品)转换成一件不断实时生成新形式的作品,提出了对现代艺术的另一种理解(图3)。阿纳多尔是数据和机器智能美学领域的先驱,以上两件作品都是他正在进行的项目“机器幻觉”(Machine Hallucinations)的一部分,从中我们可以看出贯穿他开创性的未见世界的可视化作品的主要线索是数据。如何处理数据而不至于沦为一种“平均图像和美”(Durschnittbild und Schoenheit)[2]便成为影像艺术家处理算法图像的核心。
所以,我们必须把迪迪-于贝尔曼那句话改写为:当我们面对(人工智能)数字图像,我们总是在面对着算法。这种算法图像包含的是另类的时间概念,一种潜在时间(latent time)、深层时间和嵌套时间。算法不仅仅是在生成无数张模拟真实的图像,而且是在生成一种模拟时间的图像序列。其中包含大量与人的时间感受无关的技术时间:数据训练的时间、机器计算的时间、软件渲染的时间等。
二、从无人的风景到非人的风景
当图像的制作和图像的解释越来越多地在没有人眼的情况下自主发生时,机器如何观看?数字图像,就像任何种类的信息一样,是人类感官无法接触的。简要地梳理一下纽约现代艺术博物馆的录像艺术史,就会发现其中的某些转变。1968年庞杜斯·胡尔特恩(Pontus Hultén)的大型展览“机械时代结束时看到的机器”(The Machine as Seen at the End of the Mechanical Age)可以看作是对现代主义,对所有金属、动力和电动事物的迷恋的回顾性调查,它预示着艺术从工业机械时代向后工业信息时代的过渡,并将阴极射线引入纽约现代艺术博物馆(简称“MoMA”)。时隔半个世纪后,2023年MoMA举办了“信号:视频如何改变世界”(Signals:How Video Transformed the World)展览,这是MoMA迄今为止对媒体艺术的最大展示,录像艺术终于从MoMA的地下室走向了6楼的特别展厅(图4)。但就在这个展览宣示着“录像艺术”在体制上的某种胜利的同时,我们略带悲观地认为它也指出甚至加速了自身的消亡。伴随着互联网尤其是手机端上充斥着的大量短视频内容,多种屏幕媒介在我们的日常生活中激增,以及过去10多年来人工智能技术对图像生产的冲击,都需要新的框架来理解移动图像。现在我们将包括数字游戏、动画,甚至编程视频都统称为“移动图像”,从作为二进制代码的电视和视频技术到依靠强大算力生产的技术图像,那么,从“录像”到“移动图像”——国内似乎更愿意称之为“影像艺术”——的语义滑移,感知逻辑发生了何种移转?
吉尔·德勒兹在《电影Ⅱ:时间—影像》的最后,对未来影像形式做过界说:“电子影像应该建立在另一种艺术意志之中或者在时间—影像尚不为人所知的方面之上。”[3]从机器和技术的角度来看,影像艺术延续了早期录像艺术的“非人”立场,即厌倦了“再现”,而倾向于“呈现”“没有人的宇宙”(L’univers sans l’homme)的诗学,也就是放弃再现世界,而从外部观看的传统立场。正如弗里德里希的油画《雾海上的旅人》(Der Wanderer über dem Nebelmeer)所再现的人物,他站在山顶,他统治、掠夺、自恋和满足的在场,来建构这个自然的存在。这里隐含了一个显而易见的阶级意识:人统治世界。机器视觉不仅致力于将人从风景中移除,生成“渺无人烟”(anthropofuges)的影像,以此来挑战人类中心主义,还倾向于构建完全没有人形,没有人迹、活动、栖息地或残留文字出现,有的只是机器的噪点与乱码的非人的世界。“无人的风景”契合了当下人类纪的生态主义思潮,尤其是行星思维下一般生态学理论,即认同人类与非人类代理的合作,在有机的自然状态之后,接着是机械的第二自然状态,以此重新安排人类力量和非人类力量之间的关系。而“非人的风景”则更进一步,这一取向的影像艺术创作认为我们应该从方兴未艾的人类纪幻觉中醒来,因为在他们看来,以人类状态去命名一个纪元依旧过于人类中心化。所以我们不应该说“人类纪”,而应该说“技术纪”(Technocene)。在“技术纪”时代,世界上大部分的图像都是由机器为其他机器制作的,人类很少参与这些循环。
这种由技术主导的非人转向思潮引导着当下影像艺术的另类感知方式,即如何感知这些“M2M”(Machine to Machine)的“隐形图像”(invisible image)。20世纪上半叶,胡塞尔警告说,由于技术化和数学化的加剧而引起的感觉的危险转移。他认为西方科学危机的威胁在于感官的完全丧失,即由科学/技术引起的感官的危机和毁灭。这种感官的政治哲学描述在现在显然已经不合时宜,因为它是受制于再现的教条式的思想形象的必然结果,但这也并不表明我们已经进入了一种毫无顾忌的技术化虚无主义。相反,我们只是在重新配置自我的感官。正如让-吕克·南希清楚认识到的:“技术的统治拆解并破坏了感觉的无限反馈。”[4]在智能机器控制的密集、大规模的图像捕捉和数据收集下,图像的观众不再是人而是机器,所以,当影像艺术家逐渐以模拟和“机器视觉”为出发点进行创作时,我们也必须以一种技术的知觉来理解影像。也就是说,我们必须获取“机器之眼”。人工智能图像的美学认识论在于它是“非人美学”,日常状态下的人是无法体验到这些的,我们只有通过生成,生成一种“非人”(non-human)。所以,我们有必要为德勒兹的生成哲学添加“生成-机器”这一环节,并由此达到对这种“算法之美”“机器之美”的感知。
三、从贫乏图像到强权图像
2012年是人工智能发展的一个节点性时刻,人类构建了跨越整个地球的基础设施,可以收集整个地球的信息并存储。这也表明人工智能的物质性,它并不像我们用语音唤醒Siri,或者使用“云盘”进行异地数据管理时那么“虚无缥缈”。凯特·克劳福德和弗拉丹·约勒在《解剖人工智能系统》中指出:运行大规模人工智能系统需要三个核心提取过程:物质资源、人力和数据[5](图5)。而这种物质性以及所引申出来的控制它的能力,在很大程度上是政治性的。所以,人工智能时代的图像政治正是基于这种对物质性的占有和操控而来的强权图像(power image)。
传统影像艺术的图像政治在很大程度上是依靠“贫乏图像”(poor image)展开的,“贫乏图像是录像艺术的来世”[6]。贫乏图像表面上看是指那些分布在互联网上模糊的、低分辨率的图像,但内在代表的是一种更加民主的全球流通图像,正如黑特·史德耶尔在《为贫乏图像辩护》一文开篇所言:“‘贫乏图像’是流通的副本。”在《为贫乏图像辩护》一文发表一年之后她写了《像你我一样的物》(A Thing Like You and Me),将“贫乏图像”延伸到更宽泛的“数码图像”(digital image)——它们是“闪亮的、不死的、对于自身的克隆”。但无论是互联网上的“贫乏图像”还是“数码图像”,它们都表达了一种借由图像的非物质化而进行流通的图像政治。在过去的30年里,德国艺术家兼理论家黑特·史德耶尔通过录像、装置和电影项目,一直在追踪图像的变异方式——从模拟图像及其蒙太奇的多种可能性到分裂的数字图像的流动性——以及这些变异对战争、种族灭绝和资本流动的再现所产生的影响。所有这些都一以贯之地聚焦于其对图像政治的不懈追问。“贫乏图像”代表了史德耶尔重新定义图像的价值,或者用一个全新的视角来审视图像政治的尝试,那就是从图像交换价值转为图像的流通价值的关注。但是,当“贫乏图像”被粗暴地压缩以便快速流通,以失去质量为代价来换取速度时,当史德耶尔向这种图像报以同情并为这种图像世界里的“无产者”辩护的时候,人工智能图像却向这种“无根的”图像权力发起了“诉讼”。
只要简单梳理一下人工智能系统的全球链条,就会发现人工智能不只是改变了图像生成和传播的逻辑,更深刻地影响了图像的权力分布。不用说文本生成视频这种前沿技术,日常每一个与智能设备互动的小小的便利瞬间——无论是询问一个问题、打开一盏灯还是播放一首歌——都需要一个庞大的地球网络,而这个网络的动力源于不可再生材料、劳动力和数据的提取。人工智能系统与其他形式消费技术的关键区别在于:它们依赖于对人类生成的大量图像、文本和视频的摄取、分析和优化,而这又依赖于大量的物质消耗。所以,人工智能图像不能单单从流通环节来把握——这正是“贫乏图像”所做的——而是应该被视为庞大的混合体。正如希腊神话中的奇美拉(Chimera)是一种集狮子、山羊、蛇和怪物于一身的动物一样,人工智能图像同时也是消费者、资源、工作者和产品的杂合体。“贫乏图像”让我们产生了图像民主化的幻觉,人工智能图像让我们真切意识到图像背后的权力关系。虽然像Open AI这样的机器学习工具从用户创作自己的作品的角度来看越来越容易,但这些系统的底层逻辑和用于训练它们的数据却只有金字塔顶端的极少数实体能够获得和控制。而这就是我们所谓的人工智能图像的政治逻辑,一种以消耗大量物质资源为代价的强权图像。传统上那种人们习惯地通过再现的方式来思考图像和权力之间关系的方式已经失效,人工智能图像与自身的全产业链条密不可分,在这个看不见的链条的背后是一种新形式的榨取主义。人工智能图像和权力之间关系的一个新方面,就是这些图像与大数据的基础设施彼此纠缠在一起,而大数据是非常耗能的。
余 论
成立于1999年的法国拟仿出版社(édition Mimésis)以出版跨学科研究成果著称,而这种视角本身已成为当代人文学科研究重要的特征。其中,他们策划推出的“图像媒介”(Images,Médiums)系列重点关注图像媒介视野下的前沿写作。2024年,该系列中的最新著作《图像状态》(Etats d’images)(及其同名展览)是评估图像这一媒介的一个重要里程碑。借由这本书的思考继续往前的发问在于:人工智能时代的影像艺术处于何种“图像状态”?或许,上文分析的作为算法图像、非人图像和强权图像的当代影像艺术的逻辑转向,部分地回应了这个问题。强大的算力生成技术拉开了与之前整个图像史之间的距离,它不仅改变了图像的制作与传播方式,更改变了图像媒介的当下状态。人工智能技术方兴未艾,借着这一强大的技术助推,我们有理由相信人工智能生成影像或将会成为21世纪(第一个50年里)最主要的图像形式。
注释:
[1]Georges Didi-Huberman. Devant le temps. Histoire de l’art et anachronisme des images. Paris: Les éditions de Minuit, 2000,p9.
[2]Georges Didi-Huberman. La Ressemblance informe, ou le gai savoir visuel selon Georges Bataille. Paris: éditions Macula, 2019,p312.
[3]吉尔·德勒兹:《电影II:时间—影像》,谢强、蔡若明、马月译,湖南美术出版社, 2004年版,第423页。
[4]Jean-Luc Nancy, A Finite Thinking, Simon Sparks(ed.). Stanford: Stanford University Press, 2003,p26.
[5]Kate Crawford and Vladan Joler,“Anatomy of an AI System: The Amazon Echo As An Anatomical Map of Human Labor, Data and Planetary Resources,”AI Now Institute and Share Lab, (September 7, 2018) https:// anatomyof.ai
[6]汪民安主编:《褶子》,河南大学出版社,2018年版,第212页。
注:杨国柱,山东艺术学院艺术管理学院副教授,艺术学博士。
责任编辑:孟 尧 蒋林娟