美学与人工智能

2024-06-28 12:31范玉吉周丰张璐

艺术广角 2024年3期

范玉吉周丰张璐

编者按 2023年10月13日上午，“人工智能时代的美育与非遗文化传播”学术研讨会暨2023上海市美学学会青年学术沙龙，在上海第二工业大学学术交流中心举办。此次会议由上海市美学学会、上海市第二工业大学外语与文化传播学院共同主办。来自上海高校、研究机构、企业的学会学者，与上海第二工业大学师生近百人齐聚一堂，围绕主题开展了一场历史与时代汇流、传统与创新交织的学术讨论。

审美是否会被算法操控？

范玉吉

大数据、算法和人工智能已经深刻地融入了我们的日常生活，小到衣食住行，大到上天入海，无处不在。而作为一种传播技术，它们对以互联网为基础的现代传播生态的影响更是颠覆性的，随着智能传播时代的到来，从信息采集到信息生成，再到信息传播，都是在智能技术的主导下进行的。从数据收集、算法训练到大数据模型的应用，数据深刻地影响了智能传播的技术逻辑和文化逻辑，使人类在智能传播的生态环境中不知不觉就失去了自我，为数据技术所控制。我们可以回想一下，在智能传播环境中，我们的每一个点赞、每一次评论、每一张照片、每一段视频，甚至我们随意浏览的一个网页都会深刻反映出我们的审美趣味和审美能力，我们的心理、我们的情绪、我们的价值观、我们的信仰等都以0和1组合成的不同编码方式被算法所感知，从而使互联网比我们更了解我们自己。在大多数情况下，我们“理性”所喜欢的东西并非我们“欲望”所想要的东西。或许我们自以为喜欢阳春白雪，但实际上我们可能更喜欢下里巴人；有时我们以为自己是高雅艺术的“铁粉”，但实质上却是通俗艺术的“脑残粉”。在互联网时代，我们的指尖每敲击一下键盘，就会成为互联网海量数据的一部分。我们已经进入了大数据时代，这个时代对我们的生活及我们与世界交流的方式都进行了基础性的重构。我们不用再去追究构成这个世界的因果关系，而是要关注各事件间的相互关系，算法技术仅仅通过我们在键盘上敲击出来的数据，就可以关联（分析）我们的意识，甚至比意识更隐秘的潜意识。被称为“大数据时代的寓言家”的维克托·迈尔-舍恩伯格早在2013年出版的《大数据时代：生活、工作与思维的大变革》一书中就明确指出，“大数据已经撼动了世界的方方面面，从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域”[1]。而2019年英国伦敦政治经济学院的尼克·库尔德里（Nick Couldry）和美国纽约州立大学的尤利西斯·A.梅西亚斯（Ulises A. Mejias）两位教授在他们合著的《连接的成本：数据殖民与资本主义的掠夺》（The Costs of Connection： How Data Is Colonizing Human Life and Appropriating It for Capitalism）一书中揭示了数据控制人类生活的本质，并提出了“数据殖民”这一重要概念。[2]今天的人类及其日常生活都被数据所控制，人成为数据的木偶，失去了自主性。就以审美领域为例，大数据通过控制人的审美意识，进而控制了人的活动，并进一步向纵深发展。

人工智能影响并控制人类审美的底层逻辑是数据。在数据科学家看来，“一切皆可量化”，不仅管理效益、决策影响、信息价值、公众形象等“无形之物”可以量化，就是偏好、态度和判断等抽象事物也可以量化。[3]这种量化仅仅是人工智能的开始。首先，人工智能通过对海量的数据进行分析，利用已知估量出未知，从个别推论出一般，就可以对人们的审美偏好、审美标准、审美价值等进行“抽象化具象”，即算法运用大数据对个体的审美经验进行分析，得出一般的审美标准，从而“创造”出让大多数人都欣赏的美的样式，如“网红脸”就是对无数美的形象抽象化之后的具象。其次，利用大数据对人工智能的大模型进行训练，训练中“喂”给人工智能的数据越多，人工智能则越“聪明”，而“喂”给人工智能的数据与算法结合后，会将数据固有的价值偏向和算法自身的价值偏向内化成人工智能的价值偏向，使人工智能带着价值立场工作。如生成式人工智能ChatGPT和Sora主要是由西方的数据“喂养”出来的，那么它们就不可避免地带有西方的价值观和审美观。在Sora根据用户的文本提示所创造出来的视频中，虽然深度模拟了真实物理世界，但这个世界是西方式的，其所生成的角色也带有典型的西方审美特征。

在未来，随着人机交互界面的进一步融合，甚至当脑机成为人类的标配时，大数据或将完全控制和改变我们的审美观念和审美价值。

一、被算法操控的审美

哈奇生说，“我们对事物之美有一种自然的知觉能力或感觉能力，它是先于一切习惯、教育或榜样而存在的”[4]。人类的审美能力本质上说就是一种美感能力，而对于达到人类智能水平的人工智能来说，将人类的美感通过情绪智能机器人的算法重新设计出来是完全可能的。[5]对于爱美的女性来说，什么样的脸型是最美的？关于这个问题，大数据给出了最精确的答案——“网红脸”——“大欧双（欧式平行双眼皮）、高翘鼻、圆润的额头、饱满的苹果肌、半永久的一字眉”，这就是一张标准的“网红脸”。从“美丽经济”到“美女经济”，人造美人几乎已经成了一种影响到全社会的选择，但也有研究者一针见血地指出，“作为网红经济一个鲜明的代表符号，网红脸不仅是一阵流行风潮而已，它关乎技术与审美，也关乎流量与欲望”[1]。爱美之心人皆有之，但人们所爱之美应该是什么？这个美一定与其所属民族的历史文化相关，一定和其所处时代的发展相关，并且每个人的美会因个人的自身条件而产生不同的样式。世界之所以丰富多彩，就是因为有着不同的美的样式和类型，即所谓各美其美，美美与共。每个人应该有自己独有的美的特质，先秦时“手如柔荑，肤如凝脂，领如蝤蛴，齿如瓠犀”的卫庄公夫人庄姜，西汉时“纤便轻细，举止翩然”的汉成帝皇后赵飞燕，盛唐时“回眸一笑百媚生”“云鬓花颜金步摇”的杨贵妃，她们的美就不同，有的壮硕，有的瘦小，有的丰腴，有的纤细，其美各不相同，但各美其美，各有意味，环肥燕瘦，并未影响其美的独特、美的自然。但今天，我们却完全将自己的审美判断交给了算法，让它代我们做出选择。大卫·萨普特指出，“算法不停地旋转和降维你的数据集，直至它能读懂你、透视你。它使脸书能用点‘赞情况预测你的性格，从表情、照片甚至你与屏幕的互动来评价你的精神状态。算法的高维理解完胜你对自己的了解，但它们并不具备完美的预测能力和公平公正的态度”[2]。算法通过对我们使用网络的行为所产生的数据进行“分析”，可以“窥视”我们的心理，从我们所认同的美的类型中测算出一个美的“公约数”，进而再通过生产出来的信息告诉我们应该拥有什么样的美的类型。其实，在审美方面，我们只不过是被算法计算出来的结果洗了脑，在科学方法的“暗示”下，我们认为自己应当拥有科学计算出来的美的类型。当整个互联网都在流行“网红脸”的时候，当我们手机里的照片都经过算法“美颜”之后，我们其实已经丧失了对美选择和判断的能力，或者说我们拥有的仅仅是一种盲从的美。

算法推荐降低了我们选择的难度，同时也使我们在舒适的信息接受中失去了审美判断力，我们会盲目地喜欢、点赞、信服那些传播量大的内容，会盲目地相信他人的评论，今天很少有女性在照片拍摄或视频聊天时不用“美颜”工具，网络购物中也很少不受网络推荐的影响，甚至只要是网红的“景点”都会成为人们的打卡胜地。实际上智能媒体是比传统更“专制”的媒体，它靠算法形成的“传播霸权”控制人们的意识，开启人们欲望程序启动键，从而形成了比过去更严重的“传媒无意识”。它剥夺了人们想象的能力，创造了万人共有的欲望，制造了虚假幸福的承诺，算法霸权让智能媒体“彻底背叛了启蒙原则，让人们面对‘异化却彻底放弃了反抗”[3]。我们在并不自知的情况下，将审美的判断力交给了算法。

二、被智能传播影响的审美

智能传播中对受众影响最大的是“精准推送”。在大众传播语境下，受众的个人性及其独特性被严重忽视了，广大受众被假设成了一个无差别或其差别可以忽略的整体，[4]即使是为广告营销而对受众进行细分，也仍然是以“受众群”的方式出现[5]。但是在智能传播中，受众的概念发生了革命性的改变，基于大数据建立的模型开始对用户的数据进行挖掘和筛选，从中找到每个用户的习惯、意愿、渴望、好恶、情感等关键细节信息，然后让想要传播的信息内容在对的时间出现在对的受众面前。[1]这就是大数据作用下精准推送的实质，它不仅改变了信息的传播方式，而且提高了信息传播的精准度，使信息刺激和受众反应之间产生了直接且明显的效果。从审美角度看，大数据可以将特定的审美类型精准地推送到喜好它的用户面前，越是喜欢，则越容易收到这样的审美类型信息产品。

但是这样的智能传播却可能因形成了“信息茧房”或造成了“过滤气泡”而对人们的审美多样性造成影响。“信息茧房”和“过滤气泡”是研究智能传播不可忽略的两个重要概念，它们分别被用来描述智能传播对人们信息获取所造成的障碍。

“信息茧房”（information cocoons）这一概念由哈佛大学法学院教授凯斯·桑斯坦在其著名的《信息乌托邦：众人如何生产知识》[2]一书中提出。桑斯坦认为，互联网给人们带来了更多的资讯和选择，但在看似更加民主和自由的信息选择表象下，其实蕴藏着对民主和自由的破坏。在信息传播中，公众自身的信息需求受其个人的兴趣、爱好、价值观、审美趣味等因素影响，往往只关注自己想要的信息，但实际上他们并不清楚自己想要的信息是出于知情的需要还是知情的欲望，也就是说，潜意识在不知不觉中剥夺了人们意识的选择权，在信息搜寻中只是选择满足欲望的信息而非满足需要的信息。而算法则会根据用户信息选择的偏好而不断“精准化”地向用户推荐其潜意识所喜欢的信息，久而久之，用户就会被禁锢在由信息构成的“茧房”中，从而造成信息接收的片面化和单一化。如果一个用户喜欢看通俗的，甚至是庸俗的短视频，那么系统就会不断地给他推荐这样的短视频，久而久之，他的审美能力和审美趣味就会降低。

“过滤气泡”（Filter Bubble）这一概念由互联网观察家伊莱·帕里泽在《过滤泡：互联网对我们的隐秘操纵》中提出，他发现搜索引擎为用户提供了在信息过载的世界里智能化、个性化、快速化获取信息的方案。但与此同时，它也可以通过解读用户偏好，随时过滤掉异质信息，为用户提供个性化的信息。但令人不安的是，搜索引擎也会对用户进行隐秘操纵，它会为每个用户构筑起信息和观念的“隔离墙”，令用户处在一个由“网络泡泡”构成的环境中，从而给多元观点的交流造成障碍。帕里泽指出，过滤泡因其满足了后物质主义而放大了个人的表达欲求，用户若置身其中，它将会操纵公共领域，侵蚀群体的共同经验，排斥对话，使人变得越来越狭隘和自私。[3]每个用户都只有处在一个信息不断更新交叠的环境中，才能获得新的认知，而如果其只是被困在一个文化单一、价值单一的环境中，其多样性就会被网络所阉割，从而对社会缺乏基本的判断与认知，形成单一甚至可能是扭曲的趣味。

以上两个概念所描述的现象，不仅表明算法对人们的信息获取产生了技术性垄断，实际上还会对人的审美和认知产生恶劣影响，使人的审美能力发展受到限制，甚至偏离正常的轨道。算法推荐给网络用户的内容看似个性化，但这个“个性化”背后却隐藏着单一化。用户的审美偏好导致算法只是将一个类型的内容精准地推送到用户面前，这些内容虽然看似数量庞大，其表现形式也似乎丰富多彩，但实际上却是单一类型内容的机械累加。用户每天都在不停地刷手机，浏览数以千计的短视频，但大都是一些重复的题材和内容，而且越是猎奇、怪诞、浮夸、庸俗的内容，越容易迎合用户那些并不高雅的趣味。短视频文化是典型的快餐文化，不仅没有营养，甚至还是一种精神毒品，令人成瘾，使人完全丧失批判的能力和立场，从潜意识层面给受众带来负面的影响，加速了人的异化，造成了人的主体性的丧失。[1]就审美而言，世界是五彩斑斓的，人们的审美也应该是丰富多彩的，但如果受到算法推送的围困，就会造成审美趣味和审美能力的片面化和单一化。

三、警惕智能传播中的文化殖民

随着全球经济陷入持续的结构性低迷，贸易保护主义不断抬头，贸易摩擦不断发生，全球化正在面临着新的挑战，甚至产生了“逆全球化”的现象。但是随着互联网的普及，在互联网领域里全球化似乎呈现出不一样的状况，西方国家的信息输出无论从数量上看还是从影响上看，都有全球化的趋势。互联网被宣称是一个信息自由的王国，但作为全人类重要的文化现象，互联网具有双向交流的功能，理应是一个各领域信息均衡传播的信息自由市场，但事实却并非如此，在互联网的世界里充斥着以西方为主的信息霸权，由于技术、语言、文化等原因，在网络发达国家与网络欠发达国家之间存在着一个巨大的数字鸿沟，在数据流通方面网络欠发达国家存在着明显的数据逆差，也就是说由西方网络发达国家传入网络欠发达国家的数据远大于网络欠发达国家传入网络发达国家的数据，这在本质上就是“信息逆差”。随着人工智能的发展，数据变得越来越重要了，被称作“21世纪的石油”，“没有大数据就没有人工智能”已经成为一种共识。随着神经网络和深度学习技术的发展，人工智能技术得到了飞速发展，深度学习携手大数据，引领了人工智能的第三次热潮。[2]从本质上说，人工智能是借助深度学习的算法技术，由海量的大数据训练出来的，数据越丰富、越多样，训练出来的人工智能也就越“智能”。但数据本身是包含着价值观的，有什么样价值观的数据就会训练出持有什么样价值观的人工智能。更为重要的还有技术配置也并非完全价值中立，资本、政治、技术都会对算法的中立性造成损害，而人工智能在自动学习中也会产生价值偏差，“理论上技术不能摆脱人类控制，但在实践中它正沿着本质上独立的路线前行”[3]。当今的网络发达国家基本都是西方国家，他们垄断了全世界80%以上的数据，数据包含西方在政治、军事、经济、文化、信仰等方面的价值要素，这些要素会随着数据深刻影响他们的人工智能，而这些人工智能在非西方国家广泛使用，会造成价值的单一化，并进而产生新的文化殖民。

有研究者运用ChatGPT-4进行过测试，面对同样的问题，用英语、德语、日语提问，其结果虽有差异但并不明显。但如果用汉语提问同样的问题，ChatGPT-4则会给出差别较大的答案，有的甚至会存在明显的种族主义或民粹主义色彩。如果用Sora来自动生成视频，则这种倾向会更加严重。就审美而言，用西方数据训练出来的人工智能会将西方的审美价值作为基准，对非西方国家的审美标准和审美形态予以排斥。算法是人设计和制定的，人的价值观自然也会被植入算法中，从而形成算法歧视或算法敌视。在不同文化之间，处于强势文化的西方国家会借助算法对弱势文化进行歧视。同时，被大数据喂养出来的人工智能则会借助算法推荐，将“它”认为优秀的文化（强势文化）精准推送给其他处于“劣势”文化的国家用户，从而形成新的文化殖民。

后殖民主义理论产生于全球化背景下，侧重于分析新形势下帝国主义的文化侵略、第三世界的精英知识分子的文化角色和政治参与、关于种族/文化/历史的“他者”表述，以揭露西方形而上学话语的局限性[1]。随着互联网的发展，在文化全球化展开的同时，新一轮的文化殖民已经开始了，这次的文化殖民可以理解成“后后殖民主义”。后后殖民主义不像此前的后殖民主义那么明显、那么激烈，它是通过最不引人注目的技术手段进行貌似中立的文化传输，它们把技术中立置于最显著的位置，让所有被殖民的国家和人民都放松了警惕，然后以最显著的效果完成它们的殖民大业。西方国家以人工智能和看似完全中立的算法技术为掩护，以最大的算法偏见为手段，将西方的文化和价值观渗透进被殖民国家人们的意识中。数据逆差已经成为影响文化软实力的重要因素，因此必须加强数据流通，促进数据贸易，扭转数据逆差，让数据自由流通成为阻断后后殖民主义的重要屏障。

人工智能艺术的实证研究

周丰

人工智能艺术的实证研究主要是针对人们对人工智能艺术的感官反应，即人工智能艺术在主体的接受中所引发的效果。虽然当前人工智能的创造性仍停留于组合创造力与探索创造力，而并没有达到转换创造力，即在新的概念层面上产生新的理念。[2]但我们已然看到大量人工智能艺术的存在，有些甚至能够获得人类艺术大奖，例如2022年9月，《纽约时报》报道称，桌面游戏开发者杰森·艾伦在软件Midjourney的帮助下获得了数字艺术奖，艺术家们指责艾伦作弊，尽管他没有违反任何规则，他甚至告诉了人们他使用了Midjourney。2023年春，摄影师鲍里斯·艾尔达格森（Boris Eldagsen）以一张人工智能生成的图像获得了索尼世界摄影奖。因此，人工智能艺术至少在效果上是被人接受的。

一、人工智能艺术实证研究的目的

人工智能艺术是否为艺术是有争议的。这种争议多是聚焦于人工智能艺术的创造性何在，它与人的艺术又有何区别。显然，针对这些问题，我们有很多理论的分析，都是基于传统的美学理论而来的。但人工智能“创造”的本质是一种程序算法，对于一般人而言程序就像是一个“黑箱”，我们很难将其“创造”的过程与人的心灵过程相匹配。因此，人工智能艺术的生成与传统艺术的生产在传统的美学理论中是断裂的。然而，人工智能艺术的审美效果是明显的。这就意味着，我们并不应从人工智能艺术的“来路”将其判定为“艺术”，而应基于它在我们身上引发的“效果”，“来路”与“效果”这样一对矛盾便是人工智能艺术备受争议的所在。那么，我们将如何克服争议？从“效果”出发能否进入对“来路”的解释？

人工智能艺术的实证研究就是这样一种尝试：实证意味着是从艺术欣赏的“效果”出发，将艺术感知的“效果”量化。因此，人工智能艺术的实证研究能够绕开传统的理论分析而直接从“效果”出发对其“艺术性”作出判断。对其“效果”量化后，可将其与传统艺术的效果相对照，看它们会有何种程度的匹配。

人工智能艺术的“效果”并不只是存在于人们的“接受”之中，它同样是其“生成”的构成。人工智能所生成的艺术并没有真正形成自我判断，微软小冰诗集的“集结”、《太空歌剧院》的获奖，这些都需要人加以选择或进一步修改。“人的执行”在于主体对人工智能艺术的感知与反应，但最终这种执行并没有被作为人的行为来认识，而是作为“人工智能”的附属，或者说是作为人工智能的整体性来认识的。个体的人是以自身的审美素养来完成他对人工智能艺术之生成的判断与修改，这些实际上都是人在“效果”之中对人工智能的反馈。因此，个体以“效果”的名义对人工智能艺术的接受已然被纳入到了人工智能艺术的总体“生成”之中。那么，从效果出发的实证研究就能够将“效果”从人工智能的总体生成之中剥离出来，回到人的感知与反应。

二、人工智能艺术实证研究的方式

对于艺术感知的实证研究是审美心理学的重要传统，可以说，从心理学诞生之初的实验心理学就有实验美学的艺术感知研究，而人工智能又是认知心理学研究的一部分。因此，今天人工智能艺术的实证研究也是审美心理学之一种。

实验的根本在于“目的”和“操作性界定”，有什么样的目的，就需要什么样的操作性界定，这也决定了实验的结果及其可靠性。因此，人工智能艺术的实验是合乎当今认知心理学实验，尤其是审美心理学实验的研究路径的。当前关于人工智能艺术的研究目的有：人工智能艺术与人之艺术的艺术性比较研究，人们对于人工智能艺术的偏见，不同文化背景的人对人工智能艺术的接受，以及人工智能艺术在不同艺术形式中所引发的效果差异，等等。

作为材料的人工智能艺术作品是从哪里来的？实验中的人工智能艺术也是需要划定边界与进行选择的。宏与库兰（Hong & Curran）在一项研究中选择了三种不同的人工智能生成器生成的作品，谷歌的艺术生成软件深梦（AI DeepDream）和创意对抗网络（Creative Adversarial Networks，CAN）生成器，以及一个自20世纪70年代以来就一直在生成艺术品的计算机程序Aaron。[1]选择的多样化是为了寻求实验结果的普遍性和可靠性。此外，在人之艺术与人工智能艺术的对照中，还要考虑二者材料的对等性，如抽象对抽象、肖像对肖像、风景对风景等。这些都是实验可靠性的保障。

从人工智能艺术实证的结果来看，利玛（Lima）等人认为，当被试知道是人工智能生成的艺术时，他们就会贬低相应的作品。被试还倾向于将抽象图像归结于人工智能而将现实主义的图像归为人的作品。[2]甘格哈伯特拉（Gangadharbatla）等人认为，被试很难区分人工智能艺术和人之艺术，尤其是人工智能生成的古典音乐和人演奏的古典音乐，即使是专业人员也很难区分。[1]还有些因素会影响人们对人工智能艺术的评判：如道德身份[2]、文化差异[3]及人工智能所使用的语境[4]。有人认为，来自美国的被试要比中国的被试对人工智能生成的诗歌和绘画更具批判性。詹森和斯科拉（Jansen & Sklar）认为，艺术家对人工智能的看法不同：协同创作的人工智能要比说教式的人工智能更受欢迎，而艺术家最爱批评用人工智能自动实现创造性的工作。[5]然而，也有人指出，对人的艺术作品和人工智能艺术作品的评价差异很大。人的艺术在构图、表达和审美价值方面要更胜一筹。此外，知道一件艺术品是由人工智能创作的，通常不会影响参与者对艺术品艺术价值的评估。他们认为生成式人工智能并未通过图灵测试。[6]

曾经的图灵测试只要“蒙混过关”即可，而今天的图灵测试则要明确告知被试者哪个是出自人工智能哪个又是来自人类。在此，确定主体对人工智能艺术的评价是以一系列的操作呈现的，而不是靠“蒙”的判断。在另一项实验中，他们又指出，如果被试之前持有人工智能不能创造艺术的前见，那么，他们对人工智能艺术的评价就会更为负面。人们对人工智能具有创造性的信念与对其创作的音乐的评价呈正相关。[7]如此一来，人工智能艺术的评判标准便更加明确并得到提升。那么，这对于人工智能艺术的发展来说也将更具指引性。

三、人工智能艺术实证研究的可能性

显然，当前的人工智能所生成的艺术是基于作品的形式特征而实现的。正如“诗人小冰”的诗歌是从大量的诗歌文本数据库中提取的，Midjourney也是根据大量的绘画艺术作品作为底层数据，即便是今天的ChatGPT也是以大语言模型为基础的。而且，这些模型或数据库基础并不是零散数据的随意结合，而是一种算法，或更为直接地说，是以某种形式特征作为骨架。

人工智能艺术之生成或是包含了“效果”，或是不考虑“效果”。而且，“包含”并不是说就是内在于人工智能算法的，它仍是由人来完成的，只是，我们在人工智能之创造性的崇拜中忽视了人的存在，只将其作为人工智能的附属。说其不考虑效果是因为，人工智能艺术并不能表达情感或态度。传统艺术的创作是有态度的，即使是杜尚的现成品艺术《泉》，也表达了他对当时艺术观念的不满，或者说在艺术理念上表达了他自己的观念。人工智能艺术的生成并不能将其指令者的某种态度表达出来，我们给予其关键词或提示语，其生成只能是一种大而化之的，如悲伤、难过或是开心喜悦，它不是具体的某种情境式的情感。

关键词或提示语是带有输入者的某种态度和倾向的。正类似于“测字算命”，求者所写的“字”其实是当下心理状态的一种反映，而算命先生根据“字”和求者的表情（包括言语、动作），去判断求者的心之所想。这是两个心灵直观的相互理解。然而，人工智能所依据的只是算命先生所见之“字”，它将在多大程度上偏向输入者的态度，这是神经美学实验所能给予的论断。一般情况下，人工智能艺术的输出并不具有特定的情感或意蕴，那么，人工智能艺术的实证研究所要做的其实就是对“效果”的量化。为了“效果特征”能与人的情感态度的表达相适应，我们仍需要更为细致的量化。如此一来，依据这种量化的效果去进一步地调试人工智能艺术的生成，有可能使其进一步生成意蕴与情感。

人工智能艺术未包含的“效果”可以通过人对人工智能艺术的反馈或修正重新呈现出来。例如2019年，德国电信公司组织了一个由人工智能专家和音乐家构成的团队，创作了贝多芬未完成的“第十交响曲”：《贝多芬第十交响曲——人工智能版》。在此过程中，团队成员在每个步骤中都要对人工智能进行指导和更正。在最初的几个月里，由人工智能生成的乐章听来十分机械，但这些乐章都有专人调整，使其贴近贝多芬的风格。诸多音乐家根据音乐理论帮助人工智能做出整个曲目结构等关键性决策，反馈给人工智能，最终于2019 年11月完成乐谱。因此，这种单个而恰切的生成准确地说是由人和人工智能共同完成的，或者说，人工智能是人的媒介。

人工智能艺术的实证研究所得的数据某种程度上就是人工智能艺术的“效果特征”。这种“效果特征”能够与其原本数据库中的“形式特征”一样，作为一种底层数据去进一步生成艺术作品，这样的话，“效果”就不再仅仅是接受层面的主体性表现，而且也是艺术生成的主体性构成，只不过这个主体性是借用技术的形式反馈到艺术生成之中的。

偶然与控制：早期生成艺术与当代AIGC的理念差异

张璐

人工智能生成内容（Artificial Intelligence Generated Content，简称AIGC）技术始于20世纪60年代，如今常被认为是对生成艺术（Generative Arts）的延续。但两者的理念其实背道而驰。生成艺术界的先驱承袭20世纪初的观念艺术思想，憧憬计算机艺术“不似人类的”，以表现去人类化的中立；相反，目前AIGC创作者追求作品“更似人类的”，以代替人类的劳作。这一对立既与时代精神的变化有关，也与任何技术在艺术中的生命周期有关。

一、观念革命：从精确控制到模糊控制

观摩艺术史上的那些美感艺术，无论在绘画、雕塑、文学还是戏剧中，我们都会发现，摹仿现实是古代艺术家最重要的手艺。在一门手艺中，艺术家所追求的是控制信息的传递，而手艺或者说艺术就是控制的方法：大脑（描绘出蓝图）精确地控制手，手控制笔，笔画出大脑要的线条。对雕塑家、演员、舞者、作家而言也都是如此。在这个过程中，创作者的意志完全灌注在其作品中：作品100%由大脑构想并实施——如果我刻刀下的苏格拉底像比其他雕匠凿子下的更逼真，那我的作品就是杰作。从古代艺术到19世纪的新古典主义艺术都是如此。

这门手艺的核心价值是描绘现实，但在1841年摄影术及伴生的摄像术出现后，它遭到了冲击。这间接催生了20世纪诸多观念艺术。这些新的艺术理念不再追求目之所及的真实。受精神分析学的启发，艺术家们围绕在“反摹仿”观念的周围，开始用艺术探索不可见的内心世界，让艺术在光学镜头和化学药水无法捕捉到的世界中焕发生机，并发展出了拼贴艺术、超现实主义、达达主义等流派。于是，放弃可见的外部世界，追求表现内心世界成为了一种重要的艺术道路。无论是雨果·鲍尔在《达达主义宣言》中所说的，作品应当“摆脱被遮蔽、被道德化、被欧洲化、被耗尽”[1]；还是安德烈·布勒东在《超现实主义宣言》中所说的，在自由最大化的、不带有任何约束和偏见的、被动和无意识的精神活动中，“每一秒钟都会有一句与我们清醒的思想并不相干的句子流淌出来”[2]，都无不宣告着艺术家想借这种变革创作出反刻板印象的、去掉历史包袱的、中立的作品。这种中立化的政治诉求，也是20世纪初逐渐出现的技术制（technocracy）的思想产物之一。[3]由于内心世界的独特性，如此创作的作品带有明显的偶然性。放弃控制、认可偶然，也成了观念艺术的信条之一。在这种理念下，原本的精确控制变成了一种模糊控制。典型的美术作品是杜尚的《被单身汉剥光的新娘》，其中的“婚纱”是由搬运工意外失手造成的。但杜尚对这次意外感到惊喜，认为偶然胜过了艺术家的“手艺”。同样，在文学界也产生了乌力波运动。这些都是计算机生成艺术的思想来源。

此后很长时间里，艺术家都用近似于自我催眠的方式或借助观众的互动来实现偶然性——如玛丽娜·阿布拉莫维奇的行为艺术作品《节奏0》（Rhythm 0）——直到能制造“偶然”的机器出现，才真正实现了“忘我”。

二、技术革命：从人工模糊到算法模糊

计算机在20世纪末再次掀起了新一轮的技术革命，就像摄影术在20世纪初那样。如果说化学显影让手的精确性落伍了，那么计算机编码让脑也面临类似的危机。

1963年，在第一届计算机艺术大赛（CAC）上，第一名由美国陆军弹道研究实验室创作的作品《飞溅图》（Splatter Diagram）夺得[4]。这份作品因一次意外而产生，它起初只是计算机测试虚拟弹道时所产生的故障形成的，然而艺术家和理论家很快明白了，算法拥有制作出中立、偶然的作品的潜能。1967 年，不莱梅大学的教授纳克（Frieder Nake）利用计算机生成了彩色图像《漫步光栅3号》（Walk Through Raster， 12.1.1967 Nr.3）[5]，展示一种有限的偶然，这是一种可控的不可控。创作者只确定了作品的面积、生成元素的形状（中空方框）、两种颜色（橙与黑），但不控制这些元素在这个范围内如何呈现，这些皆由计算机的随机数控制。算法生成了一幅抽象画，在这幅画中，纳克放弃了绝大部分的控制，作品不是由他本人大脑100%构想的，其意志屈从于算法的随机选择，从而实现了忘物（没有德国文化）乃至忘我（没有纳克的选择）。这就是最早期的计算机进行全自动创作的生成艺术（Gen-Art），也是如今AIGC的起点。它的出现让传统的画笔变成了被文化必然性限制住的保守形式。一些思想家因此渴望通过计算机介入艺术创作带来文化的解放。

对此学者们持有不同的看法。本塞（Max Bense）保持了乐观的态度，认为计算机至少比人中立，能测量、统计、归纳并由此创造出所有人都喜爱的作品[1]；莫勒（Abraham André Moles）和利奥塔（Jean-Fran?ois Lyotard）则从各个方面对这种乐观表示了怀疑[2]；梅茨格（Gustav Metzger）是最激烈反对计算机中立性的思想家和艺术家，他指出，计算机设备最终会和所有其他技术一样被资本主义所利用，导致它所产生的内容并没有任何中立性可言[3]。这些争论的背后，其实是艺术家作为第一施动者（agent）的主体性问题，也就是艺术家的大脑和手，究竟在计算机辅助的作品创作中发挥了什么不可或缺的积极作用，以及计算机作为第二施动者的黑箱问题，即计算机所生成的内容如何能代表全人类的中立思想。但无论争议如何，当时的思想家与观念艺术家一样，期望计算机能为艺术带来中立的、反民粹的、反资本的新鲜空气。这种诉求与二战后的社会氛围息息相关。

三、当代精确控制：算法艺术的幼年形态

虽然最早的生成艺术不一定需要计算机参与，只要求有一段脱离创作者控制的程序，它可以是纯粹的物理或化学程序（比如梅茨格的一些作品），但经历80多年的发展，目前生成艺术更多趋向于“算法艺术”，即创作者利用代码制作的算法进行艺术创作。原理上，它是从随机像素点的噪声图像开始，根据输入的代码限定，进而形成可以辨识的图像，最终将目标优化成接近输入者意图的形象。它有两种实现形式：一是直接通过编码语言（如Javascript、Java、C/C++、Python、R等语言）实现；二是通过算法库（如Javascript下的p5.js、three.js）实现。

与早期的计算机生成艺术不同，随着算法的迭代、算力的增加、大数据的出现，近年来的AI在“笔触”的控制方面愈发精准。程序在下笔的瞬间，能够完成人类之手无法完成的肌肉控制。笔触偶然性的减少，推动了创作者可以在技术层面追求有更高复杂度的画面内容，因此人像、多人场景代替了抽象画成为近年的主流。近年在AIGC绘画比赛中的优胜作品往往都是人像，因为它显示了算法对描绘人类面部的精准控制，但这似乎又回归了早年手工绘画的追求。AI达到了古罗马雕刻家和文艺复兴画家的水准，但创作者作为第一施动者的控制欲也重新回归了。可以说，早期计算机艺术家憧憬的是计算机能够“不似人类”地作画；而当前AIGC艺术家所追求的则是“更似人类”地作画。

生成艺术从“反控制”到“控制”的转变是技术而非观念导致的。与传统手工美术在20世纪从“美感艺术”走向“观念艺术”的路径不同，生成艺术的路径是相反的。这并非说两者有本质的不同，恰恰相反，它们本质是相同的。虽然早期的生成艺术家大多数来自计算机实验室，但当代的生成艺术家在美术学院受训，他们重复了传统手工艺术家所选择的道路；只不过他们起步晚，因此还在模仿传统手工艺术的早期阶段。事实上，手工艺术也是从抽象（拉斯科洞穴）到具象（古罗马雕塑）发展的。但因为在新现实主义及摄影术之后，具象技法已经无法再进步，按巴迪欧的说法，具象艺术已经饱和化（saturation）[1]，创作范式必须改变，这就导致了观念艺术的革命。

这种范式革命在短短百年的摄影史中最明显：因为工具（冲印方式、镜头组和滤镜、三脚架、闪光灯）让摄影技术很快饱和，摄影师无法创造出比同行更优秀的画面。因此，21世纪初的摄影家为避免陷入具象的内卷，就转向虚构的外卷——不再追求呈现纪实画面，而是变得与20世纪绘画一样，探索观念与风格。绘画经历了几千年成熟和衰老的过程，摄影只用了一百多年就复现了。

因此，生成艺术从“观念”走向“美感”，是因为它正处在幼年期，其具象技术尚未饱和。当前的生成艺术家致力于学习新代码，以提升对作品的控制力，这如同早期画家寻找新植物来制作色彩更准确的颜料。待其饱和之后，生成艺术也会走向与手工画、摄影一样的观念艺术之路，从控制走向偶然。

可以说，“技术”与“观念”两个维度的变革在艺术演变的过程中交替出现。当某一种艺术类型在其技术饱和的时代，观念革命会引领新的潮流（如诗体到散文体的变革）；在其观念饱和的时代，若恰巧出现技术革命，那么也可以为这类艺术注入新活力（如工程学和材料学之于建筑）；两者也可能同时发生。若两者长期都没有出现，那么这种艺术类型就会变得陈词滥调，进而万马齐喑。

〔本文系上海市哲学社会科学项目“巴迪欧美学视域下的融媒体数字审美研究”（2022ZWY012）及上海第二工业大学同名项目阶段性成果〕

【作者简介】

范玉吉：华东政法大学传播学院院长，教授，博士生导师，上海市美学学会副会长。

周丰：上海社会科学院哲学研究所助理研究员。

张璐：上海第二工业大学外语与文化传播学院讲师。

（责任编辑牛寒婷）