人工智能生成艺术
——具有争议性变革背后的启发性与局限性

2022-02-24 08:44屠意雯东华大学

艺术品鉴 2022年36期

屠意雯（东华大学）

近年来，随着人工智能研究的飞速发展，该项技术被更成熟地运用于艺术创作领域，通过庞大的数据分析及精细的文字指令来完成与传统数字艺术不相上下的作品。如今，用于制图的人工智能软件已被普及到大众用户，这样的技术允许毫无美术基础的用户能通过文字输入、图像识别等方式得到一张人工智能生成的艺术作品。

2022 年无疑成为一个人工智能生成艺术从一个概念走进每个人生活的转折点，这项技术的推广在给人们无穷灵感的同时，也引发了社会对其的讨论与争议。本文将从杰森·艾伦用人工智能生成的图像获奖这一事件切入，讨论社会对人工智能生成艺术的争议及顾虑，深入研究人工智能生成图像的原理，再结合相关案例探索该项技术对艺术创作的助益、启发及其局限性。

一、人工智能艺术的争议

正如每一次的科技变革之初社会上都会无法避免地产生怀疑和不安的情绪，人工智能所生成的艺术作品再一次激发了人们诸如“算法能否取代人类思想”“人工智能绘图是不是能被定义为艺术”以及“艺术家利用人工智能完成的创作能否被赋予传统（数字）艺术的价值”等讨论。2022 年夏天，一位名叫杰森·艾伦（Jason Allen）的游戏设计师兼游戏艺术总监，用一款名为 Midjourney 的人工智能图像生成软件创作了《太空歌剧院》（Théâtre D’opéra Spatial）（如图1）。该作品斩获了科罗拉多州博览会的年度艺术比赛中数字媒体艺术类别的头奖。

图1 《太空歌剧院》杰森·艾伦（图片来源：nytimes.com）

然而，与《太空歌剧院》一并竞争该奖项的作品主要是经过数字艺术加工的摄影作品及多媒体创作，耗费的时间及需要的美术技法远远高于人工智能生成的图像，也正是这一事实激发了该事件在艺术领域的广泛讨论。一时间，有人指责杰森的这一行为属于作弊，认为该作品是人工智能绘制的，不能算作杰森本人的创作。也有人认为杰森所使用的人工智能软件与Photoshop 这样的传统数码图像处理软件一样，只是艺术家的助益工具。更有人由此开始思考人工智能生成图像是否能被定义为艺术。

二、人工智能生成艺术的原理及关键要素

在对上述事件及人工智能生成艺术进行深入讨论之前，本文将首先展开对人工智能绘图软件的运作原理的研究。Midjourney 及其同类型人工智能绘图软件并不需要操作者亲自对作品进行创作、调整，而是依靠作者所输入的一系列指令来运算生成图片，对作者的在艺术方面的语言描述能力有很大考验。这些人工智能软件的运作基础是其数据库中从古至今海量已问世的艺术作品以及图像，人工智能通过不断的机器学习和深度学习，将这些作品的画面呈现与相应的文字描述联系起来形成算法，从而运行生成用户指令所描绘出的图像。

然而，人工智能绘图有非常大的随机性，会导致其绘图结果的不可控性较大。譬如，当作者在线上人工智能绘图软件NightCafe 中输入“女孩拿着玫瑰花”（girl with rose）这样的指令后，会得到图2 所示作品：画面模糊缺乏细节，对“女孩拿着玫瑰花”这一指令的呈现不合常理。而当添加一些更详细的指令：“半身像”（half-length portrait）、“微笑”（smile）及“深色长发”（dark long hair）后，得到图3，相较于图2 显得有逻辑且更接近作者的初始想象。由此可见，运用人工智能生成图像，指令对画面表达的准确度及详细程度决定了输出画面的完整度和可控度。再回看杰森的这幅《太空歌剧院》，从纯艺术的角度来看这无疑是一幅从构图、光线、色调到故事性都比较优秀的作品。虽然杰森至今仍未公开《太空歌剧院》完整的指令，但在其2022 年9 月接受访谈时提到它的完整指令非常详细，涉及画面如何打光、建筑结构、人物装饰的风格及元素在画面的具体分布等细节。其作品的宏伟的视觉风格很大程度上也源自他身为游戏设计师及艺术总监的专业知识和工作经验。杰森在访谈中也提到，那些利用人工智能生成出不可思议作品的作者，往往本就是非常出众的设计师或艺术家。

图2 《女孩拿着玫瑰花 I》（图片来源：作者自制）

图3 《女孩拿着玫瑰花 II》（图片来源：作者自制）

艺术家在人工智能生成图像中的主导地位也在《人工智能与艺术家、艺术作品关系辨析》一文中得到证实，作者郭洁琳提到“人工智能作品的生成过程离不开人为因素——前期所输入的数据是被人类所筛选过的；中期的参数变化是人为调控的；后期的生成物是按照人类审美品位而选取出的”。结合法学博士熊琦在《人工智能生成内容的著作权认定》中的论述，可以发现在法律层面，由于人工智能不能成为权利主体或拥有作品初始著作权，在判定人工智能生成的作品是否为独创时，必须以人的行为基础为主，因此，人（作者）对于人工智能生成艺术作品拥有绝对的著作权——“换言之，根本不存在归属于人工智能的作品或完全由人工智能创作的作品，无论来源如何，被认定为作品的对象只可能归属于人”。

通过上述对人工智能生成图像的原理、关键要素（指令），及人的行为在此过程中的必要性进行分析后可见，要利用人工智能创作出一幅优秀的艺术作品，对作者的专业技巧及构思想法都有较高的要求，这项技术只是艺术家对美和思想进行表达的助益工具，而非捷径。

三、人工智能生成艺术的价值和局限

人工智能生成图像无疑为艺术界带来了突破性的科学技术支持，尤其在数字媒体艺术领域助力着一场新的变革。在上文将人工智定义为艺术工具且明确该项技术不能自主创作的前提下，此章节将着重讨论作为科技与艺术结合最前沿的技术，人工智能生成图像会为艺术领域带来的技术突破、新的思考空间以及丰富的研究素材。

（一）随机性带来的无限可能

利用人工智能来生成艺术作品时，作者虽然通过输入指令来控制结果成像，但计算机在运算过程中如何理解指令并根据庞大数据库中的参考输出相应的图像是不完全受艺术家控制的。换言之，无论作者输入的指令多么详细、精确，都无法百分之百地控制人工智能会生成怎样的艺术作品。也正是人工智能生成图像拥有随机性这一点，给艺术创作带来无限的可能性，也一定程度上弥补了一些用户在艺术专业知识方面的空缺，允许更多不同领域的人为艺术注入新的生命力。

上海图书馆研究员金家琴及高级工程师夏翠娟撰写的《数字人文在视觉化艺术领域的应用前沿——图像艺术分析与计算机生成艺术》一文中论述：“生成艺术家常把随机性放进作品里，伪随机（pseudo randomness）是生成艺术中非常重要的组成部分。”在这样的随机性作用下，尤其是对一些比较抽象或有较大诠释空间的指令，人工智能生成艺术有更多机会能呈现出一些作者意想不到的细节。这都要归功于人工智能背后不计其数的艺术作品及图像参考数据库，这些人类个体穷尽一生都无法览尽的艺术知识，被编写成算法，在人们构建好主观意识框架的基础上，为创作带来更多的灵感与可能性。

早在20 世纪60 年代，科学家就开始尝试用计算机生成图像，并将生成艺术（Generative Art）与计算机艺术（Computer Art）紧密联结起来。1965年，德国电脑艺术研究学者格奥尔格·尼斯（Georg Nees）利用计算机生成的作品《冰水砾石》（图4）便是理解生成艺术中随机性的很好的例子。这幅作品由随机生成器处理，在结构性操作系统运作下输出了一幅展现自有序到无序，充满关联、变化的作品。计算机帮助格奥尔格用艺术的形式表达了他科学家的思考，正如如今人工智能帮助像杰森一样非纯艺专业的用户填补绘画技法的空缺，用艺术作品来表达跨领域的创造力。

图4 格奥尔格·尼斯（Georg Nees）作品《冰水砾石》（Schotter）（图片来源：www.researchgate.net）

（二）艺术背后的人文与社会反思

由于人工智能生成图像的前提是收集大量数据供其进行机器学习和深度学习，这项技术用理性视角对艺术作品进行剖析，再比较直观地以生成图像的形式反映其分析结果。因此，生成艺术也能帮助学者和大众从不一样的角度理解、研究艺术界的技术突破、运动变迁、历史背景和人文思考。在巴荷兰画家伦勃朗（Rembrandt Harmenszoon van Rijn）逝世近四百年后的2016 年，一个运用人工智能深度学习算法结合面部识别技术，3D 打印完成的肖像作品《下一个伦勃朗》（the next rembrandt）（图5）被揭开面纱，成为人工智能延续已逝艺术家杰作的代表案例。

图5 《下一个伦勃朗》（The Next Rembrandt）（图片来源：medium.com）

“下一个伦勃朗”项目是由ING 联合微软发起的，研究小组在搜集、分析了346 幅伦勃朗的油画作品后，用算法推算出伦勃朗的“下一件作品”应该是其创作最多的题材——肖像画，并同时得出以下关键词：白人、男性、胡须、30 至40 岁、深色服装、（装饰）衣领、佩戴帽子、面向右。光是这些词汇便不由得引发人们对那个时代的艺术环境及社会背景的思考。提到伦勃朗的画作，大众往往联想到的是他毫不美化矫饰的现实主义人物表现手法，而在此环节计算机则以非常理性客观的角度揭示了其艺术才华所服务的对象——那个社会极少数的上流社会男性。

“下一个伦勃朗”项目展示出的人工智能生成艺术的技术水平无疑是震撼的，它带领人们复刻过去、革新当下、启发未来。虽然这件肖像作品从技术层面看只是总结、运用伦勃朗风格、技巧的结果，难以被称为艺术创作，但当研究小组将艺术作品这一感性的过程总结成可计量的算法，复兴伦勃朗创作手法的同时也将那个时代的绘画主题、人文环境和社会环境再次点亮，引发人们新的思考，使科学和艺术难分彼此地融合在一起。在上述案例中提到的人脸识别技术是人工智能生成艺术中一项至关重要的技术分支，而在2018 年麻省理工针对商用人工智能的一项研究中表明，被研究的人工智能样本对浅肤色男性的分析错误率为0.8%的同时，对深肤色女性的分析错误率达到了34.7%。这也导致了许多根据人像照片绘制艺术作品的人工智能系统常常在分析肤色、人种这一方面出现显著误差。在《2021 国际多媒体技术公平性、问责制及透明度大会学报》中提到人工智能生成艺术所表现出的偏差（偏见）结果分类，包括了混合偏差、样本选择偏差、移植性偏差、代表性偏见和标签偏见。人工智能在不经意间，将它收集到的信息中带有偏见的社会价值观真实地还原在它的输出结果上，成为刻板印象及社会认知偏差的直接体现。艺术本就是一种用来传递对同一事物不一样角度的思考及感受的载体，也是反映社会道德准则的参考。因此，人工智能生成艺术的多样性和包容性成为社会的镜子，它将问题带到聚光灯下引起人们的反思。针对算法的偏差（偏见），科学家们也不断努力地拓宽样本采集并修正算法。这也正是生成艺术为艺术、科学领域及整个社会带来的人文思考与道德价值。

四、结语

人工智能生成艺术是一项突破性的技术，正是因为这项技术的介入，艺术创作从作者必须主导整个创作过程的时代，进入了运算结果随机性和作者主导共同作用的时代。依靠语言指令对作品的描述生成艺术的运作原理，减少了不具备传统艺术专业技能的群体的创作阻力，赋予了更多像科学家、工程师、作家等其他专业领域的用户来进行跨领域知识的融合与创造的可能性。

与此同时，生成艺术也像一面镜子一样照出艺术作品诞生的各个时代的社会问题和认知偏差。这些输出结果的错误和偏见虽然能激发人们对社会问题的觉悟和多角度的人文思考，却也使得人工智能的局限性被放大——由于有缺陷的算法会导致偏差的结果，而修正这些算法偏差是一个漫长且没有捷径的过程，人们短时间内无法依赖这项技术。总之，人工智能生成艺术还有很大的成长空间，而对人而言，如何完善这项技术并加以利用仍有很多内容值得去探索。