AI绘画的演化、影响与思辨

2023-09-20 00:58杨宇鹤

传媒 2023年17期

文/杨宇鹤

2022年8月，一幅名为《太空歌剧院》（如图1）的画作在美国科罗拉多州艺术博览会上获得了数字艺术一等奖。该评选结果迅速引起了全球艺术界的关注，这是因为画作并非画家亲自绘图，而是通过AI制图软件Midjourney生成，再经由数字工具Photoshop、Gigapixel加工，最后得以数字形态呈现。随后，有关该画作的讨论从画作本身延伸至版权问题，AI绘画开始受到大众传媒的高度关注。同一年，国内外互联网巨头公司包括谷歌、微软、腾讯、百度都纷纷参与AI绘画的业务开发和收购融资，数字时代AI绘画的潜在价值由此显露。那么，何谓AI绘画，其具有哪些特点，将对今后的艺术领域造成哪些影响？这些问题都迎来新的讨论空间。

图1

一、AI绘画的前世今生

技术和艺术的博弈亘古存在，而每一次技术跃升都会掀起艺术新浪潮。AI绘画，顾名思义就是人工智能绘画，其基本内涵是依托数字化的图像数据库，运用算法技术生成图像。从技术逻辑来看，人工智能本身并不具备绘画能力，它通过模仿学习绘画经验和绘画作品进行图像生成。事实上，模仿人类神经元的人工智能早在上世纪已经出现。而伴随人工智能的不断迭代和数字通信的持续改善，AI绘画不仅可以通过更简单的符号口令和更便捷的数字软件生成图像，而且初步具备了同人类一样的认知水平。有关AI绘画的讨论正从一个遥远的想象变成触手可及的现实。

1.经验模拟：物理学习的AI绘画。AI绘画的初级阶段可视作经验模拟，即由设定程序的机器人模仿人类进行绘画创作。1973年，艺术家哈罗德·科恩创造了世界上首个绘画机器人——AARON，并为其制定了一套简单的计算机规则完成绘画指令。与当前语境下的AI绘画不同，AARON是一种物理绘画，即通过机械臂在画布上完成，绘画作品多为单色线条。但是，AARON在某些方面表现出远比人类强大的天赋，比如一天创作千幅作品、随时随地绘画。而随后近40年的时间里，科恩一方面注重AARON的绘画技巧如三维绘画、独立上色，另一方面有意识地培养AARON的艺术认知。直到今天，AARON仍在进行绘画实践，但由它完成的绘画始终未能跳脱色彩鲜艳的抽象派风格，而这种风格也可以看做是源自对其自身创造者也是艺术家的科恩的模仿。

2.风格拼贴：算法判断的AI绘画。计算机出现后，AI绘画的模仿对象不再聚焦具体画家的绘画经验，而是面向海量绘画作品集成的数据图库，在此基础上输出图像。2014年，一种计算机视觉化算法——对抗式生成模型（GAN）诞生，该模型包含生成器和判别器两个部分，通过模拟神经系统相互竞争学习达成训练目的。具体到AI绘画，通过对输入的真实图像内容特征和对参考的艺术图像风格的提取，实现真实图像特征与艺术图像特征融合，从而生产新的艺术图像。而生成器和判别器在输入和输出过程中，彼此提升各自算力，实现图像“智力”提升。法国艺术团体Obvious创作的《爱德蒙·贝拉米肖像》就是对抗式生成的典型案例，其利用算法将全新作品同15000幅古典肖像画集中比较，不断缩小二者的区别

3.图文预测：对齐训练的AI绘画。随着“图生图”的AI绘画模式逐步推广，生成作品的变形问题始终未能解决。文本图像预训练模型（CLIP）作为一种图像分类方式，能够根据自然语言理解进行视觉分析，用户只要输入一句话或者上传一幅风格明显的图片，算法就能将图像特征和文字特征对齐，对图像进行相应调整。这种对齐规避了AI绘画作品的随意性，相比此前对抗式生成模型获得了更准确的图像效果。但是，对齐训练建立在庞大的数据库之上，这对于计算机软硬件设施均提出了极高要求。因此，图文预测阶段的AI绘画仅限于少数互联网公司如谷歌、微软。

4.通用生成：扩散模型的AI绘画。随着算法模型纵深发展，单一生成模型逐步被扩散模型（Diffusion Model）所取代，后者基于马尔科夫链学习噪声生成数据，反向去噪生成视觉信息。而算法系统所赋予的单一能力如笔迹识别、语音识别、图像识别、阅读理解、语言理解之间相互迁移，尤其是在自然语言大模型（LLM）领域，人工智能出现了一些通用化特征。彼时，AI绘画不仅通过文本获得的知识理解进行“望文生图”，而且初步具备类同人类一样的思考能力。以绘画工具Midjourney为例，用户登录Discord社区，以对话形式在指令框输入关键词；Midjourney则会在1分钟之内生成4张相应图像，并允许用户锁定风格、像素、格式等。而一幅由关键词生成的《中国情侣》（如图2）作品，渲染出上世纪90年代中国的写实风格，让大众感叹AI绘画在各个层面的超然进步。

图2

二、AI绘画的影响

AI绘画伴随着通用人工智能的狂飙将迎来更多可能性。而对于艺术领域而言，AI绘画至少在创作主体、创作方式、创作成果、创作传播四个方面带来直接冲击。

1.人人皆为创作者。AI绘画极大地降低了艺术领域的从业门槛，并突出表现为创作者的涌现和创作能力的提升。技术赋权视角下，人人都可成为艺术家。随着AI绘画软件的完善和普及，人们只需下载AI绘画软件，输入文本指令，调整绘画风格，就能轻松获得一幅绘画作品。而基于庞大的数据集成体系，AI绘画能力已经大大超过普通人水平。在一项有关AI绘画作品和真人绘画作品的调查中，几乎99%的用户都无法正确辨别。对于那些本身就具备绘画素养的包括艺术家在内的人群而言，AI绘画能够给予他们充分参考，提升绘画作品的创作效率和艺术水准，转化为更优质的生产力。

《太空歌剧院》的获奖，引发了人们对于AI绘画的争议和讨论。它的作者Jason M.Allen就是一名游戏设计师。尽管他在艺术领域的天分有限，但理工科背景帮助他熟练掌握各类数字绘画软件，通过修改指令、选择草稿、调整格式，最终展示出一座融合古典元素和科幻元素的宫殿。值得一提的是，《太空歌剧院》对光影的捕捉显现出AI在细节层面的卓然进步，这种进步甚至超越了艺术家，这也是该作品获奖引发争议的直接因素。

2.智能化数字工具。AI绘画是一种以数字工具为载体的艺术形式，它利用计算机算法模型来实现“描述生成”和“参考生成”的功能。然而，由于普通人对于自己想法的陈述往往相对简练，而算法模型对场景还原和细节处理的能力有限，这就导致了AI绘画作品往往存在一定的割裂感。为了解决这个问题，一些AI绘画工具开始探索使用大语言模型来生成内容，从而更全面地理解用户给定的指令，并根据语义理解进行绘画。其中最具代表性的AI绘画工具分别为Midjourney和Stable Diffusion。

Midjourney是一种采用对话形式的AI绘画工具，它可以通过交流的方式进行绘画创作。用户需要提出绘画想法，包括文字描述、风格描述、画幅比例、参考图片权重等指令。Midjourney接收反馈之后，不仅按照用户具体要求生成图像，而且能够依据所描述内容和绘画风格智能化调整线条、色调、像素等。例如，算法模型会根据场景在什么地方、时间是什么年代、人的情绪状态进行图像修正，这就大大减少了AI绘画作品的不合时宜，即不会出现一张无厘头的高清图片。此外，许多用户通过ChatGPT和Midjourney叠加使用，让用户想法转化为更系统的文本指令，直至AI画作栩栩如生。

Stable Diffusion是一种基于扩散技术的文本到图像的模型，它可以根据任意的文本输入生成逼真的图像。它由德国慕尼黑大学的CompVis组和Runway公司的研究人员开发，并已经开源，可以在大多数配备了至少8GB VRAM的GPU上运行。由于其开源性的特点，多国技术人员围绕Stable Diffusion编写了能够让其生成的模型更可控的插件，例如ControlNet和LoRA。ControlNet是一种神经网络结构，可以通过添加额外的条件来控制扩散模型。LoRA是Low-Rank Adaptation of Large Language Models的缩写，可以理解为Stable Diffusion模型的一种插件，和hyper-network类似，都是在不修改Stable Diffusion模型的前提下，利用少量数据训练出一种画风/IP/人物，实现定制化需求。

3.充满想象力的成果。自AI绘画出现之后，就一直饱受数字缝合（拼接）争议。这是因为AI绘画的底层逻辑是模仿学习，AI在不同数据库之间选择和归纳，使得最后生成的绘画作品像是人类所为。尽管AI绘画缺乏人类意志，但这种依赖数据的创作方式反过来又拓展了人类的想象力，推动创意内容出现。一方面，AI绘画能够超脱人类意志将天马行空的想象转变为现实，进而产生陌生化的视觉体验；另一方面，AI绘画也革新了绘画的呈现方式，动态的、多维的、交互的绘画作品不断打破固有审美范式。

2023年3月7日，可口可乐发布了创意广告《Masterpiece（杰作）》，该短片运用了Stable Diffusion技术，可以将静态的名画转化为动态的视频，画中的人物无缝地帮助一位需要灵感和提神的学生打开可口可乐瓶，展现出不同画风和文化背景下的可口可乐瓶。这个短片不仅展示了可口可乐的创意魅力，也展现了AI技术在艺术领域的应用潜力。2023年4月1日，支付宝联合Gurulab创始人赵伯祚发布了一条名为《支付往事》的短片。近5分钟短片全部视觉由AI完成，详述了中国支付从钱包时代、互联网时代、二维码时代再到未来万物互联时代的支付状况。由于特定时代的素材匮乏，AI绘画软件便弥补了这个遗憾，通过相似文本组成了新的图像，从而保持短片叙事流畅。在此基础上，AI还设计出卡通人物形象，使得严肃的支付内容中增加了吸引力和趣味性。这条被冠以中国第一则AI广告的短片更是为AI绘画的商业化落地打开了新图景。

4.共享化的分享传播。数字化生产决定了AI绘画作品可以永久地保存下来，数字空间同时也为AI绘画作品的欣赏和传播带来极大便利。

一方面，受众以屏幕为媒介能够更近距离、全方位、立体化感知AI绘画作品。部分AI绘画作品甚至需要指定观看方式。AI绘画还改变了绘画作品的评价标准和评选机制。全新的观看方式不仅给受众带来沉浸式体验，这种行为本身也能够编织视觉信息，制造新的解读。目前阶段，受众观看AI绘画作品是对算法模型的一种反馈，某种意义上受众也是AI绘画作品的创作者。而在不久的将来，某些AI绘画作品必须经过受众观看才能最终完成。

另一方面， AI绘画作品在美术馆、博物馆以外获得充分的展览机会，数字空间自由组合使得更广泛的公共性实现，最终指向审美素养的整体提升。目前，除了社区性质的AI绘画软件，大多数AI绘画作品均可分享至第三方平台，帮助AI绘画作品借助社交媒体形成裂变式传播。特斯拉创始人马斯克的AI绘画作品就在推特获得大量关注，部分用户通过马斯克形象和反差场景叠加，制造出戏谑的视觉冲突，也带来了艺术领域的新思考。

三、关于AI绘画的思辨

从科技领域突破到艺术领域争论，AI绘画相关话题在2022年达到井喷式增长。根据券商机构国泰君安预计，未来5年，AI绘画在图像内容生成领域的渗透率将达到10%～30%，市场规模将超600亿元，创造出更广阔的市场价值。然而，在AI绘画受到高度瞩目的同时，也需要客观审视其局限和问题，由此更好地把握AI绘画的发展方向。

1.主体性问题。如果承认AI绘画作品是一种智力成果，那么其创作主体究竟是人还是其他。就目前阶段而言，AI绘画是人工智能依靠数据和算法获得一种相对符合人类的创作能力。但AI绘画整个生产过程都需要人的介入，AI并不可能像人类一样具备生物性机能，形成独立思考的能力。麦克卢汉认为，一切具有反馈功能的服务器中动力的生成和传输与使用动力的工作运程是完全分类的，其原因在于机器能量的源头和信息转换的流程是互相分离的。换言之，即便未来AI对于人脑思维的训练达到新的阶段，但是AI始终无法像人类一样身体和意识同时在场，它的工具性地位不会改变。这就让绘画主体性的问题回到原点，AI不能作为智力成果的所有人，AI绘画将会是一种新兴的艺术品类。

2.艺术性问题。AI绘画为每个个体提供了生成绘画作品的权力，但这种生成更像一种工业化生产，与艺术的精准度或者说独创性相违背。从创作者来看，AI绘画并非一件易事，它建立在创作者能够清晰地表达想法、熟练运用数字工具且拥有AI绘画软件相匹配的软硬件设施的基础上。因此创作者的综合能力而非绘画能力决定着绘画作品的艺术性高低。从创作方式来看，AI是提取其他绘画作品的共性信息进行拼凑，而艺术家创作则在共性信息中寻求突破，所以AI绘画艺术的独创性有待提高。从创作成果来看，以数据为基础的AI绘画不存在雷同问题，但数据所带来的偶发性也造成艺术价值很难保障。即便在AI绘画应用前景较好的游戏设计、动漫设计领域，AI绘画作品质量不稳定现象也频频发生，表现为张冠李戴、画面同质、设计单一等。

3.艺术创作者创新性问题。AI绘画的出现使得传统创作者面临更激烈的竞争和更多样化的选择，这就要求他们不断提高自己的创新能力，以保持或提升自己在艺术市场上的优势和影响力。传统创作者可以通过学习和使用AI绘画工具来拓展自己的创作视野和范围，从而获得更多的灵感和想法；也可以通过与AI绘画工具进行交流和合作来优化自己的创作过程和结果，从而提高自己的创作效率和质量。但是，AI绘画也可能对传统创作者产生一些负面影响，例如，它可能使得传统创作者失去了自己原有的个人风格和特色，或者使得他们陷入了对AI绘画所带来的虚假或浮夸的绘画风格浪潮的盲目追逐。这些负面影响可能导致传统创作者迷失了自己原本的创作的目的和意义，或者使得他们失去了创作的动力和信心。例如，创作出漫画《秀逗魔导士》的作者新泉留衣，在近日发布的《秀逗魔导士》画册中使用了AI绘画，被粉丝指出失去了个人风格，引发舆论反响。

4.版权性问题。版权是所有数字内容生产绕不开的议题，而AI绘画又将该问题进一步放大。首先，一幅AI绘画作品的生成至少与三部分人群相关：使用AI绘画软件的用户、AI绘画软件的设计者以及软件投资商、开发商。三者皆对绘画作品付出了一定贡献，因此作品的最终归属权存在模糊地带。其次，AI背后的学习素材并非凭空而来，为了让绘画达到高水准需要不断扩充素材库。那么，使用这些素材是否属于侵权？再次，AI绘画作品必然综合了多种绘画元素，而对于前人的借鉴是否能够被法律保护同样处在灰色地带。2023年1月，三位艺术家对AI绘画软件 Stable Diffusion 和Midjourney 创建者提起诉讼，他们认为这些组织侵犯了艺术家的权利，在“未经原创艺术家同意”的情况下从网络上抓取的50亿张图片来训练AI模型。

5.伦理性问题。AI绘画还引发了道德伦理争议。人的意志在技术支持下获得了前所未有的放大，而技术本身不具备价值评判机制。对于门槛低、制作简单、成果真假难辨的AI绘画，必然会出现挑战世俗伦理的图像内容。比如，部分用户利用AI绘画软件进行色情图片制作，渲染挑战认知极限的图片内容进行谋利。再如，嫁接知名人物肖像进行图片制作，引起认知错乱和社会恐慌。2023年3月，某新闻平台在社交媒体推特发布“美国总统特朗普被捕”的快讯。图片中特朗普在阶梯前被两名美国警察抓住，导致网友信以为真。随后才被其他媒体证实，图片是AI生成的虚假图片，文字内容也为虚假信息。而从更远的角度来看，当AI绘画展现出超越人类思维的创作能力，放任AI绘画的权力边界，还将出现更多挑战社会伦理的问题。

6.对艺术消费市场的影响。AI绘画可以为艺术市场提供更多更丰富更多样化的艺术作品，从而满足不同层次不同需求不同偏好的消费者。AI绘画也可以为艺术市场带来更多更便捷更低成本的艺术交易方式，从而促进艺术市场的发展和繁荣。然而，AI绘画也可能对艺术市场和消费者产生一些负面影响，例如它可能使得艺术市场出现更多的艺术作品的仿制和盗用，从而损害了艺术作品的原创性和价值；它也可能使得消费者对于艺术作品的评价和接受出现更多的误解和偏见，从而影响了艺术作品的传播和影响力。

四、结语

AI绘画在人工智能的突破下获得了长足发展，也赋予人类利用AI进行艺术实践的诸多可能。随着ChatGPT的横空出世，AI绘画进入新纪元。面对AI绘画引起的行业生态剧变，我们应正视技术和艺术的相互博弈，研究AI绘画未来发展中将引发的问题，积极寻求解决方案，以为AI绘画开启更旺盛的艺术生命。