魏珍珍 周钿
摘要:随着人工智能(Artificial Intelligence,AI)的快速发展,其在繪画方面的应用愈加广泛。文章分析现有AI绘画工具,探讨其技术发展、局限性与发展趋势,分析其与艺术的差异和相关道德性,从而引导创作者正确看待和利用AI绘画。
关键词:人工智能技术;AI绘画;计算机视觉;艺术创作工具
中图分类号:TP18;J204 文献标识码:A 文章编号:1004-9436(2023)02-0-03
人类对生活情感的记录和表达是本性,而科技的发展一直影响着人类看待世界的方式。近年来,人工智能技术不断更新迭代,吸引了大量艺术家的关注,相关研究者也开始探索人工智能技术在艺术创作方面的应用。此外,艺术展示场所出现的人工智能艺术创作产品,其是否称得上是艺术品,各种观点也层出不穷,吸引着人们对AI绘画这一新兴技术和艺术相结合的产物展开理论和实践方面的讨论。本文主要介绍AI图像生成的技术发展与当前存在的局限性,并分析未来AI绘画的发展趋势,希望在此基础上引导创作者正确看待和利用AI绘画。
1 智能图像的生成与艺术特性
本文所探讨的AI绘画,主要针对的是基于机器学习模型进行自动数字绘图的计算机程序。AI绘画良好的创作能力来源于神经网络的发展,即通过神经网络的计算,不断缩小需求输入与期望输出的差距。目前的AI生成技术主要由三个神经网络相互组合搭建而成,一是文本转换网络,将输入的提示语转化成网络能够理解的字符串;二是生成网络,收到文本后,与内部数据库进行匹配,衡量各字符串的权重,模拟计算后输出匹配图像;三是放大网络,将输出的图像清晰化,得到符合现阶段分辨率限制的图像。经过大量研究证明,以上生成式AI模型在训练成本和出图效果上都有比较理想的成绩。
1.1 智能图像生成的技术发展
AI绘画创作在过去10年中发展迅速,其中不乏出现了一些重要的技术里程碑。例如,GAN的技术创新对当前人工智能艺术运动的兴起作出了重大贡献。2012年,一些计算机学者通过神经网络GAN进行上万张图片的模型训练,最终生成了一个非常模糊的猫脸,人们认识到可以通过计算机生成图像,这成为人工智能与艺术相接的转折点。将输入字符串生成的图像与真实样本进行对比,经过多次循环后得到的图像会越来越接近输入文本需求。该框架的实现使得各种类型的图像内容生成取得了令人印象深刻的结果,很快成为人工智能最重要的研究领域之一,并且出现了许多高级和特定领域的原始架构变体,如CycleGAN(循环生成对抗网络)、StyleGAN(风格生成对抗网络)和BigGAN(庞大生成对抗网络)等智能图像生成软件。
2015年,Mordvintsev(莫尔德温采夫)等人使用DeepDreams(深度梦想),通过可视化和最大化神经元激活的模式来提高深度CNN(卷积神经网络)的可解释性。随着计算机图形学和计算机视觉研究的不断深入,深度神经网络与手工绘画相结合,开发了许多渲染和纹理合成算法。其中包括将“绘画风格”应用于图像生成过程,在输出时可以选择水彩或素描风格的融入。而促使艺术人工智能技术快速发展的最具标志性的人工智能发明之一则是NST(神经风格迁移),这种方法由Gatys(加茨比)等人在工作中引入,计算机将生成图像的“内容”简单理解为可识别的相关物体,将“风格”直接理解为一种美学上令人愉悦或有趣的视觉偏差,通过分离与组合图像“内容”和“风格”,证明了CNN在创建风格化图像方面的成功。尽管NST方法代表了自动图像处理领域中一项非常有趣的技术贡献,但使用NST方法生成的程式化图像通常表现为有图像输入的明显组合,而不是原创和独特的艺术创作。
综上所述,人工智能绘画有诸多优点。第一,数据库庞大,既囊括了不同时期不同风格画家的作品,又存储了使用者依据AI创作的绘画作品。第二,使用AI输出绘画作品,效率高且操作简便,哪怕是之前没有基础的使用者,在经过指南操作和基础练习后也能达到正常使用的水平。
1.2 AI绘画的技术现状与局限性
如今,AI绘画模型正在以前所未有的速度爆发性增长。2022年8月22号,Stable Diffusion宣布开源,不仅是程序,还包括训练好的模型。它是目前水平最高的绘画AI之一,它的开源意味着接下来会有很多包装stable fusion(稳定融合)内核的产品出现,这是一个指数型增长的开始。同年10月,能够自动续写小说的AI工具Novel AI Diffusion(新型人工智能扩散)将它的配图功能单独工具化,这是目前最成功的能够进行动漫风格绘画的AI生成器,能够根据提示词输出想要的角色,同时还具有干净漂亮的线条。但是,Novel AI生成的图比以往任何一个AI生成的图的拼贴感都强,甚至能比对上原图,在网上饱受争议,主要原因有两点:第一,Novel AI使用了争议极大的数据源Danbooru(丹布鲁),这个数据源本身存在大量无授权的图片;第二,Novel AI的计算没有对输出模型进行对比检查,通常导致“过拟合”问题。虽然Diffusion(扩散)的技术原理本质上并不是缝合拼贴,但是基于以上原因,在结果上确实会出现和原作者过度雷同从而引发抄袭和侵权的风险,Novel AI就是最好的例子。
虽然AI的功能令人惊叹,但目前仍然存在很大的发展空间,主要受制于算法的发展。第一,AI绘画过度依赖训练数据。现有的计算仅局限于数据库中已导入的图像或者艺术数据,导致目前的AI绘画只是对过去一段时期的艺术整合,并没有实时跟进艺术的发展。第二,AI所能理解的提示词有限,以绘画风格和绘画内容为主,且无法绘制文字作品,当输入词涉及语义逻辑时会难以计算。第三,AI绘画不具系列性,在同一AI绘画软件上输入类似的文本,AI会重新进行计算而无法得到与之前相互关联的同系列输出图像,因此,AI绘画输出的是一张张独立图像,难以进行同系列的创作。
不仅在绘画领域,AI也在其他领域同样得到了快速发展和广泛应用。例如,工业领域在大力发展智能语音识别技术,对人们日常自然语言进行理解与转化;互联网领域在发展拍照识物和寻找类似物品的程序;科研领域在不断进行类似结果的模拟计算,不断总结与更新,进行比对和验证得到最佳结果。各个领域最终都会相互结合,AI在绘画领域的发展势不可当,必将成为绘画创作的一大新潮流。
2 正确看待和利用AI绘画
正确看待和利用AI绘画,与传统绘画进行比较分析是必要的。传统绘画是使用一定的物质材料作为工具,运用色彩、线条等进行构图,必须由艺术家完成,这需要艺术家进行一定时间的训练。AI绘画则依据机器数据库识别输入文本,通过对以往作品的计算,进行图像匹配创作绘画。
2.1 AI绘画的道德性
在人工智能艺术创作过程中,机器和艺术家二者间的人机关系一直存在争议。2022年8月,在美国科罗拉多州博览会艺术比赛中,Jason Allen(杰森·艾伦)的作品《太空歌剧院》夺得头奖。由于该画作使用AI绘图工具Midjourney完成,因此引来了不少人类艺术家的指责,AI绘画到底算不算艺术呢[1]?除此之外,其他重要问题,如与人工智能艺术的新颖性、原创性和自主性相关的问题,也开始受到艺术史学家、艺术家以及人工智能科学家和开发人员的关注。
这些争议与计算机在作出被认为对创作过程至关重要的决策时的自主程度有关。计算技术是否仍然被视为单纯的工具,还是它们表现出独立“行为”的特性?尽管原则上艺术作品具有可复制性,这也是人造器物总可以被人仿制的原因所在,但是机械复制代表的则是与之不同的新东西。在《机械复制时代的艺术作品》中,本雅明指出技术复制好比一把双刃剑,在割裂了本真性,导致“灵韵”丢失,不断贬低原作价值本质的同时,也极大地增强了作品的空间灵活性,提高了公众参与度[2]。因此,这就很难确定AI艺术品的价值应该取决于其输出结果所涉及的技术复杂性和创新性,还是仅取决于最终的视觉表现。Hertzmann(赫茨曼)表示,“人工智能算法不是自主创造者,在可预见的未来也不会出现。它们仍然只是工具,可供艺术家探索和利用”。
另一个值得注意的是作者版权和伦理问题。2018年10月,Obvious(无创意)集体制作的AI艺术品《埃德蒙德·贝拉米》在佳士得拍卖会上以432 500美元的价格售出,这一拍卖引发了关于作者身份和版权问题的讨论,并引发了关于在制作、推广和销售作品时必须考虑的版权问题的讨论[3]。在上述拍卖的情况下,人工智能艺术品虽然是由人工智能系统自主生产,但创建该系统的作者,以及用于运行网络的代码的作者,都没有收到任何正式的版权许可。
尽管争论不断,但最近出售的大多數人工智能艺术品的案例表明,目前这些艺术品的著作权归于使用人工智能技术制作艺术品的艺术家,不管创作过程如何,哪怕在艺术品上明确标注了由AI进行制作,那些计算模型的开发者和软件运营商的贡献仍然被忽略,类似计算机行业套用代码源,仅仅将代码当成一种公开工具来使用。而在使用AI进行绘画创作中,数据库中的部分图像也可能涉及原始作者创作版权,即在没有征得作者许可的情况下进行了计算输出。当然,这在最终作品中几乎不会被注意到,但仍然需要从道德角度承认,人工智能艺术品中的版权侵权是一个需要系统解决的问题。
2.2 AI绘画——创作者的工具
目前对AI绘画的看法主要分为两大类,一部分激进的人认为AI具有比人类艺术家更强大的学习和计算能力,AI绘画将取代人类成为更具创作经验和技巧的“艺术家”。不过,AI绘画创作出的作品是毫无感情的图像,将大大减少绘画的原创性,这意味着人类最神圣且不可冒犯的领域已经接近陷落。而另一部分人认为AI只不过是另一个绘画工具,将AI绘画看作艺术技术性载体,而不是作为主体的艺术,它不能替代人类独有的创造力,因为艺术来源于真实生活,而这是机器所不能感受的人类那种特有的复杂生活阅历与人生感悟。虽然借助深度学习和神经网络算法让AI绘画创意无限,但提供创作需求的主导者依旧是人,人对表达的持续渴望是本能,并不会被AI所替代[4]。
AI绘画模型能够作为人类艺术传承的工具。自古流传下来的文墨书画或石碑壁画,饱受岁月侵蚀,上面具体的内容或许早已无法识别。而AI绘画可以借助VAE(重构变分自编码器)和GAN,通过训练图画的缺失部分,生成图像记忆,填补受损区域[5]。此外,AI还能通过计算对比鉴别古画的真伪,将需要鉴别的艺术品拍照上传后,AI会在数据库进行匹配,通过每一个组成代码的比对计算来判断相似度。
AI绘画模型能够作为创作者的绘画工具。它能够帮助创作者将灵感具体化,通过在同一主题下更换不同关键词,得到不同的输出可能性,而内部又具有完整的统一性,具有一种“在明确边界内的丰富可能性”。类似中国传统的山水画创作,墨水流动的不确定性与AI计算类似,给予了画家源源不断的创作想法。接下来,画家会在大致区分开的山水上绘制细节,将自己创作的情感带入,逐步填充和调整细节。相较于传统的文档、草图、照片等繁杂且耗时的需求来源,创作者将自己一时的灵感转换成文字关键词输入给AI,便能将其具象图像化,囊括气氛、光线、风格和质感等。
此外,AI绘画模型还降低了艺术体验的门槛,让普通人都可以体验艺术创作的过程。只需要提供一个粗陋的轮廓或者大致想法,人人都能立即得到自己想要的图像。这正好迎合了当代艺术的价值方向,即破除了艺术家与普通人的界限,人人皆为艺术家。其中,类似泼墨的过程在AI绘画创作过程中被简化,创作者可以根据原始图像来绘制细节,作为创作者的练习,为后续的艺术创作积累经验。当然,AI绘画也存在不合理的取舍细节和缺乏共情感染力、氛围感的缺点,而这些刚好是人类艺术家擅长处理的方面。
3 结语
当前绘画创作紧跟科技发展步伐,AI绘画与传统绘画的结合是时代趋势,随着绘画艺术的发展,绘画艺术的边界将不断发生变化。绘画与科技的结合越来越紧密,AI绘画的局限性也会不断缩小。将AI绘画作为人类艺术传承和提高创作效率的工具,将其作为人脑的延伸而不会取代人,未来会有越来越多的绘画艺术形式将在人类和AI的协作下完成。随着AI算法的不断更新与AI绘画相关条例的逐步完善,普通人也能够用AI生产高质量视觉作品,这将极大改变人类的艺术生活。
参考文献:
[1] 王方方. AI绘画引发的思考[J].科技与金融,2022(10):60.
[2] 王子铭.作为艺术事件:本雅明论机械复制时代的艺术作品[J].文艺评论,2022(3):11-19.
[3] 郭霁瑶.偷窃的艺术,还是重新定义原创?AI绘画背后的艺术变革与争议[J].中国经济周刊,2022(23):75-77.
[4] 王少文.数字时代绘画主体性探讨[J].四川戏剧,2022(9):157-159.
[5] 童茵.数字人文范式框架与绘画文物AI智能研究[J].计算机产品与流通,2020(3):133-135.
作者简介:魏珍珍(1980—),女,湖北武汉人,硕士,副教授,研究方向:视觉传达设计。
周钿(1999—),女,湖北襄阳人,硕士在读,研究方向:视觉传达设计。