赵永涛,高经纬
【视觉传达设计】
新一代人工智能技术在平面设计中的应用
赵永涛1*,高经纬2
(1.洛阳理工学院 艺术设计学院,河南 洛阳 471003;2.天津大学,天津 300354)
探讨人工智能技术在平面设计领域中的应用现状和不足,并提出一种基于自然语言描述的图像生成方法,以更好地满足设计师的需求。采用GPT-3模型生成创作思路的文本描述,并使用稳定扰动(Stable Diffusion)算法生成与描述相匹配的图像。通过测试和应用实例验证方法在平面设计中的效果,旨在探索平面设计领域中的新视角和工具,以简化设计过程,提高设计质量和效率。研究采用实证分析方法,结合实验结果和定性分析,评估了该方法生成的图像与自然语言描述的匹配程度、图像质量,以及方法的灵活性和可控性。通过这些评估指标,可确定该方法的有效性,并更好地满足设计师的需求。未来的研究方向包括进一步增强算法的多样性、创意性,以及探索更智能化的平面设计工具,以提高设计师的工作效率和设计品质。
人工智能技术;平面设计;自然语言理解算法;图像生成
平面设计是将文本、图像与色彩等视觉元素组合起来,传递信息和情感的一种艺术形式[1]。它广泛应用于印刷品[2]、包装[3]、标识[4]、广告[5]等领域,并在互联网和移动应用程序的设计中得到了越来越多的关注。平面设计的本质在于通过设计构建出令人印象深刻、直观易懂的视觉元素,从而达到信息传递和情感沟通的目的。
平面设计中包含了许多视觉元素[6],包括图形、图像、色彩和空间等[7-8],设计师需要根据其设计目的,灵活地选择和搭配这些元素,从而构建出一个完整、清晰和吸引人的设计作品。平面设计需要符合观众视觉认知的特点,以便观众能够快速地获取信息并理解设计的意图[9]。在设计的过程中,设计师需要注意设计细节和整体效果,如线条与色彩的选择、比例和平衡等,这些细节可以直接影响到设计作品的效果和品质[10]。
平面设计的历史可以追溯到古代的书籍装帧和印刷品制作,但直到19世纪末和20世纪初,平面设计才逐渐形成为一门独立的学科。20世纪上半叶,平面设计发展迅速,主要受到包豪斯学派、现代主义和构成主义的影响。这些流派主张以简洁、清晰、功能性为设计的核心,强调设计要符合生产力和现代社会的需求[11]。
随着人工智能技术的快速发展,它的应用范围也在不断拓展。其中,人工智能在平面设计中的应用越来越受到关注[12]。在传统平面设计中,设计师通常需要通过手工绘图、数字化绘图软件等手段来完成设计作品。这种方式不仅需要花费大量时间和精力,而且设计师需要具备较高的艺术修养和设计能力。在这种情况下,人工智能技术的应用可以大大提高平面设计的效率和质量[13-14]。
人工智能技术在平面设计中的应用主要包括两个方面:图像处理;自动化设计[15]。在图像处理方面,人工智能可以应用于图片修复、图像增强、图像识别等方面。徐国彬等[16]采用一种改进算法改善了数字类国画缺陷修复问题,具有一定的实际应用价值。董霙达等[17]针对现存传统蒙古家具纹路样式模糊等问题,提出一种机器学习方法,增强了纹样特征,其对文物修复和保护具有参考价值。许鑫等[18]以剪纸为载体,通过研究剪纸图像自动分类识别技术来探讨人工智能技术在艺术领域中的应用,取得了良好的分类效果。在自动化设计方面,人工智能可以帮助设计师完成排版、颜色搭配[19]、字体设计[20]等工作。本研究主要关注人工智能在平面设计中,针对自动化设计的应用。高峰等[21]首先进行人工智能案例的分析,然后基于人工智能的辅助设计座椅形态,经过多次调整,取得了较好的效果。李雄等[22]借助对抗神经网络来进行概念草图的设计,有助于设计师突破思路,提高设计效率。
虽然目前风格迁移、对抗生成网络(GANs)和其他机器学习算法在平面设计领域中越来越受到关注,且这些算法提供了一种自动化、高效的方式来创建平面设计,但它们通常需要大量的数据来训练模型,因为很难收集到足够的数据,这对某些类型的设计来说可能是不可行的。此外,这些算法往往需要强大的计算能力,对一些小型设计团队或设计师来说可能是一种挑战。不仅如此,算法生成的图像品质和多样性也是一个问题。通常传统算法生成的图像比较平淡且缺乏个性。这些算法还往往受到训练数据的限制,很难超越数据中的内容和风格,因此难以实现真正的创造性和独特性。
针对以上问题,本研究提出了一种基于自然语言描述的图像生成方法,利用GPT-3(Generative Pre-training Transformer-3)[23]模型生成创作思路的文本描述,并使用稳定扰动(Stable Diffusion)[24]方法生成与自然语言描述相匹配的图像。本研究团队在设计者提供的自然语言描述上进行了测试,并列举了包装、书籍封面和广告设计的应用实例。实验结果表明,该方法能够有效生成与自然语言描述相匹配的高质量图像。通过人工智能技术的自动化和高效性,设计生成过程迅速,节省了设计时间。该方法具备灵活性和可控性,能生成具备多样性、高质量的图像。应用人工智能技术使得设计作品适应不同风格和要求,不仅可满足设计师的个性化需求,并提供更多创意和选择,还能加强设计师与客户之间的沟通与理解,通过生成与客户需求相匹配的图像,帮助设计师更好地理解客户需求,改善设计师与客户之间的合作,产生更好的设计结果。
本研究采用了预训练的语言模型GPT-3来解析设计师提供的自然语言需求描述。GPT-3是一个基于transformer结构的语言模型,通过预测下一个单词的方式进行自监督学习,其具有很强的语言理解能力。传统迁移学习模型和生成式预训练迁移学习模型的对比图,见图1。
传统迁移学习模型中包含编码器和解码器两部分,而生成式预训练迁移学习仅使用了一个多层的解码器,因此生成式预训练迁移学习模型相较于传统模型有了明显的改进。本研究使用的GPT-3模型使用来自人类反馈的强化学习方案,通过对大语言模型进行微调,从而可在较少参数的情况下,生成优于往期的模型。鉴于传统自然语言技术存在的多种局限,基于大语言模型的GPT-3充分利用大量无标注文本进行预训练,从而使得模型在小样本和无样本场景下有较强的理解与生成能力。基于人类反馈的强化学习方案基本流程如图2所示。
如图2所示,首先为保证模型有充足的知识储备量,需要收集大量的说明解释数据来训练监督策略。随后,标记者记录模型希望输出的结果并利用这个标记数据结合监督学习对模型进行微调。其次,研究人员对这个训练的数据集和若干模型结果进行抽样,把输出结果从最优到最差进行排序,并以此数据训练反馈模型。然后,把新的问题从样本中抽样,借助模型生成输出结果,并计算这个反馈结果的准确率。最后,将这个反馈结果用以优化策略模型,从而使模型输出最正确可靠的结论。
图1 传统迁移学习模型和生成式预训练迁移学习模型对比图
为了将自然语言描述转换为稳定扰动算法中需要的低维向量表示,采用了GPT-3对自然语言描述进行编码,其能够将自然语言描述转换为高质量的低维向量表示,然后使用稳定扰动方法来生成与自然语言描述相匹配的图像。稳定扰动图像生成算法结构如图3所示。
稳定扰动算法首先使用预训练模型对需要训练的图像生成相应的描述词语,然后使用变分自动编码器训练模型,接下来将经过压缩后的数据输入扩散过程模型,进行正向采样操作。在数据输入过程中会产生噪音,持续记录每步产生噪音的数据。
进一步地,利用交叉注意力机制将潜在空间中的特征和另一模态特征融合。交叉注意力公式见式(1)。
图3 稳定扰动图像生成算法结构
在向前过程中根据多元高斯分布来生成一张纯噪音图像,利用变分自动编码器将纯噪音图像压缩到算法潜在空间中。进一步地执行去噪网络,利用交叉注意力机制融合多模态信息,并预测每一步需要检测的噪音,最后利用变分自动编码器将生成图片还原到目标图片大小。
当生成完图像后,还可以通过微调来修改自己生成的模型。通过这种方法,可将自然语言描述转换为图像,并且保留输入句子的语义信息,从而让生成的图像更加符合设计需求。
在当代平面设计中,艺术家和设计师们需要创造出高质量的图像来满足客户和观众的需求。随着人工智能技术的快速发展,使用机器生成图像逐渐成为了一个重要的趋势,这不仅可以减少设计师的工作量,还可以为设计师提供更多的创作灵感。本研究使用了来自设计师的一组自然语言描述,作为输入进行实验。针对每个自然语言描述,笔者将GPT-3模型用于解析设计师的思路,然后从GPT-3辅助生成的描述中提取关键词,并使用稳定扰动(Stable Diffusion)生成与关键词描述相匹配的图像。接下来,通过将本研究算法应用于平面设计中常用的黑白版画、水彩与厚涂油画、建筑与风景设计、数字插画设计、3D渲染效果设计等表现形式中,来探讨本研究算法的合理性与适用性。
黑白版画作为一种古老的印刷技术,一直以来都是平面设计中的重要元素。如表1的序号1~3所示,经本研究算法生成的黑白版画可被用来表现一种古典、优雅的气质。如表1的序号4所示,创造出一种神秘、幽暗的氛围。同时,生成黑白版画的高对比度和纹理感也能够给设计作品带来更多的层次、更强的立体感。经本研究算法生成黑白版画的应用不仅能够强调设计作品的主题和情感,还可以起到吸引目光和增加视觉冲击力的作用。
水彩和厚涂油画作为两种艺术绘画形式,不仅在绘画领域被广泛应用,同时在平面设计中也有着重要作用。表2中序号1~2展示了本研究算法生成的水彩作品,以其柔和流畅的特点适合描绘人物,增加作品的个性和情感共鸣。而表2中序号3~4的厚涂油画则显示出丰富的质感和强烈的立体感,适合表现强烈、厚重的视觉效果。在平面设计中,经本研究算法生成的厚涂油画的质感可以带来更强的视觉冲击力,同时也更易于传达作品所希望表达的情感和主题。
表1 黑白版画效果
Tab.1 Effects of black and white prints
表1(续)
表2 水彩和厚涂油画效果
Tab.2 Effects of watercolor and impasto oil painting
如表3所示,经本研究算法生成的数字插画在插图和漫画方面具有独特的表现手法和视觉效果,其可以创造出各种不同的视觉效果,例如水彩画效果、手绘风格等。这种多样性使得经本研究算法生成的数字插画在创造独特的设计风格和形式上非常实用。
在当代平面设计中,3D渲染类图片的应用越来越广泛。如表4所示,经本研究算法生成的3D渲染图能够以高保真度、高逼真度的方式呈现设计师所设计的模型和场景,帮助设计师更加直观、全面地了解和展示设计方案。通过自然语言理解与稳定扰动(Stable Diffusion)生成3D渲染技术,设计师能够从各个角度观察和调整设计方案,包括构件、材质、光照、布局等。此外,3D渲染技术还可以让设计方案以具有立体感的效果图、动画、视频等形式呈现,为设计师的展示和交流提供了更多的选择。
表3 数字插画图片效果
Tab.3 Effects of digital illustration pictures
表4 3D渲染效果
Tab.4 3D rendering effect
基于自然语言描述生成视觉艺术表现图片可以给平面设计带来许多帮助。首先,这些类型的图像具有非常强的审美感受,可以增加作品的视觉冲击力,吸引观众的注意力。例如,使用自然语言描述与稳定扰动(Stable Diffuison)生成的黑白版画可以增强图像的纹理和线条感,使得图像更具有立体感和质感,从而提高设计作品的艺术价值。而其生成的水彩和厚涂油画则可以营造出柔和的氛围,使得设计作品更加具有温暖和感性的感觉。其次,生成这些类型的图像可以帮助设计师更好地表达设计概念和想法。例如,3D渲染图以高保真度、高逼真度的方式呈现设计师所设计的模型和场景,帮助设计师更加直观、全面地了解和展示设计方案。
人工智能在平面设计领域的应用已经展现出巨大的潜力和广阔的发展前景。其中,包装设计、书籍封面设计和广告设计作为平面设计领域中的重要实践领域,具有代表性和普遍性。以这些实例为案例,可以较为充分地展示人工智能在平面设计中的应用和价值,并深入探讨其对创造力和设计效率的影响。
包装设计是人工智能在平面设计领域中的一个重要应用方向。包装设计的目标是通过独特的视觉元素和信息传达方式来吸引消费者、塑造品牌形象,并促进产品销售。采用人工智能模型GPT-3,可以将自然语言描述转化为低维向量表示,以茶叶包装为例(如图4所示),通过GPT生成的描述语言为“清晨的雾气,茶香四溢。享受自然的美好,品味茶叶的独特滋味”。进一步地,结合稳定扰动(Stable Diffusion)算法生成与描述相匹配的图像。
图4 包装设计效果图
以茶叶所处的环境为主题,描绘了茶叶生长在山水之间的情景,用自然的色彩和光影表现出茶叶的清新和优雅。通过算法生成的元素与人工设计的元素相融合,形成了独具特色的设计风格,使得设计不仅符合茶叶自然主题的特点,还突出了包装设计的美感和实用性,为茶叶行业注入了新的活力和创意。
书籍封面设计是另一个具有重要影响力的实践领域,也是人工智能在平面设计中的应用之一。书籍封面的设计需要吸引读者,引起他们的兴趣并传递内容的核心概念。以奇幻冒险小说为题,GPT生成的描述语言为“在中世纪城市中展开一场哥特式奇幻冒险!在傍晚余晖的照耀下,踏入中世纪城市的奇幻冒险之旅,古老的城墙高耸入云,哥特式尖塔屹立其中,散发着神秘的魔力。城市的街道弥漫着神秘的氛围,灯火闪烁,散发着暖意。整个封面展现了中世纪城市的壮丽景象,结合哥特风格的神秘气息和奇幻元素,引领读者踏入冒险的世界,探索其中的秘密与宝藏。”如图5所示,设计师可以通过自然语言描述生成与书籍主题相符合的图像。
这种方法不仅提供了快速的设计解决方案,而且在设计过程中注入了新颖的创意和个性化元素。通过以书籍封面设计为案例,可研究人工智能对设计创造力和读者吸引力的提升。
广告设计是平面设计领域中另一个重要的应用领域,也是人工智能的理想实践场景。广告设计需要通过视觉元素和文字信息吸引目标受众,传达产品或服务的核心价值和品牌形象。以地铁环保主题广告为例,GPT生成的描述语言为“一棵枯萎的树木矗立在画面中央,它的枝干干燥脆弱,叶片凋零残缺。然而,当我们的目光穿过枯木,我们被带入一个完全不同的场景。在背景中,一片绚丽的风景展现出来。广阔的天空中,夕阳的余晖洒在了美丽的山丘之上。”
图5 书籍封面设计效果图
在这个环保广告中,可以看到一棵枯萎的树木,枝干干瘪,叶片凋零,象征着破坏和环境恶化。然而,当视线穿过这棵枯木,一个令人惊叹的景象呈现在眼前。葱郁的绿色草地延伸到远方。这美丽的风景提醒着人们,尽管现实中存在破坏和枯萎,但只要人们努力保护环境,恢复生态平衡,就能够创造出美丽、和谐的自然景观。具体细节如图6所示。
以包装设计、书籍封面设计和广告设计为案例来分析人工智能在平面设计领域中的应用,能够多方面展示其在不同设计领域中的作用和效果。这些实例代表了平面设计的重要实践领域,同时也涉及商业推广与创造力等关键因素。通过研究这些案例,可以深入理解人工智能对平面设计的影响,并为设计师和相关从业者提供有价值的参考和启示。
图6 广告设计效果图
人工智能在平面设计领域的应用正日益成为一种新趋势,特别是GPT-3和稳定扰动(Stable Diffusion)算法的应用,为设计师带来了全新的视角和工具。在这项研究中,自然语言理解算法可以将设计师的构思迅速转化为清晰准确的文本描述,有助于平面设计师迅速理解客户或团队的需求。此外,稳定扰动(Stable Diffusion)算法的应用进一步拓展了自然语言理解算法的潜力,稳定扰动(Stable Diffusion)算法将文本描述转化为逼真的图像。这一方法的优势在于生成高质量的、逼真的图像,并避免了不真实感。因此,平面设计师可以更方便地利用这种方法创建与设计思路相匹配的图像。新一代人工智能技术的应用将极大地改变平面设计的方式,简化流程,提高效率,创造引人注目的视觉作品,同时更好地理解客户或团队的需求,以提高设计质量和效率。
[1] BESTLEY R, MCNEIL P. Visual Research: An Introduction to Research Methods in Graphic Design[M]. London: Bloomsbury Publishing, 2022.
[2] 韦慧. 平面设计中视觉设计技术在印染中的应用[J]. 棉纺织技术, 2021, 49(2): 89. WEI H. Application of Visual Design Technology in Printing and Dyeing in Graphic Design[J]. Cotton Textile Technology, 2021, 49(2): 89.
[3] 林晓龙, 王亚兰. 平面设计在食品包装中的运用[J]. 中国造纸, 2022, 41(2): 6. LIN X L, WANG Y L. The Application of Graphic Design in Food Packaging[J]. China Paper, 2022, 41(2): 6.
[4] 吕金鸿. 探索字体设计的视觉形象[J]. 美术观察, 2022, 318(2): 156-157. LYU J H. Exploring the Visual Image of Font Design[J]. Art Observation, 2022, 318(2): 156-157.
[5] 李洪玮, 翟冬. 平面设计在工业产品设计中的应用[J]. 内燃机工程, 2022, 43(5): 110-111. LI H W, ZHAI D. Application of Graphic Design in Industrial Product Design[J]. Internal Combustion Engine Engineering, 2022, 43(5): 110-111.
[6] 张洪亮. 当代平面设计中色彩表现的发展趋势探究[J]. 包装工程, 2022, 43(18): 397-401. ZHANG H L. Research on the Development Trend of Color Expression in Contemporary Graphic Design[J]. Packaging Engineering, 2022, 43(18): 397-401.
[7] 李肖雄. 触觉在平面设计中的影响及应用探析[J]. 包装工程, 2022, 43(4): 419-422. LI X X. Analysis of the Influence and Application of Haptic Sense in Graphic Design[J]. Packaging Engineering, 2022, 43(4): 419-422.
[8] 王一帆. 建筑平面设计中的视觉审美[J]. 建筑结构, 2022, 52(20): 154. WANG Y F. Visual Aesthetics in Architectural Graphic Design[J]. Building Structure, 2022, 52(20): 154.
[9] 郝志刚. 平面设计中的情感化表现[J]. 包装工程, 2021, 42(12): 344-346. HAO Z G. Emotional Expression in Graphic Design[J]. Packaging Engineering, 2021, 42(12): 344-346.
[10] HOLLIS R. About Graphic Design[M]. Minneapolis: Occasional Papers, 2012.
[11] JOBLING P, JOBLING P, CROWLEY D. Graphic Design: Reproduction and Representation Since 1800[J]. Design Issues, 1996, 12(2): 291-296.
[12] 殷明. 计算机美术设计在数字媒体平面设计中的应用[J]. 机械设计, 2021, 38(4): 154-155. YIN M. Application of Computer Art Design in Digital Media Graphic Design[J]. Mechanical Design, 2021, 38(4): 154-155.
[13] 银宇堃, 陈洪, 赵海英. 人工智能在艺术设计中的应用[J]. 包装工程, 2020, 41(6): 252-261. YIN Y K, CHEN H, ZHAO H Y. The Application of Artificial Intelligence in Art Design[J]. Packaging Engineering, 2020, 41(6): 252-261.
[14] 胡洁. 人工智能驱动的艺术创新[J]. 装饰, 2019, 319(11): 12-17. HU J. Art Innovation Driven by Artificial Intelligence[J]. Decoration, 2019, 319(11): 12-17.
[15] KARAATA E. Usage of Artificial Intelligence in Today's Graphic Design[J]. Online Journal of Art and Design, 2018, 6(4): 183-198.
[16] 徐国彬, 于艺铭, 李洁, 等. 基于改进BSCB算法的缺陷国画类数字图像修复研究[J]. 激光与光电子学进展, 2022, 59(10): 81-89. XU G B, YU Y M, LI J, et al. Research on Defective Chinese Painting Digital Image Restoration Based on Improved BSCB Algorithm[J]. Laser and Optoelectronics Progress, 2022, 59(10): 81-89.
[17] 董霙达, 张成涛, 多化琼, 等. 基于加权变换的蒙古族家具纹样增强研究[J]. 计算机工程与科学, 2021, 43(6): 1047-1051. DONG K D, ZHANG C T, DUO H Q, et al. Research on Mongolian Furniture Pattern Enhancement Based on Weighted Transformation[J]. Computer Engineering and Science, 2021, 43(6): 1047-1051.
[18] 许鑫, 鲍小春. 基于机器学习的剪纸图像自动分类研究[J]. 图书馆杂志, 2018, 37(7): 88-96. XU X, BAO X C. Research on Automatic Classification of Paper-cut Images Based on Machine Learning[J]. Library Journal, 2018, 37(7): 88-96.
[19] 邱雪琳, 孙迎, 刘正, 等. 基于色彩优化的云锦局部风格迁移[J]. 丝绸, 2022, 59(12): 64-70. QIU X L, SUN Y, LIU Z, et al. Local Style Transfer of Brocade Based on Color Optimization[J]. Silk, 2022, 59(12): 64-70.
[20] 陈可佳, 费子阳, 陈景强, 等. 文本风格迁移研究综述[J]. 软件学报, 2022, 33(12): 4668-4687. CHEN K J, FEI Z Y, CHEN J Q, et al. A Review of Text Style Transfer Research[J]. Journal of Software, 2022, 33(12): 4668-4687.
[21] 高峰, 焦阳. 基于人工智能的辅助创意设计[J]. 装饰, 2019, 319(11): 34-37.GAO F, JIAO Y. Assisted Creative Design Based on Artificial Intelligence[J]. Decoration, 2019, 319(11): 34-37.
[22] 李雄, 苏建宁, 张志鹏. 基于深度学习的产品概念草图生成设计研究[J]. 机械工程学报, 2023, 59(11): 16-30.LI X, SU J N, ZHANG Z P. Research on Product Concept Sketch Generation Design Based on Deep Learning[J]. Chinese Journal of Mechanical Engineering, 2023, 59(11): 16-30.
[23] OUYANG L, WU J, JIANG X, et al. Training Language Models to Follow Instructions with Human Feedback[J]. Advances in Neural Information Processing Systems, 2022, 35: 27730-27744.
[24] ROMBACH R, BLATTMANN A, LORENZ D, et al. High-resolution Image Synthesis with Latent Diffusion Models[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, New Orleans: IEEE Computer Society, 2022: 10684-10695.
Application of New Generation Artificial Intelligence Technology in Graphic Design
ZHAO Yongtao1*, GAO Jingwei2
(1.School of Art and Design, Luoyang Institute of Science and Technology, Henan Luoyang 471003, China; 2.Tianjin University, Tianjin 300354, China)
The work aims to explore the current status and limitations of artificial intelligence (AI) technology in the field of graphic design and propose a natural language-based image generation method to meet the needs of designers. The GPT-3 model was used to generate textual descriptions of creative ideas and the stable diffusion algorithm was adopted to generate images matching the descriptions. Through practical applications and testing, the effectiveness of the method in graphic design was examined, aiming to discover new perspectives and tools that simplified the design process and enhanced its quality and efficiency. The study adopts an empirical analysis approach, combining experimental results and qualitative analysis to evaluate the level of alignment between generated images and natural language descriptions, image quality, flexibility, and controllability of the method. By utilizing these evaluation criteria, the researchers can determine the method's effectiveness and better fulfill the requirements of designers. Future research directions include enhancing algorithm diversity and creativity, as well as exploring more intelligent graphic design tools to improve the efficiency and quality of designers' work.
artificial intelligence technology; graphic design; natural language description; image generation
TB482;J511
A
1001-3563(2024)04-0226-09
10.19554/j.cnki.1001-3563.2024.04.024
2023-09-25
河南兴文化工程文化研究专项项目(2023XWH250)