【摘要】艺术创作是艺术工作者展示艺术技能和技巧、抒发情怀、表达感情、实现创意的主要途径。传统的艺术创作方式和手段由于其诸多的局限性,不能够充分实现艺术家的创意和构想,而人工智能技术的发展和应用为艺术创作提供了新的方法和思路。生成式人工智能(AIGC)艺术是信息科技与艺术深度融合的产物,已成为当下流行的一种艺术创作的新模式。本文首先阐述了AIGC的逻辑内涵,指出AIGC逻辑内涵是人工智能艺术机器深度学习的理论框架,可以帮助艺术家更深入地理解和掌握AI艺术创作的内在规律。接着阐述了prompt语义要素的指标特征,阐述了prompt语义分析能够帮助艺术家解析和理解AI艺术创意和创作引导,完成AI艺术的创作过程。然后本文通过AIGC在绘画、音乐、动漫、影音等艺术创作中的分析研究,揭示了prompt语义要素与AIGC艺术创作中的促进作用和互动关系。本研究对于推动人工智能与艺术的深度融合,促进艺术领域的创新和发展具有重要意义。最后,展望了AIGC赋能下艺术创作与实践的发展方向。
【关键词】生成式人工智能;AIGC逻辑内涵;prompt语义要素;互动关系;艺术创作
【中图分类号】TP18;J0 【文献标识码】A 【文章编号】2097-2261(2023)26-0054-04
一、引言
艺术创作是人类精神文化的重要活动,是人类欣赏美、创造美、表现美的重要形式,也是人类情感表达和交流的重要方式。近年来,人工智能(Artificial Intelligence, AI)的快速发展使其在艺术创作领域表现出了巨大的潜力和影响力。人工智能生成内容(Artificial Intelligence Generated Content, AIGC)作为AI在艺术创作中的重要应用之一,通过机器学习和大数据分析等技术手段,使机器(计算机)能够像人类一样创作出绘画、音乐等艺术作品。AIGC的创作过程涉及两个重要的要素:AIGC的邏辑内涵和prompt的语义要素。本文通过分析AI艺术创作的过程、prompt对AIGC创作的影响以及两者之间的互动关系,可以深入理解AIGC的特有价值和独特作用,同时也能充分认识到其局限性,也揭示出AIGC在艺术创作领域所面临的挑战与未来的前景。
二、AIGC及其逻辑内涵
(一)生成式人工智能是艺术创作的新型式
AIGC是利用人工智能技术来生成内容[1],被认为是继专业生产内容(Professional Generated Content,PGC)、用户生产内容(User Generated Content,UGC)之后的新型内容创作方式。在艺术创作领域,AIGC能够自主生成绘画、音乐、动漫、影视等各种形式的艺术作品,AIGC的核心特征是其创作过程的自动化和智能化,通过机器学习、深度学习和生成模型等技术,AIGC能够从大量的数据中学习并生成各种形式的艺术作品,如绘画、音乐、动漫视频等。
(二)AIGC的逻辑内涵
AI艺术创作中的AIGC逻辑内涵是指AIGC创作中的逻辑规则、算法模型和自我学习能力。它不仅能够基于大数据进行分析和模式识别,还通过深度学习和生成模型等技术实现了创作的自动化和智能化。理解AIGC的逻辑内涵对于揭示其艺术创作过程和生成作品的特点具有重要意义。
1.AIGC是数据驱动下的创作过程。
AIGC的训练过程主要依赖于海量数据的“投喂”,通过对大规模数据集的学习,AIGC能够捕捉到“投喂”艺术作品中的模式、风格和特征,并在生成过程中进行模仿和创新。数据驱动的创作使AIGC能够从“投喂”的艺术作品中获取灵感,并将其融合、转化为新的创作内容。
2.AIGC的核心是机器深度学习的规则和算法。
AIGC的创作过程包括生成对抗网络(GAN)、变分自动编码器(VAE)、递归神经网络(RNN)和深度卷积神经网络(DCNN)等一系列的规则和算法[1]。这些深度学习模型在艺术创作中被广泛应用于生成图像、音乐、动漫视频等类型的内容。深度学习算法在AIGC创作中发挥着重要作用,通过多层次的神经元网络模拟人类的认知和创造过程,实现对艺术创作元素的理解和创建。
3.AIGC能够自我学习和迭代进化。
AIGC通过引入反馈机制和迭代训练,可以根据创作结果满意度进行自我调整和优化。它能够累积成功和失败的经验并从中进行学习,逐步改进生成的作品。这种自我学习和进化的过程使得AIGC具备了适应性和创新性,能够不断改进和提高创作水平,从而不断探索新的艺术形式和创作风格。
4. AIGC具有解释和阐述艺术作品的能力。
人工智能通过结合AIGC和自然语言处理( Natural Language Processing, NLP),可以对作品进行文字描述、背景释义和情感表达。这在很大程度上增强人们对作品的理解,使AIGC生成的作品更具有艺术性和情感共鸣。
三、Prompt语义要素
(一)AIGC中的prompt语义含义
在AIGC艺术创作中,创作工具就是在网络计算机上运行的人工智能机器人(AI Robot),是一种自动化的软件代理[2]。通过创作者与机器人的交互对话来实现创作过程。这种交互对话的语言就是提示语(Prompt)。生成高质量艺术作品的关键是创建prompt对话的精准性,通过对prompt的精准语义分析和把握,合理设计和编写prompt来引导深度学习模型生成高质量的艺术内容。
Prompt作为AIGC创作的输入“提示语”,通过“指令”形式表达了艺术创作者的创作目标和创意思维。通过对prompt的设计和编写,艺术创作者可以传达作品的主题、情感和风格等信息,引导AIGC生成符合作者意图的艺术作品。
(二)Prompt语义的要素构成
1.明确作品的主题和情感的传达
Prompt语义可以确定作品的主题或情感色彩,从而引导AIGC生成与其创意相符的艺术作品。例如,在“Microsoft 必应”的“图像创建器”工具中,通过DALL·E的AIGC工具,输入prompt提示语“请使用水彩画风格为我创造一幅宁静的沙漠日落,让色彩蒙眬而美丽”。通过这个prompt,AIGC生成一幅主题为“沙漠日落”的水彩画,“宁静”“色彩蒙眬”传递出了情感信息。
2.设定作品的风格和表达方式
通过prompt语义特定的词汇、语言描述,能够设定作品的创作风格和表达方式。例如,在“Google MusicLM”音乐生成软件中,输入提示词“An ethereal and slightly sorrowful neoclassical music to express the transience of life and the passing of time”。软件会生成一首描述“空灵而略带哀伤”的“新古典主义音乐”,表达了生命的短暂和时间的流逝。
3.规定作品的创作方式和条件限制
艺术创作者可以通过prompt语义中的提示和要求来限定AIGC的创作范围和方式。例如,在百度“文心一言”中,分别输入提示词“帮我画一个玩电脑的李白,扁平插画,可爱Q版”和“帮我画一个玩电脑的唐朝诗人李白,扁平插画,可爱Q版”,生成的画面区别是前者是一个“现代人”形象,后者因为限定了“唐朝诗人”,是一个“古代人”形象。
四、AIGC在不同艺术领域中Prompt语义要素的特点
在AIGC艺术创作中,不同的创作领域都有其对应的prompt语义设计和描述要求,这些prompt语义要素的特点和作用也各有不同。
(一)图像创作中prompt语义的特点
在图像创作领域中,prompt语义通常是用于描述图像生成条件和要求的文本。图像生成模型会基于这些prompt语义要素生成相应的图像。Prompt语义要素通常包括图像类型、图像特征、图像风格、图像细节等方面的描述。
1.关键词选择是重中之重。Prompt中的关键词对于图像生成的结果有着至关重要的作用,不同的关键词选择会导致完全不同的图像生成结果。
2.图像语义需要准确表述。Prompt中的语义信息应该准确地描述所需生成图像的内容,否则会导致生成的图像与预期的内容不符。
3.把握图像视觉效果的可控参数。Prompt中可以加入对于生成图像视觉效果的参数设置,如对颜色、对比度、纹理等的要求,从而增强生成图像的可控性。
4.增加视觉场景的灵活可变。Prompt中可以添加对于生成图像视觉场景的特定描述,如场景的时间、地点、环境等信息,从而使生成图像的视觉场景更加多样化。
例如,在Midjourney的AI圖像创作软件中创作一幅图像作品,输入“From the first perspective,a little boy runs towards you in surprise,opens his mouth,full-body picture,behind him is a dreamy animation world,high-definition characters,blurred background,Pixar style,--ar 16:9”提示语,生成一幅皮克斯风格的16:9画面图像,以第一视角,一个全身画面的小男孩惊喜地向你跑来,张开嘴巴,身后是一个梦幻般的动画世界,模糊的背景。提示语中,对于画面风格、分辨率、镜头关系、角色表情、背景内容都进行了描述。
(二)音乐生成中prompt语义的特点
在音乐生成应用领域中,大多数AIGC软件都是通过调整控制参数来实现,prompt语义是通过这些参数来定义和引导音乐的生成。参数化的prompt语义通常包括音乐类型、音乐风格、音乐节奏、音乐主题等方面的控制。与图像不同,音乐的生成更加依赖于音乐理论和感性体验,因此prompt语义需要更加注重音乐素材(旋律、节奏、和弦等)的语义相关性,以保证生成的音乐作品符合音乐理论和审美标准。
具体来说,音乐生成的prompt语义要素涵盖以下方面的内容:
1.旋律。旋律是音乐中最基本的元素之一,prompt语义需要引导AIGC生成符合旋律特点的作品。
2.节奏。节奏是音乐中表现节奏感和节奏美感的元素,prompt语义需要指导AIGC生成符合节奏感和节奏美感的作品。
3.和弦。和弦是音乐中表现和声美感和和声关系的元素,prompt语义需要指导AIGC生成符合和弦特点和和声美感的作品。
4.风格。音乐的不同风格有着不同的音乐特点和审美标准,prompt语义需要指导AIGC生成符合不同音乐风格的作品。
5.情感。音乐是一种表达情感和情感体验的艺术形式,prompt语义需要指导AIGC生成符合情感特点和情感体验的作品。
通过合理的prompt语义设计,可以实现高质量、多样化的音乐生成。例如,在Mubert Inc(https://mubert.com/render)中,创作一首音乐作品,输入一个描述“情绪、持续时间和节奏”的提示语 “Upbeat electronic music, with a fast tempo, creates youthful energy and a vision of the future”,软件会生成一首描述“欢愉的,富有青春活力”的快节奏“电子音乐”,表达了对未来的美好憧憬。
(三)动漫视频生成中prompt语义的特点
在动漫视频生成应用领域中,prompt语义通常需要描述动漫视频生成条件和要求。一般包括视频类型、视频风格、视频剧情、视频特效等方面的描述。与图像生成、音乐生成等应用领域相比,动漫视频生成对prompt语义的要求更为复杂和严格。
1.动漫视频生成需要涉及包括视觉、配音、剧情等多个层面的prompt语义,因此,语义的设计需要综合考虑这些不同层面的信息。
2.动漫视频生成需要在时间维度上进行控制,prompt语义设计需要考虑到时间序列的因素,包括场景切换、镜头切换、音效等。
3.动漫视频生成需要保持一定的连贯性和逻辑性,prompt语义设计需要注重前后衔接,保证动漫视频的整体流畅性和故事性。
例如,在Pika Labs(https://www.Pika.art)中通过文字生成视频功能,输入提示语“Prompt:A stallion running on the prairie. -ar 16:9 -motion 4 -gs 20 ”,就生成一段“一匹骏马在草原上奔驰”的动画视频,在prompt中,“-ar 16:9”参数表示画面长宽比是16:9,“-motion 4”参数表示产生更大的运动程度,“-gs 20”参数的含义是生成的动画与文本的相关性,值越高相关性越高。
五、存在的挑战和尚待解决的问题
AIGC逻辑内涵与prompt语义的融合互动在AI艺术创作中具有重要意义,但也面临一些挑战。理解和处理语义要素的复杂性以及与AIGC的有效互动需要进一步的研究和优化。
(一)语义表达的复杂性
Prompt语义要素是AI艺术创作中重要的指导因素,但如何将其准确地传达给AIGC软件是一项挑战。不同的语言具有不同的特点,自然语言的语义多样性、主观性和隐含性使得对prompt的设计和解读变得复杂和不确定。进一步研究如何有效地设计和表达语义要素,以及如何将其精准地传递到AIGC系统的逻辑中,是艺术创作者需要不断研究和学习的问题[2]。网络上出现的“prompt engineering”,就是让AIGC工具使用者更准确地掌握prompt,并把其应用到与AI进行有效沟通所总结出来的系统化知识。
(二)潜在的生成偏差和创造性局限
AIGC系统在生成过程中普遍存在一定的偏差和局限性,导致生成结果与艺术创作者的预期不完全一致。这可能是由于模型的局限性、训练数据的偏差以及对prompt语义理解的不完善所导致的。解决这些问题需要AI程序开发者进一步改进AIGC模型的设计和訓练方法,以及提升对prompt语义的深入理解。这也需要艺术创作者与程序工程师能够达到深度的融合和默契,共同研究解决问题。
(三)创作者与AIGC的磨合与适应
在艺术创作中,艺术创作者与AIGC软件之间的磨合至关重要。然而,如何很好地实现艺术创作者与AIGC的有效互动、引导和调试生成过程,仍然具有一定的挑战。需要开发更智能、灵活和界面友好的AIGC工具,以促进创作者与AIGC系统之间的创造性合作,使艺术创作者能够更好地表达其创作意图和审美观点。
六、结语
AIGC逻辑内涵作为AI艺术创作系统的核心,通过学习和模仿人类创作规律和风格,可以生成具有独特性的作品。而prompt语义作为指导性因素,引导AIGC系统在生成过程中理解和表达艺术创作者的意图和审美要求。两者的互动共同推动了AI艺术创作的创新性和多样性。
然而,AIGC逻辑与prompt语义的互动面临着一些挑战,如语义表达的复杂性、生成偏差和创造性限制,以及人类与AIGC系统的协作融合。同时,我们也看到了AIGC逻辑与prompt语义的互动给AI艺术创作带来巨大的潜力和广阔的前景。让AI技术成为艺术工作者的得力助手,需要进一步研究和探索AIGC逻辑与prompt语义的互动,改进和完善深度学习算法和内容生成式模型,通过充分理解和合理应用,从而进一步提高艺术作品的质量和创造性。推动AI技术与艺术的深度融合,将为艺术创作领域带来新的突破和创新。
参考文献:
[1]翟尤,李娟.AIGC发展路径思考:大模型工具化普及迎来新机遇[J].互联网天地,2022(11):22-27.
[2]胡越,罗东阳,花奎,等.关于深度学习的综述与讨论[J].智能系统学报,2019,14(01):1-19.
[3]赵京胜,宋梦雪,高祥.自然语言处理发展及应用综述[J].信息技术与信息化,2019(07):142-145.
[4]牟怡.智能传播场景中的“真实”再定义[J].人民论坛·学术前沿,2020(18):112-119.
[5]您的人工智能通信指南[EB/OL].https://learnprompting.org/zh-Hans/docs/intro.
作者简介:
姚建东(1969.2-),男,汉族,山西临猗人,硕士,内蒙古艺术学院网络信息中心,副教授,研究方向:现代教育技术、数字媒体技术、计算机网络。