从文学到代码:人工智能编剧的创作逻辑与应用前景

2024-02-06 05:35
现代电影技术 2024年1期
关键词:创作传统

孟 可

北京师范大学艺术与传媒学院,北京 100091

人工智能(AI)作为一种用于精妙模拟和延伸扩展人类智能的技术及应用系统,其目标是使机器能够胜任通常需要人类才能完成的复杂工作。当前的生成式AI 系统在执行短期任务方面表现出色,而利用AI 模型生成构思完整、规划严密的长篇故事和影视剧集则将具有更广泛的应用前景。从20 世纪80年代开始,AI 便已介入故事叙述,在经历了超文本、计算机互动戏剧等一系列AI 叙事的发展,与2010 年代计算机视觉(CV)、深度学习(DL)等技术的崛起后,当前影像艺术正身处这个“试炼场”[1]的漩涡中心。面向技术,有学者提出疑问:“ChatGPT 来了,我们离AI 生成电影还有多远?”[2]。2023 年7 月,一部由AI 执导的《南方公园》剧集给影视行业带来巨大震动,引发了业界关于多智能体模拟、AI 编剧等话题的热烈讨论。本文以Showrunner AI 技术创作的《南方公园》剧集为引,深入探析AI编剧的创作逻辑及其在影视制作中的应用前景,希望为我国影视产业“从文本到代码”的未来探索提供借鉴。同时,本文还将比较AI 编剧与传统编剧,对传统编剧的创作主体性进行反思,以期为影视产业的创新和发展带来更多可能性。

1 数据驱动的未来影像

1.1 人工智能编剧:自然语言处理(NLP)、深度神经网络(DNN)与超级剧本

1973 年,影片《西部世界》虚构了一个供机器人生存的巨型高科技乐园,而在2023 年4 月,电影走进了现实:斯坦福大学和谷歌的研究者构建出了一个能够让25 个AI 智能体(Agent)在其中生存、进行复杂行为的虚拟小镇,在这个数字化的沙盒“西部世界”中,每个智能体都有其独特的背景与个性,进行着自己的社交、工作、休闲行为[3]。这场实验不仅在游戏领域引起轰动,同样受到了影视行业研究者的关注。Fable Studio以此为灵感发布了名为“SHOW‐1”的节目统筹智能体(Showrunner),并制作出了新一部的《南方公园》。在这一集中,AI 完成了从编剧、导演到配音、剪辑的全部流程,而观众只需要输入一句话便可以生成自己的《南方公园》影片(图1)。

图1 AI制作的《南方公园》剧集

与人类艺术创作基于生活经验、感性体验和情感认知不同,AI 的艺术创作基于算法技术和数据分析,通过学习和推理来进行机械、客观的创作行为。现阶段,AI 进行故事生成的方式包括基于关键词生成故事、故事对话生成、基于大数据生成故事、故事情节生成等,这些数字化、自动化的创作方法通过模拟人类思维进行类人化剧本写作。

基于关键词的故事生成方法利用自然语言处理(NLP)技术自动构建包括背景、人物和情节等故事要素,并通过数据挖掘提取实体信息,搭建庞大的语言模型与知识图谱。在理解信息的基础上,AI 根据输入关键词查找相关词汇、短语和语法结构,快速生成独特故事。生成对话形式的故事作为构建故事情节的一种方法,通过模拟多个角色之间的交互对话,展现了其在解决语言连贯及自然性方面的特长。在这一领域,AI 还采用了序列到序列(Sequence‐to‐Se‐quence)模型。通过对模型进行训练,使其具备预测下一个对话轮次可能性的能力。对话生成任务可视为一个序列到序列的问题,即在结合上下文情况下生成下一个对话轮次,最终生成与之相一致的故事结局序列[4]。

然而,鉴于自动化程度相对较低,上述两种AI故事生成方法在故事架构和情节编写方面更适用于教育、广告、游戏等简易场景。为使其适应电影、剧集等具备戏剧性和文学性的应用场景,研究者对AI 编剧提出了更为严苛的创作要求。基于大数据的故事生成方法运用多层神经网络模型对海量文本进行深度学习与分析,借助文本挖掘技术提取关键人物、时间地点等核心要素,为故事生成奠定基础。相较于基于大数据的故事生成侧重于海量数据学习,AI 故事情节生成更重视模拟人类思维与逻辑,对人类创作经验与规律进行深入剖析与概括,进而推断出逻辑通畅、架构完整且内容丰富的故事情节。

要在创作中收获一部引人入胜的作品,仅依赖完整的架构和丰富的情节是远远不足的,“戏剧性”一直是AI 编剧创作道路上难以跨越的瓶颈。“戏剧性”要求编剧在场景之间进行情绪铺垫、构建悬念、实现逆转等处理手法,这种效果难以直接被提示链(Prompt Chaining)大模型所吸收。然而,在《南方公园》样片中,观众惊喜地发现传统编剧技巧中的悬念、突转、延宕等戏剧性桥段以及松弛有度的叙事节奏已被AI 编剧所吸收,这意味着AI 生成的不再仅仅是故事本身,而是一个包含了多种编剧手法的“超级剧本”。Fable Studio 在最新的文章中揭示了这种能够初步制造“戏剧性”的AI 制作流程[5]:首先,故事系统在获取了包含主题、梗概以及模拟时间内主要事件的高层次构思基础上,利用模拟数据作为提示链的一部分,自动推断出多达14 个场景;其次,剧务系统负责为各个场景挑选合适的角色,并依据情节模式推进故事发展,每个场景均与一个情节字母(如A、B、C)相对应;随后在影像生成中,编导系统会交替运用不同的角色组合,跟踪他们各自的故事进展,以维持用户的关注度;最后,在舞台系统和人工智能摄像系统的协同作用下,场景将按照预设的情节模式(如ABABC)有序呈现。尽管整部影片观看下来,场景之间的切换尚不连贯,有些甚至稍显生硬,但这一探索仍为AI 编剧领域提供了重要参考,概念性地展示了生成式大模型(Large‐scale Generative Models)对于“娱乐”的更深层理解,这有助于突破“戏剧性”瓶颈,进一步提升AI创作水平。

1.2 创作逻辑的转向:从单向度的统筹行为到多向度的生成行为

相较于传统编剧,AI 编剧在创作方法上整合了文学、戏剧、电影、游戏及互动作品等多种叙事体裁,形成了独特的创作思路。这使其运作的底层逻辑从传统的单向度统筹行为转变为多向度生成行为,为多样化的叙事效果提供了技术基础。

在传统编剧的创作过程中,线性思维模式占据主导地位,即依照时间顺序逐层展开故事情节。此过程涵盖了对整体故事的全局性规划与设计,其中包括角色设定、情节推进以及主题呈现等关键环节。此类规划与设计可视为一种单向度的统筹行为,即编剧从整体出发,逐步深入至故事的部分细节。从全局规划层面,传统编剧遵循线性思维模式,让情节、角色与主题在时间轴上呈现出层次分明、逻辑严密的态势。在情节构建层面,传统编剧也是依据线性思维模式,即编剧需要在构思上一个情节环节的基础上,方能创作出下一个环节。尽管有时在创作初期,编剧可能抱有特定的结局设定,如悲剧或喜剧,或者因为事先想到某个场景或桥段而促成整个故事的构建,但在整体思路上,仍然遵循“因果”关系进行情节推进。即便在实际写作过程中,编剧可能会根据正在创作的部分调整前文内容以增强连贯性,但整体写作依然是区块与区块的相对统筹,流程呈现为“螺旋线”状顺序展开(图2)。

图2 传统编剧的创作思路抽象图

与传统编剧相较,AI 编剧的显著区别在于其采用空间性思维。通过运用生成式对抗网络(GAN)与提示链等先进技术,AI 编剧能够同时处理多个情节线索、角色发展以及主题呈现,展现出传统编剧前所未有的创作能力。在这个过程中,AI 编剧创作的底层逻辑不再是单向度的统筹行为,而是多向度的生成行为。

生成式对抗网络(GAN)在AI 编剧领域的应用,为实现高质量、多样性和定制化的故事情节创作提供了可能性。GAN 是一种“博弈”式的网络模型,其通过两个相互对抗的神经网络(生成器和判别器)生成文本等数据[6]。生成器(Generator)负责从随机噪声中生成故事片段,判别器(Discriminator)则负责判断生成的故事片段是否达到预期的质量。在获取文本数据的训练集后,AI 编剧会构建GAN 模型,其中,生成器生成连贯的故事情节或对话,判别器则评估生成的内容是否具备逻辑合理性和趣味性。AI 编剧利用采集的数据对GAN 模型进行训练,根据先前的提示,生成器概率性地生成后续情节,判别器则会评估生成的内容。根据评估结果,AI 编剧会调整生成器和判别器的参数,以优化生成的内容,使上下文具备基本逻辑(图3)。

图3 神经符号性故事生成系统架构①

Fable Studio 认为,当前大语言模型(LLM)训练的只有角色、对话行、短场景标题与最终的剧本,整体剧本仍然显得初级与粗糙,时间、角色情感状态、作品主题、导演笔记等详细信息均未得到体现。而在《南方公园》AI 项目中,这一问题利用提示链技术得到了初步解决。提示链作为一种典型的提示交互协同形式,将原有需求分解,相互关联多个提示(Prompts)数据点,形成一个有序的链式结构,共同解决一项复杂任务[7]。为了训练SHOW‐1 这样的AI 编剧模型,研究者透露,首先需要收集足够的数据点,其中提示数据点可以是用户“一句话”式的初始意图,也可以是一个已经生成的剧集作品。通过仿真,AI 编剧从用户的输入和模拟的代理中连续地收集、处理、链接数据点,随着时间的推移与事件的创建,一个具有完整季节弧线、背景故事、日常生活、角色个性的虚拟世界得以构建出来。同时,角色、背景等元素也会基于用户反馈或创作方向的变化而不断变化,比如《南方公园》中的角色Cartman 在反馈与调整中展现出害羞和天真的特性。这种与SHOW‐1 模型互动和微调的反馈循环可以促进新内容的产生,实现“实时剧本”的惊人跨越。

可以看出,AI 编剧进行创作时,剧本元素并非如传统编剧创作逻辑那样逐步、逐层浮现,而是相互交织,以一种“块茎”式的空间网状结构迅速生成(图4)。最终故事的诞生也非传统意义上的“前文总结‐最终得出”,而是结合上下文,通过“由点到体”的扩散膨胀方式实现。这一点也体现在SHOW‐1 项目的口号中——“一句话生成你自己的《南方公园》”。

图4 AI编剧的创作思路抽象图

2 人工智能技术赋能下的传统编剧转型

2.1 人工智能技术的艺术创造力

2023 年11 月8 日,长达118 天的好莱坞编剧大罢工终于在“达成初步协议”的结果中落下帷幕。在此之前,AI 音乐制作、AI 图片生成等AIGC 的席卷就已经给艺术从业者带来了技术恐慌,他们担忧AI 会使艺术失去其独特的创造性。列夫·马诺维奇(Lev Manovich)与埃马努埃莱·阿列利(Emanuele Arielli)在《人工智能美学和创造力的人类中心主义神话》中指出“创造力”一词具有人类中心主义倾向,而这“最后或许会影响到我们对人类智能本身的理解”[8]。面对AI 在创作领域的涌入,在表达态度、转变身份之前,人们需要对“创造力”进行重新审视。

首先,创造力是否为人类所独有?抵制者往往认为,AIGC 并非“创造”而是“仿制”,具有自我意识的人类精神才是创造中不可缺少的一环。但也有人提出异议,他们认为在“物质转向”思潮下作为“活的有机体”[9]的技术同样具有创造力,任何随机的、意料之外的过程都应该被看成是创造性的,而艺术则是在此基础上增加了美学维度,即随机结果令人感到赏心悦目。当然,科学技术哲学家也给出一个较为中和的答案,即“技术在经由人类精神支撑,通过动机以及意志的抉择才能引发真正的创造力”[10]。

其次,创造是否也是一种“程序”?心灵计算理论(Computational Theory of Mind, CTM)作为AI 的理论基础,认为大脑是一台信息处理机器[11]。哲学家路德维希·维特根斯坦(Ludwig Wittgenstein)提出了图灵测试(Turing Test)的另一种视角:这不是一个检验机器是否能够骗过观察者,让人类以为它是真人的方法,而是一个考察人类的行为和理解究竟在多大程度上“机械化”的测试[8]。图灵测试在历史上曾多次被通过,如象棋、围棋、交谈等,每当AI技术达到一个类人进程中的里程碑时,人们便会开始反思人类这种行为背后的底层逻辑——一项项原本被认为具有自主性的人类行为在AI 的介入下展露了“机械化”的一面。现阶段,艺术创作正处在被审视的中心。对于编剧而言,创造力无疑是坚实有力的武器,但是当回顾创作过程时,人类编剧们不难发现,剧本写作也是一种机制(Machanics),编剧大师罗伯特·麦基(Robert McKee)认为“故事并不是凭空产生的,而是脱胎于已经在历史上和人类经验中存在的素材”[12],“剧本节拍器”(Script Metronome)、“普罗普结构”(Propp)等的出现为编剧们提供了可靠的程序参考。

艺术的发展离不开对传统观念的挑战,而突破创造力人类中心主义的藩篱正是当下面临的关键一步。在数字化背景下,艺术家们日益意识到,仅以人类自我为中心的创作思维已经无法满足媒介融合的需求,而采用功能主义的视角既会限制技术的可能性,也会阻滞人类最终的解放[13]。对于“创造力”的反向思考提供了独特的机会来深入探讨人类与AI的关系,并促进传统创作者对自身在“人机协同”发展中的身份进行重新定位。

2.2 作为“艺术指导”的传统编剧与人机协同创作新模式

事实上,在AIGC 强势发展的背景下,传统创作者对新兴技术的恐慌源于主体危机。为应对这场前所未有的“海啸”,传统编剧亟待重塑自身身份。回看传统画师与AI 绘画的斗争历程,传统编剧或可从中汲取有益启示:部分画师成功发掘出作为人类创作者的独特价值,也有部分画师作为“训练者”成为了“能开汽车的曾经的马车夫”。从AI绘画的历史经验中可以看到,在这场不可逆的发展中,人类创作者从未停止寻找新身份的可能——在影视领域,传统编剧的角色也将从“创作者”转变为“艺术指导”。

在“艺术指导”这一角色中,传统编剧需要运用训练、审判和评估三个方面的技能。首先,在训练方面,编剧应具备对海量优质故事素材进行分类和标注的能力,以便AI 学习不同类型故事的叙事特征和创作规律,适时调整AI生成故事模型的参数,如学习率、隐藏层大小、优化器等,使其创作出的故事更符合剧本创作的要求。其次,在审判方面,编剧需对生成情节的逻辑进行审视,确保上下文流畅连贯,角色性格、动机和成长符合故事背景和主题要求。同时,在个性化定制作品中,还需对文化背景、主题内涵、艺术审美进行审判,使之与用户需求保持一致。最后,在评估方面,编剧需要分析当前市场的需求和趋势,了解目标群体的口味和喜好,不断调整、训练新的AI 编剧模型,以创作出更符合市场需求和观众口味的多样化作品,避免审美单一、效率低下的传统评估模式[14]。

随着角色身份转变的还有创作模式的转型。作为AIGC 发展的命脉,“人机协同”将成为数字时代重要的工作方式,并体现在三个维度:第一,工作形式从单独创作转变为团队协作。过去,传统编剧通常独立完成创作后才与其他工作者合作,耗时较长,然而在AI 编剧的介入下,他们会与数据科学家、AI 工程师等其他工作者更加紧密地合作。第二,工作逻辑从线性创作转变为非线性创作。AI 编剧的空间性创作逻辑能够辅助传统编剧以非线性思维构建不同的情节线、角色和事件,并利用算法模型来选择和组合这些元素,以生成更加丰富的情节与更加复杂的叙事。第三,工作成果从单一输出转变为多元输出。传统编剧只能将故事转化为文字形式呈现给读者或观众,然而随着大语言模型(LLM)与扩散模型(Diffu‐sion Model)的联合使用,剧本或许将会在图片的连续生成与视频的播放中同步浮现。

当然,正如前文所言,技术的创造力必须由人类的精神作支撑,在这个与机器和谐共生的环境下,即使与AI协同创作,传统编剧也需要保持作为“人类创作者”的独特性,即文化角色的最终表达。虽然AI可以模拟人类的情感反应,但是只有人类本身才能够更深层次地理解角色的情感,真正创作出兼具深度与真实度的作品。另外,想要AI 创作出具有个人风格的故事必然需要获得传统编剧的支持。在传统编剧的提示、训练、选择与反馈中,作品方能在最终形成统一的语言特点和美学风格。

3 人工智能编剧的未来创作新趋势

3.1 “节拍器”的进一步构建

虽然SHOW‐1 项目已经在“戏剧性”的营造上进行了初步尝试,但是对“戏剧性”的根基,即节奏的把控,依然是AI 编剧创作时的盲区。这导致了即使故事本身已经足够情节丰富,但是仍会让观众在观看过程中产生疲惫、焦虑或乏味的负面感受。当然,剧本的“节奏”并非无迹可寻,而构建与优化AI 编剧的“节拍器”算法,将成为AI 构建继幕、序列、场景之后的下一步工作。

罗伯特·麦基(Robert McKee)在《故事》中将一个完整的剧本分解为从故事到节拍共5个层次,一个故事大约会包含1~3 幕、2~5 序列、40~60 场以及若干节拍。其中,节拍作为最小的结构成分,是指动作或反应中一种行为的交替。这些变化的行为构筑了场景的转折,变化时间的长短、幅度的大小决定了剧本的基本节奏。动作小节拍可以串联成情节大节拍,最终形成规律的节拍器,指导编剧将简单的故事编写成跌宕起伏的剧本。纵然不同编剧心中的节拍器各不相同,但是大体结构趋于一致。运用剧本节拍器能够协助编剧把握悬念的释放时机、适时延缓剧情的发展、制造突如其来的转折,将人物情感、角色动作、具体事件等元素错落有致地编排在一起,形成张弛有度的节奏——而这就是戏剧性的来源。

AI 编剧在进行《南方公园》剧集创作时最多可以生成14 个场景,通过剪切再穿插的方式模拟出戏剧性的效果,但是仅仅使用这种方式进行创作,“戏剧性”的出现将会如“猴子打字机”一般属于偶然事件。为了稳定、流畅地生成出具备起承转合、张弛有度的故事,传统编剧作为艺术指导可以通过训练让AI 编剧构建可靠、适用的节拍器,帮助其在剧本生成的过程中及时评估情节节奏,以进一步提高模型的质量。

3.2 皮格马利翁效应(Pygmalion Effect)下的个性化定制

在当今信息爆炸的时代,人们对内容的需求日益多样化,个性化定制已成为满足这一需求的关键。AI 编剧凭借其强大的数据处理和智能分析能力,能够精准地捕捉到观众的文化消费习惯和心理需求,为每一位观众量身定制独特的故事情节和角色设定。

事实上,人们通常认为,艺术品的价值很大程度上取决于是否满足观众的意向投射,在欣赏作品中,观众并非被动接收者,同样也发挥着自身的主观能动性。意向投射是指观众在接触艺术作品时,根据自己的生活经验、价值取向、审美倾向等,对作品进行解读和赋予意义的过程:他们以自身的情感赋予作品人物的性格与内涵,使人物行为具有多样化的诠释空间,又将作品中的各种元素(如形式、色彩、文字等)加以整合[15],形成对作品的独特理解和把握。这就解释了为什么“一千个读者就会有一千个哈姆雷特”。在这个过程中,艺术品的“灵魂”是双向流动的,即艺术家通过作品表达观点和情感,观众根据理解和感受与艺术家进行交流。随着比特(Bit)打造的数字环境愈发精细与多样,数字时代人们的审美观念出现了虚拟化倾向,虚拟角色承载了观者的自身意志与个人欲望[16],相比于拥有意识与瑕疵的真实人物,更能够满足每个观众的个性化需求。

追求意向投射的观众正如皮格马利翁,更能够爱上代表着自身情感与理想的少女雕塑,在AI 编剧的帮助下,每个人都将成为独一无二的艺术家,将自己的想象和向往赋予独属于自己的“少女雕塑”。AI故事生成技术提供的个性化故事定制服务,可以精准满足人们的精神需求,使意向投射变得更加丰富和多元。无论是追求浪漫爱情、冒险刺激,还是寻求慰藉与启迪,AI 编剧都能量身定制出符合内心期望的情节。值得期待的是,在AI编剧的助力下,人们还可以跨越时空、虚实,与不同背景、不同年代的角色共同进行故事冒险,《西部世界》里的高科技乐园将在计算机里真正照进现实。

3.3 跨媒介的多元融合

从《南方公园》剧集的“一键生成”中可以初见端倪,在未来,剧本的呈现方式将发生重大变革。传统的剧本主要以文本形式呈现,存在于排演与拍摄之前,是故事创作流程中不可或缺的一环(图5)。然而,随着AI 技术的快速发展,尤其是大语言模型(LLM)与扩散模型(Diffusion Model)的迭代赋能,电影创作流程将发生颠覆性的改变。在AI故事生成与电影虚拟制作的技术结合下,编剧、设计、导演、摄影、特效、配音、剪辑等工作模块从传统的线性流程变为同步进行[17],届时,故事将在被观众看到的那一刻才开始出现,并在叙述过程中生长完整(图6)。

图5 电影传统创作流程

图6 AI编剧与虚拟摄制结合后的电影创作流程

基于此,AI 故事生成技术还可以与VR 影像跨媒介融合,剧本、图像、音频、视频的同步生成效果将在360 度的影像空间中大放异彩,在实时生成与实时交互中极大地拓宽观众对故事的感知边界,应用于电影这一重要的高端领域[18]。

AI 编剧可以根据观众的需求和兴趣,创作出适合VR 影像的故事情节,并结合高拟真度的虚拟场景与个性化定制的虚拟角色,为观众量身打造VR 沉浸体验。同时,在AI 技术的支持下,VR 影像能够实现实时的交互式叙事。“VR 影像叙事可以利用深度学习技术,分析观者在看到某些故事情节时的反应数据,据此设置出针对不同反应类型的多种叙事方法,从而引导观者进入不同的故事发展方向,增强VR 影像的交互性与丰富性。”[19]跨媒介的多元融合还将促进如空间位置叙事、基于视听与触感[20]的立体叙事等全新叙事方式的诞生,为观众提供前所未有的观影体验:在追踪技术锚定观众在VR 空间中的位置后,AI 编剧可以根据方位、朝向来实时生成画面内容,让观众获得真正的故事参与感;通过AI故事生成技术,VR 影像还可以根据观众的动作和情感变化来调整听觉和视觉元素,将视听体验带入叙事之中,为观众营造更逼真的环境。例如,有些观众在看到恐怖或刺激镜头时会害怕地闭眼或转头,从而错失部分情节和细节,这时AI 编剧可以通过增强听觉信息来代替视觉信息,以维持观众内容接收的连贯性与完整性。

4 结语

随着AI技术的迅猛发展和AIGC 的逐步应用,可以预见未来剧本的创作方式与呈现形式都将发生重大变革,这是大科学时代学科和技术交叉渗透与融合发展的要求,也是我国影视行业的一次重大机遇。当然,机遇与挑战并存。面对AI编剧的发展,传统编剧不仅需要深入理解技术的创作原理,进行科学实操,还需要了解如何利用技术来增强艺术效果,而非被技术所缚。在“人机协同”的创作模式下,兼具技术与艺术素养的传统编剧将作为新型创作人才,更好地发挥自身的文化角色。此外,在积极推动AI 故事生成技术发展的同时,研究者还需关注其在伦理、版权等领域的潜在挑战。积极应对挑战,才能够充分挖掘AI编剧的潜能,缔造健康、有序的“科艺交融”可持续发展生态环境。

注释

①图片来源:https://www.psyxel.com/mark‐riedl‐intro‐ai‐story‐generation/。

猜你喜欢
创作传统
咱也过回『创作』瘾
饭后“老传统”该改了
亚岁送鞋的传统
《如诗如画》创作谈
同样的新年,不同的传统
老传统当传承
《一墙之隔》创作谈
口耳相传的直苴赛装传统
“竹”的传统与创新
创作随笔