人工智能叙事在影视和游戏行业的应用模式

2019-09-10 07:22周飞

周飞

摘 要:随着人工智能的发展,基于智能机算、大数据、机器学习的人工智能算法正在挑战“讲述精彩故事”的艰巨任务。人工智能正在被广泛应用到影视和视频游戏等媒体娱乐行业中,挑战和协助“故事讲述者”的身份。本文基于对人工智能叙事在影视和游戏行业中的应用研究,提出三类主要应用模式:人工智能识别故事和情感模式并辅助和评估叙事、人工智能静态故事生成系统、基于人工智能的动态交互式叙事。本文分析了这三种模式的内在原理和应用场景,并提出了对未来发展方向的展望。

关键词:智能计算;人工智能叙事;情绪弧线线;交互式叙事

一、引言

讲述故事是人类进行相互交流,娱乐和教导的重要组成部分。一个普通人每日可能会讲几十个故事:在餐桌旁分享经验的故事;通过寓言教导价值观的故事;通过新闻传播重要事件,以及娱乐电影,小说和电脑游戏故事的乐趣。故事也激励人们学习,这就是为什么“讲故事”在学校或工作中构成培训场景和案例研究的支柱。在机器学习算法和大数据高速发展的今天,人工智能,可以以不被人注意到的方式提高日常生活、工作中的效率。同时,人工智能的发展开始引发一些社会焦虑[1],即人工智能正在取代人类的工作。那么人工智能在一直以来被认为是无法取代人类工作的领域——故事创作(尤其是讲一个精彩的故事)的领域是否能够撼动人类无法被取代的地位呢?人工智能叙事通常是指对故事进行有效创造、讲述、理解和回应的智能计算能力。人工智能叙事程序的相关算法研究旨在将叙事智能灌输到计算机中。在这样做的过程中,开发计算性叙事智能的目标是通过真正了解人类的需求,使计算机成为更好的沟通者、教育者、演艺人员以及更能与人类联系的人。超乎很多人的想象,这样的计算机程序已经开始在人们的生活中占据了一定的位置。在媒体和娱乐领域,由于创作者变得更加精明和开放,每天人工智能在内容创建过程中越来越受欢迎,例如借由人工智能将文本转换为视频。像路透社这样的大型媒体公司认识到利用人工智能创造视频的好处,使公司能够以与编辑内容相同的速度制作视频。除了文本到视频之外,不难观察到许多人工智能技术人工智能简化了讲故事的过程,消除了耗费创造力的耗时,非创造性任务。并且,它成为故事讲述者始终如一地达到正确基调并跟上需求的关键工具。尽管有这些好处,人工智能给人类带来了负面的耻辱感和各种各样的焦虑感。人们害怕它将完全取代人类的工作、害怕失业。然而,它正在改变内容创作者的工作方式并且变得更好。

人工智能叙事在影视和游戏行业的应用模式可以划分为以下三类:人工智能作为内容创建(讲故事)的辅助者、人工智能作为叙事者(单向讲述故事)、基于人工智能的交互式叙事。下文将分别进行阐述。

二、人工智能作为影视叙事的辅助者

机器可以与人类一起工作以改善讲故事的过程。这就是让人工智能作为讲故事的辅助者的角色。

(一)让人工智能通过机器学习掌握“情绪弧线”的模型

情绪弧线是指一个故事中随着情节的变化情感起伏的定量图形弧线模型。让人工智能通过对优秀影片故事中情绪弧线线的识别和判断,为人类的故事创作提供有效的指导参考指标,从而优化人类讲故事的流程。

如果将影视故事相关的各项指标统计为量化数据,那么情绪弧线是一项极为重要的量化指标。不夸张的说,情绪弧线是故事的支柱。讲故事的大师从斯皮尔伯格再到皮克斯動画工作室——都擅长引发观众的情感。凭借对观众脉搏的本能阅读,他们调整自己的故事,在关键时刻激起喜悦,悲伤和愤怒等情感。但即使是最好的故事讲述者也会产生不均衡的结果(一些莎士比亚戏剧让观众感到无动于衷或断绝关系)。这种变化的原因是什么?理论上可以认为,一个故事的情绪弧线在很大程度上解释了电影的成败。情绪弧线的想法并不新鲜。每个讲故事的大师都熟悉它们。有些人试图找出最常见的模式。目前好莱坞制片人主导的类型片最流行的弧线遵循“灰姑娘”的模式。由麻烦开始,主角为了实现目标经历了各种阻力和磨难,经过了如同过山车一样的波折后,主角最终实现目标。这样的情绪弧线实际上被市场证明了最能获得观众的共鸣。研究人员回顾了纽约时报的文章,看看特定类型是否更有可能成为该出版物发送最多的电子邮件列表。他们发现,读者最常见的故事引起了强烈的情绪反应,特别是那些鼓励积极情绪的故事。认为电影观众可能以同样的方式回应是合乎逻辑的。

正因为如此,让人工智能识别和判断、乃至创造出基于内容的情绪弧线,成为了此类应用方向的研究重点。

(二)人工智能预测观众参与度

了解故事如何形成是有趣的,但了解我们如何使用这些发现更为重要。特定类型的情绪弧线能够激起观众的反应和参与,特定类型的弧线能够激发更多观众的反应。

麻省理工学院社交机器实验室的团队试图通过分析Vimeo短片数据集的视觉数据来回答这些问题。对于每个故事,团队使用回归模型来考虑弧特征,同时控制对于可能影响在线反应的各种元数据,例如视频长度和上传日期。目标是预测视频在社交媒体上收到的评论数量。在大多数情况下,大量的评论表明观众参与度很高,尽管可能会有一些警告。在一些大型视频网站的如Vimeo分析中,视觉弧线确实预测了观众的参与度,几个家庭的电影产生了更多的观众评论。对Vimeo视频的其他分析揭示了类似的发现,两个故事类型吸引的评论明显多于其他类型。这些故事的最终结果是积极的情绪爆炸。主要区别在于故事在大结局之前涉及从负面到正面的更多情绪波动。这两个类型的故事倾向于收到比那些消极结局的评论更多的评论, 这些反馈见解并不一定会让编剧们回到故事板阶段重新创作,却可以激发创作者反思和审视作品并通过指标对创作流程进行优化。目前可以看到的是视频故事的创建方式发生了重大变化。同样,导演现在可以将动作捕捉整合到他们的作品中,作家和故事板可以与机器一起工作,使用人工智能功能来锐化故事并放大情感拉力。

至少可以肯定的是,在讲一个独特而真实的故事比以往任何时候都更受重视的时代,人工智能可以成为出版商,品牌和其他任何旨在以可持续,一致和可扩展的方式创建引人入胜的内容的创造者的强大工具。因此,让人工智能识别判断故事的情绪弧线,并在适当的时机为影视叙事者提供辅助和支持就能大幅优化影视叙事的流程、增加评估故事创作的标尺,协助创作出高质量的故事。可以说这种应用方向的着眼点在于人工智能带来的科技创新如何进一步推动人的价值[2]。在这个过程中,人工智能是作为一个辅助的角色。

三、人工智能作为叙事者

这一研究方向旨在让人工智能成为较为独立的叙事者。它依赖于“故事生成系统”算法研究的持续不断的努力。算法被理解为一组指令,当算法被输入内容后,产生输出。在目前的情况下,期望的输出是一个故事。

在人工智能(AI)领域,故事的自动生成已经成为研究的主题超过五十年。最早的程序化故事生成器叫TALE-SPIN,一种在20世纪70年代开发的人工智能程序。在20世纪90年代,计算机程序MEXICA被开发用于研究智能绘图内容的生成。使用类似于MEXICA的方法,ProtoPropp程序生成与俄罗斯民间传说有关的故事。而在互联网上有大量“随机情节发生器”通过输入一些条件和变量,能够生成各种各样的故事。随着智能算法设计的发展,具备智能化故事生成能力的程序越来越灵活独立。著名的例子有:加州大学圣克鲁兹分校的博士生James Ryan使用代码讲述故事。谢尔顿(Sheldon Klein)是他目前的项目。命名来自于Sheldon County——人工智能的早期先驱。Sheldon County是一个人工智能的播客,它的程序自主产生无限数量的故事。另外,人工智能算法生成故事不仅仅局限于文字情节,它还能够同时配以声音影像担当影片故事的讲述者角色。一部人工智能自主创作的影片《Sunspring》于2016年在SCI-FI LONDON电影节上首次亮相。电影吸引了众多粉丝,一位观众将其描述为有趣而又奇怪。然而要知道的是这个电影的剧本完全是由智能算法程序完成的。事实上,这部影片可能会引起其观众的一些疑虑。影片中的一个角色莫名其妙地咳出了眼球;影片中的对话经常听起来像是一系列随机无关的句子。

迄今为止,叙事学和人工智能之间关于这一主题的相互作用是有限的和不确定的。然而,正如计算叙事学的兴起所证明的那样,这种情况正在缓慢改变。这个前沿仍然需要探索,因为每个领域都可以为另一个领域做出重大贡献。故事生成系统的算法实现不仅需要一组明确定义的概念作为实现的基础,而且还需要将故事生成的整体工作明确划分为更易于建模的特定任务。这可能需要区分构建故事的过程和构建故事后告诉它的过程。这两个过程在虚构的情况下显然是相互关联的,但它们在概念上也与它们的输入和输出的观点不同。叙事学对澄清这两个过程之间的关系和相互作用的明确贡献将构成对讲故事的重要贡献。如上所述,故事生成研究可以提供一个非常有趣的基准,用于实际测试叙事学概念清晰和精确到足以转化为故事讲述者的工作实现的程度。

例如,想象一个角色侮辱另一个角色,被侮辱的人具有復仇的个性。侮辱因此导致被侮辱的角色后来决定制定报复计划。这个决定孵化计划然后导致这个角色后来坐下来制定计划。制定计划然后让角色后来执行计划的第一步。这使他们出现在一个由侮辱者拥有的企业。导致复仇者环顾四周,看看是否有人在那里。她没有看到任何人,所以她放火烧了生意。她离开了现场。

已有证据表明算法叙事能力可以证明这种潜力。2016年,IBM制作了第一部完全由人工智能创作的电影预告片。为了制作20世纪福克斯惊悚摩根的预告片,惊悚片预告片的数据库被送入IBM Watson电脑。通过模式发现和其他功能,算法然后从电影中选择音乐和场景,拼凑出可靠的预告片。 无论做出何种选择,电影总是有相同的结局(燃烧的建筑物)。

四、基于人工智能的交互式叙事

不容忽视,有一个真正的动态讲故事市场。如果这项技术落到了优秀的电子游戏制作公司的设计师手中,它可以用来产生一种全媒体环境下[3]永无止境的独特、个性化的娱乐流。交互式叙事作为一种数字娱乐形式(通常应用在电子游戏或类似的交互软件中),其中故事情节不是预先确定的。作者创造了叙述必须解决的环境,角色和情境,但用户(也是读者或玩家)根据他们与故事世界的互动经历了一个独特的故事。

传统电子游戏的叙事方式停留在线性叙事、分支叙事和少数网状叙事。但是无论哪种叙事方式,其实都是游戏设计者预先设定好的情节,在不同的结点,由玩家选择而产生有限多种类的分支,最终完成叙事任务。玩家可以通过多次游玩,分别选择不同的分支而最终实现所有分支情节的体验。本质上说,这类叙事方式和写小说一样,都是提前已经设定好了所有的可能性。玩家的角色,与其说是游戏体验过程的参与者,不如说是创作者创作故事情节的被动的接受者,其过程本质和看小说、看影视作品没有区别——因为故事是静态的,是事先已经安排好的。而在交互式的叙事模型中,情况则与以往截然不同。人类玩家是故事的体验者、参与者同时也是创造者的一部分。交互叙事的系统里,没有提前设定好的剧本,只有一个能够相互作用的系统。所有的行为、交互都会产生各种各样的因果联系,并相互作用于后续的情节发展。而人工智能算法则作为一个游戏情节的代理,它的计算能力负责计算各种因子的影响,并持续根据所有玩家和游戏世界的条件动态的提供游戏中的情节反馈。这样的游戏世界模型,可以说非常接近现实世界,玩家每次进入游戏的体验会随着行为和选择的差异而动态的呈现区别,再考虑上所有玩家的差异,可以说没有哪一次的体验会完全一样。因此,这类交互式叙事可以很好的给电子游戏指出未来的发展方向之一。“交互”的内涵在电子游戏的语境中得到深入,即是真正意义上,对于玩家的不同输入表现,得到复杂智能化的反馈,从而让玩家真正在玩一个游戏,而不是另一种变相的影片或者电子读物。最早的互动角色体验之一涉及“Eliza”,这是一种在20世纪60年代开发的语言和软件系统。它似乎是一个非常复杂的实体,可以引人注目地与用户交流。但是越多人与之互动,他们就越注意到公式化的反应,这表明它是一个相对简单的计算机程序。相比之下,像“Tale-Spin”这样的节目在幕后制作了精心制作的技术流程,观众从未见过。观众只看到了技术带来的结果,例如自私的人物会说谎。结果与“Eliza”效应相反:不是观众最初假设的简单过程是复杂的,而是让受众体验的复杂过程变得简单。 两种类型的隐藏过程的一个优秀案例是电子游戏“模拟城市”。它包含一个复杂但最终透明的城市工作模式,包括影响交通需求的住房位置和造成困扰附近居民的工业活动。它旨在通过游戏引导用户了解这个基础模型,因为他们建立自己的城市并观察他们的成长方式。这种探索和响应是支持长期玩家参与的最佳方式。Versu是讲述人们互动故事的电子游戏引擎。Versu故事中的每个人都以人工智能为模型,赋予他们独特的个性特征和倾向。他们记得球员如何对待他们。他们可以成为你的朋友,你的爱人,你的导师,你最大的敌人。他们注意到你选择说什么,但他们也可能对手势,表情做出反应,不论你是否嘲笑他们的笑话。用户可以享受之前没有体验过的社交自由。在后面刺伤人物,或者甜言蜜语,直到你让他们完全按照自己的意愿行事。以电视游戏的未来方式运作的游戏非常罕见,但Versu的故事就是其中之一。这一切的简单性背叛了社交人工智能项目的复杂程度。这不是关于选择预定义路径之一的预先编写的故事。它似乎是一个真正的新兴故事。场景可以作为任何角色重放,而之前播放的场景现在由他们自己独特的人工智能接管。然后,当历史中不同点的已知角色以适当的行为编程时,可以坐下来共同吃饭。

交互式叙事系统的体系结构有三个组成部分:戏剧管理器,用户模型和代理模型。戏剧管理器负责通过以连贯的顺序搜索和执行故事“节拍”来引导叙事,通过提供新的信息和协调矛盾情节来改进故事事件,并与代理模型协作以选择角色的最佳叙事动作。它监测故事世界中的一些概述变量,以便根据作者的目标对叙事作出最佳决策:衡量整体冲突将有助于增加或减少戏剧性的紧张,同时衡量关系和可爱性可以引导故事走向浪漫的故事情节。代理模型收集有关故事世界和角色的信息,并生成可能的动作以响应故事中的每个非玩家角色。游戏世界中的角色可能的行为均来自角色的个性和情感模型,这允许每个角色表现出具有智能化的戏剧目标的自主行为。最后,用户模型跟踪玩家的选择和输入,例如戏剧管理器和代理人模型可以配合用户尝试的方式,而不是挑战或误解他们的决定。目前常用的开发交互式叙事系统的策略有三种。首先,环境方法是采用交互式系统(例如计算机游戏)的方法,并且以形成连贯的情节的方式鼓励用户的动作。由于系统足够复杂,不管用户的行为如何,紧急行为都可能形成类似故事的行为。第二种,通过数据来驱动“故事组件”库,其足够通用以便可以响应于用户的动作(或缺乏动作)而平滑地组合。这种方法的优点在于更加通用的定向环境方法,代价是更大的初始投资。第三种,基于语言的方法要求用户和系统共享一些非常有限的特定领域的语言,以便它们可以相互作出反应,并且系统可以“理解”更大比例的用户操作,例如图画语言或者通用语言(如英语)的限制版。

这些系统共同产生了“人类”的角色,改变了对玩家的实时反应,并确保新的叙事事件可以被理解。围绕交互式讲故事的研究领域包括许多不同的领域,包括心理学,社会学,认知科学,语言学,自然语言处理,用户界面设计,计算机科学和紧急情报。它们属于人机交互(HCI)的总称,处于硬科学和人文科学的交叉点。制作有效的互动故事系统的难度归因于每个领域的专业人员之间的意识形态分歧:艺术家难以将自己限制在逻辑和线性系统中,而程序员则不愿意欣赏或融入人文学科的抽象和未经证实的概念。交互式叙事形式受到观众选择的强烈影响。这些经验需要引人注目的计算机生成角色,而不是现在通过智能手机和家庭助理向我们讲话的外壳。而且他们需要的虚拟环境不仅仅是模拟空间——而是感觉生机勃勃,反应迅速且具有情感意义的环境。

五、小结

人工智能现在非常复杂,它可以完成很大一部分工作——就像检测我们周围的趋势和发生一样——并且它是人类工作者的盟友。人工智能以人类无法完成的规模完成这些任务。这个过程使故事讲述者更好地完成工作,并证明人工智能更像是现代叙事的替代品。与人们在过去几十年中看到的其他突破性发展类似(例如,智能手机,虚拟现实,甚至面部识别等),在未来,放弃对技术的部分控制比我们与一个人进行互动的方式至关重要。在未来十年人们将生活在一个完全由机器操作的社会中的假设是不现实的。但可以公平地说,相关技术将成为人们沟通,消费信息等方式的重要组成部分。如果有一件事可以被肯定的了解,那就是人工智能并不是讲故事的最后一种转型技术,因为不难观察到虚拟和增强现实的进展。创造性的视角或许是勇敢地接受这些技术,这些技术将对人们的生活和工作产生积极影响。

下一代媒體——它将成为艺术,学习,自我表达甚至健康维护的基础——需要一种深刻的跨学科方法。艺术与科学,讲故事和软件应当融合在一起,而不是单向的由艺术家掌握的工程师建造的工具。如此才能创造与人类文化密切相关的突破性的,艺术和技术复合化的体验。

参考文献:

[1] 王峰.人工智能科幻叙事的三种时间想象与当代社会焦虑[J/OL].社会科学战线:1-8[2019-02-27].http://kns.cnki.net/kcms/detail/22.1002.C.20190222.1010.022.html.

[2] 彭桂兵.人工智能时代科技题材纪录片的叙事艺术——以央视纪录片《创新中国》为例[J].中国电视,2018,(12):38-41.

[3] 贺艳.试析新的媒介生态对电视剧创作的多维影响[J].中国电视,2018,(6):12-17.