薛可欣 王春华
关键词:人工智能视觉技术 动画场景设计 技术优势 设计焦虑 危机 消亡 发展
引言
人工智能视觉技术是指人工智能化的机器视觉技术。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术。机器视觉技术是一门涉及人工智能、神经生物学、心理物理学、计算机科学、图像处理、模式识别等诸多领域的交叉学科,主要用计算机来模拟人的视觉功能,从客观事物的图像中提取信息,进行处理并加以理解。用人工智能视觉技术进行动画场景设计就是在动画场景的设计过程中使用人工智能视觉技术:用人工智能视觉技术对其数据库中数据的整合、处理实现机器的自主设计,或者在设计过程中引入人工智能视觉技术来降低动画场景设计的工作量。
2022年Glenn Marshall用人工智能视觉技术制作出的动画作品《The crow》获得戛纳最佳动画短片奖的提名,在这一作品中的场景是完全由人工智能视觉技术自主设计、制作完成的。截至目前全网“人工智能视觉技术”的总词条量破两亿,“AI制图”的总词条量破二十亿,“AI动画场景设计”总词条量破一亿,“动画场景设计”总词条量仅约三亿。“AI动画场景”词条量几乎占到了“动画场景设计”总词条量的三分之一。目前关注度较高的AI制图程序Disco Diffusion最新版本已支持动画的输出,且输出作品中的动画场景较为完善。部分世界性艺术比赛甚至专门设置了人工智能视觉技术作品赛道。2022年根据制作者提供的开放性文本内容进行视频合成的人工智能技术也已经出现。此类技术提高了动画场景设计师的工作效率,降低了动画场景的生产成本和行业门槛,将会促进动画的发展。但人工智能视觉技术在动画场景设计中的介入也会产生一些负面影响,如思想危机、文化危机、动画消亡等。德布雷提出人类历史分为意识形态史和科技史两个部分,人工智能视觉技术是科技领域的进步。设计焦虑的产生与技术在意识形态领域对人工的替代有关。人工智能视觉技术在未来或许会成为动画场景设计中的辅助工具,或在其对动画场景设计的渗透下衍生出新风格的动画场景、新的动画形式。
一、动画场景设计中人工智能视觉技术的优势
传统赛璐璐动画场景在设计过程中经常采用的一种方式是对实拍照片的转描,转描后再加以设计、修改。CLIP STUDIO PAINT的智能线稿提取功能很大程度简化了这一过程。用户在CLIP STUDIOPAINT软件中点击“线稿提取”按键,就可以直接将所选图层中的图像转化为一张速写图。目前这项技术已经成为草稿绘制阶段较为常用的技术之一。2022年美国的学者研发出可以直接对线稿进行色彩填充的智能上色程序。虽然这项程序现在还没有将上色效果做得足够完美,但是其已经描绘出了一个只需极短时间就可以完成场景颜色设计的未来[1]。传统赛璐璐风格动画场景设计中还包括光影的设计。恰当的光影可以更好地渲染气氛、烘托情绪。目前DamienHenry研发出了clipdrop.co-relight这一可以对2D图片打光的人工智能视觉程序。这一程序可以对制作者上传的2D图片智能分析,后直接打光,简化了动画场景设计中的光影设计步骤。此类人工智能视觉技术极大提高了动画场景设计效率,降低了动画场景设计成本。
人工智能视觉技术也可以根据设计师的需要进行场景图的自主设计。动画场景设计师可以在AI出图的基础上进行二次处理。程序可以向动画场景设计师提供设计灵感和设计思路,设计效率大大提高。
动画场景的设计过程不一定非要通过“绘制”来实现,也可以通过“生成”来实现。2022年9月Google Research研发了Phenaki模型,此技术模型能够现实通过给定文本提示的方式进行视频的合成。这项技术将对动画场景画面的设计简化成了对动画场景的指令文本的设计,通过改变动画场景设计过程的方式促成了一种动画场景设计变革。
人工智能视觉技术还降低了动画场景设计的门槛,为非动画从业者在动画领域的发展创造了条件。在人工智能视觉技术的辅助下,没有美术基础的人也可以进行设计、作图。这客观上扩大了动画场景设计师群体,将进一步促进动画的发展。
二、人工智能视觉技术在动画场景设计过程中产生的设计焦虑
技术的发展可以是智慧的加速器,但也可以是掘墓人。虽然人工智能视觉技术具备一定的设计优势,但也会在使用中引发设计焦虑。
(一)动画数量激增与思想危机的产生
第一重意义上的思想危机主要来自于媒介泛滥。动画场景是动画中的主要元素之一,动画场景设计方式的优化、设计效率的提升会推动动画作品数量激增。动画实际上是一种信息传递的媒介。精神通过在一个可感知的物质性中获得实体,通过沉淀于一个载体之上作用于另一个人[2]。人工智能视觉技术便利了信息传递媒介的制造,互联网与大数据加速了信息的传递,如今使得一个信息甚至在诞生之初就已经被接收到。但并不是所有的信息都值得被传播。影响范围最大、流传最广的作品不一定是最有价值、有意义的作品。制作一部思想内核较为完备的动画作品需要一定的时间,受众理解、接收这样一部动画作品所传递的思想也需要一定的时间。人工智能视觉技术在动画场景设计中的使用通过简化动画场景设计过程的方式简化了动画设计、制作的流程,进而推动了动画作品数量的激增。在动画作品数量的激增下,單个动画作品的寿命缩短了。动画制作者很难有足够的时间去制作一部制作较为精良、思想内核较为完备的动画作品。且受众没有足够的时间去理解动画作品所传达的思想。因此此类作品的投资回报比往往不够优秀。在市场的加持下,动画制造者为追求经济效益而对观众的喜好过度讨好,只注重具有高投资回报比的动画作品的制作而忽略了具有较高思想、艺术价值的动画作品的制作。这会使得社会思想越来越浮躁。媒介泛滥也使得信息的管控更为困难。一些对受众的心智、社会的稳定有所危害的动画作品来不及被下架、被整改就已经被传播,被受众所接受。这是社会的不安定因素,将会加重思想危机。
第二重意义上的思想危机来自于拟像泛滥。人工智能视觉技术在设计过程中对其数据库中数据的筛选、整合与二次创作类似,其作品是一种被复制拼贴的拟象。完全利用人工智能视觉技术进行动画场景的设计就是将自主权交给了技术,设计成了对已有数据的重构。作品是设计者思想传播与物质化呈现的载体。当下人工智能视觉技术已经有了可以对某一类风格、某一艺术家的作品进行完全复制或同类创作的能力,当人工智能制造出的动画作品与由人工创造出的作品从外观上看几乎没有区别时,原创者(指此类风格真正的原创者)的思想变得难以分辨。这种混乱与鲍德里亚提出的现代生产领域向后现代拟像(Simulacra)社会的堕落有一定的相似之处,与之不同的是当原作与二次创作品混杂时泛滥的不仅是拟像,还包括拟像的拟像。拟像泛滥终将导致思想混乱,是一种思想危机。
(二)人工智能视觉技术在动画场景设计中的过度介入引发文化危机
文化危机的第一个方面是文化趋同现象的加剧与变形。在人工动画场景设计阶段不同文化背景的设计师设计出的动画场景往往受其自身所处的文化环境影响。社会学家与人类学家在上世纪末就已经提出了有关文化趋同现象的预言,这一预言并不能完全解释人工智能视觉技术在文化层面引发的危机。这种危机实际上是人工智能视觉技术造成的加剧与变形了的“文化趋同”。人工智能视觉技术在动画场景设计中的过度介入下,不同文化不是求同存异地融合而是几乎合而为一。人工智能视觉技术的图片制作是通过对数据库中信息的拼贴与整合来实现的。不同文化背景的动画场景设计师在使用技术进行设计时AI的拼贴都来自同样的数据。同样的数据、同样的处理技术使得不同文化的差异性被消磨,加剧了变形的文化趋同现象。
动画场景设计者借用动画场景这一媒介对文化信息进行传递的过程实际构成了一种文化转译。当动画场景设计师使用人工智能视觉技术进行动画场景设计时,人工智能视觉技术是设计过程的“执行者”。工具会对所传递的信息产生非客观的、受工具制造者影响的影响:人工智能视觉技术的机器学习中存在着诸如程序开发工程师的认知等的人类偏见。人工智能还具有主动解释图片的能力,这种解释是非客观的,它首先由艺术家最初提供的图像集、认知模式等间接影响到产生图像的最终倾向性。最初的数据总是经过预选,因此也传递了文化价值和判断,这些反过来又隐含地决定了算法的运行[3]。不同的文化就像一座座冰山,水线之上的是文化中可见的部分,也是最易被机器学习模仿的部分。但水线之上的只是文化的表面层。文化的中间层与内在层是水线以下不易见、不可见的部分[4]。这一部分不仅是文化的重要组成部分,还构成了对水线以上文化表现层的支撑。这一部分是难以物质化的,是机器学习难以模仿的。技术对设计的过度介入构成了对文化中间层和内在层的冲击,进一步影响文化表象层。三个层面都受到冲击,文化危机随之产生。
文化危机的第二个方面是文化发展的停滞。鲍德里亚认为信息在交流行为中消耗自身,不是在生产意义,而是在消解意义。动画场景与文字一样都是信息传递的载体,完全借助人工智能视觉技术进行动画场景设计实际上就把动画场景设计局限在现有的语料库中了,未收录在语料库中的信息无法进行传递。文化由于缺少能够将其物质化的载体而难以向前发展,人工智能视觉技术不具备真正意义上的原创性,双重因素共同作用几乎扼殺了文化的未来发展,形成了文化危机。
(三)人工智能视觉技术在动画场景设计中的过度介入或将造成动画消亡
工具对人越解放,工具的思考就越替代人的思考。在这一过程中最先消亡是动画场景设计过程中的原创精神与多样性。动画场景设计过程的过度简化、机器对人工的过分替代加之市场的影响,会诱发动画领域的劣币驱逐良币现象。更低成本、更短制作周期的动画作品将会越来越多,这对需要较高投入、较长制作周期的动画作品是一种冲击。最终低成本、短周期的动画作品能够流传得更广、具有更强的生命力、获得更高的收益。因而资本对这一类型的作品的扶持力度就更大,市面上就更看不到有原创性的、丰富多彩的东西。这会形成一个闭环,将投资收益比较差但更有深度、更精良的高成本、长周期的动画作品驱逐出局。这对动画场景设计师的自主性和原创性是一种损害,更在宏观上导致了动画原创性的枯竭与想象力的萎缩。
人工智能视觉技术在动画场景设计中的过度介入会通过对动画场景的美和生命力造成威胁的方式导致动画美和生命力的丧失。尼采的美学思想中提到浮于表面、归于虚无的艺术是颓废的、萎靡的、无生命力的[5]。人工智能视觉技术局限于已有的规则(算法、数据库等),动画生产者为追求更高经济效益而放松了对有深层次作品的追求,创造出来的作品也就而失去了美和生命力。
技术在动画场景设计中的过度介入也将使得动画走向消亡。动画场景是动画中的重要元素,当新动画场景的设计全部基于对已有信息的分析整合时,“设计”实际变成了一种对过去的拼贴与重现,技术通过消解动画当下性的方式造成动画的消亡。
动画的消亡还来自于动画场景设计人才的短缺。人才的成长往往需要较长的时间,当为了追求经济效益而对人工过分压缩的时候会同时压缩动画场景设计师的生存空间和生长时间,这几乎扼杀了潜在的动画场景设计人才。动画场景设计人才的丧失将会造成动画发展的后继乏力,长此以往将会酿成动画走向消亡的恶果。
三、焦虑的解构与人工智能视觉技术未来在动画场景设计中的发展
(一)德布雷媒介学视角下设计焦虑的本质
德布雷认为人类历史可以分为两个独立的部分:意识形态史和科学史。在意识形态史中可以有变化,却没有纯粹意义上的进步,是一种可逆反的强度,是一种不分前后的重复空间。在科学史中有线性和无限的进步,有现在与过去之间无可逆反的决裂,是一种积累性的延伸[6]。这一观点提供了一种对于人类历史的三维认识:意识形态史坍缩成二维平面,科技史引入第三个维度。人工智能视觉技术只属于科技领域,不参与构成意识形态。假设AI参与意识形态的构成,AI的“思考”又只来源于已有的数据,既沿着科技发展方向向前发展,又逆着科技发展方向回溯历史,在第三维度上循环往复,产生发展的混乱。这种原地踏步甚至倒退的发展模式最终消解了动画的未来、消解了动画自身。
这种技术焦虑的缓解是要认识到人工智能视觉技术只属于科技范畴,只是一种工具。可以利用AI制图“思考”的产物,只将其作为一种提高效率的方式,而不是用人工智能视觉技术完全替代人工、替代人的思维进行设计的过程。
(二)人工智能视觉技术未来在动画场景设计中的发展方向人工智能视觉技术在动画场景设计中的第一个发展方向是成为动画场景设计过程中的辅助工具,帮助设计师完成概念设计、草图设计、灵感收集等工作。
帮助设计师完成概念设计即通过参与动画创作前期阶段的方式辅助动画场景设计。动画场景设计工作由动画分镜师和动画场景绘师两种不同身份的动画工作者共同完成。动画场景设计的一般过程是先由分镜师在分镜稿中提供草图、人景对位等关键信息,再由场景绘师完成细节设计与成稿绘制。分镜师在人工智能视觉技术发展起来之前向场景绘师提供画面关键信息时往往采用人工绘制的方式,工作量较大、效率较低。在技术发展起来以后分镜师可以将对分镜中场景的设计与指定转移到对场景关键词的设计与指定上,借人工智能视觉技术用关键信息直接输出分镜稿,或在AI出图基础上进行修改来完成分镜稿,再将分镜稿交由场景绘师进一步将设计细化、完成创作。日本映像制作人Ryo Sogabe已经开始使用人工智能视觉程序Midjourney进行前期概念设计。这种方式降低了动画分镜师与场景绘师在动画场景设计过程中的沟通成本,提高了动画场景设计效率。
帮助设计师完成概念设计、灵感收集即先用人工智能视觉技术出图后再由设计师进行二次加工以完成设计和创作。虽然这种方式目前还少有动画场景设计师进行实操,但已经可以从部分具有前瞻性的艺术家对技术的使用中窥见一斑。如英国艺术家Daniel Oxford在人工智能视觉程序输出图片的基础上用Ps等电脑绘图软件进行二次创作,用AI与人工配合的方式完成图像绘制。这种方式节省了设计师的工作量,且并没有完全用技术替代人工。
第二个发展方向是在一部分动画场景的设计中继续当下人工智能视觉技术的使用模式。这在未来可能形成一种新风格的动画场景。
目前人们普遍认为人工智能视觉技术设计生成的场景作品仅仅是看起来气势恢宏、天马行空,但细节处理不到位、表意含糊不明。这种“缺点”未来或许会成为人工智能视觉技术设计场景独有的特点。新技术总是起源于旧技术的发展,在新技术诞生之初及发展之初总是受到旧技术的影响。每个新的传递手段都消化吸收之前的手段。新手段要通过一个模仿的阶段[7]。人工智能视觉技术源于绘图技术的发展,在诞生、发展之初主要还是对绘画的模仿。新技术的发展会逐步从旧技术中剥离出来,朝与旧技术不同的方向发展。近些年已经有人提出AI的图像输出不会只局限于对绘画的模仿,进行了创作尝试,并已经引发了各界关注、取得了一定经济效益。如2018年拍出43.25万美元的AI作品《Edmond de Belamy》及2019年拍出3.2万英镑的神经网络实时生成肖像作品《路人的记忆I》。二者共同具有画面元素融合、表意模糊、細节刻画简略的“缺点”,此类“缺点”就有可能成为未来人工智能视觉技术图像作品独有的特点。在这种技术的使用方式中起决定性作用的仍然是人和人的思维,技术仅仅是设计思维的实践工具。未来的AI制图作品可能会与当下的绘画作品有所不同,因而AI动画场景在未来可能会朝着与传统动画场景有所区别的方向发展。
结语
人工智能视觉技术的发展依托科技的发展。科技的发展可以解放生产力,引发短暂的行业繁荣。但从长远来看,这种发展实际上是一种无关结果好坏的预警。若对其忽视,放任人工智能视觉技术在动画场景设计中的发展,将会引发思想危机、文化危机、动画的消亡。只有对其正确认识才能更好地对其进行使用。对人工智能视觉技术在动画场景设计中的使用既不能过分乐观,也不用过分担忧。当代人工智能视觉技术的诞生对艺术领域的冲击在一定程度上与摄影技术的诞生对艺术领域的冲击类似:在诞生之初都经历了关于其是否会对艺术领域产生威胁的讨论。结合摄影技术发展的历史来看,技术诞生之初的激烈探讨会成为其发展的助推器,当下对人工智能视觉技术的探讨会帮助人们更好地认识这一技术、理解如何在动画场景设计中使用人工智能视觉技术。这将会推动人工智能视觉技术成为动画场景设计中良好的辅助工具,或是在其影响下催生新风格的动画场景。