雨林
Sora生成的视频画面
OpenAI新推出的文生视频模型Sora,是最近社交媒體上的“顶流”。
Sora的骨干研究成员比尔·皮布尔斯和蒂姆·布鲁克斯在X上不断更新Sora的新作。据布鲁克斯2月18日的动态,Sora已经具备同时生成多个视频的能力。
Sora空降,引起了人工智能领域的行业震荡,余波直接蔓延到了影视行业。一个直观的例子是,在Sora发布后,美国导演泰勒·派瑞直接叫停了耗资8亿美元的亚特兰大制片厂扩建计划。他认为,人工智能将导致电影业大量工作岗位流失。不少媒体也指出,Sora或将改变包括电影制作、广告、平面设计和游戏开发在内的一系列创意性产业。
对于影视创作来说,人工智能已是不可忽略的存在—Sora一经问世,就成了柏林国际电影节的讨论焦点。Sora公布几天后,柏林电影节就组织了一场人工智能和影视世界构建的论坛,Sora的前景和危险主导了所有人的焦点。
制片厂的老板们为之兴奋、着迷,认为人工智能将带来好莱坞故事讲述的新篇章。
恐惧来自那些没有话语权的“打工人”。过去一年,好莱坞编剧、演员们旷日持久的罢工浪潮,就已经将行业的生存焦虑推到台面上:人工智能写剧本、人工智能合成演员,在好莱坞也不再是稀罕事,编剧和演员们看到了自身随时被取代的命运。
Sora的降临,让这些行业的人们又一次感受到了危机,激起了更大范围的不安。《好莱坞报道》说,对于视觉特效和其他后期工作人员来说,人工智能是一种“生存威胁”。
2024年2月13日,德国柏林,波茨坦大街上的电影节宣传海报
在科技巨头为AI的里程碑式进展雀跃的同时,影视行业人员半是期待,半是警惕。当人工智能一步步成熟到足以替换面孔、替换背景、替换群演,再到直接从文本生成视频,这个行业会在多大程度上被改变?
更进一步,这多大程度上会改变我们对影像真实的固有认知?
从蒂姆·布鲁克斯最近发布的Sora生成视频来看,画面中无论背景还是人物,都非常接近相机拍摄的效果—即便是在指尖反复捻搓的白雪特写,也看不出什么明显的破绽。
在人工智能生成视频领域,OpenAI并不是第一家付诸行动的企业。在此之前,谷歌、Meta和Runway都曾开发过类似的文生视频技术。但不论是对于普通受众还是影视内容生产者来说,真正形成冲击力的,是近期的Sora。
而让人们感到震撼的,不仅仅是Sora的“成熟”,还有人工智能发展之迅速。从文字到图像再到视频,人工智能接近人类的速度,快得出乎人们的预料。
此时距离上一次ChatGPT在现实世界掀起轩然大波,才过了短短一年多。在Sora横空出世之前,Sora的两个主要“竞争对手”Pika和Runway,最长都只能生成四秒钟的视频。与Runway和Pika相比,Sora有不少优势—视频时间更长、人物的身体运动更为逼真,且支持较复杂的运动场景等。
不过,Sora在一些细节上仍然显得有些“笨拙”—比如,在空间的辨认上有些左右不分,在因果关系上存在理解障碍(视频中的人咬了一口饼干,但饼干却没有出现咬痕)。全网刷屏的女子漫步东京街头视频,也存在多处细节错误,街头招牌上的日语文字绝大多数并不准确,街景中也有不合常规的障碍物。
即便如此,Sora还是代表着人工智能生成视频的新里程碑。这一新兴的风口,让科技巨头们争破了头。谷歌的Lumiere、Meta的Emu和字节跳动的MagicVideo-V2以及Runway、Pika Labs、Genmo和StabilityAI等初创公司,都在加码文生视频模型的赌注,Midjourney也准备在今年晚些时候涉足视频生成领域。
人工智能的未来备受瞩目。据Statista的数据,2024年生成式人工智能的市场规模预计将达到666.2亿美元。而据彭博社预计,2032年,市场规模将再扩大至1.3万亿美元。国内360董事长周鸿祎判断:“Sora意味着AGI(通用人工智能)的实现将从十年缩短到一年。”
Sora带来的影响不可能仅仅停留在Sora自身。市场研究公司ABI Research的高级分析师里斯·海登说,这类人工智能模型可能会对数字娱乐市场产生巨大影响,因为新的个性化内容将在各个渠道流传。
这意味着,价值数千亿美元的影视行业的生产方式,将迎来巨大变化。而赖此生存的影视从业者,不得不拿出比AI有利的条件。
受众能在多大程度上感受到人和人工智能的区别,在Sora正式开放使用之前尚未可知。
一年前,由人工智能生成的威尔·史密斯吃面视频在网络上引起了病毒式传播。当时,人物的表情和动作、面条入口前后的形状变化都存在明显的bug。最近Sora掀起热议后,威尔·史密斯亲自录制了一段吃面视频,但在得到解释之前,不少人还以为是Sora的“杰作”。
威尔·史密斯亲自录制吃面视频,被认为是AI的杰作
价值数千亿美元的影视行业的生产方式,将迎来巨大变化。
威尔·史密斯的“以真乱假”,恰恰说明了:在真实性这一点上,人们在很大程度上相信,人工智能即将拥有人类作品的说服力。
在此基础上,从“AI换脸”,到Runway和Elevenlabs的“變身”和背景替换功能,再到Sora直接由文字输出视频,人工智能给影视行业带来的冲击是不可忽略的。
《纽约客》2月16日刊文提出,Sora对视频领域的冲击,可以类比ChatGPT对写作的影响。
人工智能最为显著的优点之一,就是效率高。《科学》杂志的研究人员招募了453名营销人员、数据分析师和受过大学教育的专业人士,其中选择使用ChatGPT的作家完成任务的时间减少了40%,并且制作的作品质量比未使用ChatGPT的参与者高出18%。
另一个优点可能是成本低廉。美国最具影响力的商业杂志之一《Fast Company》表示,Sora将改变人们创作内容的方式—未来使用生成式人工智能要比使用3D建模、传统视觉特效和CGI等便宜上百倍,它甚至可能比架一台摄像机还要便宜。
以知名科幻电影《流浪地球》为例,制作团队共为影片绘制了5310张概念设计、9989张分镜头画稿,搭建了102个科幻类主场景,耗费了巨大的人力物力。导演郭帆曾在采访中表示,在设计科幻电影的概念图方面,Midjourney更有优势—因为一个有几十年经验的设计师可能需要一周的时间才能完成,而Midjourney一夜之间就可以制作出大量画面。
《流浪地球2》剧组拍摄期间有1189位常驻工作人员,超过22000位参演群众演员。郭帆觉得,有了人工智能工具,《流浪地球3》的剧组人数或许可以减少至少一半。
道具制作师西蒙·魏斯,曾为导演韦斯·安德森创造出布达佩斯大饭店微缩模型,他表示,以前还“担心自己会失业”。但如今,他也开始使用新的人工智能技术来辅助传统的道具制作,“我们必须与之合作”。
他说:“人工智能可以更快地找到照片,为搭建微缩场景提供灵感,用ChatGPT找到所需的图片,就不用在谷歌上搜索好几天。”
人工智能参与文字、图像乃至视频、甚至是电影的未来是可以预见的,而且或许还能拿出傲人的成绩。就在去年,一部由人类和AI共同写就的《机忆之地》还拿下了第五届江苏青年科普科幻作品大赛的二等奖。
洛杉矶导演戴夫·克拉克认为:“创作者需要拥抱人工智能技术,以获得从未想象过或实现过的内容。”
然而,新技术将如何冲击既成规范的社会生活?人类似乎还没想清楚。不久前,人工智能刚刚卷入一场风波:1月25日,一名X用户分享了一张泰勒·斯威夫特的露骨图片,被浏览了4700万次。尽管X平台努力删除,但这些内容还是得到了疯狂传播。
电影《流浪地球2》剧照
威尔·史密斯亲自录制了一段吃面视频,不少人还以为是Sora的“杰作”。
这并非孤例。去年11月,新泽西州30多名女高中生的照片,也被AI篡改成色情图片,并发在了网络上。此前,深伪视频在色情平台已经泛滥,但随着新技术的到来,情况将如何恶化,没人说得清。
身份验证公司iProov的首席科学员安德鲁·纽维尔说:“Sora将使那些带有恶意的人更容易生成高质量的深度伪造视频,更便于他们创建用于攻击目的的视频。”
人工智能生成视频正在一步步深入人类的工作和生活。可以想见的是,不久的未来,整个互联网都将充斥着AI伪造视频。最终,人类引以为傲的影像艺术的最后堡垒—电影,也可能被颠覆。
只不过,到那时,我们需要重新界定什么是“伪造”,什么又是创作。
以Sora为代表的工具,将如何影响未来的影视行业,并不完全以业内人员的意见为准—再好的AI作品,都要观众买单才有意义。
从目前的数据看来,观众对于人工智能深度参与的作品态度不算乐观。雅虎娱乐和YouGov的一项调查显示,大多数美国人并不想看人工智能生成的有深度伪造演员的电影。民意调查发现,在接受调查的1665名美国成年人中,有61%的人认为“在电影和电视节目中加入人工智能生成的演员数字复制品是个‘坏主意”;另有63%的人认为,好莱坞不应允许人工智能代替人类编剧生成电影和电视剧本。
人工智能会走多远,人类还没有定数。
但可以确定的是,创作最终还是人的艺术。就如德国视觉特效工作室Trixter的总经理克里斯蒂娜·卡斯珀斯-罗梅尔所说,即便像Sora这样的人工智能工具在工作流程上更高效,电影和电视制作还是将继续依赖人类创作者。
特约编辑姜雯 阿树 jw@nfcmag.com