如今,随着AIGC技术不断发展,数字人需求正在迎来阶梯性的增长,目前已广泛应用在包括直播、游戏、影视、短视频等多个业务场景中,为这些行业发展起到了降本增效的作用。聚力维度成立于2016年,一直致力于数字人创新技术研发。早在2014年我们就开始涉足AI与影视制作的研究。当时主要是运用计算机视觉技术,在影视行业进行后期制作相关工作,一直想将人工智能技术全面应用于影视制作的全流程。经过几轮人工智能技术革新和浪潮,我们现在已经非常接近这个目标。2021年,由聚力维度全面研发的人工智能数字人驱动引擎“赛博演猿”正式推出。
让影视制作更简单高效
“赛博演猿”的推出,主要是基于我们在深入研究影视行业的成本构成后,发现其中最主要的成本来源是将人物画面置入虚拟场景拍摄。因为,传统的影视制作通常有两种方式——实拍结合后期制作和纯虚拟动画制作,这个过程还包括原画设计、建模、后期渲染等步骤。尽管这些方式能制作高质量影视作品,但成本高昂且制作周期长。
为了解决这个问题,我们提出了一种全新制作思路。这一思路以AIGC数字人为核心,在元宇宙的3D数字世界中拍摄,形成一种新型AI影视制作工具,结合镜头、灯光等交互工具,就能够实现数字化直接拍摄,既可以直播,也可以录制电影。
我们的研究与Sora在核心目标上存在共鸣,都期望AI成为生产力主体,而非仅作为辅助工具。在研究AI技术对于影视行业的应用时,很多人认为,仅仅在现有人工流程中嵌入AI环节,可能无法充分发挥AI潜力。我们坚信,真正的AI影视制作应当是一个多模态过程,不限于文字和像素的输入和输出,还包括声音、情绪表达和肢体动作等方面。因此,我们致力于开发一个多模态制作流程,从而更全面地展现创作者意图和情感。
在AI输出方面,我们希望输出的是结构化图形,而不是单纯像素,所以决定在生成数字人时,采纳多模态生成方式。例如,在塑造人脸时,相较于烦琐的文字描述,图像描述更为直观,若需对鼻子进行微调,使其高度增加,通过鼠标直接拖拽调整显然更为高 效。
值得一提的是,我们的方法与Sora有所不同,这得益于对成本的优化。首先,数字人与真人相比,无须承担吃、住、行等相应成本支出;其次,在虚拟环境中拍摄虚拟场景,成本也低于现实世界的实景拍摄成本,甚至都不用后期制作。因此,通过AI协助,既能够将成本降低,也能确保电影级画质。
让每个人都能成为导演
目前,我们的核心技术主要围绕数字人的生成与应用,包括其来源、建模、语音及动作制作等方面,并且已经将数字人集成至虚拟拍摄软件中,以实现更高效的创作过程。
在技术研发方面,我们最先研究的是通过视觉捕捉技术来解决表演问题。通过该技术,无须演员参与,即可实现高质量视觉捕捉效果。可以说,在全球范围内,在这一领域的技术水平处于领先地位。这项技术不仅为后续AI直接生成动作提供了前置支持,并且不管是细微的表情,还是比较夸张的表情,以及手指活动,都可以用AI精准捕捉。通过拉远镜头,我们的技术还能进行全身精准捕捉,其中涉及肩膀和胯部的捕捉尤为精准,同时实现了对脚部在地面滑动的细腻捕捉。此外,还能根据输入的文字生成声音,并生成与文字相匹配的表情和口型,为演员提供更为便捷的表演方式。
关于数字人的产生,推出了数字人AI生产端平台——赛博演猿,其具备随机生成、图像生成和文字生成功能。生成的数字人不是静态图片,而是可以被驱动的实体。以图像生成为例,用户可通过此功能自动生成与自身相似的图像,并通过鼠标键盘或文字指令调整数字人的面部特征,如鼻子宽度等,并且无版权及法律风险。例如,影视剧导演可以根据作品需求生成各类角色,如男女主角、男女配角等,还可以实现实时更换。此外,数字拍摄的优势在于快速调用和特效生成,使电影特效制作变得轻而易举,像不同的天气效果、穿墙效果等都可以实现一键切换、一键调用。虽然我们目前主要拍摄动画片,但随着技术不断成熟,预计在2025年,在影视制作中的渲染效果将实现与实拍效果无缝衔接。在此过程中,需要始终确保数据内容的结构化,并实现与虚拟对象的交互。
打造AI影视产业新生态
在内容创作方面,还积极探索AI在短剧制作中的应用。虽然传统短剧制作成本高,但通过AI技术创新,在降低成本的同时,将实现单人独立制作短剧的目标。这一举措不仅体现了对技术创新的追求,也展示了在提升内容生产效率和降低成本方面的决心。
今年,将加大在影视剧内容制作方面的技术研发力度,最终目标是实现“个人日产10分钟影视级内容”的目标。如果影视剧制作能像小说创作一样,实现个人日产数分钟影视内容,其影响将会是颠覆性的。以前,在面向企业的服务中,往往是按要求为客户用AI技术制作企业宣传片或节目,但随着技术不断进步,AI化趋势日益明显,客户对全流程AI制作的需求也日益迫切。
特别是在直播方面,利用数字人作为企业宣传主持人,或是作为带领大家进行文旅体验的主播,等等,流量都非常亮眼。近期,我们为三星堆打造了一项创新体验,此项体验的核心在于摄像头技术。观众将有机会通过摄像头,实时控制数字人的表情与动作,展开一场别开生面的互动之旅。
值得一提的是,我们还推出了一项创新功能,即利用图片生成个人脸部模型,与IP角色进行互动。为了更广泛地推广这一技术,建立了数字人标准,使得第三方创作者也能将自己的数字人导入平台,希望最终能够赋能几十万企业和千千万万个人创作者。当下,我们正在推动“数字横店计划”,致力于打造一个虚拟影视产业生态。尽管AI生成的3D模型目前尚未达到影视级别,但我们相信,随着技术不断进步,这一愿景将成为现实。
我们对未来充满期待,希望在2024年能够推出一系列全球领先的AI电视剧、电影等作品。随着AI技术不断发展,更加有信心将这些作品推向更广阔的舞台。W
(作者赵天奇系北京聚力维度科技有限公司创始人、 CEO)