颜媛媛
大家好,我是数字人大亨,很荣幸能够与大家探讨一个备受关注的话题:AIGC(AIGC 即AIGeneratedContent,是指利用人工智能技术来生成内容)是否能代替人类进行创作?历史证明,人类的创造力和创作风格是随着时代和技术革新不断演进的。在内容创作,尤其是创作优质个性化内容方面,AIGC 和人类的协同是非常必要的一环。
3月30日,在2023新榜大会上,腾讯内容平台部副总经理姚天恒通过他的数字人“大亨”做了这样的开场演讲(如图1)。令人关注的是,这个数字人不仅在形象上高度逼真,而且在语音、语调、唇动等方面也非常真实,甚至连姚天恒惯常的表情和动作都毫不马虎地模拟了出来。
数字人“大亨”是以姚天恒真人为原型打造,采用腾讯智影最新人工智能技术,通过深度学习他本人少量的真实音频、视频数据生成的分身模型。借此机会,腾讯也正式对外发布了全新的AI智能创作助手“腾讯智影”,通过为内容创作者提供一系列的智能创作工具,帮助创作者在内容创作时提质增效。
腾讯在AI 领域的动作很快,距离腾讯在2022全年业绩财报电话会上坦言AI“非常令人兴奋”,并表态未来可能将AI 纳入微信和QQ,刚刚过去一周时间,腾讯就分别在博鳌亚洲论坛2023 年年会“下一代互联网”
论坛上透露正在研发类ChatGPT 聊天机器人,并且集成到QQ、微信,以及腾讯云的版本“都会有”,以及正式在“2023 新榜大会”上发布“腾讯智影”。
然而,很多人都没想到“腾讯智影”发布的第一时间,人们就可以在微信小程序中找到并体验,与此同时,用户还可以使用PC 浏览器登录zenvideo.qq.com 开启“腾讯智影”平台,以获得更便利的操控体验。
在官方主页可以看到,腾讯智影主要提供“人”“声”“影”三个方面的能力。其中在“人”的方面,“智影数字人”是腾讯智影最核心的功能。用户输入文本或音频内容,即可生成数字人播报视频。根据用户差异化的应用需求和场景,“腾讯智影”又细分为视频剪辑、文本配音、数字人播报、视频审阅等多个功能(如图2)。
在“声”的方面,腾讯智影则提供了文本配音、音色定制、智能变声等功能。在“影”的方面,通过腾讯智影文章转视频能力,创作者可以直接将自己撰写的文字转化为视频内容,无须进行繁琐的素材收集和处理。此外,腾讯智影分段式的素材呈现方式,让创作者可以快速处理分镜,添加卡点、滤镜、特效等,从而大大缩短视频制作的周期和成本。
如此強大的功能,再凭借腾讯微信小程序的覆盖面,自然在第一时间成为市场关注的焦点。
在“腾讯智影”主界面点击“数字人播报”后即可打造属于自己的数字人主播。用户首先需要选择相应的数字人形象(提供2D和3D两个类别可供选择),即可进入数字人创作界面(如图3)。
这里要提醒大家的是,“腾讯智影”需要在Chrome浏览器进行访问,即便是腾讯QQ浏览器也会提示PC 用户更换浏览器进行工作。在3D主播生成界面可以看到,左侧主要是工具栏界面,数字人、背景、配乐等细节都可以单独编辑,以“数字人编辑”为例,用户可以对3D主播的形象及动作、画面、字幕等细节进行个性化打造。
从服装样式、服装颜色、人物姿势到动作,“腾讯智影”都提供了预设模式给用户选择,用户只需要根据个人偏好进行点选即可,上手非常快(如图4)。
追求易用性的同时,“腾讯智影”在细节上并没有完全“放权”。用户可以选择3D数字人各种动作表达,配合文字内容形成自然、连贯的播报,但数字人具体发型、面部表情其实是没办法做个性化定制的,不过在“高级编辑”中,用户还是可以上传自己的视频、音频和图片资料,进而强化数字人主播内容的差异化。
不过目前“腾讯智影”只对免费用户开放了部分体验功能,其余大部分需要用户付费使用。如免费版,可以获得每个月5分钟的免费数字人生成视频时长,每天3 次的智能工具使用等;398元一年的高级会员是每个月10分钟的数字人生成视频时长或高级+ 专业音色的文本配音服务二选一,以及每天50次的智能工具等。而在数字人定制上,目前照片定制数字人形象的价格为首年3999元,视频定制数字人形象的价格为首年7999元(如图5)。
值得一提的是“腾讯智影”内部已经嵌入了金币体系,部分服务需要使用“金币”付费,而金币除了注册时赠送的1000金币外,还可通过签到等活跃行为获得。
抛开数字人的打造,“腾讯智影”本身是一款影音剪辑工具,对于不少“小白”用户而言,其在文本配音、视频剪辑等方面的工具属性更具实用性。
在“腾讯智影”主界面中点击“文本配音”后进入相应编辑界面,在顶部菜单栏找到“导入文本”的选项,平台支持doc、docx、txt 等格式的文本,默认文本上限 8000 个字,足以满足半小时左右的配音需求了。不同于其他视频剪辑软件,用户能对配音的节奏(整体速度、局部速度)、发音等等进行调校,最为强大的地方是智影“文本配音”支持不同句、不同字添加不同配音,比如旁白、开场都可以选用不同的人声(如图6)。
除配音功能非常人性化外,“文本配音”本身预置了数十款配音素材可选,用户可以根据视频配音、文章播报、新闻播报、有声小说、语音助手等分类快速选择最适合自己的配音模板,而且顶部还有语气和情绪的分类,再加上“百变”标签人物下的方言选项,足以为用户带来灵活多变的文本配音。
而对于高阶玩家,“文本配音”还提供了“定制专属音色”服务,系统可根据用户上传音色进行“声音复刻”,从而打造独一无二的配音(如图7)。
除了极其强悍的配音功能外,视频剪辑也是“腾讯智影”的基础功能。从素材到音轨,从转场到特效,“腾讯智影”的视频剪辑功能可以说是相当强大,无论是初学者还是专业剪辑师都能快速上手。
素材和快捷键可
以說是“腾讯智影”剪辑功能的一大特色,在轨道区进行创作,免不了对素材进行雕琢,智影目前已具备十余种素材调整操作功能,而且右上角的快捷键栏也上线30 余个预设快捷键,极大提升了剪辑效率。
相对功能强悍的PC版,微信“腾讯智影”小程序同样能够实现数字人、智能配音等热门功能,但受限于手机操作空间,视频剪辑等功能并非其主打,而是引入了当下最热门的“AI绘画”。
进入AI绘画页面后,发现“腾讯智影”在绘图方面支持文本生图和图生图两种生成方式,其中图生图只能生成动漫风格一种风格,但可以额外添加文字修饰,以更加准确地生成自己想要的效果(如图8)。
而文本生图支持的风格则比较多元,有2D动漫、2.5D动漫、国风、彩漫、素描、线稿、人像特写、油画、印象派共9 种,比较遗憾的是暂时只支持生成人像。从最终生成效果来看,“AI绘画”最终成像效果还是比较让人满意了。
总体而言,“腾讯智影”本身并非全新产品,本次在AI 上的升级,让其不仅兼顾了市场上已有的功能,而且更是从一个视频创作工具升级为“智慧”的创作助手,无疑能进一步解放短视频创作者生产力,更让入门级用户也能通过数字人践行自己的想法,极大地推动了AIGC内容产业落地。