刘虹伶
近日,搜狗公司与新华社新媒体中心联合发布站立式AI合成主播,新的AI合成主播将从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”,这是全球首个AI合成主播。
全球首个AI主播惊艳落地
在2018年的互联网大会开幕当天,全球首个“AI合成主播”第一次亮相于众人眼前。据了解,它由搜狗和新华社新媒体中心共同打造,以新华社主持人邱浩为原型,实现高效的新闻播报。
AI主播不仅仅是新华社将AI技术引入新闻报道中的一次尝试,也是“搜狗分身”技术在新闻行业的一次实践。
搜狗CEO王小川表示,搜狗分身打造了AI合成主播,它利用搜狗的AI能力,从人类的声音语言习惯、表情及嘴唇动作等层面对AI进行拟人化训练,然后“克隆”出人类的分身,进而帮助人类提高信息表达和传递的效率。
说得通俗易懂一些,真人主播小吴面对镜头录制一段播报新闻的视频,搜狗分身通过这段视频可以将小吴的声音、嘴唇动作和表情这些特征进行提取,再通过语音、嘴唇动作、表情三者合成,加之深度学习等技术,“克隆”出于主播小吴几乎一模一样具备新闻播报能力的AI分身。
举例来说,主播小吴每天工作10个小时,一周工作七天,这样下来他每周工作时间是70小时。然而,只要有足够多的服务器,AI合成主播呈现无数个AI分身,就可以有N个主播小吴的AI分身在一天24小时不间断地工作。
相较于传统视频新闻需要漫长录制过程而言,AI主播只需要人工将文本输入就可以在短时间内生成新闻播报视频,并且无形中减少了主播播报新闻过程中的“失误率”。由此可见,AI主播的诞生和落地大大地节省了人力成本,同时也提升了传媒行业的效率。
据了解,AI主播从互联网大会落地开始就已经正式上岗,成为了新华社报道队伍中的一员。上岗至今的这三个月以来,首批入职的一中一英两位AI主播,已经生产3400余条新闻报道,累计时长达10000多分钟,其间还参与了第五届世界互联网大会、首届进博会、2019春运、春节等若干重要报道。
全球首个“AI合成主播”无疑是中国人工智能与传媒业大胆融合并付诸规模化应用的典型案例。
搜狗AI主播再次升级
如果说AI合成主播的落地给新闻主播们带来了“失业危机”的压力,那么主播们压力又升级了。
因为,搜狗再次升级,带来了全球首个站立式AI合成主播。对,这个AI主播除了能够播报新闻之外,还拥有了肢体语言能力。
据了解,搜狗此次升级除了让AI主播肢体语言丰富起来之外,声音更具有真实情感和表现力,在图像生成方面也实现了更加逼真的表情生成、自然的肢体动作以及嘴唇动作预测等能力。简单来说,AI主播可以站起来用更生动的方式播报新闻了。
AI主播的此次升级,不仅仅是提升了AI主播的表现力,同时也保持了搜狗在这一领域的全球领先。
除了可以站着播新闻,这位工作了三个月的AI主播还有了自己的名字——“新小浩”。而近日搜狗给新小浩带来了一位新同事,一个叫“新小萌”的全球首个AI女主播。“新小萌”的落地展示了“搜狗分身”技术的通用能力,这项技术可以持续“克隆”不同类型、不同特点的AI主播的“分身”。
据搜狗方面透露,最新推出的站立式AI合成主播将参与2019年全国两会的报道,并将在搜狗搜索、输入法等资讯平台上与用户见面。
随着搜狗与新华社达成的长期合作,更多的AI主播将不断涌现。由此也可以预见,AI主播正在成为AI时代信息资讯传播链条最重要的一环。
搜狗分身技术“克隆”人类
以“搜狗分身”技术为核心的AI主播交出的亮眼成绩单,我们可以看出以输入法、浏览器、搜索引擎起家的搜狗正在围绕人工智能展开更多触角。
搜狗分身是搜狗在多模态合成技术上的一次探索,它是人工智能在模仿人类领域的一次新进展。与此同时,搜狗的AI商业化落地也在同步推进。
新华社的AI主播是搜狗分身技术的第一个落地场景,它除了在新闻播报领域的应用外,其实还有更广泛的应用空间可以探索。
例如在线教育场景,利用搜狗分身做音视频的合成,在提升教育行业效率的同时,也可以增强与用户的互动性。
又比如虚拟助理,相较于目前应用最多的语音助手,带有形象的虚拟助理亲民度更高,在交互中也更加贴近人类的期待,这在未来也会是一个巨大的场景。
据搜狗CEO王小川介绍,“搜狗分身”技术未来还将应用于娱乐、医疗、健康、教育、法律、金融等多个领域。而搜狗也将在今年推出更加大众化的消费级智能硬件,目的为“争夺用户入口”。
搜狗AI商业化加速
从对AI主播的产品定位不难看出,对于人工智能技术的应用探索,搜狗还是致力于让机器成为辅助表达与信息获取的分身以及助理,这同时也是搜狗给技术落地提出的战略目标。
除了搜狗分身外,搜狗也在围绕语言与交互抢占行业赛道。
在搜狗搜索中,搜狗可以做到输入中文一键连接全球网页。
在C端场景,将AI引入搜狗输入法,推出AI制音坊,为自然交互的愿景代言。在智能硬件领域,发布拳头产品翻译宝Pro,围绕新闻媒体推出搜狗翻译笔,助力中英文的无缝转换。
在B端场景,搜狗推出机器同声传译、智能分诊,落地手机语音助手等抢占行业赛道。
以上种种举措,皆在传递着搜狗正在全方位释放人工智能技术的实力,在让沟通与表达变得更加简单和高效的理念指引下,切实为广大用户提供更加贴近生活并贴近人性的产品。
同时也可以明显感受到,搜狗的AI商业化也在加速。
根据公开数据,2018年搜狗输入法日均语音功能调用量已经达到了5.34亿次,这样的数据一方面凸显了搜狗输入法的头部地位,另一方面也彰显了人工智能技术在搜狗的各条产品线存在着更加广阔的应用场景与发展潜力。
搜狗由文字输入作为基础,不断地在语音、搜索、翻译等相关领域取得进展和突破,这些探索与尝试为搜狗在人工智能时代布局积累了大量且丰富的应用场景。
不可否认的是,兼具应用场景与技术实力将为搜狗发力人工智能提供原动力,我们有理由相信在未来搜狗将带给我们比AI合成主播更大的惊艳。
锌刻度记者观点:搜狗的AI商业化,未来可期
搜狗分身技术的推出代表着搜狗在多模态交互、语音合成、唇语合成等前沿技术上的进一步探索。而另一方面搜狗开始推动这项技术进入行业,此次是与新华社一起推出AI主播,未来还会进入更多行业,以及探索更多的商业落地。
除了要夯实基础技术的积累沉淀,還要深化AI落地,一向低调的搜狗正全面加速AI的商业化进程。