你好,虚拟数字人

2022-06-16 23:43勒川
中关村 2022年6期
关键词:数字

勒川

2021年4月,在英伟达GTC发布会上,身着标志性皮夹克的黄仁勋现身。期间,为了展现英伟达的Omniverse技术,合成了一个虚拟厨房和“老黄”。随着镜头逐渐拉远,老黄被分解,特效完成之后,老黄消失。然后在此出现的厨房和老黄,就是用Omniverse生成的“数字复刻版”。在这个假厨房中,英伟达还特地加入了一些彩蛋。比如右下角的国旗和乐高小人,一瓶据说是带着自家logo的橄榄油,还有左边的厨具也被换掉了。

尽管英伟达回应称,虚拟人只出现了14秒钟,其他部分全部为真人演讲,但是由于黄仁勋的形象过于逼真,引发大众对于虚拟现实、AI换脸等技术的诸多讨论,“黄仁勋骗过了全世界”一度登上热搜榜,而虚拟数字人也成为更多人所关注的话题。

2021年被公认为是“元宇宙元年”,虚拟数字人借势火爆出圈,它们有的主持节目,有的能唱能跳,还有的是美妆博主,可谓百花齐放。其实,这股风潮在2020年底就已经初现端倪。虚拟人“集原美”入驻小红书,迅速收获流量与点赞;翎Ling初出茅庐即与真人选手同台选秀,一曲《天女散花》向世人证明了她东方面孔下对传统文化的纯粹热爱。唱京剧,穿国潮,拜师学艺,传承并焕新古老的传统文化,各路品牌合作也纷至沓来;阿喜Angie也以清新治愈的風格吸粉上万,目前在抖音、微博、哔哩哔哩等平台,阿喜每条视频的播放量都在数千至几十万不等。此后,她更是拿下钟薛高、雅迪电动车等品牌的联名机会。

2021年6月15日,清华大学计算机系举行“华智冰”成果发布会,宣布“华智冰”正式“入学”,清华大学迎来中国首个原创虚拟学生。与一般的虚拟数字人不同,华智冰拥有持续的学习能力,能够逐渐“长大”,不断“学习”数据中隐含的模式,包括文本、视觉、图像、视频等,就像人类能够不断从身边经历的事情中来学习行为模式一样。随着时间的推移,华智冰针对新场景学到的新能力,将有机地融入自己的模型中,从而变得越来越聪明。

今年1月7日,尚美生活发布酒店行业首个数字虚拟数字人“尚小美”;4月18日,云南首个虚拟数字人“云诗洋”正式发布。“云诗洋”的研发核心技术创意环节都由云南升维科技研发团队完成,全链条自主可控。未来“云诗洋”将首先应用于云南公益宣传、直播带货、品牌传播、文旅推介等业务场景,同时致力于赋能乡村振兴、民族团结、生态文明,打造辐射南亚东南亚的云南原生科技文化产品,为中国梦的云南篇章贡献优质的“科技标杆”和“文化标杆”。

北京冬奥会期间,“冬奥手语播报数字人”每天在北京卫视《北京您早》节目中对“冬奥赛事集锦”和“一起看冬奥”进行手语播报,便捷听障人士收看赛事专题报道,提升他们的社会参与度和幸福感。“冬奥手语播报数字人”采用我国首个超大规模智能信息模型和虚拟数字人技术,是由北京市科委、中关村管委会和北京市残联发起,科技冬奥专项支持,由智谱AI、凌云光和北京广播电视台联合打造。

《中国虚拟数字人影响力指数报告》中指出,2021年元宇宙概念兴起,叠加疫情下国人对虚拟内容需求增加、消费级VR硬件快速发展,虚拟数字人发展进入快车道。虚拟数字人将成为元宇宙最核心的交互载体和入口,每个人都可能用虚拟分身进入元宇宙,沉浸式体验游戏、娱乐、社交、教育、运动等数字化内容,开启“第二人生”,追求更真实、更理想的自我。

大幕拉开,我们即将进入数智化时代。元宇宙方兴未艾,而虚拟数字人也将迎来属于它的春天。

前世今生

“元宇宙”一词最初源自美国科幻作家尼尔·斯蒂芬森(Neal Stephenson),他在1992年出版的科幻小说《雪崩》(Snow Crash)中创造了两个概念:元宇宙(Metaverse)和虚拟分身(Avatar)。“虚拟分身”在中国发展至今,拥有了更广泛的称呼:“虚拟数字人”(Metahuman)。

从技术层面看,虚拟数字人可以理解为通过计算机图形学、语音合成技术、深度学习、类脑科学、生物科技、计算科学等聚合科技创设,并具有“人”的外观、行为、甚至思想(价值观)的可交互的虚拟形象。虚拟数字人具备三方面特征:一是拥有人的外观,具有特定的相貌、性别和性格等人物特征;二是拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;三是拥有人的思想,具有识别外界环境、并能与人交流互动的能力。

自工业革命起,以机器代替手工劳动就成了人类努力的方向。随后,第一台计算机的发明,让机器开始升级为“人工智能”。步入互联网时代后,“人工智能”更是加快了替代手工劳动的步伐,并从基础的体力劳动层面渐渐转向创意、创作层面。

2001年,传媒业迎来了“开辟新天地的创举”——世界上第一个虚拟主播阿娜诺娃(Ananova)诞生了。CNN这样评价她:“一个可播报新闻、体育、天气等的虚拟播音员,堪比一个真实的有血有肉的主持人”。此时的阿娜诺娃还是个只有头部的二维动画,不过因为技术、成本高昂等因素限制,她并没有再优化升级。

翎Ling初出茅庐即与真人选手同台选秀

F23E3869-7B9C-4AF8-8CEF-6B8325AA8095

此后,日本推出了寺井有纪(Yuki),中国推出了歌手虚拟主持人阿拉娜(Alana),美国推出了薇薇安(Vivian),韩国推出了露西雅(Lusia)。从2D到3D,从只有头部到拥有全部身体,从只有虚拟人物播报到拥有演播室进行播报,虚拟主持人日渐成熟。2004年,央视CCTV-6频道推出了国内首位虚拟电视节目主持人——小龙,点燃了国内CG技术从电影级走向消费级的星星之火。

在艾媒咨询发布的《2022中国虚拟人行业发展研究报告》中,将国内虚拟人产业的发展历程分为四个阶段:萌芽阶段(1980-1999)、探索阶段(2000-2014)、初级阶段(2015-2019)、发展阶段(2020至今),而发展阶段的特征是,“技术、需求均有突破,虚拟偶像凭借独特的人设吸引年轻群体。”

虚拟数字人的分类有多种,技术上可以分为智能驱动、真人驱动两大类。应用上则包括了身份型(如真人虚拟分身)、服务型(如虚拟员工)、表演型(如虚拟偶像)三大类。这两年,我们可以明显地看到虚拟数字人的火爆及其应用场景的变化。在今年的北京冬奥会上,体育明星谷爱凌的数智分身“Meet Gu”、百度智能云AI手语主播、腾讯3D手语数智人“聆语”、AI气象服务虚拟人“冯小殊”等纷纷“上岗”就业——这些数字人的出现让大众对于虚拟数字人有了更直观、更深入的认知。

随着计算机图形学、深度学习、语音合成、类脑科学等聚合科技的进步,虚拟数字人正逐步演进成为新物种、新媒介,越来越多的虚拟数字人正在被设计、制作和运营,应用场景得到了极大的扩展,应用价值正逐步被发掘,激活了元宇宙生态,將成为未来人类进入元宇宙的重要载体。

国重实验室大数据中心首席科学家沈浩教授认为:“虚拟数字人正逐步演进成新物种、新媒介,是人类进入元宇宙的重要载体和媒介的延伸。”

风生水起

虚拟数字人的兴起,一方面得益于元宇宙概念盛行,另一方面,虚拟数字人相关技术包括CG、语音识别、图像识别、动捕等的共同成熟,以及上述各类应用于演唱会、代言、走秀、短视频的数字人的“出圈”。如今身份不同、形态各异的虚拟数字人逐渐融入更多元的场景。

云游戏、影视制作、虚拟娱乐、虚拟主播等领域已经广泛应用虚拟数字人,基于更成熟的软硬件一体化技术,从建模、驱动、渲染、剪辑、合片等流程逐步实现自动化、实时化和智能化,相比真人表演有更自由的发挥空间,创作内容和延展空间得到释放,创作者之间可以在线协作、高效协同,大幅提升内容制作效率,极大地降低生产成本。

品牌代言、虚拟演唱会、虚拟直播等已经成为虚拟偶像、虚拟主播的主流应用场景。虚拟偶像的人设、言行等由品牌方掌握,比真人明星的可控性、安全性更强,还可以延展应用在元宇宙中更多元的虚拟场景,实现多圈层传播,虚拟偶像IP化将成为流行趋势,粉丝经济在快速崛起。

虚拟数字人在传媒、教育、金融、医疗、体育等领域将得到愈加广泛的应用,为企业数字化转型发展提供了新的路径,并将发挥越来越重要的作用,有助于企业生产经营提质增效。例如虚拟主播可以“全年无休”、24小时实时播报新闻;虚拟手语主持人可以缓解真人手语主持人稀缺问题,有效解决听障人士沟通难题;虚拟员工则可以扮演客服、导游、助手等功能性角色,不仅提高效率,还具有陪伴、关怀等外延性价值。

湖南卫视的数字主持人小漾,自推出之时就被定位为实习主持人,随着《你好星期六》节目的播出,“跑调”“追星”等标签让小漾的个人风格更加明晰。据了解,节目组还给小漾设定了一条从实习到转正的成长线。

面对新行业机遇,互联网公司、AI企业和硬件厂商均入局虚拟人赛道

中国首个超写实数字人AYAYI自2021年5月亮相,一夜之间吸引了近4万粉丝,其小红书账号首发帖点赞已超10万。2021年9月,AYAYI宣布入职阿里,成为天猫超级品牌日的数字主理人。据悉,目前,AYAYI已经和娇兰、保时捷等品牌达成合作。

此外,虚拟歌手洛天依,近年来多次献唱卫视春晚、跨年演唱会、综艺节目等,演艺经历丰富;虚拟美妆达人柳夜熙,仅在抖音发布6条视频,已有粉丝数超800万。

由中国信息通信研究院云计算与大数据研究所牵头编写的《2020年虚拟数字人发展白皮书》指出,当前虚拟数字人理论和技术日益成熟,应用范围不断扩大,产业正在逐步形成、不断丰富,相应的商业模式也在持续演进和多元化。

艾媒咨询数据显示,2020年中国虚拟偶像核心市场规模为34.6亿元,预计2021年将达到62.2亿元;2020年虚拟偶像带动周边市场规模为645.6亿元,预计2021年为1074.9亿元。此外,有八成以上的网民都有追星行为,其中喜欢追虚拟偶像的有63.6%的网民。艾媒咨询分析师认为,虚拟偶像或许没有成人的思想,但根据粉丝需求策划的偶像,能最大程度满足粉丝的想象,有利于积累更庞大的粉丝群体。

市场研究机构量子位《虚拟数字人深度产业报告》指出,预测到2030年,我国虚拟数字人整体市场规模将达到2700亿元。其中,身份型虚拟数字人市场规模预计为1750亿元,占主导地位;服务型虚拟数字人的总规模则超过950亿元。

兵家必争

受益于人工智能技术的突破,一众虚拟数字人如雨后春笋般出现。面对新行业机遇,互联网公司、AI企业和硬件厂商均入局虚拟人赛道。纵观全球,Meta、英伟达、微软、Roblox、EPIC、腾讯、字节跳动、阿里巴巴、网易、百度、科大讯飞、华为、爱奇艺、B站等皆开启了“造人竞赛”。其中,Meta、腾讯等超级巨头,通过软件、硬件、应用场景、超级IP打造的全面布局吹响行业冲锋号;英伟达、百度等老牌技术大厂,则基于AI技术积累为行业探索技术基建;Epic、网易、爱奇艺、B站等则不断丰富虚拟数字人的内容及应用,为数字生活提供更多服务。F23E3869-7B9C-4AF8-8CEF-6B8325AA8095

冬奥期间,央视主持人朱广权和AI虚拟人手语主播的一条pk短视频引发了全网关注。画面中,朱广权金句频频,语速惊人。而一旁的虚拟人手语主播也是见招拆招,根据朱广权的话同步即时进行手语翻译,成功完成了挑战。如真人一般,穿着正装,亲切自然地播报新闻,这就是由央视新闻联合百度智能云打造的“AI手语主播”。目前,百度已打造了央视网虚拟主持人小C、航天局火星车数字人祝融号、百度App代言人龚俊、理财专员小浦等一系列虚拟数字人。

科大讯飞通过先进的AI技术,牵手央视打造的“3D虚拟冰冰”,拥有媲美真人的立体化身形,还解锁了东北话、英语等多達31种语言技能。首先是声音上,采集录制真人的声音素材,通过声音标注、机器深度学习算法等构建发音声学模型。然后利用3D虚拟人的肢体动作控制、AI驱动口唇表情合成等技术,结合王冰冰真人的特征进行3D建模,模拟出精准的口型、灵动的神态与动作。

腾讯旗下有NExT Studios工作室,该工作室专攻前沿技术以及创意研发,拥有是实时高保真数字人技术,曾推出一个名为Siren的虚拟数字人。而网易旗下则有专注于游戏与泛娱乐AI研究的伏羲工作室,并且该工作室在数字人与游戏的结合上做了不少尝试。

B站方面曾在2019年收购上海禾念,让洛天依等一众超人气虚拟偶像成为bilibili的“员工”。同样地,字节跳动去年投资了成立不到两个月的杭州李未可科技有限公司,该公司推出了虚拟数字人“李未可”。据“李未可”的主创团队介绍,公司要把“李未可”打造成中国第一个真正有情感连接的AI虚拟数字人。

商汤科技的SenseMARS Agent数字人经过不同领域的知识数据库训练,已应用于购物中心、银行、线上客服、博物馆、展馆、旅游景区、机场等多种行业和领域。比如在交互方面,基于商汤的AI技术,SenseMARS Agent数字人可以实现口型准确、动作逼真,并与真人之间进行智能对话等交互应用。

清博智能的虚拟人产品,凭借着长期积累的“自然语义分析”等能力,可以做到通过文字来驱动虚拟人去讲话,并已经成熟应用在虚拟人培训、演讲和直播带货等多个场景中。“元娲虚拟人生产力服务平台”和数字藏品等服务,已经在广泛的成熟应用。另外,对于企业希望获得“元宇宙”的整合营销、解决方案,以及如何在这个时代下去转型,清博智能都有相应的服务提供。

天神娱乐近日在投资者互动平台表示公司近期新设立了控股子公司北京元境数字科技有限公司,其主营业务为打造虚拟数字人制作平台,进行虚拟主播、虚拟偶像等虚拟数字人的开发,服务电竞游戏、品牌营销等领域。

科技大厂之外,乐华娱乐、次世文化、创壹视频等影视文娱、传媒、短视频厂商也在致力于虚拟数字人生态打造。这些企业的进驻和耕耘,一定程度上加速了虚拟数字人行业的发展速度。

据启信宝数据,2020年国内虚拟数字人相关企业新增数量为36080家,2021年该数据达到66293家,同比增长80%。天眼查数据显示,我国现有“虚拟数字人”相关企业约30万家,近5年新增注册企业增速复合增长率近60%。

虚拟数字人领域也是备受资本青睐。2022年以来,虚拟数字人领域融资数量近百起,融资金额达4.11亿元。有数据显示,2021年虚拟数字人相关企业融资共有2843起,融资金额为2540亿元。而2020年虚拟人相关企业融资有1713起。不仅如此,红杉、IDG、顺为资本在内的一线基金纷纷入局,总融资金额达到近8亿元。

作为探索元宇宙“新物种”,虚拟数字人无疑打开了新世界的大门,这条赛道已渐成兵家必争之地。

难题待解

无数经验告诉我们,机遇总是与挑战并行。在虚拟数字人行业井喷式发展的同时,也有更多的挑战亟待解决。

国内虚拟数字人产业下游消费市场发达,但综合市场情况来看,产业上游技术端颇为薄弱,不少企业面临着成本和变现难题。并且随着资本的涌入,企业还不得不面对竞争加剧和政策监管风险。

腾讯智能产品副总裁李学朝认为:“上下游产业平台的缺失,在很大程度上制约产业化发展,同时也为该产业的投资设立了无形门槛,而且制作方式自动化较低、生产门槛高、关键技术不够成熟,以及技术人才、综合人才的缺乏,也一定程度上限制了虚拟人的发展。”

在李学朝看来,目前虚拟数字人产业发展面临的难题主要在技术方面。语音识别属于感知智能,而让机器从简单的识别语音到理解语音则上升到了认知智能层面,机器的自然语言理解能力如何也成为其是否有智慧的标志。自然语言理解是人工智能的难点,计算机怎么去表示、获取、学习知识,并将知识与数据结合是个挑战。所以,未来虚拟数字人发展的破局关键在于“深度的场景理解”和“有效的技术提升”。

百度智能云AI人机交互实验室负责人李士岩表示,虚拟数字人规模化落地还面临三大难点:产业链割裂、服务场景与演艺场景没有有效打通、满足高频需求成本高。首先,数字人产业链各个节点相对割裂,不能高效协同,导致数字人在制作和调优上存在较高壁垒,目前行业中大多数公司只是数字人制作与运营全流程上的一环或其中几环;其次,服务场景与演艺场景没有有效打通,表现为演艺型数字人不具备客户所需的业务能力,而服务型数字人缺乏人设,难以与用户进行情感交流;第三是满足高机动性、高频需求的成本依旧很高,这一问题归根结底还是数字人的生产效率问题。

《2020年虚拟数字人发展白皮书》认为,虚拟数字人作为新一代人机交互平台,仍处于发展期,还未有统一的通用系统框架,并且虚拟数字人发展有一定的制约阻碍,制约虚拟数字人产业发展的因素主要有以下几个方面:政策环境层面,行业依然处于培育期,缺乏政策与资本扶持;技术应用层面,制作方式自动化程度低、生产门槛高,关键技术还不够完全成熟;人才培养层面,技术人才、综合人才极度缺乏,人才供应体系不完善;标准体系层面,行业内缺乏统一技术标准和体系,产品质量良莠不齐;安全伦理层面,相关法律法规和伦理规范尚待完善,存在潜在风险。F23E3869-7B9C-4AF8-8CEF-6B8325AA8095

虚拟数字人技术在发展中会引发一些法律问题和伦理风险,需要提前建立相关制度进行防范。虚拟世界里面的虚拟人物所有权、犯罪行为尚没有法律上的界定。虚拟数字人带来的沉浸式体验可能会对用户的精神、心理状态带来影响,改变用户在脱离虚拟世界后的行为,比如可能会增加暴力傾向,存在一定伦理风险。

未来将至

作为新技术、新产业,虚拟数字技术被纳入“十四五”规划纲要,其创新应用将成为我国产业创新的必经之路。《中国虚拟数字人影响力指数报告》中提出了对虚拟数字人行业的发展八大展望。

预计2025年虚拟数字人的“繁衍”速度将超过地球人类的繁衍速度;虚拟数字人将成为人机交互新界面,承载数字世界的沉浸式体验;可编程的虚拟数字人将实现智能化、规模化生产内容,并形成新的产业生态;2030年,中国虚拟数字人赛道将诞生出超过10个独角兽企业;AI情感算法、多模态人机交互、类脑科学等技术在虚拟数字人产业带动下得到跨越式发展;虚拟数字人产业将催生“中之人”“技术美术”Vup等新职业,相关产业人才缺口高达100万;虚拟员工成消费品、金融、地产、物业、教育、文旅等服务行业标配;随着虚拟数字人的爆发式增长,可信数字身份治理体系和网络安全体系建设迫在眉睫,亟需建立可追溯的分布式数字身份体系。

正如互联网时代的许多新事物一样,虚拟数字人也必将经历“雨后春笋到大浪淘沙,以及适者生存”的考验。腾讯NExT Studios团队认为,作为科技产物,虚拟数字人背后的“魂”或“神”,依旧需要依托人,或者人工智能完整表达。随着计算机图形技术、动捕技术以及AI技术的发展,虚拟数字人将在场景技术、情感技术、交互技术上产生长足的进步,这就会让未来的数字人越来越接近于真人,甚至于超越。

整体来看,虚拟数字人的进化路径由拟人化走向同人化,最终将走向超人化,实现归真超实。在拟人化阶段,虚拟数字人是由计算机虚拟合成的、高度逼真的三维动画人物;在同人化阶段,虚拟数字人的外观、情感、交流能力、理解能力等各方面与真人相同;在超人化阶段,数字虚拟人的能力将超越自然人。

未来虚拟数字人的发展不能单独依托技术,要拥有足够的竞争力,必须打造全新体验,对整个应用场景深刻理解。满足用户需求,给用户前所未有的情感体验,让用户接纳虚拟人,才是虚拟人走向成功的必经之路。

在元宇宙设想中,现实人类需要凭借虚拟人化身存在于虚拟世界中,该分身将参与虚拟世界的社交、娱乐和商业交易。虚拟数字人化身是未来元宇宙的重要组成部分,是人类前往虚拟世界的通行证和在虚拟世界中的身份标识。

乘着元宇宙概念火爆的东风,以及数字人技术和商业化的双重发展,属于虚拟数字人的时代正向我们款款走来。未来,随着视觉呈现技术的不断革新,虚拟数字人会以前所未有的方式一次次打破人们原有的认知,为用户打造无与伦比的体验,延伸出更多产业化的数字人应用,这将是一片崭新的蓝海——就让我们拭目以待吧。F23E3869-7B9C-4AF8-8CEF-6B8325AA8095

猜你喜欢
数字
数字
创意数字“6”
数字等
是什么被挡住的数字
数字
数字
成双成对
成双成对
数字变变变