人工智能数字卫生工作者
可能大家都看过《阿凡达》《蜘蛛侠 II》《猩球崛起 I - III》等好莱坞的商业大片,给人们留下深刻印象的,莫过于这些电影的炫丽特效。但大多数人都是影院观看一次,过个眼瘾就完了;除非是做电影与动画方面的专业人才,或许也没有太多人想去深入了解电影背后的技术。
但如果你是一名资深影迷,那么一定对 CG(Computer-Generated,电脑生成)技术并不陌生。它是一种借助计算机来制作动画的技术,大致可以分为二维动画(2D)和三维动画(3D)两种。
电影《阿凡達》
作为“电影史上 10 大里程碑之作”之一的《阿凡达》来说,它之所以被广大影迷称为“奇迹之作”,除了其背后隐喻的人文争议、导演卡梅隆进行的多角度投入等因素之外,就是因为这部电影是用了 CG 动画的 3D 技术来拍摄的,让人们在观影时体验到了近乎完美的身临其境的感受。
那么,这部“传奇”电影是怎样做到这一点的呢?《阿凡达》中体现的“里程碑”级的 3D 效果,不仅仅是因为使用了自行研发的 3D 摄像机和虚拟摄影机,还在于应用了一项能保留演员细致表情的技术,进一步加深了营造电影真实感的砝码。在此之前使用 CG 技术拍摄的电影,比如《最终幻想》等,往往因为人物面部表情僵硬,让人一眼就判断出是用了电脑特效,从而失去了真实的沉浸感。
而《阿凡达》中角色面部表情无比真实的原因,要归功于电影制作团队中主要负责计算机生成面部工作的 Mark Sagar。他也因为在《阿凡达》和另一部应用该面部表情技术的电影《金刚》中的出色工作,分别在 2010 年和 2011 年获得了奥斯卡科技奖。
Mark Sagar 副教授目前是奥克兰大学生物工程学院动画技术实验室的主任,旨在创造自主互动的动画系统,助力下一代人机互动和面部动作技术的发展。他从构建模仿人眼的机器开始,目前的研究方向包括开发结构合理的虚拟眼睛和创建生物力学模拟解剖的真实模型;这将是一个通过数学和生理学,将逼真的人类特征结合计算机图像的案例。
baby x尝试画一个心形
除了学术研究之外,Mark Sagar 还联合创立了一家专注于开发具有情感响应功能、并有着个性和特色的虚拟形象公司 Soul Machines(后文统称:灵魂机器)。灵魂机器的总部位于新西兰的奥克兰市,由 AI 研究人员、神经科学家、心理学家、艺术家和创新思想家等构成,目前已成功为梅赛德斯奔驰、SKI-II 和索尼等公司定制了虚拟服务形象。
baby x 内部虚拟神经系统
另外,值得一提的是,世界卫生组织在 2020 年 7 月推出了首个人工智能数字卫生工作者 Florence。这是由灵魂机器公司所开发,并得到了亚马逊网络服务和谷歌云的支持。据悉,Florence 被用于驳斥关于 COVID-19 和吸烟的不实信息,并帮助吸烟者制定个性化戒烟倡议,可通过视频或文字全天向人们提供服务。
不要以为这只不过是给一个精灵或者某个同学配上一张脸这么简单,灵魂机器实际上从 4 个方面改善了人机交互体验:首先,其定制的形象十分逼真;其次,它所采用的数字 DNA(Digital DNA)技术可以保证迅速且规模化地创造及定制交互;此外,通过 AI 驱动的数字大脑还可以让虚拟形象识别交互者的面部表情,判断交互者的心情状态,并作出反馈,以便更深度且真实地进行互动;最后,其做出的虚拟形象还可以在与人的互动中不断学习,提升表现。
下面来看一个具体的例子—— Baby X。以自家女儿为原型,Mark Sagar 带领动画技术实验室研发出一个“永生”于屏幕中的数字宝宝—— Baby X,这个宝宝可以倾听并对语言给出表情和动作上的反馈。比如在 Baby X 在“生病难受”时、对话人不理睬她时,她就会表现出忧伤焦躁的行为和表情。而与其交互的人则需要像在真实世界照顾幼童一样,跟 Baby X 交流,使其“平静下来”。
AI 宝宝会自主反应、还会每天长大
除此之外,这个数字宝宝还会对虚拟网页做出反应。比如,你可以在屏幕中看到 Baby X 正尝试画一个心形,或者尝试弹虚拟钢琴等;交互者还可以与正在行为中的数字宝宝进行互动。
对 Baby X 内部进行解析,这个数字宝宝是由虚拟的神经系统驱动的,如果以虚拟透视解剖图来进行展示,可以看到这个虚拟的神经系统控制着她的一举一动,包括呼吸、心跳、动作和表情等。这个系统的中枢,就在虚拟大脑中,主要负责控制并发出对任意传感输入的反馈。
AI 宝宝完全模仿人的思考模式,以及行为过程
虽然目前来看,这些形象还有很多缺陷,比如口型或表情略为僵硬等,但不可否认,灵魂机器的开发成果看上去已经离人类很接近了。
当然,对于灵魂机器来说,其所在的研究领域也有着很大的发展空间。根据 Juniper Research 的研究,到 2022 年,对话助理每年将节省 80 多亿美元的成本,相比较之下,2007 年这一数字为 2000 万美元。另外,到 2020 年年底,聊天机器人预计将为 85% 的客户服务互动提供动力。
2020 年 1 月,灵魂机器在由淡马锡牵头的 B 轮融资中筹集了 4000 万美元,参投机构包括 Lakestar 以及现有投资者 Horizons Ventures、奥克兰大学发明家基金、Salesforce Ventures 等。继2016 年 11 月完成 750 万美元的 A 轮后,本次融资交易将使灵魂机器的总投资增加到近 5000 万美元。
在新资金的加持下,灵魂机器的技术又有了哪些突破?不论从思想灵魂的角度,还是从数字机器的层面,这家公司在未来将会如何发展?他们的联合创始人 Greg Cross,将在今年的 EmTech China 全球新兴科技峰会上带你深入走进其技术应用的核心范围。(摘自美《深科技》)(编辑/费勒萌)