李建刚
数字人(Digital Human,简称DH)代表了媒体和科技领域的一项重要创新,它是虚拟实体的一项显著成就。借助人工智能和计算机图形技术,能够高度逼真地模仿真人的外貌、声音和行为,但是在模拟连续思考和主观决策方面尚存在一些技术挑战。可以肯定的是,数字人作为新兴媒体形式,正在重新定义并深刻影响着人工智能与人类之间、人与人之间以及社会整体互动的方式。
数字人通常被理解为一种数字化身(digital avatar),允许用户完全改变其身份为虚拟存在。通过这种虚拟身份,用户可以将其视为真实人的数字表现,或者创造独特的角色并为其编写身份脚本。
这个概念的普及和发展部分要归功于好莱坞的科幻电影,比如《猩球崛起》和《阿凡达》。随后,视频游戏工作室也继续推动了数字人的技术应用,例如Quantic Dream 开发的视频游戏,将真实演员转换为数字副本(digital copies),可以在游戏机和个人电脑上运行。与此同时,数字角色和声音合成技术的发展也为数字人的逼真性和流畅性作出了贡献。数字人的制作涉及传统动画制作的三个主要步骤:模型创建、动作捕捉和实时渲染。在模型创建阶段,演员佩戴特殊的标记设备,以创建脸部的3D 模型。人体动作需要由多个摄像机持续拍摄。这些摄像机捕捉每一帧和不同角度的动作,并将数据传输到负责渲染数字角色的系统中。对于数字化身,这些模型会通过演员的真实表情和动作来实时驱动,以呈现更逼真的外观和行为。
数字人的概念起源和发展根植于计算机科学、人工智能和计算机图形学等多个领域。在20 世纪60 年代到70 年代,研究人员开始尝试使用计算机生成简单的虚拟角色和图形。随着70 年代到80 年代人工智能和自然语言处理技术的迅速发展,研究人员开始将注意力转向如何使计算机能够理解和生成人类语言。这一领域的进展为数字角色生成提供了基础,使它们能够模仿人类的对话和语音。80 年代到90 年代,计算机图形学领域取得显著进展。研究人员开始应用三维建模和渲染技术来创建逼真的数字角色。这些技术的发展为数字人的外观和行为提供了真实的效果。从20 世纪90 年代至今,视觉效果和电影工作室创造了众多经典的3D 角色形象,推动了数字角色技术在传媒业和娱乐产业中的采用。进入21 世纪,人工智能、深度学习、神经网络、计算机视觉等领域的新成果和新突破产生协同效应,计算机和软件引擎已经能够满足实时图形处理,演员动作和3D 模型结合起来的延迟时间可以控制在观众难以察觉的范围内。
今天的人们无需依赖专业工作室设备或大量预算即可创建自己的数字角色和身份。在设计与制作成本大幅降低的同时,数字人技术已经演变为一个复杂领域,涉及先进技术和专业知识的综合运用,这为未来的媒体、娱乐、教育和社交互动提供了广阔空间。
在当今信息爆炸的屏幕时代,人们面临巨大的信息量和多任务处理的挑战,这被形象地称为“数据洪流(Data Deluge)”。在这个背景下,新一代数字人应运而生,它们融合了不同技术领域的最新进展,呈现出前所未有的高级功能和强大应用潜力。它们不仅仅是媒体内容中的参与者,而且正在逐渐演变成一种全新的人机媒介。借助人工智能系统,这些数字人具备了理解复杂模式、适应新情境,并不断提高性能的能力。它们有助于帮助人们在多任务环境下处理庞大的信息流,同时集中精力关注和思考重要问题。这一趋势代表着数字人在塑造和改善人机互动方面具有重要的价值。
数字人的发展还包括情感连接与智能互动的交叉领域。巴黎理工学院研究主任凯瑟琳·佩拉乔德在1994 年开发了他们第一个自主代理角色,从那时起,她研究的重点就是集中在如何使数字代理角色更具表现力,以便理解和适应用户的情感。借助人工智能和先进的算法,数字人能够建立深层次的情感联系,可以更好地理解和响应用户的需求。通过分析用户的面部表情、声音语调以及文本中的情感线索,数字人可以理解用户的情感状态并相应调整其互动方式,这种情感智能可以应用在多个领域,例如提供鼓励、幽默等情感和心理支持,从而大幅增强了互动的人性化程度。
数字人的创建涉及数学算法、人工智能技术和物理模拟的复杂组合,以支持其运动、行为和物理特性。人工智能和机器学习技术赋予数字人语言理解、情感识别、问题解决和决策能力。语音技术通过合成和串联的方式产生语音,利用机器学习算法捕捉人类语音的微妙之处,如音调、音色和节奏等。认知架构构成了数字人行为建模的核心,将各种智能技术融合在一起,以模仿类似人类的认知过程。情感模型进一步增强了数字人的行为,允许虚拟实体感知并回应人类的情感。
我们已经目睹了在新闻广播中,主持人以数字化身和相同的声音来传递信息。未来,在教育和学习中,历史上的重要人物也许可以在电子课程中与学生进行互动。总之,整个行业都将受到人工智能驱动的数字人技术的影响。数字人具有与人自然对话的能力,以自然的方式进行实时响应,甚至可以提供屏幕指南和视频来协助用户进行互动。我们将在日常生活中看到更多的数字人,帮助我们完成各种任务,而每个人也将逐渐拥有自己的数字版本。数字人未来将在智能决策方面发挥关键作用,其海量知识储备和智能化的知识分析处理能力,必然会激发研究人员进一步深入探讨语言理解、知识表达、逻辑推理等复杂认知任务以及相关伦理体系的研究和底层设计。
数字人的崛起正在改变我们与社交媒体和数字平台互动的方式。随着人工智能能力不断增强,我们也意识到伦理和道德风险的显著增加,这些风险正在对社会空间产生深远影响。因此,如何在应用设计和伦理规范方面前瞻性地引导这些技术,以促进社会个体的参与和连接,而不是加剧数字社会中的分裂和不平等,成了亟待解决的问题。
长期以来,数字人被认为难以真正实现与人类的互动,因为它们受人类控制,并受其程序决定其言行。麻省理工学院教授贾斯汀·卡塞尔曾提出这样的问题,“如果数字人被黑客攻击并发表贬低性言论,会导致什么后果?”它可能引发一系列事件:首先是法律后果,这些言辞可能触犯法律,特别是如果它们构成诽谤,涉及名誉、隐私或商业价值方面的侵犯。虚假信息和欺骗是数字人技术所带来的首要风险。恶意使用数字人技术可以轻松制造虚假信息和欺骗,威胁到媒体信息的可信度,破坏公共秩序。数字人能够以逼真的方式模仿真人外貌和言语,这使虚假信息更难以被识别。在社交媒体和新闻传播领域,这已经成为重要问题。其次,隐私保护方面的问题凸显了数字人技术的风险性。数字人技术涉及大量个人数据的收集和处理,面部识别技术的应用使得用户面部特征可能被不当地获取和使用。随着数字人的数量不断增加,一些程序甚至可能在未获得真人同意或授权的情况下被应用。由于涉及个人数据的安全性和滥用问题,这会引发严重的隐私担忧。用户需要更多的控制权和透明度,以保护其个人信息和隐私权。第三,数字人技术可能对一些行业和职业造成冲击,特别是在媒体和传播领域。AI主播可能逐渐取代真实的媒体从业者,如新闻主持人和播音员。这可能引发失业问题或产生职业不稳定性现象,需要采取政策和培训措施来帮助受影响的人员重新就业或提高技能。最后,数字人技术本身也面临着技术漏洞和安全威胁。由于技术系统的复杂性,数字人可能受到黑客攻击或存在其他潜在安全漏洞。这可能导致数字人被滥用,例如用于恶意目的、虚假信息的传播或网络诈骗。
这些伦理挑战和风险需要跨学科的合作来解决,涵盖技术、法律、伦理和政策等领域,以确保数字人技术的发展不会损害社会公共利益和安全。同时,用户教育和媒介素养的提高也是面对这些挑战的关键因素。
数字人的应用领域广泛,涵盖了匿名性需求和媒体内容创作等多个领域。不仅是传媒业和娱乐产业,科技企业也积极探索数字人技术,以创建虚拟顾问和改善用户体验。未来社会可能需要建立以真实人特征为本体模型,以数字人角色为社会延展的多层级、多维度网络安全风险评估体系,这有助于前瞻性监测和现代化管理。政府部门和网络安全监管部门需要加快建立和完善与数字人相关的法律法规,以防范网络安全攻击,并推动数字文化的发展。
通过持续的研究和合作,我们可以更好地理解数字人的潜力和挑战,同时确保其发展符合社会的利益和价值观。这一领域的不断发展将为我们创造更广阔的数字未来,激发创新,并推动社会朝着更加智能化和紧密连接的方向迈进。