白静
人脸交换技术,顾名思义,就是在图像或视频中把一张脸替换成另一张脸。这一技术在电影制作领域已经不是个新鲜词了,它需要专业的视频剪辑师和特效专家花费大量时间和精力才能完成。
最近出现的换脸视频可以说是人脸交换技术的一个突破,人工智能把A的面部关键信息记录下来,如下图所展现出的嘴巴、鼻子、眼睛等信息,并且将这种信息反复重建和自我改进,最终可以完全自主地生成一张A的脸,并模拟它的大部分表情。下一步,当然就很简单,只要把这张脸再贴到任意一个视频中的B的身体上,“换脸”就完成了。这个技术的核心在于可以复制一张脸。
AI收集的脸部信息
AI换脸的本质是把人的五官形象和表情分开。表情是五官在不同情绪下的形象,更多也是指五官的“动作”。一个人的五官和表情总是一体的、难以分割。然而AI换脸技术的出现,正在告诉我们五官形象和表情是可以分离的。
AI换脸的过程为:人工智能预先分析好视频里面的五官的形状和位置;你提供照片后,人工智能再分析照片中的五官形状和位置;然后再把照片中五官的形状和位置,与视频对比着进行合并。人脸互换一般可以用于视频合成、提供隐私服务、肖像更换或者其他有创新性的应用。
最早的人脸互换是通过特征点匹配来提取一张脸中例如眉毛、眼睛等特征信息然后匹配到另一张人脸上。如今,只要有足够多的图像数据,AI就能让一个编码器把一个人脸压缩成一个代码和两个解码器,一个解码器可以还原原始人脸,另一个可以生成新的人脸,下图展示了一位女性换脸前后的对比图,左右两个人的姿势完全一致,只是脸部特征发生了变化,如果只看右图,我们很难看出这是生成的假图。
现实中的机器人还没有科幻电影中那些很夸张的能力,只能根据使用者的行为动作做出一系列的反应。而如今的AI“换脸”通过“生成性对抗网络”(Generative Adversarial Network)这种机器学习技术对现有的图片资料进行深度分析的和学习,这种深度学习就是人工智能研究在今天的核心指导思想,也是机器人在未来的发展方向。
人工智能已迈向认知智能的新阶段
换脸对比图
谷歌的AlphaGo因为学习了大量专业棋手棋谱,然后又从自我对弈中持续学习和提高,因此战胜了人类世界冠军。微软小冰因为学习了大量互联网上的流行语,才能用既时尚、又活泼的聊天方式与用户交流。这些被宣传为人工智能的典型应用大多都拥有深度学习的技术基础,这似乎也符合人类认知的特点——人的智慧离不开长大成人过程里的不间断学习。
当然,机器目前的主流学习方法和人类的学习方式还存在很大的差别。比如,目前的计算机视觉系统在看过成千上万张自行车的照片后,很容易辨别出什么是自行车,什么不是自行车,这种需要大量训练照片的学习方式尽管看上去还比较笨拙,但反观人类,给一个三四岁的小孩子看一辆自行车之后,再见到哪怕外觀完全不同的自行车,小孩子也十有八九能做出那是一辆自行车的判断。也就是说,人类的学习过程往往不需要大规模的训练数据。
如果说人工智能是一种会学习的机器,那未来需要着重提高的,就是让人工智能在学习时的抽象或归纳能力向人类看齐,走向认知智能的新世界。
(责任编辑/王佳颖 美术编辑/李子夜)