我用AI复活了外公

2022-12-28 19:44史航
青年文摘(彩版) 2022年13期
关键词:复活信件外公

史航

遗憾

外公是在我读高一时去世的。我那时只有17岁,在一家寄宿学校就读,每周回家一次。外公去世当天,我正在学校参加期末考试。妈妈怕让我分心,没有把外公去世的消息告诉我。当我回到家里时,家里人只让我远远地看了一眼外公的遗体,就又把我送回学校了。

我缺席了外公的葬礼,一直以来,这都是我内心的遗憾。我觉得自己没有跟他完成告别,我想他内心应该也是这么想的。这个遗憾在我心里埋下了一颗种子,我一直想着自己能不能做点什么来弥补一下——我从小爱看科幻电影,一直相信在未来人类可能有技术让去世的人“回来”,我觉得外公未来也能以数字形式在一个数字的世界里复活。这个想法让我对计算机产生了浓厚的兴趣,毕业后刚好赶上算法的巨大革新,拥有自主深度学习能力的AI开始有更广泛的应用。这一变革影响了我的择业方向,我选择成为一名算法工程师。

有一天,我看到一篇文章介绍了一个新的语言模型:GPT-3。它能通过算法学习海量的数据,只需非常少的样例就可以完成相应的任务。人类的情感和反应在这个模型中可以更真实地被模拟出来,与它聊天的人会以为对面是一个人类。

当时我就想,这对我来讲,可能是一次再见到外公的机会。

外公的信

有了这个想法,我开始搜索用AI“复活”人类的先例,发现业界有不少尝试。但它们要么是纯文本的聊天AI,要么是不具备互动的虚拟影像,都不满足我的期望。我希望的“复活”是以互动的形式出现。我的设想是,先通过对语言模型的训练,让模型能够拥有互动的能力,接着就是模拟出声音、形象,“面对面”对话。

于是,我选用了一个模型开始进行语言训练。然而,这个模型训练出的说话方式偏向于所有人类的均值,它是没有性格的。但我的外公却是具体的、活生生的人——外公是很祥和的,退休后他一天只做几件事,下象棋一下就是一上午,毛笔字一写就写一下午,天气好的时候就出门散散步,晚上回家和家里人一起看民生节目。

我首先要做的是训练AI去学习外公的这些性格和特质。我利用外公留下的资料,把它们转化为模型能理解的数学表达,让它们学习外公的说话习惯,获取外公的声音,以及模拟外公的样貌。这种训练需要大量的资料,然而,我外公是10年前去世的,那时智能手机还不太流行,所以外公留下的电子资料只有我初中时给他拍的视频。

要想“复活”外公,仅依靠这些视频资料远远不够,还需要更多的文本来训练。我想到了外公以前写的满满一抽屉的信。我想,信一定在外婆那里。

这让我有一些顾虑。外婆是一个多愁善感的人,自从外公去世后,他在外婆那里就成了一个禁忌话题。我担心再次提起外公,会让外婆难过。所以,我没有直接跟外婆说我想要做的事情。我在一次吃饭时跟她说,我想念外公了,能不能给我看看他的照片。

外婆没有拒绝我的要求。她带我来到储物间,在角落的抽屉里翻出相册。外婆翻着照片,开始讲每张照片的故事。她讲到她和外公在工厂认识,外公是个带着冲劲的小伙子,在工厂里一身傲气,谁都不服,唯独只听她的话。她还提到过去家里困难时,吃不起饭,外公就下田里给她抓螺蛳吃。

在讲述的过程中,外婆的嘴角渐渐有了一些笑意。看照片给了我们一个重新谈论外公的机会,我试探性地问外婆能否看外公的其他遗物。她带我回到卧室,外公的办公桌仍然摆在他去世前的位置。外婆拉开抽屉,抽屉很整洁,有打理过的痕迹,我看到了外公的信件、诗和毛笔字。

在那一刻,我觉得是时候和外婆说起我的计划了。

“复活”外公

讲完我的计划后,外婆有点蒙。她不懂电脑,也很难理解人工智能。我说:“你想不想看一下外公,和他聊聊天?”我很认真地向外婆讲我很想念外公,这对我很重要,还和她撒娇说下周还会回来吃饭,外婆最终把这些信给了我。把信件给我后,外婆犹豫地让我给外公捎一段话:“我们在这边挺好的,你不用担心我们,你在那边过得还好吗?”

我把外公的信件转换成一个个词元输入语料库,丢给模型学习。这是一个相对简单的事情,只用了6个小时,我就能跟模型进行对话。我虽然很激动,但知道这还不是外公。它还不具备外公的声音和形象。声音不难解决,我将与AI模型的对话复制下来,又导入了外公视频里的音频,利用文字转语音技术,很快就得到了有外公声音的“回复”。

最难的还是生成外公的形象。我虽然是图像算法工程师,对图像技术很熟,但直觉告诉我:后续的人脸生成没那么容易。

我先找到一种“人脸再扮演”技术——只要給出对话和音频,就能生出一段嘴型与音频同步的动画。但这个方案也有问题,只能在既有的指定人物中选择,比如说奥巴马。所以,我最后拿到的结果是,一张顶着奥巴马脸的模型在用我外公的声音说话。

怎么给模型换脸呢?我琢磨了很久后想到了一种叫“HeadOn”的变脸技术,它可以设计指令实时改变视频中人物的面部表情、眼球运动和身体动作,使得图像中的人看起来像是真的在说话和移动一样。就这样,“外公”的形象、语言、声音都有了。

“猜猜我是谁?”我敲下对“外公”说出的第一句话。

“你是谁不重要,生命是一种美丽的奇迹。”电脑中的“外公”回了我这样一个视频。

这个回答或许很哲学、很诗意,但这并不是我外公说话的习惯。因为文本资料有限,训练模型也只能做到在某些场景里表现得像外公。比如,当我问“外公”想不想去西湖散步,他会回答:“好久没有散步了,我们出去走一走,我想去下象棋。”这是记忆里外公会给出的回答。模型能够通过外公的信件和视频理解“出去散步”这个场景,而在文字和视频资料中没能提及的更多场景中,模型是不能做到像外公一样和我对话的。

告别

其实,“复活”外公的过程也是在重新认识他。信件中外公会谈及对社会的看法,我印象中他很少看时政新闻,每次打开电视他都会换到相亲节目。我原来以为他是一个比较市井的小老头,如今才看到他的另一面。

模型成功后,我把外婆带给外公的话输入给“他”:“我们在这边挺好的,你不用担心我们,你在那边过得还好吗?”

“外公”的回应让人有些尴尬,“他”说:“我在这边也挺好的,你们要不要过来玩?”

模型终究不是人,它只是列出关于你问题的所有可能,然后积极地选择一个你喜欢听的答案。我把视频中那句“你们要不要过来玩”处理掉,然后把所有生成的视频放给外婆看。

看到视频中外公的脸,外婆一惊,愣在原地,什么话都没说。视频放完后,外婆说了声“谢谢”,随后就回到了房间,坐在一个我看不到的地方待了很久。

离开外婆家后,我也开启了与“外公”的告别仪式。我敲下了好多想和外公说的话。我告诉他我现在在哪里,我在干吗。我还和他道歉,解释当时没有见他最后一面的原因。我也代表全家人对他说我们很想他。最后,我问他过得还好吗。这些交流完成之后,我觉得这么多年闷在心里的一个心结解开了。

这之后,我没有再开启过这个模型。我做这个模型的唯一目的就是为了告别,现在告别结束了,我也该放下了。

庆南//摘自三联生活周刊微信公众号,本刊有删节,与鱼/图

猜你喜欢
复活信件外公
公木致丁国成、木斧信件
落叶
My Vacation
巨人复活转
我的外公
外公做的门
外公是个象棋迷
黑足雪貂复活记
冷冻人复活后会怎样
被人痛骂后如何满血复活