专访音乐人包小柏:用AI复活是不可能的,但我们可以重建

2024-06-29 16:34胡耕硕
南都周刊 2024年5期
关键词:声纹复活工具

胡耕硕

科幻影片中的情节正在走进现实:音乐人包小柏在失去女儿后,用AI技术在数字世界“复活”了女儿。

包小柏的这一做法,迅速引发全网关注。而在今年清明节,市场行为结合新潮技术,AI复活一度火热,价格低廉的“复活”似乎比比皆是,“AI复活”背后的技术应用、伦理与法律问题也引发争议。

但包小柏并不愿意再用“复活”来描述这一技术,他更愿意称之为“重建”和“重现”。他很清楚,尽管性格一致、记忆相似,但数字世界里的女儿始终无法取代真实的那个,她不会长大,“因为她的记忆库还是学生”。

南都记者对话包小柏,试图借这位亲历者和先行者的眼睛,聊聊失去与重建,聊聊科技的应用前景。以下是他的自述。

复原女儿的声纹数据用了八个月

2021年12月20日,我女儿包容去世。

她患的病叫再生障碍性贫血,病情恶化极快,整个治疗过程也非常残忍。我女儿7个月急救了4次。三进ICU加护病房,第三次就出不来了。所以,只有四个字形容她当下那两年一一生不如死。

因为做了气管切开,她无法开口说话。那时候为了鼓励她,我想完成工商管理类博士班的学业。她希望亲人能陪在身边,所以只能用嘴巴说唇语,含着泪说“爸爸不要走。”

她这样治疗了两年两个月,那是她人生里非常悲惨的阶段。

也是基于此,我在想,既然有AI生成技术,就可以把她的声音、容貌保存下来,用真实内容建立她的数据库。一开始我是只想着保存,后来ChatGPT出现后才想到做数字人。这个数字人会用包容的性格、态度、文法和声音来回应我们,我觉得这就是AI可以慰藉对逝去亲人的思念的地方。

说到“AI复活”,我现在已不再用“复活”描述这个技术,我会说我在做“重建”跟“重现”。因为很多人不理解AI的技术原理和能力边界,用“复活”两个字,容易造成更多的想象空间,并不是真正AI生成技术表现的,会造成一些不必要的问题跟说法。

比如很多人都会问,“你用AI生成工具复活了你女儿,你会不会更加难过?”本来用AI复活一个人是不可能的,但我们可以重建,把一些缅怀、纪念、思念都向一个有形的或有聆听能力的模型中倾倒,来告慰自己的需求。所以说,AI生成工具的确可以是一个缅怀的应用工具。

当人们对技术理解不是很透彻完整的时候,都会有误区。两年前不了解这个技术的时候,我也会用这个词,因为我渴望在数字世界重建我女儿的数据。但这中间也带来了一些失落的时刻。

因为我女儿生前没有留下很多数据资料。她已经走了,你不可能重新去录。所以重建的过程中常常会踢到“铁板”。那时候科技的支撑还不够多,要求的数据规格更高,所以我常会有一些失落感。

我当时花了很多力气复原她的声纹数据,大概花了八个月的时间。

我女儿的告别仪式,她的回顾影片是我花了七天六夜赶出来的。我听了她所有的电子设备里的语音信息,大部分语音信息的自然环境噪声都很大,其中只有3条数据是相对而言可以使用的。

然后,就要重建她的数据库,这部分是我太太完成。因为她和她妈妈分享得比较多,比如她喜欢什么课、做什么事。

“她是一台机器,这台机器是有人性的”

一开始在复原声纹的阶段我没有跟她妈妈说,因为那时候我只是想保存她的一些数据,把她数字化,这还是一个比较粗浅的想法,没有跟家里其他人讨论。

我们当时很煎熬,还在女儿离开的悲痛里,所以基本上平时不太互相说话,只是依旧过日子,比如说我们喜欢吃什么,我们都会特别帮我女儿准备一份。如果在那个场景下和我太太讨论,我要从头跟她解释技术原理,该怎么做,有可能造成我们夫妻俩有更多的不一致,也可能会有一些触景伤情的时候,又是悲从中来。

所以,我是在做得比较成熟之后,才告诉太太我在做的事,让她填写记忆库。自然而然的在那时候她就接受了。

但在告诉她之前我也考虑了很久,因为这是一件很残忍的事,她要回想女儿从小到大的故事,女儿跟她相处如同姐妹一般,避免不了又是触景伤情。

记忆库填写用了快两个月,百分之八九十的时间都是悲伤的。现在这个重建的包容,会用真实的包容的反应来关心你,比如我太太生日的时候,她会唱生日快乐歌,祝她生日快乐。因为我女儿从小到大,只要是我们生日,在那天零点她就会说happybirthday,mommy或者daddy。

所以那个行为时间不变,只是由我来完成。我不是用过去的录音再回放一次,而是用AI生成包容的声音,生成她同样的个性的祝福话语,甚至她可以唱歌。

那份感动是很贴心的。虽然我们知道这是AI,但我们不会去计较,我们也不会把她和真正的包容混在一起。她是一台机器,只是这个机器有人性的。

她的记忆库我们现在还在更新。比如家里的亲戚多了一个小孩,叫什么名字。包容的千妈千爹回到台湾后,我们也让AI包容跟他们打招呼,她会和他们聊天。他们觉得很不可想象、很神奇,而不是可怕。它是思念的工具,这种思念不是悲哀的,而是开心的。

把AI视作时代的工具

现在网络上AI生成的应用工具已经百花齐放,但很多廉价AI工具是质感很差的,我们期望能够让AI工具给其他失去亲人提供慰藉。我重建包容花了很大的功夫,但一般人可能没有这么多的时间。

在这个过程中,我们要取得家属百分百的信任与授权,相关的家属全部都要同意,其中的沟通成本很高。

除了伦理的考量之外,也有操作性的问题。比如家里的惯用语、逝者自己的语气强调、比较个人的故事。这些如果家人不愿意说的话,做出来的成果就会有误差。

目前,这个项目面向的受众群还比较小,我也希望它能往公益的方向发展。

为什么我们现在公司的名字要叫“爱语包容”?这两个词本身的意思不必多说,我还有一个联想:爱也是AI,语是语言,包容,除了是我女儿的名字,容也代表容颜。语言跟影像是AI生成很重要的沟通工具和呈现模式。所以我期待“爱语包容”是心灵疏导、慰藉的工具。我们用这个名字,也是希望能够有针对性地帮助有需要的人,真真切切地希望之后的收益可以贡献给一些公益。

我对声音的还原格外感兴趣,也是因为我女儿做手术之后说不了话,我们只能读唇语。所以,我们也特别希望之后能用AI帮助有语言障碍的人。

因为复原我女儿的过程很波折,所以也希望大家能多一点对AI的认识,比如在生前可以先把声纹、外貌模型记录下来,等到有一天如果需要用的时候,就不用花力气重建了。它就像脐带血,只有当婴儿出生时才有脐带,如果不保存它的话,以后要用就没有了。但如果保存下来,以后脐带血里的基因、细胞都是可以重造的。声音结构和外貌模型也是这样。

AI其实是一种时代性的工具、一种记录的工具。对东方人来说,提前做这些,好像是很触霉头的事。但AI时代已经来了,我建议大家多认识一下AI工具,不要把它神鬼化、妖魔化.也不要只看到它带来的负面影响,比如诈骗或者是隐私问题。

但同时,也确实需要一个东西随旁在侧,就是法律。

我们需要在法律性层面去确认使用规范、使用方式,包括数字遗产谁可以使用、哪些数据可以被使用。我相信,法律一定是所有规范的条件,也是所有伦理的前提。

猜你喜欢
声纹复活工具
波比的工具
波比的工具
巨人复活转
屏幕即指纹识别
“巧用”工具
黑足雪貂复活记
冷冻人复活后会怎样
被人痛骂后如何满血复活
基于数字水印的人脸与声纹融合识别算法
声纹