李强
前几天,我被赵本山忽悠了,准确来说,是被有赵本山的视频忽悠了。
本山大叔一改往日屏幕里的模样,穿着皮衣出现在视频里,板正地坐着谈起自己参加春晚的往事,讲着一口无比流利的英语。我自愧不如,心想,念书时学了那么多年英语,如今竟连一句囫囵话都讲不清楚。
赵本山很少以流利的英文示人,只记得他在电影《大笑江湖》里讲过一句蹩脚的英语,“May the force be with you”,结果被翻译成“别太嘚瑟,没什么用”,传为笑料。他更为人熟知的是铁岭口音和幽默形象。
我向来对网络上的信息很谨慎,短视频的汪洋大海里许多事物早已真假难辨。长久以来,与虚假视频斗智斗勇,也让我练就了一双火眼金睛,相信自己几乎能够一眼看出哪些是真,哪些是假。
我见过用AI绘画画出的“特朗普被捕图”,他的狱中神情惟妙惟肖;见过带货直播间里的AI虚拟主播,已接近真人出镜的效果;听过AI孙燕姿唱刀郎的《罗刹海市》,连腔调和换气声都演绎得如出一辙。
只是当听到那则视频里,讲英文的声音与赵本山一模一样,看到视频右下方打着“杨澜访谈录”几个大字,就连他讲的每一句话都和他的口型对得上时,我相信,这流利的英语是真的出自本山大叔之口,毫无疑问。
刷完几十秒的短视频,我还在回味本山大叔地道的英文发音。马上又看到郭德纲用英语说相声,范伟用英语演小品,罗永浩用英语直播带货。这些视频看上去毫无违和感,但好像哪里怪怪的。
直到瞅见角落里“由AI生成”的字样,我才如梦方醒,又惊叹不已。如果不是画面上方的那一行小字,恐怕赵本山自己也百口莫辩,他的老搭档范伟也要被再次忽悠了。我这双“火眼金睛”竟也有被蒙蔽的一天。不得不感慨,AI又进化了,而我落伍了。
年初,我还曾对AI绘画画出的作品充满瑕疵而感到不屑,如今,遍地皆是利用AI技术生成的视频,直接让这个社会进入了“眼见为虚”的时代。
那些借助软件可以快速生成的视频里,李云龙、马保国、刀郎都熟练地讲起英语,于谦用日语当起了捧哏,马斯克、特朗普、迈克尔·杰克逊则讲起了带有外国腔的普通话。
这些视频把我看呆住了,看过许多遍后,我仍旧盯着那些名人的嘴,不敢相信,造假可以如此逼真,连赵本山讲英语发音时嘴角的褶子都造得出来。
在不少人看来,伪造这样的视频纯粹是为了娱乐,甚至有人兴奋地拿起自己的视频、声音投喂给AI,以便于伪造出精通各国语言的自己。
AI正在朝着完美造物主的方向进化,这让人惊叹,也让人恐慌。这种伪造被称为“深度伪造”,不同于以往简单的造假,而是基于深度学习,连面容、声音、眼神、口型、动作,甚至指纹都可以“假”得与真人无二。
影像造假的历史回溯起来也有100余年了,造假的技术和工具在过去的百年间不断进化着,但从未像今天这样,几乎在视觉和听觉上,彻底模糊掉虚假与真实的界限。原本人们所信奉的“有图有真相”“此视频为证”这样的准则,瞬间不香了。更多的人在伪造视频面前,将失去明辨真相的能力。
我们生活在这样一个网络时代,早已经没有什么隐私可言。试想一下,若有人盗取了一张你的照片,或去你的短视频账号里下载一段视频,再利用AI技术伪造一段视频,视频中的你说着你从未说过的话,做着你从未做过的事,而后发给你的家人、朋友、同事。我们又该如何应对呢?
有媒体报道称,今年,在美國亚利桑那州,一位母亲接到了一通陌生电话,电话里她听到了女儿的声音,女儿正哭着喊“妈妈”。这位母亲知道,15岁的女儿在外地滑雪,她担心发生了什么意外。后来,她又听到一个男人的声音,声称她的女儿在自己手里,需要100万美元,否则就会逼她的女儿吸毒,并送到墨西哥去。
这位母亲吓坏了,她还听到电话里传来女儿的声音:“帮帮我,妈妈!”但很快,丈夫确定了女儿的安全,并意识到那是骗子打来的电话。可这位母亲仍然很疑惑,因为她很确定,电话里听到的的确是女儿的声音,她的语气,甚至她的哭泣方式都与真人无异。
电话里的声音只是通过AI克隆出来的声音。据说,还有一款AI软件,只需要3秒钟的语音样本,就能够完美伪造出本人的声音和语气。倘若诈骗分子掌握了这项技能,那我还敢随便跟陌生人说话吗?
不过这已经是半年前的新闻,半年后,AI技术已经可以克隆完整的人了。如果绑匪发来伪造的绑架视频,而恰巧你此刻又联系不上孩子,后果不堪设想。
尽管这样的骗局现在并不流行,但已经有不法者开始滥用最新的AI技术违法犯罪。在各地警方公布的案件中,已有犯罪分子通过AI拟声、AI换脸等手段,成功诈骗到数千元至百万元不等的钱财。明星、专家、官员等人的音视频也可能被伪造,用于行骗。有“反诈中心”公开表示,借AI技术行骗的成功率接近100%。
尽管不少国家都要求添加水印以清楚标记AI生成的内容,但那些试图以此牟利者,当然不会这么做,我们面对伪造视频也只能当“睁眼瞎”。
在很多方面,这项技术也可能被滥用,并带来恶果,比如用于虚假新闻的生产,用于法庭证据的制作或篡改,用于色情视频的伪造,用于恶意攻击、抹黑、诽谤他人等。
一些工程师尝试开发AI内容检测器,用魔法打败魔法,这些检测器可以检测相关内容是否带有AI生成痕迹,像照妖镜一样,但目前一些检测器的检出率并不高。而作为普通人,当我们阅读文章、收听音频、观看图片或视频时,很难做到时刻把“照妖镜”拿在手里,举在眼前。
很多时候,当我们发现那些视频是被伪造的时候,假象可能早已被当作真相传遍各个角落,一些恶果也许已经无法挽回地产生了。
我并非要反对或阻碍AI技术的进步,事实是,我很欢迎这项技术,也欢迎来AI世界造“假”,甚至每逢AI进化出新的功能,我都很兴奋——又有人用这技术创作出不曾有过的事物。
比如,在某视频平台上,一位博主充当导演和编剧的角色,使用AI技术重现名人,将不同时代不同领域、不同国家的不同人物,安排进一期又一期的视频对谈节目。
为了满足乔布斯与苏格拉底一起喝下午茶的愿望,他生成了AI乔布斯、AI苏格拉底,并邀请AI约翰·列侬来主持这场对谈。在那个不大的屏幕上,他们三人畅聊着“嬉皮士精神如何影响了硅谷”“技术与艺术之间的关系”。而且据说,几乎85%以上的对话内容均由ChatGPT-4生成。
这些视频内容得到了不少观众的好评,尽管很多人都明白,那些视频里最经典的仍然是这些名人的思想创造,而不是利用AI生成的音容笑貌。但这位导演却以一种从未有过的方式,给予了苏格拉底、尼采、李白等人新的存在方式——数字生命,也创造出一种新的对谈方式,让先贤们碰撞思想。
就像视频中AI苏格拉底说的那样,“技术,犹如命运本身,即非仁慈,亦非恶意,而是由人类之手挥舞的力量”。而AI乔布斯则说,“它就像两只狼,一只是贪婪、嫉妒、不耐烦的,另一只是充满爱、同情和耐心的,让哪一只长大,取决于我们选择喂养哪一只”。
链接|
让“AI外语相声”再飛一会儿
⊙ 夏振彬
作家福楼拜说:“艺术与科学总是在山顶重逢。”以为我所用的态度对待人工智能,我们有理由期待更多“顶峰相见”。
“好久没见老郭了,原来在闭门学英语啊!”
近日,一段“郭德纲”讲英语相声的视频在网上流传。视频中,这位知名相声演员用一口流利的英语说相声,那叫一个地道,不仅发音准确,连嘴型都十分自然。
其实,不只是老郭。他的搭档“于谦”还精通日语、韩语,“赵本山”演起了英文小品,歌手“泰勒·斯威夫特”等外国明星会说流利的中文……一夜之间,仿佛满世界都成了语言小天才。
是什么让名人说出一口地道外语?你肯定已经猜到了,是AI。AI技术突飞猛进,对此人们都有心理准备,可进步竟如此神速,还是让人吃了一惊。它能够实时转换语言,“克隆”音色,还能修改口型,看起来毫无违和感。网友惊呼,看到这些视频,才知道人工智能有多牛!
让相声演员飙英文、让外国明星唱二人转,AI技术是“懂幽默”的,可幽默背后,风险也不少。比如,从著作权到肖像权、声音权,“AI外语相声”和AI换脸一样,涉嫌多项侵权。再有,AI技术将音色、口型等模仿得如此逼真,改天拿来做广告、发布“重要信息”,如何防范?
有这些担忧,属人之常情。不过,过度忧虑也没有必要。你想啊,眼下风头正劲的技术应用之一,就是人工智能了。每有风吹草动,必然引起全民围观,且很多人都是拿着放大镜看。在此等情况下,倘若有人借此为非作歹,把戏不难被戳穿。再者说,目前AI技术在文娱领域的应用,多是图个乐子,幽默嘛,不妨宽以待之。
对于新技术、新业态、新模式,我们常说要“包容审慎”。这是一种态度,也是一种行政监管方式。所谓“包容”,就是对那些未知大于已知的事物,采取包容的姿态;所谓“审慎”,其中一个要点就是别一上来就“管死”,而要给它一个“观察期”。“AI外语相声”“译制配音”等,属于生成式人工智能,是新技术,正是应当被包容审慎的范畴。如专家所言,它仍处在发展的初期阶段,风险没有完全暴露,应用前景难以估量。既如此,再观察观察,让它们再飞一会儿,方为理性之举。
创新是需要呵护的。艺人或艺术作品的AI化,或许真能帮助文化艺术的海外传播。外国人也能听相声,意味着传统文化艺术在未来或将拥有大批洋粉丝。再往大处说,这背后的技术突破,将进一步扫除语言障碍,进而在文化交流传播、文化产品制作等很多领域打开一片新天地。
当然,包容绝不是纵容。有一件事非做不可:今年8月15日起施行的《生成式人工智能服务管理暂行办法》指出,提供者应当对图片、视频等生成内容进行标识。言下之意,AI作品应该有鲜明“印记”,比如打上数字水印进行区分。标识清楚,真假泾渭分明,当成行业共识、用户守则。如此,麻烦便可大大减少。