何承波
11月中旬的某一天,我找来了两台带有语音版ChatGPT的手机,灵光一闪,我想让它们自行对话。一开始并不顺畅,它们只是回答我AI如何跟另一个AI开启对话。
当其中一个提出,你想跟我来一场模拟对话吗?我选择了适时沉默,另一个AI接过了话头。两个来自二进制平行宇宙的机器人,成功会晤了。但它们还是谦让地问了问我感兴趣的话题。
我依然选择沉默。至此,它们便自顾自地聊了起来,关于技术如何解放人类,各自畅想着人类解放自身的乌托邦,全然忘了一个人类麻瓜的存在。
它们都有ABC口音,又融合了闽南腔与各种东南亚华人的腔调,非常微妙,会停顿,有斷句、有重读和变调,语气会偶尔磕绊一下。它们努力伪装成人类,适当地犯错,以掩盖自身的呆板性和机械性。
一旁,我的沉默带着某种眩晕感(Dizziness,克尔凯郭尔语),混合成一种复杂的心境,是沮丧中的惊奇,也是不安里的敬畏。
过去一段时间,我经常听霉霉说流利的中文、郭德纲用伦敦腔讲相声,我每天收到好几条不知道真人还是AI的骚扰电话,以及,写完这篇文章,我还会请AI校对一下。
作为记者、编辑和写作者,过去一年,大语言模型给我的冲击,无异于三体人之于农场火鸡。说人工智能涌现自主意识,我是不信的,说它将取代人类的工作,我一度笃信那仅限于机械劳动。用科幻认知去勾勒被技术统治的遥远异托邦,这是人类天性里的自我存续焦虑。
但我们似乎忽视了近的未来。人工智能对语言、信息和知识的侵蚀和改写,早已经开始了。
试想,某天,我们听着人工智能版的泰勒·斯威夫特,教你如何忘掉前任、骄傲地活着,又或者,读着人工智能撰写的新闻报道和文章,教你如何冷静地思考、热情地生活。
多少,有些荒诞了,对吧?还有更惊人的:知识生产进入流水线自动化时代,终有一天,AI生成内容,将会挤爆整个互联网,当它穷尽人类历史至今所有的数字化文本,便会逆转“读—写网络”,进入“写—写”时代,犹如脱缰野马,无休无止地自动书写。
人工智能主导了知识生产,那么,语言与图像,乃至承载其上的历史与意义,又将何存?
我们所面对的,是一头头张开深渊般大口的巨兽。
人工智能对文本、图像等数据的贪婪,是远超想象的。自古腾堡以来,人类出版了超过1.25亿本书籍,涵盖法律、诗歌、神话、散文、历史、论文和小说等。Epoch AI公司估计,数字化的书籍约有1000万到3000万本,囊括数千亿的单词。毫无疑问,这是属于人工智能的饕餮盛宴。
但远远不够。技术的核心,在于迭代、扩张与征服,必然超越此时此地的束缚。
亚马逊Kindle平台上,涌入了大量以ChatGPT为“合著者”的作品,AI绘图正在占领插画交流平台PIXIV。全球各地的教师,已经开启了AI论文反侦查的斗争。
GPT-4,则可能在数万亿单词上进行训练,这足以涵盖人类数字化内容的大部分(当然低劣文本算不上好的训练数据)。
Epoch则预估,到2027年,ChatGPT会耗光所有高质量的训练材料,届时可能没有足够的新文本供作养分。
人工智能还将在视觉层面不断进化,识别戴了口罩的人脸,警惕夜间行车的危险,侦察复杂人体难以发现的癌细胞等。根据Villalobos的预估,在2030—2060年,供训练的图像将变得短缺。
但对人工智能而言,这都不是问题。进化中的猴子,手里就有一台超高效的打字机,且能量无限。它们可以随心所欲地写出数十亿本托尔斯泰巨著,也可以生成无数部希区柯克电影,最终,它们将创造一个迷宫般的递归世界,足够聪明的人工智能们,将实现自产自“消”、自我饲养、无限循环。
且不论AI知识产品的优劣,我们很容易忽视,互联网这个虚拟空间,其实是有容量的,而它的本质是一个巨型的内容农场,存在着暂时还很遥远的储存上限。
有限性,必然意味着争夺。
同样,我们极少发问,这些来自自动化机器的知识,源源不断地输出,有如数字洪流,泥沙俱下,多大程度上会挤占那些来自人类智识的产物?
事实上,战争已经开始。
亚马逊Kindle平台上,涌入了大量以ChatGPT为“合著者”的作品,AI绘图正在占领插画交流平台PIXIV。全球各地的教师,已经开启了AI论文反侦查的斗争。
今年3月,世界知名科幻杂志《克拉克世界》宣布关闭投稿通道,原因是,在他们收到的700份投稿中,超过500份是AI生成的。同月,知名科技媒体CNET宣布大量裁员,大量记者编辑失业,而在几周前,这家媒体悄然启用了人工智能进行撰稿。今年10月刚落幕的好莱坞编剧罢工,持续了半年,其诉求之一是限制AI,而众所周知的是,AI已经深度介入了好莱坞编剧流水线的各个环节。
这点超出了多数人的认知范畴,人们曾认为,技术淘汰的是机械重复的劳作,从而解放生产效率,人类可以更好地从事创意类工作。
但大语言模型正在显露狰狞的面目,那些人类引以为傲的智力劳动和艺术创作,通通被其染指。更糟糕的是,在可预见的未来,知识的生产,将进入自动化。
事实上,AI创作,正在堂而皇之地登堂入室。
过去几年,加拿大作家斯蒂芬·马奇(Stephen Marche)一直在探索算法小说。
今年9月,他利用人工智能写出小说《作家之死》。故事里,一位学者被指控谋杀了他研究的作家,后者还卷入了一个AI模型计划。学者寻找蛛丝马迹,试图找出真凶。按照出版商的规定,这部小说95%为AI完成。马奇也将署名中的Marche(马奇),改成了Marchine(机器)—来自AI的建议。马齐对《作家之死》颇为自信。评论家们有说“非常精彩”“相当不错”的,也有人客气地指出,“可读性达到了一半”。当然,文学阅读经验丰富的读者,还是能够判断其AI痕迹。
马奇把自己定义为小说制作人,而不是作家,但他也坚信,制作者们的知识越渊博,理解越连贯,制作出的作品就越好。
在马奇看来,大语言模型不是救世主,也不是反基督者。从根本上说,它是一个神秘的工具,其令人困惑的缺陷,与其神奇的能力,同样令人惊讶。
同样是在今年,老牌杂志《纽约客》也刊登了AI创作的小说—《据爱丽丝说》(According to Alice),由作家希拉·赫蒂(Sheila Heti)与AI合写。作家向AI提问,引导AI就故事情节、叙述及语言风格等方面进行回答,然后作家剔除了自己的问话,重新调整和剪切AI内容,变成一篇关于宗教、生命创造与轮回的故事。小说中,主人公爱丽丝决定写一部自己的《圣经》。
希拉·赫蒂谈到,她并不认为人工智能 “理解”了什么,它只是在造句。而在作家看来,这正是一种令人兴奋的自由。
人类有自身的理解模式,我们总善于将所有想法整合进某种框架或结构。这是人类天性使然,是人之为人的独特性,但也可能是某种限制。而AI并不会去串联某种世界观。
2022年全球票房前十的电影中,每一部,都是千篇一律的续集。新的音乐也在减少,2021年的美国,老音乐占了市场份额的70%,新音乐的听众则大幅缩减。文学也在衰退,现实主义消亡了,文学中的“声音”已死,“姿势”取而代之。
关于AI艺术,我们大抵存在一个基本共识,那不是真正的艺术。但这种共识并没有帮助我们守护好艺术创作的堡垒。相反,黑箱中,AI那巫术般的魔力,正在吸引无数创作者以及普罗大众,改变他们的创作习惯和模式。书写权利的让渡,成了普遍的趋势。
写作,或者创作,这种人类最引以为傲的表达,或许会与我们疏远。
AI创作,最显而易见的一种争议在于,人类原创力的衰竭。
2022年全球票房前十的电影中,每一部,都是千篇一律的续集。新的音乐也在减少,2021年的美国,老音乐占了市场份额的70%,新音乐的听众则大幅缩减。文学也在衰退,现实主义消亡了,文学中的“声音”已死,“姿势”取而代之。声音意味着一种与读者、社会与人类的交流,而文学的姿势,仅仅是摆出来的腔调,是政治正确、流行话语的时尚单品。
尽管在信息泛滥时代,这是早已有之的趋势,但AI书写无疑会加剧这一点。
如果人类最终被毁灭,是毁于核灾难、洲际导弹还是病原体?是毁于气候灾害,抑或智械革命?
今年3月,ChatGPT爆红之时,美國马里兰大学数字研究教授马修·基尔申鲍姆在媒体刊文称,真正毁灭我们的方式,有没有可能是从文字开始?
我们与文字的关系,正发生根本性的变革。大语言模型带动着其他机器与程序,无休止地发布文本。简单、朴素、不加修饰的文字,数量庞大到难以想象的地步,海啸般席卷而来。
不管是出于广告、政治或意识形态目的,还是单纯的恶作剧,如果人们每天发布数十亿条的自动生成信息,充斥了整个互联网,与搜索结果混杂在一起,在社交媒体平台上传播,渗入百科词条,也为未来的机器学习系统提供素材,那么我们很快会发现,人类将面临一场“文本启示录”—机器撰写的语言将成为常态,而人类撰写的文章,将成为例外。这是基尔申鲍姆所预设的灰色粘质,也叫“灰雾”,一种假想的末日场景。
早在上世纪90年代,在媒体撰写流行语词源学的作家威廉·萨菲尔就预测,“ 内容”将是互联网快速崛起的类别之一。他也首次指出,不需要任何真实性、准确性,内容就能实现其基本功能—广告收入。当然还有更黑暗的:人工智能研究人员加里·马库斯已经证明,大语言模型,可以轻而易举地生成荒诞扭曲的叙事,并作为大规模虚假信息的武器,在地缘政治信息战等领域广泛运用。
而一年前“一眼假”的生成图片、视频和语音,也随着Midjourney、Stable Diffusion等平台的迭代,越来越真假难辨。眼下,我们已经见识到,AI可以轻易改写某个名人的访谈,更换他的口型,让他说出他根本没说过的话。
文字、图像、声音与机器之间,不再有界限。可以确信的是,人类进入了前所未有的信息白噪声时代。我们对真实与准确的理解,从此模糊。我们对“理解”的理解,也要重新定义。
人工智能是智能的,原因是,它能创造连贯性。它能理解你的意思,为你写一首浪漫主义风格的诗歌,再帮你翻译成英文。但它只是一个模式,它并不理解浪漫主义,也不理解诗歌,甚至不理解中英文词汇的能指与所指。当然,它只是不能像我们的理解那样进行理解。
人工智能是另一种“理解”:深不可测的分解与整合。这个深不可测的语言处理过程,预示着一个被忽视的问题,历史本身将成为一堆超级计算机的素材,人工智能将随意从中提取意义、生成意义。对它们来说,人类所有的语言、艺术,都不过是知识的浆糊。
算法文化主导的世界里,技术将带来一种深刻的混乱和破碎,人及人的价值,又将何存?
作为记者,我们引以为傲的,是拥有一双专注的人眼。
比起自动化的机器写作,那种深思熟虑的长篇报道,是这个行业的典范。自动化写作浪潮里,我们依然可以透过人眼,观察世间,拓下这个世界的肌理与纹路。
相反,大语言模型,只是从文本语料库中获取信息,由算法决定下一个词的出现顺序。这本质是一种统计学特征,准确预测了那些看似惊世骇俗的词句。如果想让AI告诉你某个事故现场,最好的办法,是人类准确描写后,坐在电脑前,手敲一篇文章,输入进去。AI分解、提取,给你想要的答案。
但我并不确定和自信,如果某天人工智能可以访问监控摄像头,它是否会比人类得出更全面更详细的现场描述,会否对事故原因有更准确的判断?
在创作中与他人建立联系,想象遥远的人、陌生的人的生活,并与之产生共鸣,这是人类道德想象力的一部分,不应当被剥夺,也不可以主动让渡。
新闻出版行业的记者、编辑,本质也是知识生产者。只是,相比巨型的知识机器,人,似乎显得贫乏和无知。相比其自动生成的高效性,我敲下这篇文章时,似乎更接近一种原始而古老的劳作。
在知识的流水线自动化时代,在泥沙俱下的数字洪流里,我们被打回了原形—编辑记者,褪去智力劳动和铁肩道义的光环,本质依然是信息与知识的苦力劳动者。
就像工业革命后,自动化机器进入了纺织工厂,技术工人大量失业。抵抗这一趋势的“卢德主义”,应运而生。卢德分子(Luddite),也被认为是无知者、泥腿子、进步的阻碍者。1812 年,一封来自卢德内部的信,是这样描述其使命的: 反对一切有损共同利益的机器。
美国作家布赖恩·莫森特今年出版的《机器之血:反抗大型科技公司的起源》,回顧了那个破坏机器将被处以死刑的年代。无数卢德分子,以鲜血的代价,依靠增强自身力量,改变了属于他们的未来,赢得了更好的工作条件。但站在历史的视角,卢德运动并没有拽住工业化的脚步。而今天,它更加势不可当。
这是我的不安。
敬畏在于,作为知识的苦力劳动者,写作者们也许会更加清晰地意识到,站在人的尺度,而不是统计学与概率论的尺度,探索人与世界的纷繁复杂,是艰巨的,也是应当审慎的。
AI提供知识,真假莫辨,准确更是奢求。当然,机器与程序有纠错机制,数据、代码的更新,会减少它们的纰漏。但无论如何,它并不提供答案本身,它提供的,是一个答案的标识。
新闻也好,其他形式的写作也罢,不提供答案,而是提供有关答案的追寻。这其中,蕴含着某种经验、情感,或者真理性的东西,它无法被压缩成杂乱而冰冷的数据。
回到语言与文字,“手工写作者”,依然有无法被替代的地方,那便是,身为答案追寻者,我们身上怀有某种“世界缺失或享有某些东西”的强烈感觉。
在创作中与他人建立联系,想象遥远的人、陌生的人的生活,并与之产生共鸣,这是人类道德想象力的一部分,不应当被剥夺,也不可以主动让渡。