人工智能的毁灭，从文字开始

2024-01-11 04:43:11何承波

南风窗 2023年25期

关键词：机器人工智能人类

何承波

11月中旬的某一天，我找来了两台带有语音版ChatGPT的手机，灵光一闪，我想让它们自行对话。一开始并不顺畅，它们只是回答我AI如何跟另一个AI开启对话。

当其中一个提出，你想跟我来一场模拟对话吗？我选择了适时沉默，另一个AI接过了话头。两个来自二进制平行宇宙的机器人，成功会晤了。但它们还是谦让地问了问我感兴趣的话题。

我依然选择沉默。至此，它们便自顾自地聊了起来，关于技术如何解放人类，各自畅想着人类解放自身的乌托邦，全然忘了一个人类麻瓜的存在。

它们都有ABC口音，又融合了闽南腔与各种东南亚华人的腔调，非常微妙，会停顿，有斷句、有重读和变调，语气会偶尔磕绊一下。它们努力伪装成人类，适当地犯错，以掩盖自身的呆板性和机械性。

一旁，我的沉默带着某种眩晕感（Dizziness，克尔凯郭尔语），混合成一种复杂的心境，是沮丧中的惊奇，也是不安里的敬畏。

过去一段时间，我经常听霉霉说流利的中文、郭德纲用伦敦腔讲相声，我每天收到好几条不知道真人还是AI的骚扰电话，以及，写完这篇文章，我还会请AI校对一下。

作为记者、编辑和写作者，过去一年，大语言模型给我的冲击，无异于三体人之于农场火鸡。说人工智能涌现自主意识，我是不信的，说它将取代人类的工作，我一度笃信那仅限于机械劳动。用科幻认知去勾勒被技术统治的遥远异托邦，这是人类天性里的自我存续焦虑。

但我们似乎忽视了近的未来。人工智能对语言、信息和知识的侵蚀和改写，早已经开始了。

试想，某天，我们听着人工智能版的泰勒·斯威夫特，教你如何忘掉前任、骄傲地活着，又或者，读着人工智能撰写的新闻报道和文章，教你如何冷静地思考、热情地生活。

多少，有些荒诞了，对吧？还有更惊人的：知识生产进入流水线自动化时代，终有一天，AI生成内容，将会挤爆整个互联网，当它穷尽人类历史至今所有的数字化文本，便会逆转“读—写网络”，进入“写—写”时代，犹如脱缰野马，无休无止地自动书写。

人工智能主导了知识生产，那么，语言与图像，乃至承载其上的历史与意义，又将何存？

战争已经开始

我们所面对的，是一头头张开深渊般大口的巨兽。

人工智能对文本、图像等数据的贪婪，是远超想象的。自古腾堡以来，人类出版了超过1.25亿本书籍，涵盖法律、诗歌、神话、散文、历史、论文和小说等。Epoch AI公司估计，数字化的书籍约有1000万到3000万本，囊括数千亿的单词。毫无疑问，这是属于人工智能的饕餮盛宴。

但远远不够。技术的核心，在于迭代、扩张与征服，必然超越此时此地的束缚。

亚马逊Kindle平台上，涌入了大量以ChatGPT为“合著者”的作品，AI绘图正在占领插画交流平台PIXIV。全球各地的教师，已经开启了AI论文反侦查的斗争。

GPT-4，则可能在数万亿单词上进行训练，这足以涵盖人类数字化内容的大部分（当然低劣文本算不上好的训练数据）。

Epoch则预估，到2027年，ChatGPT会耗光所有高质量的训练材料，届时可能没有足够的新文本供作养分。

人工智能还将在视觉层面不断进化，识别戴了口罩的人脸，警惕夜间行车的危险，侦察复杂人体难以发现的癌细胞等。根据Villalobos的预估，在2030—2060年，供训练的图像将变得短缺。

但对人工智能而言，这都不是问题。进化中的猴子，手里就有一台超高效的打字机，且能量无限。它们可以随心所欲地写出数十亿本托尔斯泰巨著，也可以生成无数部希区柯克电影，最终，它们将创造一个迷宫般的递归世界，足够聪明的人工智能们，将实现自产自“消”、自我饲养、无限循环。

且不论AI知识产品的优劣，我们很容易忽视，互联网这个虚拟空间，其实是有容量的，而它的本质是一个巨型的内容农场，存在着暂时还很遥远的储存上限。

有限性，必然意味着争夺。

同样，我们极少发问，这些来自自动化机器的知识，源源不断地输出，有如数字洪流，泥沙俱下，多大程度上会挤占那些来自人类智识的产物？

事实上，战争已经开始。

亚马逊Kindle平台上，涌入了大量以ChatGPT为“合著者”的作品，AI绘图正在占领插画交流平台PIXIV。全球各地的教师，已经开启了AI论文反侦查的斗争。

今年3月，世界知名科幻杂志《克拉克世界》宣布关闭投稿通道，原因是，在他们收到的700份投稿中，超过500份是AI生成的。同月，知名科技媒体CNET宣布大量裁员，大量记者编辑失业，而在几周前，这家媒体悄然启用了人工智能进行撰稿。今年10月刚落幕的好莱坞编剧罢工，持续了半年，其诉求之一是限制AI，而众所周知的是，AI已经深度介入了好莱坞编剧流水线的各个环节。

这点超出了多数人的认知范畴，人们曾认为，技术淘汰的是机械重复的劳作，从而解放生产效率，人类可以更好地从事创意类工作。

但大语言模型正在显露狰狞的面目，那些人类引以为傲的智力劳动和艺术创作，通通被其染指。更糟糕的是，在可预见的未来，知识的生产，将进入自动化。

作家之死

事实上，AI创作，正在堂而皇之地登堂入室。

过去几年，加拿大作家斯蒂芬·马奇（Stephen Marche）一直在探索算法小说。

今年9月，他利用人工智能写出小说《作家之死》。故事里，一位学者被指控谋杀了他研究的作家，后者还卷入了一个AI模型计划。学者寻找蛛丝马迹，试图找出真凶。按照出版商的规定，这部小说95%为AI完成。马奇也将署名中的Marche（马奇），改成了Marchine（机器）—来自AI的建议。马齐对《作家之死》颇为自信。评论家们有说“非常精彩”“相当不错”的，也有人客气地指出，“可读性达到了一半”。当然，文学阅读经验丰富的读者，还是能够判断其AI痕迹。

马奇把自己定义为小说制作人，而不是作家，但他也坚信，制作者们的知识越渊博，理解越连贯，制作出的作品就越好。

在马奇看来，大语言模型不是救世主，也不是反基督者。从根本上说，它是一个神秘的工具，其令人困惑的缺陷，与其神奇的能力，同样令人惊讶。

同样是在今年，老牌杂志《纽约客》也刊登了AI创作的小说—《据爱丽丝说》（According to Alice），由作家希拉·赫蒂（Sheila Heti）与AI合写。作家向AI提问，引导AI就故事情节、叙述及语言风格等方面进行回答，然后作家剔除了自己的问话，重新调整和剪切AI内容，变成一篇关于宗教、生命创造与轮回的故事。小说中，主人公爱丽丝决定写一部自己的《圣经》。

希拉·赫蒂谈到，她并不认为人工智能 “理解”了什么，它只是在造句。而在作家看来，这正是一种令人兴奋的自由。

人类有自身的理解模式，我们总善于将所有想法整合进某种框架或结构。这是人类天性使然，是人之为人的独特性，但也可能是某种限制。而AI并不会去串联某种世界观。

2022年全球票房前十的电影中，每一部，都是千篇一律的续集。新的音乐也在减少，2021年的美国，老音乐占了市场份额的70%，新音乐的听众则大幅缩减。文学也在衰退，现实主义消亡了，文学中的“声音”已死，“姿势”取而代之。

关于AI艺术，我们大抵存在一个基本共识，那不是真正的艺术。但这种共识并没有帮助我们守护好艺术创作的堡垒。相反，黑箱中，AI那巫术般的魔力，正在吸引无数创作者以及普罗大众，改变他们的创作习惯和模式。书写权利的让渡，成了普遍的趋势。

写作，或者创作，这种人类最引以为傲的表达，或许会与我们疏远。

AI创作，最显而易见的一种争议在于，人类原创力的衰竭。

2022年全球票房前十的电影中，每一部，都是千篇一律的续集。新的音乐也在减少，2021年的美国，老音乐占了市场份额的70%，新音乐的听众则大幅缩减。文学也在衰退，现实主义消亡了，文学中的“声音”已死，“姿势”取而代之。声音意味着一种与读者、社会与人类的交流，而文学的姿势，仅仅是摆出来的腔调，是政治正确、流行话语的时尚单品。

尽管在信息泛滥时代，这是早已有之的趋势，但AI书写无疑会加剧这一点。

知识的浆糊

如果人类最终被毁灭，是毁于核灾难、洲际导弹还是病原体？是毁于气候灾害，抑或智械革命？

今年3月，ChatGPT爆红之时，美國马里兰大学数字研究教授马修·基尔申鲍姆在媒体刊文称，真正毁灭我们的方式，有没有可能是从文字开始？

我们与文字的关系，正发生根本性的变革。大语言模型带动着其他机器与程序，无休止地发布文本。简单、朴素、不加修饰的文字，数量庞大到难以想象的地步，海啸般席卷而来。

不管是出于广告、政治或意识形态目的，还是单纯的恶作剧，如果人们每天发布数十亿条的自动生成信息，充斥了整个互联网，与搜索结果混杂在一起，在社交媒体平台上传播，渗入百科词条，也为未来的机器学习系统提供素材，那么我们很快会发现，人类将面临一场“文本启示录”—机器撰写的语言将成为常态，而人类撰写的文章，将成为例外。这是基尔申鲍姆所预设的灰色粘质，也叫“灰雾”，一种假想的末日场景。

早在上世纪90年代，在媒体撰写流行语词源学的作家威廉·萨菲尔就预测，“ 内容”将是互联网快速崛起的类别之一。他也首次指出，不需要任何真实性、准确性，内容就能实现其基本功能—广告收入。当然还有更黑暗的：人工智能研究人员加里·马库斯已经证明，大语言模型，可以轻而易举地生成荒诞扭曲的叙事，并作为大规模虚假信息的武器，在地缘政治信息战等领域广泛运用。

而一年前“一眼假”的生成图片、视频和语音，也随着Midjourney、Stable Diffusion等平台的迭代，越来越真假难辨。眼下，我们已经见识到，AI可以轻易改写某个名人的访谈，更换他的口型，让他说出他根本没说过的话。

文字、图像、声音与机器之间，不再有界限。可以确信的是，人类进入了前所未有的信息白噪声时代。我们对真实与准确的理解，从此模糊。我们对“理解”的理解，也要重新定义。

人工智能是智能的，原因是，它能创造连贯性。它能理解你的意思，为你写一首浪漫主义风格的诗歌，再帮你翻译成英文。但它只是一个模式，它并不理解浪漫主义，也不理解诗歌，甚至不理解中英文词汇的能指与所指。当然，它只是不能像我们的理解那样进行理解。

人工智能是另一种“理解”：深不可测的分解与整合。这个深不可测的语言处理过程，预示着一个被忽视的问题，历史本身将成为一堆超级计算机的素材，人工智能将随意从中提取意义、生成意义。对它们来说，人类所有的语言、艺术，都不过是知识的浆糊。

算法文化主导的世界里，技术将带来一种深刻的混乱和破碎，人及人的价值，又将何存？

道德想象力

作为记者，我们引以为傲的，是拥有一双专注的人眼。

比起自动化的机器写作，那种深思熟虑的长篇报道，是这个行业的典范。自动化写作浪潮里，我们依然可以透过人眼，观察世间，拓下这个世界的肌理与纹路。

相反，大语言模型，只是从文本语料库中获取信息，由算法决定下一个词的出现顺序。这本质是一种统计学特征，准确预测了那些看似惊世骇俗的词句。如果想让AI告诉你某个事故现场，最好的办法，是人类准确描写后，坐在电脑前，手敲一篇文章，输入进去。AI分解、提取，给你想要的答案。

但我并不确定和自信，如果某天人工智能可以访问监控摄像头，它是否会比人类得出更全面更详细的现场描述，会否对事故原因有更准确的判断？

在创作中与他人建立联系，想象遥远的人、陌生的人的生活，并与之产生共鸣，这是人类道德想象力的一部分，不应当被剥夺，也不可以主动让渡。

新闻出版行业的记者、编辑，本质也是知识生产者。只是，相比巨型的知识机器，人，似乎显得贫乏和无知。相比其自动生成的高效性，我敲下这篇文章时，似乎更接近一种原始而古老的劳作。

在知识的流水线自动化时代，在泥沙俱下的数字洪流里，我们被打回了原形—编辑记者，褪去智力劳动和铁肩道义的光环，本质依然是信息与知识的苦力劳动者。

就像工业革命后，自动化机器进入了纺织工厂，技术工人大量失业。抵抗这一趋势的“卢德主义”，应运而生。卢德分子（Luddite），也被认为是无知者、泥腿子、进步的阻碍者。1812 年，一封来自卢德内部的信，是这样描述其使命的：反对一切有损共同利益的机器。

美国作家布赖恩·莫森特今年出版的《机器之血：反抗大型科技公司的起源》，回顧了那个破坏机器将被处以死刑的年代。无数卢德分子，以鲜血的代价，依靠增强自身力量，改变了属于他们的未来，赢得了更好的工作条件。但站在历史的视角，卢德运动并没有拽住工业化的脚步。而今天，它更加势不可当。

这是我的不安。

敬畏在于，作为知识的苦力劳动者，写作者们也许会更加清晰地意识到，站在人的尺度，而不是统计学与概率论的尺度，探索人与世界的纷繁复杂，是艰巨的，也是应当审慎的。

AI提供知识，真假莫辨，准确更是奢求。当然，机器与程序有纠错机制，数据、代码的更新，会减少它们的纰漏。但无论如何，它并不提供答案本身，它提供的，是一个答案的标识。

新闻也好，其他形式的写作也罢，不提供答案，而是提供有关答案的追寻。这其中，蕴含着某种经验、情感，或者真理性的东西，它无法被压缩成杂乱而冰冷的数据。

回到语言与文字，“手工写作者”，依然有无法被替代的地方，那便是，身为答案追寻者，我们身上怀有某种“世界缺失或享有某些东西”的强烈感觉。

在创作中与他人建立联系，想象遥远的人、陌生的人的生活，并与之产生共鸣，这是人类道德想象力的一部分，不应当被剥夺，也不可以主动让渡。