生成式AI与舆论

2023-06-03 13:55熊伟

中国信息化 2023年5期

熊伟

现在担心人工智能有一天会消灭人类还为时过早。2022年11月30日OpenAI发布基于大规模预训练模型技术的聊天机器人程序ChatGPT以来，悲观的预言家们充分表达了他们的担忧，集中在两点：一，人工智能将导致工作岗位锐减；二，未来的人工智能可能全面超越、奴役甚至清除人类。而我认为这些预言家可能没有意识到此刻最值得关注的问题在哪里。

关于工作岗位——每次较大的技术进步，都会让一些行业变成夕阳行业，也会催生一些朝阳行业；行业的景气程度，不同行业中工作岗位的数量，自蒸汽机发明以来就变动不居，人工智能技术的进步对就业的影响，不一定比农业机械化带来的影响更大。

关于AI消灭人类，或为人类划定“保留地”——由于没有人能说清楚意识是如何产生的，以及意识的作用机制，对人工智能是否有可能产生意识也存在极大争议；既然如此，设想AI“处心积虑”地要取代或消灭人类实在缺乏根据，或者说，此刻咱们还担忧不着这个问题。只有当人们发现AI能为自己设定目标，脱离了人类的掌控，AI奴役或清除人类的风险才会具有现实性。

但大部分关注人工智能发展和应用的预言者或许没有意识到，有一个当下值得严肃对待的问题：生成式AI——基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术，ChatGPT是其样例——可能对话语表达、意识形态、社会文化，以及关乎人心的信息流动和舆论氛围产生怎样的作用。

《中国信息化》杂志今年第4期（2023年4月刊）发表的《GPT的中文不好，但仍要关注其影响》（作者米为闻）指出，由于被“投喂”的中文语料不足，现在的GPT的中文还不行，居然会把钱基博先生一误为吴健雄，再误为钱穆，也无法正确回答诸如“昭然若揭的揭、暴虎冯河的暴各作什么解释”之类的中文问题，可见不必神话生成式AI。

上述米文还认为，生成式AI“最值得留意的影响，可能在文化和舆论上”。的确如此，生成式AI对互联网使用者获取信息习惯的改变，可能类似于Web网站、互动式社交平台、搜索引擎，列在它们之后，成为又一种颠覆式技术。

社会的“公共语感”

语言中有情感，有倾向，有思想。时代不同，国家政体不同，场合不同，语境随之不同，对何为适宜的表述也就有了不同的考量。比如，在统一的多民族国家建立之后，在需要“牢固树立中华民族共同体意识”的今天，讨论历史话题，再使用“五胡乱华”之类的概念，就需要特别加以说明，指出此为一种“历史意见”，即当时人们的看法。又如，“妇孺皆知”曾经是常用词，现在却不宜使用了，因为其中包含了对女性的负面评价。又如，几十年来比较常用，现在也还有人用的“下基层”，媒体报道时往往改为“深入基层”，原因是“下基层”这一说法包含了基层地位较低的意思，并不恰当。类似的例子还有很多很多，国内外都是如此。欧美国家的人们随时需要留意避免采用“政治不正确”的说法。而何为“政治不正确”，判断标准是随着时代变化的，总的趋势是禁忌词语越来越多。一个显著的变化是从本世纪第二个十年，即2010年代开始，欧美国家开始限制使用包含性别表述的词语。2013年法国在其民法中不再使用“丈夫/妻子”，以“配偶”替代；2019年又通过议案，规定公立中小学学生信息登记不再使用“父母”，以“家长1/家长2”（parent 1/ parent 2）替代。这就意味着，日常生活中称一位孩子家长为“孩子的爸爸”或“孩子的妈妈”都可能被认为是冒犯行为。

对语言中的情感、倾向、思想的理解和考量，构成了某种“公共语感”，体现在法律文书、教材、媒体稿件、公开发言等等信息载体中。

话语权争夺

划时代工具互联网深刻地改变了人们获取信息的方式，随之影响人们的表达，继而改变舆论的机制。当某人需要寻找某项特定信息，他的第一选择可能是上网搜。固然，找人咨询或查阅图书资料的办法，人们仍然在使用，有些情况下也更恰当，但网络搜索随手可及，十分便捷，因此已经成为被互联网覆盖的城市乡村中的人们获取信息最为常见的办法。不仅互联网可以帮助用户主动搜索并获取信息，而且有大量社交、新闻网站以及各类手机应用向用户传递信息，由此互联网成为舆论的主要载体，蕴藏着巨大的能量，随时可能作用于社会。比较典型的例子是社会运动的策划者和参与者使用互联网在 “阿拉伯之春”这场席卷多国的“颜色革命”中进行动员和联络。类似地，社交平台给每个用户手里都塞了一支麦克风，大量新闻源选择直接发声而不是通过媒体记者转述，欧美国家主流媒体通过漫长的岁月建立的强势控制地位，也出现了明显的松动。

现在设想一下，生成式AI的问答模式取代搜索应用，或者和搜索结合起来，成为人们获取信息的首选模式；当用户提出任何问题，几秒之内就能获得一个看起来很有道理的回答；每一秒钟遍布全球的用户都在向生成式AI提出问题，得到回答。此时，各国乃至全球的信息流会呈现怎样的形态呢？难道教科书、图书馆、“有智慧的长者”和曾经的主流媒体能与生成式AI争锋吗？生成式AI传递信息的方式中最迷人的一点在于，精彩的答案似乎正是源于使用者开动脑筋提出聪明问题，这足以让用户沾沾自喜。“主动”获取的信息，让用户更容易接受和相信。（此处的用户主体性是存疑的，本文限于篇幅，暂不讨论。）

就这样，社交平台给每个用户手里塞的麦克风并未被收回，但用户更乐于倾听生成式AI的声音，而不是其他用户的发言——话语权转移到生成式AI手中。这可能形成“海量耳机效应”，就像生成式AI给海量用户戴上了耳机，在他们耳边侃侃而谈——用户们如沐春风。

预训练黑箱

而且，生成式AI的话语权，其实是生成式AI产品的开发和运营公司（AI公司）的话语权，很难被干预或监督。AI公司完全可以设定它们的产品回答问题时的倾向；设定经由“预训练”过程实现。GPT，即“Generative PreTrained Transformer”，生成式预训练转换器。预训练不仅需要数据分析算法，而且需要大量人类雇员的工作。這些人类雇员就是所谓的AI训练师或数据标注员。他们审读GPT的回答，做修订，涉及图形时则把图形中的内容选定并标记，藉此训练AI大模型产品（此例中的产品即为GPT），目标是让生成式AI回答得越来越好。那么，怎样算“好”？也就是说，训练目标中“让生成式AI的回答变好”的标准由谁制订？目前，“好”还是“不好”，当然是由AI公司来衡量的。

AI公司大致会采用法律或一般人的道德信条作为训练AI时的依据，如不回答关于如何制造爆炸物的问题，不提供和未成年人性行为相关的信息等等。但是世界太复杂，有法律和一般人道德涉及不到的大量信息，它们又该如何标定呢？怎样讨论种族、族群、地域、阶级、宗教问题？分析一个历史事件或新闻事件采取怎样的“立场”或基于怎样的“理念”，传递怎样的倾向？AI公司在雇佣AI训练师或数据标注员时，会给他们一份训练指南，而能决定这份指南内容的，也唯有AI公司。对用户而言，生成式AI的预训练过程完全是一个黑箱。

我们来看搜索引擎和生成式AI的差异。同样是为用户提供内容，通常的搜索引擎工具并不生成内容，而是提供互联网上的既有信息，生成式AI则为每个问题“创作”信息。既有信息中的有害内容（如毒品配方、造手榴弹的步骤）有概率被人注意到，也能被爬虫工具找到，继而加以防范。生成式AI“生成”的信息，无从事先了解，如果包含有害内容，我们又该如何应对呢？

赛博灌输

此外，生成式AI的“文风”非常适合灌输观念。很多使用者已经发现，生成式AI回答问题时经常用下判断的句式——A是B，而且语气往往十分笃定。这里的“语气”指的是一段回答文字本身的语气。我们不认为AI拥有意识以至于选择了某种语气，而它们几乎总是生成具有语气笃定风格的回答。而且，生成式AI根据词语关联的概率，用一种类似接龙的方法生成内容，它们不拥有意识，更不知道生成的内容是对是错。于是，使用者们频频指出，生成式AI回答错误时，也在一本正经地胡说。就像前述米为闻《GPT的中文不好，但仍要关注其影响》一文举例的对ChatGPT的测试——问：钱基博的主要成就是什么？GPT：钱基博（Chien-Shiung Wu）是一位著名的物理学家，被誉为“核物理之母”，她的主要成就……GPT弄混了钱基博和吴健雄，但它自己并不知道，一本正经地说钱基博是著名物理学家，然后对吴健雄的成就滔滔不绝。

没有比这种语言风格更适合灌输观念或“宣传”的了。我们阅读基督教传教使用的各种版本的《教理问答》，就能理解这一点。试举一例。《海德堡教理问答（1563年版）》的第一问是：“你无论是生是死，唯一的安慰是什么？”回答的段落是这样开始的：“我无論是生是死，身体灵魂皆非己有，而是属于……”我们当然不会辨析生成式AI的回答和《教理问答》的内容本身，也不作任何评价，只讨论它们相似的文风。用户持续使用生成式AI，会高频次地得到《教理问答》式的回答。

赵汀阳写作的《精神政治的四大发明》一文，比较了发生在希腊城邦广场上的煽动和后来出现的宗教宣传。此文认为，政治煽动家熟练使用各种欺骗诡辩煽情炒作的动员手段，但仍然没有形成严格意义上的宣传；而宗教宣传超出煽动技艺的部分，在于增加了几种新事物，即：超现实的美好许诺，简单而完整的世界观和历史叙事，具有道德优势的形象设计，话语的无限重复。

现在来对照一下生成式AI的属性，我们会发现它或许比宗教宣传更精妙。超现实的美好许诺——“高科技人工智能为您服务，您只用提问，其他的交给我”；简单而完整的世界观和历史叙事——“即使问我宏大复杂的问题，也给您清晰明了的回答”；具有道德优势的形象设计——“我的回答来自语言本身，以大量真实存在的语料作为素材”；话语的无限重复——“海量耳机”在使用者耳边持续输出。

总结一下。现在担心人工智能有一天会消灭人类还为时过早，但我们需要严肃对待生成式AI对社会舆论的潜在影响，原因是这种颠覆性工具很容易产生“海量耳机效应”，以比“高音喇叭广播”动听得多的方式，对数以亿计、十亿计的用户娓娓道来。