“嵌入”与“扩散”：ChatGPT的技术特质与传播影响

2023-06-12 19:57:40刘瑞生韩博

出版参考 2023年4期

刘瑞生韩博

摘要：2022年11月，美国公司OpenAI推出的ChatGPT火爆全球，这款聊天机器人程序成为有史以来用户增长最快的网络应用。“横空出世”的ChatGPT具有标杆性的意义：作为通用人工智能领域的“破土性”应用，它已经具备与人类深度交互并进行“仿人”甚至“超人”创作的特质；作为第一款大规模商业化的通用人工智能应用，ChatGPT具备了将人工智能技术深度“嵌入”网络应用的潜质。随着技术的进阶和各种类ChatGPT的不断推出，引发整个数字产业链的新一轮博弈。人工智能技术将加速向社会扩散，将在与人的“链接”和与社会的相互建构中演进，深化“交融”效应，引发传播变革。

关键词：人工智能 ChatGPT 技术特质传播影响

人工智能，被视为未来经济社会发展的新引擎，是当今主要国家竞相发展的“战略高地”，也是诸多高科技企业激烈博弈的前沿技术。随着移动互联网、物联网、算法等技术的不断升级迭代，近年来“智能”亦开始成为新媒体的一种“浸入性”要素，以至于有学者呼唤“智媒”时代的来临。[1]不过，人工智能技术虽然不断演进和迭代，但更多是作为专用人工智能领域而停留于“幕后”的研发阶段，抑或成为主流平台辅助应用的“配角”，在通用人工智能领域并未出现有突破创新性功能而产生扩散效应的“爆款”应用。

然而，美国人工智能公司OpenAI开发的一款人工智能聊天机器人ChatGPT，则彻底打破了这一局面，让通用人工智能技术彻底“浮出水面”。ChatGPT自上线后迅速火爆全网，其独特的功能吸引了全球关注，用户数量迅速破亿，一些平台企业亦纷纷表示将步其后尘推出类ChatGPT应用。ChatGPT，成为当下新媒体领域最热的话题。本文将梳理ChatGPT的发展历程和技术特质，解析ChatGPT何以能“嵌入”新媒体生态，展望ChatGPT将引发数字产业链的“扩散”效应，以及ChatGPT对传播与社会的“交融”性影响。

一、“破土”：ChatGPT的技术演进与特质

2022年11月30日，美国人工智能公司OpenAI开发的人工智能聊天机器人ChatGPT正式上线。尽管在形式上只是一款至简的聊天机器人程序，但功能强大的ChatGPT卻是人工智能技术“厚积”数十年而“破土”的应用，它积淀着人工智能的底层技术，浓缩着人工智能的发展特质，是人工智能领域集大成的顶级应用，标志着人工智能技术在“强”方面的突破性进展。

1.技术实质：“强”人工智能的突破性新应用

聊天机器人（chatbot）实际上是人工智能技术早就开始探索的领域，较典型的代表如1966年的ELIZA和1972年的PARRY。2016年，Skype、Line、Facebook等平台亦开始引入了聊天机器人程序。随后，类似的聊天机器人以弹窗类应用或虚拟助手、智慧助手等小程序形式开始广泛进入商业、教育、娱乐、金融、健康、新闻等领域。这些聊天机器人，虽能与用户进行简单对话并能完成一些指令性操作，但由于智能程度不高被用户趣称为“智障”，只能作为手机、网络平台的辅助性“配角”。

ChatGPT则是一款以“主角”身份出现的聊天机器人程序，其全称为聊天生成预训练转换器（Chat Generative Pre-trained Transformer）。与以往的“聊天机器人”相比，ChatGPT在形式上相似，是一款可以模仿人类对话者和用户进行互动交流的独立程序，但在技术底层和功能上差异较大。ChatGPT基于最高阶架构的大型语言模型，并历经多年深度学习强化训练，在智慧上已经类似于人类，具备极其强大的功能。由于对人类意图的高识别率和理解的高精准度，ChatGPT能够通过学习和理解人类的语言来和注册用户进行对话互动，它能更精准地理解用户意图及实现类人的回复，能更精确、更加可控地完成撰写邮件、视频脚本、代码、菜谱、诗歌、音乐、小说、商业计划书、童话故事和论文等各类文字输出型任务，甚至在人类的合适引导下可以完成逻辑推理、新知识快速学习等复杂任务。

简单来说，人工智能技术可以划分为专用人工智能和通用人工智能。专用人工智能主要针对具体领域专业，其相对任务单一、需求明确、建模简单、应用边界清晰；通用人工智能（Artificial General Intelligence，AGI），也称为强人工智能（Strong Artificial Intelligence），是真正意义上完备的人工智能系统。[2]新世纪之后，互联网技术虽然大大推动了人工智能技术的创新性和应用性，但主要是在专用人工智能领域取得了较大突破，而在通用人工智能方面却处于探索阶段。ChatGPT的出现，使得人工智能真正进入到“强”的发展阶段。

2.发展程度：顶级人工智能技术的集大成者

作为通用人工智能第一个“爆款”应用，ChatGPT可谓当前世界科技巨头和顶级技术的集成。

ChatGPT背后的三项底层基础技术为开源框架、算法模型、编译器，经美国人工智能公司历练多年。在语言模型的三个重要组成部分方面，即算力、数据、算法上，ChatGPT亦占有软件和硬件的优势。

算力是支撑背后大语言模型训练的硬件基础，而OpenAI公司的背后是科技巨头微软。微软2019年向OpenAI公司投资10亿美元，并与OpenAI公司独家合作打造了一台性能位居全球前五，拥有超过28.5万个CPU核心、1万块英伟达V100GPU、每块GPU拥有400Gbps网络带宽的超级计算机——Azure AI超算平台。[3]

数据是影响模型能力强弱甚至生成质量的关键。在数据层面，从2018年起，OpenAI就开始发布生成式预训练语言模型GPT，在第三代模型（GPT-3）的数据训练量就达到45TB，参数量达到了1750亿，因此，无论在训练时间还是模型的量级来说，ChatGPT都建立了极大优势。

算法则包括模型架构和优化方法，决定着模型的核心技能。ChatGPT本质上是一个由浮点数参数表示的深度神经网络大模型，仍然属于深度学习算法的框架，而深度学习作为人工智能的主流算法，自2006年被提出，在美国已经发展了17年。ChatGPT的算法训练非常重视真实世界数据的调用，并通过这些数据对模型进行迭代，进而不断提高其人工智能水平，并形成了独特的算法生态体系。

由于在算力、数据和算法方面有美国科技巨头和顶级技术的支撑，ChatGPT成功“出圈”。

3.历史演进：浓缩人工智能发展特质的应用

ChatGPT虽一日爆红，却是美国人工智能多年积淀的结果。现代人工智能的概念自1956年被提出后，在美国已经发展了将近70年。其中，大多数人工智能领域难以付诸大规模商用，属于投资大而见效慢的烧钱行业。

ChatGPT也浓缩着美国人工智能公司的这种特质。OpenAI公司于2015年由一群美国科技精英创办后，就专注于研究通用人工智能，从2018年起，OpenAI就开始发布第一代生成式预训练语言模型GPT，用于生成文章、代码、机器翻译、问答等各类内容，之后经过第二代和第三代，才在2022年11月推出相当于第3.5代模型的ChatGPT，而其一次训练成本就高达数百万美元。即使成功推出了火爆的ChatGPT，而OpenAI公司2022年僅收入3600万美元，全年亏损超过5亿美元。

4.技术水平：人工智能显著提升的标志性应用

2018年OpenAI公司带动了大模型技术的兴起，近年来国内外也发布了多个模型参数庞大的深度神经网络大模型，但只有ChatGPT引发了全球学术界和产业界的热议和关注，原因在于ChatGPT在诸多维度能力的显著提升，包括海量高价值信息的全量在线记忆能力、自然语言输入的任意任务和多轮对话理解能力、复杂逻辑的思维链推理能力、多角色多风格的长文本生成表达能力、即时新知识学习应用与进化能力、自动写代码和理解代码的能力等。

与传统认知智能需要针对各领域任务定制对应的系统不同，ChatGPT不仅能完成多个场景、多轮人机对话，还能在交互中以“类人”的方式交流、学习和进步，自主、快速、不间断地学习各领域专业知识并达到人类专家水平。根据斯坦福大学的研究发现，ChatGPT已拥有同理心，可以解决93%的任务，所拥有的心智相当于9岁儿童。[4]正是初步综合实现的“智慧涌现”，让ChatGPT成为一款与众不同的爆款应用。

5.局限与潜力：尚处于初级阶段具有无限可能的应用

2022年11月刚进入商用的ChatGPT尚处于第3.5代模型，其应用中仍有一些局限性。主要包括：语法和语义错误，在生成文本时会出现语法错误和语义不一致的情况；泛化能力有限，在处理新的任务时泛化能力较弱，它可能无法准确地回答新的问题或处理新的文本数据；缺乏逻辑推理能力，无法通过推理来得出结论，在处理复杂的问题时可能会出错；依赖输入文本，对输入文本的内容有非常高的依赖性等。

ChatGPT可以通过GPT模型的不断的迭代来提升性能。例如2023年3月14日，OpenAI公司推出了第四代模型GPT-4，在安全性、一致性、真实性方面有所提升，例如在其内部评估中，GPT-4对被禁止内容的请求做出回应的可能性比GPT-3.5低82%，做出真实回应的可能性高40%。[5]

二、“嵌入”：ChatGPT对人工智能发展的促推效应

火爆“出圈”的ChatGPT，很可能对人工智能技术发展和产业生态产生极为重要的影响。在ChatGPT的示范效应下，诸多科技巨头表示将推出类ChatGPT应用，这预示着人工智能应用将迅速“嵌入”全球网络生态，并引发人工智能产业链变革。

1.“里程碑”：ChatGPT令人工智能产业链“浮出水面”

ChatGPT是第一款面向大众的、可以初步进行商业应用的通用人工智能聊天机器人应用，迈出了商业应用的第一步。第一步往往是具有里程碑意义的。ChatGPT之前，受技术程度所限，发展将近70年的人工智能最核心的技术一直停留在“幕后”的“烧钱”和小规模的局部应用阶段。ChatGPT的火爆，则成功地推动人工智能技术进入大规模商用阶段，人工智能被推向“台前”。

一旦步入商用后，ChatGPT将形成引领效应，后续企业纷纷效仿，产业迅速跟进，从而进入技术竞争与生态体系膨胀的快车道。从互联网浏览器的诞生，到门户网站的建立，再到即时通信技术的发展，都可以印证这一基本规律。这是互联网时代以来的技术生态发展总体态势，即新技术一旦进入商用就会迅速渗透社会，带来产业链的巨大变革。

美国目前的科技巨头公司如谷歌、微软、亚马逊、Meta等都在通用大模型上进行了进一步的布局与投资。继ChatGPT之后，我国的各科技公司纷纷加入了大模型开发和应用的队伍。例如腾讯、阿里、百度、华为、科大讯飞等均在跟进大模型的研发与应用。

2.“加速器”：引发消费端、产业端、社会端的全面智能化升级

以ChatGPT为代表的人工智能进入大规模商用后，首先会影响内容生产领域的消费端升级，进而导致数据引领的产业端提速，最终激发文化创意的社会端革新，社会端再促发应用技术不断升级迭代，循环往复，加速人工智能社会化和人类社会智能化。

消费端，类ChatGPT应用将在人类指导下进行内容创作，形成全新的内容生产形式，并逐步融入文字、图片、视频、3D制作等领域。这导致ChatGPT很快会作为一种技术和功能要素依次嵌入搜索引擎、浏览器插件、办公软件/WPS、会议系统自动摘要、新闻客户端以及内容安全、即时通信、短视频、游戏、网络音乐、电商购物等。

产业端，合成数据（synthetic data）将超越人类用户生产的大数据而成为新的战略资源。合成数据是计算机模拟技术或算法创建、生成的自标注信息，是在数字世界中创造出来的新型数据。《麻省理工科技评论》（MIT Technology Review）将大模型合成数据列为2022年十大突破性技术之一；全球IT研究与咨询机构Gartner预测，到2024年用于训练大模型的数据中有60%将是合成数据，到2030年大模型使用的绝大部分数据将由人工智能合成。[6]这将对自动驾驶汽车、机器人、安防、制造业等相关产业产生直接影响。例如，目前已经存在的平台包括英伟达的元宇宙平台Omniverse，可在虚拟环境中对机器人进行训练，之后直接运用在现实世界。

社会端，多模态内容自动组合，解放人类创造力，助力创新。互联网时代以来，创意材料极大丰富，但自动创意生成一直难以实现，以ChatGPT为代表的内容生产人工智能应用则很大程度上解决了这一问题。未来，ChatGPT将实现多模态内容跨种类的综合性组合，并不断提升创意与资料的再整合生产能力。而随着这种创新能力的提升，人工智能将彻底进入人类社会的工作和生活中。

3.“新赛道”：对全球既有技术生态产生强烈冲击

以ChatGPT为代表的人工智能将对全球既有生态产生极为强烈的冲击。

一方面，ChatGPT将“逼迫”既有生态的“局中人”进入人工智能新赛道。从顺应技术潮流来看，所有企业和平台都要考虑融入类ChatGPT技术或推出相似产品，ChatGPT的“搅入”打乱原有的、潜在的技术生态发展步调，全球技术生态被ChatGPT引入人工智能新赛道。

另一方面，ChatGPT作为美国引领的最前沿技术应用，有着极高的技术壁垒、时间壁垒、成本壁垒，一旦使用类似技术产品，局中的参与者就变成人工智能新赛道上对ChatGPT难以企及的追赶者。谷歌、微软都是业内遥遥领先的全球性巨头，调集其综合资源才实现ChatGPT的快速更新迭代。ChatGPT背后的支持模型，参数量从最开始的1.17亿增加到1750亿，庞大的预训练数据量和高额的训练成本，使得一般企业根本没有能力完成通用型人工智能的开发。此外，这种始于2018年的投入已经形成“时间壁垒”效应，ChatGPT是“时间+數量”的质变成果。

具有示范效应的ChatGPT，不仅增强了科技公司对该领域的投入，也加剧了在人工智能方面的竞争，加快了推出类ChatGPT的速度。随着超级平台以ChatGPT为中心的新一轮“技术竞争”的加剧，类ChatGPT应用将进一步“嵌入”数字社会生态中。

三、“扩散”：ChatGPT对传播与社会的影响

1.向社会的传播“扩散”加速泛人工智能生态的生成

ChatGPT发布后，其月度活跃用户数量仅2个月便激增1亿多，超过之前TikTok9个月用户破亿的速度，成为互联网时代以来全球用户增长最快的应用。ChatGPT的火爆，不仅引发相关概念股狂涨，还促使国内外诸多科技公司加快推出类似产品。2023年2月，谷歌推出类似于ChatGPT的对话人工智能服务Bard。百度也于2023年3月发布大语言模型“文心一言”（ERNIE Bot）。全球已经开始涌现一波由ChatGPT引领的人工智能热潮，以ChatGPT为技术特征的人工智能将“重构”网络生态和全球科技生态。

在ChatGPT出现之前，如果说人工智能尚停留于小规模应用和测试阶段，可见度不高，那么ChatGPT则将人工智能从“幕后”推到“台前”。在ChatGPT的示范效应和风险投资的加持下，类ChatGPT将伴随着大规模商用而“扩散”至社会诸领域。根据埃弗雷特·罗杰斯（Everett Rogers）的创新扩散理论（Diffusion of Innovation Theory），技术的创新特征包括相对优越性、兼容性、易用性、可试性和可察性等方面，而ChatGPT在这五个方面都大大超越了之前的人工智能应用，这将加速推动ChatGPT的扩散网络的形成。[7]在ChatGPT的“扩散”中，人类社会将生成一个泛智能的社会生态，人机互动在未来成为普遍趋势，AI机器人将开始大规模涉足知识类和创造性工作。

2.在与人类社会“互构”中的风险

尽管目前ChatGPT对我国大陆不开放，中国用户在使用层面受限，无法直接访问其服务，但随着国内企业的跟进，类ChatGPT产品将迅速把人工智能应用引入我们的社会工作和生活，在提供诸多便利的同时，也不可避免地带来诸多新的“风险”。例如，北京师范大学互联网发展研究院院长助理吴沈括认为，ChatGPT在实际应用层面将面临三种风险：第一种是在更加巨量数据汇聚的过程中，可能会产生法律和安全风险；第二种是在模型和算法设计的过程中，可能产生伦理和违法风险；第三种是在实际应用过程中，可能被用于违法犯罪行为，进而带来社会风险。[8]目前较为显见的是，ChatGPT产品这种类人的内容生产活动的风险，主要是在诸多方面“以假乱真”的内容生产所衍生出的不道德甚至违法犯罪行为。

例如，加拿大麦吉尔大学研究团队曾使用GPT-2模型阅读加拿大广播公司播发的约5000篇有关新冠疫情的文章，然后要求其生成关于这场危机的“反事实新闻”，结果，与最初人类记者的新闻报道中更侧重于个体和地缘政治的“假新闻”不同，GPT-2生成了大流行在生物学和医学方面的“假新闻”。OpenAI公司也警告ChatGPT用户，它“可能偶尔会生成不正确的信息”，“产生有害指令或有偏见的内容”。[9]ChatGPT可以模仿特定的语言风格进行内容生产，其话语结构、用词特点等与真人高度相似，由于能够产生出高质量的人类口语文本，可被用来进行网络欺诈。

整体来看，类ChatGPT应用的智慧化程度高，拉低了人工智能生产的技术使用门槛，极大提升了内容生产的速度、自动化和仿真性，对未来的信息内容治理提出了进一步挑战。尤其是在新闻出版方面，当前“以假乱真”的ChatGPT已经产生了一定影响，并引发科学界和新闻出版界的警惕。例如，自2023年1月24日起，《自然》规定在其旗下所有期刊的论文中，ChatGPT 等大语言模型不能列入作者。[10]同月，学术期刊《科学》禁止在论文中使用ChatGPT 生成的文本，也禁止将ChatGPT署名为作者。

3.“交融”中的演进

作为一项新技术，ChatGPT仍在不断更新中，并在与人和社会的“交融”中“扩散”和演进。

ChatGPT的应用可能在深度联网中加速应用的“扩散”。在5G时代，ChatGPT最快落地场景之一是5G消息，估计未来市场规模达3000亿元。[11]如果ChatGPT能上网自己寻找学习语料和搜索知识，将产生更大的突破，其与微软Bing搜索引擎合作已经进行了初步探索。2023年3月，OpenAI对ChatGPT进行重大升级，通过插件功能授予ChatGPT访问第三方知识源和数据库（包括网络）的权限来扩展其功能，ChatGPT将能直接检索到最新新闻，与5000多个第三方应用插件交互，实现查询世界各国语言词汇、短语，查询实时股票、航班、酒店信息，规划差旅，访问各大电商数据帮助比价下单，还支持个人或企业把私有数据（文档、笔记、邮件等）发给ChatGPT，成为人的“第二大脑”或企业的智能助理。[12]

而在社会的主体人类的高度关注和各种张力中，ChatGPT亦将被加入算法屏蔽，走AI向善路线。在各个行业的应用中，为了避免ChatGPT染上“恶习”，可以通过算法屏蔽，减少有害性和欺骗性的训练输入。

当然，ChatGPT也将在与人类社会的“互构”中不断演进，不断提升准确度。继续加大数据量，特别是实时数据的输入后，ChatGPT将在联想能力方面大大提升，最终诞生高于文本内容的凭空创造能力，接近甚至超越人类，这将是通用人工智能发展的高级阶段。

（作者单位系中国社会科学院新闻与传播研究所）