刘瑞生 韩博
摘 要:2022年11月,美国公司OpenAI推出的ChatGPT火爆全球,这款聊天机器人程序成为有史以来用户增长最快的网络应用。“横空出世”的ChatGPT具有标杆性的意义:作为通用人工智能领域的“破土性”应用,它已经具备与人类深度交互并进行“仿人”甚至“超人”创作的特质;作为第一款大规模商业化的通用人工智能应用,ChatGPT具备了将人工智能技术深度“嵌入”网络应用的潜质。随着技术的进阶和各种类ChatGPT的不断推出,引发整个数字产业链的新一轮博弈。人工智能技术将加速向社会扩散,将在与人的“链接”和与社会的相互建构中演进,深化“交融”效应,引发传播变革。
关键词:人工智能 ChatGPT 技术特质 传播影响
人工智能,被视为未来经济社会发展的新引擎,是当今主要国家竞相发展的“战略高地”,也是诸多高科技企业激烈博弈的前沿技术。随着移动互联网、物联网、算法等技术的不断升级迭代,近年来“智能”亦开始成为新媒体的一种“浸入性”要素,以至于有学者呼唤“智媒”时代的来临。[1]不过,人工智能技术虽然不断演进和迭代,但更多是作为专用人工智能领域而停留于“幕后”的研发阶段,抑或成为主流平台辅助应用的“配角”,在通用人工智能领域并未出现有突破创新性功能而产生扩散效应的“爆款”应用。
然而,美国人工智能公司OpenAI开发的一款人工智能聊天机器人ChatGPT,则彻底打破了这一局面,让通用人工智能技术彻底“浮出水面”。ChatGPT自上线后迅速火爆全网,其独特的功能吸引了全球关注,用户数量迅速破亿,一些平台企业亦纷纷表示将步其后尘推出类ChatGPT应用。ChatGPT,成为当下新媒体领域最热的话题。本文将梳理ChatGPT的发展历程和技术特质,解析ChatGPT何以能“嵌入”新媒体生态,展望ChatGPT将引发数字产业链的“扩散”效应,以及ChatGPT对传播与社会的“交融”性影响。
一、“破土”:ChatGPT的技术演进与特质
2022年11月30日,美国人工智能公司OpenAI开发的人工智能聊天机器人ChatGPT正式上线。尽管在形式上只是一款至简的聊天机器人程序,但功能强大的ChatGPT卻是人工智能技术“厚积”数十年而“破土”的应用,它积淀着人工智能的底层技术,浓缩着人工智能的发展特质,是人工智能领域集大成的顶级应用,标志着人工智能技术在“强”方面的突破性进展。
1.技术实质:“强”人工智能的突破性新应用
聊天机器人(chatbot)实际上是人工智能技术早就开始探索的领域,较典型的代表如1966年的ELIZA和1972年的PARRY。2016年,Skype、Line、Facebook等平台亦开始引入了聊天机器人程序。随后,类似的聊天机器人以弹窗类应用或虚拟助手、智慧助手等小程序形式开始广泛进入商业、教育、娱乐、金融、健康、新闻等领域。这些聊天机器人,虽能与用户进行简单对话并能完成一些指令性操作,但由于智能程度不高被用户趣称为“智障”,只能作为手机、网络平台的辅助性“配角”。
ChatGPT则是一款以“主角”身份出现的聊天机器人程序,其全称为聊天生成预训练转换器(Chat Generative Pre-trained Transformer)。与以往的“聊天机器人”相比,ChatGPT在形式上相似,是一款可以模仿人类对话者和用户进行互动交流的独立程序,但在技术底层和功能上差异较大。ChatGPT基于最高阶架构的大型语言模型,并历经多年深度学习强化训练,在智慧上已经类似于人类,具备极其强大的功能。由于对人类意图的高识别率和理解的高精准度,ChatGPT能够通过学习和理解人类的语言来和注册用户进行对话互动,它能更精准地理解用户意图及实现类人的回复,能更精确、更加可控地完成撰写邮件、视频脚本、代码、菜谱、诗歌、音乐、小说、商业计划书、童话故事和论文等各类文字输出型任务,甚至在人类的合适引导下可以完成逻辑推理、新知识快速学习等复杂任务。
简单来说,人工智能技术可以划分为专用人工智能和通用人工智能。专用人工智能主要针对具体领域专业,其相对任务单一、需求明确、建模简单、应用边界清晰;通用人工智能(Artificial General Intelligence,AGI),也称为强人工智能(Strong Artificial Intelligence),是真正意义上完备的人工智能系统。[2]新世纪之后,互联网技术虽然大大推动了人工智能技术的创新性和应用性,但主要是在专用人工智能领域取得了较大突破,而在通用人工智能方面却处于探索阶段。ChatGPT的出现,使得人工智能真正进入到“强”的发展阶段。
2.发展程度:顶级人工智能技术的集大成者
作为通用人工智能第一个“爆款”应用,ChatGPT可谓当前世界科技巨头和顶级技术的集成。
ChatGPT背后的三项底层基础技术为开源框架、算法模型、编译器,经美国人工智能公司历练多年。在语言模型的三个重要组成部分方面,即算力、数据、算法上,ChatGPT亦占有软件和硬件的优势。
算力是支撑背后大语言模型训练的硬件基础,而OpenAI公司的背后是科技巨头微软。微软2019年向OpenAI公司投资10亿美元,并与OpenAI公司独家合作打造了一台性能位居全球前五,拥有超过28.5万个CPU核心、1万块英伟达V100GPU、每块GPU拥有400Gbps网络带宽的超级计算机——Azure AI超算平台。[3]
数据是影响模型能力强弱甚至生成质量的关键。在数据层面,从2018年起,OpenAI就开始发布生成式预训练语言模型GPT,在第三代模型(GPT-3)的数据训练量就达到45TB,参数量达到了1750亿,因此,无论在训练时间还是模型的量级来说,ChatGPT都建立了极大优势。
算法则包括模型架构和优化方法,决定着模型的核心技能。ChatGPT本质上是一个由浮点数参数表示的深度神经网络大模型,仍然属于深度学习算法的框架,而深度学习作为人工智能的主流算法,自2006年被提出,在美国已经发展了17年。ChatGPT的算法训练非常重视真实世界数据的调用,并通过这些数据对模型进行迭代,进而不断提高其人工智能水平,并形成了独特的算法生态体系。
由于在算力、数据和算法方面有美国科技巨头和顶级技术的支撑,ChatGPT成功“出圈”。
3.历史演进:浓缩人工智能发展特质的应用
ChatGPT虽一日爆红,却是美国人工智能多年积淀的结果。现代人工智能的概念自1956年被提出后,在美国已经发展了将近70年。其中,大多数人工智能领域难以付诸大规模商用,属于投资大而见效慢的烧钱行业。
ChatGPT也浓缩着美国人工智能公司的这种特质。OpenAI公司于2015年由一群美国科技精英创办后,就专注于研究通用人工智能,从2018年起,OpenAI就开始发布第一代生成式预训练语言模型GPT,用于生成文章、代码、机器翻译、问答等各类内容,之后经过第二代和第三代,才在2022年11月推出相当于第3.5代模型的ChatGPT,而其一次训练成本就高达数百万美元。即使成功推出了火爆的ChatGPT,而OpenAI公司2022年僅收入3600万美元,全年亏损超过5亿美元。
4.技术水平:人工智能显著提升的标志性应用
2018年OpenAI公司带动了大模型技术的兴起,近年来国内外也发布了多个模型参数庞大的深度神经网络大模型,但只有ChatGPT引发了全球学术界和产业界的热议和关注,原因在于ChatGPT在诸多维度能力的显著提升,包括海量高价值信息的全量在线记忆能力、自然语言输入的任意任务和多轮对话理解能力、复杂逻辑的思维链推理能力、多角色多风格的长文本生成表达能力、即时新知识学习应用与进化能力、自动写代码和理解代码的能力等。
与传统认知智能需要针对各领域任务定制对应的系统不同,ChatGPT不仅能完成多个场景、多轮人机对话,还能在交互中以“类人”的方式交流、学习和进步,自主、快速、不间断地学习各领域专业知识并达到人类专家水平。根据斯坦福大学的研究发现,ChatGPT已拥有同理心,可以解决93%的任务,所拥有的心智相当于9岁儿童。[4]正是初步综合实现的“智慧涌现”,让ChatGPT成为一款与众不同的爆款应用。
5.局限与潜力:尚处于初级阶段具有无限可能的应用
2022年11月刚进入商用的ChatGPT尚处于第3.5代模型,其应用中仍有一些局限性。主要包括:语法和语义错误,在生成文本时会出现语法错误和语义不一致的情况;泛化能力有限,在处理新的任务时泛化能力较弱,它可能无法准确地回答新的问题或处理新的文本数据;缺乏逻辑推理能力,无法通过推理来得出结论,在处理复杂的问题时可能会出错;依赖输入文本,对输入文本的内容有非常高的依赖性等。
ChatGPT可以通过GPT模型的不断的迭代来提升性能。例如2023年3月14日,OpenAI公司推出了第四代模型GPT-4,在安全性、一致性、真实性方面有所提升,例如在其内部评估中,GPT-4对被禁止内容的请求做出回应的可能性比GPT-3.5低82%,做出真实回应的可能性高40%。[5]
二、“嵌入”:ChatGPT对人工智能发展的促推效应
火爆“出圈”的ChatGPT,很可能对人工智能技术发展和产业生态产生极为重要的影响。在ChatGPT的示范效应下,诸多科技巨头表示将推出类ChatGPT应用,这预示着人工智能应用将迅速“嵌入”全球网络生态,并引发人工智能产业链变革。
1.“里程碑”:ChatGPT令人工智能产业链“浮出水面”
ChatGPT是第一款面向大众的、可以初步进行商业应用的通用人工智能聊天机器人应用,迈出了商业应用的第一步。第一步往往是具有里程碑意义的。ChatGPT之前,受技术程度所限,发展将近70年的人工智能最核心的技术一直停留在“幕后”的“烧钱”和小规模的局部应用阶段。ChatGPT的火爆,则成功地推动人工智能技术进入大规模商用阶段,人工智能被推向“台前”。
一旦步入商用后,ChatGPT将形成引领效应,后续企业纷纷效仿,产业迅速跟进,从而进入技术竞争与生态体系膨胀的快车道。从互联网浏览器的诞生,到门户网站的建立,再到即时通信技术的发展,都可以印证这一基本规律。这是互联网时代以来的技术生态发展总体态势,即新技术一旦进入商用就会迅速渗透社会,带来产业链的巨大变革。
美国目前的科技巨头公司如谷歌、微软、亚马逊、Meta等都在通用大模型上进行了进一步的布局与投资。继ChatGPT之后,我国的各科技公司纷纷加入了大模型开发和应用的队伍。例如腾讯、阿里、百度、华为、科大讯飞等均在跟进大模型的研发与应用。
2.“加速器”:引发消费端、产业端、社会端的全面智能化升级
以ChatGPT为代表的人工智能进入大规模商用后,首先会影响内容生产领域的消费端升级,进而导致数据引领的产业端提速,最终激发文化创意的社会端革新,社会端再促发应用技术不断升级迭代,循环往复,加速人工智能社会化和人类社会智能化。
消费端,类ChatGPT应用将在人类指导下进行内容创作,形成全新的内容生产形式,并逐步融入文字、图片、视频、3D制作等领域。这导致ChatGPT很快会作为一种技术和功能要素依次嵌入搜索引擎、浏览器插件、办公软件/WPS、会议系统自动摘要、新闻客户端以及内容安全、即时通信、短视频、游戏、网络音乐、电商购物等。
产业端,合成数据(synthetic data)将超越人类用户生产的大数据而成为新的战略资源。合成数据是计算机模拟技术或算法创建、生成的自标注信息,是在数字世界中创造出来的新型数据。《麻省理工科技评论》(MIT Technology Review)将大模型合成数据列为2022年十大突破性技术之一;全球IT研究与咨询机构Gartner预测,到2024年用于训练大模型的数据中有60%将是合成数据,到2030年大模型使用的绝大部分数据将由人工智能合成。[6]这将对自动驾驶汽车、机器人、安防、制造业等相关产业产生直接影响。例如,目前已经存在的平台包括英伟达的元宇宙平台Omniverse,可在虚拟环境中对机器人进行训练,之后直接运用在现实世界。
社会端,多模态内容自动组合,解放人类创造力,助力创新。互联网时代以来,创意材料极大丰富,但自动创意生成一直难以实现,以ChatGPT为代表的内容生产人工智能应用则很大程度上解决了这一问题。未来,ChatGPT将实现多模态内容跨种类的综合性组合,并不断提升创意与资料的再整合生产能力。而随着这种创新能力的提升,人工智能将彻底进入人类社会的工作和生活中。
3.“新赛道”:对全球既有技术生态产生强烈冲击
以ChatGPT为代表的人工智能将对全球既有生态产生极为强烈的冲击。
一方面,ChatGPT将“逼迫”既有生态的“局中人”进入人工智能新赛道。从顺应技术潮流来看,所有企业和平台都要考虑融入类ChatGPT技术或推出相似产品,ChatGPT的“搅入”打乱原有的、潜在的技术生态发展步调,全球技术生态被ChatGPT引入人工智能新赛道。
另一方面,ChatGPT作为美国引领的最前沿技术应用,有着极高的技术壁垒、时间壁垒、成本壁垒,一旦使用类似技术产品,局中的参与者就变成人工智能新赛道上对ChatGPT难以企及的追赶者。谷歌、微软都是业内遥遥领先的全球性巨头,调集其综合资源才实现ChatGPT的快速更新迭代。ChatGPT背后的支持模型,参数量从最开始的1.17亿增加到1750亿,庞大的预训练数据量和高额的训练成本,使得一般企业根本没有能力完成通用型人工智能的开发。此外,这种始于2018年的投入已经形成“时间壁垒”效应,ChatGPT是“时间+數量”的质变成果。
具有示范效应的ChatGPT,不仅增强了科技公司对该领域的投入,也加剧了在人工智能方面的竞争,加快了推出类ChatGPT的速度。随着超级平台以ChatGPT为中心的新一轮“技术竞争”的加剧,类ChatGPT应用将进一步“嵌入”数字社会生态中。
三、“扩散”:ChatGPT对传播与社会的影响
1.向社会的传播“扩散”加速泛人工智能生态的生成
ChatGPT发布后,其月度活跃用户数量仅2个月便激增1亿多,超过之前TikTok9个月用户破亿的速度,成为互联网时代以来全球用户增长最快的应用。ChatGPT的火爆,不仅引发相关概念股狂涨,还促使国内外诸多科技公司加快推出类似产品。2023年2月,谷歌推出类似于ChatGPT的对话人工智能服务Bard。百度也于2023年3月发布大语言模型“文心一言”(ERNIE Bot)。全球已经开始涌现一波由ChatGPT引领的人工智能热潮,以ChatGPT为技术特征的人工智能将“重构”网络生态和全球科技生态。
在ChatGPT出现之前,如果说人工智能尚停留于小规模应用和测试阶段,可见度不高,那么ChatGPT则将人工智能从“幕后”推到“台前”。在ChatGPT的示范效应和风险投资的加持下,类ChatGPT将伴随着大规模商用而“扩散”至社会诸领域。根据埃弗雷特·罗杰斯(Everett Rogers)的创新扩散理论(Diffusion of Innovation Theory),技术的创新特征包括相对优越性、兼容性、易用性、可试性和可察性等方面,而ChatGPT在这五个方面都大大超越了之前的人工智能应用,这将加速推动ChatGPT的扩散网络的形成。[7]在ChatGPT的“扩散”中,人类社会将生成一个泛智能的社会生态,人机互动在未来成为普遍趋势,AI机器人将开始大规模涉足知识类和创造性工作。
2.在与人类社会“互构”中的风险
尽管目前ChatGPT对我国大陆不开放,中国用户在使用层面受限,无法直接访问其服务,但随着国内企业的跟进,类ChatGPT产品将迅速把人工智能应用引入我们的社会工作和生活,在提供诸多便利的同时,也不可避免地带来诸多新的“风险”。例如,北京师范大学互联网发展研究院院长助理吴沈括认为,ChatGPT在实际应用层面将面临三种风险:第一种是在更加巨量数据汇聚的过程中,可能会产生法律和安全风险;第二种是在模型和算法设计的过程中,可能产生伦理和违法风险;第三种是在实际应用过程中,可能被用于违法犯罪行为,进而带来社会风险。[8]目前较为显见的是,ChatGPT产品这种类人的内容生产活动的风险,主要是在诸多方面“以假乱真”的内容生产所衍生出的不道德甚至违法犯罪行为。
例如,加拿大麦吉尔大学研究团队曾使用GPT-2模型阅读加拿大广播公司播发的约5000篇有关新冠疫情的文章,然后要求其生成关于这场危机的“反事实新闻”,结果,与最初人类记者的新闻报道中更侧重于个体和地缘政治的“假新闻”不同,GPT-2生成了大流行在生物学和医学方面的“假新闻”。OpenAI公司也警告ChatGPT用户,它“可能偶尔会生成不正确的信息”,“产生有害指令或有偏见的内容”。[9]ChatGPT可以模仿特定的语言风格进行内容生产,其话语结构、用词特点等与真人高度相似,由于能够产生出高质量的人类口语文本,可被用来进行网络欺诈。
整体来看,类ChatGPT应用的智慧化程度高,拉低了人工智能生产的技术使用门槛,极大提升了内容生产的速度、自动化和仿真性,对未来的信息内容治理提出了进一步挑战。尤其是在新闻出版方面,当前“以假乱真”的ChatGPT已经产生了一定影响,并引发科学界和新闻出版界的警惕。例如,自2023年1月24日起,《自然》规定在其旗下所有期刊的论文中,ChatGPT 等大语言模型不能列入作者。[10]同月,学术期刊《科学》禁止在论文中使用ChatGPT 生成的文本,也禁止将ChatGPT署名为作者。
3.“交融”中的演进
作为一项新技术,ChatGPT仍在不断更新中,并在与人和社会的“交融”中“扩散”和演进。
ChatGPT的应用可能在深度联网中加速应用的“扩散”。在5G时代,ChatGPT最快落地场景之一是5G消息,估计未来市场规模达3000亿元。[11]如果ChatGPT能上网自己寻找学习语料和搜索知识,将产生更大的突破,其与微软Bing搜索引擎合作已经进行了初步探索。2023年3月,OpenAI对ChatGPT进行重大升级,通过插件功能授予ChatGPT访问第三方知识源和数据库(包括网络)的权限来扩展其功能,ChatGPT将能直接检索到最新新闻,与5000多个第三方应用插件交互,实现查询世界各国语言词汇、短语,查询实时股票、航班、酒店信息,规划差旅,访问各大电商数据帮助比价下单,还支持个人或企业把私有数据(文档、笔记、邮件等)发给ChatGPT,成为人的“第二大脑”或企业的智能助理。[12]
而在社会的主体人类的高度关注和各种张力中,ChatGPT亦将被加入算法屏蔽,走AI向善路线。在各个行业的应用中,为了避免ChatGPT染上“恶习”,可以通过算法屏蔽,减少有害性和欺骗性的训练输入。
当然,ChatGPT也将在与人类社会的“互构”中不断演进,不断提升准确度。继续加大数据量,特别是实时数据的输入后,ChatGPT将在联想能力方面大大提升,最终诞生高于文本内容的凭空创造能力,接近甚至超越人类,这将是通用人工智能发展的高级阶段。
(作者单位系中国社会科学院新闻与传播研究所)