黄楚新 张 迪
2022 年11 月,美国OpenAI 实验室发布了一款名为ChatGPT 的聊天机器人。不同于传统的聊天机器人,以Transformer 架构和自然语言处理(NLP)为核心技术的ChatGPT 凭借其出色的上下文记忆、推理和深度学习能力,能够实现信息检索、内容生产甚至情感陪伴等多种复杂语境下的人机互动和对话。[1]同时,通过人类反馈强化学习(RLHF)和模型微调,ChatGPT 能够在文案策划、多语种翻译、知识传播、脚本撰写、人机对话、文本生成、图像绘制甚至代码编程等领域广泛应用,展现出极强的内容生产力,是当前AIGC 发展的典型成果。ChatGPT 是GPT模型的3.5 版本,在经历GPT-1、GPT-2、GPT-3的更新迭代后,其预训练参数达1750 亿,文本数据45TB,耗资1200 万美元[2],被视为人工智能技术在快速发展过程中的一座里程碑。以ChatGPT 这一火爆的AIGC 为代表,人工智能技术正在深刻地改变着新闻传播生态和结构。
不同于曾在围棋竞赛中战胜人类冠军李世石的专业型人工智能AlphaGo,ChatGPT 受到广泛关注的原因之一在于人们在其进展中似乎看到了通用人工智能到来的可能性。
在内容生成方面,预训练大语言模型ChatGPT摆脱了单一领域的模式化生产,可在特定的任务和领域中自动进行微调,从而更精准地在智能客服、游戏开发、文本制作、数据分析、政务服务、教育教学等领域发挥效能。而2023 年3 月发布的GPT-4 则实现了从单模态到多模态的大模型转化,不仅支持文字形式的输入输出,更是将图片、音视频、语言等信息传递方式融入其中,集纳了单模态内容的细节式捕捉、多模态内容的智能性生成、跨模态内容的精准化转换。[3]
在信息检索方面,ChatGPT 与Bing 搜索引擎的结合及其API 接口的开放,带来了搜索引擎领域的革命性进步。[4]与传统搜索引擎不同,基于预训练的大语言数据库ChatGPT + Bing 搜索界面更加简单,可以根据用户提问、上下文内容等智能生成有逻辑且符合语境的“新”内容,而不是对既有文字、图片的简单搬运。
智能对话、内容生成、信息搜索等以ChatGPT为代表的AIGC 正在潜移默化地嵌入全球互联网的多元场景中,日益成为生产生活和信息传播的重要方式。
ChatGPT 的内容生成方式是通过与用户间对话产生,但如果仅把它当作一个聊天机器人,就会限制对其传播特质的认知。ChatGPT 不但在内容生成的完整性、适配性、逻辑性上对既往人工智能产品有全面突破,更在人机互动上让用户体验到真人对话的交流感。这源于GPT 模型的Transformer 计算逻辑算法,相比于传统的自然语言处理算法RNN(Recurrent Neural Network),Transformer 是一个调用千亿级别的参数、使用超大规模数据来完成日常训练的神经网络深度学习算法,具有很好的“时序数据处理”(理解上下文关系)和“自注意力机制”(抓重点、找联系)的能力。此外,ChatGPT 以人类提示性语言(prompts)为基础,利用人类对多个模型的输出结果进行排序,进而标注人类偏好作为奖励模型,并通过不断强化训练提高自身“猜概率”的能力,从而使模型更符合人类认知和语言表达方式。需要注意的是,这仍然是一种通过掌握特殊标记和经验性学习后的结果,ChatGPT 目前尚不具备人类情感、意识和思维。在人与ChatGPT 对话中,神态、表情、肢体、体温的线索消除就很好地证明了这一点。因此,如果过度沉迷于ChatGPT 所营造的超仿真环境中,有可能使人类陷入雪莉·克特尔所言的“群体性孤独”。
罗萨曾指出:“现代性就是加速。”[5]从技术的底层逻辑出发探究ChatGPT 的模型体质和优势,不难发现加速是AI 技术的突出特点。一方面,AIGC 内容生产的即时性加速了人与信息的连接。ChatGPT可以根据人类对话指令在几秒钟内完成论文撰写、新闻制作、诗歌创作、代码编程、信息搜集等各类文本,提高了信息获取的及时性和有效性。另一方面,ChatGPT 的高速发展也在不断加速着人工智能技术的快速演进。从2018 年OpenAI 发布GPT 以来已经过5 轮的迭代升级,每一次技术更新的背后都是更大参数的内容投喂和众多技术的加速堆叠。例如,ChatGPT 的Beta 版本使用了10000 个英伟达GPU 训练模型,新一代GPT-5 大模型正在25000 个英伟达GPU 上训练,可以说,ChatGPT 出生至今的每个环节都离不开几万片英伟达等各类计算设备的强力支撑。无疑,ChatGPT 更大程度上完成了对人类知识的整合,高质量的自然语言接口,加速了内容与内容的连接、技术与技术的连接,是更大程度上物与物的连接。未来,在不断加速的现代社会系统中AI 技术还在持续地推动“万物互联”时代的到来。
ChatGPT 给新闻传播领域带来的机遇变革首先体现在对于新闻产品生产全流程的升级再造。海量训练参数的投喂、自然语言处理、人类反馈强化训练等技术的应用都使得ChatGPT 能够深度嵌入新闻采集、写作、编辑、发布全链条之中,带动新闻产品的智能化生产。
新闻信息的采集和检索是新闻生产的初始环节也是重要环节,决定着新闻产品的走向和价值大小。尽管ChatGPT 目前所生成的文本是基于预训练的数据库,内容存在一定的滞后性,无法对最新发生的新闻事件完成实时的信息检索。但是,ChatGPT 可以以极低的成本在调查性新闻、解释性报道、建设性新闻等深度报道中为记者提供丰富且全面的背景资料和经典案例,节约资金的同时有效提高信息采集的速度、深度和广度。
在新闻写作方面,ChatGPT 不仅极大提高了数据新闻、体育新闻、财经新闻等结构性文本的信息生产效率,进一步简化数据图表、交互程序等在文本形式层面的生产要素;而且基于预训练大语言模型、Transformer 算法,ChatGPT 能完成上下文语境理解、追问、反问等人性化互动并持续地与使用者对话,这有助于媒体创新“聊天新闻”“问答式新闻”“新闻游戏”等新闻报道方式,丰富产品样态,增强新闻的可读性和新颖性。同时,内容生产与分发一体化的问答系统能更精准地将个性化信息传达给用户,有效提升了信息的到达率和用户黏性,为深化媒体融合增强媒体传播力、引导力、影响力、公信力提供可供性选择。
在新闻编辑实践中,ChatGPT 的应用使得去编辑部中心的新闻生产趋势日益明显。一方面,ChatGPT 可根据编辑的指令要求快速完成字词错误校对、用语规范性校对、智能排版、格式优化等机械重复性内容;另一方面,凭借海量内容的投喂,ChatGPT 能够生成不同风格、不同类型的产品内容,为编辑新闻策划提供思路和灵感。
总之,以ChatGPT 为代表的AIGC 在新闻采集、写作、编辑、分发的各个环节展示出强大的内容生产力,并为新闻产品创作全流程持续赋能。
技术的进步持续推动着内容生产模式的变迁,从历史演进的角度梳理人工智能技术融入新闻传播领域的进程,大致可分为机器辅助、人机协同以及未来可能到来的自主创作三个阶段。
机器辅助新闻生产阶段,由于AI 技术发展尚未成熟且模板化严重,因此只能辅助记者从事一些简单的机械化操作。以ChatGPT 为代表的AIGC 技术的飞速发展将互联网内容生产模式带入第二阶段,也就是如今的人机协同阶段。一方面,ChatGPT 利用千万体量的预训练参数、Transformer 算法以及深度学习等技术加持能够生产文本、语言、图像、视频甚至代码等多模态的内容,促使传媒产业走向人机协同的媒体深度融合道路,并依赖于AIGC 的高产高效,为媒体融合发展提质增效。[6]2023 年2 月,Meta Media 超媒体控股集团旗下《Instyle 优家画报》宣布推出全球首位拥有人格化特质的虚拟主编Beatrice,以更多元、灵活的方式为Z 世代年轻人传递时尚资讯。[7]另一方面,智能语音识别、自动生成字幕、智能视频剪辑以及新华社“小诤”、湖南卫视“小漾”等虚拟主播的蓬勃发展,不断驱动着内容生产从劳动密集型向技术密集型转变,极大提高内容生产力的同时,将新闻工作者从重复、单一的劳动中解放出来,去完成更具有创造性和人文关怀的新闻活动。
拉图尔的行动者网络理论提出将人类因素和非人因素视为平等的社会网络行动者,有力地动摇了人与机器二元对立的主客体认知。从技术的发展历程不难看出,“人性化趋势”是以ChatGPT 为代表的人工智能技术发展的趋势与方向。未来,人工智能技术能否达到自主创作的水平目前尚未可知,但ChatGPT 必将引发人和技术关系的再度思考。
2020 年9 月26 日,中共中央办公厅、国务院办公厅印发的《关于加快推进媒体深度融合发展的意见》指出,“要发挥市场机制作用,增强主流媒体的市场竞争意识和能力,探索建立‘新闻+ 政务服务商务’的运营模式”。当前,我国媒体在政务、服务、商务领域的成就主要集中于政务新媒体、本地生活服务以及智慧城市大脑建设等方面。基于通用型、生成式、人类反馈强化学习等技术的预训练大语言模型ChatGPT 在新闻传播领域的应用,有望助力“新闻+政务服务商务”运营模式实现质的突破,驱动媒体智能化转型。
在政务服务方面,媒体可利用ChatGPT 的人机交互生成方式将其打造成一个集政务问答、文件梳理、政务管理、政务运作等多功能一体化的“掌上政务助手”。一方面,“政务助手”能够24 小时不间断地为用户提供政务服务;另一方面,依托自身海量文本数据和自然语言处理技术,ChatGPT 能够在虚拟空间中与用户形成理性且持续的问答对话,即时、准确、有效地处理公民政务诉求的同时,有助于哈贝马斯所言的“公共领域”促进主体间性的产生,从而提升公民参与公共事务的热情。
在生活服务方面,ChatGPT 能够广泛应用于“新闻+ 天气”“新闻+交通”“新闻+ 文旅”“新闻+ 餐饮”“新闻+电商”等各个方面。根据用户问答的语境,ChatGPT 能自动化生成个性化的信息服务,真正实现“千人千面”的信息定制,全面提升媒体综合服务能力和水平。
在商务服务方面,ChatGPT 等AIGC 的发展有助于媒体与技术公司的跨界合作。一方面,媒体需要主动打破自身边界,促使技术、渠道、全能人才、资金等生产要素流向职业媒体,提升自身自我“造血”能力;另一方面,技术公司也需要掌握大量文本资源的媒体为其提供训练AI 模型的海量投喂参数。国内对标ChatGPT 的“文心一言”开发公司百度就宣布了与澎湃新闻、南方都市报、上海日报社等多家机构媒体联通合作,共同打造“文心一言”数据库。
可以预见,AI 技术在新闻业的广泛应用为媒体的智能化转型提供可供性。但必须承认的是,在政治、金融等专业化领域对信息内容要求更为严谨、确定性更高,ChatGPT 给出的随机性、概率性答案还有待推敲和考证。
当前,我国媒体融合已步入深水区,如何打破体制机制壁垒、优化传媒经营与管理方式是传统媒体继续推进媒体融合纵深发展的关键。ChatGPT 作为一个集聊天、搜索、浏览为一体的生成式AI 可通过智能问答的方式,在媒体外部跨界合作、市场分析、竞争分析、品牌营销,内部风格定位、项目管理、人才机制、运行架构等方面为传媒经营与管理模式探索提供创新思路。拥有海量数据库的ChatGPT既能输出有关特色、人口、经济、文化、风土人情等当地个性化信息,又能提供经典且成熟的媒体转型案例,地方特色与成功管理经验的有机融合正是当下媒体因地制宜、制定特色化体制机制融合发展的核心突破所在。因此,从宏观层面出发探讨ChatGPT 对新闻传播的机遇变革,传媒业态的创新将是一大亮点。
尽管ChatGPT 的出现可能引发全球内容生产和信息检索领域的巨大变革,在新闻传播方面具有诸多积极影响,但它的技术和内容还存在较大的不确定性,使通用型人工智能有可能成为“数字利维坦”,带来虚假信息泛滥、意识形态渗透、冲击传统研究范式的风险隐忧。
预训练大语言模型ChatGPT 凭借技术接入成本低、适用程度高的技术特征成为目前全球用户最快突破1 亿的应用程序,但也正在成为虚假信息泛滥的温床。一方面,技术使用的便利性和易得性带来生产主体的模糊,成为假新闻产生的源头。ChatGPT 的运行方式高度依赖用户指令(prompt),因此生成的内容易受到用户影响。一些恶意使用者通过输入虚假信息、欺骗、质疑等方法诱导ChatGPT 生成看似“专业”“权威”的虚假新闻或深度伪造视频,从而达到吸引眼球、博取流量、引起社会关注的目的。2023 年4 月,广东深圳某自媒体公司利用ChatGPT 生成并发布了一篇《今晨甘肃一火车撞上修路工人致9 人死亡》的文章,在短时间内形成病毒式传播引发广泛关注,直到官方辟谣才得以平息。另一方面,ChatGPT 强大的内容输出能力主要依靠海量文本数据库和互联网用户投喂,但这些缺乏“把关”的数据文本可能本身就存在准确性、真实性、权威性、公正性、客观性的偏差。同时,汲取网络语料的过程,给极端主义者、宗教激进主义者、恐怖分子等制造极端信息,通过人为“数据投毒”来训练AI 模型留下了可乘之机。因此,尽管OpenAI 公司始终标榜ChatGPT 的客观、准确、真实,但不可否认的是,通过“拼凑”和强化学习的方式“一本正经胡说八道”的ChatGPT 在新闻传播领域的广泛应用,势必对媒体公信力和全球信息系统产生巨大挑战。如何加强预训练文本库的内容标记和信息过滤,从源头治理虚假信息和极端言论,是AIGC 亟待解决的重要问题。
人工智能虽然能够模拟、延展人类思维,但它本身并不具有认知和判断能力,因此基于历史训练数据和人类反馈强化学习机制的ChatGPT 仍无法摆脱技术固有的算法偏见和歧视。当AIGC 被更广泛地应用于公共生活,或将带来更大范围、更隐蔽的意识形态渗透。
ChatGPT 之所以有如此强大的内容生成能力,主要依靠于前期庞大的、无监督的文本投喂,而这些核心训练集主要来源于OpenAI 公司所在的西方国家和主流媒体。因此,在基于对ChatGPT 进行“政治罗盘”(Political Compass)的意识形态光谱考察中,ChatGPT 在政治、经济和社会伦理等议题中普遍带有鲜明的左翼自由主义立场,并且在跨文化的议题中倾向于站在“西方中心”的视角思考和回应。ChatGPT为用户打造了一个可持续对话、闭环式的人机交互模式,使用者的确可以从信息检索、产品生成中获得便利,但对一些算法素养较低的用户来说,他们很难意识到并且发现其中暗含的意识形态立场和算法偏见。在长此以往的人机交互中,可能会导致认知固化和他国意识形态渗透的风险。
ChatGPT、元宇宙等新兴技术正在加速推动虚拟世界和现实边界的消弭,在互联网问题和现实问题高度同构的背景下,新现象、新课题、新的研究对象层出不穷,传统新闻学研究范式的适用性和权威性正在遭受前所未有的冲击和挑战。
数字技术给新闻业带来的不仅是一种工具性的“影响”,更是一种生态性的“培育”。在新闻业主体方面,传统新闻学研究往往将制度化的专业机构作为新闻生产的权威性主体,即拉斯韦尔5W 模型中的传播者(who)。但数字技术的发展带来传播权力的转移和下沉打破了原有的新闻传受边界,一方面,博客、抖音、微博、微信等社会化媒介的应用为自媒体用户生产新闻提供技术可供性;另一方面,ChatGPT 更是以强大的内容生成能力展示了它在新闻生产与传播领域的巨大威力,让人们看到AIGC 成为独立的内容生产主体的可能性。这些在传统上并不被认为是媒体组织的异质组织,构成了“混杂的媒介体系”,使得传统新闻学研究范式中对新闻记者和组织的定义不再适用。[8]在新闻场域方面,传统新闻学研究倾向于将新闻场域看作是边界清晰的独立空间,但正如鲍曼所提出的“液态现代性”理论一样,数字时代新闻场域不断受到来自技术、权力、经济以及其他场域的侵入和挤压,其边界已不再清晰。新闻业面临的新伦理与价值危机已超越新闻学自身的学科边界,对整个社会生态系统造成危害与影响。因此,在面临研究对象与课题发生质的改变的现实环境下,新闻学亟须范式重建。
美国学者海勒认为,机器和人类共同成为一个二元体系,使得他们成为彼此的衡量尺度。[9]为有效应对数字时代的技术侵袭,人类必须明确人与机器的本质差异,不断挖掘自身的主体性特质和“人本”潜力。
从技术演进的历史脉络出发,可以预见随着技术的不断完善和发展,未来在情景对话、情感表达中,AI 技术也许能够达到人类的行为方式和水平,但在社会实践、身体表现、意识思维等方面,机器永远有其局限。可以说,ChatGPT 利用神经网络技术和人类投喂预训练等方式能够物理集合出数据库中原本没有的“新”文本,但这并不意味着ChatGPT 作为一种技术应用本体就具有了人类独有的创造力和思维的“灵韵”。因此就新闻传播领域而言,作为AIGC 冲击下的新闻工作者,应充分发挥自身在人文关怀、舆论引导、调查研究等方面的主观能动性和独特优势,用有深度、有温度、有思想的高质量新闻作品回应AIGC 的技术挑战。
近年来,每一次AI 技术的突破和发展都会引发人类对自身生存不确定性的反思,而从积极的角度看,每一次反思的背后又不断激励着人类对自身知识边界、创造性和思维能动性的挖掘与提升。
加快政策立法、明晰法律责任主体与应用规制是治理虚假信息、“深度伪造”、隐私泄露等风险挑战的关键所在。2022 年11 月,国家网信办联合工信部、公安部发布《互联网信息服务深度合成管理规定》,从数据和个人信息管理、虚假信息辟谣、算法审查、标识合成内容、科技伦理审查、平台公约、反电信网络诈骗以及深度合成服务监督等方面对算法制作文本、音视频、智能语音转化、AI 换脸等人工智能深度合成的应用进行政策规制;同时对深度合成服务提供者和技术者及其技术管理规范、主体责任义务进行明确。未来,需进一步将政策规定上升为国家立法,落实谁生产、谁负责的内容主体责任制度,加快形成法律导向明确、用户高度自律、平台把关有效、监督惩罚得当的多元主体协同治理机制,从而维护国家安全与公民合法利益,建设清朗网络空间。
作为人工智能技术研发的主体,科技公司需承担自身主体责任,在治理由AI 技术所引发的全球数字不公、算法偏见、国家冲突、刻板印象等伦理危机中主动优化技术缺陷,不断消除数字时代下的技术乱象。首先,可以通过技术更迭完善ChatGPT 用户实名身份认证机制,从源头追溯假新闻、极端言论的IP 属地及个人信息并对其访问范围和使用权限进行限制,从而减少恶意使用者利用模型进行攻击,提升系统“免疫力”;其次,科技公司可通过全球多样化文本投喂、信息过滤等方式,丰富文本内容的同时对文本数据库进行清洗与把关,进一步提升人工智能生产内容的真实性、准确性、客观性与公正性,从而打造造福全人类的通用人工智能。
为有效应对中西方在人工智能领域的发展差距,我国应发挥集中力量办大事的制度优势,加快研发自主可控的通用型人工智能。一方面,在扎实推进共同富裕的前提下,充分调动社会主义市场经济体制的优越性,汇聚资本、技术、人才等研发资源向通用型人工智能技术靠拢。另一方面,通过政策扶持、协同联动打通各企业、媒体间文本数据库壁垒,促进多元内容的共享与流动,共同打造更客观、更公正、更真实的高质量中文语料库,进而培育出更符合我国文化交流语境的自然语言生成式模型,使其真正成为数字中国、网络强国、网络空间命运共同体建设进程中可信、可用、可控、可靠的“推动者”。