生成式人工智能与知识生产新形态
——关于三阶知识生产的探析

2023-12-18 16:59
学术研究 2023年10期
关键词:三阶二阶人工智能

肖 峰

以ChatGPT 为代表的基于大语言模型的生成式人工智能的出现,被认为是人工智能技术的最新进展和重大突破,也被视为人工智能发展的新方向,它一经问世,就在知识生产的一线应用中大显身手,使我们直接感受到它对人类知识生产的方式和效果所产生的重大影响和深刻改变,甚至正在带来一场知识生产的革命。可以说,知识生产在智能时代是人类的“主业”,也是引领和影响人类生产和生存方式的决定性因素,并将对整个社会文明带来全面的改变。所以在ChatGPT 刚一问世时,其意义就被微软CEO 萨提亚·纳德拉(Satya Nadella)称道为“堪比工业革命的技术浪潮”。①郑雨航:《微软CEO:堪比工业革命,这辈子第一次见这么大的技术浪潮!》,搜狐网:https://www.sohu.com/a/63763196_115362,2023 年2 月6 日。知识生产是ChatGPT 等生成式人工智能直接改变的对象,它同时也是作为知识哲学的认识论的重要一章,但长期以来它并未受到足够的重视。生成式人工智能使知识生产及其当代新特征受到关注,这使得作为认识论的研究视野必然要投向这一新的聚焦点。

一、人工智能的文本生成与人类的知识生产之间

人工智能与知识问题紧密相关。第一代人工智能(符号AI)的标志性成果就是“知识工程”,它力求使AI 具有某一领域的知识并应用这种知识去进行推理、决策等“智能”活动,做人类专家能做的事情,所以也将追求这一目标的人工智能称为“专家系统”。第二代人工智能继续求解AI 如何具有知识的问题,但它不是像符号AI 那样事先将领域知识直接输入计算机,而是通过对人工建构的神经网络进行数据训练,使其从大量的数据中学习和发现规律、形成模型(相当于通过训练掌握一般知识),然后用模型去完成识别、决策等智能任务。由于数据在训练和使用中的重要性(如数据充足的情况下可以取得更高的效率和准确性),第二代人工智能也被称为“数据驱动型AI”。

知识无论是通过事先输入的,还是通过数据的训练学习而来的,上面所说的人工智能都是在“应用知识”去进行推理、决策和识别(分类)等任务,这样的人工智能均属于传统的“分析式AI”。以ChatGPT 为代表的生成式人工智能,则开辟了“知识的生产”这一机器智能新方向,它不再仅限于应用现有的知识去解决感知和决策之类的问题,而且能够生成新的知识。由于它的生成物直接呈现为包含了新内容的新文本,所以也将其称为内容或文本的生成,这一类人工智能也被称为“人工智能生成内容”(Artificial Intelligence Generated Content,AIGC)。生成式AI 与传统AI 的一个关键区别是,“当传统AI只能识别或分类现有内容时,生成式AI 模型可以创建新的内容。”①Jeremy Noronha, ChatGPT and Generative AI: The Future of Content Creation, Writesonic website: https://writesonic.com/blog/chatgpt-generative-ai/, March 13, 2023.还可以说,前者属于演绎式地应用知识(演绎不能出新知),后者属于综合性概括性地再生产知识(归纳可以出新知)。正是这一新的能力,使过去只能由人所从事的知识生产活动,现今也可以被人工智能所介入;而且随着生成式人工智能水平的提高,这种介入的程度将会不断加深,人类的知识生产随之被人工智能更加深度地改变。所以,生成式人工智能被认为是人工智能技术的一次重要突破或“转向”。

如果要给出一个界定,那么生成式人工智能指的是能够根据输入而生成新内容的一类机器系统,OpenAI 的GPT 系列、google 的Bard、百度的文心一言等就是生成式人工智能的具体产品,这样的产品目前如雨后春笋般地涌现出来,如GPT 的迭代就形成了从GPT-1 到GPT-4(GPT-5 也在研发中)的系列产品,它们将智能机器的内容生成能力不断提升到新的水平,生成内容的形式也越来越多样化,除了自然语言文本外,还能生成图片、视频、音频、计算机代码(程序)等,因此可以被广泛应用于各行各业,例如娱乐、艺术、设计、科学和教育等领域。

生成式人工智能一经使用,就令知识生产者感到获得了一个功能强大的新助手,如它可以与人对话,回答人所提出的各种各样的问题,尤其是知识方面的问题;还能就人的疑惑提供咨询与参考意见;这些回答的内容还可按人的要求系统化为规范的文本(如文章、内容摘要、工作计划等),形同为人生产出了特定的知识产品。随着它可以生成知识性的回应文本,一个新的问题就凸显出来:生成式人工智能是否在进行真正意义上的知识生产?它的文本生成是否等同于知识生产?

ChatGPT 等生成式人工智能通常使用基于神经网络的算法模型,能在给定条件下生成新的数据,具有强大的内容生产能力。基于生成式人工智能能够自动生成新内容、新文本的功能,很容易推论出它能够进行新知识的生产。但如果这样来对目前的生成式人工智能进行认识论定位,显然是高估了它的能力,某种程度上还会过早地将它的文本生成能力与人类的知识生产能力相提并论。

首先,从数据、信息、文本、内容和知识之间的关系上看,上述的理解是对这些概念的语义未经厘清而加以等同或混淆后造成的误解。生成式人工智能所生成的产物在直接的物理形式上是“数据”,一系列的数据以文字的形式表现出来就是“文本”,在文本中被人解读出来的信息才是所谓“内容”,这些内容如果在人看来是真实的有根据的,就被称之为“知识”。可见,就作为技术系统的人工智能来说,它所自动生成的仅仅是数据以及由数据汇集而成的文本,而是否具有知识的属性,则需要由人来界定:对上述概念关系的看法不同,就会对生成式人工智能的文本生成是否为知识生产持不同的观点。如果将数据与信息和知识相等同,则GPT 的数据生成就是一种知识的生产;如果认为它们是有区别的,就会认为GPT 所直接生成的并不是知识,而是数据或文本,它们可能负载着知识,也可能不负载知识(如乱码或文本中存在语法错误或事实错误的内容),其生成的内容需要人加以判别、验证、加工和认可后,才有可能被鉴定为知识。在后一种理解中,GPT 生成文本的过程并非知识生产的过程;当这一过程被称为“自然语言处理”时,也表明了它只是在语言符号的层面上进行的数字化处理,而不是在知识语义上进行的处理。这也是本文所持的立场。

其次,如果从哲学上将知识理解为“被确证的真信念”,那么GPT 等生成式人工智能一方面没有与意识和理解相关联的信念,另一方面它也不能确保自己提供的都是能够揭示真相的知识,它唯一在做或能做的,就是根据训练时在模型中建立的词与词之间的关联性,来预测一个词(严格地说是token)或几个词(即已有的文本)出现后,下一个词应该是什么,即按照特定的概率模型在相关的词汇中选择一个词与上一个词相接,从而形成在人的视角看上去的完整的句子,进而导致内容的生成,以及其中包含的知识的生成。但实质上AI 系统并不理解句子的含义,也不表明它主张句子所表达的立场或信念;它不是在语义或知识的层面上处理和加工信息,只是根据大语言模型中建立的海量的词与词的关联性来选择最匹配的“语词接龙”,是一种不明意义的“填字游戏”,它能生成什么样的句子,是由训练数据所决定的;它所生成的回应,也是在模仿训练时最常见的反应:训练的数据集(语料)包含了各种语言模式和语境,使它可以在各种情况下找到最合适的摹本来生成相应的文本。它也没有任何“对”与“错”的概念,受不同提示词的影响,或在不同的上下文中,它可以生成意思上完全对立的句子,从而给出完全相反的事实或判断,如在前一段对话中表达“地球是圆的”,在后一段对话中则回答“地球是方的”。因此至少在目前,我们还不能指望它所提供的“陈述”都反映了真相,当然也就不能确保它所生成的都是经得起验证的知识。这样的特性也使得ChatGPT 被称为“随机鹦鹉”。

此外,文本生成与知识生产不仅有“文本”与“知识”的不同,还有“生成”(generation)与“生产”(production)的区别。一般来说,生成的含义较泛,任何两种具有“引起”和“产生”的相关现象,都可以称为“生成”,或只要将某种东西带入为存在,就是生成。在人工智能系统中,输出是由输入和系统的运作带出的,因此可以说输出是由输入和系统所生成的,但不能说是由输入和系统所生产出来的,因为“生产”的含义较“生成”更窄,它特指基于劳动或努力而产生的事物,通常指人利用工具创造出产品的活动,它与“创造”和“制造”等含义相近甚至相同。生产还包含目的性和人为的掌控性,是与人相关的现象,即使是自动化的无人生产也是与人相关的,因为它在信息系统的终端是受人控制的。而生成可以指没有人参与的自然或自动形成某种结果的过程,在这一点上也可见生成比生产的含义广,因此可以用来指计算机程序对于结果或内容(文本)的“生成”,因为文本生成可以是“非人化”的自动化、数字化过程,而知识生产则是依托于人进行的认知活动。

综上可见,文本比知识广,生成比生产广,仅从广延性上,“文本生成”就比“知识生产”的范围广泛,因此两者不能相互等同。从ChatGPT 的当前使用中也可以看到文本生成不能等同于知识生产,如一篇文章的摘要的形成,是典型的文本生成,但不属于严格意义上的知识生产。所以,从生成式人工智能具有文本或内容的生成能力,并不能从逻辑上推出它一定具有知识生产的能力;或者说,AI 系统自动地生成文本的过程,并不等同于人有目的有意识地生产知识的过程。

二、三阶知识生产:生成式人工智能的认识论定位

GPT 等的文本生成与人的知识生产具有不同的属性,但也有某些层面上的相似性,如两者都具有某种意义上的“创造性”,即对“原材料”进行加工制造,改变其原有的性状或样貌,最后形成不同于原料的某种“新产品”,这也是“创造”的普通含义。但创造还有特殊的含义,即所谓“前所未有性”或“独创性”,有时也称为“创新性”,这也是创造被推崇为一种珍贵品质时所采纳的含义。在这一层含义上,机器所生成的文本不具有创造性,因为它虽然较之先前的文本具有特定的“新”,但在文本所承载的内容上,则不具有“前所未有”的创新特征,它只是在已有的数据和模型范围内进行推演和生成,无法超越训练数据和模型所固有的限制;它所回应的内容,从本质上都是对训练过的内容的模仿,所以是对既有内容在文本形式上加以改变的一种复述,也是由算法所框定的结果。而人类在进行知识生产的时候,则可以发生知识的创造,人可以超越或突破既有知识和思维方式(即人脑中的算法)的限制,提出前所未有的新概念、新观点、新理论、新学说,以及在此基础上形成新学派、新学科,总之就是创造出新的知识或知识体系。相较于既有的知识内容或知识体系来说,这是某种新知识“从无到有”或“无中生有”的诞生过程。而人工智能的文本生成,则是“有中生有”的过程,即从一种形态的“有”(输入的数据、训练中获得的数据)生成另一种形态的“有”(输出的数据、即作为回应的文本),它虽然提供了“前所未有”的文本,但并未提供前所未有的知识。如果更严格地认为只有包含了知识创造的活动才属于知识生产的话,那么“人工智能内容生成实际上仍是知识重组,而不是知识生产或再生产。”①支振锋:《生成式人工智能大模型的信息内容治理》,《政法论坛》2023 年第4 期。

生成式人工智能虽然不能进行像人一样的有创造性的知识生产,但由于其生成的文本通常负载着信息和知识,所以也可以拟人化地视其为参与了知识生产活动,当然这是一种特殊的知识生产类型,也可以称之为知识生产的一种新形态。为了将人工智能的文本生成纳入到知识生产的范畴中来,我们需要对知识生产加以“分阶”考察,并引入“一阶知识生产”“二阶知识生产”和“三阶知识生产”的类型概念。

知识哲学的一项重要工作是对知识进行分类,如普遍知识与特殊知识、理性知识与感性知识、科学知识与人文知识等就是一些通常的分类视角。除此以外,一阶知识和二阶知识也是一个重要的分类视角。

目前,学界区分一阶知识和二阶知识的标准并不统一,从而这两种知识所指的含义也各有不同。如有的将一阶知识界定为“知其然”的一类知识, 二阶知识为“知其所以然”的一类知识;②陈嘉映:《当代知识论的中国话语》,《哲学分析》2022 年第1 期。有的则将“知道窗外有一棵树”归类为一阶知识,而将“知道我的知觉是可靠的”归类为二阶知识;③赵丹、胡志强:《认识源泉的可靠性:知识论的一个两难问题》,《哲学动态》2020 年第10 期。还有的将一阶知识视为直接认识对象而形成的知识,二阶知识则是加工一阶知识后形成的知识。④姜华:《从辛弃疾到GPT:人工智能对人类知识生产格局的重塑及其效应》,《南京社会科学》2023 年第2 期。或许还可以根据经验分为直接经验和间接经验两类,来将基于直接经验的知识界定为一阶知识,将基于间接经验的知识划归为二阶知识等。

结合知识生产的视角,我们在这里还可以提出另一种与上述既有联系也有区别的知识分类:将原创性知识界定为一阶知识,而将对一阶知识进行整理和加工(如将其系统化、体系化、通俗化等以利于传播)后形成的知识称为二阶知识。相应地,“一阶知识生产”就是探索、发现和创造出新知识的广义的科学研究活动,如技术发明、科学发现、学术创新、学派创建、文学艺术创作等;“二阶知识生产”则是对一阶知识所进行的梳理、汇集、介绍、翻译、推广和传承的种种工作,如编写将知识体系化的教材、编撰将知识词条化的百科全书、编簒将文献典籍汇集起来的类书或丛书等,它本质上是对一阶知识的引用、整理和传播,供知识的教育、传承和发展之用。由此也可以看到,一阶知识源于研究和探索,二阶知识缘自传播和教育。一阶知识生产的“标准产品”是学术论文,二级知识生产的标准产品则是教科书和各种形式的“工具书”。在网络时代来临后,这些知识产品既能以纸质形态存在,也能以数字形态(如维基百科、百度百科)在网络世界中存在,后者使得相应的知识生产和传播也可以在电子网络空间中进行。

一阶知识的生产具有“前所未有”性,它是面对认识客体的“原创性知识”的形成,是新知识的创造;这种新知识不能从任何先前的知识中采用演绎(基于规则)或归纳(基于统计或概括)等手段所推导出来(如相对论就不能从牛顿力学中推导出来)。二阶知识生产的主要特征是要保持对一阶知识的忠实,将一阶知识准确地再现和介绍出来,为的是使更多的人能够理解和把握一阶知识,它主要行使知识传播的功能,通常不允许有超出一阶知识(原意)的随意发挥,并有专门的机构和人员对其进行纠错,以确保二阶知识在传播一阶知识时的准确性。二阶知识生产也是使一阶知识“社会化”或“正统化”的手段与方式,是一阶知识得到广泛传播和留存的必要途径,没有二阶知识的加持,一阶知识往往会淹没于知识的海洋或历史的风尘之中。进行一阶和二阶知识生产的人通常被分别称为知识的创造者和传播者。

还可以借鉴文献学中的文献分类来理解一阶和二阶知识。文献学将人类生产的知识文献分为零次、一次、二次和三次文献,其中零次文献就是不曾公开的诸如实验或会议记录、内部档案等文献,一次文献主要指带有创造性的原始论文或著作;二次文献是按一定规则将分散无序的一次文献进行加工、整理和组织而形成的目录、索引、文摘、丛书等,它不像一次文献那样包含新的知识信息;三次文献是在利用二次文献的基础上,对一次文献的内容再度加工后产生的诸如教科书、百科全书、词典、年鉴等。两相对比,我们这里所界定的一阶知识相当于文献学中一次文献所负载的知识,二阶知识相当于二次和三次文献中传播的知识,而零次文献的内容还没有成为真正的知识,所以不进入知识分类的视野。

生成式人工智能的出现,使得我们需要超出既有的一阶和二阶知识生产范畴,引入“三阶知识生产”的概念,将其视为由生成式人工智能所介导的知识生产新形态,才能恰当地表述GPT 之类的文本生成属性。生成式人工智能介导的三阶知识生产,不同于既有的一阶和二阶知识生产,但又与它们也有紧密的关联,它是“奠基于一阶知识与二阶知识基础之上的新的知识形态”。①姜华:《从辛弃疾到GPT:人工智能对人类知识生产格局的重塑及其效应》,《南京社会科学》2023 年第2 期。由GPT 所生成的三阶知识,是对一阶和二阶知识加以整合、加工后所形成的,这些一阶和二阶知识以语料的形式用于GPT 的模型训练,它们包括主要来自互联网上的书籍、论文、博客、新闻网站、百科网站(如维基百科、百度百科等)和社交媒体平台等开放性的数字化电子资源,其中的主要部分就是人类已经创造出来的一阶知识和被整理出来的二阶知识。GPT 模型生成文本时,就是在这些训练语料(知识)的基础上进行模仿、预测和推论,亦即对既有的一阶和二阶知识进行再度的加工与运用,形同对其进行了新的概括和阐释,抑或是对既有的一阶和二阶知识的再消化、再组织、再利用而形成的知识。这样的三阶知识既来源于一阶和二阶知识,又与其相区别,因为它不是对一阶和二阶知识的复述或拷贝,而是以新的表述或文本来加以展示。三阶知识生产还包括将一种形态的知识(如用自然语言表述的知识)转变为另一种形态的知识(如用视频、图像或程序表达出来的知识),这正是GPT-4 和一些新版本的生成式人工智能产品能够具备的神奇功能。

如果将三阶知识生产与二阶知识生产进行专门的比较,也可以发现两者是既相似也不同的。相似在于,它们都不同于一阶知识那样是从“0”到“1”的原始性知识创造,都属于“从有到有”的知识形式的变换;不同在于,三阶知识不像二阶知识那样需要对一阶知识加以毫不走样的准确再现,而是在知识的再生产中具有了更强的灵活性:它可以对既有的知识在自学习的基础上进行基于综合与推断的“发挥”或“建构”,它的工作机制就是“在提示下构建模仿训练文本中类似话语的文本话语”,②Jesse Meyer, Ryan Urbanowicz, Patrick Martin, et al., “ChatGPT and Large Language Models in Academia: Opportunities and Challenges”, BioData Mining, vol.16, no.1, 2023.这种“类似”又并非完全一样,而是可以形成与训练数据不一样的样本,从而在形式上呈现出与一阶知识的不一样,由此呈现出某种程度的创造性或新颖性。当然这种创造显然不同于一阶知识的创造,只属于表述方式或“版本”意义的新颖,是生成“新文本”而非生成真正的“新知识”,其功能主要是使一阶或二阶知识得到多样化的呈现。在物质世界中,我们知道化学变化才能形成新物质,而物理变化则不能。同样,“ChatGPT 对我们知识的整理是一种物理集合,它能够整合知识和全网大数据;但它并没有让知识产生化学反应,它只是物理反应。”③张洪忠、黄民烈等:《ChatGPT 的技术逻辑、社会影响与传播学未来》,《江西师范大学学报(哲学社会科学版)》2023 年第2 期。

如果再就三种知识生产对于“创新”的关系加以比较可以看到,一阶知识生产的本质就是创新,且是“原创之新”。二阶知识主要的目的是忠实地复现一阶知识,基本上不允许创新。当然,进行二阶知识生产时,也会在面对浩如烟海的一阶知识时,面临编撰、汇集或引用哪些知识的选择问题,可能不同的人会有不同的关注点,这种关注点的变化,也可以导致二阶知识成果的不同或新颖,这样的新颖或创新可称为“关注之新”。三阶知识生产是通过词语的重组而呈现出来的“表述之新”。在内容的效果上,三阶知识之新是对既有知识的新理解、新阐释,导向的是一种非原始创新的“文本创新”或“阐释创新”,或对既有知识的应用之新,而不是“发现之新”,从而属于非本质之新。生成式人工智能至少在目前还不具有知识发现的能力,因为它只能提供预训练时所“积累”起来的知识,海量数据的大训练使它“见多识广”,可以生成能够回应广泛领域问题的答案,但在知识水平上它不会超出人类既有的知识量,没有也不可能带来超出训练数据集的新信息,如果超出,反而是不正常的“胡说八道”。它虽然可以说出前人没有说出过的“话”,形成不同于既有叙事的新文本,但并不能说出前人没有说出过的意思,即不能表达出人类知识总和以外的新知识,而只能是换种方式表达了既有知识,因此它的“新”类似于“新瓶装旧酒”中的“新”,而非形成新概念新理论意义上的内在之新、根本之新。正因为如此,所以使用这一工具时,用其来生成规范的、有先例可循的文本时,它表现得十分擅长和高效;而如果让它就某一人类未知的领域写一篇研究论文,它就爱莫能助,或信马由缰地胡诌一气。这表明即使是它的表述之新,也有风险,可能“走偏”,这就是ChatGPT 中的幻觉现象(hallucination):在没有适当指引和缺乏先在语料训练的情况下,它会生成一些看上去合理但实际有误的回应文本,即“一本正经地胡说八道”,甚至还会“无中生有”地伪造参考文献和事实,“很容易提供明显自信的捏造信息”,①Jesse Meyer, Ryan Urbanowicz, Patrick Martin, et al., “ChatGPT and Large Language Models in Academia: Opportunities and Challenges”, BioData Mining, vol.16, no.1, 2023.这显然与一阶知识生产中的“无中生有”在性质上完全不同。

三种知识生产的区别,就文献形态来说,一阶知识生产的最高文献形态是“经典”,每一部经典,在人类的知识体系中既前所未有,也不可取代。二阶知识生产的最高文献形态是广义的“词典”:供人方便查阅、学习和掌握人类既有知识的各种工具书、教科书及知识普及读物等。三阶知识生产的文本形态还是无法归类的“非典”:因为它在目前水平上形成的文本是既非经典也非词典的“非典型类文本”,如在内容上它是一阶、二阶知识经过智能机器加工后的“杂合体”,是在人的提示词不断引导下进行回应中所共建的“人机混合文本”,以至于难以将其归类为是典型的人的作品还是机器的作品,所以导致了知识产权、文本署名等方面的新争议,进而ChatGPT 即使参与了论文的贡献,也很难被认为是论文的“作者”或“作者之一”,甚至不少刊物(如Nature、Science等)完全拒绝刊用通过GPT 等生成的内容,表明它作为“知识生产者”的“身份”还普遍不被人类的知识平台所认可,更何况它所生成的文本中还难免有伪造和胡诌的内容,这些都使其难入人类知识宝库的“典籍”之列被加以“典藏”,所以这里的“非典”也具有“知识典籍之外”的含义。

总之,生成式人工智能可以生成新文本的文本创新,并不等同于能够生产新知识的知识创新,这是我们在理解生成式人工智能介导的三阶知识生产时,必须看到的重要特征;同时,也只有从三阶知识生产的视角,我们才能准确把握ChatGPT 等生成式人工智能所进行的内容生成的实质。

三、三阶知识生产的意义

生成式人工智能所造就的三阶知识生产虽然不能像一阶知识生产那样具有原创性,但对于人类的知识生产来说,也具有独特而重要的意义。无论什么时代,一阶知识生产都是决定知识生产水平的最重要的知识生产形态,二阶知识生产可以通过其传播和教育功能,来辅助人类一阶知识生产能力的提高。而生成式人工智能所带来的三阶知识生产,对积极促进一阶知识生产力的提高提供了新的途径,它能够带动原创性新知识的出产效率,这是生成式人工智能介导的三阶知识生产的最大价值。

在生成式人工智能介导的三阶知识生产尚未出现之前,在知识生产的领域中,人所进行的要么是一阶知识生产,要么是二阶知识生产,当然在现实中也会融合进行一阶与二阶相交织的知识生产,如在整理和介绍前人的一阶知识成果时(此即二阶知识生产),有可能发现和提出新的见解,可以看作是二阶知识生产中蕴含的一阶知识生产;与此同时,一阶知识生产中也可能蕴含着二阶知识生产,如在职业的一阶知识生产者那里,其发表的具有学术创见的论著可归类为他所完成的一阶知识生产成果,但其中无疑交织着大量的二阶知识生产内容,如对所涉及论题的文献梳理和知识背景介绍,以及为了论证自己的观点而进行的旁征博引,这些都属于二阶知识生产的范畴,这部分知识生产通常既耗时间也耗精力,但它是一阶知识生产的必要准备或辅助部分,起着奠基、佐证、支撑等作用。在这个意义上,所谓一阶知识生产的从“0”到“1”,并不是绝对意义上的无中生有,而必须有作为知识创新基础的“前知识”作为可借鉴的支点和向导,也就是需要进行大量的二阶知识生产活动才能孕育出珍贵的一阶知识生产成果。

当生成式人工智能介导的三阶知识生产出现后,人类的知识生产就从过去以一阶和二阶知识生产的协同为主,进一步演进为一阶、二阶和三阶知识生产的交合为主,此时生成式人工智能介导的三阶知识生产将会越来越多地介入到整个知识生产过程中来,由它来替代大部分在过去表现为二阶知识生产的部分(如对一阶知识的整理和概括),并且以极高的效率来完成这部分的知识生产。如在GPT 平台上,只要设置好了相关知识的概括和整理范围,就可以一键获取由机器系统所自动完成的文献综述。此外,在帮助人整理思路、形成文本成果方面,GPT 的三阶知识生产也能大显身手,其强大的文本生成能力,使得 “人工智能虽然不能产生新的想法,但它可以帮助研究人员和科学家组织材料、整理想法,形成初稿”,①Jaeho Jeon and Seongyong Lee, “Large Language Models in Education: A Focus on the Complementary Relationship between Human Teachers and ChatGPT”, Education and Information Technologies, 17 April, 2023.还可以在初稿形成后由它来进行智能查错纠错和润色,即可以帮助人高效优质地完成将思想转化为文字、组织为文本的写作过程,而这个过程由人来完成时也是极耗精力和时间的。仅就如上两个方面来说,生成式人工智能介导的三阶知识生产就可以使人从大量的收集和整理资料、组织思想片段形成初步文稿等方面的工具性劳动中解放出来,将更多的精力和时间用于知识生产的核心环节或“高端”部分,更多地投入或专注于只有人才能完成的知识创新工作,同时还可以不断降低知识生产的边际成本,加快知识生产的节奏,提高知识创新的能力。因此,目前不少研究人员已经开始将人工智能生产内容的技术作为研究助理,帮助他们组织思维、协助编写代码、总结研究文献、撰写和修改论文等。②Matthew Hutson, “Could Al Help You to Write Your Next Paper?”, Nature, vol.611, no.7934, 2022.鉴于机器生成文本的优势,可以使人机合作的知识生产具有“更高的产出效率、更为稳定的内容质量、更低的产出成本,其内容的可拓展性也将更强。”③陈永伟:《超越ChatGPT:生成式人工智能的机遇、风险与挑战》,《山东大学学报(哲学社会科学版)》2023年第2 期。

当生成式人工智能具备长文本的生成能力后,先前由人所进行的大量二阶知识生产,如编写教科书和工具书的工作,都可以交由机器去完成;同时,二阶知识生产中的知识传播活动,如教育,则由于三阶知识生产的出现也会受到极大的影响,那就是将其引入教育后,无论是教师的知识传授还是学生的知识习得,都可以借助智能机器来提供更为个性化、更有针对性和灵活性的教学方式,从而大大提高教与学的效果,且大量的教学过程将变为人机直接交互的过程,使教师必须在场地面对学生进行知识传授的二阶知识生产活动,逐步替换为生成式人工智能介导的三阶知识生产活动,而且完成得比人更好更快,从而在二阶知识生产的传统领域中带来教育的革命、学习的革命和传播的革命。

作为三阶知识策源地的生成式人工智能还是群体智能的化身,它可以极大地赋能于个体的知识生产,使个体的知识生产能力得到强力推进。在生成式人工智能中集合了海量的人类知识和智能,使用ChatGPT 之类的工具时,就是以人机合作的方式在借用其中的群体智能,通过与GPT 的互动,人可以从机器智能系统所蕴含的算法中获得新的思路和想法,尤其在人机对话中受到激发和启发,获得创作、创新的灵感,所以“ChatGPT 可以帮助研究人员、学生和教育工作者产生想法。”④Editorial, “ChatGPT for Academic Writing: A Game Changer or a Disruptive Tool”, Journal of Anaesthesiology Clinical Pharmacology, vol.39, no.1, 2023.我们知道,作为个体的人总是知识有限的,进行知识创造时总会碰到相关知识储备不足的问题,需要不断向更有知识的人请教或进行“知识充电”,但总会受制于所能接触到的人不足够多或不足够博学,从而不能获得及时满意的知识帮助。而生成式人工智能的人机问答使得人联通了一个无所不知而又有求必应的“在线知识助理”,当人在知识生产中碰到需要“请教”的种种知识性问题时,生成式人工智能能够搜索和分析海量的数据和信息,调动在训练中积累或学会的知识,从中提取答案,为人提供咨询,所以ChatGPT 虽然还不是思想家(给人直接提供原创性的新思想),但完全可以充当“学问家”,对人在知识生产中碰到的知识问题给予有问必答、有惑必解的即时帮助。人可以将来自智能系统的新知识、新启发以及在此基础上形成的新灵感融入自己的研究中,形成新见识、新观点,再借助GPT 将其条理化和文本化,进而成型化为知识产品。可以将生成式人工智能的这些功能视为 “知识和智能服务功能”,它本身虽然不是直接的一阶知识生产主体,但以其中蕴含的人类级别的群体知识和群体智能,对以人为主体的知识生产提供了空前的帮助,从而有效推动知识生产的进步。

三阶知识生产的意义还在于创新链的相互传递。如前所述,一阶知识生产体现的是原创之新,二阶和三阶知识生产体现的是注意之新和表述之新,它们均包含对一阶知识的消化吸收再创新,在这个过程中可以发现新的问题、新的研究对象,从而开启一阶知识生产的新方向或新领域,由此导向新一轮的一阶知识创新。不仅如此,作为三阶知识生产系统的生成式人工智能在未来还有可能进化到具有进行一阶知识生产的能力,这就是从人的知识生产助手(弱人工智能),进化到人的知识生产伙伴或代理(通用人工智能或强人工智能),甚至进化为全面碾压和取代人的知识生产能力的对手(超人工智能),所以它才被认为是人工智能发展的拐点,是从弱人工智能到强人工智能的过渡形态,以至于GPT-4“被认为是通用人工智能的早期版本”,①Sébastien Bubeck, Varun Chandrasekaran, Ronen Eldan, et al., “Sparks of Artificial General Intelligence: Early Experiments with GPT-4”, arXiv website: https://arxiv.org/abs/2303.12712, April 13, 2023.有的甚至直接“视其为通用人工智能,即使不等同,也是正在推进通用人工智能”。②Li Weigang, Lirian Michi Enamoto, Li Denise Leyi, et al., “New Directions for Artificial Intelligence: Human, Machine,Biological, and Quantum Intelligence”, Front Inform Technol Electron Eng, vol.23, no.6, 2022.就是说,三阶知识生产,也可以说是生成式人工智能为人类开创的一种知识生产新类型,这种知识生产虽然在当前的技术基础上还不具有原创性,不具有一阶知识的创新能力,但它可以对人类的一阶知识创新提供多方面的帮助或促进,甚至还包含着基于更高技术水平的一阶知识创新的潜力。

三阶知识生产的上述意义,也包含了它对生成式人工智能的合理定位:它在目前还不能等价于一阶知识生产,但开创了知识生产新形态、提供了知识生产新工具,这既不夸大也不抹杀它在知识生产中的作用。生成式人工智能介导的三阶知识生产,是在一阶和二阶知识生产基础上的一种“知识再生产”,这种再生产并非完全消极地映射一阶和二阶知识生产的样貌,而是可以积极反馈和推进一阶知识生产中的原始创新,当然也可能因手段的限制而生成不真实不可靠的内容,如在没有知识或数据储备的领域或问题上“编出”某种不存在的“知识”,导向一种“创造性破坏效应”,③高奇琦:《GPT 技术与人文社会科学知识生产:智能时代的学者与学术研究》,《上海交通大学学报(哲学社会科学版)》2023 年第3 期。这无疑也是全面看待三阶知识生产意义的不容忽视的一个方面。

四、结语

基于以上的分析,对于“生成式人工智能可否进行知识生产”的问题,可给予明确的肯定回答,即它的工作具有知识生产的性质,但属于一种特定的知识生产——三阶知识的生产,它与人所进行的一阶和二阶知识生产都有所不同。这种知识生产中也可能有创新,但不是一阶知识意义上的创新。三阶知识生产在介入到人所进行的知识生产过程中后,仍然具有重要而特殊的意义,如它的出现,增加了知识生产的新形式,产出了更加丰富和多样的内容,这些内容经过人的验证、加工和提升后,有可能成为新的知识。它的出现还可影响一阶知识和二阶知识的生产,从直接和间接的意义上,全面地影响了人类的知识生产,从而在智能文明中发挥越来越大的作用,为人的知识创新提供前所未有的帮助,增强人类的知识生产力,也使人类的知识生产进入到一个新时代:“人机合作”的知识生产新时代。探究和发掘生成式人工智能如何重塑了知识生产的新形态,为的是积极顺应这一变化,主动调整学习、教育和研究策略,造就更强大的人机交互的知识生产能力,营造更具活力的知识社会,尤其是探索如何借助生成式人工智能提升人类的原始创新能力,使智能技术的增强效应切实赋能于人,也惠及于人。

猜你喜欢
三阶二阶人工智能
三阶非线性微分方程周期解的非退化和存在唯一性
一类二阶迭代泛函微分方程的周期解
一类二阶中立随机偏微分方程的吸引集和拟不变集
2019:人工智能
二阶线性微分方程的解法
人工智能与就业
一类二阶中立随机偏微分方程的吸引集和拟不变集
数读人工智能
下一幕,人工智能!
三类可降阶的三阶非线性微分方程