【摘要】文章基于人工智能生成知识的视角,分析了智慧驱动型和数据驱动型两种知识生成的原理,论述了个体生产知识、专业生产知识、大众生产知识以及人工智能生成知识的沿革历程,最后提出知识生成格局的变化对出版业、出版本质及出版学研究范围拓展三个方面的价值思考。
【关键词】AIGC 生成式智能出版 ChatGPT 数字出版 数据科学 微软小冰
【中图分类号】G230 【文献标识码】A 【文章编号】1003-6687(2023)11-036-09
【DOI】10.13786/j.cnki.cn14-1066/g2.2023.11.005
生成式人工智能技术的出现引起社会各行各业的热议和思考,在出版业内部,将引发编校印发各环节革新;[1]在出版业外部,将促进出版大数据、智能知识服务、出版领域智能决策机器人、生成式智能出版物以及元宇宙出版等新产品、新业态和新模式的涌现。[2]此外,生成式人工智能技术将推动出版业前端——知识生成方式发生革命性变化,把人类生成知识推至人机协同生成知识的新层面。
一、知识生成原理阐释:以智慧为中心与以数据为中心
出版是知识生产和表达的产业,知识生产是出版业的前提和基础。所谓知识,《现代汉語词典》有两种解释:第一种是指人们在社会实践中所获得的认识和经验的总和;第二种是指学术、文化或学问,如知识面、知识分子等。本文以第一种概念为立论之基,探讨知识的生成理路。
人类社会发展至今,知识生成包含智慧驱动型和数据驱动型两种类型。智慧驱动型知识生成方式,是指知识生成是在人的智慧主导下所形成的知识创造。知识生成最初的原动力源于个体,即“个体通过直接的‘实践经验积累隐性知识”。[3]隐性知识无法通过文字、语言、图表或符号来明确表述,也难以进行逻辑说明,往往是人类非语言智力活动的成果,如非正式的、难以表达的经验、技巧、技能和诀窍等技能类隐性知识,再如直觉、感悟、洞察力、心智模式、团队默契、企业文化等认识类隐性知识。隐性知识生成以后,大致形成了社会化、外显化、组合化、内隐化四种知识转化模式。[4]社会化,强调隐性知识的传播过程,即通过传授、观察、模仿等社会化方式实现个体与个体之间的隐性知识传播,如出版业中的“传帮带”学徒机制,新编辑通过模仿、学习和请教等方式学会老编辑的技巧和经验。外显化,是隐性知识转化为显性知识的过程。显性知识是指可以通过文字、图表、公式等进行完整表述的知识,隐性知识显性化的呈现方式包括概念、假设、模式、类比或比喻等。组合化,是指显性知识通过增加、关联、组合、分类和整理等形式向系统知识转化的过程。内隐化,是指显性知识的隐性化过程,即显性知识体现于隐性知识之中,生成应用性、操作性知识,如“事上练”“干中学”较好地形容了内隐化过程。智慧驱动型的知识生成是目前占据主流地位的知识生成方式,构成了目前出版业所生产和传播的主流知识。知识转化之后,则进入知识论证或验证阶段。论证环节是指人们通过预测或实验,能够证伪或证明该知识环节决定着知识的合规律性和知识质量。在知识体系构建的过程中,论证环节主要通过知识融合方式实现:为解决知识质量参差不齐、基于不同数据源的知识重复等问题,进行知识融合;对来自不同数据源的知识基于同一框架规范进行异构数据整合、消歧,由实体对齐和实体消歧组成。
数据驱动型知识生成方式,是指基于海量数据的知识生产原料,从中挖掘出新规律、新知识,实现数据、信息走向知识生成的使命。“以数据为关键原料的知识生产范式的出现与知识形态的演变,意味着新的认识论或知识观正在悄然形成。”[3]数据驱动型知识生成方式离不开数据、算法和算力要素的支持。在数据方面,“机器学习的数据是影响创作质量的重要因素,掌握的数据越多,设定的程序越清晰,他们的知识创作会越顺利”。[5]相反,数据积累偏少、数据质量不高或需高度创造性写作的领域,[6]知识智能生成就无法实现。就新闻机器人而言,越是天气、地震预报及金融、体育等数据繁多、结构化和标准化水平较高(“干净”数据)的领域,[7]就越容易开发出实用价值突出的自然语言自动生成系统;就生成型预训练聊天机器人而言,ChatGPT之所以能够取得突破性进展,极为关键的因素是其从网页、WebText2、图书、维基百科等渠道搜集而来的3 000亿单词语料,经过数据清理后形成超过1 750亿的巨量无标注文本数据;[8]就写作机器人而言,微软小冰在出版《阳光失了玻璃窗》诗集之前,就已完成自1920年以来519位诗人的现代诗数据训练,并借助深度神经网络等技术,在训练1万次之后,具备了创作现代诗歌的能力。
在算法方面,机器人根据语法、句法规则,或者大语言模型,实现半自动或全自动的自然语言生成,形成符合人类认知、需求和价值观的内容。不过在具体的算法应用方面尚有较大差异,如微软小冰采用基于规则的系统和机器学习技术,而ChatGPT则基于海量语料库以及人类的反馈强化学习算法。
在算力方面,算力水平的高低、强弱决定着算法作用的发挥和数据处理能力的大小。通俗理解,算力相当于人的大脑在观察、感知、决策、控制等方面的反应速度。ChatGPT能够成为AI发展的里程碑式成果,在知识生成方面实现巨大跨越,离不开超强算力的支撑和加持。ChatGPT使用的GPT3.5模型在微软云计算服务Azure AI的超算基础设施上训练,总算力消耗约为3 640PF-days(按每秒一千万亿次计算,须运行3 640天);[9]而小冰公司与微软中国联手推出的人工智能解决方案,则将微软智能云Azure作为云计算运营平台,可以提供大规模的计算资源支持。
2021年,Haiko等人从数据科学视角提出了数据智能和分析的知识创造过程模型,将人的智慧和智能化技术进行了有机融合。[10]该模型分为扩大个体知识、分享隐性知识、业务概念(个体通过分享扩充知识以增强业务内容理解能力)、数据理解、数据准备(数据加工、清洗、整合等)、数据建模、评估论证、知识生成(知识网络化)、模型应用以及部署(新知识、新模型的应用)阶段。也有国内学者进一步提炼为“业务理解与概念化、数据准备与建模、知识生成与模型应用”[3]三个阶段。由此看来,人类智慧生产知识和数据生成知识的融合趋势日益明显,融为一体、合而为一的知识生成新格局正在加速形成。
二、知识生成进阶分析:从个体智慧到人工智能
ChatGPT的火出圈,也推动着知识生成从个体生产知识、专业生产知识、大众生产知识走向人工智能生成知识,进而推动人机协同生成知识新格局的出现,知识生成进阶见下页图1。
1. 个体生产知识
“人类知识的两大枝干,它们也许来自某种共同但不为我们所知的根源,这就是感性和理性。”[11]知识是如何产生的?关于这个问题,古今中外先贤们孜孜不倦地追求并试图给出尽可能合理的答案,由此形成了经验论和唯理论两种认知观。以笛卡尔、斯宾诺莎和莱布尼茨等人为代表的唯理论派认为,知识的源泉是“天赋观念”,唯有经过演绎和推理所获得的理性知识,方是可靠的知识,因此崇尚演绎法;而贝克莱、休谟和马赫等则认为,知识的源泉是经验感知,知识是对客观世界的反映,人们通过感官对世界进行观察归纳和总结,从而形成知识,故崇尚归纳法。
此外,力图综合唯理论和经验论的康德则以感知经验为基础,提出先验想象力的概念,以“灵魂不可或缺的功能”[12]试图找寻二者之间的平衡点,即想象力是感情和理性的中介,是先天知识的奠基力量。“科学始于问题”是卡尔·波普尔提出的著名观点,[13]强调的是问题促使人们探索、思考,并通过科学严谨的求证过程获得答案,最终形成有关问题的科学知识。[14]应该说,“科学始于问题”的知识生产方式,围绕着问题的提出、猜想假设、证伪排除,最终提出新问题,同样综合了唯理论和经验论,并强调实验法对科学知识发现的重要价值。
个体生产知识本质上是观念生产和创造活动,是个体基于语言和心智,对陌生事物的概念、属性、特征、程序、结构、逻辑等进行探索的过程。基于个体生产的知识,推动着社会从蒙昧朴素走向科学理性,对科学和社会发展有着不可磨灭的贡献。[5]个体生产知识古已有之,是出版和出版业发展的原动力。如孔子以“垂世立教”的思想“书其重者”,选择重要的学术著作进行整理、删节、补充、编次和阐述,编订“六经”,归纳总结了夏商周三代文化,实现了中华文化的传播与传承,且孔子之于《论语》的原创性知识生产影响深远,迄今仍然是出版机构出版和发行的畅销品牌。个体生产知识对出版业的影响还体现在专著出版这一出版业态上。在学术出版或专业出版领域,专著是学术成果的最主要体现,也是个体生产知识的智慧结晶,是作者围绕特定选题所进行的系统、专深的知识生产。
2. 专业生产知识
专业生产知识是指由专门的组织或个人负责知识生产,是以知识生产为职业活动的过程。“专业组织所生产的文化形式开始决定着其他个体文化形式的合法性、合理性与发展方向,垄断着对宇宙、社会、人生以及神的存在等问题的解释权,影响着人类的终极关怀。”[15]
在我国历史上,西周时期就已出现专业化的知识生产组织,《礼记·王制》记载:“天子命之教然后为学。小学在公宫南之左,大学在郊。天子曰辟雍,诸侯曰泮宫。”天子的大学叫辟雍,诸侯的大学叫泮宫。春秋战国时期,诸子百家争鸣,分别生产、传播和传世了各学派的知识和理论。诸子书编纂有个鲜明特点,即采用语录体,[16]由弟子门人根据老师生前言谈内容编辑记录而成。西汉时期,“兴太学”,“以养天下之士”。作为专门传授知识、研究学问的太学,开创于公元前124年,与西方的雅典大学、亚历山大里亚大学同为世界上最古老的高等学校。[17]到唐朝初年,太学规模完备,盛极一时。唐朝和宋朝,太学和国子学同时存在,元明清则改设国子学或国子监。
西方出现的第一个培育思想的场所是公元前387年柏拉图创立的阿加德米学园,被视作“雅典第一个永久性的高等教育机构”。[18]学园生产和教授体操、数学、音乐、法律等各门知识,以培养自由人格和探索万物本源的能力。中世纪时期,沙龙成为上流社会和文人雅士生产和交流知识的重要场所,知识生产为上流精英和政府权威所垄断。及至大学出现,符合要求的大学从业者成为职业化的知识生产者,与科研团队在组织制度下从事知识生产,从而实现了个人知识向专业知识的跨越。而今,大学也不再是唯一的知识生产组织,学会、协会、实验室、科技公司、创新智库等越来越成为科研创新主体,担任着生产和传播知识的角色。
专业人士生产知识或精英群体生产知识,本质上还是个体生产知识,只不过依托专门化的知识生产组织,在知识探索、生产和传播途径上更加科学化、合理化和系统化。而专业组织生产知识或专业机构生产知识,一方面,使知识的生产者、拥有者由权贵阶层、精英阶层转变为职业性知识生产者,只要该生产者具有专业组织标准,即可在制度内从事知识的协同生产和传播;另一方面,个体生产知识模式转变为协作生产知识模式,知识生产向着群体化、社会化、职业化、建制化、合理化的方向发展,在更大范围内、更高水平上、更深程度上推动了人类社会的知识生产和传播水平的提升。
以出版视角来审视,专业生产知识对出版业发展也产生了深刻而久远的影响。首先,学术出版本身就是对学术成果进行编辑加工,面向学术群体进行传播,以推动学术研究进步为宗旨。[19]学术出版得以诞生、发展与壮大,离不开专业生产内容模式的出现,得益于大学等专业组织生产和传播知识的直接推动。其次,专业出版作为面向特定领域的职业群体所开展的法律、医学、建筑等专业知识生产和传播的业态,本身也是专业生产知识模式在出版业的体现,是专业生产和传播知识的发展结果。最后,教育出版是以教材、教辅图书、数字教育服务为主要产品的出版业态,以社会教育和知识传播为主要目的。
3. 大眾生产知识
随着互联网时代的到来,网络重构了社会形态,也成为新知识的提供方和沉淀池。为适应互联网变革,“知识的创造者和应用者都要具有将知识转化成电脑语言的工具和技巧”,[20]通过键盘、屏幕、网络等新介质,人们在互联网上生产、分发和共享数据、信息、知识,形成了新的思维方式、工作方式和生活方式。于是,用户生产知识这一新的知识生产方式应运而生。
用户生产知识在出版业有几种典型的业态,在特定的发展阶段,这些新业态的出现,进一步推动了出版业的可持续、高质量发展。第一,网络出版。网络出版相较于传统的图书出版,首先,作者身份由专业群体转变为大众网民,出版作者准入门槛降低,作者群体规模扩大;其次,出版的门槛实质性降低了,不像图书出版需要严格的书号配给,网络出版取得经营许可证后,具体的编号编码由网络出版企业自行开展;再次,网民大众生产网络文学、小说作品等,通过网络出版的传播,进一步发挥了数字出版产品的教诲、审美、伦理等价值,维护了社会和谐稳定。第二,众智众创的民营出版。民营文化公司的知识生产方式,较国有出版企业有较大不同:后者主要是借助外部作者的资源,进行知识的二次生产;而前者则大多围绕特定領域、特定主题、特定知识点,组织包括自身队伍在内的众人智慧进行编创,是知识的一次生产,甚至许多出版产品的知识生产完全来自自身,如考研辅导读物、中小学教辅读物等。第三,基于互联网的大众协作式知识生产。基于互联网的大众协作式知识生产,如百度百科、维基百科、豆瓣小组等网络平台的知识产品,往往就特定的知识体系、知识点,面向全网征稿,符合一定标准和具备一定水平的网民,可以就相关词条、相关作品进行内容编创,所完成的知识产品经过审校后可面向整个互联网进行知识传播。值得注意的是,这种生产方式,一方面,融汇了大众集体的智慧,是智慧生产知识的模式;另一方面,也融合了智能化的数字技术,采取知识挖掘、数据驱动知识生成技术,因此是既属于智慧驱动型也属于数据驱动型的知识生产模式。
随着5G技术的普及和推广,互联网门槛进一步降低,得益于移动互联网终端设备的普及与通信宽带提速降费等,用户依然是互联网内容的主要生产者和有力传播者。[21]基于5G容量增强、海量终端、高速率以及低时延等技术优势,大众进行知识生产、制作、下载的高速度、即时化效果将进一步呈现,同时,将进一步面临生产内容、生产知识的审核、把关等方面的挑战。
于出版业发展而言,大众生产知识模式的出现,一方面,扩大了上游的作者群体,使作者的范畴不再局限于专业人士和专业组织,进一步扩展到数量更多、范围更广、代表性更强的公民大众;另一方面,大众生产知识模式的丰富和发展,推动着大众出版、民营出版的蓬勃发展,促进了网络出版业态的繁荣壮大,也进一步强化了众智众创的群体智能技术在出版业的广泛落地和应用。
4. 人工智能生成知识
前述个体生产知识、专业生产知识、大众生产知识在各自的发展阶段对知识生产、传播和规律探索都起到了积极的推动作用,但是知识生产的主体始终局限于人的范畴。而人工智能生产知识则把知识生产主体由同质的个人、专业群体或专业组织扩展到异质的数据、算法、机器、人工智能。
其实,新型内容生产方式(AIGC)并非新事物,早在第二次人工智能浪潮(1976—2006年)时,专家系统就试图通过“人机交互界面、知识库、推理机、解释器、综合数据库、知识获取”[22]等部件,输入某个领域的大量专家知识与经验,模拟人类专家的推理思维,解决需要人类专家处理的复杂知识问题。专家系统依据知识库,使用推理机所得出的结论,就具备了AIGC的雏形,具有了人工智能生成知识的意味。1976年,耶鲁大学开启了机器模拟人类写作的先河,研发了全球首套故事写作机器算法,支持撰写简讯等简单文字内容。[6]
前些年的微软小冰、新闻机器人、维基百科等都具备了人工智能生成内容的能力,只是ChatGPT优化对话语言模型出现以后,其超强的内容创作、智能回答、代码编写、内容翻译、教育辅导等能力,使得AIGC由专业群体走向公民大众、由特定行业走向社会的方方面面。维基百科、新闻机器人、微软小冰、ChatGPT代表着四种不同人工智能生成内容、知识的技术路线。
(1)基于群体智能的AIGC。群体智能源于20世纪90年代人们对蜜蜂、蚂蚁、鱼、鸟等生物群体的观察和研究。所谓群体智能,是指数量众多的无智能或低智能的简单个体聚集在一起组成群体,利用群体优势通过相互间的分工合作表现出智能行为特性。[23]
群体智能作为新一代人工智能的重要方向,作为我国人工智能发展的重点领域,已是不争的事实。在理论层面,继自组织、间接通信以及群体智能系统的底层机制研究等涌现[24]之后,结构理论与组织方法、激励机制与涌现机理、学习理论与方法、通用计算范式与模型,成为基于互联网的群体智能理论体系重点突破的方向所在。在政策层面,国务院印发的《新一代人工智能发展规划》明确规定了群体智能的基础理论、关键共性技术、服务平台以及应用场景,指出要开展群体智能的知识获取与生成关键技术研究。在实践层面,群体智能的应用场景广泛,几乎渗透到生活的各个方面,如基于群体编辑的维基百科、基于众包众享的共享经济、基于众问众答的知识共享等,甚至包括“基于群智理念的出版流程协同再造”。[25]
维基百科是群体智能生成知识的典型产品,也是前述数据驱动型知识生产方式的经典案例。维基百科“通过大规模群体协作、非线性、去中心化、自下而上的群体智慧方法”,[26]实现了对结构化、半结构化数据源的知识抽取。一方面,抽取的结果形成了形式化的知识,如建筑、法律、医学等领域本体;另一方面,生成了基于元数据的专题知识库。这一过程的微观层面可描述为,用户以标签(用户隐性知识显性化的结果)作为信息载体参与群体的交流和沟通,通过对信息资源的大量标注进行协作,从而形成群体知识;群体知识在推动个体智能提升的基础上促进群体智能的涌现,从而再次巩固群体知识形成的基础。[27]在技术路线的归结上,维基百科奉行的是人机物结合的群体智能2.0时代的众包技术,[28]任务提出者运用互联网聚集群体智慧,将任务发布在众包平台上供参加者选择,任务提出者和参加者基于众包平台进行信息交流。
(2)基于模板的AIGC。就新闻资讯行业而言,机器撰稿、新闻推荐已不是新鲜事物。[29]新闻机器人本身是一种人工智能生成内容、生成知识的技术。国外有代表性的新闻机器人有美联社的WordSmith、《华盛顿邮报》的Heliograf以及《纽约时报》的Blossom等;国内则有新华社的快笔小新、腾讯的Dreamwriter(梦幻写手)、第一财经的DT稿王、《南方都市报》的小南、今日头条的张小明、中国地震台网的地震信息播报机器人等。
机器人撰稿核心技术主要是自然语言处理、数据挖掘、机器学习、知识图谱、语音识别及计算机视觉等。作为自然语言生成系统,机器人撰稿的技术路线有模板式、抽取式和生成式三种。[30]抽取式撰稿的技术路线主要应用在文本自动摘要方面,即机器人从海量文本素材中筛选重要信息,进行二次加工,从原始新闻文本内容中快速抽取核心信息,生成文章摘要。生成式撰稿的技术路线则主要体现在基于大语言模型的AIGC,如ChatGPT。基于模板的机器人撰稿技术是迄今最普遍、最成熟的一种技术。其主要技术原理包括:首先,清洗和加工数据,建立海量的语料库;其次,对海量语料库进行训练,形成深度学习模型,并通过语义分析、命名实体识别和情感分析等技术,准确抓取新闻事件的关键要素,[31]包括测量新闻性、叙事角度排序、匹配报道角度与数据事实(选择故事点)等;最后,因事制宜选择模板,筛选关键数据填入语言模板模型,[32]自动生成新闻稿件并基于自然语言进行润色。早期的新闻机器人所生成的稿件,往往因为模板单一而可读性不强、模板痕迹严重而为人诟病,但经过数十年的发展,各种新闻机器人的语言模板类型不断丰富、数量不断增加,基于不同模板生成的新闻适人化、可读性程度不断提升,已经达到难以区分是由人类撰写还是由机器撰写的程度。如Wordersmith自身拥有100多种报道类型、3亿种新闻写作模板,不同模板的语调、语气和写作风格都各有特色。新闻机器人生成的稿件,从枯燥无味、单调呆板变得更加生动、具有人情味,更加符合人类的学习、阅读、思考和表达习惯。
此外,AI主播等新闻机器人在前述技术基础之上,还运用了计算机视觉、语音合成等技术,基于真人表情、语音、唇形等特征进行建模,把文字信息转化为音视频的形式,实现新闻咨询的音视频播报和实时交流互动。
(3)基于规则的AIGC与基于大模型的AIGC。在ChatGPT出现以前,微软小冰、微软小娜等聊天机器人在内容、知识生成方面有着不俗的表现,一度是AIGC领域的佼佼者。但前者的到来并成为现象级事件,使得有必要分析和比较这两种AIGC的技术原理和应用场景差异,以便对AIGC有更进一步的认知和理解。
2014年5月,微软(亚洲)互联网工程院正式宣告微软小冰的诞生。微软小冰是建立在情感计算框架基础上,综合运用算法、大数据和云计算,逐步进行代际升级并向EQ方向发展的完整的人工智能体系。[33]2021年9月,第九代微软小冰发布,覆盖中国、日本、印尼等多个国家的6.6亿在线用户、4.5亿台智能设备以及9亿内容观众,涵盖金融、地产、汽车、零售等多个垂直领域。
在内容生成方面,微软小冰可以进行文本内容、语音内容以及视觉内容生成。在诗歌领域,2017年其与湛庐文化合作出版首部AI诗集《阳光失了玻璃窗》,2019年采取人机合作的方式出版首部由AI和人类共同创作的诗集《花是绿水的沉默》;在金融领域,建立国内规模第一的金融文本摘要平台,为国内40%以上的个人投资者和90%以上的金融机构交易员提供金融知识服务,并构建了基于小冰AI生成的金融知识图谱;在音乐领域,创作独一无二的音乐曲目,并自主完成乐器选择、编曲和歌词创作,自主发布数十首逼近人类歌手演唱水平的单曲;在有声读物领域,构建CCP有声读物生产平台并创造30多个角色化声音,支持基于AI技术自动生成定制化的儿童有声读物,并拥有2 300多小时自主版权的非定制儿童有声读物,形成了国内规模较大的有声读物知识库;在绘画领域,通过学习400多年艺术史上的236位著名画家的经验,可在受到创作激励时,独立完成100%原创绘画作品,并于2019年在中央美术学院举办个人画展,于2020年在中信出版社出版绘画作品集《或然世界:谁是人工智能画家小冰》。此外,小冰在图案设计、电台节目和电视台节目内容生成方面也都有着杰出的表现。
ChatGPT作为一款火爆2023年度的AI产品,其在智能回答、代码编写、教育辅导、内容翻译以及内容创作方面的应用场景和表现,以及作用于出版业所形成的生成式智能出版场景,如出版大数据与大语言模型、升维发展的智能知识服务、智能决策的出版领域智能机器人、生成式智能出版物、元宇宙出版五类新业态,已有相关研究[1-2]加以介绍,此不赘言。
同样是人工智能生成内容、生成知识的微软小冰和ChatGPT,其相互之间的原理、场景和特征对比分析主要有以下几方面。
在AI设定方面,小冰被设定为对话代理,用于社交平台为用户提供情感陪护,其已然成为全球范围内承载交互量最大的人工智能系统,占全球交互总量60%以上。ChatGPT则优化对话语言模型,运用更为通用的大语言模型,可回答更广阔范围内的各种知识问题并执行各种自然语言处理任务。小冰的目标设定和功能設置上更多属于情感智能的范畴,而ChatGPT则更多属于认知智能的范畴。前者旨在赋予AI以类似于人的观察、理解和生成各种情感特征的能力,产生类人情感并进行自然、亲切、生动交互;后者则旨在赋予AI具备类似人的学习、理解、语言、推理、决策等高级智能,进行知识学习、逻辑推理、问题求解、形成知识图谱或进行智能决策等。二者的共同点在于均集多项技能于一身,都具备了通用人工智能的若干属性。
在算法方面,微软小冰使用了基于规则的系统以及深度学习技术,即使用了预先定义的规则和规则引擎进行响应和交互,其主要过程包括:一是语义解析,对输入的文本进行语义解析以理解关键信息和意图;二是规则匹配,基于预定义规则和规则引擎来匹配输入的语义和模式,如使用固定的模板;三是生成回复,匹配到相应的规则,根据规则的定义生成回复,回复的方式可以是简单的文本替换,也可以基于模板填充;四是输出和交互,把生成的回复反馈给用户,作为对用户输入的回应。而ChatGPT则使用了基于人类反馈强化学习算法的Transformer架构以及自注意力机制(self-attention)。GPT是一种基于互联网可用数据训练的文本生成深度学习模型,采用了利用人类反馈中强化学习(Reinforcement Learning with Human Feedback,RLHF)算法,主要包括三个步骤:一是预训练语言模型的训练阶段,旨在形成自然语言理解与生成上下文学习能力、复杂意图理解能力以及特定受众文本摘要能力等;二是打分模型训练阶段,旨在通过代码微调和指令微调来评估模型输出符合人类表现程度的优劣;三是基于强化学习的语言模型优化阶段,旨在优化模型,支持生成思维链进行复杂推理,以提高ChatGPT的思考能力。自注意力机制,也是Transformer架构的核心技术之一,通过给予不同位置的元素不同的注意力权重,使得模型可以根据序列中元素之间的相关性加权组合信息。ChatGPT的Transformer架构则使用了多头注意力机制,在不同的“头”中分别计算注意力权重,以获得更多颗细颗粒度的关注信息。[34]多注意力机制的使用,使得ChatGPT具有更卓越的处理长序列和捕捉长距离依赖关系的能力,更好地实现自然语言理解,能够生成连贯的、高质量的文本内容。
在数据语料库方面,微软小冰侧重于中文语境,集合了中国近7亿用户的社交数据、新闻和百科知识等,并精练为1 500万条真实而有趣的语料库(之后每天净增 0.7%)。[34]ChatGPT的训练语料或数据来源则主要是英语、法语等其他语境,大致有两类:一是前文介绍过的超过1 750亿的巨量无标注文本数据;[33]二是有标注文本数据,融入了由40名标注人员主导的、数万高质量的、符合人类偏好的人工标注数据,“以获得听得懂人类语言、自身拥有判断标准的LLM”。[8]
正是由于上述三方面的不同,微软小冰和ChatGPT在知识生成方面各有特色:在输出长度方面,微软小冰输出内容的长度和规模较ChatGPT显得力有不逮,后者可以输出数万字的文本内容;在输出模态方面,微软小冰可支持输出文本、图片、表情符号、音频、视频等多种模态的知识,而ChatGPT则主要集中在文本模态领域,所生成的内容以文本为主;在输出语言性质方面,微软小冰主要面向中国客户输出中文数据、信息和知识,而ChatGPT则更多是基于英语、法语等非中文的语料库进行内容生成;在适人化方面,由于微软小冰的强交互性、情感智能定位以及专门针对中文用户所进行的训练和优化,其个性化理解和回应用户需求、偏好的能力较强,具有较好的适人性,而ChatGPT作为通用的大语言模型,个性化和适应性方面则稍逊色;从知识生成的特点来看,微软小冰所生成的知识在特定领域的内容会更加丰富和准确,而ChatGPT则能够涵盖更广泛的主题和领域,针对用户提问,生成范围更广、更为系统、更为专业的数据和知识。
三、知识生成价值刍议:从出版前端到出版本质
从知识生产的主体和时间节点来看,前述个体生产知识、专业生产知识、大众生产知识以及人工智能生产知识,皆为知识的第一次生产,即由人类或人工智能所进行的知识的创新和创造;而出版行为、出版活动则属于知识的第二次生产。那么,从知识生产方式来看出版学,能够带来哪些启迪和思考?
1. 知识生成格局的变革,深刻影响出版业的发展
知识生成格局的变革,从智慧驱动到数据驱动,从人类生产知识到AI生产知识,将在很长一段时间内呈现出人机协作生成知识的新格局。人机协作生成知识格局涵盖AI生产新闻、AI创作图书、AI创作音乐、AI创造绘画、AI生产有声读物等AI生成内容的各个领域,对出版业产生全方位的深刻影响。在出版产品方面,一系列的生成式智能出版物将陆续出现,如生成式智能出版物、生成式智能知识服务、出版专业大语言模型等。实践中,世界顶级的法律、税务知识服务商律商联讯(LexisNexis)已于2023年5月推出了面向法律界的生成式智能知识服务平台——Lexis+AI,具备提供法律内容检索、法律内容总结以及生成合同、简报等功能。在出版技术方面,大语言模型技术、基于人类反馈的强化学习算法、自注意力机制等技术将陆续影响和作用于出版业,对出版内部流程和外部产品服务持久赋能。在出版营销方面,营销文档的AI制作、基于AIGC的虚拟客服、出版营销数据建设等将会出现或不断强化,在线下营销、直播营销、短视频营销等基础上进一步拓展出版营业的版图,丰富出版营业的内涵。
2. 知识生成方式的变化,并没有改变出版本质
出版的本质究竟是什么?以实践视角视之,出版的本质可被解读为“对作品经过编辑、复制而后予以公开的活动”,笔者认为反映出版实践的编校印发说固然是没错的,但在回答出版的本质是什么这一问题上则显得力有不逮。以理论视角考察,编辑出版是“文化缔构、文化传播和文化再生产活动”[35]“出版活动的本质是文化选择”[36]“商业形式的文化建构”[37]等观点是从文化角度提出的,“出版专业主义核心内涵是信息选择把关、共识与价值观表达以及知识和文化的传播”[38]及“出版本质是一种知识生产”[39]则是从知识的角度提出的。笔者基本赞同出版的本质是知识生产这种说法,至少知识生产作为出版的本质可以适用于专业出版、学术出版、教育出版等业态,但是大众出版的本质是否为生产知识?抑或生产的是技巧、技能、生活经验等隐性知识?这一点尚需严谨论证。实际上,出版的本质是知识生产,更确切地说,是知识的第二次生产,是知识的建制化生产,是一种深层次、有底蕴的知识生产,是知识的社会化生产与传播。就此而言,无论是人类还是AI生产的知识,实质上生产的是知识素材、知识原型,而非知识产品、知识成品,出版业生产和传播的则是知识产品和知识成品。
3. 知识生成范式的转换,启迪出版学研究范围拓新
AI生成知识的出现并不能取代人类生成知识,数据驱动生成知识也不能替代智慧生成知识,恰如机器人新闻中算法和记者的关系,不是替代关系而是耦合关系,[40]二者同样在新闻业中扮演重要角色。但这意味着知识生成的范式开始由人类智慧生成知识转变为人机协作生成知识,且这一新的知识生成范式将在很长的历史时期内存在并发展。就出版学研究而言,知识生产范式和内容供给模式的转换,[41]给我们最大的启发在于拓新出版学的研究边界,基于时间维度展开高新技术对出版业应用的出版未来学研究。[42]就此而言,是否可扩展至出版前端的作者,在作者学方面进行钻研和探索?长期以来,出版学研究的范围往往在本体维度的出版经营管理、时间维度的出版史、空间维度的国际出版、技术维度的数字出版以及作为出版后端的阅读、读者等,鲜有学者将作者、作者学作为出版学研究的基本范畴和主要领域。把出版学研究领域拓展至前端的作者,一方面,有利于扩大出版学研究范围,深入分析知识生成的主体、工具、对象等特点,探究知识生成机理与规律;另一方面,在人機写作生成知识的时代,对作者的研究进一步由研究人类作者延展到研究AI作者,既是提升出版人数字素养与技能的要求,也与当下作为研究热点的智能出版、智慧出版相吻合。
结语
生成式人工智能技术引发了社会各行各业的热议和思考,也引起了学术各界的研究和探索。本文在提出智慧驱动型和数据驱动型知识生成原理的基础上,从知识生成这个维度,对个体生产知识、专业生产知识、大众生产知识及人工智能生成知识进行了分析和思考,最后提出了人机协同生成知识的新格局对出版业和出版学发展的意义。其实,关于生成式人工智能和出版的关系,还有诸多议题值得深入研究,如生成式人工智能物的可版权性如何、著作权归属如何、可行性的法律治理方案如何、分析式智能出版和生成式智能出版的区别与联系又在哪里等。
参考文献:
[1] 张新新,丁靖佳.生成式智能出版的技术原理与流程革新[J/OL].[2023-07-16].图书情报知识,https://kns.cnki.net/kcms2/detail/42.1085.g2.20230716.0031.002.html.
[2] 张新新,黄如花. 生成式智能出版的应用场景、风险挑战与调治路径[J/OL].[2023-07-17].图书情报知识,https://kns.cnki.net/kcms2/detail/42.1085.G2.20230717.1104.003.html.
[3] 郝祥軍,顾小清. AI重塑知识观:数据科学影响下的知识创造与教育发展[J]. 中国远程教育,2023(5):13-23.
[4] 王健. 知识萃取——将科研项目隐性知识显性化[J]. 企业管理,2022(4):102-105.
[5] 吴飞,段竺辰. 从独思到人机协作——知识创新模式进阶论[J]. 浙江学刊,2020(5):94-104.
[6] 吴锋. 发达国家“算法新闻”的理论缘起、最新进展及行业影响[J]. 编辑之友,2018(5):48-54.
[7] 熊国荣,李贤秀.“机器人记者”对新闻记者就业的冲击及应对[J]. 编辑之友,2016(11):73-77.
[8] Brown T, Mann B, Ryder N, et al. Language Models are Few-shot Learners[J]. Advances in Neural Information Processing Systems, 2020(33): 1877-1901.
[9] 朱光辉,王喜文. ChatGPT的运行模式、关键技术及未来图景[J]. 新疆师范大学学报(哲学社会科学版),2023(4):113-122.
[10] Haiko V, Cunningham S, Janssen M, et al. Data science as knowledge creation a framework for synergies between data analysts and domain professionals[J]. Technological Forecasting and Social Change, 2011, 173(4): 1-10.
[11] 康德. 纯粹理性批判[M]. 邓晓芒,译. 北京:人民出版社,2004:21.
[12] 王庆节.“先验想象力”抑或“超越论形象力”——海德格尔对康德先验想象力概念的解释与批判[J].现代哲学,2016(4):58-65.
[13] 邱仁宗. 科学方法与科学动力学——现代科学哲学概述[M]. 北京:高等教育出版社,2006:51.
[14] 袁方,王汉生. 社会研究方法教程(重排本)[M]. 北京:北京大学出版社,2013:28.
[15] 刘魁. 真理、文化权威与知识生产的时代性——兼评福柯对真理话语的微观权力分析[J]. 南京政治学院学报,2005(3):53-57.
[16] 李明杰. 中国出版史:上册·古代卷[M]. 长沙:湖南大学出版社,2008:50-51.
[17] 张岱年,方克立. 中国文化概论[M]. 北京:北京师范大学出版社,2004:135.
[18] 贺国庆. 古希腊高等教育探微[J]. 河北大学学报(哲学社会科学版),2003(4):5-8.
[19] 方卿,许洁,等. 出版学基础[M].武汉:武汉大学出版社,2023:356.
[20] 让-弗朗索瓦·利奥塔. 后现代状况:关于知识的报告[M]. 岛子,译. 长沙:湖南美术出版社,1996:35.
[21] 张新新,陈奎莲. 坚持出版导向,引领5G时代数字出版新变化[J]. 出版发行研究,2020(3):38-44.
[22] 张新新. 智能出版:现代出版技术原理与应用[M]. 北京:人民出版社,2021:40-50.
[23] Rocio·M. T, Maria O. Identification of innovation solvers in open innovation communities using swarm intelligence[J]. Technological Forecasting and Social Change, 2016, 109(2): 15-24.
[24] 王玫,朱云龙,何小贤. 群体智能研究综述[J]. 计算机工程,2005(22):194-196.
[25] 刘华东,马维娜,张新新. “出版+人工智能”:智能出版流程再造[J]. 出版广角,2018(1):14-16.
[26] 肖奎. 维基百科大数据的知识挖掘与管理方法研究[D]. 武汉大学,2014.
[27] 牛明坤. 基于大众标注的群体知识组织性质与结构研究[D]. 湖南大学,2018.
[28] 赵健,张鑫褆,李佳明,等. 群体智能2.0研究综述[J]. 计算机工程,2019(12):1-7.
[29] 张新新,刘华东. 出版+人工智能: 未来出版的新模式与新形态——以《新一代人工智能发展规划》为视角[J]. 科技与出版,2017(12):38-43.
[30] 申屠晓明,甘恬. 机器人写稿的技术原理及实现方法[J]. 传媒评论,2017(9):15-19.
[31] 央视新闻:新闻机器人的工作原理与技术解析[EB/OL].[2023-07-14].http://www.uctdm.com/43920.html.
[32] 邓浩然. 新闻写作机器人现状与发展研究——以Xiaomingbot为例[D]. 兰州大学,2019.
[33] 陆伟晶. 人工智能机器人面临的伦理困境——以“微软小冰”为例[J]. 视听界,2018(4):74-78.
[34] 崔宇红,白帆,张蕊芯. ChatGPT在高等教育领域的应用、风险及应对[J]. 重庆理工大学学报(社会科学),2023(5):16-25.
[35] 王振铎. 文化缔构编辑观[J]. 河南大学学报(哲学社会科学版),1988(3):104-114.
[36] 陈少志,张新新. 出版业文化质量的提升向度与路径探析——基于编辑工作的视角[J]. 中国编辑,2023(7):34-40.
[37] 方卿,丁靖佳. 数字出版三个基本理论问题的思考[J]. 中国出版,2023(10):17-22.
[38] 李杨. 数智时代出版专业主义的核心内涵建构[J]. 编辑之友,2022(7):83-89.
[39] 范军. 出版本质上是一种知识生产[J]. 出版科学,2022(3):1.
[40] 张超,钟新. 从比特到人工智能:数字新闻生产的算法转向[J]. 编辑之友,2017(11):61-66.
[41] 方卿,丁靖佳. 人工智能生成内容(AIGC)的三个出版学议题[J]. 出版科学,2023(2):5-10.
[42] 张新新. 中国特色数字出版学研究对象:研究价值、提炼方法与多维表达[J]. 编辑之友,2020(11):5-11,30.
作者信息:张新新(1984— ),男,江苏赣榆人,博士,上海理工大学出版印刷与艺术设计学院教授、博士生导师,国家新闻出版署科技与标准重点实验室学术委员会主任,主要研究方向:数字出版、人工智能、文化管理与服务。