摘 要:以ChatGPT为代表的聊天机器人再次引发了人们对AIGC(人工智能生成内容)的关注。“出版再想象:AI与内容生产变革”研讨会回应热点,邀请来自学界业界的5位专家,从不同角度探讨AIGC背景下出版的未来。厘清ChatGPT的技术原理及其可供性,辨析AIGC模式中的人机互动关系,是理解这场内容生产范式转换的前提。当前,AIGC已经有一定程度的实践应用,在提升内容生产力方面表现出优势。对出版业而言,AIGC给产业发展带来更大的不确定性,既提供了机遇,也带来了挑战,出版人必须做好应对准备。
关键词:AIGC;ChatGPT;出版变革;数字出版;智能出版
DOl: 10.3969/j.issn.2097-1869.2023.02.003
2022年年底,OpenAI公司推出了一款名为ChatGPT的人工智能产品,它基于大规模语料库和生成式模型,具有十分强大的通用性能力和逻辑推理能力。基于自身技术路线,ChatGPT更加适合解决复杂的AIGC问题,这使得AIGC再一次成为学术热点,并且还走向了大众领域,引发了全民关注。在几年前的讨论高潮中,人们关注AIGC的可版权性和版权归属问题,以及它对内容产业的冲击和产业内部的自我调适。今天,在全民狂欢于探索ChatGPT的应用边界时,以此为引子,《数字出版研究》编辑部的讨论进一步将ChatGPT应用延伸到出版专业领域,冷静思考AIGC时代出版的未来向何处去。
在此背景下,2023年3月2日,由北京印刷学院主办,北京印刷学院出版学院、《数字出版研究》编辑部、“学术志”平台承办的“出版再想象:AI与内容生产变革”研讨会在云端举行。本次研讨会由北京印刷学院出版学院讲师刘广东主持,邀请到5位相关领域的专家:
北京斯麦尔数字出版技术有限公司董事长郑铁男;北京网梯科技发展有限公司董事长张震;北京颉腾文化传媒有限公司副总经理李杰臣;中华医学会杂志社新媒体部主任沈锡宾;中国音像与数字出版协会副秘书长李弘。
《数字出版研究》编辑部对这次研讨会中的一些共性议题做了梳理和整合,希望借此为思考内容生产的未来带来启发。
1 奇点来临?ChatGPT的原理与想象
技术奇点假说认为,技术发展会在很短的时间内发生极大的接近于无限的进步,技术的增长将会变得不可控制和不可逆转。基于大规模预训练自然语言处理模型的人工智能,正在不断冲击人类对技术的既有认知,近期,人形机器人Ameca接入ChatGPT后,甚至产生了有“情绪”的对话,引起科技界甚至社会大众的广泛关注。以ChatGPT为代表的AIGC会是奇点到来的标志或者即将到来的前奏吗?拆解其技术原理,有助于我们在集体技术焦虑中冷静审视这场变革。
郑铁男:ChatGPT是人工智能技术驱动的自然语言处理工具,其核心是自然语言处理(Natural Language Processing, NLP)。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。国内外都有成形的自然语言处理技术。ChatGPT并非一个新技术,它能够通过理解和学习人类的语言进行对话,还能根据聊天的上下文进行互动,真正像人类一样聊天交流,甚至能完成撰写邮件、编写视频脚本、编写文案、翻译、编代码、写论文等任务。
张震:在ChatGPT引发的这轮AIGC浪潮之前,AI在自然理解领域显著落后于人类。现在,我们看到它超越了大部分普通人,但是依然落后于专业人士。普通人觉得它很专业,但有时候它的答案是“一本正经地胡说八道”。即便如此,用“涌现”这个词来描绘ChatGPT给人们带来的震撼并不为过。AI也在不断学习,其内容更新速度很快,人类在体力工具、运输工具外,终于在脑力工具上出现了一次质的飞跃。
自然语言的理解和生成的突破可能开启人工智能的奇点:以前只是模仿普通生物,如模仿基本的两栖类动物,进行一些视觉模仿和基本的符号识别。但是真正的基于符号的思考和理解是人类突飞猛进的一个关键点,这个点在互联网领域就是奇点。
如果从入口把水灌入迷宫,水只要一直不断,它必然找到出口。水能走通迷宫是不是智能?我以前认为水能走通迷宫只是自然界的一种规律,现在我认为这就是智能。很多图像生成类人工智能软件能够帮助用户消除照片中的背景干扰,效果很好,但如果去原场景就会发现,AI消除后新建的场景与实际相去甚远。智能也许是自然界的普遍现象,人的大脑也是进化的产物,所以AI对很多问题随机回答、脑补答案,是十分必要的。
OpenAI的工程师John Carmack坚信一个人能够实现整个人类大脑的核心源代码,个人能够编写实现AIGC的源代码。他提出,人类DNA信息量不足1 GB,而大脑只有40 MB的信息容量,并且其中存在大量的冗余和无效代码;假设把冗余去掉,其工作量是一个程序员即可完成的。人类大脑这样的核心代码可能需要几万行,关键在于大量的用于学习的语料库。孕育生命仅需要10个月,而人类大脑发育成熟则一般要到23岁,养育过程的成本远远大于生育过程的成本。对于AIGC,算法的代码其实很少,但是教会算法需要付出巨大的代价,甚至有个说法:人工智能,有多少智能就有多少人工。OpenAI把大量的数据标引工作交给了肯尼亚的外包团队,由该团队做相关的数据标注和训练。AlphaGo初期学习了大量的围棋棋谱,之后就开始自己跟自己对弈了。在知识和语言领域,在出版领域,未来也可能出现这种情况,一旦AI学会人类语言的规律,就会进入自我进化阶段,加速发展。
李弘:技术有递归性,《技术的本质》一书中讲到所有的技术都是一点一点从最原始的技术不断叠加出来的,理解ChatGPT亦然。ChatGPT并不是技术革命,其采用的技术路线并未变化,而是应用上的重大突破,其意义在于大大加强了人类对于人工智能可用性的信心。ChatGPT处在展开期,任何一项技术的应用都有导入和展开的情境。
ChatGPT对于大规模文字模态的AIGC应用具有重要意义,在归纳性的文字类工作中有着优异表现。ChatGPT有理解、学习、逻辑推理能力,这些能力对于研究咨询、定题分析十分必要,因此其对于出版业有很强的支撑作用。此外,ChatGPT在道德、伦理方面有比较强的判断,如有主动承认错误、敢于质疑的“性格”,未来其在模仿人类能力方面可能还会有很大进步。ChatGPT的应用会产生一个较大的市场,随着越来越多的企业和个人接入ChatGPT的开放接口,其应用可能会是下一个阶段创新和创业的主战场。
2 技术赋能:嵌入出版业的AIGC
无论是人类还是机器,其生产的内容都是供人类消费的精神产品并可转化为意义,出版的本质属性和价值追求并不因内容生产主体的变化而变化。着眼于当下,如果以出版为视角,AIGC无疑是近年来十分重要的出版转型升级的机遇之一。
郑铁男:出版行业是为知识服务的,无论是纸质书还是在线教育平台、知识数据库等,其实都是提供知识服务的。出版行业正向知识服务转向,为网民提供知识搜索、知识推荐的服务。出版业原来的用户主要是消费纸质书,现在则是知识图谱,要通过自然语言处理的中间插件技术或ChatGPT的技术进行内容的组织和生产。与ChatGPT不同,出版业大多是做纵深领域,切口小,类似于石油领域、化工领域、机械领域等,我们把行业的内容数字化,进行知识图谱的标引,这并不需要海量的数据去给用户提供最后的服务,因为用户需要得到的都是行业内部的准确内容。我们要使用ChatGPT还有自然语言处理这种中间的搜索引擎的插件技术,由出版社编辑进行深度的标引,用人工+技术的方式对内容进行分类聚类,组织形成产品,提供给用户。
张震:ChatGPT将会改变传统知识的出版和教授方式,让个性化学习成为可能,人工智能将会成为抄袭者。ChatGPT的训练过程和训练成本基本上都是小公司、小团队无法承担的,所以大部分公司都会基于人工智能操作系统开发自己的相关产品和应用。对出版企业来说也一样,可能是在别人已经训练好的预训练模型上做一些简单的学习和加工,打造自己的产品和应用。
国内有人将一门管理学慕课课程视频转化成文字后输入给ChatGPT,再拿考试题目做测试,结果ChatGPT成功通过了考试,拿到了号称颁发给ChatGPT的第一张结业证书。未来,有可能每一个出版机构都会训练出自己的面向某一个专业领域的提供人工智能服务的具体应用。
AIGC对出版业的意义是,在生产环节会实现效率的极大提升,在专业能力环节会让专业能力前置,以前专业人士才能达到的水平、掌握的技术,未来有可能终端用户比编辑水平还要高,所以可能会给出版行业带来颠覆。未来有可能产生一些人类和AI共同打造的新书,生产速度越来越快、数量越来越多。在服务群众的精神文化需求上,AIGC还将产生重大的价值和功能。
沈锡宾:通过我们的实际测试发现,ChatGPT在医疗健康和科技出版方面的应用潜力巨大:它具备基本医学、保险常识和多轮对话的能力,对中文的理解能力不弱;具备病例阅读、理解和纠错的能力;信息抽取和术语标准化的能力涉及强知识,且随时间变化少,这两个任务接近甚至超出基于大量标注的有监督学习的效果,相当于自带通识知识库;具备简单推理、肯定否定关系的识别能力;具备连续学习的能力,在不断的训练后,前后一个月的水平完全不同;具备一定的学术评价能力,但水平有限,结果不理想;结合知识图谱和相关规则进行输出,可大幅提升现有对话、推理能力;医学类应用的特点是严谨,其提供的建议可以给出置信度,帮助使用者判断答案是否可靠。
对出版商来说,传统的基于知识图谱构建进行知识服务很烦琐,因为这需要大量的专家介入,而且知识图谱在不断演进,短时间内难以完成更新。对此,可以利用出版机构已有的论文文档、一些比较好的临床病例和临床指南去做大规模的预训练,形成知识服务体系,以此向大众提供比较通用的医学咨询服务。通过大量经过同行评议的数据训练AI,可以此面向临床医生提供更好的CDSS(临床决策支持系统)服务。
人工智能在科技界的应用分为五个方向:第一,在科研设计和论文写作方向上,其可以帮助科研人员完成数据的组织、统计和文字修订,可以协助作者开展科研设计、进行投稿指导;第二,在知识服务方向上,它可以为用户提供个性化服务,帮助出版企业从内容提供商向知识服务商过渡,提供解决问题的方案而非文档;第三,在选题策划方向上,可以协助编辑、专家开展选题策划,从大量的稿件中遴选出更优秀的和更具话题性的文章,也可以开展专家遴选、评价等;第四,在学术不端检测方向上,它利用图像识别技术进行图片对比,利用自然语言处理技术实现文字相似性检查,能有效避免抄袭情况的发生;第五,在传播方向上,它可以提炼主题、扩展表现形式、提升网络传播效率,也可以基于自动翻译功能实现多语种传播,还可以基于用户精准画像实现内容的精准分发与推送。
3 未来已来:AIGC在出版业的实践
出版史已经证明,技术是深刻影响出版发展的关键因素之一。以ChatGPT为代表的AIGC技术在出版界快速实践,一定程度上证明了其在提升内容生产力方面的价值。随着技术的不断普及,其应用空间还将进一步得到拓展。
郑铁男:近期,Springer Link已经有作者和ChatGPT合作出书。2023年2月14日,每日经济新闻、澎湃新闻、上游新闻等多家媒体平台宣布接入被称为“中国版ChatGPT”的百度“文心一言”,成为其生态合作伙伴。这些都彰显了以ChatGPT为代表的AIGC工具在出版领域的广阔应用前景。
数字出版正在向数据出版阶段发展。出版企业要构建数智底座、数据中台,做好内容数据和用户数据。出版企业现在只有PDF、方正排版或者InDesign的文件,要把内容变成碎片化的XML原数据,才能被ChatGPT或自然语言处理技术利用,重新组织形成数据库或者变成OWL知识图谱。为此,要在标准上做好准备。有关部门发布的《中央文化企业数字化转型升级项目标准化工作方案》《中央文化企业数字化转型升级规划与实施方案》《出版资源内容部件数据元》等方案、标准,对书刊加工、数据管理、资料管理等都设置了规范,出版社要参照国家标准做好数据处理。
提供知识服务将会成为出版业下一步转型的目标。如国家开放大学出版社的口号是“为终身学习者提供知识服务”,该社的愿景就是通过人工智能等方式,为用户提供支持服务,让学习更有效。出版行业已经开始利用技术对内容进行碎片化重组,更新产品和服务。正如黑龙江科学技术出版社总编辑张东君所言,基于内容的多形态出版才具有生命力。中国电力出版社、社科文献出版社、中国法制出版社等众多出版社已经改变了生产流程,从排版起就与加工公司合作,仅需4天时间就可生成XML、PDF和Epub文件,生产周期很短。出版企业要转换流程,构建排版、加工质检、标引、成品提交体系,从排版文件到XML、再到知识图谱,打造这样的数据库生产与发布模式。要不断地重组内容,利用各种数字技术形成新的数字产品。出版企业要从文献服务向信息服务转型,最后成为知识服务业。出版企业要做多种形态的产品,这样才有生命力。出版企业也可以为各类客户建立数据库,如组织内容、搭建平台。
李杰臣:《ChatGPT:AI革命》是国内首部利用ChatGPT创作的关于ChatGPT的图书,通过复盘该书的创作和出版流程,能够直观感受出版业如何利用AIGC,以及AIGC对出版内容生产的影响。
这本书的写作时间是8天,速度较快:首先,写作过程中提出的问题非常准确,ChatGPT能够快速填充细节内容;其次,这本书是用ChatGPT讲ChatGPT,其回复相对准确。在这本书的出版过程中,人工干预得最多的是写作框架和逻辑关系,否则输出内容的前后逻辑会比较混乱。该书从交稿到出蓝图的周期大概是7天,一是因为总体文字量不大,只有11万字;二是根据一线编辑反馈的意见,AIGC的文字质量是优于绝大多数人类作者的。关于知识产权问题,OpenAI公司的官方说明中明确提出,通过个人提问所产生的答案,其知识产权归属于提问者。
沈锡宾:人工智能已经给科技期刊界带来了正向影响。2019年,中华医学会与国际知名期刊服务商Wiley及其旗下公司Atypon签约,共同研发中华医学会开放获取平台。Atypon在特定领域提供知识服务,目前其主要服务基于人工智能技术从原始内容中提取知识而展开,帮助用户在冗长的文本中快速准确地找到信息。Atypon的机器学习技术在内容提升、模式识别、信息检索以及知识聚合方面都有很多应用和场景。他们认为,人工智能在科研设计与论文写作、知识服务、选题策划、学术不端检测、传播出版等五个方面有巨大潜力。
Atypon团队研发的人工智能技术应用在自动摘要、信息提取以及从语音到文本、图片的转化等领域,团队还在研发文章完整性检测、高级筛选论文的功能,可以实现自动翻译、跨语言检索;可以基于中文文献推荐英文文献;可以从一些内容中做实体识别、构建知识图谱、寻找疾病与药物之间的关系、提取因果关系,做共病的共同基因的知识图谱。基于文章内容,它可以生成非结构式的小型摘要和一句话摘要,这个功能便于论文在Google Scholar这种学术引擎中进行分发和传播;在图片方面,它可以把模糊的图片变得高清;可以基于视频发现平台和AI转换成文本做二次检索。
4 歧路彷徨:出版业的“危”与“机”
AIGC所引发的是包括本体论、认识论和方法论等在内的一场内容生产范式转换,这向既有的理论方法、政策工具和实践路径等的有效性提出了挑战,出版业未来的不确定性正在增强,出版人要做好迎接机遇与挑战的两方面准备。
张震:大部分人所从事的都是服务业,包括出版社的编辑。服务业的本质是表演——有人“表演”,有人“看表演”。出版业其实大部分都属于出版服务业,如中小学教辅材料,其中的脑筋急转弯类型的内容长期没有变化,只是形式更加生动,更加寓教于乐,更复杂。ChatGPT能赋能大部分服务业,服务行业不需要太精密,人工智能取代这些行业是一种必然趋势。
清华大学梁斌教授早在2011年就提出,未来的网络教育领域,教育、培训、出版、咨询、投资没有边界。没有边界会导致工业时代的分工、行业的大规模融合。出版行业的未来会怎么样?出版行业会做教育、培训、投资以及咨询相关的业务。大部分的出版工作和咨询工作,本质上做的是辅导性的工作,我认为会被AIGC取代;而一些创造性、创新性的行业,是人类从来没有去做过的事情,AIGC可能会发挥一些辅助作用。人类大脑神经元网络的参数、模型和能量消耗,还远远小于各种人工智能的数据模型。ChatGPT会开启新的人工智能时代,出版会成为中国未来在线教育的入口。
李杰臣:在人机协同过程中,应该注重体现人的主体性。首先,OpenAI公司明确说明ChatGPT作为一个模型是没有自主意识的,其无法为错误信息承担责任。出版物应该体现人的意志,而AI不是承担责任的主体,这也是很多期刊不接受ChatGPT作为联合署名者投稿的原因。其次,在利用ChatGPT进行创作的过程中,很多思想、观点必须由人提出,否则它会反复出现一些口水话。AI时代强调“问商”,就是将人的思想和主体性体现成问题,去引导机器回答。做人机交互,无论是创作一篇文章还是创作一本书,最终的内容还是人引导机器生产的,而非相反。
对于编辑个人来说,AIGC高效与否取决于其使用的熟练程度。当AIGC引发一个产业的整体生产模式变革后就能体现其优势。AIGC对于文字编辑而言是利好,因为它可以帮助修改文字表达;对于策划编辑而言则喜忧参半,一方面是中低端作者+AIGC就能很好地实现选题,另一方面是未来策划编辑可能要耗费大量精力去甄别AIGC的内容。
对于作者而言,AIGC对作者的创新思维、逻辑思维和求证辨伪能力的要求会更高。此外,AIGC会改变作者的一些常规创作。在提出更好的问题的基础上,让AIGC去生成约70%的普通内容,在此基础上再增加30%的人类见解和创新。另外是去中心化的创作方式,内容的生产模式经历了从专家生产到用户生产、再到人工智能生产的过程,领域专家只需要把内容的结构体系列出来,再通过AI填充细节。在未来的创作中,这种去中心化的创作方式或许还会迎来新变革。此外,AIGC对于中低端的作者影响很大,但是对高端作者影响有限,因为高端作者往往有个人的独特见解。
沈锡宾:AIGC在带来一系列利好的同时,也带来了一些隐忧。《科学》系列期刊已经明确,由ChatGPT(或任何其他人工智能工具)生成的文本不能用于科学作品中,图像或图形也不能是此类工具的产品,人工智能的程序不能成为作者;违反这些政策将构成学术不端行为,与修改图像或抄袭等不端行为没有区别;当然,在研究论文中有许多由AI生成的合法数据集(而不是论文的文本)不包括在这次政策的更改中。《细胞》和《柳叶刀》则表示,不能使用人工智能工具取代作者完成关键性任务,作者还必须在论文中详细解释他们是如何使用人工智能工具的。然而,AIGC与人类创作的文本是难以区分的。AIGC还会涉及数据造假问题,计算机科学家已经发现,如果软件没有接触到足够的训练数据来生成正确的回答,它通常会编造一个答案。如果被某些不法机构利用,可能产生大量的混杂了假数据的“水文”,会极大地扰乱科技期刊的同行评议机制,造成公共资源的浪费。对此,需要研发相关的检测工具,例如为DeepFake生成的换脸视频加上特殊水印,AIGC的文字内容也可以参考这种方式,以避免意外风险。
李弘:2022年关于元宇宙的讨论很多,但元宇宙的发展已经开始“退烧”。这给我们一个很强的警醒:这些技术与出版是何关系?出版业如何跟进新技术?出版业不该盲从技术,尤其是以虚拟技术为代表的元宇宙技术,因为对于出版业来说,其技术框架包括相关应用还十分遥远。但ChatGPT基于大模型人工智能技术,对出版业会有比较大的影响,它是离出版最近的风口,出版融合创新需要解决如何利用ChatGPT技术的框架及其相关应用的问题。如果不利用ChatGPT的相关技术来做好市场的、专业领域的出版转型,出版发展就可能面临越来越大的压力。
推动出版融合必须厘清技术和内容之间的矛盾关系,这要求我们在一个技术框架里、在一个更强的法律环境里重新理解出版。谈论出版的本质,必须考虑其技术本质,否则在实践中就会遇到困境。例如,关于专业出版的困境,实质是投入问题。基于语音、图像、文本的人工智能应用与出版有很大的重合度。一方面,这对出版可能会造成冲击;另一方面,也给出版带来了发展机遇,出版业要加大研发投入,让人工智能技术为我所用,加大技术对内容的支撑。出版实践中对于数据、信息等出版客体的价值创造关注不够。ChatGPT对于同样问题的回应并不相同,其会根据问题描述情况调整回答。如果有足够的语料,它就能在某一个专业领域给出更精确的检索结果,这对于改善内容质量、提高检索精准性是十分必要的。但这样做在某种意义上是不合规的,虽然能优化其模型和输出结果,但是存在版权问题和数据安全问题。对此,需要尽快建立一个数据安全机制和内容合规框架,使这类技术为出版所用、为产业赋能。
AI的突破对于人类的角色和管理效能的提升有很大帮助,对于ChatGPT的下一步技术创新,出版主管部门要做一些课题,重点实验室要主动承担责任,行业协会、高等院校、研究机构都要开展研究,共同探讨ChatGPT如何与出版结合。只有在政产学研各方合力推动之下,出版融合发展的技术创新和模式创新才有可能成功。
(实习生周洋对此文亦有贡献。)
作者简介
刘广东,男,北京印刷学院出版学院讲师。研究方向:出版基础理论、数字出版新模式和学术出版。
Abstract: Chatbots, represented by ChatGPT, have attracted peoples attention to AIGC once again. The seminar of “Publishing Re-Imagination: AI and Content Production Transformation”, in response to the hot topics, invited five experts either from academia or industry to discuss the future of publishing in the context of AIGC. To understand this paradigm shift in content production transformation, the technical principles and availability of ChatGPT should be investigated and the relationship between man and machine in their interaction in the mode of AIGC must be identified. AIGC has been applied in practice to a certain extent, showing advantages in enhancing content productivity. For the publishing industry, AIGC brings greater uncertainty to industrial development, including both opportunities and challenges, for which publishers should prepare.
Keywords: AIGC; ChatGPT; Publishing transformation; Digital publishing; Intelligent publishing