童祁 曹颖
摘 要 我国出版业正处在关键时期,如何在蓬勃的技术变革下快速应对,促进出版业内容创新和高质量发展,成为无法绕开的关键性问题。文章梳理大模型技术的发展历史及对出版业的影响,对欧美领先企业应用案例进行洞察,重点分析大模型如何影响数字出版行业以及数字出版行业对大模型的反向助力。在此基础上,提出大模型与数字出版行业互动关系未来前景的展望。
关键词 大模型;人工智能;数字出版;欧美产业实践
以ChatGPT为代表的大语言模型(以下简称“大模型”)技术正在以前所未有的态势影响内容生成和出版行业。业界瞩目的“ARK投资”出品的2024年度研究报告指出,就内容行业而言,创作书面内容的成本在过去一个世纪一直都相对稳定,但过去两年,随着大语言模型的写作质量提升,内容成本骤降[1]。本文对大模型的发展背景进行回溯,对大模型在欧美领先企业的应用案例进行洞察,以此为基础,预判大模型在数字出版行业的发展趋势。
1 背景
大模型是人工智能领域最前沿的数字技术创新,与内容行业密切相关。它支持用户以人类日常语言交流,根据用户提问可以自动生成文字、图片、音视频等多模态内容,实现交互友好和便捷。作为内容生成和信息处理器,它的训练离不开出版内容行业积累的高质量语料和数字内容。根据人工智能专家披露,书籍、期刊、维基百科等是GPT3进行训练的重要数据来源,其中图书分享网站Libgen是GPT最重要的数据库[2]。换言之,大模型与数字出版天然具备紧密联系,大模型的起源和发展得益于其数字出版基因。出版业也开始进入以大模型为核心驱动的数字融合发展阶段,大模型技术、语音合成技术、图像视频生成等技术聚合,引领有声书、网络出版、网络音乐、网络游戏等数字出版产业的生产力大幅提升。
我们从科技史的视角来回顾会发现,出版业的发展史就是内容形态和传播方式在技术驱动下不断演变的历史。进入互联网时代,随着数字技术的快速变革,出版流程趋于智能化,移动互联网、人工智能、大数据等技术迭代对出版的影响也愈发显著,数字出版应运而生。在数字技术助力下,编辑、印刷、储运、售后等出版全流程实现智能化。媒体与出版融合,增强互动体验,实现商业模式创新。比如新媒体方式营销,即利用流媒体、社交媒体等新兴媒体平台,对用户数据进行市场分析、用户行为研究,利用搜索引擎优化技术开展个性化的内容推荐,优化出版物推广策略。
大模型可以降低人机交互门槛,拓展数字内容跨领域的应用场景,广泛提助力网络游戏、网络视听、有声书等数字出版领域的提质增效与转型升级,加快出版智能化生产。总体来看,人工智能驱动下的数字出版产业呈现媒介融合、开放共享、交互感知和跨界共生4个特征:①媒介融合。即通过将不同媒介形态、功能、传播技术和组织结构等要素进行融合形成全新阅读体验和出版模式;②开放共享。即提升出版物开放性和包容性,通过开放获取、版权保护、共享平台等,实现知识便捷获取与流动分享;③交互感知。通过感性化阅读体验、内容互动性、个性化定制等实现内容互动的感知体验及知识生产与传播的双向互动;④跨界共生。数字化时代,产业边界逐渐模糊,交叉融合成为趋势,数字出版与技术、教育、艺术、娱乐等融合,实现产业创新与升级。
2 现状
自20世纪50年代以来,人工智能技术发展起起伏伏,目前已进入由大模型引领的第4次高潮。1956年,在美国汉诺斯小镇宁静的达特茅斯学院,约翰·麦卡锡、克劳德·香农等学者聚在一起讨论着机器模拟智能的一系列问题,虽然没有达成共识,却为讨论内容起了一个名字:人工智能。自此,人工智能开始出现在人们的视野,1956年也就成为普遍认为的人工智能元年[3]。2017年,Google颠覆性地提出基于自注意力机制的神经网络结构——Transformer架构,这几乎成为所有使用大语言模型的生成式AI公司的基础[4]。2020年5月,OpenAI发布了GPT-3模型,成为当时最大的语言模型。GPT-3拥有1 750亿个参数,预训练数据量达到45 TB,训练数据包括多种文本类型和数据库资源[2],在许多自然语言(即人类日常使用的语言)处理任务上表现出色,甚至在一些任务上超过了人类水平,可以生成高质量的文本,如回答问题、翻译语言等。2022年11月,搭载了GPT-3.5的ChatGPT横空出世。ChatGPT能够根据之前的输入内容,逐步生成连贯、合理的回复,模拟人类的对话方式。其凭借逼真的自然语言交互与多场景内容生成能力以及友好便捷的交互方式,迅速引爆互联网。之后GPT不断迭代升级,逐渐具备多模态理解和多类型内容生成能力。欧美一些代表企业率先将其与出版产业融合。
2.1 大模型正在渗透美国出版产业全流程
全球新冠疫情结束之后,数字加速(digital acceleration)带来电子书、有声书等的超预期增长,也带来出版业与数字技术和生态的进一步创新融合[5]。进入2023年,人工智能技术在美国出现重大变革,技术的进步重新塑造内容形态、读者偏好和市场趋势。以OpenAI为代表的美国AI大模型企业正在积极推动产业应用和落地,数字出版产业首当其冲。
2.1.1 在内容供给方面,大模型成为内容生成的重要工具,辅助创作
亚马逊上架海量ChatGPT辅助编撰各类书籍,同时专门开辟了AI作者书籍专栏。亚马逊的自助出版平台(Amazon Kindle Direct Publishing)为作者发布电子书,提供了极大的便利。截至2024年4月,亚马逊Kindle商店中有超过一千本电子书将ChatGPT列为作者或合著者,包括英语、意大利语、法语等不同语言图书,内容涵盖教育、文学、旅游、商业、个人成长等多种题材,而且这个数字每天仍在上升(2024年4月15日,亚马逊kindle商店的搜索结果并未顯示具体数字,这可能与很多作者没有披露或者未将GPT列为作者有关)。这里需要指出的是,大模型将取代革新后的出版创作流程中的部分环节,但并非取代作者角色。作者仍是内容创作核心,将与大模型共同参与创作。
除了传统的文字内容领域外,另一个受到巨大影响的领域是有声书。据专业机构预测,全球有声读物市场预计到2030年将超过350亿美元[6]。有声书分为真人有声书和人工智能AI有声书,后者主要由语音合成技术驱动。随着大模型技术的发展和AIGC的爆发,通过AI语音工具模仿人类语音输出正在革新出版产业有声阅读制作。微软研发的AI语音工具VALL-E,仅需3秒音频即可模仿人说话。该工具经过60 000小时英语语音数据的训练并使用特定语音的3秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。
2.1.2 在编辑审校方面,传统的编辑流程因为大模型技术而提效增速
以美国公司Veristage为例,这家新兴的技术公司由图书出版业的几位资深人士共同创立,他们的背景和经验使得Veristage在出版与人工智能结合方面具有独特优势和深入理解。其产品Insight平台利用不同的大语言模型如ChatGPT和Claude来理解和处理文档及书籍内容。此外,Insight还特别重视内容安全,其愿景是为出版业提供安全可靠的大模型服务。
2.1.3 在用户交互方面,大模型帮助出版商优化用户的个性化体验
美国新闻业巨头BuzzFeed使用ChatGPT来增强其用户交互栏目“Quizze”的互动体验。BuzzFeed首席执行官乔纳·佩雷蒂在一份给员工的备忘录中表示,公司将利用这一技术创建面对用户的个性测验,同时根据用户反应生成个性化的文本内容。例如,一项关于浪漫喜剧电影偏好的测试可能会提出“为你的浪漫喜剧选择一个场景”和“告诉我们你一个可爱的缺点”等问题。测试将根据每个人的回答生成一篇独特的、可分享的文章。大众出版商也在积极推进AI应用,全球知名的出版公司哈珀·柯林斯将AI技术用于进行文本翻译和插图版图书的生产,这也对大众出版行业提出了新的挑战,如何在保持内容质量的同时,利用新技術提高生产效率,是出版行业需要考虑的问题[7]。
2.2 英国传统出版集团加速尝试大模型应用
英国的技术进步不如美国迅猛,监管政策不如欧盟细致入微,但在灵活的框架下,英国数字出版业积极拥抱大模型技术并出现一些亮眼的应用案例。大型出版机构正在利用大模型革新教育出版流程。培生集团正在建立自己的大模型应用并开始与大模型公司合作。大模型的应用更多侧重用户端,而非改变出版社数字化工作流。培生集团希望能为受教育者提供AI助手,让AI协助回答学习相关问题并根据受教育者的经验,提供教育课程推荐。教育出版是培生集团非常重视的细分领域,培生集团利用大模型识别全球职业技能趋势,调整教育出版产品规划。在第24届中国国际教育年会上,培生集团展示自身在人工智能领域的多项前瞻性研究成果与应用,英语语言测评工作可以利用人工智能迅速准确地衡量考生的英语水平,在考试测评领域应用人工智能技术确保考试公平;职业技能部门利用人工智能帮助组织预测内部和外部的技能需求,使工作者的技能与不断发展的就业市场技能需求保持一致[8]。
此外,大模型正在显著提升市场营销和读者体验。在大模型技术爆发之前,企鹅兰登就已经运用人工智能预测重点地域的书刊需求,以减少书刊的退订率[9]。Shimmr.ai是一家利用人工智能技术来革新书籍市场营销方式的英国创新公司,口号是“帮助你更高效地卖更多书”。通过其自动化广告平台,Shimmr.ai旨在利用持续自我优化的广告活动来增强书籍的可发现性、销售量和可扩展性。这个过程从AI分析一本书的“DNA”——其流派、情节线、主题等开始,以创建目标营销活动,包括与受众匹配的标签和关键词。这种方法可能显著改进书籍的推广方式,确保它们有效且高效地触及正确的受众。
2.3 欧盟专业出版巨头引领大模型应用
欧盟较早把大模型监管提上日程,首要任务是确保欧盟使用的人工智能系统安全、透明、可追溯、非歧视和环境友好。在这种监管背景下,欧洲的大型出版公司主导探索AIGC产品并且持续推出自研大模型工具,探索出版垂类模型。在出版的细分领域,专业出版更加积极应用AI工具。
大模型最先进入专业出版领域。2023年10月18日,施普林格·自然向媒体发布信息称,继2019年出版世界上第一本由机器生成的科研图书之后,施普林格·自然最新又授权作者使用GPT并将其作为集成工作流程的一部分,出版一本学术图书。这项创新实验显示,生成式AI在节省作者时间上有巨大潜力,但也凸显人工指导的重要性。此外,施普林格·自然最新推出科技论文写作助手Curie,与通用的AI写作应用程序不同,Curie专注于研究人员在专业写作中的独有痛点,为英文和英语语言润色,以处理非母语写作的语法错误并改善措辞和选词[10]。
基于专业数据库内容训练的出版AI应运而生。2024年1月16日,全球领先的科技出版与信息分析公司爱思唯尔正式发布Scopus AI。这款生成式人工智能工具经过科研人员共同测试和开发而成,结合了行业领先的科研文献引文与索引数据库,将帮助研究人员和科研机构快速、准确地获得文献摘要和研究见解,从而推动学术合作并促进产生广泛的社会影响力。Scopus AI以Scopus数据库中涵盖了全球7 000多家出版商旗下的超过27 000种学术期刊的可信内容、累计超过18亿的引用文献和超过1 700万的学者档案为基础,为用户提供简明易读的科研主题摘要。Scopus数据库的内容经过独立的内容遴选与咨询委员会严格审核与筛选,该委员会由代表主要科学学科的全球知名科学家和图书馆员
组成[11]。
AI出版平台不断提升用户参与度。比如刚刚完成最新一轮融资的德国数据驱动型出版公司Inkitt。Inkitt是一个利用AI技术帮助作者开发和分发作品的自助出版平台。这家公司的目标是将用户提交的故事转化为畅销书并以此为基础,构建一个新世纪的“迪士尼”。Inkitt使用的AI技术旨在分析和预测哪些故事可能会成功,优化内容以增强读者的参与度。Inkitt的平台吸引了大量的关注和用户参与,拥有3 300万用户并从其服务中涌现出多部畅销书。新融资将帮助公司扩大内容制作范围,包括使用AI撰写故事、制作个性化小说、涉足游戏和有声读物领域,以及制作更多视频内容[12]。
3 趋势
大模型对于出版业而言是一项里程碑式的技术,其发展过程与数字内容产业有深刻内在关联。大模型影响数字出版业的全流程和各环节,会带来产业、价值、生态等一系列变化。一方面,大模型推动出版业价值链发生根本性变革;另一方面,出版业作为以内容为中心的产业,语料丰富且质量高,应用场景丰富,也必然反向助力大模型迭代优化。
3.1 大模型将全面助力欧美出版业态和商业模式创新
从产业角度来看,欧美大型出版机构正在积极探索和应用垂类大模型,大模型也在全面革新和迭代传统的内容创作、分发流程,从而提高效率和创新能力。
在内容创作方面,垂类大模型的应用日益广泛。例如,通过AI生成的文本和图像,出版机构能够快速生成新的内容草案,为作者和编辑提供灵感和素材。此外,AI技术还能够辅助创作者进行创意拓展,通过分析大量数据和趋势,为新作品的構思提供支持。以施普林格·自然为例,其科技论文写作助手Curie基于学术文献进行专门训练,涵盖超过447个研究领域、2 000多个特定领域的课题,该训练还基于已发表论文中进行的100多万次编辑,其中包括《自然》系列期刊上的论文[10]。
从编辑出版流程看,大模型智能化辅助编辑审校流程,特别是多模态大模型针对音视频等数字出版内容的审校能力,将极大提升编辑审校效率。以此为基础,大模型将重构编辑流程,编辑需要将更多精力放在内容价值层面,更深介入内容生产环节。在传统的编辑审校流程中,编辑人员需要投入大量时间和精力来检查文本的语法、拼写、风格一致性以及事实准确性等问题。而大模型技术的应用可以自动化这一过程,快速识别并纠正错误,甚至提出改进建议,极大地减轻了编辑的工作负担。对于多模态大模型而言,其能力不仅限于文本,还能够处理音频和视频等非文本内容。在数字出版领域,这尤为重要,因为音视频内容的审校往往比文本更复杂和更耗时。多模态大模型可以分析音视频内容中的语音、图像和文本元素,识别不一致性、错误信息或者版权问题,从而确保内容的质量和合规性。此外,大模型还能够提供个性化的编辑建议,根据出版机构的风格指南和品牌语言,对内容进行定制化的优化。这种智能化的辅助编辑审校流程,不仅提升了编辑工作的效率,也保证了出版内容的高质量标准,为读者提供了更加丰富和精准的阅读体验。
在用户体验环节,大模型将在创建互动内容、提升多元化和沉浸式内容体验方面发挥更大优势,加速读者体验全面升级。基于大模型,根据读者偏好调整故事线的互动式电子书、定制化的阅读助手、图书快速转换为有声书、音视频、实时的阅读反馈分析、VR/AR增强现实阅读体验都有可能实现,从而极大地拓展阅读乃至数字出版的外延场景案例。2023年8月1日,OpenAI宣布公司有史以来的第一笔收购,收购对象是一家成立了仅2年且只有8位员工的“虚拟游戏”公司Global Illumination。Biomes是Global Illumination最近推出的一款基于Web的沙盒类大型多人在线角色扮演游戏(MMORPG),使用了Next.js、Typescript、React和Web Assembly等技术,被称为开源版“我的世界”。玩家只需要打开浏览器,就可以建造、觅食、玩小游戏以及进行更多活动。Biomes游戏利用AI技术,根据玩家的行为和喜好,动态地调整地形、植被、动物、天气等内容,生成真实多变的游戏世界,带来更有挑战性、更刺激的游戏体验。在这样的背景下,大家对于此次收购也有另一种猜测:OpenAI买下这个公司,目的是要在GPT-5上运行多智能体文明模拟游戏。
3.2 数字出版产业将为大模型进化提供多样性的知识库
决定大模型核心竞争力的关键要素包含算力、算法与数据,数字出版产业对大模型的影响更多落位在数据层面。出版机构积累了大量的高质量内容资源并具备持续的高质量内容生产能力,为大模型训练提供高质量语料库。前文提到的GPT-3训练数据库,主要来源于图书、期刊、网络数据等。美联社作为首家媒体机构与OpenAI达成协议,授权OpenAI使用美联社部分新闻存档,以探索生成式人工智能在新闻领域的应用。OpenAI的首席运营官布拉德·莱特卡普表示,美联社的反馈意见以及OpenAI对其高质量、真实文本存档的访问将有助于提高OpenAI系统的能力和实用性[13]。而后,与OpenAI合作的媒体机构范围从美国逐步拓展至欧洲。2023年12月,德国数字传媒出版集团Axel Springer和OpenAI达成战略合作,双方的合作将推动新闻出版业与人工智能更深入的整合,OpenAI将付费使用施普林格旗下出版物的内容,以填充ChatGPT的答案并训练其人工智能工具。Axel Springer将通过专业新闻内容丰富ChatGPT用户体验。通过这次合作,ChatGPT用户将能够接收到来自Axel Springer旗下媒体品牌的全球新闻内容摘要。ChatGPT对用户查询的回答将包括对原始文章的引用和链接,以提高透明度和提供更多信息。OpenAI也将支持Axel Springer的AI驱动计划,合作还涉及使用Axel Springer旗下媒体品牌的优质内容来推进OpenAI的大型语言模型的训练。此外,出版机构也将同时开发新的收入模式。OpenAI的COO Brad Lightcap表示,这次合作将帮助人们通过AI工具以新的方式获取高质量、实时的新闻内容,他们致力于与全球出版商和创作者合作,以此确保他们从先进的AI技术和新的收入模式中获益。
4 建议
目前,我国正处在出版业智能化、融合化升级的关键阶段。通过对欧美数字出版业最新态势的追踪,可以看到中国应该加强人工智能方向的前瞻性、针对性布局,推动人工智能深度应用,探索新的商业模式,更好与“Z世代”新兴读者群的阅读习惯结合,从而促进数字出版业的高质量发展。在迅速变化的环境中,出版业面临系列挑战的同时也迎来了革新发展的历史机遇。敏锐的市场洞察能力、持续的内容与服务创新能力以及丰富的资源协同能力,正是出版业应对动态环境挑战的关键能力。
4.1 洞察先行,持续关注国内外行业动态
近年来,国际大型出版公司一直在探索前沿数字技术在出版业的应用。人工智能与出版业的结合并不是新鲜事物。早在两年前,以DeepZen和Speechki为代表的新一代智能化音频转换技术,已经开始撼动传统人工朗诵模式下的有声书行业[5]。在数字出版时代,数字出版企业的数据其实已经初步完成数据化、标签化、知识图谱化、索引化、智能检索化,所以比较容易在大模型时代脱颖而出。而传统出版企业的大模型转型则可能需要先完成以上步骤。由此可以看出,新兴的数字出版产业特别是像有声书、网络文学、网络游戏等产生于数字时代的产业,相比于传统出版企业,在应用大模型方面更具优势,要紧跟技术发展,建立信息获取和共享机制,培养和提升数据分析能力,捕获市场和客户需求。
4.2 携手共进,提升内外资源协同能力
外部协同是指出版机构和技术企业加强合作,明确合作目标与权责分配,出版机构深度参与技术研发过程,双方强化沟通和透明度,优势互补。内部协同是指出版业内部各机构之间加强协同共享,搭建行业合作平台,可采用联合研发、合作推广、人才共培等方式来优化资源配置。大模型技术在推动出版业创新和提升用户体验方面具备切实的能力和潜力,但需要出版社提供更多专业性内容和语料来提升大模型对内容的把控能力。
对于大模型训练而言,最重要的是解决数据、算法、算力的问题。GPT的训练数据离不开出版内容行业积累的海量高质量语料和数字内容。目前,中文数据在GPT所用语料中的占比极低,所以,GPT的中文输出能力与英文输出能力相比相差较大。对于中国科技企业追赶大模型技术、参与国际竞争角度而言,中文数据至关重要。虽然中文互联网上有大量数据,但其质量参差不齐。如何深入发掘中文可训练语料,是下一步中文大模型训练的基础。
5 结语
对于内容行业而言,文本、语音、图片、视频等技术的叠加可能产生多种真假难辨的内容,引发个人隐私、公众认知、数据安全等安全隐患。我们应当看到大模型可能带来的技术风险,但这些风险可以在适当监管的前提下预判和解决。有风险不等于要停止发展,特别是在全球范围内大模型技术研发日新月异、商业生态初见雏形、应用市场如火如荼的当下,我们要积极拥抱技术,持续探索安全发展的新路径。
技术和内容从来不是二元对立的,而是紧密连接互相促进。新的变革性技术到来之后,如何用于挖掘和扩大文化内容的价值并且赋能时代和未来,是出版业和技术企业的共同议题。出版智能化、融合化升级的关键阶段,数字出版业和人工智能业更应该携手合作共同应对未来,通过融合双方的优势资源,共同促进出版内容的创新和价值最大化,同时助力中国大模型技术的发展,这才是中国特色数字出版产业发展的必由
之路。
(责任编辑:郭剑)
参考文献
[1] Big Ideas 2024[EB/OL].[2024-03-15].https://www.ark-invest.com/big-ideas-2024.
[2] ALAN D T.What in my AI?[EB/OL].[2024-03-15].https://lifearchitect.ai/whats-in-my-ai/.
[3] 尼克.人工智能簡史[M].2版.北京:人民邮电出版社,2021:6.
[4] 揭秘Transformer创始八子,聚是一团火,散是满天星[EB/OL].(2023-08-23)[2024-03-15].https://www.thepaper.cn/newsDetail_forward_24318491.
[5] 任翔.数字加速与新增长周期:2021年欧美数字出版发展回顾[J].出版广角,2022(1):50-55.
[6] Publishing Trends in 2024[EB/OL].(2023-12-05)[2024-03-15].https://publishingstate.com/publishing-trends-in-2024/2023/.
[7] 渠竞帆.AI“杀入”出版业,国际出版商有何应对之策[EB/OL].(2024-04-09)[2024-03-15].https://mp.weixin.qq.com/s?__biz=MzI3MzQ1MzI0NQ==&mid=2247531200&idx=1&sn=a53a649d7ff17bd17268a5f9eefab6c7&chksm=eb212312dc56aa04d91b2f957ce650984f18131888b7829d71127d404d6fa57544cba7326449&scene=27.
[8] 引领探索AI赋能教育新方向 培生亮相第24届中国国际教育年会[EB/OL].(2023-10-27)[2024-03-15].https://edu.sina.com.cn/l/2023-10-27/doc-imzsptxk5069967.shtml.
[9] 有了这些高科技,出版行业和从前大不相同[EB/OL].(2021-05-23)[2024-03-15].https://www.fortunechina.com/keji/c/2021-05/23/content_390704.htm.
[10] 人工智能驱动 全球知名学术出版机构推出一款科技论文写作助手[EB/OL].(2023-10-17)[2024-03-15].https://new.qq.com/rain/a/20231017A08BMB00.
[11] 爱思唯尔正式发布Scopus AI,助力科研全流程增效提速[EB/OL].(2024-01-18)[2024-03-15].https://www.jiemian.com/article/10694804.html.
[12] Inkitt nets another 37 million for AI powered publishing[EB/OL].(2024-04-15)[2024-04-16].https://www.publishersweekly.com/pw/by-topic/international/international-book-news/article/94456-inkitt-nets-another-37-million-for-ai-powered-publishing.html.
[13] 美聯社与Open AI合作,探索生成式AI在新闻领域的应用[EB/OL].(2023-07-14)[2024-04-16].https://www.thepaper.cn/newsDetail_forward_ 23849215.
Large Language Models and Digital Publishing Revolution—Experience and Lessons from Western Industry Practices
Qi Tong1Ying Cao2
1.School of Economics and Management,Tsinghua University,Beijing 100084,China;2.Research Institute of Tencent,Beijing 100101,China
Abstract China's publishing industry is at a critical historical moment. How to respond quickly under the vigorous technological revolution and promote content innovation and high-quality development in the publishing industry has become an unavoidable key issue. The article reviews the development history of large language models and its impact on the publishing industry. It provides insights into the application cases of leading companies in US、EU and UK, analyzing how large language models affect the digital publishing industry and how the digital publishing industry reciprocally supports large models. Based on this, the paper proposes prospects for the interactive relationship between large language models and digital publishing in the future, as well as suggestions for the publishing industry to respond to future challenges.
Keywords Large language models; Artificial intelligence; Digital publishing; Western Industry Practice