【摘 要】从早期的激光照排技术到现代的智能出版,出版业经历了从电子出版到数字出版、融合出版的演变。出版业不仅在内容制作、业务流程优化、产品和服务创新等方面取得显著进展,还在政策支持、技术驱动和市场需求的共同推动下,实现了跨越式发展。随着生成式人工智能技术和AIGC技术的发展,AIGC将成为编辑的辅助工具,赋能出版全流程,显著提升内容的生产力和创造力。
【关 键 词】人工智能;智能出版;融合出版;生成式AI;大数据分析
【作者单位】刘长明,北京北大方正电子有限公司;杨勇,北京北大方正电子有限公司。
【中图分类号】G230.7 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2024.13.002
随着人工智能技术的迅猛发展,出版业迎来了前所未有的发展机遇。作为承载知识传承与文化交流重任的重要领域,出版业历来积极拥抱技术革新。从早期引领印刷革命的汉字激光照排技术到如今的智能出版,出版业数字化转型不仅是科技进步的体现、社会文化发展的需求,也是提升知识传播效率与质量的重要途径。这一过程不仅展现了出版业对技术变革的敏锐洞察和积极响应,也预示着在智能技术的赋能下,出版业将迎来更加多元化、高效化和个性化的未来。
在出版业数字化转型进程中,从电子出版到数字出版,再到融合出版和智能出版,出版业在内容制作、业务流程优化、产品和服务创新等方面取得了显著进展,更在政策支持、技术驱动和市场需求的共同推动下实现了跨越式发展。本文从智能技术与内容产业深度融合应用的视角,探讨智能技术在选题策划、内容审核、内容生产、内容分发、传播分析、内容营销等方面的应用。
一、出版业数字化转型历程
我国出版业的数字化进程始于王选教授发明的汉字激光照排技术。经过40余年的探索与发展,在内容制作、业务流程优化、产品和服务创新等方面取得了显著进展。1974年,王选教授发明的汉字激光照排技术成为国家设立的重点科技攻关项目“汉字信息处理系统工程”的重要组成部分。这项技术不仅开启了我国印刷技术革命的新纪元,推动了中文计算机信息技术的全面发展,而且标志着中国出版业告别了铅与火,迎来光与电,开启电子出版时代。汉字激光照排技术使文字和图像的排版过程数字化,显著提升了排版速度和效率,提高出版物的印刷质量,并缩短出版周期,加速信息传播。
2005年至2013年,随着互联网和移动互联网技术的发展,我国出版业从电子出版向数字出版过渡。这一阶段以内容生产数字化、产品形态多样化、传播渠道网络化、管理过程数字化和使用作品数字化为特征,数字化转型快速发展。得益于政策支持和技术驱动,出版市场规模不断扩大,版权保护意识逐渐增强,国际合作与交流日益频繁,我国出版业开始步入加快数字化转型和创新发展的新阶段。
党的十八大以来,以习近平同志为核心的党中央高度重视传统媒体和新兴媒体的融合发展。2014年8月,《关于推动传统媒体和新兴媒体融合发展的指导意见》的颁布,标志着媒体融合已上升为国家战略。2015年4月,财政部与国家新闻出版广电总局联合发布《关于推动传统出版和新兴出版融合发展的指导意见》,强调以转型升级为基础,加快推动传统出版与新兴出版业态的融合发展。在国家政策的支持下,出版业积极探索和推进业务流程的数字化改造,建立选题策划、协同编辑、结构化加工、全媒体资源管理等一体化内容生产平台,推动内容生产模式的升级和创新。同时,拓宽发行渠道,大力发展电子商务,整合产业链,构建线上线下一体化的内容传播体系,并充分利用新一代信息技术加快发展移动阅读、在线教育、知识服务、按需印刷、电子商务等新业态。2022年4月,中宣部印发《关于推动出版深度融合发展的实施意见》,对未来一个时期的出版融合发展作出全面部署,指出强化大数据、云计算、人工智能、区块链等新技术的应用,建立一体化内容协同生产传播新体系,健全数字化环境下的内容生产传播机制,全面推进机构融合、业务融合、资源要素融合。
当前,随着移动互联网、大数据、云计算、人工智能、区块链等技术的发展,尤其是这些技术的融合和叠加,推动了全球产业进入数智化时代。生成式AI的出现使得出版业的数字化转型逐步进入数智化转型和智能出版时代。大模型对出版业的影响,不仅限于技术层面的改进,更体现在内容创意创作、分发传播策划、日常工作效能的革新上。大模型的一键分发、精准审校功能,使编辑出版人员得以从烦琐低效的事务中解放出来。智能技术已成为出版业融合发展的新动能,其显著特征是智能工具的广泛应用,数据开始全面赋能出版业全链条、全场景的转型升级。多数出版企业正着手建立一体化内容协同生产传播新体系,以进一步释放内容生产力。
在数字化转型的推动下,我国出版业的模式和范式持续进化:从媒介角度看,从单介质出版向多媒介出版发展;从出版流程看,从一次出版向可持续出版发展;从模态看,从静态出版向动态交互出版转变;从加工流程看,从传统内容制作流程向全流程数字化制作转变;从产品形态看,从单一图书出版向多产品形态发展;从角色看,从图书出版商向知识服务商转变;从业务边界看,从单一书刊出版领域向跨领域出版和数字内容产业拓展。
二、智能技术在出版融合方面的应用价值
在出版领域,随着人工智能技术的不断进步与应用,涌现了一系列智能技术。这些技术不仅改变了出版的生产方式和流程,而且在深度推进出版数字化转型和融合发展过程中,其应用价值日益凸显。人工智能对出版数字化转型和融合创新的未来发展影响主要体现在以下三个方面。
1.生成式AI技术
生成式AI技术的发展推动了人工智能内容生成技术的应用。人工智能自动生成内容(AIGC)是继专业生产内容(PGC)、用户生产内容(UGC)之后的新型内容创作方式。AIGC改变了内容生产方式,提高了内容生产效率,推动了内容生产的变革。生成算法、预训练模型、多模态技术等AI技术的汇聚融合,为AIGC提供了肥沃的技术土壤。特别是以OpenAI、ChatGPT为代表的生成式AI大模型的发展,加速了AIGC时代的到来。生成式AI大模型为AIGC的落地应用带来了可能。AIGC涵盖了文本生成、音频生成、图像生成、视频生成,以及图像、视频、文本间的跨模态生成,具备面向不同模态的多场景应用能力。
AIGC给内容产业带来了深远的影响。一是内容表达体系的变化,从文本到音频、图像、视频,再到多模态内容传播表达体系,AIGC技术凭借其强大的语言处理和生成能力,实现了辅助智能选题策划、内容核查、稿件润色、智能纠错、智能推理判断、智能知识搜索等多重功能,从而提高出版效率,推进范式创新,极大地提升了出版效率。这使得出版机构能够在短时间内响应市场需求,加速内容的创作,缩短发布周期。二是内容生产和传播生态的变化。在生成式AI的加持下,出版机构能够根据用户的反馈进行内容优化和个性化调整,进一步提升读者体验。例如:在搜索引擎的基础上增加交互功能,实现聊天对话集成搜索和问答式内容生产;在内容传播中内嵌智能算法,通过分析用户和受众数据,实现以内容为核心的精准传播。
2.大数据、内容挖掘及知识服务技术
以自然语言处理和知识图谱技术为核心的技术体系,能够助力出版机构打造数据资产的核心枢纽,有利于其构建知识管理及知识服务平台,使数据转化为资产,将资产转化为服务,从而释放数据价值,实现对海量数据的高效处理与分析。通过分析用户行为、市场趋势等数据,出版机构可以更精准地定位目标用户群体,制定更有效的出版策略。同时,大数据技术还能帮助出版机构评估出版物的市场表现,方便出版机构及时调整出版计划和定价策略。
3.信息传感技术
AR/VR/XR技术的应用实现了内容的全媒体表达形态,沉浸式场景、数字人、元宇宙等新技术共同助力构建融合出版传播的新生态。借助虚拟现实技术,用户可以在虚拟环境中阅读书籍、听音频或观看视频,享受沉浸式的阅读体验。这不仅丰富了内容的呈现形式,还拓宽了阅读渠道,吸引了更多用户。
目前,人工智能技术,尤其是生成式AI、基础大模型、知识图谱、自然语言理解、深度学习、图像及视频识别技术、语音识别和合成技术等,正逐步成熟并形成广泛应用,极大地推动了出版业的创新和发展。这些技术不仅提高了出版效率和效益,还拓宽了内容的表现形式和传播渠道。
三、人工智能赋能出版的实现路径
从智能技术与内容产业深度融合应用的角度来看,智能技术在智能选题策划、智能内容生产、内容智能审核、内容智能分发、传播分析、内容营销等出版各环节均发挥重要的赋能作用。围绕智能技术加持下的出版业数字创新和数智化转型,我们观察到以下创新应用趋势:一是内容生产流程的数字化和智能化,使出版业从劳动密集型向技术密集型转变;二是内容分发的智能化,通过分析用户阅读行为等数据,实现精准推送及个性化服务,促进出版物的传播与营销;三是数字内容的重构和数据价值的挖掘,这为用户提供了更丰富的产品形态和数据服务。将人工智能技术应用于出版产业,能实现出版产业的智能化升级。
1.推动内容生产流程数字化与智能化
从内容生产流程来看,人工智能技术推动了内容生产流程的数字化与智能化进程。依托人工智能技术构建的智能编校排一体化出版业务流程,可实现内容编辑加工流程的全数字化和智能化。在这一流程中,作者写作、编辑加工、设计排版、审稿校对等内容生产环节基于统一技术平台实现融合出版、智能出版,这不仅提升了出版效率与质量,还降低了出版成本。
技术平台集成AI编辑助手中的智能写作、智能审校、智能排版、智能校对等智能化工具,实现了内容数字化管理、策划、编纂、审校、排版、校对等图书生产环节的全流程数字化。在选题策划环节,技术平台利用大数据和人工智能技术从海量数据中挖掘有效信息,并深度分析用户需求,从而提升了选题的科学性和准确性。在内容创作环节,内容生产从专业生产内容(PGC)向用户生成内容(UGC)转变,并在生成式AI技术的支持下升级到AIGC,形成PGC与AIGC协同共生的内容生产新范式。例如:基于深度学习、自然语言处理等算法对文字进行处理和分析,实现内容的自动生成;利用视觉技术、语音技术等将传统出版中的图文形式转换为视频形式,使编辑方式从“人讲人说”向“人机协同”转变;借助语义分析、知识图谱等算法对内容进行分析,为用户提供更好的人机交互阅读体验。人工智能技术已成为出版行业实现高质量内容生产的重要手段。在内容编审环节,引入智能编辑助手能够实现从人工编校到人机协同智能编校的转变;在排版环节,引入智能排版工具能够实现从人工排版到人机协同智能排版的转变;在编校排环节,人机协同的编辑加工新范式逐渐形成。
2.助力传播和营销,内容分发智能化
内容智能化分发是指根据用户的兴趣爱好,向其推荐符合其兴趣的产品和服务。随着信息技术的不断发展,内容分发技术日益成熟,为用户提供个性化内容推荐成为可能。例如:基于深度学习、自然语言处理等算法对用户进行标签分类和精准识别,实现个性化内容推荐;利用智能感知和知识图谱等技术对用户进行精准画像和场景分析,实现智能推送和智能客服;运用数据挖掘、算法推荐等技术对用户行为进行分析和预测,实现智能营销。根据不同类型、不同载体的产品特点,人工智能在内容推荐方面可分为图书内容推荐、期刊内容推荐等。
在图书内容推荐方面,人工智能可以根据读者的阅读行为数据、购买记录等构建知识图谱,并进行多维度、多层次分析,根据读者的需求及偏好提供精准化的阅读服务。在期刊内容推荐方面,人工智能可以根据期刊的类型、目标受众、学科领域等数据,构建期刊知识图谱,并根据期刊的类型和目标受众提供精准化阅读服务。
市场营销是出版机构的核心工作,涉及产品定位、定价、宣传、销售等过程。人工智能可以为市场营销提供智能决策支持,通过分析用户行为数据、历史购买数据等,向用户推荐符合其需求的产品和服务。例如,在内容市场方面,通过人工智能对用户行为数据的分析,出版机构可以为不同类型的用户推荐适合的内容,并提供个性化服务,以满足用户的特定需求。此外,人工智能技术还可以帮助出版机构根据用户行为数据和社交数据进行用户画像分析,对目标人群进行精准定位,提供更精准的服务。借助人工智能技术,出版机构可以根据用户的阅读行为和偏好,为其推荐匹配需求的图书、期刊等内容,或为其定制相应的出版内容和产品服务。
3.挖掘数据价值,加强知识服务建设
人工智能技术在知识图谱的构建和管理中发挥着重要作用。利用大数据、自然语言处理等人工智能技术,出版机构可以建立基于大数据的数据资源管理平台和知识图谱及知识服务平台。这些平台能够自动关联、获取、发现新知识,并提供新服务,最终实现内容数据化、数据知识化、知识服务化,从而最大化数据服务的价值,显著提升出版内容资源的组织效率和开发效率。依托知识服务平台构建的连接和服务,出版机构可以聚合生态,发展出版新业态和新模式。出版机构应在知识服务(数据库)平台、在线教育平台、数字文化公共服务平台(如数字阅读、数字图书馆)的建设和运营上持续发力,形成平台化服务商业模式。
总之,围绕出版业的数智化转型,出版机构应将打造智能出版技术底座作为技术支撑平台,结合自然语言处理、知识图谱、行业大模型、多媒体处理技术,打造底层技术引擎。在智能技术的支撑下,传统出版内容生产、传播及运营的底层逻辑将发生根本变化,基于AI的“人机协同共生”智能出版流程将成为出版的新范式。未来,智能技术将与选题策划、内容生产、编辑加工、营销传播等业务流程更紧密地融合。
四、人工智能在出版领域的应用——以方正电子为例
1.方正星空出版大模型赋能出版业全链条创新
2024年初,北京北大方正电子有限公司(以下简称“方正电子”)面向出版行业发布了方正星空出版大模型,该模型基于通用和开源的大模型架构,融入了出版行业的专业知识和私有数据,并与出版学科和应用场景紧密结合的小模型共同组成了面向出版领域的AI编辑助手,在选题策划、内容加工、营销传播等多个出版环节为编辑提供辅助。
(1)驱动选题革新与优化
传统图书选题过程需要投入大量时间进行市场调研、数据分析,以了解读者需求。当前,图书市场竞争激烈,读者需求多变,热点话题瞬息万变,这使得预测市场需求变得极为困难。方正星空出版大模型在图书选题中的应用,可以帮助编辑更准确地把握市场动态,精准匹配读者需求,提升选题决策的科学性和准确性,从而降低风险,提高出版效率。第一,方正星空出版大模型能够分析大量的市场数据和读者反馈,利用自然语言理解等相关技术对图书评论、图书评分等进行分析,提取出当前读者关注的热点话题,帮助编辑在选题时准确把握读者感兴趣的题材和内容。第二,方正星空出版大模型利用大模型的预测能力,通过对图书主题、语言风格、读者行为、地域差异、读者年龄等多维度的分析,进行相对准确的市场预测,帮助编辑有效地进行选题决策,并为新书的出版提供有力的数据支持。大模型技术在图书选题策划中的应用,能够助力出版机构更好地理解市场和读者需求,推动出版行业的创新和发展。
(2)提升内容审校精准度与风控效能
随着人工智能技术的快速发展,特别是大型预训练模型的出现,内容审核和内容风控领域迎来了革命性的变化。方正星空出版大模型通过深度学习和大量数据训练,能够理解并分析语言的上下文,执行复杂的语言处理任务,主要表现在以下几个方面。一是准确率提升。通过深度学习,方正星空出版大模型能更准确地理解文本内容,减少误判和漏判,从而提高审校的准确性。二是时效性提升。方正星空出版大模型利用检索增强(RAG)等技术,从大量文档中检索相关信息,将这些信息作为上下文与当前内容进行校对,以判断内容的时效性。三是对意识形态的把控更加严格。通过模式识别和数据分析,方正星空出版大模型能够预测和识别内容中潜在的风险。四是建议修改内容的合理化。方正星空出版大模型基于修改建议,为用户提供更好的交互方式服务,提升用户的使用满意度。五是持续学习能力和强大的多任务处理能力。方正星空出版大模型能够基于用户反馈的内容差错及用户行为数据不断学习,随着时间的推移不断优化性能。同时,它还能处理拼写、语法、格式、事实等多维度的校对任务。随着技术的不断进步,方正星空出版大模型在内容审校和风控中的应用不仅提升了审核的准确性和效率,而且使建议更加合理。目前,方正电子基于星空出版大模型的智能审校大模型版本已经完成研发,将为用户提供更全面和高效的服务。
(3)提高编辑内容编审效率
借助AI技术,AI编辑助手可利用智能图表技术自动收集并识别稿件中的所有图片,并根据内容进行精确分类,如行内补字图片以及含有二维码、数学公式、表格、地图等的图片。同时,智能图表技术对不同类型的图片进行AI识别和转换。这一技术的应用不仅减少了编辑人员手动筛选和整理的工作量,而且提高了稿件内容的准确度,提升了稿件质量。例如,智能图表技术能够识别并转换图片中的数学公式为可编辑的格式,使编辑能够轻松修改和调整公式,从而减少排版人员在公式录入过程中可能引入的错误,并支持将表格内容的图片转换成实际的表格,使表格数据可以进一步分析和处理。此外,二维码的识别功能能够使编辑直接预览二维码内容,为编辑提供了即时的信息验证手段,确保内容的准确性和安全性。
(4)提升稿件编辑加工能力和效果
在稿件加工过程中,方正星空出版大模型凭借其强大的自然语言处理能力,能够高效地进行文本分析和语义识别,对稿件进行润色,从而帮助编辑提高工作效率。在大模型的支撑下,AI编辑助手在进行稿件润色时,会结合整篇文章的写作风格和语言特点,保留作者的语言风格,避免过度润色。同时,为了控制内容篇幅不因润色而有显著变化,AI编辑助手还实现了与编辑、文档以及大模型的三方交互功能。这使得编辑能够对选中的句子或段落直接进行润色,并查看润色前后的改动情况。此外,AI编辑助手通过“大花脸”方式呈现修改痕迹,保留了大模型的改动记录,以提升编辑的使用体验。然而,在实际应用中,方正星空出版大模型仍存在一些不足,主要体现在对于不同类型或领域的图书还难以完全把握其中的细微差别,特别是在处理复杂的语言逻辑结构或特定领域的表述时,大模型的润色有时会导致内容风格趋于一致,缺乏个性。
(5)辅助内容传播与营销
在图书编辑和出版过程中,AI导读能够迅速从原始稿件中提取核心内容,生成概要性文档。这可以帮助编辑在短时间内筛选和评估稿件,为出版决策提供依据。此外,对于已经出版的书籍,AI可以生成富有吸引力的内容摘要,并将其推送给潜在读者进行预览。这有助于读者进行快速筛选,选择真正有价值的书籍进行深入阅读。在学术出版领域,AI导读通过对论文进行深度语义理解,提取核心观点和结论,生成高度概括的文本摘要。这可以帮助研究人员迅速把握研究的全貌,决定是否需要深入阅读完整的论文,从而显著提高工作效率。同时,AI导读还能将文本摘要转化为视频,为图书和论文的传播开辟新的维度。例如,一本科普读物的摘要视频通过AI导读生成后,可以在社交媒体平台进行广泛传播,吸引对科学感兴趣的年轻群体。这种跨媒介的传播方式不仅能提升作品的曝光率和影响力,还能推动知识的普及,为文化产业的发展注入新的活力。
2.方正电子AI技术在出版行业的应用
近年来,高等教育出版社尤其重视人工智能技术的应用,自2023年起开始与华为、阿里巴巴等头部企业合作,开展教育大模型的训练与应用工作。合作围绕智能检索、智能审核、智能问答、智能创作等服务场景,探索应用大模型等生成式人工智能技术,旨在打造教学助手和编辑助手等场景应用。截至2023年底,高等教育出版社已将人工智能技术应用于数字教材编辑场景,与方正电子联合研发了AI编辑助手,旨在减轻编辑负担并赋予编辑更多能力。目前,双方合作研发的“智校云雠”智能审校客户端已在社内编辑流程中得到广泛应用。“智校云雠”集成了人工智能、自然语言处理、内容结构化、PDF版面识别、大数据等先进技术,能够对教材内容进行智能审核,包括字词符号、敏感信息、重复语句、知识引用、参考文献、字符格式、语法,以及稿件的大纲体例和图表、公式以及多模态资源的审核,从而提高了教材审核的准确性和效率。同时,高等教育出版社正与方正电子联合打造智能案例库,通过智能化收集和整理编辑的编审行为,为后续编辑的编审工作提供案例参考。智能案例库的建设实现了编校过程的资产化,有助于提升内容的整体质量。
目前,化学工业出版社已经将智能审校纳入图书的标准生产流程。编辑在接收到作者的稿件后,即可直接进行预审。智能审校系统会对稿件内容进行全面审核,包括字词符号的准确性、敏感内容的识别、逻辑大纲的正确性,以及对知识点、格式等方面的检查。审核完成后,编辑可以根据系统提供的审校建议,在可编辑的稿件中进行修改,或选择将审校结果反馈给作者,以便作者进行内容调整。这一流程显著减少了稿件在编辑过程中的反复修改次数,有效提高了工作效率。
五、结语
近年来,随着出版融合发展的不断深入,大数据、云计算、人工智能等技术被广泛应用于出版流程中。尤其是生成式人工智能的发展,对传统出版模式产生了深远的影响,并为出版业带来了全方位的赋能和革新。人工智能技术正逐步成为出版业的新质生产力,推动出版业的数字化转型和融合发展。随着生成式人工智能技术的发展,AIGC工具将成为编辑的编审助手,赋能出版全流程,显著提升内容生产力和生产效率。同时,人工智能还在推动内容生产流程和传播体系的创新,助力构建人机协同的智能出版流程和传播新体系。展望未来,基于AI的“人机协同共生”智能出版流程将成为出版业的新范式,智能技术将与选题策划、内容生产、编辑加工、营销传播等业务流程更加紧密地融合,人工智能技术在出版行业的应用将从赋能走向全面融合的新阶段。
|参考文献|
[1]刘长明,高国连,杨勇. 智能技术驱动融合出版创新和发展[J]. 出版与印刷,2021(4):78-84.
[2]张海生,吴朝平. 人工智能与出版融合发展:内在机理、现实问题与路径选择[J]. 中国科技期刊研究,2019(3):225-231.
[3]沈珉. 人工智能技术再造出版生态[J]. 出版广角,2018(1):20-22.
[4]程忠良. 人工智能时代出版业发展模式进化的三大路径[J]. 科技与出版,2018(7):127-131.
[5]胡玉玺,王雨薇,程海威. 智能出版:智媒时代传统出版业务的转型升级方向[J]. 科技与出版,2020(11):56-63.
[6]陆遐. 人工智能视角下出版行业的融合创新探讨[J]. 新闻传播,2021(9):57-59.