范波 贾广胜 范林海 裴恒利 张一媚 汤兴恒
摘 要:快速发展的人工智能技术正推动传统出版业进入新时代。文章从人工智能技术在传统出版业的应用分析出发,对人工智能与传统出版业相融合的应用现状、应用探索等做出具体分析。面对人工智能对传统出版业带来的机遇与挑战,应积极探索人工智能与传统出版业融合发展新平台——出版产业大脑的建设,以實现出版产业的创新产出和转型发展,推动出版业向更高质量发展。
关键词:人工智能 出版产业大脑 传统出版 融合出版
人工智能(Artificial Intelligence,AI)技术的发展为传统出版产业带来了转型机遇。[1]2022年11月,ChatGPT问世,其在内容生成方面所表现出的卓越性能,不仅给智能内容生成(Artificial Intelligence Generated Content,AIGC)、个性化定制出版等带来了希望,同时,也将会革新既有的出版理念和出版方式[2],对包括传统出版业在内的众多行业产生巨大影响。《出版业“十四五”发展规划》强调要推动出版深度融合发展,突出科技创新在数字化转型升级中的作用,中宣部等部门也提出要促进文化和科技的深度融合,打造新型出版传播体系。由此可见,利用人工智能等新一代信息技术赋能传统出版产业高质量发展,推动文化和科技的深度融合已成为国家发展战略导向,出版业应抓住新机遇,挖掘人工智能与传统出版产业的契合点,最终打造“出版+人工智能”的新模式和新形态。
一、人工智能在出版产业的应用现状
我国的出版融合转型工作已推进多年,在新媒体平台构建、在线教育、知识服务、数字阅读等方向,各出版单位均做出了有益的探索。[3]然而,由于技术、模式、体制机制等问题,导致在出版产业的融合转型过程中,出现了数字要素基础薄弱、技术应用支撑能力不足、数据底座不坚实、业态融合程度不深、产业结构优化升级效果不明显、供给与需求结构不适应等问题,制约了传统出版产业的融合转型发展进程。近年来,随着《出版业“十四五”发展规划》等方针政策的提出,人工智能与传统出版业发展的结合已成为人工智能技术应用的一大热点领域,人工智能技术通过数据的汇聚、工具的应用与场景的结合,能够不断赋能传统出版产业提升应用价值,实现技术与应用场景的螺旋上升。基于人工智能等新一代信息技术,推动传统出版的数字化融合发展,已成为出版业发展的主要趋势。经过深入研究,目前,国内外人工智能技术在出版相关领域的应用已经取得了一些重要进展,其应用领域主要集中在以下三个方面。
1.知识组织和知识服务
利用词表、分类到本体、知识图谱等知识组织技术构建专业数据库,结合机器学习、机器翻译、智能检索等技术对文献进行自动分类、跨语言检索,实现内容多元化、产品化和标准化的知识服务。[4]如人民法院出版社的“中国法律应用数字网络服务平台”,通过搭建法信大纲知识地图,突出法律知识数据聚集与分析作用;知识产权出版社的“InteCovery专利分析”,为用户提供了深度标引加工服务;威利的“Cochrane Library”提供医学主题词表(MESH)的组织功能;再如科学出版社的“SciEngine平台”、施普林格的“Springer Material”、百度的“百度学术”、万方的“万方数据知识服务平台”等都是知识服务领域中较为成功的应用案例。
2.自动化出版业务流程
将人工智能技术与出版实际业务场景相结合,能够辅助优化内容生产、编辑、校对、发行等环节的效率,提升出版品质和读者体验。①利用深度学习技术,实现文稿推荐和文稿生成,辅助选题流程优化。[5]例如,WordAi作为一款基于深度学习技术的智能写作工具,可根据主题和关键词生成高质量原创文字,助力用户高效地完成选题和内容创作。②通过语法分析、语义解析、词汇识别等手段,自动检测文稿和图片中的错误,辅助编辑进行图像编辑和分类,提高编辑效率。[6]例如,基于自然语言处理、人工智能和内容结构化技术,黑马智能辅助审校平台可实现文稿的检查、推荐和优化,有利于提高编辑工作效率和质量。③通过预测分析和机器学习,优化印刷流程,降低成本,提高效率。[7]例如,Heidelberg Prinect Press Center系统利用机器学习和数据分析技术,实时监测、分析和优化印刷生产过程。该系统收集并处理大量生产数据,可预测潜在问题并自动调整设备参数,以提高印刷效率和质量。④基于人工智能技术,能够通过分析读者购买行为、阅读习惯等数据,预测读者需求,优化发行策略,还可以通过个性化推荐、智能客服等方式,提升读者体验,增加读者黏性。[8]例如,Amazon Kindle 是一款采用人工智能技术的电子阅读服务平台。通过分析用户的阅读历史、喜好和购买行为等多维度数据,该平台可向用户推荐更符合其兴趣的图书和内容。这种个性化的推荐系统使用户能够更轻松地发现新书、扩展阅读领域,并提高阅读的满足感与体验。
3.智能化出版物版权管理
利用人工智能技术可以为出版物版权管理提供高效、准确的辅助服务,协助版权保护机构快速发现和处理侵权行为,保护版权人的合法权益。通过深度学习、自然语言处理等技术,能够识别侵权图片和侵权文字[9],结合海量数据智能分析,实现对侵权行为的监测和预防,降低侵权风险并保障版权方的权益。[10]国内外多家知名厂商正在积极布局基于人工智能技术的版权监测管理平台:YouTube平台的ContentID版权管理功能,通过人工智能技术对用户上传内容进行识别和比对,实现音频、视频、图像等多种类型内容的侵权监测;国内如腾讯版权资产服务平台,通过建立人工智能和大数据技术的侵权监测系统,对互联网上的图片、视频、文字等内容进行监测和比对,快速发现和解决版权侵权问题,帮助作者维护自己的版权权益。
二、人工智能在出版产业的问题探索
从现有研究可以发现,当前人工智能技术在出版产业的应用主要存在以下几点问题。
1.从出版产业角度进行中观、宏观分析的应用较为缺失
单个企业的聚合构成了产业,产业反映了行业多个企业的特征。出版社或更为大型的出版集团,对现有的人工智能应用多集中于微观领域,大多应用是从产业技术入手,在编排、印刷、产品推荐等局部传统领域,应用相关人工智能进行技术改進。[11]但人工智能技术所提供的丰富数据源、分析手段并没有直接应用于出版产业的中观、宏观层次的管理与分析,而相较于产业技术细节,产业链条、产业布局、产业规划等信息将更加直接决策产业、企业的发展走向与兴衰。
2.行业传统数据与产业大数据的融合程度不足
出版产业的产业链也有大小之分,从传统出版行业的角度来看,出版产业可以分为编(编辑)、印(印刷)、发(发行)、供(物料供应),而当前科技创新与传统产业的融合,使得传统产业的链条本身发生了大的变化。产业链与创新链的融合更为密切,因此政府、产业、研究院所、高校等与企业主体的合作与交流日益加强。但在这种情况之下,我们仍然发现,人工智能技术所依赖的分析数据,其维度较为单一,数据的孤立性依然存在,在小链条中,不同企业间的数据仍然没有打通,而对于大链条的数据,又缺乏必要的收集渠道和手段。数据是人工智能分析的重要基础,因此从现有出版产业的发展来看,小链条与大链条的数据孤立现象仍然存在。
3.先进技术背景下的应用场景服务模式尚不清晰
从行业的管理、发展来看,不同层次,其需要也是不同的。在微观层面,面对大数据和人工智能技术的冲击,要在多元化数据、多源头数据、多缘数据以及先进技术的支撑下,扩展业务思维,对于编、印、发、供等细粒度信息进行再组织、再分析,以人工智能手段支持其应用。在中观层面,面向企业决策和管理,需要在多样化数据支持下,进行企业管理与决策,人工智能与大数据的应用将赋能企业管理、业务拓展和转型。在宏观层面,一个产业的治理,必须将多源大数据作为基础,以分析工具和方法作为手段,以可视化为前端展开多样化服务,为管理决策提供直观高效的支撑。
三、人工智能在出版产业的应用探索
为解决出版产业融合转型发展中存在的数字要素基础薄弱、技术应用支撑能力不足、业态融合程度不深、产业结构优化升级效果不明显、供给与需求结构不匹配等问题,构建“出版产业大脑”,为产业未来发展谋划、产业发展策略制定、产业转型治理提供数据化的智能辅助决策支撑。
产业大脑以数据资源为驱动,以人工智能技术为基础,以大数据分析为手段,将政策链、产业链、创新链、人才链、资金链等资源要素数据汇聚起来,通过关键技术研发、数据科学处理与分析,掌握行业态势和自身定位,面向产业战略、管理、执行三个维度,提供多源数据、智慧辅助决策、业务流程智能化、多场景交互可视化四项服务,构建产业指数体系,既为产业转型升级提供数字化服务,也为产业治理提供数字化工具。
1.战略层面,为宏观产业决策层提供综合知识图谱,构建产业融合转型“参谋室”
面对出版产业宏观决策管理中存在的决策经验化、产业链治理效能低等问题,出版产业大脑在宏观决策层面,面向出版产业政府决策机构,从政策链、产业链、创新链视角进行出版产业宏观态势的观察与透析。利用智能可视分析技术,结合政策、标准、主体、产业、人才等创新要素数据,通过时空结构分析、系统建模与仿真分析等方式构建出版产业知识图谱,打造“一屏观全域”的动态监测平台,对产业宏观层面进行直观刻画,辅助产业规划的最高决策层及相关主体,给予其俯视产业链全局的机遇,为我国出版产业管理部门和机构提供覆盖面广、时效性强的多维决策支撑,为出版产业进行全方位、全流程的决策赋能,从而达到精准决策的目的。
(1)政策图谱是政府制定产业政策的参考标杆。构建政策图谱,利用数据挖掘和文本分析技术,智能提取政策主题、措施和目标,把握政策热点、脉络和趋势,并结合关联分析、语义识别,分析不同政策间的关联性、实施效果、社会反响,辅助开展科学的政策规划和研判,促进政策研究者对产业状况的深度理解,也能辅助政策决策者科学制定相关政策,并为未来政府建设政策智能咨询服务体系、打造政策智能管理系统奠定基础。
(2)产业图谱是政府优化产业布局的重要依据。产业图谱建立模型打造产业指标评价体系,优化产业布局,实现政策效果的量化评估和分析预测,推动产业结构良性发展。帮助政府决策者掌握出版产业的宏观格局演化情况,开展出版产业链结构分析,建立产业发展评价体系、分析研判产业发展前景、预测企业需求和发展趋势、构建资源精准匹配模型,对产业政策的效果进行量化评估和分析预测,帮助政府把握产业瓶颈与发展机遇,提升政府治理能力,辅助政府有针对性地制定产业发展战略和调控政策,对出版产业发展方向和区域布局进行动态化指导,促进产业链上下游资源综合利用,推动产业结构良性发展,提升出版产业的创新能力、发展规模和经济效益。
(3)创新图谱是政府促进产业升级的有力支撑。构建创新图谱,基于文本挖掘和语义分析技术,识别前沿技术热点,结合科学计量、社会网络分析等技术,剖析产业创新态势,将技术与作者、机构、资源投入等数据进行关联,为出版机构提供合作推荐、优化创新投入结构,辅助决策者开展资金支持、政策引导和服务保障。
2.管理层面,出版产业大脑可以服务于中观企业管理层,提供智能态势监测,打造企业科学管理“驾驶舱”
针对出版企业转型升级的需求,“出版产业大脑”以数据智能为核心,提供资源治理服务,基于智能分析引擎研发,服务企业开展竞合态势分析、国际出版动态监测和对标分析,研究如何进一步通过技术研发、内容创新、渠道融合、市场融合走好高质量发展之路,探索出版融合发展新路径,提高出版企业规模、内容价值和创新水平,提升企业的竞争力和影响力。
一是开展智能态势监测与分析服务。基于智能分析引擎,服务出版企业开展竞合态势分析、市场竞争力分析、人才动员力分析、科技创新力分析等,探索企业融合发展新路径,提高出版企业内容价值和创新水平。
二是提供全方位的企业发展态势智能分析。构建面向出版企业管理的智能分析工具,包括企业态势智能评估、企业竞争关系分析、企业人才脉络梳理等,辅助管理者自主开展多维态势分析。
三是构建海外出版动态监测和国内外竞合分析服务。面向国内外主要出版商产品,利用机器翻译、实体识别等技术获取海外主要出版物信息并,实现对海外出版物内容、市场动态、书评和社会影响的评估,支撑图书版权引进和出海的分析和决策判断。
3.执行层面,出版产业大脑还服务微观业务层面,提供智能业务辅助工具,搭建业务流程管理“操作台”
基于人工智能技术,为出版产业从业者提供智能工具集,利用出版流程数据,结合知识图谱、机器翻译、自然语言处理等技术,构建智能选题、智能发行、智能审校等应用场景服务,提升编辑、发行、审校等业务流程效率,对现有企业出版流程与模式进行升级。
(1)智能选题。基于文本识别、聚类分析等技术,识别市场热点话题,为选题提供方向参考,并结合同类图书市场化分析,有针对性地开展市场需求分析和预测,结合自然语言处理技术自动生成选题报告,为图书选题策劃提供参考依据。
(2)智能发行。根据读者用户的购买记录和会员信息,为读者进行画像,并结合协同过滤技术,为用户推荐可能感兴趣的书籍,实现精准营销;另外,通过比较同类图书的市场表现和销售情况,辅助生成同类图书的优缺点分析报告,以便更好地制订图书发行策略。
(3)智能写作。基于大模型,自主研发智能内容生成平台,能够根据提示词一键生成文章段落和图片,辅助开展组稿、文案撰写等工作。
(4)智能审校。基于自然语言处理和深度迁移学习技术,根据分词结果及当前词条的上下文语义关系,识别知识点并创建索引,利用预训练模型,实现创作、编辑、审核、发布等环节文本的自动化审核和校对,提升校对质量及审稿效率。
四、结语
人工智能时代,传统出版业将受到前所未有的冲击与挑战,需辩证看待人工智能技术与传统出版业之间的关系,保持理性认识。人工智能技术为传统出版业的转型升级带来诸多发展机遇,一方面,应继续推进行业内外多源数据汇聚进程,构建多源关联、时效权威、高数据质量的产业大数据知识库,以保证人工智能技术数据底座的准确性与及时性;另一方面,持续聚焦人工智能产业应用研究,分别在数据、算法、算力三要素层面,在知识服务、流程优化、版权管理等细分领域,全面、深入、透彻地研究人工智能技术原理,聚焦人工智能技术与出版产业的深度融合,持续探索人工智能技术在出版产业中的广泛应用,实现人工智能对传统出版产业的深度赋能,推动产业效率和价值的全面提升。
(作者单位系山东出版数字融合产业研究院,范林海系本文通讯作者)