新基建规划背景下出版业数字基础设施升级路径思考

2022-05-30 10:48吴申伦
出版广角 2022年16期
关键词:出版业基础设施出版社

【摘 要】面对大数据时代的挑战和文化数字化战略的要求,出版业现有的数字基础设施需不断适应新的市场环境,借鉴新基建的理念与实践进行升级,对接文化大数据体系框架,实现由数据智能驱动出版的决策、供应和消费环节。对出版业而言,数字基础设施的升级可提高内外数据资源利用率,优化图书供应与销售链管理,提高数字产品之间的互操作性和产业生态系统的智能化程度。在项目优先级中,云端数据库、联盟区块链、供应链动态模型、数字化公共阅读是出版业数字基础设施升级的可行着力点,构建初步框架。

【关  键  词】文化数字化;出版业;数字基础设施;大数据;智能化

【作者单位】吴申伦,华东政法大学传播学院,浙江大学数字出版研究中心。

【中图分类号】G239.2 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2022.16.011

2022年5月22日,中共中央办公厅、国务院印发了《关于推进实施国家文化数字化战略的意见》(下文简称《意见》),明确要求“建成文化数字化基础设施和平台,形成线上线下融合互动、立体覆盖的文化服务供给体系”,其最终目标在于“建成物理分布、逻辑关联、快速链接、高效搜索、全面共享、重点集成的国家文化大数据体系”[1]。出版业是我国文化产业的重要组成部分,国家文化数字化战略目标的实现离不开出版业的全面数据化转型与创新发展,需要出版业数字基础设施升级作为支撑。

尽管我国出版业很早就开始搭建数字基础设施,如数字编校系统、配送物流网、读者在线反馈渠道等,但其主心骨依然是传统出版流程和线下零售市场,线上业务主要是网上书店。与把持网络文学、有声书、数字阅读大头的互联网企业相比,出版业在收集数据、建立数据库、使用数据研判市场、多行业数据交互等方面相对薄弱,因此需要充分吸收《意见》精髓,利用数据智能驱动对数字基础设施进行升级,更好地适应日新月异的数字经济环境,在合作共建的基础上实现多种资源的共享、融合与创新,为整个行业提供数据化转型过程中必要的内外部支持。

一、出版业数字基础设施升级的战略意义

大数据时代,各行各业数据化、平台化、智能化趋势愈发明显,我国出版业须对本行业的数字基础设施进行全方位升级,充分利用数据信息促进出版流程、业务模式、消费场景创新,以应对大数据时代的挑战。

1.新基建与大数据时代的挑战

对大数据的需求与应用已成为时代的主题。与大型建筑、购置、安装等传统基础设施相比,在国家于2018年12月的中央经济工作会议提出,而后又被多次完善并写入2020年政府工作报告的“新型基础设施建设”中,5G基建、大数据中心、人工智能、人工互联网等核心领域无不强调数据驱动的重要特征——通过“对海量数据进行深度分析和解读”,“以前所未有的速度吸收、处理和响应信息”,不仅提高了生产效率,深刻改变了商业模式[2],还成为企业和个人至关重要的可增值资产[3]。

《意见》中的文化数字化基础设施与新基建存在依托关系,前者专用于文化领域,后者则在全行业中发挥着广泛适用的基础性支撑作用。为此,作为国家文化数字化基础设施组成部分的出版业数字基础设施,也应当充分认识新基建的理念与实践,积极响应新基建规划,在大数据时代进行自我完善。

2.出版业现有的数字基础设施存在“搭车”局限

印刷时代的出版产品主要是实物书报刊,彼时出版基础设施主要包括图书的公路运输网络、批发集散地、城市书报亭、公共图书馆、公共办公楼/产业园区等,为线性出版产业链的上下游畅通提供保障。互联网技术普及后,电脑编校、数字阅读、网上书店等新兴事物越来越普遍,以存储、处理、传输数据信息为基本需求,出版业早期的数字基础设施应运而生,如出版集团的线上管理系统、公共图书馆的数字服务部分、向书店和出版社开放的大型电商平台、专业期刊数据库、政府设立的版权登记和保护平台等。

数字基础设施的使用,形成了线上与线下两条图书零售渠道。但出版业数字基础设施的搭建存在明显的“搭车”局限。第一,出版社和书店十分依赖互联网平台企业经济生态圈中的电商平台、社交媒体和数据库,通过后者进行用户引流、产品分销,难以对抗平台主导的价格战;第二,由于各个出版单位的自建数据库、私域流量分割独立,整个行业的数据无法汇总,有效利用率低;第三,出版业对大数据、人工智能、算法、云计算等技术的使用程度尚不及很多互联网企业,无法形成按需生成、精准推送、智能引流等新型产销形态,从而导致竞争力不足。

3.出版业数字基础设施面向大数据的升级与架构

出版业作为内容产业,在数字化过程中产生了相当大规模的数据信息,包括出版流程元数据、作品各个数字版本、平台与门店用户的消费记录、图书配送物流网络、用户原创衍生内容等,但现有的出版业数字基础设施未能对这些数据进行充分利用。如当当网、京东、微店等平台虽然可以根据用户的浏览与消费记录绘制用户画像进行精准推送,但出版社和书店并不掌握用户数据库。因此,出版业数字基础设施需借鉴新基建的理念与实践进行升级再造,以应对本行业的具体或特殊问题,实现以数据驱动的方式促使选题策划、内容组稿、编辑出版、零售发行等流程走向智能化,促进场景阅读、知识服务、按需定制、解决方案等业务模式创新。这也契合当前学界对数字基础设施定义的更新:“以数据创新为驱动、通信网络为基础、数据算力设施为核心的基础设施体系。”[4]

根据《意见》精神,高书生提出了“两侧四端”(供给侧、资源端、生产端、消费端、云端、需求侧)的文化大数据体系框架[5],为出版业数字基础设施面向大数据升级提供了对接范式,覆盖了完整的出版产业链(见图1)。资源端用于保存内容资源,包括古籍、文物、外译、红色等多类型数据库;生产端通过智能编校软件、人工智能算法、阅读物联网等采集数据加工形成多态出版物;消费端是出版物化为文化消费新场景、新体验之前的最后一站,基于公共數字阅读服务体系、供应链数字孪生模型、可感知智能终端等满足读者个性化定制、精准投送、多维呈现、全民共享等需求;云端是各板块之间的桥梁,由开放型平台、联盟区块链、数据交易中心等组成,不仅可存储、交易和分发产品数据、用户数据和元数据,也是出版业与电视电影、文博文物、网络文化等其他内容领域数据关联的中心节点,从而真正形成国家文化专网和国家文化大数据体系。

二、数据智能驱动:出版业数字基础设施升级的主要方向

面对当前出版业对数据信息利用程度较低所引发的诸多问题,升级后的数字基础设施可辅助出版社和书店收集数据并进行整合、存储、共享,借助算法将其转化为上游选题、中游发行、下游阅读的资源和依据。

1.提高出版社数据资源的利用率

在国家政策的推动下,绝大多数出版社都建立了数字管理系统和官方网站,但这种自上而下的外力驱动型改革往往很难激发基层主体的主观能动性。很多出版社在日常工作中仅仅是使用线上系统完成三审三校、申报选题、申领书号等流程,具体的书稿审校工作依然通过纸质稿完成。一些出版社的数据库意识相对薄弱,尚未实现包括元数据、选题审校、内容版本、版权信息、读者反馈等数据资源的自由查询和调动。而我国已基本形成综合型出版集团下控若干出版社、印发公司和相关企业的格局,缺乏通用数据库可能会导致不必要的内耗。如下游发行单位的用户数据不能及时反馈到上游出版社,后者只能重新进行市场调研,浪费人力物力。

针对《意见》提出的“利用文化数据服务平台,探索数字化转型升级的有效途径”和“统筹推进国家文化大数据体系”,升级后的出版业数字基础设施可收集、整合乃至共享生产数据,形成出版行业的云端大数据汇总。出版社依托完备的大数据库,可通过智能系统的筛查功能提高图书选题策划与发行的精准度,减少跟风出版,聚焦重点、精品出版项目。此外,大数据还能够发现事物之间的隐性联系,出版社可凭借大数据描绘用户画像,发现潜在的需求点,在定制与个性化方面进行业务和模式创新。

2.优化图书供应与销售链的管理

互联网的开放性使得出版社、实体或虚拟书店、电商平台等都可以在网上开设图书销售窗口,加之传统的线下零售渠道存在诸多中间环节,数据不够公开透明,从而导致图书供应与销售出现一些管理问题。由于出版社无法及时了解图书终端的销售情况,尤其在电商价格战、疫情等影响下,可能会加剧对书店延迟结款的不信任,从而提高采购门槛。反过来,由于观测配货过程的中间环节不易,书店难以从出版社直购、中盘商进货、大电商回流中选择最优的进货渠道。

为此,出版业数字基础设施建设要实现对图书供应与销售的全程监控与信息披露,通过减少信息不对称促进整个图书零售市场的优化;帮助出版社与书店建立信任关系,建立图书资源数据库,提高书店选书进货的效率。出版社与书店可通过云端数据库、供应链数字孪生模型、人工智能算法的分析,扩大或缩小规模,制定经营策略,使整个出版产业链实现自我调整,动态维持市场平衡。对政府部门而言,清晰可查的图书供应与销售数据不仅是其出台扶持政策的依据,还可根据图书实时流向数据打击市场中的违法行为,这也是《意见》中“构建文化数字化治理体系”的重要组成部分。

3.提高出版类数字产品之间的互操作性

互操作性是内容作品大批量转化为数据后的产物,因为纸质印刷品无所谓互操作性。出版类数字产品主要有电子书、有声书、慕课、数字期刊等形式,数字化初期的互操作性表现为数字产品文件源格式的互斥问题。随着平台经济的发展以及互联网平台在数字内容领域的扩张,出版类数字产品通常需要依托互联网企业的开放型平台才能被读者阅读消费。因此,当前出版业的互操作性主要是指同一款数字产品可经由不同终端和系统操作使用,抑或来自不同出版社的数字产品可经由一款终端或系统操作使用。由于互操作性会压缩中心化带来的盈利空间,互联网企业更倾向于建立垄断性闭环,从而使这一问题愈发凸显。缺乏互操作性提高了读者的消费成本,降低了读者阅读体验和付费意愿,不利于产业的长期发展。

《意见》要求“加快文化数字化建设标准研究制定,健全文化资源数据分享动力机制”,升级出版业数字基础设施可推动我国数字阅读标准的建立。鉴于出版社、书店的技术和财力有限,出版业数字基础设施的升级应由政府部门和行业协会牵头指导,并给予政策、技术、资金支持,促使出版社和书店结成联盟关系,电子通信商、互联网平台、硬件厂商、数据解决方案提供商等共同参与。项目制合作关系能够在开放型平台用户账号关联、非核心版权资源开放范围、交互借阅条件、格式转换许可、智能合约规范等关键方面达成共识,实现版权保护与文化数字化成果共享。

4.提高出版业整体生态系统的智能化程度

目前,“人治”依然是出版业各个环节运转的主要力量,需靠具体的人去评判选题的市场潜力,控制各条销路的发行数量,对接上下游从业者,向读者推荐产品等。尽管人的主创性十分重要,但面对信息化时代的海量数据,人力毕竟存在数据不敏感、主观判断失误等问题。数字基建与数据资源利用率低、图书供应与销售链复杂化、数字产品互操作性差等问题,恰好反映了出版业整合利用和互通数据资源的意识较为薄弱,从而导致用于数据驱动的原材料缺乏。

数字基础设施可以共建共享的方式向出版社提供一系列云端数据和算法服务,提高出版业整体生态系统的智能化程度。如由自动化审稿代替复杂人工劳动,根据用户画像精准营销[6],支持全场景化的阅读体验,定向生产虚拟伴读或导购数字人等。面对建设和使用数据库或算法的巨大前期成本压力,数字基础设施的公共、公平、公开特征既能减轻出版社对技术公司的依赖,又可确保数据与算法的安全规范,是行业自决的保证。出版社能够普遍运用新型的数字基础设施进行数据智能驱动,是落实《意见》中“培育一批新型文化企业,引领文化产业数字化建设方向”任务的关键步骤。

三、出版业数字基础设施升级的着力点和初步框架

出版业数字基础设施的全面升级不可能一蹴而就,短时间内也很难产生预期效益,因此,可优先选择最能够反映数据智能驱动的项目作为发展着力点,对标《意见》提出的重点任务,搭建从出版社经由中间平台/经销商/书店/图书馆覆盖读者受众的初步框架。

1.构建涵盖版权、版本与其他出版信息的云端数据库

《意见》首先提出的重点任务是“统筹利用文化领域已建或在建数字化工程和数据库所形成的成果,关联形成中华文化数据库”,因而云端数据库在出版业升级数字基础设施的过程中具有较高优先级。云端数据库可涵盖已出版的纸质书、电子书、有声书以及其他形式的数字出版产品(如数字教育应用)相关信息。出版社不仅可以将自己的出版物信息上传至云端数据库保存,还可通过输入导出、检索查询全国出版行業数据,为选题策划提供市场实况、同类对比等参考依据。

北京开卷公司在图书市场数据采集和应用领域具有代表性,在合作单位的范围内,其Smart系统分为图书、榜单、市场等模块,可供出版社查询。多媒体数字出版物相关信息则部分来源于互联网企业,输入格式本身便意味着一种市场规范。云端数据库的主管权限为政府部门所有,健全的数据库能提高报备、审核、检查等办公效率。如出现图书内容相关的突发舆论事件时,管理单位可在第一时间找到相关责任人和完整的产销链。因此,云端数据库的建设有利于出版业搭建政企一体化管理网络。

2.搭建出版业专属联盟区块链

近年来,区块链相关产业在我国迅速发展,搭建出版业专属联盟区块链具有一定的先导性。区块链在出版业的应用主要有以下方面:一是用于存储出版生产、产品交易、版权登记等相关数据,借助其不可篡改、公开透明的特点保证数据的安全可靠;二是基于以上功能推出图书相关数字藏品,如中信出版社推出的《山海经捉妖记》《叶嘉莹读诵纳兰词全集》、新华文轩联合“阿里拍卖”推出的首个数字藏书《瞻对》(实体书+限量数字藏书票)等[7]。在此过程中,出版社通常需要将数据和产品置于第三方机构运营的联盟链或私链,如蚂蚁链、BSN链、百度超级链、至信链、智臻链等,由于出版社在其中的主导性低,导致区块链运营方的经营风险往往也会波及出版社。

《意见》指出,不仅要“形成国家文化专网”,还要“鼓励和支持各类文化机构接入国家文化专网”。因此,随着区块链技术在出版业中应用的深入,本行业专属的联盟区块链可通过行业内部自律有效降低来自外部的风险。首先,出版业专属联盟区块链可将不同出版社的数字藏书、数字藏品置于同一区块链,消除用户的平台转换成本;其次,与云端数据库结合后,出版社将重要的数据资源保存于区块链,安全性较高;最后,由于区块链具有智能合约功能,作者、出版社、版权衍生开发者可在线上完成公平透明的图书版权交易,从而降低签约成本。专属联盟区块链可由政府部门和行业协会牵头,与全国范围内的出版社合作运营监管。

3.利用数字孪生技术复刻出版供应链网络动态模型

数字孪生复刻的供应链网络动态模型是勾连整个出版产业链各个主体的桥梁,也是《意见》中“文化数据服务平台”的一种形式。数字孪生是指利用多种数字技术将物理实体仿真,在虚拟空间中完成其全生命周期映射。数字孪生通过创建物理对象的数字模型,进行“全要素/全流程/全业务数据驱动”,实现实时监控、未来预判、智能处理、模拟优化,应用领域包括卫星通信、数字医疗、制造车间、智慧城市等领域[8]。国内许多城市都在酝酿并实施仿真数字模型计划,以改善道路交通、治安管理、生态环境等。

出版社与平台、书店合作可通过数字孪生技术虚拟映射现实中的物流运输网络、线上平台流量、线下发行网点等关键性的产业节点,复刻出版供应链网络动态模型,从而实现精密、实时、双向的数据信息交互,即时发现可能发生的滞销或脱销,优化图书运输路线与存储仓点的选择,以及具有经销合作关系的线下网点(书店)布局,根据终端消费状况反馈至上游以调整营销策略,模拟特定的出版选题与业务模式走向。此外,数字孪生供应链网络还需要以子母系统的方式,将各个出版社和书店的自用数据和模型关联整合,实现共建共享,为整个行业智能决策提供重要依据。

4.线上线下融合,优化公共阅读服务体系

公共阅读服务体系是传统出版基础设施的重要组成部分,依托各级公共图书馆、社区和农村书屋、城市书房等实体设施,对其进行升级再造的可执行性和社会效益较高。公共阅读服务体系的存在价值除了推广全民阅读,也是在以惠民工程的形式让政府财政消化一部分图书产出。《意见》提出“线上线下融合互动、立体覆盖的文化服务供给体系”的目标和“全国智慧图书馆体系”的任务,为此,优化公共阅读服务体系应当以线上线下融合一体为目标,扩大覆盖群体。

一方面,部分地市级图书馆尚未开通网上注册功能,也无可用于移动端的APP,数字资源中电子书数量相对不足,优质内容存量、并发数与阅读体验均有待提升。社区和农村书屋与以上图书馆存在相似性。另一方面,越来越多的城市书房依托图书馆如雨后春笋般出现。图书馆数字化、社区和农村书屋升级以及城市书房24小时运营,都需要与云端数据库、专属区块链、孪生供应链等数字基础设施相结合,充分收集用户数据和需求,作为节点整合并入供应链网络,经由人工智能算法与场景物联技术提供智能化的阅读服务。如城市书房与智慧城市相连,可实现自助办证、人脸出入识别、光温湿调节、自动结算、控制人流、安全警报等配套功能;与图书馆相连,可实现馆际借阅调取、个性推荐书目、市民阅读统计、远程活动组织、阅读场景定制等。线上线下融合一体的公关阅读服务体系反过来也是政府部门了解国民素养、出版社进行针对性选题策划的窗口。

四、结语

正如《意见》着重指出:要“建成文化数字化基础设施和平台”,国家实施文化数字化战略的一个重要的期许,就是让文化人“从不擅长、不熟悉、不精通的事务中解脱出来,专心做最擅长的事,恢复文化人做内容的功力”[9]。人力资源固然是出版业重要的生产力,但面对生产与消费的日益精细化,数据与算法往往更能发现人力难以察觉的事物关联,进而挖掘产业新的增长点。为此,出版业需要全面升级现有的数字基础设施,形成自己的核心数据资源,通過智能化的信息处理方式实现出版流程、业务模式、消费场景创新。而数字基础设施是连接出版社、中盘商、书店与公共新基建、相关产业的桥梁,通过设施共享、数据交互、算法运用和规则共识,使整个出版业有机融入数字经济大循环,在新基建规划大背景下和文化数字化战略中发挥积极作用。

|参考文献|

[1]中共中央办公厅 国务院印发《关于推进实施国家文化数字化战略的意见》[EB/OL].(2022-05-22)

[2022-07-22].http://www.gov.cn/zhengce/2022-05/22/

content_5691759.htm.

[2]《理论导报》编辑部. 新基建到底“新”在哪里?[J]. 理论导报,2021(1):56-57.

[3]张懿. 助力“艰苦一跃”,更好释放数字经济潜能[N]. 文汇报,2021-11-26(2).

[4]曾志敏. 强化数字基础设施建设[EB/OL].(2022-05-07)[2022-07-23]. https://www.zjwx.gov.cn/art/2022/5/7/art_1673579_58871128.html.

[5]成琪. 高书生:让中华文明数字化成果全民共享 随处可见[EB/OL].(2022-06-01)[2022-07-25].http://www.ce.cn/culture/gd/202206/01/t20220601_37698136.shtml.

[6] 刘银娣. 从经验到算法:人工智能驱动的出版模式创新研究[J]. 科技与出版,2018(2):45-49.

[7]入局数字藏品和元宇宙,出版业还能怎么更进一步?[EB/OL].(2022-08-03)[2022-08-05].

https://mp.weixin.qq.com/s/HKA1Cs7Rn6kZYdGwzYf

ZfQ.

[8]陶飞,刘蔚然,张萌等. 数字孪生五维模型及十大领域应用[J]. 计算机集成制造系统,2019(1):1-18.

[9]高书生. 国家文化数字化战略:背景与布局[J]. 河北师范大学学报(哲学社会科学版),  2022(5):11-18.

猜你喜欢
出版业基础设施出版社
农业基础设施建设有望加速
公募基础设施REITs与股票的比较
我等待……
以按需出版为抓手,推动出版业数字化转型
振动搅拌,基础设施耐久性的保障
今日華人出版社有限公司
充分挖掘基础设施建设发展潜力
AR与VR技术在儿童出版业中的应用
对出版业供给侧改革的思考
石油工业出版社