出版企业文化数据体系建设初探

2024-04-25 09:45卫敏马嵩崔璐
出版广角 2024年6期
关键词:出版社数字化数字

卫敏?马嵩?崔璐

【摘要】出版企业作为文化的重要阵地,如何抓住国家文化数字化战略机遇,实现更高质量的转型发展,是其面临的重要课题。基于时代出版文化数据体系建设基础和文化数据体系建设框架分析,提出依托资源库开展数据解构推进文化数据资产化,依托资源库进行数据重构推进文化数据产品化,依托多平台场景应用推进文化数据商品化等具体实施路径,以及重视数字化要素建设,探索多元消费新场景,接入国家文化专网等文化数据体系建设发展方向。

【关  键  词】文化数据体系;出版企业;数据资产;数字出版

【作者单位】卫敏,时代出版传媒股份有限公司;马嵩,时代出版传媒股份有限公司;崔璐,时代出版传媒股份有限公司。

【中图分类号】G239.2【文献标识码】A【DOI】10.16491/j.cnki.cn45-1216/g2.2024.06.009

随着互联网和移动互联网的普及,数字技术为文化产业发展带来了重大机遇。与此同时,如何使科技与文化高质量融合,满足人民群众日益增长的精神文化需要,成为文化产业迫切需要解决的问题。在此背景下,中共中央办公厅、国务院办公厅印发了《关于推进实施国家文化数字化战略的意见》(以下简称“文化数字化战略”),从政策层面给出解决之道。时代出版传媒股份有限公司(以下简称“时代出版”)依据自身特色优势开展探索,着力构建集团架构下的文化数据体系,将已有的数字出版基础转化为数据资产优势,力图形成具有地方出版集团特色的深度融合发展之道。

一、时代出版文化数据体系建设基础

时代出版是安徽省重要的文化生产企业,也是安徽省文化产业的重要支柱企业之一。近年来,在数字化浪潮的推动下,时代出版坚持传统出版和新兴出版融合发展战略,围绕数字教育、数字出版探索科技与文化深度融合发展之路,成为安徽文化企业数字化发展的排头兵。

1.数字内容生产基础

一是纸质图书数字化。时代出版旗下9家出版社中8家以传统纸质出版为主,积累了大量的图书资源。各家出版社针对本社数字化需要开展各项数字化业务,对已有资源进行登记归档、加工整理、保管存储及数据分析,如安徽科学技术出版社的手写体图像文献处理与新安医学文献数字化。目前,时代出版已编辑加工数字化图书约1.6万种,通过集团版权资源管理系统打通各家出版社,将各社的数字资源进行统一管理,在时代出版内部形成统一的书刊数字化管理标准。

二是音像资源数字化。除了纸质出版,时代出版旗下的时代新媒体出版社还将社内以往的录像带、光盘等音视频资源转化为数字资源,构建时代出版版权资源管理系统子库,对视频、音频、图片等多媒体资源进行统一管理,目前已上传图片5872张、音视频资源近3000部。

2.融合产品运营基础

一是打造数字教育新模式。时代出版下属单位安徽时代漫游文化传媒公司围绕新媒体及幼儿教育产业,依托国家新闻出版署融合发展(时代出版)重点实验室与高校进行学前教育融合出版的研究合作,研发出国内首套基于触控感应与智能交互技术、具有完全自主知识产权的学前教育多媒体电子互动课程,并配套幼儿互动阅读电子书、动漫图书、幼儿家庭亲子包等产品,发展了全国代理商近200家,覆盖全国102个城市的5000多家教育机构。其中,电子书入驻苹果商城,全球下载130万次,被国家汉办采购为孔子学院数字教材。课程全版权输出阿拉伯语和蒙语地区,时代出版也因此成为安徽省唯一一个产品覆盖全国,并走向世界的学前教育教材研发单位。

二是铺设移动应用全媒体矩阵渠道。不仅时代出版通过APP、微信群、微信公众号、小程序、短视频直播等渠道全面推广各家出版社亮点产品,各家出版社也自运营微信公众号,如“纸上行舟”“时代育才帮”“时代e学”等,累计拥有社群用户近500万,并实现了微信公众号内容销售联动。如面向中老年群体的APP与小程序“乐龄听书”,打造了中医养生、隔代抚育、曲艺小说等精品专栏,以满足和解决中老年人精神文化需求,力图构建中老年人线上消费“生态圈”。

3.创新体系建设基础

一是建立“1+3+5”创新发展体系,推进文化精品内容与科技融合创新。“1”指国家文化和科技融合示范基地,“3”指3个重点实验室,即国家新闻出版署出版融合发展(时代出版)重点实验室、国家出版业科技与标准重点实验室、教育资源动态数字出版安徽省重点实验室,“5”指时代出版培育出的5个国家级高新技术企业。

时代出版充分发挥在融合出版方面的平台优势,大力加强数字化项目建设,推出一系列精品项目。其中,“皮影中国AR绘本”“豚宝宝学前艺术数字课程”“乐龄听书”等3个项目入选数字出版精品遴选计划,累计入选数量位居全国地方出版集团前列。

二、时代出版文化数据体系建设框架

文化数字化战略明确提出,到2035年建成物理分布、逻辑关联、快速链接、高效搜索、全面共享、重点集成的国家文化大数据体系[1]。中宣部文改办原副主任、一级巡视员高书生认为,国家文化大数据体系可概括为“两侧四端”:两侧即供给侧和需求侧,四端分别为资源端、生产端、消费端和云端[2]。时代出版作为文化内容出版企业,具备生产端属性。

随着出版深度融合发展政策的颁布,时代出版旗下9家出版单位各自围繞自身的业务特色打造融合产品,如黄山书社的“安徽基本古籍库”、安徽教育出版社的“时代教育在线”等。在文化大数据体系和国家文化数字化战略的指导下,时代出版制定了企业的文化数据体系建设规划,力图打破各社间的数据孤岛,实现资源互联互通。具体包括资源层、资产层、产品层和场景层,如图1所示。

1.数字资源层

书刊版权资源是出版社的核心资产,书刊版权数量庞大、种类繁多,涉及的权利主体和权利关系复杂,如何对海量的版权信息进行有效管理是出版社面临的现实问题。资源层主要是将各出版社图书期刊的数字化资源,以及电子音像出版、网络出版的音视频资源进行集中规范管理。首先是对于传统的纸质文献、实物收藏进行数字化,实现数据的获取、存储和使用;其次是制定统一的书刊数据标准和分类体系,使不同类型的文化资源能够有效管理;最后是推动各社之间的资源共享,实现文化资料跨机构流通,避免重复建设。

2.数据资产层

数字资源通常以单本图书、期刊为单位,属于非结构化的资源,存在粒度大、难以复用的问题。数据资产层主要是对数字资源进行解构,按照统一的标准进行数据标注和关联,实现对图书期刊资源的细粒度分割。为整合各家出版社的版权资源,时代出版建设了版权资源管理系统总库和子库,对各家出版社的图书基本信息、版权信息、图片及资源文件进行OCR识别、元数据标引与检索、结构化加工、格式转换及分布式存储等,形成统一的数字管理标准。

除图书资源转化的数据资产外,读者对图书的使用行为亦可以形成数据资产。时代出版采用“现代纸书”的运作模式,通过图书二维码收集读者大数据信息,利用大数据平台对采集的数据信息进行再度解构,形成关于用户偏好的数据资产,服务于各出版社的出版系统、作者系统、运营系统和编辑系统。

3.数字产品层

数字产品是通过对数字资源进行加工、整合和创造,形成有实际应用和商业价值的产品。各出版社的数字产品以知识服务为主要目标,对特定领域的数字资源进行系统化、结构化、知识化加工,以提供更便捷、灵活、互动和个性化的用户体验。目前,时代出版数字产品主要包括数据库、平台、APP和小程序等类型。

4.消费场景层

文化生产机构生产文化产品、提供文化服务,是以满足人民群众的精神文化需求为最终目的。文化消费新场景作为满足其精神文化需求的重要载体,是传统文化生产机构转型升级、提升文化产业质量效益和核心竞争力的重要一步[3]。出版机构需要转变传统文化业态,打造以全息呈现、数字孪生、多语言交互、高逼真等数字技术为支撑,文化与科技深度融合的沉浸式、互动性、智能化、虚拟化文化消费新场景。

三、时代出版文化数据体系实施路径

为了更好地推进出版机构融入国家文化大数据体系,时代出版目前迫切需要解决的是建立健全基于数据关联应用的生产端,建设集团框架下的文化资源数据体系。

1.依托资源库开展数据解构,推进文化数据资产化

时代出版于2021年投资建设了集团版权资源库系统,依托所属各家出版社版权资源,聚集整理全部皖版图书资源,建设内容资源库,打造皖版图书版权集中管理平台。该系统为安徽省出版机构提供包括版权及其内容资源(纸质书、电子书、音视频多媒体、文件文档、图片、素材等)的采集、加工、存储、应用与发布等数字化转换与运营功能。一期工程已完成对时代出版各家出版社2018年以来的数字资源采集整理,近期启动的二期工程将对2018年以前的历年图书期刊开展采集整理工作。

一是对出版物版权信息数据进行标注,以实现对各家出版机构传统出版物、数字出版产品的基本信息、版权信息、标签信息、分类信息进行自动采集与管理、并对采集的数据进行统计分析。在此基础上,时代出版牵头制定了《书刊数字化资源管理规范》地方标准,包括书刊数字化资源管理规范的术语和定义、资源加工规范、信息管理规范、运营信息管理规范、安全性管理规范等内容。各出版社在对各类资源基础元数据、辅文信息、分类体系、标签体系、版权信息、合同信息等进行管理时,均需遵循集团的顶层设计,按照集团标准规范来完成。为保留各自的出版特色,各出版社可基于集团标准进行扩展,以满足差异化的存储、管理需要。同时,各出版社可基于自身资源进行资源统计、批量导入导出、ERP系统对接、资源关联等日常管理,提高资源管理效率与管理水平,完成对有保存或再开发价值书刊的采集入库、归档管理,为进一步的立体化开发、商业化利用打下基础。

二是对出版物内容资源数据进行解构。针对图书内容非结构化、粒度大、复用难的问题,时代出版依托版权资源库对专业图书、教辅图书开展细粒度的结构化、知识化标引工作。如:针对古籍类图书,通过应用OCR扫描、图像处理、版面分析及内容自动抽取等古籍图书数字化、结构化、知识化技术,对安徽基本古籍丛书、新安医学古籍丛书、诗词古谱等古籍图书资源进行数字化处理,累计入库超6000万字;针对教辅图书,构建中小学主要学科的知识图谱,覆盖教材体系和教学体系,并对教辅图书中的试题进行细粒度拆分,与教研人员共同标引试题的题型、题干、答题区域、答案类型、答案内容、解题过程、考点、难度等构成要素。此外,对教育出版积累的微课、课件、试卷等多媒体资源也做了拆分,通过知识点与教材体系和试题做了关联处理,实现了试题内容与讲解内容的深度关联。

2.依托资源库进行数据重构,推进文化数据产品化

时代出版依托版权资源库系统的数字内容资源,打造了一系列数字文化产品,使用户在数字化图像、文字、视频、声音、音乐等多语言符号的融合下,体验数字文化语境[4]。

一是重构专业出版数据形成知识服务产品。如:对黄山书社出版的“安徽古籍丛书”等安徽地方文献典籍进行数字化加工,一期项目累计加工字数超4000万,构建了安徽基本古籍库网络平台,读者可在平台上实现在线阅读(横版、竖版、原文及对照4种阅读模式)、全文检索、在线笔记、纪年换算等功能;依托安徽科学技术出版社近20年收集整理的大量流传下来的上千卷新安古籍资料,运用古籍数字化加工技术生成新安医学数据库产品,并在此基础上构建了新安医学上万条知识图谱和主题詞表,对新安医学库中的中医理论、诊法、医案、方剂等进行知识标引,实现了全文检索、智能推荐、辅助决策等功能;基于上海音乐学院收集整理的自上古到明清以来的1000多首古谱诗词、古谱、译谱、慕课等内容资源,将宫调谱、工尺谱等古代记谱法转化成为现代音乐谱法,让原本淹没在古籍中的珍贵音乐文化遗产恢复其听觉形态,形成了一个集图、文、声、像一体的古谱诗词赏析与传承数据库产品。

二是重构教育数据形成教育服务产品。在教育服务领域,时代出版基于国家科技部原科技支撑计划项目研究成果研发了智慧教辅系统,实现了对学生个性化学习的动态出版。该系统面向中小学建立了由上万个知识点构成的教学知识图谱体系,可对学生的答题情况进行统计分析,采用自适应测试与诊断分析技术智能分析学生学习过程中的不足,在已标引知识点的多媒体资源库中搜索最优的资源进行推送,从而为学生提供优质的诊断与提升服务。

3.依托多平台场景应用,推进文化数据商品化

一是通过大屏小屏互动,促进网络消费服务全民阅读。时代出版于2022年启动的“时代云书房”数字阅读项目,涵盖时代出版精品书刊的电子书、听书资源和视频资源,是一个集阅读与消费的数字阅读平台。该项目包括网页平台、APP和小程序,实现了PC端大屏与移动端小屏的互动,通过创设线上消费平台,使用户可以在任一场景下实现即时消费,满足用户不同的消费习惯。“时代云书房”还与安徽全民阅读网互联互通,结合安徽省的“书香安徽”系列活动,为全民健康阅读营造良好环境,以此激发用户的阅读热情。此外,时代新媒体出版社还开发了安徽省15分钟阅读圈城市阅读空间管理平台,对安徽省的城市阅读空间进行数字化升级改造,呈现安徽省内各地阅读空间的数量、占地面积、藏书量、活动量等相关信息,为未来在全省推广数字阅读项目及在线在场结合的消费场景打下基础。

二是线上线下一体,促进个性化消费,服务智慧教育。时代出版作为安徽省基础教育资源应用平台的参建单位,通过智慧校园建设助力安徽省教育资源的均衡发展,依托移动互联技术推动教育“精准扶智”。在安徽省委宣传部“送文化、种文化”号召下,时代出版先后给金寨、灵璧两县捐赠了“时代e博·智慧课堂”教学软硬件产品,通过教育信息化的推进将文化惠民落到实处。目前,该平台已经为安徽省近300所中小学校开展应用示范,未来可为全省1.5万余所学校、25万个班级、40万名教师提供教育资源应用服务。

2021年“双减”政策出台后,时代出版积极响应,第一时间开发了“课优服”课后服务综合应用平台和APP,上线各出版社和培训机构的精品课程,以“平台+内容+管理”的服务模式积极为各级地方教育部门提供优质课程入校服务,为学校提供德智体美劳等素质教育课程及研学、劳动、心理健康等大教育服务,以满足学校与学生的个性化需求,实现了线上、线下一体化消费。目前,该平台已整合教案、课件、视频等数字资源超17万个,累计在51个县区6000余所学校开设课程超19万门次,参课学生人次超630 万。时代出版通过积极探索聚焦课程、服务标准化建设,形成全国素质教育资源出版服务新样板,即“政府主导+学校主体+社会参与”的立体模式。

四、时代出版文化数据体系未来发展规划

1.解构与关联:重视数字化要素

作为生产端的文化企业,其发展的核心是内容,为此出版企业的数字化转型必须重视文化资源数字化。时代出版将继续做好数字化转化工作,将文化资源图片、音频、视频、文字数据的采集、加工、挖掘與数据服务纳入日常性工作;充分利用时代出版建设的创新平台,即“1+3+5”创新发展体系,加强关键数据技术的研发;将凝结出版工作者智慧和知识的数据关联,以集团版权资源管理系统为基础,将各社的资源形成内部关联链,构建出版的文化数据资产。

2.重构与呈现:探索多元消费新场景

文化数字化战略中提出发展数字化文化消费新场景,发展线上线下一体化、在线在场相结合的数字化文化新体验[1]。场景是消费者接触文化资源的时空情景,具有较强的体验性。场景的构建要求出版企业主动发掘文化资源价值,吸引消费者进行数字化文化体验,从而引导消费者产生文化消费。为此,一要鼓励各出版社采用融媒体技术,围绕特定主题打造集音频、视频、游戏、图片、文字的融媒体产品,实现“大屏”“小屏”跨屏互动,通过趣味性、体验感实现不同场景的消费;二要利用时代出版多年在教育领域积累的优势积极与学校合作,以数字阅读、精品课的形式通过图书馆、城市阅读空间、课堂等搭建新的消费场景。

3.集成与交易:接入国家文化专网

国家文化专网是国家文化大数据体系的基础设施,时代出版将通过积极接入国家文化专网融入国家文化大数据体系,并在现有文化数据体系的基础上按照国家文化大数据标准体系的相关规定上传文化数据,实现底层数据关联,并通过国家文化专网对文化数据进行加工、生产、交易等,以此打造专业化数字文化生产线。

文化数字化战略是实施文化产业数字化发展的决策部署,也是加快文化强国建设的重大举措。传统文化企业应借助国家政策的东风,积极探索数字化转型的新途径,以满足人民群众日益增长的精神文化需要为目标;开发多元数字产品,构建消费新场景,实现社会效益与经济效益双丰收。

|参考文献|

[1]中共中央办公厅 国务院办公厅印发《关于推进实施国家文化数字化战略的意见》[EB/OL]. (2022-

05-22)[2024-03-20]. http://www.xinhuanet.com/politics/2022-05/22/c_1128674022.htm.

[2]高书生. 国家文化数字化战略怎样落地落实[M]. 北京:人民出版社,2023.

[3]齐骥,陈思. 数字化文化消费新场景的背景、特征、功能与发展方向[J]. 福建论坛(人文社会科学版),2022(12):35-43.

[4]彭祝斌,江哲丰. 数字文化产品体验中的“意识”问题及其导向策略:基于“数字体认”的行为逻辑[J]. 东岳论从,2023(6):117-125.

猜你喜欢
出版社数字化数字
内卷
家纺业亟待数字化赋能
我等待……
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
答数字
今日華人出版社有限公司
数字化制胜
数字看G20
石油工业出版社