传统出版企业数字化转型升级现状及对策

2015-05-30 10:48李自满
出版广角 2015年5期
关键词:标引资源库出版社

李自满

对传统出版社来说,数字化转型升级建设是落实传统出版社进行产业升级和业务转型的综合性平台,同时亦是支持出版业务向新兴媒体的创新。新技术驱动着出版产业的转型和发展,在新的历史时期,为了顺应时代发展潮流和出版个性化需求,要努力提升传统出版单位的整体实力。

随着互联网、云计算、智能终端等数据传输、存储、呈现方面的技术不断发展演进,以传统纸质载体为主的各种图书、报刊出版物,以及以磁带、光盘等为载体的音像出版物开始逐渐被各种数字化内容所取代。这些数字化技术、通信技术和计算机技术的不断发展,极大地推动了新闻出版行业的信息化进程。同时,对传统新闻出版业造成了猛烈冲击,促使新闻出版行业由传统的出版行业向数字出版转型。

2013年,由中宣部、财政部、国家新闻出版广电总局共同发起推动部分中央文化企业数字化转型升级,中国商务出版社是首批试点单位之一。此次中央文化企业数字化转型升级项目建设的是支撑传统出版社进行产业升级和业务转型的综合性平台,需要支持现有出版业务的发展,同时更要支持出版业务向新兴媒体的创新。本文就中国商务出版社数字化转型升级现状及对策做个分析。

一、数字化转型升级内容

中国商务出版社(以下简称“我社”)数字化转型升级项目分为传统出版业务流程改造和内容资源关联、复合应用出版两大块。传统出版业务流程改造包括数字化加工、内容资源管理、编辑加工、产品发布四个方面。内容资源关联、复合应用出版包括关联标识符编码嵌入软件和复合出版物生产和投送两个方面。经过一年多的努力,我社完成了全部产品的安装部署及订制部分的开发工作,并上线试运行。

数字化转型包含加工标引、采编生产、资源管理及发布运营数字出版业务的四方面以及内容资源关联、复合应用出版业务。通过数字化转型升级建设,建立数字化转型升级的整体框架和数字化出版基础平台。通过加工标引系统标引,形成可以重复利用和动态重组的碎片化内容单元。编辑加工系统是内容生产环节,实现真正的全流程数字化生产过程。

二、数字化转型升级项目情况

1.数字化加工

数字化转型升级核心是实现传统图书出版资源的数字化加工、结构化标引,对存量资源数字化加工及新增资源同步数字化的技术工具,用以实现数字内容资源的汇聚与可控性。

在资源的加工标引环节,主要是对传统图书进行加工标引,包括历史存量资源和新生产的内容资源,针对部分软件需求,采用腾云数字化加工标引系统,包括以下四大块:

(1)纸书数字化加工工具。主要是对纸质图书进行扫描、识别、编改、目录制作等操作,完成从纸质书到电子书的加工过程。

(2)格式转换工具。对排版文件、稿件文件等各种不同格式的文档进行格式转换,转换成数字化阅读所需要的标准电子书。

(3)结构化加工标引工具。在电子书文件的基础上按图书的基本元数据和结构信息进行元数据标引和碎片化加工,形成以XML表示的内容资源。

(4)电子书编辑加工工具。主要是对电子书进行二次编辑和加工,包括EPUB、PDF以及XML文件等。

2.数字资源管理

数字资源管理是我社整个数字化转型升级的底层支撑系统,它将分散的数字资源进行收集整理及加工标引以后统一存储到数字化全媒体资源库中进行统一管理、挖掘和服务,其核心目标是为我社提供一个数据存储、管理、检索、加工、发布和服务的资源服务中心,以数据资源为中心对我社的各个业务系统提供数据支撑。

数字资源管理系统支持资源入库、资源分类、资源标引、资源检索、内容审查、版权信息管理、版本管理等功能,支持对图书、图片、电子音像、多媒体等多种资源的管理,支持对知识条目资源的管理,支持对版权信息的管理,支持对线下市场宣传活动的管理,支持对资源的复用、导出、入库管理,支持内容审查等业务。

资源管理系统是转型升级最基础的平台,也是这次转型升级整个工程的基础设施。本系统的建设为社内各类人员提供一个资源检索、浏览、下载的通道,不仅提供了各种基础资源,还提供了各种专题库和特色资源库的检索查询。

3.数字化编辑加工

编辑加工系统是对内容生产业务进行全流程数字化编辑的系统,用以实现协同制作、多元发布。

对数字出版产品生产过程的全流程管理,为创作、投约稿、编辑、排版、审核、发布等各环节提供了协同工作环境。系统提供开放接口,支持与出版编务系统、ERP系统及其他数字出版业务系统的集成和衔接。

整个系统所有的业务应用都是以数字化内容产品的编辑生产为核心,从最开始的选题策划到内容的协同编辑、三审三校、发稿,然后将编辑XML内容保存到生产数据库中,再经过动态重组和协同编排生成多媒体电子书或者多元化数字产品发布到不同的终端上。

目前我社还是以传统出版为主,以稿件在线下流转的方式来完成稿件内容的编写、审校和出版。

4.产品发布运营

产品发布运营平台是在出版社运营资源库的基础上对各种内容产品和内容资源进行多形式、多终端的发布,为个人和机构用户提供个性化的数字阅读服务,同时可对数字资源进行有效的保护和营销管理,做到安全可控。整个系统所有的业务应用都是以数字资源和产品为中心,产品数据库就是利用系统建成的成品图书资源库、图片库、知识库等,进行一系列的管理和发布,上层业务系统都是与数据资源库进行数据交换,为用户提供电子书、数字报、数字期刊、特色资源库等数字资源产品。

5.内容资源关联、复合应用软件系统

关联标识符编码嵌入软件系统是对不同属性数字内容资源的关联关系进行标识的工具软件,用以实现出版资源的多属性汇聚,实现数字技术环境下出版产品形态的多样化,实现出版企业对新形态数字出版产品的可控性。复合出版物生产和投送系统是用以实现多种属性资源的关联管理、复合呈现,实现复合出版物的多形态生产,多渠道、多终端发布。试运行工作按合同要求对系统进行检验,同时检查系统的可靠性、安全性和整体性能,确保两包软件(出版业务流程改造和内容资源关联、复合应用出版)平稳运行及正常衔接,是项目总体竣工验收的前提条件。

三、数字出版发展趋势及其对策

1.数字化加工系统

数字出版平台本身是一个开放的平台,随着出版业的发展及读者阅读需求和习惯的改变不断地进行改进和完善,同时面对不同类型的出版单位需要更多个性化的需求和功能,针对众多出版社需要开发更加具体和专用的工具以及出版单位需要的全媒体数字化加工系统。

2.数字资源管理系统

随着数字出版和出版业转型升级的深入,数字资源管理系统不仅仅局限在现有各种资源的存储、管理和服务,它最终的目标是为出版社建设全媒体资源库,是出版社的全媒体数据中心。因此整个平台的建设是基于云平台框架和XML标准,是一个完全开放的全媒体资源中心,将融入当下流行和先进的新技术和新功能,具体表现如下:

(1)采用基于XML的可扩展资源模型。全媒体资源库涵盖了目前所能见到的所有资源类型,但是随着数字出版的发展,会不断地出版新的资源类型,为了满足对新资源类型的管理,系统需要建立可动态扩展的资源模型。因此,如何建立一种可扩展并且可缩放的数据模型,来表示全媒体的内容资源是本项目的难点和重点。根据目前的技术发展和各种资源的特点,拟采用基于XML的可扩展数据模型来表示资源并结合NXD数据库对其进行存储、管理和检索。

(2)构建跨媒体统一检索框架和模型。全媒体资源管理系统中存储和管理的是文本、图像、视频、文档等不同种类的跨媒体资源,为了实现对这些资源的统一内容检索,在统一内容特征表示模型的基础上建立跨媒体统一检索框架是本系统研究的核心。因此,本项目将着重研究跨媒体信息形态下有效的同构语义空间表征及构建方法,并基于此提出面向海量跨媒体数据在同构语义空间中的高效交叉索引方法,进而实现跨媒体的内容统一检索。

(3)跨媒体的语义挖掘和关联关系。在研究关联关系的统一表达机制基础上,需研究如何通过对深度加工和标引的出版资源结构化分析得到显性的关联,如何抽取底层内容特征、概念语义特征、时空语义特征,如何通过机器学习、语义分析、复杂网络的拓扑结构挖掘等方法自动构建隐形的间接关联。

(4)基于云平台的分布式资源管理和服务技术。随着数字复合出版的发展,出版单位会积累海量的全媒体内容资源,为了增加对这些海量资源的处理、管理和服务能力,高效地对这些数据进行管理、存储和备份,系统将采用云平台框架,实现分布式的数据存储、管理和服务,采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。

(5)多内核的全媒体数据库引擎技术。全媒体资源库中存储的资源种类繁多,包括文字、文档、图像、视频、音频、动画等资源,根据各种资源的特征和上层业务应用需求,全媒体资源库采用不同的存储和管理方式,以达到最优的管理和存储效率。针对资源库中结构化、半结构化和非结构化的全媒体数据资源的统一存储,采用多引擎储存、管理和索引框模式。

(6)非结构化数据存储。全媒体资源管理系统中涉及繁多的内容资源,其中大部分是非结构化数据,包括图书、期刊、报纸、工具书、新闻资讯、排版文件、资料文档、图片、视频等,都是非结构化的数据,存储在普通的结构化数据库里,会影响访问效率。这些非结构化数据需要专门的非结构化数据管理系统对其进行存储、处理和管理。我社长期以来从事非结构化数据的管理和挖掘研究,在这方面积累了大量的技术积累,并开发了自主知识产权的非结构化数据管理引擎,以此为基础按项目需要进行研发,会大大加快项目进度,并且能够保证项目的成功实施。

3.数字化编辑加工系统

数字化编辑加工系统是全新的内容生产平台,结合目前的发展现状体现出其独有的特点,主要有:

(1)全流程数字化。实现内容生产的全流程数字化,各用户角色在线完成工作,编辑、审校等人员全部在线上完成,稿件的流转审校都是数字化、结构化的内容。

(2)基于开放的XML标准。为适应数字内容的“一次制作,多元发布”,在内容生产过程中内容元数据基于开放的XML标准,系统采用国际通用的标准。

(3)语料库使用。在稿件内容的编辑过程中充分利用资源库和语料库,为作者和编辑提供语料资源支持,从而加快内容编辑的过程。

(4)高度集成。系统是基于组件的思路来建设,将涉及内容生产的各个子系统和工具进行全面的集成,是一体化的内容生产系统。

(5)支持多媒体采编。支持文本、表格、公式、图片、音频、视频、链接等各种元素的混合编辑,从而可以实现纸质图书、电子书、交互式多媒体电子书等不同形态的内容产品。

(6)在线的交互式排版。基于XML完成交互式内容排版,编辑人员直接在线实现可视化的内容编排,系统集成多种排版发布的模板,并与indesign等排版系统实现对接。

(7)知识标引。对定位于知识服务的专业出版社来说,知识标引是很关键的一个环节,需要按照专业知识体系对内容中的知识元、知识点等进行标引,这需要由行业专业来完成,而作者是最了解内容的专家,因此在生产过程中由作者完成知识标引和主题标引。

数字化编辑加工不仅仅是定位于图书内容的编辑生产,更多是各种数字化产品的编辑、加工和制作。

4.产品发布平台

对于出版社来说,需要根据自身资源的特色以及读者用户的个性化需求提供更有针对性的产品发布平台,为满足读者更加精确、细致的需求,产品发布运营需要进一步完善和升级。

四、结语

对传统出版社来说,数字化转型升级建设是落实传统出版社进行产业升级和业务转型的综合性平台,同时亦是支持出版业务向新兴媒体的创新。新技术驱动着出版产业的转型和发展,在新的历史时期,为了顺应时代发展潮流和出版个性化需求,要努力提升传统出版单位的整体实力。

[1]徐丽芳,刘锦宏,丛挺等.数字出版概论[M]. 北京:电子工业出版社,2013.

[2]罗梅,朱瑜.深度融合转型发展——2014年第八届出版发行春茗恳谈会在合肥召开[J]. 出版广角,2014(6).

[3]左键,孙辉.复合出版与传统出版数字化转型[J]. 中国出版,2010(8).

[4]陈洁.出版社内容资源管理平台[J].科技与出版,2009(1).

[5]张书卿.我国数字出版标准化现状及对策[J].出版发行研究,2008(11).

[6]张新新.数字出版业态中政府与市场的关系——以传统出版单位为视觉[J].出版广角,2014(6).

(作者单位:中国商务出版社)

猜你喜欢
标引资源库出版社
我等待……
贵州●石斛种质资源库
档案主题标引与分类标引的比较分析
本刊对来稿中关键词标引的要求
今日華人出版社有限公司
高中历史信息化教育资源库应用探索
福建基础教育教学资源库建设研究——以福建基础教育网资源库为例
本刊对来稿中关键词标引的要求
石油工业出版社
本刊对来稿中关键词标引的要求