历史出版资源数字出版应用研究

2009-10-24 05:49
科技与出版 2009年10期
关键词:数字出版整合数据库

张 军

摘 要 以商务印书馆历史出版资源——《东方杂志》的数字出版实践为例,分析了变历史出版资源 为数字出版产品的整个过程,包括设计、开发、实施等,探索历史出版资源的数字出版及应 用,寻找历史出版资源开发利用的成功模式。

关键词 数字出版; 整合; 历史出版资源; 数据库; 按需印刷

历史资源的数字化是值得出版界思考的一个重要课题。如何将那些具有历史价值、学术价值 和艺术价值的历史出版资源综合开发利用,为学者、研究人员和专业人士提供原版数据信息 和更加便捷多样的服务,是当今出版人需要重视的┪侍狻

在今年第三届中国数字出版博览会上,商务印书馆推出了《东方杂志》数字出版产品,得到 与会专家、学者的一致好评。该产品利用数字出版技术,将历史出版资源以新的载体形式、 新的内容展现方式呈现给广大读者,为历史出版资源的数字出版应用提供了可供借鉴的成功 案例。

1. 项目背景

《东方杂志》是商务印书馆出版的十大杂志之一。它创刊于1904年(清光绪三十年)3月11 日,至1948年12月终刊,刊龄长达45年,先后在上海、长沙、香港、重庆等地出版,是中国 近现代期刊史上影响最大、刊龄最长的综合性杂志,历经清末、辛亥革命、五四运动、抗日 战争、解放战争等各个重大历史时期,紧跟时代脉搏,忠实地记录了我国近现 代发展的历史轨迹,被称为“中国近现代史的资料库”“杂志界的重镇”“杂志的杂志”。

为了更好地实现《东方杂志》的学术价值和历史价值,突破传统纸质期刊的限制,探索历史 资源的数字化体系,商务印书馆决定建设《东方杂志》数据库,提供原版数据信息,实现目 录的检索,并进一步实现全文的检索,同时提供原版《东方杂志》的个性化定制及按需印刷 业务,建立一个学术交流门户网站。

2. 建设目标

《东方杂志》数据库由商务印书馆旗下的北京商易华信息技术有限公司推出,是历史出版资 源 数字化的代表性产品,也是“商务百年出版资源数字化工程”的里程碑。该数据库遵循风格 学术性、内容权威性、国际适用性、数据安全性的原则,建立知名的《东方杂志》数据库检 索 平台,以多种角度呈现《东方杂志》的内容;建立功能强大的电子商务平台,实现《东方杂 志》数据库产品的在线销售;建立《东方杂志》按需印刷的生产及销售平台,实现《东方杂 志》按需印刷产品的在线销售;建立历史资源的数字化体系,为商务印书馆实现出版资源数 字化进行有益的探索。

3. 设计开发过程

(1)项目论证

《东方杂志》项目于2008年1月正式启动。首先开展的是项目论证,包括两大部分:第一部 分是对《东方杂志》内容的分析,包括单本杂志分析,文章元数据分析、图片元数据分析、 广告元数据分析,人物元数据分析、栏目/专辑分析、事件分析等;第二部分是对《东方杂志 》数字出版产品的分析,包括产品类型、产品表现形式、产品定价、产品结算方式等。最终 ,确定了按需印刷和以网站形式呈现的数据库这两类产品形式。ね1 《东方杂志》数字出版项目系统结构图

(2)数字化加工

《东方杂志》数字化不是简单地将历史出版资源转变为图像或文本等电子文件,它实质上是 对《东方杂志》内容的打散、整理、加工、重组等,使历史出版资源从一种载体转换成多种 载体。在这一过程中,内容是核心,技术是手段。

在深入分析原书之后,我们根据杂志的构成和特点,确定了加工对象和展示方式,进而进行 数字化,深度加工。其中,最重要的是图片资源的开发。《东方杂志》自创刊起,即辟有图 画 类栏目,选登19世纪上半叶的珍贵图片文献,“关于时事、人物、风景、美术、各地特殊风 俗以及其他富有趣味之照片图件”,多姿多彩。对于这些图片,我们专门作了处理:将图画 拆分、切割开来,形成专门的图画数据库;将图题、图注等几十个属性项全部数字化,供用 户检索;既可以用电子书形式做成画册来进行展示,也可以结合按需印刷业务进行深度选题 开发。

在对《东方杂志》数字出版产品的数据加工过程中,遵循着“一次制作,多重利用”的原则 ,即,经过加工的资源应适应多种不同的用途。例如图像在经过加工以后至少要以三种形式 存在:第一种是用于长久保存的原始存档形式;第二种是用于通过网络对公众提供的图像, 其特点是低分辨率,易于传输和下载;第三种是用于按需印刷的图像,它对分辨率要求较高 ,其中封面图片的分辨率不得低于300?dpi,文章图片不得低于600?dpi。另外,为了保证 数据的安全性,《东方杂志》数字资源采用了水印技术,进行了有效的知识产权保护。

(3)管理与维护

《东方杂志》历史出版资源数字出版平台由7部分组成,分别是网站管理系统、数据加工系 统、信息发布系统、信息检索系统、电子商务系统、产品管理系统、客户管理系统。它可以 实现相关知识采集、加工、处理、存储、组织和展示的全方位管理与维护。

4. 建设成果

目前,《东方杂志》数据库初步形成数字出版产品,实现了目录检索,用户可对819期杂志 、约30?000篇文章、12?000多幅图画等,按照标题、作者、关键词、摘要等进行检索、浏 览、打印。数据库内唯一标志符共分为六大类:杂志唯一标志符、目录唯一标志符、栏目唯 一标志符、文章唯一标志符、图片唯一标志符、广告唯一标志符。形成年卷库、特刊库、文 章库、图片库、广告库、封页库、栏目库、事件库、人物库等多个产品。用户可依据自身需 求,自定义选择购买使用。

在实现历史出版资源在线检索的同时,《东方杂志》数据库还向海内外图书馆等机构以及个 人提供原版《东方杂志》的按需印刷服务,依据用户的个性化需求,印制其所需的内容,实 现数据库产品与按需印刷服务的捆绑销售。通过按需印刷,网络成为集供求信息、出版、印 制、运输、销售终端于一体的名副其实的发行“中盘”,真正实现数字出版产品线上、线下 的结合,实现跨介质的数字复合出版运作模式。

5. 实施过程中的关键点

(1) 明确需求与目标

在内容开发方面,应有一个明确的定位。应把那些重量级、具有代表性、学术和历史价值较 高、市场需求迫切的资源作为重点,进行深度开发;在数字出版形态方面,尝试新媒体出版 ,并将数据库、手机出版、按需印刷作为重点。

(2) 统一元数据标准

结合国内外通用标准,针对特定历史出版资源数字化的特点,确定元数据标准。通过对历史 出版资源元数据的收集、整理、加工、规范化等相关流程,并应用各种计算机技术,结合历 史出版资源的数字化体系结构,开发标准元数据库、索引库、关键词库、对象数据库与元数 据库和外部数据库接口,从而最终完成历史出版资源数据库的┐罱ā

(3) 一次制作,多重利用

历史出版资源数字化是数字出版的前提。在元数据标引过程中,不用对现有资源进行格式改 造,只需加以外部属性的描述。这将为全部历史出版资源的调用、格式转换和再度开发创造 统一的数据环境,体现了信息资源深度开发、整合传播、增值利用的理念。

结语

历史出版资源数字出版的目标是形成数字出版产品。归根结底,数字出版产品要满足用户个 性化的、多样化的需求,为其提供按需定制的信息服务。因此,数字出版产品的精准定位非 常重要。在现阶段数字出版环境下,“做出产品、做出效果”是数字出版人务实的选择。只 有把握动态、满足需求、获得效益才是当下最重要的。

猜你喜欢
数字出版整合数据库
数据库
学术期刊数字出版的运行模式与市场结构
浅谈新媒体在美术类图书出版中的应用
做一个全民阅读时代的“悦”读人
国际图书出版市场现状及趋势分析
记初中英语词汇教学的一次归类、整合改革及反思
音乐与科学有效整合的研究
幼儿教育中美术与科学整合的研究
“1+1”微群阅读
数据库