ECIP计划与中文图书自动编目

2011-03-18 13:50:28
图书馆研究与工作 2011年4期
关键词:电子文本编目书目

张 燕

(浙江图书馆,浙江 杭州 310007)

1993年图书在版编目(即CIP)在我国正式实施,近二十年来,其各项工作取得了很大的进步,读者、图书馆、出版社以及信息产业相关行业都从中受益良多。但是,纵观我国CIP的发展,CIP在数据质量、管理、宣传、数据传输上还存有很多问题,与美国等发达国家相比,还有较大的差距。因此,对现有CIP实行改革已经是势在必行。自2000年以来,国内图书馆界的很多资深专家,深入分析了我国中文图书在版编目和图书馆界联合编目的现状、取得的成绩和存在的问题,结合《图书书名页》和《图书在版编目数据》两项国家标准的修订,吸收各方面对数字文献处理的研究结果,提出了在我国推进ECIP计划的构想,进而对中文图书馆“自动编目”的实现,进行了一系列研究与模拟操作,取得了比较可行的方法。所谓ECIP(E-lectronic Cata1oging in Publication)计划,其内容即是利用印前电子文本加注结构标签的方法进行“自动编目”。ECIP自动编目系统的设计思想是对图书的印前电子文本用XML语言描述的DC元数据在电子文本上加注结构标签,使线性文件转换为数据库文件,从而达到一次录入生成两种产品(图书馆机读目录、图书)的目的。

1 ECIP的技术原理

1.1 利用“一次录入,两种产品”的原理

图书编目实际上是将图书扉页(书名页正面)、版本记录页(书名页背面)等处的有关数据元素,按一定著录规则进行描述,形成书目记录。ECIP则是用数据库方式把有关数据元素录入相应字段、子字段,通过计算机编目软件进行处理,同时产生目录卡片和机读目录两种产品。

1.2 对线性文件进行结构化处理

自动编目的实现,是利用中文图书印刷版的印前电子文本,从中直接提取书目记录所需要的描述性数据元素,在图书出版过程中自动产生该书的书目记录。但印前电子文本是线性文件,要使之成为数据库文件,需要对其进行结构化处理。有两种做法:一种是以数据库方式录入,定稿后转换为线性方式,以产生计算机排版文件;一种是以线性方式录入,对有关数据元素加注结构标签,定稿后按其结构标签转换为数据库文件。

1.3 属性数据元素在图书物理结构之中

图书馆的书目记录与C1P数据都包含著录数据与检索数据两部分内容。其中著录数据取自文献本身,即书目记录的著录数据存在于该书的印前电子文本之中。通过剖析印刷版图书的物理结构,可确定书目记录所需要的数据元素。书目记录与CIP数据主要取开端部分的内容,有时涉及结尾与外表部分。我国国家标准《图书书名页》规定了扉页、版本记录页与附书名页有关事项,《中文普通图书著录条例》规定以扉页和版本记录页为主要信息源,确定这些部分的数据元素并对其进行结构化处理,是实现自动编目的基础。

2 实施ECIP的重要性

2.1 可全面提高书目数据的质量

首先从CIP数据本身来说,目前是根据出版单位的数据进行核定,出版单位未报的缺项,则无法判断。如现有的CIP数据没有并列书名,原因是出版单位未报,CIP中心无法增补。著录、分类、主题标引,皆因可参考的材料很少,不能保证质量。实现ECIP以后,除必要的书目数据外,还有目次页、出版说明、内容简介、作者简介等内容,书目质量将大大提高。

2.2 可以实现“自动编目”

目前虽然有很多图书馆实行了联机联合编目,但还没有从中文图书制作的源头进行“自动编目”。由图书的电子文本自动产生新书预报与正式书目数据以后,全社会都可以享用这一成果,发行界和图书馆界都不用另行编目,将节省大量人力物力财力。ECIP问世将会对编目界产生革命性影响。

2.3 为制定EBOOK标准奠定基础

ECIP的实现,涉及一系列标准与规范的执行,将有力推进出版行业标准化的进程。目前出版界执行《图书书名页》国家标准很不规范,项目也不一致,有的把翻译书的原著书名印在扉页上和并列书名混淆。这种情况不仅给编目工作带来困难,对图书电子文本的利用也很不方便。《图书书名页》标准的认真执行,可为制定EBOOK的标准奠定基础。ECIP的实现,对统一机读目录格式有极大的影响,对于出版物元数据的研究工作也将产生积极作用,促进EBOOK的属性数据元素与书目记录的属性元素趋向一致,为大量开发与利用中文数字化信息资源创造了条件。

2.4 推动出版数字化进程

ECIP的全面实现即图书出版的全过程,从选题、审稿、录入排版、印刷、发行都将有所反映,也就产生了一个完善的书目信息数据库,从而形成出版数字化系统的完整解决方案。包含出版物自身数字化、出版管理数字化、出版商务数字化。还可在每一环节上实施底账核查,打击盗版侵权的非法行为。

2.5 促进数字图书馆的建设

ECIP的软件技术,不仅实现了中文图书的“自动编目”,而且推动了EBOOK的“自动制作”即在出版中文图书印刷版的同时,“自动制作”其电子版。这对于中文数字信息资源建设具有难以估算的价值,会大大加快我国数字图书馆建设的进程。

3 实施ECIP计划,实现“自动编目”

ECIP是在出版过程中,利用排版印刷的电子文本产生书目数据。只有实施ECIP计划,才是真正意义上的“自动编目”。我国的计算机编目经过了十多年的实践,已经有了一支专业队伍,积累了宝贵经验,在机读格式、著录规则、规范文件、分类与主题工具等方面正逐渐形成统一的文本,联机编目网络已开始运作,这是实现中文图书“自动编目”的最基本条件。我国目前的CIP数据没有解决出版发行部门与图书馆界重复编目的现象,在书目的标准化、规范化方面也存在缺陷。因此,ECIP是我国CIP发展的必由之路。我国目前已开始进行有关的研究与实验。而美国国会图书馆从1995年就开始实施ECIP计划。根据其最新的计划,截至2007年1月,传统的纸质CIP项目将不再是国会CIP标准的数据获取方式,取而代之的将是ECIP项目。纸质的申请单只适用于以下几种文献:非英语语言的图书(当代西方欧洲语言除外)、题名页任何位置出现读音符号的图书(当代西方欧洲语言除外)。内容主要包含图像、表格、图表或者数学、化学公式的图书(儿童读物除外)。

4 结语

ECIP是图书在版编目自动化、网络化建设的战略性目标和手段。ECIP的实现,不仅可以实现完整意义上的“自动编目”,而且可促使出版业、发行商与图书馆采用共同的元数据格式与统一的数字化书目产品。图书期刊在出版过程就可以产生格式标准、著录规范、内容丰富、价格低廉的书目记录,从而可有效地避免社会性的重复劳动。根据美国的实施经验,ECIP项目将能够极大地丰富CIP的数据项目,扩充提交内容,有利于提高CIP的准确性和完整性。但是,ECIP的发展在我国仍然处于理论探讨和个别实践阶段,没有能够推广开来。美国的ECIP非常成功,很大程度上得益于其图书情报以及出版界的标准化与规范化。因此,必须制订实施ECIP的周密计划,在相关管理部门与出版机构两个层面,调整现有的处理流程与操作方法,让所有出版信息的处理都在同一平台上实现,真正实现中文图书自动编目。

〔1〕陈源蒸.中文图书自动编目的实现〔J〕.中国图书馆学报,2005(1):2-8

〔2〕陈源蒸.中文图书ECIP与自动编目手册〔M〕.北京:北京图书馆出版社,2003:1-20

〔3〕张丽娟.CNMARC存在的问题与ECIP计划的实施〔J〕.中国图书馆学报,2004(4):67-69

〔4〕张耀蕾.中美在版编目的比较研究〔J〕.图书馆学研究,2008(5):47-51

〔5〕杨兰芝,田昊,曾照云.CIP存在的问题与ECIP计划的实施〔J〕.现代情报,2007(6):149-151

猜你喜欢
电子文本编目书目
推荐书目《初春之城》
都市人(2022年3期)2022-04-27 00:44:57
国家图书馆藏四种古籍编目志疑
天一阁文丛(2020年0期)2020-11-05 08:28:36
粤剧编目整理之回顾与展望
戏曲研究(2017年3期)2018-01-23 02:51:01
基于现代信息技术的教学模式创新探索研究
继续教育(2016年11期)2016-11-24 20:11:38
从编辑视角看协同编辑
出版广角(2016年3期)2016-04-21 22:12:55
图书馆编目业务外包发展探讨
河南科技(2014年22期)2014-02-27 14:18:37
电子文本的阅读过程与心理表征的构建
本刊邮购书目
研究生英语电子文本阅读态度调查研究
研究生英语电子文本阅读态度调查研究