德国目录格式变迁对CNMARC发展的启示

2018-02-07 00:57:07赵娜
数字图书馆论坛 2018年1期
关键词:数据格式编目书目

赵娜

(国家图书馆,北京 100081)

在德国的编目发展史上曾自成普鲁士编目体系,与英美编目体系分庭抗礼。但随着国际化编目思想的日益深入及《资源描述与检索》(Resource Description and Access,RDA)的出现,德国编目逐渐向国际一体化方向转变。在目录格式方面,为方便书目数据的国际化共享与交换以及更好地实施RDA编目,德国放弃使用本国的MAB(Maschinelles Austauschformat für Bibliotheken)格式而向MARC21(Machine-Readable Cataloging)格式转换。这种做法为我国中文编目工作提供了新的发展思路。在国内外全面实施RDA的趋势下,我国中文编目无论是在编目规则还是目录格式方面都面临很大挑战。本文以具有相似独特编目传统的德国目录格式为切入点,深入研究德国目录格式的发展历程,总结德国的发展思路,借鉴其经验与做法,对CNMARC的未来发展提出思考与建议。德国目录格式的发展历程主要经历了三个重要阶段,即卡片目录阶段、MAB机读目录格式阶段以及向MARC21格式转换阶段;此外,目前德国正在积极参与研发新的元数据格式和标准。

1 卡片目录的使用

20世纪初,德国开始使用卡片式目录。虽然卡片目录的原型始于美国[1],但由于德国和美国编目规则以及编目实践传统的不同,在卡片目录上呈现的内容也有所不同。为节省卡片空间,记录更多有效信息,德国的《普鲁士规则》制定了很多关于缩写和省略的规则,如在第7条中规定:“如果对于识别作品不重要,题名中的附加信息可以省略”“个人名称中的其他信息予以省略”“当有多个编者时,只著录前两个编者”“表示版本信息、尺寸和页码的修饰语要予以缩写”等[2]。此外,《普鲁士规则》对尺寸也有特别的规定,即“25厘米以下的书在著录时要用80表示,25—35厘米的用40表示,35—45厘米的用20表示,45厘米以上的用gr.20表示”[2]。图1是根据《普鲁士规则》编制的卡片目录样例[2]。

图 1 卡片目录样例

在上述实例中,著者“Bruno Garlepp”记录在卡片的第一行;第二行记录题名和责任信息“Unseres Bismarck Heimgang. Ein Trauertag All-Deutschlands. Mit einl.Gedicht von Felix Dahn. Text von Bruno Garlepp”;第三行按顺序记录出版地、出版者、出版时间、页码和尺寸。当有多个出版地时,仅记录第一个,其余的用“[usw.]”表示。实例中“20”表示该图书的尺寸在35—45厘米。从上述实例可以看出,卡片目录中所显示的内容非常简练,仅提供题名页中的主要信息;此外,卡片目录中所提供的检索入口非常少,主要从著者、题名两方面进行检索。卡片目录格式在德国存在了半个多世纪,直到机读目录格式的出现,卡片目录才逐渐被机读目录格式取代。

2 MAB机读目录格式的产生与发展

20世纪60年代,随着计算机技术在图书馆的广泛应用,图书馆目录格式发生新的变革。1968年美国研发出MARCII机读目录格式,它是目前机读目录格式的母本。受美国研发机读目录格式的影响,德国从20世纪60年代末期开始自主研发机读目录格式。德国没有使用美国研发的MARCII机读目录格式,主要基于以下三方面原因。(1)编目规则的差异。20世纪70年代以来,德国使用的编目规则是《字顺目录编目条例》(Regeln für die alphabetische Katalogisierung),英美两国使用的是《英美编目条例》,两部编目规则存在诸多差异,由于当时机读目录格式严重依赖编目规则,所以德国选择自主研发机读目录格式。(2)MARCII对不同种类数据的识别不够,不符合德国编目实践的要求。(3)德国不满意MARCII中子字段的设置,其自主研发的机读目录格式是以字段为基础[3]。基于以上原因,德国在开启机读目录编目时代的初期选择自主研发的机读目录格式。1972年MAB问世,自此,德国和奥地利的图书馆开始了MAB机读目录格式的编目时代[4]。

随着编目规则的不断改进以及编目需求的日益提高,德国对MAB格式的改进工作在不断进行,MAB的改进版MAB2最终于1995年问世。MAB2除包括书目数据、个人名称、团体机构名称、主题词和本地数据五种格式外,还包括两种临时格式,即地址和图书馆数据格式以及分类和标记数据格式。1995年起,德国和奥地利一直采用MAB2机读目录格式。MAB2机读目录格式同样只有字段,没有子字段,除头标区外,字段号的设置范围为001—949。本文以书目数据格式为例,MAB2书目数据字段说明详见表1[5]。

表 1 MAB2书目数据字段说明

根据表1可以看出,MAB2书目数据格式包含很多字段号,除100字段代表的个人名称与MARC21的书目数据格式相同外,其他字段的定义均与MARC21不同。与卡片目录相比,MAB2格式的书目数据记录无论是目录的详细程度,还是检索点的设置都得到大幅提升。然而,从国际间书目数据共享的角度看,MAB2独特的字段设置是一种阻碍,并随着德国编目工作的日益国际化而变得更加突出。

3 向MARC21机读目录格式的转换

进入21世纪,随着互联网的高速发展,国际间书目数据的共享日益频繁,在新形势下,德国的机读目录格式到了必须转换的阶段。为便于利用国际书目数据,使德国图书馆的数据在世界范围内可见,德国图书馆标准委员会决定推动德国目录格式向MARC21格式转换。2002—2004年德国进行了MARC21的可行性研究与分析,并于2004年12月决定采用MARC21替代MAB2[6]。截至2013年12月,德国完成了MAB2向MARC21的转换工作。自此,德国开启了MARC21的编目时代,同时为德国顺利实施RDA打下了坚实的基础。德国在向MARC21数据格式转换的过程中并没有完全接受英国、美国的编目规则。如在编目语言方面,仍然沿用德语,这一点从040$bger可以看出,“ger”代表的编目语言是德语;另外,德国依然按照本国的编目规则进行编目,在术语的表述和缩写的使用等方面继续按照以往编目实践进行操作。

4 探索全新的元数据格式

德国在书目数据格式方面的探索,没有因完成向MARC21格式的转换而停止。虽然MARC21为了适应RDA的编目需求而进行修订,但对于图书馆长远发展而言,MARC21格式已不能满足网络数据发展的新要求,目前MARC格式被认为是制约图书馆书目数据在互联网上开放利用的最大障碍。2002年,OCLC的Tennant提出“MARC must die”观点[7]。此外,国际上关于书目数据新格式的研究也一直没有停过,如关联数据(linked data)在图书馆的应用,即将图书馆数据用关联数据形式发布,实现书目数据在互联网上的普遍关联[8];由美国国会图书馆研发的书目格式——书目框架(BIBFRAME)应用关联数据技术,使书目数据可在整个互联网上交换、发布和共享,目前BIBFRAME已经升级到2.0版本[9]。目前,德国已积极参与关联数据和BIBFRAME的建设。在关联数据方面,德国国家图书馆自2010年以来一直通过关联数据服务提供RDF标准的数据[10],在书目数据和主题规范数据方面,德国国家图书馆推出了关联数据项目,即20th Century Press Archives、Gemeinsame Normdatei及STW Thesaurus for Economics。此外,德国北莱茵-威斯特法伦图书馆服务中心也在书目数据方面参与了关联数据项目,即lobid.BibliographicResources[11]。针对美国国会图书馆的BIBFRAME计划,德国国家图书馆作为“Early Implementers Group”的成员之一,一直积极地致力于德国标准国际化的研究。目前德国BIBFRAME项目的第一阶段的主要任务是将德国国家图书馆数据由“Pica+”向BIBFRAME格式转换,并从中获取经验。2014年2月起,在德国国家图书馆的书目信息中开始提供BIBFRAME书目格式的链接[12]。目前,德国国家图书馆的在线目录不仅提供MARC21-XML格式的书目记录,还提供BIBFRAME格式的书目记录,而德国国家图书馆BIBFRAME项目的第二阶段正处于规划中。

5 德国目录格式的变迁对CNMARC发展的启示

5.1 CNMARC所面临的挑战

我国中文文献编目最初也采用卡片目录,随着机读目录的出现,我国中文编目学家参照UNIMARC,并结合我国国情制定CNMARC,并一直沿用至今。与中文编目不同,我国的外文编目始终与美国的编目实践一致,采用由USMARC演变而来的MARC21格式。因此,目前我国大部分图书馆中存在两种机读目录格式并存的情况。这种分立式目录格式造成我国图书馆“一馆两制”的状况,不利于图书馆数据库的统一建设[13]。随着RDA的出现,很多国家开始积极响应并推动RDA的应用,我国的外文编目也积极地制定外文文献资源RDA本地政策,并为适应RDA的编目采用了MARC21格式所做出的修订,将实施RDA编目提上日程。面对国际编目的大环境,未来我国中文编目实施RDA已是大势所趋,为了能够与RDA相适应,我国中文编目除制定RDA中文文献资源的本地政策外,还应该考虑CNMARC格式的未来方向,是继续沿用CNMARC,还是向MARC21实施转换,或是启用新的元数据格式。

5.2 CNMARC的未来发展方向

结合国际上目录格式的发展趋势以及德国目录格式的发展历程,本文认为CNMARC的未来发展方向将面临三种选择:一是借鉴MARC21的修订经验,结合RDA的编目需求,修订CNMARC;二是以实施RDA为契机,与国际接轨,将CNMARC向MARC21转换,从而使中外文文献编目得到融合和统一;三是完全放弃MARC格式,参与新的元数据格式(如关联数据或BIBFRAME)的研究与实践。

5.2.1 修订CNMARC

目前,修订CNMARC对于我国中文编目是比较直接且容易实现的方法,因为CNMARC是由UNIMARC发展而来,我国可以根据新版的UNIMARC进行CNMARC修订,这样既节省时间,也不用耗费大量人力。但是,目前书目数据交换日益频繁,从我国单个图书馆乃至整个图书馆系统的长远建设考虑,采用独特的目录格式会阻碍图书馆数据库的长远发展以及书目数据的国际共享与交换。德国在实施RDA的同时,选择向MARC21格式的转换在很大程度上是出于对上述两方面的考虑。因此,基于上述原因,本文认为仅对CNMARC进行修订虽然是最直接和最容易的方法,但不能最有效地解决我国编目存在的实际问题。

5.2.2 向MARC21实施转换

相比直接修订CNMARC,向MARC21实施转换更难且更费事,它不仅是目录格式单纯的转换,还涉及CNMARC数据的处理与兼容问题、中文编目规则与MARC21的协调问题、编目人员的培训问题等,但即便困难重重,CNMARC向MARC21转换也是可行的,主要基于以下两方面原因。

(1)CNMARC与MARC21可以实现自动转换。根据相关研究,CNMARC与MARC21的区别主要在于数据字段区中所用的内容标识符不同[14]。此外,我国图书馆界的专家已经对CNMARC向MARC21的转换问题进行研究。如张爱优[15]和谢蓉[16]曾对CNMARC和MARC21的常用项目进行分析,发现二者除存在字段和子字段命名的差异外,存在极大的相似性;余敏[17]将CNMARC与MARC21进行对比,发现CNMARC与MARC21在多字段区都可以实现自动转换。另外,相比德国的MAB格式,CNMARC的转换更容易,德国的MAB与MARC21相比不仅在数据字段区中所用的内容标识符不同,而且MAB中没有子字段,与MARC21和CNMARC都不相同。

(2)向MARC21转换有助于书目数据的共享与交换。我国图书馆大多存在中外文两种数据格式并存的情况,其阻碍了图书馆数据库的长远建设。另外,在数字编目时代,书目数据的国际共享成为主旋律,但是独特的目录格式不仅会阻碍我国访问并使用国际书目数据,还会阻碍我国图书馆的数据在世界范围内共享,影响我国优秀传统文化的传播。因此,为了我国图书馆的长远发展,弘扬我国文化,提高我国文化软实力,可以考虑由CNMARC向MARC21进行转换。针对转换的问题,本文认为可借鉴德国的经验,如实施MARC21的可行性研究与分析,制定详细的实施方案,如可以实施自动转换的字段建立映射关系等。

5.2.3 探索全新的元数据格式和标准

德国在向MARC21转换的同时,也积极参与国际上新的数据格式的研究与实践,因为MARC格式前景不佳,制约了图书馆数据在互联网上的开放利用,并且新的编目规则和标准RDA是可以独立于储存和交换数据的媒介、格式和系统,从而能够支持MARC、DC、MODS、RDF/XML等多种输出格式[18]。虽然目前国际上新的元数据标准正处于研发阶段,还没有全面推广和使用,但是,我国目录格式和标准的未来发展应该紧跟国际发展趋势,无论是中文编目还是外文编目都要与国际编目相融合,向编目的国际一体化迈进。曾经独立于英美编目体系的德国,在面临编目日益国际化和标准化发展的同时,积极参与到国际编目的活动中,制定RDA本地实施政策,转换机读目录格式,并且积极地参与研发新的元数据格式和标准。目前我国实施全新的元数据格式和标准并不现实,但是这可以作为我国编目未来发展的一个方向。如我国可以向德国学习,先从书目数据或规范数据入手,成立关联数据项目或BIBFRAME项目,积极参与到国际全新的元数据格式和标准的研发中,为我国编目工作在国际上赢得更多的话语权。

6 结语

本文以德国目录格式的发展历程为切入点,梳理德国目录格式的演变过程,在此基础上借鉴德国向MARC21转换的经验以及德国参与研发新的元数据格式和标准的做法,并结合CNMARC所面临的挑战,针对CNMARC的未来发展方向提出建议。虽然我国与德国在编目上有一些相似,但是由于两国编目工作的实际情况不同,因此,针对CNMARC的未来发展问题,我国还需结合自身实际情况,制定符合我国国情和图书馆馆情的具体实施方案。

[1]张玉麟.简论图书馆卡片目录的产生和发展[J].图书馆工作与研究,1987(3)∶59-63.

[2]OSBORN A D.The Prussian instructions∶rules for the alphabetical catalogs of the Prussian libraries[M].Ann Arbor∶University of Michigan Press,1938.

[3]Nalsi的西文编目笔记III[EB/OL].[2017-10-03].http∶//nalsi.net/posts/tag/marc.

[4]吴丽坤,殷洁.文献编目理论研究[M].北京∶中央编译出版社,2013.

[5]MAB2-TITELOnline-Kurzreferenz-Version[EB/OL].[2017-11-29].http∶//www.dnb.de/SharedDocs/Downloads/DE/DNB/standardisierung/mab TitelBibliographischeDaten2001.txt?_blob=publicationFile.

[6]国家图书馆外文采编部.交流与创新——外文文献资源建设与组织学术论文集[M].北京∶国家图书馆出版社,2016.

[7]刘炜,夏翠娟.书目数据新格式BIBFRANE及其应用[J].大学图书馆学报,2014(1)∶5-12.

[8]刘炜,胡小菁,钱国富,等.RDA与关联数据[J].中国图书馆学报,2012(1)∶34-42.

[9]靳光明.机读目录与书目框架的发展过程与前景探究[J].电子技术与软件工程,2017(7)∶206.

[10]Deutsche National Bibliothek.Linked Data Service of the German National Library[EB/OL].[2017-10-02].http∶//www.dnb.de/EN/Service/DigitaleDienste/LinkedData/linkeddata_node.html.

[11]林海青,楼向英,夏翠娟.图书馆关联数据∶机会与挑战[J].中国图书馆学报,2012,38(1)∶58-67.

[12]Deutsche National Bibliothek.BIBFRAME-Bibliographic Framework Initiative[EB/OL].[2017-10-02].http∶//www.dnb.de/EN/Wir/Projekte/Laufend/bibframe.html.

[13]罗翀.RDA全视角解读[M].北京∶国家图书馆出版社,2015.

[14]王松林.中文编目与RDA[M].北京∶海洋出版社,2014.

[15]张爱优.CNMARC和MARC21常用项目的比较分析[J].图书馆论坛,2005(5)∶157-159.

[16]谢蓉.USMARC与CNMARC的比较研究[J].现代情报,2005(4)∶ 124-127.

[17]余敏.从CNMARC到MARC21数据转换研究[J].图书馆论坛,2011,31(3)∶105-108.

[18]胡小菁,张期民,高红.RDA在中国实施面临的问题[J].数字图书馆论坛,2013(7)∶8-11.

猜你喜欢
数据格式编目书目
推荐书目《初春之城》
都市人(2022年3期)2022-04-27 00:44:57
国家图书馆藏四种古籍编目志疑
天一阁文丛(2020年0期)2020-11-05 08:28:36
在智能交通系统中PLC数据格式转换方法的研究
电子测试(2018年1期)2018-04-18 11:52:49
粤剧编目整理之回顾与展望
戏曲研究(2017年3期)2018-01-23 02:51:01
论子函数在C语言数据格式输出中的应用
DWG与SHP数据格式互转换方法研究——以龙岩规划测绘数据为例
图书馆编目业务外包发展探讨
河南科技(2014年22期)2014-02-27 14:18:37
基于ArcGIS的规划数据格式转换研究
本刊邮购书目
图书在版编目(CIP)数据
全国新书目(2009年8期)2009-05-22 11:31:16