电子化时代图书馆的文书资料管理

2011-04-14 03:35朱莲花黄卫东编译青岛大学图书馆山东青岛266071
图书馆理论与实践 2011年3期
关键词:数据格式电子化实物

●朱莲花,黄卫东编译(青岛大学 图书馆,山东 青岛 266071)

1 前言

日本文书馆制度的发展与图书馆、博物馆相比较为落后,所以有关反映本地区地方文化特色的资料和时事资料保存在各个地区图书馆。这些资料保存在图书馆的“特殊文库”“特别资料室”内,以不同于出版物的类型及格式存在,并向读者提供服务。随着近几年数字化存档、数字图书馆的发展,这些文书资料逐步公开化。本文根据近几年有关电子化时代的发展状况,对文书资料管理方法进行分析研究。

2 图书馆电子化的现状

过去,图书馆的文书资料与图书是以完全不同的方式来管理的。原因之一是,文书资料的分类、秩序体系跟图书的分类体系有着很大的差别。

文书资料的保存,原则上按出处或者按原结构分类保存,关键的是要明确资料的制作地和继承过程并且把整体资料看成一个群体,重点分析它的物理结构。在整理的过程中,虽然是根据内容和形态进行分类,但有关这些资料原有的秩序信息必须要完整地记录下来。在这一点上,与根据内容来分类排架的图书馆原则有很多不同。

法国的文书资料管理体系较发达,特别是以公文为中心,在19世纪中期开始根据“出处原则”和“原秩序原则”对文书资料进行分类和排架。[1]日本文书馆的文书资料管理制度从20世纪后期才开始发展,最初倾向于按照图书馆信息学进行目录的分类和排架。[2]从1970年前后起,有人提出这种方法会破坏文书资料的原有秩序,提倡资料大体在按“公文”“私人文件”等分类[3]的基础上,应重视资料出自哪家、哪个组织制作等“出处”信息[4]的观点。此外,还主张区分目录分类和排架分类的方法,以防止破坏文书资料原有秩序。这种重视资料原有秩序的管理方法主要先实行于公文等文书资料管理领域,后来逐渐普及到私人文件管理等领域。

经过以上的发展,以内容、形态及年代为中心分类的文书资料,逐渐变成从更多的资料特征来进行分类,同时添加出处或者资料的原秩序等信息,在目录上进行“第1分类”“第2分类”等,从多角度对资料进行分类、排架。另外,有关文书资料实际的排架,除了明显的形态不同之外,还重视出处和原秩序的排列,1980年以后更加重视对公文等文书资料根据出处分类的方法。[2]

在图书馆,文书资料与图书资料的管理完全不同,大多数图书馆以不同的资料体系来保存。因此,在小规模的图书馆,读者对这些资料的利用率未必很高,许多文书资料不能像一般的出版物那样简单地阅览。

这类文书资料,随着近年来的电子化和通过WEB等电子媒体的公开,阅览及利用变得简便。现在,除了国立和县立的主要图书馆以外,大学以及主要城市图书馆也在开展把各种各样文书资料以电子化方式公开的业务。例如,贵重资料视频数据库、贵重图书和汉书,有关自然风景区的资料、历史年代资料等。从这些文书资料产生的年代来看,主要是明治(1868年—1911年)以前的,最新的资料也就是战前的资料等。地方图书馆电子化公开的文书资料主要是反映本地地方特色的资料。另外,一些图书馆也公开议会资料等,而有关行政文书之类的资料,原则上由国家或者各地区文书馆以及相关行政机构保存并公开。因此,由图书馆保存并公开的文书资料主要是近代以前的历史资料。其中,被电子化的资料类型主要是绘画、地图、织锦绘画以及照片等图像资料。关于文字资料,由于很难描述并且多数用了草体字,对一般人来说难以阅读,因此,电子化公开的资料主要是通俗易懂的绘图资料。今后的一个重要课题是如何使这些难懂的文字资料变成通俗易懂的内容并公开和应用。

虽说文书资料逐渐被电子化公开后便于利用,但是在现实中与图书等其他资料之间的隔阂依然很大,缺乏与图书资料之间的相互联系。另外,图书馆的文书资料与博物馆及文书馆的资料之间的相互关联也不充分。因此,这些文书资料的管理在电子化以后的课题是,如何把这些文书资料与馆内的图书或者缩微胶卷等模拟复制资料,以及与博物馆、文书馆或者其他图书馆等馆外资料相互连接的问题。

3 图书馆的文书资料电子化

图书馆文书资料的电子化可以采取各种各样的方式,本文以下面的系统图来说明比较常用的文书资料电子化方式的问题。

图 图书馆文书资料的电子化

上图所示的电子化资料对象是:图书馆现有的图书资料和文书资料以及缩微胶卷等模拟复制资料,还包括近几年增加的Born DigitalContents等。图中用罗马数字所表示的是实物资料或是原始资料,用英文字母表示的是被电子化的资料和及目录数据。另外,中间的箭头表示资料电子化的过程。其中,表示被电子化的文书资料和目录数据的是:“B:电子化文书资料”和“A:电子化文书资料目录数据”。文书资料的电子化方式有两种:一种是图中箭头① 所示的从“Ⅰ:实物文书资料”电子化,另外一种是箭头② 所示的从缩微胶卷或者底片胶卷等,即“Ⅱ:模拟复制资料”的电子化。另外,通过“A:电子化文书资料目录数据”,可以链接“C:电子图书数据”以及“E:其他图书馆、博物馆、文书馆等设施”的目录数据。

4 文书资料的电子化过程

上图中图书馆保存的文书资料,主要可分为实物资料、模拟复制资料(指用缩微相机或者银盐相机拍摄的模拟复制资料)、电子化资料和图书等4种。通过文书资料的电子化保存实物资料或者模拟复制资料,可以提高这些资料的利用率,并能更有效地保证资料的完整性。

近些年来,随着数码照相机性能的提高,从实物资料直接电子化的情况也比较多。一般来说,通过直接电子化可以获取保存质量较高的文书资料信息,而通过模拟复制资料进行保存可能比实物资料的保存质量还差。因为资料里包含丰富的彩色或者微妙的信息,而通过直接电子化既能反映出其信息的丰富性,又可以降低成本。

如上所述,实行电子化时需根据资料的状况以及各馆的实际情况而定,但是,无论使用哪一种方式,必须先明确“实物文书资料”“模拟复制资料”“电子化资料”三者的功能。另外,在数字信息的目录数据中,必须明确记录电子化的资料是实物资料还是模拟复制资料。还有,用如上3种媒体保存同样的资料时,必须相互参照各自的信息。比如,缩微胶卷用卷号和圈数来标记其资料的情况。收藏这种信息时,无论是将胶卷底片电子化还是将实物资料电子化,一定要把这些信息反映在电子化资料信息的目录数据中。

另外,把刊登实物资料的概要、目录或者照片等图鉴作为图书保存时,也要清楚记录原始资料之间的关联,即从图书资料的目录中能够参照实物资料的ID,使这些资料相互对应。由此,可以把“实物文书资料”“模拟复制资料”“电子化资料”“图书资料”等相互联系起来保存并传承下去。

近几年,在图书馆和文书馆保存的资料,不仅仅是物理性的资料,还有越来越广泛普及最初就用电子媒体制作的BornDigitalContents。BornDigitalContents主要包括,地方图书馆记录有关本馆、学校以及公共设施举办的各种活动资料和广告等信息的WEB网页或者电子文书,还包括有关地区的活动资料和传统仪式的数字信息。因此,在今后的电子图书馆业务中,Born DigitalContents保存将成为一个很重要的研究课题。

这些资料中一部分有可能存在对应于Born Digital Contents的“Ⅰ:实物文书资料”“Ⅳ:图书资料”等关联收藏资料中,因此,必须做好通过目录数据获得与其他资源之间关联的信息记载。另外,Born Digital Contents的数据格式必须根据更为多样的数据格式化方式格式化以后保存。如果电子化资料对象是WEB网页内容时,一般情况下是用HTML文件或者用时事图像如实地保存。但是遇到需要使用插入程序的情况,或者遇到对特定的OS以及浏览器依赖程度较高的资料时,对它的依赖环境必须获取更详细的信息。另外,为了能够再现这些环境,必须同时保存OS以及浏览器的应用程序和各版本的插入程序。

但是,电子信息资源随着硬件环境的变化,将来再现会很困难,因此,对于特殊的数据格式资料,可以考虑将“BornDigitalContents”纸本化作为“实物文书资料”来保存,或者制作成图书作为“图书资料”来保存。通过这种方法可以把同一种资料用实物和电子数据两种方式保存,从而能应对因为环境变化而引起的各种问题。在这种情况下,对于“Born Digital Contents”“实物文书资料”“图书资料”各自的目录数据必须做好资料之间的相互对应的信息记述,从而能够更加安全地对一种资料进行分散阅览。

总之,希望各种形态的资料以互补的方式加以利用,而能起到相互链接各种资料的作用的就是目录数据。

5 目录数据的设计

图书馆文书管理用的目录数据必须对应前面所述的各种要素。目录数据除了对应保存文书资料的要素以外,还要起到链接胶卷等模拟复制信息、图书信息、Born DigitalContents以及与其他馆之间信息交换的作用。为了能够应对这些问题,必须掌握已有的各种目录数据格式,设计一个适合于所有要素的目录数据格式。

1980年兴起了国际性目录数据格式标准化的热潮,1989 年由 ICA(InternationalCouncil Archives)[5]致力于记录历史资料记述标准化,并于1992年发表了“关于记录历史资料记述的声明”(马德里原则),从而制定了国际标准的原则。1994年出版了国际标准记录史料记述一般原则ISAD(G)(General International Standard Archival Description) 的初版。

1993年,加利福尼亚大学的伯克雷学校制定了用SGML/XML文书记述语言的Encorded ArchivalDescription(EAD)目录数据格式。这与前面所述的显示概念和结构ISAD(G)原则相比,EAD是利用SGML/XML记述为前提,并且EAD还附有ISAD(G)和EAD的对应表。[6]

另一方面,针对图书馆用或者电子资料保存用的目录数据中最典型的是1994年制作的DublinCore。[7]DublinCore是由极其简单的15个要素组成的表示电子信息资源的目录数据格式,也与ISAD(G)以及EAD的目录数据要素相对应,近几年互相变换各种不同目录数据时都可以利用Dublin Core。但是,由于Dublin Core存在与MARC等已有的目录数据格式之间互换性较难的问题,所以美国议会图书馆于2002年开发出了既对应于Dublin Core的简便性,又具有MARC21多要素特点的目录数据大纲MODS(Metadata Object Description Schema)。[8]MODS是由 20 个主要素和子要素组成的目录数据大纲,主要是针对图书馆电子信息资源的目录数据而设计的,它既对应现存的图书,也对应WEB信息内容等电子信息资源。

另外,关于管理数字化数据的目录数据,CCSDS(ConsultativeCommitteeForSpaceDateSystems) 构建了为保存数字化信息内容的OAIS参照模型。它把数字化信息分成内容信息(Content Information)、保存记述信息(Dresevation Description Information)、组合信息(Packaging Information) 以及与组合相关的信息(Descritive Informationaboutpackage) 共4点的参照模型,还有作为描述这个OAIS参照模型的组合信息部分的目录数据。以美国议会图书馆为中心的研究集团提倡METS,[9]METS由记述目录数据、管理目录数据、文件组、结构图以及操作等部分组成,是一个以OAIS模型为基准,给予电子信息资源目录数据的格式。另外,OCLC与RLG的共同研究集团,共同研究基于OAIS模型的目录数据大纲PREMIS,现已经进入最后的完成阶段。

对于这种存在各种各样格式的目录数据标准,在图书馆实际利用率较高的是MODS。此格式除了可以对应Dublin Core所包含的标准要素以外,与MARC21的互换性也较好。并且MODS的要素通过Dublin Core,与EAD文书资料的各文书单位内容要素之间能互相变换。

关于数字信息,利用前面所述的PREMIS以及METS等目录数据格式,可以保存相关数据。灵活运用这些目录数据格式,能获取保存数字信息所需要的最低限度的样式、格式、再生环境等信息,把数字信息保存下来。

满足以上条件的综合目录数据,可以以日本国立国会图书馆制定的“NDL数字存档系统、目录数据大纲”为例。这个目录数据,整合MODS以及PREMIS[10]等目录数据格式,以获取实物文书资料和数字数据两方面信息为目标。此格式可分为“信息组合目录数据”“记述目录数据”“技术目录数据”“权利目录数据”“保存目录数据”“管理目录数据”等,关于内容的信息适用于MODS,数字化的信息利用PREMIS的概念而设计。

如前所述,必须设计一个“实物文书资料”“模拟复制资料”“电子化资料”“Born Digital Contents”“图书资料”等各种资料的目录数据之间相互对应的目录数据。目录数据与文书不是相互独立的个体,必须把两者作为一个整体来记述。因此,怎样描述这些结构将成为今后的研究课题。

6 与馆外机构的协作

前面研究了馆内资料相互链接的重要性,而与馆外资料之间的链接也很重要。有关图书馆的书籍数据,国立情报研究所通过NACSISCAT(综合目录数据库)等系统,横向制作和利用各种书籍资料。在数字化存档和数字图书馆建设中,这种横向连接信息的尝试有几例,但还为数不多。

其中,最先驱的例子是,国家文学研究资料馆、国际日本文化研究中心、京都大学、历史民俗博物馆、大阪市立大学、东京大学史料编撰所、庆应义塾大学等机构,利用DublinCore转换各个机构不同的目录数据,并且使用Z39.50协议[11]连接各机构数字资料信息的研究项目。[12]该研究项目已成为人间文化研究机构研究的研究资源共享系统之一。

另外,作为国立国会图书馆和国立情报研究所开展构建综合门户的研究项目,国立国会图书馆开设了有关数字图书馆的门户网站“NDL数字存档门户网站PROTA。[13]除了国会国立图书馆以外,多个机构已经构建了聚集电子化资料的信息网站,收藏这些信息的目录数据是以Dublin Core为中心的国会国立图书馆的目录数据大纲“DC-NDL”。

国立情报研究所作为总务省、文化厅的研究项目构建了“文化遗产在线”[14]网站,收集日本全国的博物馆、美术馆的资料信息,构建信息检索系统。

但是,这些不同项目的各自连接信息的结构、使用的目录数据大纲都有所不同,很难统一规定为一个标准格式的目录数据。因此,今后各个馆必须把握这些现状,研究出更为通用的目录数据格式,摸索电子化资料数据的链接方式。

7 结语

如今图书馆的电子化文书资料管理,改变了文书资料与图书资料完全分开保存的传统的文书管理模式,提高了文书资料的利用率,并且为读者提供了更加简便的文书资料阅览环境。另外,通过保存数字化信息,资料信息对后世的传承也起到了一定的作用。但是,为了更好地发挥它的长处,更加需要文中图所列出的各种资料之间的相互联系。这种联系除了包括把同一种资料用不同媒体保存时各种资料之间相互联系以外,还要包括相关图书以及其他机构保存的文书资料之间的链接等。相关的目录数据,分别有文书馆领域的目录数据和在图书馆处理电子信息资源时所使用的目录数据,以及专门处理电子信息资源的目录数据等各种格式。根据现状,必须研制出既适应实物资料又能获取BornDegitalContents信息的目录数据。

以这些目录数据为媒介,促进保存同一种文书资料的图书馆、文书馆、博物馆等不同机构信息之间的横向检索等事业,加深数据的MLA(Modern Language Association)链接是一件非常紧迫的事情。

(译自:(日)研谷纪夫.电子化时代图书馆的文书资料管理 [J].情报科学与技术,2008(11):554-559.)

[1](日) 青山英幸.Archives:Evidence,historicaldocu mentsand culturalheritage [J].Journalof the Japan Soci ety forArchivalScience,2004 (1):40-51.

[2](日)铃江英一.近代史料的管理和史料认识[M].北海道:北海道大学图书出版会,2003.

[3](日)小川千代子.电子记录的存档[M].(日本)东京:Nichigai Associates Inc,2003.

[4](日)大野瑞男.近世纪史料分类的原状和基础的课题[J].史料馆研究期刊,1968(1):267-283.

[5]ICA.记录史料记述标准化作业事业计划[EB/OL].[2010-04-20].http://www.ica.org/.

[6](日)五岛敏芳.日本的记录史料记述EAD/XML化和记录史料管理:围绕记录史料管理过程的EAD利用的地位 [J].情报知识学报,2003(12/4):3-21.

[7]DublinCore[EB/OL].[2010-04-20].http://www.dublincore.org/.

[8] MODS[EB/OL].[2010-04-20].http://www.loc.gov/standards/mods/.

[9] METS[EB/OL].[2010-04-20].http://www.loc.gov/standards/mets/.

[10] PRMIS[EB/OL].[2010-04-20].http://www.loc.gov/stan dards/premis/.

[11]美国议会图书馆Z39.50辅导资料[EB/OL].[2010-04-20].http://www.loc.gov/z39.50/.

[12](日) 山本泰则,等.关于DublinCore目录数据和Z39.50协议为基准的人文科学系数据库综合检索的实际验证实验[C]//人文学和计算机学术会论文集.(日本)东京,2004:199-206.

[13]国立国会图书馆数字存档门户PROTA[EB/OL].[2010-04-20].http://porta.ndl.go.jp/portal/dt.

[14] 文化遗产在线 [EB/OL].[2010-04-20].http://bunka.nii.ac.jp.

猜你喜欢
数据格式电子化实物
带你学习实物电路图的连接
推进外汇窗口服务电子化
1 我省市级国库集中支付电子化系统首次上线运行
当手绘遇上实物
基于Arduino控制的半实物模拟驾驶系统
基于RFID的户外广告监管系统的设计与实现
一种融合多业务的信息化系统框架研究
实物与宣传不符,卖方担责吗?
初中数学前置性作业的电子化尝试
汽车电子化,没有假设