(美国圣荷西州立大学信息学院 加利福尼亚州圣荷西 95192)
一个访谈只有当它被记录下来,以某种方式处理,并可在图书馆、档案馆或其他收藏机构中获取,或以对应文字稿的形式出版时,才能称之为口述历史。有效用于学术研究、重新解释和验证其他类型资料,赋予口述历史新的内涵。
——唐纳德·里奇《大家来做口述历史》(第3版)
美国口述历史学家唐纳德·里奇(Donald Ritchie)的上述表述提醒口述历史学家和编目员,口述历史记录(包括访谈记录和相关资料)是服务于历史研究目的而创造的历史文献。口述历史是历史学家用来理解过去的许多证据之一。口述历史应当与其他相关文献(信件、政府文件和作为历史证据的其他文件)和作为补充资料的二次文献(学者分析历史证据的书籍和文章等)一并归入图书馆和档案馆。
尽管访谈记录依然是口述历史的核心基础,但目前的最佳实践已将注意力从访谈转向更广阔的视域,其中记录访谈只是口述历史生命周期中的一个步骤。口述历史生命周期的新模型由四部分组成,如图1所示:计划、访谈、管理和利用(PLAN, INTERVIEW,CURATE and USE)。在这个模型中,编目员应当参与项目设计,并为技术和元数据规范提供指导。
第一步,计划:是指制定一个项目方案,包括通过访谈所要探究的问题,以及项目的大小和形式、谁会接受采访、访谈如何归档、记录的技术规格以及描述性元数据的采集等细节;第二步,采访:是指访谈实施,这一直是口述历史的基础工作;第三步,管理:是指图书馆和档案馆在保存和提供利用方面的职责;第四步,使用:指的是口述历史被研究者发现和利用的途径。这里所描述的生命周期方法,通过让编目员参与口述历史项目规划,提高其在口述历史方法论中的作用,并确保由口述历史学家提供给编目员的元数据信息完整而充分,足以进行良好的编目工作。
图1 口述历史生命周期
图2 口述历史资料管理
图2进一步拆分了图1中所述的管理步骤。这些步骤,包括在图书馆和档案馆所进行的加工、编目和保管等工作。第一步,加工:是指图书馆或档案馆为口述历史永久保存所作的必要的物理上的处理以及记录保存等工作;第二步,编目:是指资源描述及其工作流程,这是本文的重点;第三步,保管:是指为确保口述历史资料的长期保存而采取的所有措施。图1和图2为图书馆员理解编目工作如何适应口述历史编目的独特需要提供了背景。
理解口述历史学家和信息专业人员在使用概念方面的细微差别也是至关重要的。下面对文中所涉及的可能引起误解的一些概念进行辨析。
档案馆和图书馆都是着眼于文献的机构,其目的是服务于研究。尽管二者功能存在重叠,但是它们的目标却存在巨大的差异,编目实践也不同。图书馆通常收藏已出版的资料,如书籍、期刊和缩微胶片等。它通常在物品层次上对馆藏进行编目,这意味着每一本书(通过书名来体现)或每个口述历史都有一个单独的条目。档案馆通常收集一些不可替代的资料,如照片和信件等。档案资料往往在大的工作语境中凸显其重要意义,其资料的组织方式通常基于来源,因此档案资料的传统编目方式是以收藏为单位(称作收藏级编目)。例如,在一个口述历史项目中所收集的某位名人的所有文件或一系列口述历史访谈,应当作为一个条目编入馆藏。
编目和元数据有着相似的含义,它们经常互换使用,但术语的用法和起源有差异。编目与图书馆一样古老,传统上由列表或卡片系统来定位图书馆的实物和文件,后来逐渐将工作扩展到资源描述和定向获取。元数据这个术语在计算机时代变得很重要,它指的是在计算机环境中使用结构化数据和语言来组织和改进对信息资源的访问与获取。元数据通常被描述为“关于信息的信息”。编目和元数据具备相同的功能,都是通过对信息资源的描述和提供主题检索等增加文献获取的可能性。
在本文中,我使用“访谈员形成元数据”[1]一词来描述口述历史采访的细节信息,如讲述者的姓名、访谈日期和对讨论主题的描述等,这些都是由采访者提供的。这些信息可以记录在表格上,并随同口述历史资料一起进入图书馆。访谈员形成的元数据是编目工作的重要组成部分,因为这些描述性信息是由最熟知访谈情况和内容的访谈员提供的。
图书馆和档案馆的管理员和编目员是信息专业人员。在较大的机构,二者的工作是不同的,但在较小的机构,他们可能会重叠或合并。管理员对馆藏资源的收藏、开发、编目、保存和使用负有行政责任。编目人员则需要有很强的技术能力和组织能力,能够熟练地运用本文所述的工具创建高质量的编目记录。在探讨编目这一口述历史生命周期的重要阶段,我将交替使用到上述这些术语。口述历史学家和访谈员是收集口述历史的专业人员。同样地,图书馆和档案馆的管理员和编目员则投身于口述历史资料的管理。口述历史学家通常都接受过口述历史方法论和现代史的训练;访谈员则受过录音技术、沟通技巧和面试技巧的培训。大多数情况下,口述历史学家和访谈员由同一人担任。在讨论口述历史生命周期中的访谈阶段时,我使用了这些术语。
一项口述历史访谈由访谈员的提问与讲述者(也称为被访者)的回答构成。据口述历史的最佳实践,讲述者被认为是口述历史的主要作者。
口述历史是通过亲历者的原始讲述来记录新近历史的一种方法[2]。访谈记录是口述历史的核心内容,也是将口述历史方法区别于其他方法的关键要素。下面一些例子表现了口述历史是如何使用的:
记录濒临消失的语言、文化以及艺术传统;
讲述某个社群或者某些特殊兴趣组群的故事;
记录某个职业群体或某个机构的历史;
展示某一事件的不同视角。
德克萨斯图书馆员兼口述历史学家Elinor Maze保守地坦言:“对于图书馆员而言,口述历史是复杂的”[3]。一些证明她观点的证据如下:
(1)技术细节。口述历史通常以音频、视频或者二者混合的形式呈现。这些音(视)频通常是模拟或者数字格式或者二者兼具。录制的格式和媒介可能与存储的格式和媒介不同。所有这些细节都必须体现在编目记录中。
(2)口述历史的组成。尽管访谈记录被认为是主要文献信息源,但完整的口述历史可能包括抄本、照片、事件发生时间表等附属资料。图书馆和档案馆通常按照资料物理属性的不同分散储藏:即印刷资料存放在一个区域;多媒体资料则存放在另一个区域。这种人为的隔离影响了口述历史的完整性。
(3)关联性。单个的口述历史可能是口述历史项目的一部分;也可能是图书馆中已有收藏对象和资源的有效补充;还可能是个人或机构所收藏文件的一部分。了解这些关系,有助于提高口述历史的研究价值。编目时必须要确定是否描述以及如何描述和链接这些关系。
对研究人员和编目员而言,将口头语言逐字逐句转换成文字的抄本有着诸多用途。相对于聆听一段长时间的录音而言,研究人员更喜欢阅读抄本。抄本还有一个优点,就是能够澄清访谈记录中难以理解的部分;提供正确的个人、组织和地名等的拼写,并且为访谈中使用的多种语言提供翻译。
但抄本转录是最昂贵的步骤之一,因此经常被省略掉。有时接收口述历史资料的图书馆或档案馆会承担转录抄本的任务,但最好的做法是让那些与访谈最接近的人(访谈员或口述历史学家)来进行。对编目员而言,抄本是访谈材料元数据缺失的情况下校验日期和拼写等非常有价值的信息源。
一般人不太考虑如何系统地组织和描述信息,他们只是希望信息在他们需要的时候触手可及。图书馆员则不然。我们每个人都有找不到珍贵文件的经历,因此我们本能地知道,单纯地储存文档并不能使人在需要时就能找到它们。我们需要一个系统来组织文档,能告知文档所在的位置以及它包含的信息。信息收集越大、越复杂,我们就越依赖一个系统来了解它的内容。这就是编目工作的切入点。
编目是一个组织和描述信息资源使其易于被发现的过程。
以下是对口述历史编目的8个充分理由:
(1)编目根据物理格式、主题、项目名称、机构、地理位置、叙述者的姓名及其他指代类别来组织信息。
(2)编目可以提供多条检索路径,使用户能够通过讲述者的名字、主题、口述历史项目或任何其他路径找到口述历史。
(3)编目可以为个人姓名、地理指示物、照片或任何其他指定信息创建链接。
(4)编目通过唯一标识符(电话号码、登录号、DOI或URL)将用户引导至实际资源。
(5)编目描述口述历史的物理特质,包括媒介、格式和抄本等细节。
(6)编目通过关键词、人名以及访谈内容的描述和叙述者的个人履历等揭示口述历史访谈的知识内容。
(7)编目可以记录重要的管理信息,如捐赠者的姓名、入藏日期、使用限制、副本数量和位置以及引用许可说明等。
(8)编目可以跨机构共享信息,共享编目允许用户通过单一搜索访问来自于链接机构的编目信息。
编目工作须从组织待编目信息的一个系统开始。编目系统包括一个容器,即目录本身(通常是数据库的形式)以及相关的规则、标准和信息输入指南。大多数图书馆和档案馆都使用嵌入到图书馆管理系统(Library Management System ,LMS)的编目模块。在较大型的收藏机构(图书馆和档案馆),编目程序已经完善到位,编目员则需调整本机构的编目实践以适应口述历史资料的编目。较小的图书馆可能需要从头开始建立自己的编目系统。本文提供的编目建议可以很容易地适应电子表格、独立数据库以及文件归档系统等。
小贴士(TIP):无论编目系统如何,编目最核心的职能是准确、完整地记录描述性数据,并尽可能在访谈完成后及时著录。在英语中,我们用助记符来表达这个原则:一致性(Consistency)、客观性(Objectivity)、准确性(Accuracy)和及时性(Timeliness)。
共享编目是互联网时代的绝妙礼物。它指图书馆能够浏览和套用其他图书馆编目记录,从而节省各个馆独立编目的时间,并使编目标准更好地得以遵循。由于口述历史是独一无二的资源,所以它们很少能从共享编目中获得直接利益。但是通过在大型平台上共享编目有利于口述历史资料的访问和获取。WorldCat[4]是世界各地图书馆馆藏的国际数据库,是最大的平台。它还为共享编目提供了国家和区域选择。
如图3所示,无论编目系统大小或者繁简,它都是由三个层级组成的分层结构。最高级别是目录本身,即各部件的存放的容器。下一个层次由记录组成,每个单元对应一条记录,通常称为编目条目。第三级由每个记录域中的子单元组成,称为字段。此图演示了项目级和收藏级的记录和字段。
图3 编目结构
元数据的广义为“信息的信息”——是指那些描述、跟踪和管理信息资源的数据。元数据标准由数据类目或字段以及与之关联的条目规则组成,它由专业群体设计,从而能够跟踪他们所需要的信息。这里是图书馆和信息科学领域的一些例子:编码档案著录EAD(Encoded Archival Description),用于描述档案收藏;机读目录MARC(Machine-Readable Cataloging),专为描述书籍设计;DC(Dublin Core),主要用于描述电子资源。虽然各个标准有其独特的适应性,但一个标准可以映射到另一个标准,因此编目数据可以在机构和专业团体之间轻松共享。遗憾的是,目前没有专门描述口述历史的元数据标准。
口述历史对编目人员而言往往是一个挑战。口述历史的某些特质,如格式复杂和物理元素多元等,都是与生俱来的。这些特质往往令编目员束手无策。而其他方面,如内容标准和元数据主题分析等,却可以通过编目人员与口述历史学家的良好沟通得以改进。
几乎每个口述历史都有一些需要编目人员运用专业技能和判断力来综合解决的独特问题。此外,如果没有抄本或访谈员形成的元数据,编目员必须花时间听取采访,以便编目。目前编目人员必须综合采用书籍、手稿和视听资料等元数据规范来实现对口述历史的有效编目。
弱化编目挑战的最佳方式是在访谈开始之前由口述历史学家和编目员达成一个编目协议。他们应该根据本文最后一个例子指定一份访谈员形成的元数据工作表(见下文表3),在该表中列明双方一致认为应当在目录条目中体现的信息。这一方案使得访谈员有责任确保所有信息被正确而一致地记录下来。
小贴士(TIP):使用访谈员形成的元数据是确保编目准确性和一致性的最佳方式,它不仅能节省编目人员的时间,而且减轻了他们的痛苦。
我们一致认为,一本书是由封面和封底之间的内容定义的,但口述历史又该如何定义呢?口述历史是由一个个单独的采访组成的吗?所有的访谈是同一个讲述者关于同一个主题的吗?是只有抄本还是跟录音一起?事实上,何为口述历史编目单元,目前尚没有统一的标准定义,可以存在多种选择。
编目员的首要任务是确定口述历史编目单元,即明确以什么作为一个编目条目。以下是我认为最常见也最有用的界定方式:
定义(DEFINITION):口述历史单元由针对特定讲述者的一个或多个访谈以及相应的抄本和附加材料组成,其目的是讲述一个单一的故事。
口述历史编目分为项目级别(一个口述访谈)或收藏级别(一组访谈的集合)。项目级编目为每个口述历史提供一个目录条目。这种方法提供了更多的细节,是条件允许情况下的首选。收藏级编目将相关口述历史的集合定义为一个编目单元。这种方法可以强调口述历史之间的关系,而且能更快速地完成,但问题是缺乏详细的描述。收藏越复杂,这种方法的效果就越差。
图3显示了口述历史编目的项目级和收藏级。左边的示例说明了项目级编目,每一个编目条目对应于单个口述历史。右边的示例说明了收藏级编目,其编目记录描述了相关口述历史的集合,比如口述历史项目中的所有访谈。在这种情况下,整个收藏将被描述为单个实体。
下一个编目步骤是确定在数据字段中记录哪些信息。定义数据字段是口述历史编目的重要内容之一。字段的选择可以根据项目的需要和访谈的内容而有所不同。下面是口述历史编目中常用的数据元素列表:
(1)关于项目:
项目名称
项目发起单位
(2)关于访谈:
访谈标题
叙述者姓名
访谈员姓名
访谈日期
访谈地点
音频或视频
记录格式
存储介质
录制说明
采访笔记
(3)访谈内容:
人物简介
访谈摘要
主题—话题
主题—地名
主题—人名
主题—机构名称
受控词表由人工生成的词汇列表和表格组成,用于补偿语言(或多种语言)的自然变体。受控词表对人类和计算机都有好处,在计算机环境中可以实现无缝操作,从而提高研究人员的搜索效果。此外,它还引导编目员在输入数据时减少随意性,从而保持数据一致。受控词表分为3个日益复杂的类别:清单、表格和叙词表。清单由一些术语或名称组成,如下面的葡萄酒清单。这样的清单有助于编目员使用准确的术语,确保拼写正确和粒度级别选取恰当。这样的清单经常在互联网上以下拉菜单选项的形式出现。
夏敦埃酒(Chardonnay)
黑比诺(Pinot Noir)
梅洛(Merlot)
雷司令(Riesling)
长相思(Sauvignon Blanc)
表格指定了术语使用的一一对应关系,编目机构可以据此确定要使用哪种变体,如表1中的机场代码[5]。在本例中,用户可以输入机场代码、机场名称或机场城市,都会得出相同的结果。
表1 各城市飞机场名称代码表
词库可以定义术语之间的复杂关系——同义词、广义词、狭义词或反义词。叙词表在计算机系统中非常有效,因为它能通过关联术语扩展检索结果。如果将词库嵌入编目系统中,那么用户可通过输入任意关联术语获得检索结果,如下例:
单一家庭住宅(SINGLE FAMILY DWELLINGS)
广义词:居住类建筑(Domestic Architecture)
狭义词:住宅房屋(Tract Houses)
关联词:连栋住宅(Duplexes)
关联词:公寓(Condominiums)
关联词:公共住宅(Apartment Houses)
不同的领域有其特定的受控词表的标准,如美国信息科学专业人员经常使用的国会图书馆规范、盖蒂艺术和建筑主题词表以及ERIC叙词主题词表等[6-8]。但是由于口述历史大多涉及未被文字记录的生活领域:其中的地名有可能是地图上没有的;人名或者机构名也可能是印刷品中不曾出现过的,这些术语在标准的受控词表中是找不到的。
图书馆、档案馆和口述历史项目组通常需要通过制定自己的词汇表来实现词汇控制,或者通过开发本地词汇表来指定口述历史访谈中所描述的人名、地名、组织和事件的拼写和格式等以补充标准词汇表。一个精心设计的本地受控词表能保持在整个口述收藏中编目的一致性,并有效弥合访谈中口语术语和研究者可能最熟悉的语言之间的差距。
小贴士(TIP):受控词表仅用于编目;访谈或抄本中的术语永远不能改动。
从口述历史保护角度,口述历史资料从收藏者(访谈员等)转移到管理者(图书馆员和档案工作者等)的过程中是最具风险的。口述历史资料的收集者们深入地参与了口述历史项目并熟悉讲述者,访谈员可以清楚地回忆起访谈的细节以及提及的名字和日期。所有访谈员能回忆起的信息都将有助于编目工作。不同的编目员有着不同的兴趣点。他们的工作是使用数据结构和受控词表等编目工具来创建从口述历史资料到用户的链接。只有具备精确的数据,编目工作才能做到最好。本节描述了对访谈员和编目员最有利的编目工作流程。
美国口述历史协会的《原则与最佳实践》对口述历史项目的前期规划工作有指导意义。“访谈员应当与有能力存储口述历史资料的机构取得联系,并确保公众对资料的获取权。”[9]这是非常关键的一步,它有助于确保口述历史资料有一个安全而稳定的存储场所,并且为口述历史从收集者到管理者的转移过程中签订合作协议创造了可能。文中建议的工作流程是基于一个前提假设:即口述历史项目组与图书馆或档案馆关于利用访谈员产生的元数据已经达成一致。
访谈员须使用一张表格来记录元数据,这可以有效避免编目员追踪编目信息的不清楚或不一致的现象发生。一般而言,访谈员与讲述者关系最为密切,负责在《访谈员形成元数据表》(见表3)上记录描述性元数据并验证相关的事实和拼写。这样就为编目员提供了精确、完善、及时和一致的可靠数据。其结果是不仅节省了编目时间,而且提高了编目质量。表2总结了编目工作的主要任务。
表2 编目主要任务
表3提供了在访谈员形成元数据表中使用包含在口述历史编目(元数据)中常见各类信息的范例。所列举的信息可以根据项目需要和任何机构工作指南进行调整。
表3 访谈员形成元数据表
《口述历史编目指南》(见表4),为各个领域的口述历史编目提供规范和指引。字段与采访者生成的元数据工作表中的各部分相匹配。该指南对保持编目一致性至关重要。与《访谈员产生的元数据工作表》一起使用将确保编目团队能够准确、一致、相对快速地输入数据。
口述历史学家Donald Ritchie提醒我们,“口述历史访谈是口述历史过程的开始,而不是结束。”[10]口述历史的主要目的向来是通过个人证词记录一段历史,并与其他记录历史的来源并肩存在。如果不谨慎保存,所收集到的叙述者的故事和证词就会丢失。编目是保存和获取的一个重要组成部分,缺失它,口述历史的益处就大大减少了。
21世纪为世界各地的学术研究提升了国际视野。美国历史学家和社区成员对中国同行的想法很感兴趣,同样某国的学生对10 000英里以外的同龄人的日常生活感到好奇。老年人可以记录他们对第二次世界大战的记忆,以便地球另一端的人能更好地理解这段历史。所有这些机会都可以借助口述历史实现,并且能够通过图书馆和档案馆的最佳实践来分享。但是,没有良好的编目,这一切都难以实现。
表4 口述历史编目指南
下面的英文资源将对口述历史学家和编目员大有裨益。
(1)MacKay, Nancy. Curating Oral Histories: From Interview to Archive, 2nd. ed. Oxford: Routledge, 2016.
南希·麦凯. 口述历史管理:从访谈到归档(第2版).牛津:劳特利奇出版社,2016.
这是口述历史编目管理方面最综合、最全面的印刷资源,本文就是在该书基础上写成的。它专门为图书馆员和档案管理者编写,其中有多个章节与编目有关。
(2)Oral History Metadata Synchronizer (OHMS),
口述历史同步元数据处理(OHMS)。这是一个免费、开源的口述历史索引系统,由肯塔基大学Nunn口述历史中心的DougBoyd研发。OHMS在美国被广泛用作转录抄本的一种节省型替代工具。
(3)Oral History Association (OHA),
美国口述历史协会(OHA)是世界上最活跃的专业口述历史协会,其“原则与最佳实践”部分在指导口述历史实践方面特别有益(http://www.oralhistory.org/about/principles-and-practices/);而“元数据工作组”对口述历史元数据的产生和运用起到了很好的指导作用。
(4)Oral History in the Digital Age (OHDA),
数字时代的口述历史(OHDA),是2012年以来口述历史新观点和案例研究的出版平台。尤为重要的是,其下拉选项“curating”,详见http://ohda.matrix.msu.edu/essays/curating/。
(5)Society of American Archivists(SAA). Oral History Section,
美国档案工作者协会,口述历史组,该小组积极参与包括编目和元数据在内的口述历史管理方面的各种讨论。
(本文特邀中国现代文学馆尹培丽博士翻译)
[1]BOYD D A“.Case Study: Interviewer-Generated Metadata,”in Oral History in the Digital Age.Washington,D.C.:Institute of Museum and Library Services,2012[EB/OL].[2017-10-13].http://ohda.matrix.msu.edu/2012/06/interviewer-generated-metadata/.
[2]NANCY M.Curating Oral Histories:From Interview to Archive[M].znd.ed.Oxford:Routledge,2016.
[4]WorldCat[EB/OL].[2017-10-02].https://www.oclc.org/en/worldcat/inside-worldcat.html.
[5]Adapted from“IATA Airport Codes”[EB/OL].[2017-10-13].https://en.wikipedia.org/wiki/IATA_airport_code.
[6]Library of Congress Authorities[EB/OL].[2017-10-13].http://authorities.loc.gov/.
[7]The Art & Architecture Thesaurus[EB/OL].[2017-10-13].http://www.getty.edu/research/tools/vocabularies/aat/.
[8]ERIC Thesaurus of Descriptors is developed and maintained by the U.S. Dept. of Education intended for its own collection within the field of education[EB/OL].[2017-10-13].https://eric.ed.gov/.
[9]Oral History Association. Principles and Best Practices[EB/OL].[2017-10-13].http://www.oralhistory.org/about/principles-andpractices/.See Pre-interview, item #1.
[10]DONALD A. Ritchie, Doing Oral History[M].3rd.Oxford: Oxford University Press, 2015.