基于内容形式与媒介类型的资源分类显示研究*

2016-11-08 05:32朱青青
国家图书馆学刊 2016年5期
关键词:术语载体媒介

朱青青

基于内容形式与媒介类型的资源分类显示研究*

朱青青

以GMD为主导的资源分类存在分类模式不统一、资源的多特征及粒度难以处理、格式信息显示过于分散等问题,而基于内容形式与媒介类型的资源分类显示则可以较好地解决这些问题。在对比分析ISBD和RDA两种标准的内容形式与媒介类型的基础上,就内容形式与媒介类型在我国的应用实践提出相关建议。表2。参考文献11。

内容形式 媒介类型 载体类型 资源分类 格式显示

“一般资料标识”(General Material Designations,GMD)由IFLA于1977年首次提出,用于说明文献所属资料类别,在我国也被称为“一般文献类型”。在传统文献时代,GMD作为概括文献资源类别的重要标识,对资源的划分起到过一定的区分作用。但随着信息资源的内容形式日益复杂、媒介和载体类型日趋多样,GMD的弊端日益凸显。鉴于此,国际上已经采用内容形式与媒介类型(载体类型)以取代GMD。本文试图探讨内容形式与媒介类型在我国资源分类显示方面的应用,并给出相关建议。

1 以GMD为主导的资源分类显示存在的问题

目前,图书馆界在资源的分类显示和资源格式信息的描述方法上依然以GMD为主导,且存在如下几方面的问题。

1.1 缺乏统一的分类模式

笔者于2016年4月通过访问网站的方式,对国内几家主要图书馆及相关机构的资源分类显示情况进行调研,结果如表1所示。

从表1可以看出,各图书馆及相关机构的资源分类虽然是以GMD为主导,但在具体的划分上依然存在较大差异,缺乏统一的标准和分类模式。有些资源类型虽然在名称上保持一致,但实际涵盖的资源范围却存在或多或少的差异,这些差异既体现在本馆不同检索系统的资源分类上,也体现在不同馆会将同一种资源划分为不同的资源类型上。比如,国家图书馆主页上划分的资源类型“图书”,其涵盖的资源范围实际包括电子图书、古籍数据库以及各种与图书相关的特色数据库,而其馆藏目录和资源发现系统中划分的资源类型“图书”主要是指纸本图书。又如,国家图书馆馆藏目录中划分的电子资源主要局限于CD、VCD、DVD、MP3等载体类型的音像电子资源,并不包括广义的计算机可用的资源;而清华大学馆藏目录中划分的电子资源不仅包括音像制品、多媒体资源,还包括电子图书和电子期刊。另外,关于特色资源,有些馆称之为特藏资源,有些馆叫做特种文献。

表1 国内几家主要图书馆及相关机构资源分类显示比较

1.2 难以处理资源多特征及粒度问题

资源粒度是指资源的构成形式,是资源被描述之后所具有的属性,一定程度上可以体现用户对资源的分类。资源可以按照多种标准进行分类,若按发行方式,可分为专著、连续性资源(期刊、报纸)、集成性资源(数据库、动态更新的网站)等;若按载体类型,可分为音像资源、缩微资源、电子资源等;若按内容形式,可分为文字资料、图像、地图、音乐等。所以,一些资源本身即具备多重分类特征,比如电子期刊、电子图书、电子地图等电子资源都以非纸质为载体,却同时又展现出资源的某种发行或内容特征。

当用户从图书馆的在线目录选择资源时,希望获得该资源格式方面的详细信息[1],比如它是一个印刷本、录音盘、视频光盘、计算机盘,还是在线电子资源;接下来用户会关心资源的发行方式,关心资源是图书、论文、报纸还是期刊,某个电子资源是报纸还是电子书;或者是想知道更具体的载体信息,比如某张录音盘是音乐CD还是黑胶唱片。而当前编目工作无法满足用户同时获取这些信息的要求。再比如,如何区分一个可在万维网上访问的电子资源和一个CD-ROM光盘形式的电子资源,因为这两种电子资源对于用户来说,代表不同的访问机制。以上问题的产生是因为GMD没有较好地解决粒度问题,无法展示资源的多个特征,导致资源的能见度不够,也不利于资源的进一步统计分析。

GMD主要定义了物理载体的文献分类,混合了内容和载体特征。一些文献类型如影像资料和录音资料是基于物理载体进行分类的,而另外一些文献类型如图像资料和地图资料主要是基于知识内容的一种分类。GMD虽然可以对文献类型进行特定的分类,但由于其存在难以解决粒度问题的缺陷,很难处理具有多重分类特征的资源。鉴于标准GMD在文献分类方面的这一缺陷,许多图书馆自创了不少非标准的GMDs,如国家图书馆目前正在使用的GMDs多达30余种。由于各馆采用的自创分类标准不统一、通用性差,最终导致用户识别、选择以及利用资源不够便捷。与此同时,GMD的这一缺陷也导致其无法对资源的分类进行准确映射与匹配,难以产生对用户有用的资源分类显示标签。

1.3 后台数据对资源的格式信息描述过于分散,缺少整合揭示

资源的分类可以显性地体现于图书馆的主页、馆藏目录检索系统、资源发现系统等前端平台,也可以隐性地体现在后台用于描述资源的数据格式上。无论是前台还是后台,对资源分类设置显示的不合理,都可能会影响用户查找和获取资源的便利性。从上文的调研情况来看,大多数图书馆的馆藏目录检索系统会特别将传统的纸质资源与电子资源进行区分,反映出用户对资源的物理载体类型可能会比较关注,因此充分揭示资源的载体格式信息对于用户来说就比较重要。部分馆会结合本馆馆藏资源特点与用户需求,对同一文献类型的资源再做进一步细分,如将图书进一步细分为普通图书、年鉴、工具书、百科全书、会议论文集、教材教参等类型,这些细分都依赖于后台基础数据的格式信息描述是否详尽。

但目前除GMD之外,描述资源的格式信息往往分散在整条MARC记录中,因此需要检查MARC记录的多个地方,甚至需要将这些描述载体类型的编码、信息等与GMD进行组合,才能最终确定资源的载体形式。对于多特征资源,目前仍然以GMD为纲的编目规则,无法在后台编目数据中同时提供多种格式信息的描述,如电子地图,目前数据中不能同时提供“地图”和“电子资源”两种格式信息。后台数据对资源的格式信息描述要么过于分散,要么过于单一。这给图书馆整合揭示内容形式相同但载体类型不同的资源,以及同一类型资源的粒度等,都带来一定的难度。

2 内容形式与媒介类型概述

2.1 内容形式与媒介类型的缘起与发展

随着资源类型的不断丰富,越来越多的资源以多种载体形式出版,GMD存在的概念交叉、功能不清等问题日益凸显。与此同时,各国对GMD的设置标准各异、变化频繁,致使GMD始终未能形成一套国际通用的方案。图书馆界普遍认为其文献分类的概念混合了FRBR阐述的内容表达与载体表现的元素[1],其规定的术语混淆了资源的发行方式、资料类型、内容形式、载体类型、标记符号(如盲文)等概念[2],从而降低了自身的适用性。为解决GMD存在的各种问题,尤其是解决当前新型、多样、复杂的资源如何被更好地描述、识别、检索、选择与获取的问题,图书馆界不得不对GMD进行重新定位。

2010年6月,国际标准《资源描述与检索》(Resource Description and Access,RDA)正式发布,其中规定采用三个元素“内容类型”“媒介类型”和“载体类型”替代 GMD用于描述资源。2011年,IFLA发布的《国际标准书目著录(统一版)》(International Standard Bibliographic Description,ISBD)新增独立著录项第0项“内容形式和媒体类型项”,以期帮助用户识别和选择适合他们需要的资源。在此基础上,我国也完成了对GB/T 3469-1983《文献类型与文献载体代码》的修订工作,并于2014年4月颁布新的国家标准GB/T 3469-2013《信息资源的内容形式和媒体类型标识》,希望采用内容形式和媒介类型组配的形式描述资源。

2.2 不同标准下内容形式与媒介类型的对比分析

由于ISBD和RDA对内容形式与媒介类型的界定存在一定差异,且新的国家标准GB/T 3469-2013主要是在ISBD(统一版)第0项的内容基础上编制而成,所以下文只重点对ISBD和RDA进行比较分析。

2.2.1 ISBD和RDA对内容形式的界定

在ISBD中,内容形式是指“反映资源内容表达的基本形式的一个或多个术语,其后可以附加内容限定,表示所描述资源的类型、感官性质、维度、是否有运动”[3]。在RDA中,内容形式则被表述为内容类型,是指“反映内容被表达的基本交流形式的类别以及被人类感知的感官类别”[4];与此同时,内容形式也指“对于在一种或多种图像形式中表达的内容,反映用于感知内容的空间维度数以及感知运动是否存在”[4]。

这两种标准都将内容形式定义为反映资源内容表达的基本形式,将内容形式视为识别作品和内容表达的一个非常重要的属性,作为必备元素或核心元素。两者罗列的内容形式都包括文字资料、图像、声音、口述、音乐、数据集、程序等几种类型。但两者的区别在于:ISBD的内容形式属于后组式,因为其只定义了11种基本的内容形式,但内容形式还可以通过一个或多个“内容限定”来扩充。内容限定可以使用类型限定(如表演型、地图型、记谱型)、维度限定(2维、3维)、感官限定(触觉、视觉、听觉、味觉、嗅觉)来表示①在此需要特别说明的是,GB/T 3469-2013新增了资料类型限定(如图书、期刊、报纸、学位论文、古籍、手稿等),用于限定内容形式为文字资料或图像的资源,并且规定资源描述机构可根据自身需要选择使用或适当扩充。。RDA则明确定义了22种内容类型②这22种类型不包括其他和未指定的情形。其中,未指定是指所描述资源的内容类型不易确定。,不允许组配描述,属于先组式。后组式较先组式而言,其内容形式的术语扩展受到较少的限制,应用起来会更为灵活。

2.2.2 ISBD和RDA对媒介类型的界定

在ISBD中,媒介类型是指“用于描述承载资源内容的一种或多种载体的类型”[3]。而在RDA中,媒介类型被定义为“反映资源内容的浏览、播放、运行等所需中间设备的一般类型的分类”[4]。两者罗列的媒介类型皆涵盖音频、视频、缩微、显微、电子(RDA使用计算机)、立体、无中介等。另外,RDA还将媒介类型进一步细化,定义了一种用于描述资源载体表现的核心元素即载体类型。简言之,媒介类型和载体类型都是用来描述资源的载体,只是媒介类型的术语比较宽泛,而载体类型的术语则更加具体。

此外,无论是对内容形式还是媒介类型,两种标准在术语的选用上也存在一定的差异。如ISBD对于由三种或更多种形式适用的混合内容组成的资源,可以界定成“多内容形式”的资源类型;对于由混合媒介组成、三种或更多种媒介类型使用的资源,可以界定成“多媒介”的资源类型。但RDA无此规定。类似,对于所描述资源的内容类型或媒介类型不易确定时,RDA可以使用“未指定”,而ISBD并无此规定。

3 关于内容形式与媒介类型在我国应用的建议

上文分析表明,GMD主导下的资源分类存在诸多问题,RDA、ISBD和我国国家标准GB/T 3469-2013均废止了GMD及其词表,重新构建和定义了新的内容形式、媒介类型取值词表及其相关描述规则。下文将重点就内容形式与媒介类型在我国的应用实践提出相关建议。

3.1 建立基于内容形式与媒介类型的统一标准和格式

为了解决GMD著录混乱的问题,便于用户了解资源的形式与类型,准确地获取资源,建议首先采用基于“内容形式与媒介类型”的标准编制书目数据,形成统一格式。现阶段,图书馆对馆藏资源的元数据制作依然以MARC格式为主,GMD在MARC21中著录于245字段$h,在UNIMARC中著录于200字段$b。而MARC21及时新增336、337、338三个字段取代245$h,用于描述内容类型、媒介类型和载体类型这三个RDA元素。因此,国际上采用MARC21格式的图书馆大多会优先采用RDA的内容与媒介类型标准。

由于我国中文文献编目一直遵循国际图联(IFLA)所构建的体系,内容规则上遵循ISBD,数据格式上采用依UNIMARC而来的CNMARC,因此建议我国应尽量启用以ISBD第0项为蓝本的标准编制或改造数据。首先,ISBD第0项较好地贯彻了FRBR的内容表达和载体表现的理念[5],不仅能够更专指地描述资源的内容形式和媒介类型,而且在内容形式的描述上还能够灵活地组配;其次,ISBD第0项在设置之初也考虑到与DC元数据标准中元素“资源类型(Type)”①指资源内容的内在属性、形态或类型,如主页、小说、诗歌、手稿、技术报告、论文、词典等。与“资源格式(Format)”②指资源外在的物理特征或数字形式,如资源的媒介、尺寸或周期,如软件、硬件等。的关联[6],注重开放获取环境下与其他元数据标准的互操作。第三,UNIMARC书目格式拟新增181“编码数据字段——内容形式”、182“编码数据字段——媒介类型”、183“编码数据字段——载体类型”、203“内容形式和媒介类型”、283“载体类型”(对应MARC21的338$a)等字段[7],一方面用于支持ISBD第0项内容的著录,另一方面注重借鉴RDA的更加具体化的载体类型术语。

3.2 尝试基于内容形式与媒介类型项整合资源

在网络时代,资源的种类和形式变得更具多元化,整合具有内在关联的多种资源变得越来越重要。以国家图书馆的馆藏图书为例,其书目存在不同的版本,包括出版社发行的纸质版本、根据纸质版本扫描的电子复制本以及外购的网络电子书版本。针对这三个版本,国家图书馆通常会制作三条元数据,纸质版本的数据对资源的形式采用GMD术语“专著”进行描述,电子复制本会采用自创的GMD“电子资源·图书”,而网络电子书则采用DC描述,资源格式描述为“电子图书”。对于用户而言,这三个版本其实是属于同一个内容形式的资源,只是在载体形式上有所不同。那么如何整合这三条元数据,便于用户快速找到与该书籍相关的所有载体形式的资源,就成为一个棘手的问题。目前,国家图书馆正在尝试的做法是:采用GB/T 3469-2013对全馆自建、征集和商购的数字资源的元数据进行整合改造[8],通过在CNMARC数据中增添UNIMARC曾经讨论过的281、282字段分别著录资源的内容形式与媒介类型,在DC元数据中增添相应的两个元素。如果该做法被进一步应用到传统资源,其数据改造前后的变化情况如表2所示。

表2 国家图书馆元数据整合拟改造示例

在按照上述方法对元数据进行改造的过程中,也可能会出现一些问题。例如,对于文字资料和图像资源,依据GB/T 3469-2013所列的媒介类型术语,基本都会采用术语“无中介”,而对于大多数电子资源则都会采用术语“电子”。笔者认为,使用类似的术语可能过于宽泛,难以进一步区分所处理资源的载体粒度,必要时可借鉴RDA的载体类型术语。

3.3 使用便于用户理解的受控词汇呈现资源的分类

资源呈现的品质相当重要,图书馆内部的编目品质仍然是决定用户满意度的关键因素[9]。书目字段的多少及其呈现方式都会直接影响用户的喜好与使用行为。对于图书馆工作人员而言,内容形式与媒介类型的相关术语及资源的属性,与以往其所熟悉的文献类型划分标准大相径庭。对于用户而言,内容形式和媒介类型的一些术语并不符合用户自己的分类习惯[10],用户甚至很难辨识这些术语的异同。这自然会引发关于字段和术语显示选择的问题,如是否选择直接显示这些新的专业字段及其相关的内容信息。

笔者认为,图书馆可以将术语名称、字段的标签调整成用户可理解的名称,降低辨识的困难度。正如某些专家的提议:尽可能选用我国用户通用的用语,在不改变术语所涉及的内容与媒介范围的前提下,不必拘泥于对RDA或ISBD词汇的翻译[11]。但应尽可能地使用受控词汇,让用户在检索与浏览时更清楚,这也有利于后台的进一步分析统计。另外,前台可以选择对相关字段进行合并显示,也可以进行简化显示,并尽可能提升这些字段信息的可视性,为用户提供较为清晰的指引。

1Dana M.Caudle,Cecilia Schmitz.Keep it Simple:Using RDA's Content,Media,and Carrier Type Fields to Simplify Format Display Issues[J].Journal of Library Metadata,2014(14):222-238.

2GB/T 3469-2013信息资源的内容形式和媒体类型标识[S].北京:中国标准出版社,2014:6.

3国际图联编目组常设委员会.国际标准书目著录(2011年统一版)[M].顾犇,译.北京:国家图书馆出版社,2012:35,39.

4RDA发展联合指导委员会.资源描述与检索(RDA)[M].RDA翻译工作组,译.北京:国家图书馆出版社,2014:273,159.

5孙更新,张燕飞.《国际标准书目著录(2011年统一版)》的新变化[J].图书、文献与交流,2013(6).

6王松林,顾犇.从一般资料标识到内容形式和媒介类型:《ISBD统一版》的新特点[J].中国图书馆学报,2012(5).

7Slovenia M..The 24th Meeting of the Permanent UNIMARC Committee[EB/OL].[2016-05-15].http://www.ifla.org/files/assets/uca/puc -meetings/24th_puc_meeting_2014.pdf.

8曹宁,张炜.国家图书馆数字资源整合的探索与实践[J].国家图书馆学刊,2015(2).

9欧俐伶,杨东谋.台湾政府开放资料之诠释资料建置探讨[J].教育资料与图书馆学,2016(1).

10Carol Ou,Sean Saxon.Displaying Content,Media,and Carrier Types in the OPAC:Questions and Considerations[J].Journal of Library Metadata,2014(14).

11胡小菁.内容和媒介类型:RDA与ISBD对比分析[J].中国图书馆学报,2012(4).

(朱青青 副研究馆员 国家图书馆)

Research on Resource Categorizing and Format Display Based on Content Form and Media Type

Zhu Qingqing

The research shows GMD is not suitable to solve the problems on inconsistent classification pattern of the resource,multiple characteristics and granularity of categorizing resources,and scattered display of format information,while the resource categorizing and format display based on content form and media types can solve these problems.This article compares content and media types between ISBD and RDA,and three suggestions are given on how to better apply and implement content form and media type in Chinese libraries. 2 tabs.11 refs.

Content Form;Media Type;Carrier Type;Resource Categorizing;Format Display

2016-05-19

* 本文系国家图书馆2016年重点科研课题“‘一般资料标识’与‘内容形式和媒体类型标识’在书目数据中的应用”(项目编号:NLC-KY-2016-01)阶段性研究成果之一。

猜你喜欢
术语载体媒介
创新举措强载体 为侨服务加速跑
坚持以活动为载体有效拓展港澳台海外统战工作
媒介论争,孰是孰非
书,最优雅的媒介
欢迎订阅创新的媒介
反思媒介呈现中的弱势群体排斥现象
创新德育教育载体
以活动为载体以创新为抓手
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势