非物质文化遗产信息资源元数据模型研究

2011-07-24 06:12
图书馆界 2011年5期
关键词:数据模型对象文化遗产

李 波

(河池学院图书馆,广西 宜州 546300)

1 问题的提出

非物质文化遗产是各族人民世代相承的、与群众生活密切相关的各种文化表现形式和文化空间,[1]如民俗活动、表演艺术、传统知识和技能以及相关的器具、实物、手工制品等。网络化和信息化的高速发展,使社会经济、文化的全球化程度不断加深。在消费文化的强势冲击下,弘扬我国各民族优秀的非物质文化遗产,对保护民族文化多样性,促进国家文化创新具有重要的战略和现实意义。

在非物质文化遗产保护工作中,图书馆在信息资源的整合和组织方面具有独特的优势。发挥这一优势,建立非物质文化遗产信息资源数据库,可以说是图书馆参与非物质文化遗产保护的最佳途径。以非物质文化遗产项目为纲目,整合相关知识、图书资料、网络资源等信息资源,使之数字化、结构化、系统化,以互联网为平台进行资源共享,可以为非物质文化遗产的宣传、研究、传承提供丰富的信息资源和便捷的信息服务。在非物质文化遗产信息资源数据库建设中,元数据模型的设计(即信息资源组织的语义总体架构的设计)是一项非常重要的基础性工作,它是不同类型数据库在具体元数据方案设计时可依据的一个基础框架,是不同数据库系统间实现互操作和数据共享的基础。

2 国内研究现状和评析

国内对于非物质文化遗产信息资源元数据模型的研究尚处于起步阶段,从目前公开发表的成果来看,只有福建省图书馆的方允璋在其专著《图书馆与非物质文化遗产》中提出的“非物质文化遗产知识库元数据方案”。该方案提出的元数据模型以非物质文化遗产相关的知识元素为描述对象,使用DC元数据核心元素集来描述对象。[2]此模型存在的不足主要体现在以下三个方面。

2.1 模型不能充分揭示非物质文化遗产信息资源的内涵

DC的设计目的是描述网络资源对象,便于网络资源的辨识、索引、检索。在对象的内容方面,DC核心元素强调的是内容的通用性,而不考虑具体内容的特殊文化属性及其内在的知识脉络。方充璋元数据方案的描述对象是与非物质文化遗产相关的各种知识元素,其最主要的目的就是“认知”,而反映“非物质文化遗产”的特殊文化内涵应是其首要考虑的因素,但这显然不是DC要解决的问题。因此,将DC用于非物质文化遗产对象的描述实际上是一种忽视描述对象的特殊性、为规范而规范的做法。

2.2 模型的规范性和可操作性不高

与非物质文化遗产相关的各种知识元素,既包括抽象的知识,又包括具体的人、实物、空间、文献资源。这些对象除了“与非物质文化遗产相关”这一共同特征外,每一类型对象还具有自己独特的共性维度。如“人”的共性维度有年龄、学历、民族、种族等,“文献”的共性维度有主题、作者、年代、学科等。只有15个核心元素的DC要整合多个互不重合的共性维度且包容不同分类维度的巨大差异,在实践中必然会降低元素定义的明确性、逻辑性,用户难以形成统一的认识,据此,该元数据方案的规范性和可操作性不高。

2.3 模型没有清晰反映出信息资源间的关系

方充璋元数据模型没有反映出非物质文化遗产项目与其相关信息资源之间的从属、参证关系以及同一非物质文化遗产项目下不同信息资源之间的联系。由于模型的描述缺乏对信息资源之间关系的清晰架构,而同一非物质文化遗产项目主题下的众多信息资源势必孤立的存在,因此难以对信息资源进行类分,无法达成对非物质文化遗产项目的全面认知。

3 非物质文化遗产信息资源元数据模型设计应考虑的因素

3.1 充分反映非物质文化遗产的内涵特征

非物质文化遗产信息资源系统的应用以达成对非物质文化遗产的全面认知为最终目标,则其元数据模型所包含的对象、概念、属性应首先要充分反映“非物质文化遗产”区别于其他文化现象的特定内涵、知识脉络以及各类非物质文化遗产所具有的共性特征。

3.2 吸收应用已有的元数据标准

为了使元数据方案具有较好的规范性和与互操作能力,非物质文化遗产信息资源元数据模型的设计应充分吸收、应用、兼容目前流行的元数据标准。由于各种元数据标准的适用对象不同,如DC适用于网络资源,CDWA适用于艺术品,FGDC适用于地理空间。在应用已有的元数据标准时,应从有利于充分揭示描述对象特征出发,决定是整体框架使用还是局部使用,切不能盲目搬用。

3.3 元数据模型应具有较好的伸缩性

一方面,元数据模型应容纳较多的元素,有较强的描述能力。由于用户的具体需求是多样的、难以预期的,资源描述与信息检索技术的发展是迅速的,因此,一个元素丰富的元数据模型对信息资源的组织管理、内容揭示、数据检索会有很强的应用弹性。反之,一个元素匮乏的元数据模型,在面对技术升级、用户描述要求细化时,便会难以应付,需要不断的扩充修改,模型的实用性会大打折扣。另一方面,元数据模型的设计应有便于不同类型用户,针对不同的需求进行元素扩展的机制。

3.4 与已有的非物质文化遗产信息源对接

目前,我国已建立国家、省、市、县四级非物质文化遗产认定、管理体系,相关文化管理职能部门也已经建立有相关的信息系统,形成一套权威、规范的数据,如各省、市的《非物质文化遗产代表作申报系统》,各级文化管理部门与申遗信息系统都是未来数据库资源建设重要的信息源。因此,在元数据模型使用的元素、概念上,应特别重视与这些信息数据的对接,以便在未来的资源建设中,通过元素间的映射关系共享这些丰富的信息源。

4 非物质文化遗产项目对象的信息结构分析

非物质文化遗产信息资源数据库是一个按非物质文化遗产项目组织起来的信息系统。非物质文化遗产项目是其元数据的描述对象,每一个非物质文化遗产项目如“刘三姐歌谣”“侗族大歌”等就分别是元数据的一个基本单元。

非物质文化遗产项目是一种复合型对象,它既包括项目的遗产类别、分布地域、历史渊源、传承谱系等概括性知识内容,又包括与项目对象相关的人物、文化空间、实物、文献、网络资源等物理实体、数字实体。在信息系统中,与上述两种类型描述对应的是非物质文化遗产项目对象的内容描述、相关实体资源描述。在非物质文化遗产信息系统中,对概括性知识的认识需要相关实体对象来印证、补充、具体化。每个相关实体资源对象虽然是独立的,但它们在非物质文化遗产信息系统中,总是因具有与某一特定非物质文化遗产项目的关联性、指向性才具有认识价值。因此,对象知识内容与相关实体之间的关系也是项目对象描述的一个重要内容。这种关系描述主要体现在元数据在结构化信息系统中的组织方式以及元数据各组成部分在结构化系统中的层级关系上,也可以体现在元数据内容描述、资源描述中的“相关性”属性的定义上,而不作为一个独立的描述模块。项目对象的内容描述、相关资源描述,加上结构化信息系统所必需的管理描述,三个描述模块共同构成了对非物质文化遗产项目对象的描述(如图1)。

图1 非物质文化遗产对象信息结构图

5 非物质文化遗产项目对象的语义成分分析

通过对非物质文化遗产项目对象语义的分析,可为我们提供三个描述模块所涉及的核心属性和概念,这些属性和概念在元数据设计时,可对应于元数据的元素,或作为元素的定义的语义基础。对象核心属性与概念的分析和提取应首先考虑对象知识、资源内容的充分呈现,概念应具有一定的专指度,以便用户对信息的认知、检索与评价。其次,尽可能引用已有的元数据方案中的的规范概念、通用属性,可根据对象的属性特征,从一个或多个通用的元数据方案中选择接近和相通的概念实体,使元素定义具有通用性、规范性。[3]45-46

5.1 内容描述

非物质文化遗产的概念有其特定的文化内涵,因此,对非物质文化遗产项目的内容描述(也就是概括性知识描述)应反映其特殊的文化内涵特征。目前,在通用的几种元数据方案中只有名称、类别、主题、地域等通用概念可以借用,缺乏其他具有专指度的概念。在这种情况下,笔者参考《国家级非物质文化遗产代表作申报书》设置的信息项目提取了民族、历史渊源、基本内容、相关器具与制品、传承谱系、基本特征、主要价值、濒危状况、保护措施9个专指概念,[4]加上前述4个通用属性,自定义1个反映对象非物质文化遗产认定情况的“遗产认定”属性,共14个属性、概念,以此作为内容描述的元素定义基础。

5.2 相关实体资源描述

与非物质文化遗产相关的实体有传承人、研究者、工艺品、艺术品、实物、文献资料、组织机构、网络资源。以上8种实体对象按相似性可分为5个大类:1)人物:包括传承人与研究者,相关的属性有姓名、性别、地域、年龄、职业、职务、民族、简介8个通用属性。2)直观对象:包括工艺品、艺术品、实物,可直接参考使用VRC(视觉资料核心类目)或CDWA(艺术作品描述类目)元数据的元素定义。3)文献资料:具体包括图书、报刊、手稿、非书资料等、可使用MARC元数据的字段定义或DC元数据元素定义。4)网络资源:具有URL的、可访问的网络资源,包括电子文本、电子图书、电子期刊、网站、网页、视频、图片、音频等,可直接使用DC元数据元素定义。5)组织机构:属性有名称、地区、负责人、地址、简介、邮编、电话、邮件等。

5.3 管理描述

管理描述包括记录标识、记录创建者、创建机构、时间(记录创建时间、记录更新时间)、编码、语种等通用管理描述属性。

6 非物质文化遗产信息资源元数据模型

基于非物质文化遗产项目对象的信息结构、语义成分分析,我们可以构建一个非物质文化遗产信息资源的元数据模型(如图2)。这一模型基本体现了非物质文化遗产对象所涉及的核心属性与概念以及它们之间的关联、层级关系。在每个描述模块中,除笔者分析提取的属性、概念外,还设置了“自定义元素”集,用来容纳用户根据应用需要自定义的元素,在不改变基本结构前提下,使模型具有可扩展性。

图2 非物质文化遗产信息资源元数据模型

除引用的DC、VRC等已有元数据的元素定义外,本模型没有规定各属性、概念在元数据中的使用方式。在具体的元数据方案中,这些属性、概念既可对应元数据的元素名称,也可以是修饰词、值或是元素定义的规定性内容。用户可以根据描述详略级别的需要以及置标技术的选择进行灵活处理。如在内容描述中的民族、历史渊源、基本内容、传承谱系等9个属性,若强调对非物质文化遗产项目对象的内容进行较详尽的描述,则每一个概念可以对应设置一个元素;如只需要概括性描述,则可以只设置一个“摘要”元素,将以上8个概念的内涵作为元素的定义的具体内容。

基于前述对元数据描述对象基本单元的界定,在本元数据模型中,对每个非物质文化遗产项目对象的管理描述、内容描述都是不可重复的,每个对象只能有唯一的管理与内容描述。对于对象的相关实体资源描述部分,由于每个项目对象会有多个相关资源,每个具体资源的内容、载体、类型不同,所以对象的资源描述部分是可重复的,每一个具体相关资源在对象的相关资源描述中都应该得到反映。

7 非物质文化遗产信息资源元数据模型的使用

7.1 根据数据库的内容确定所需的元数据描述模块

在具体元数据方案设计中使用本元数据模型,首先要根据具体数据库所涉及的内容选择元数据模型中具体描述模块或模块中的组件。如《非物质文化遗产传承人数据库》,根据数据库涉及的内容分析,可确定其元数据应包括非物质文化遗产对象管理描述、内容描述模块以及相关实体资源描述中的人物描述组件。再如,设计开发一个包括纸质文献、电子文献的《非物质文化遗产研究文献数据库》,则根据模型中相关资源的分类,可以确定数据库元数据方案应包括管理描述、内容描述以及相关资源描述中的文献资料、网络资源描述组件。

7.2 根据数据库的功能和应用需要,选用所需的概念、元素

根据数据库对元数据详略的具体需要以及描述、检索应用的需要,在选定的模块与组件中选择所需的概念、元素,建立具体的元数据元素定义方案。在具体元数据方案的设计时,在确定元数据方案所包括的基本描述模块后,便可以根据描述的详略要求,选择全部、部分、分拆、合并使用基本模块中元素或概念作为元数据方案的元素、修饰词、元素定义内容。其次,考虑到具体的、特殊的描述、检索应用需要,可以增加用户自定义的元素,以容纳本模型没有涵盖的描述内容以及其他特殊的描述要求。如,若建立一个以人物介绍为重点内容的《非物质文化遗产传承人数据库》,则在具体的元数据方案设计时,在对象的内容描述模块中就可以只选择使用名称、主题、类别等通用型核心元素,而不需要使用历史渊源、基本内容、传承谱系、基本特征、主要价值、濒危状况、保护措施等专指性很强的概念。如果类似于《非物质文化遗产知识库》这样强调对象全面知识的项目,则在对象的内容描述模块中就可以使用上述专指概念,对非物质文化遗产的要关知识进行全面、细致的描述。

7.3 根据应用环境确定编码工具和元数据存储方式

本元数据模型只是一个语义和结构框架,它并没有规定具体使用哪种编码方法和存储方式。在信息资源数据库开发中,确定了元素的语义定义后,可根据数据库的使用环境、数据管理效率、通用性、互操作性需要确定使用何种编码和存储方式。以一个大型商业数据库为平台的大型的非物质文化网络多媒体资源数据库为例,从使用环境上,就考虑用关系数据库来编码和存放元数据。如重点考虑元数据在网络环境下互操性和可辨识性,则可考虑使用基于RDF 和 XML 的编码方法。[3]62

8 结语

目前国内对非物质文化遗产信息资源元数据的研究尚处于初级阶段,本人在前人研究的基础上,提出了自己的一家之言,旨在抛砖引玉,促进这一领域的研究。

[1]中华人民共和国文化部.国务院办公厅关于加强我国非物质文化遗产保护工作的意见[EB/OL].[2011-01-20].http://www.mcprc.gov.cn/sjzz/shwhs/200608/t2006083 1_70859.html.

[2]方允璋.图书馆与非物质文化遗产[M].北京:北京图书馆出版社,2006:208—219.

[3]赵 亮.元数据规范应用框架与编码[C]//缪其浩.元数据与图书馆.上海:上海科学技术文献出版社,2005.

[4]中国艺术研究院.国家级非物质文化遗产名录申报范本——阿诗玛申报书[EB/OL].[2011-01-20].http://www.ihchina.cn/inc/doc/asm.doc.

猜你喜欢
数据模型对象文化遗产
World Heritage Day 世界遗产日
Task 3
晒晒全国优秀县委书记拟推荐对象
基于区块链的微网绿电交易数据模型研究
关于PowerDesigner软件工程技术的研究
Tough Nut to Crack
攻略对象的心思好难猜
图说车事
ORM工具
文化遗产与我们的生活