非遗南音资源的收集与整理、元数据的创建研究

2020-10-12 05:36
非遗传承研究 2020年2期
关键词:南音整理资源

滕 腾

南音作为第一批国家级非物质文化遗产,多年来备受政府及社会各界广泛关注,并享誉海内外。对南音而言,其研究日渐丰硕,但是,在南音的数据库建设方面,却显得不够完善。诸多的南音文献资源,当然也包括当下各个高校的音乐资源,都没有进行充分数字化。这些宝贵的音乐资源的数字化是非常重要的,因为数字化的目的是信息资源的长期保存与充分利用。因此,笔者在数字信息资源建设与服务规范方面做了尝试与探索。在笔者的博士后出站报告《南音数据库的构建》中,主要对南音资源进行南音音乐文本与南音文化语境两大板块的研究,具体包括历史、组成(指、谱、曲)、术语、演唱、乐器、乐人、乐社、乐事、教育、传承、乐舞、其他等十二部分。报告试图通过传统南音与南音创作来研究南音的整体内容,工作方案是按照南音数据库的工作流程设定的,分别包括:南音数据库建设的背景和意义、南音资源的收集与整理、南音资源的分类与描述、南音资源的数字化与技术实现、南音数据库的应用与未来等五个部分。本文是笔者出站报告的第二部分。

对南音数据库而言,成功地收集与整理冗繁的南音资源是建立数据库的第一个非常重要的步骤。对数据库的“局外人”而言,什么是资源的收集与整理,怎样进行资源的收集与整理,资源收集与整理的关键问题是什么,以及在收集与整理资源的过程中会遇到哪些问题,是需要创建者(这里指建立数据库的人)缜密思考的系列问题。因此,对建立数据库的“局内人”而言,这些问题就显得至关重要。

一、南音资源收集与整理的问题

(一)收集与整理的定义

收集是指有着确定方向、明确目的的采撷和记录、收集材料的行为活动。它主要指调查采访、查阅和搜集资料。收集是关于采集资料的政策和行动,这种行动包括项目单位采取的一系列动作和决定,以及与资源捐赠者、创建者、出售者达成管理与使用和法律上的共识。所谓整理,是指针对添加的内容,建立知识上的控制,为以后的使用与资源的挖掘和提供准备的步骤。

(二)收集与整理的关键问题

1.收集的关键问题

收集的关键问题包括以下三个:首先,要思考目前我们拥有什么样的南音资源(包括资源内容和资源类型等),这需要相关人员进行整理。其次,需要明确收集什么样的南音资源,换句话说,就是收集南音资源的标准是什么,以何种方式划分南音资源的代表性内容,以及我们要怎样选择有代表性的乐人、乐事、乐社、乐域、乐类等。这就要求厘清南音资源的历史、地域以及分布范围。最后,对收集到的南音资源如何进行分类。对于资源收集人员每个环节的分工与组配等问题,应事先进行清晰的论证。

2.整理的关键问题

资源整理的有序程度关系到后续一系列建立数据库步骤的有章可循。只有解决好资源之间的依附关系、从属关系、关联关系、相关关系等,才能为下一步构建数据库打下坚实的基础。因此,整理资源的关键是要遵循以下几点。

(1)保存文化语境与生态环境

南音资源在创建、组成、积累时,必须保存与之相关的语境,即处理过程中要保存好语境或生态环境,并做好元数据保存,切忌元数据的丢失与更改。特别是对于复合式的集合(既有原生非数字的,又有原生数字的南音资源),其语境就会不同,就会存在复杂性。因此,要关注这两者之间的区别与联系。在保存原生非数字资源的过程中,除了对转换得来的数字资源应给予保存之外,对于原来的非数字资源也应该加以最大限度的保存。

(2)建立南音资源的知识管理

在处理的过程中,对于集合的理解应该比第一阶段更深入和巩固。建立知识控制的工作包括评估与确认集合中材料的类型,评估这些记录的价值,在集合的上下文中评估它们的关系。用最好的方式来整理这些材料,以保存上下文信息,便于日后访问,并且要把所做的决定和所记录的知识记录下来。

(3)提供南音资源查阅的方法

为了确保南音资源的可访问性,必须提供查阅的方法与途径。通常的做法是为查阅提供帮助,这种帮助是知识控制的产物,但并不意味着在知识控制建立前就无法访问。或者说,在知识控制中获得的扩展信息都可以用于查阅。实现发现的途径与之前整理和描述所用到的工具和步骤相关。这里涉及三个相关的问题:描述性元数据在哪里?如何访问?用户是否允许搜索内容本身?查阅还必须依靠工作开始之前的指导,而这种指导要参考项目的相关政策、管理领域以及记录的创建者。

(三)收集与整理中存在的问题

1.收集中存在的问题

宏观上主要有三个问题。第一,地域分布较广,收集的难度大,投入高;第二,对收集到的资源的归类,应设立相关的制度;第三,收集到的资源的存放问题。因此,要建立相关管理办法。比如:捕获与传输资源的方法;确认并处理含有病毒的以及其他威胁到保存文件的方法;处理重复的、冗余的或者超出范围的文件选项;保存资源的方法和策略;访问资源的方法和策略;处理机密的或其他敏感信息的政策和策略;保留或不保留原始的存储媒体;有条件地控制访问;关系到知识产权、版权的政策;根据相关的条件确保完整性和真实性的方法,以及能够保存管理和分发的数字内容类别(视频、数据库、文本等)。微观上,收集过程中也存在诸多问题。

(1)收集者与被收集者的关系问题

所谓收集者,是想获取资源的人或机构,被收集者是指为获取资源的人或机构提供资源的人或机构。通常情况,某些收集者获取资源的途径主要包括熟悉的人、地域、团体等。这些被收集者在有新的南音资源后,可能会提供给收集者。此处,收集者与被收集者未建立稳固的关系,这种收集者的行为是被动的。而主动的收集者通常情况应与某个个人、团体或地域的机构人员建立稳固的收藏关系,主动定期到各个收集地进行收集。

(2)收集资源的系统性和连续性问题

资源建设要遵从完整性和系统性,做到资源收集有主属、次第,立体与交叉。因此,南音资源的编辑要逐步形成一种资源总目录或书谱志,进而为南音研究者掌握和检索资源提供途径。研究者可根据资源总目录概览,对已有资源、待访资源和散佚资源等了如指掌。同时,对于未收集到的南音资源,要根据基本元数据(如名称、著录、作者、时间等)途径进行深入采集。

(3)南音资源分布的集中与否问题

从目前的研究成果看,南音的研究资源(主要包括论文、教材、音视频等)主要分为五种形式:第一,图书馆;第二,南音研究所、非遗南音研究中心、文化馆、博物馆等机构;第三,公开发表的国内外期刊论文,研讨会的学术论文,正式出版的专著、乐谱、教材、录音带、录像带和唱片等;第四,个人收集,如教师、科研人员、南音爱好者等收集的资源;第五,网上资源,其特点是资源的不完整性,存在碎片化的形态,梳理过程耗时、耗力、耗材。

2.整理中存在的问题

资源的整理是整个数据库建设过程中最为复杂的一部分,因此,在整理资源的过程中不可避免会存在诸多问题。我们要思考:第一,由于资源的收集整理需要多个人、多次工作才能够完成,因此,在工作过程中会出现整理的资源内容重复或丢失的现象。第二,收集上来的资源形式可能五花八门,工作人员怎样有效地处理与加工这些资源,并为下一步工作做好准备呢?解决这些问题都需要建立完备的工作规范,并详尽地记录工作流程,以备多次梳理与复查。

二、南音资源元数据的创建

南音数字化工程的实施需要处理复杂的资源的描述、表现、组织和利用的问题,而根本性问题是各类型资源对象之间的关联。元数据的创建能够有效地解决这一问题。元数据是为使用者提供资源描述、资源组织、资源分类等检索形式的有效工具。通过元数据的创建来解决南音资源的内容属性、南音资源的共享共建、资源的描述规范、资源检索获取的方便、资源定位选择的智能、避免南音资源重复建设等问题。在开始论述元数据的创建之初,定会有诸多学者会问,为何要建立南音资源元数据?

(一)元数据的含义与作用

1.元数据的含义

元数据(metadata),台湾地区译为“诠释资料”或“超资料”等。元数据的基本含义是“关于数据的数据”或“描述数据的数据”。常用的元数据类型主要包括:描述性元数据、管理性元数据、结构性元数据。在大数据平台中,元数据整合数据平台各个系统的元信息,例如,分布式存储的路径、存储量、变更、新增、删除等。

2.元数据的作用

元数据能够解决数据库中包含的数据信息数量、数据存储量、数据流关系(相关关系、等同关系、属分关系等)等,同时还可以有效解决用户会发生的系列问题。比如,所需数据的途径、数据使用的方法、数据产生的进度(数据的同步与变更)以及数据的实时掌控和分析等。总之,元数据主要是对资源的描述、整合、掌控等。因此,每个个体均可以对资源进行描述,当然也就会发生元数据项目与内容①一个基本的元数据由元数据项目和元数据内容构成。比如,一部作品,“作曲者”“出版者”都是元数据项目,而“×××作曲”和“×××出版社”即元数据内容。的千变万化,从这一点来看,元数据标准就显得尤为重要了。

3.都柏林元数据集

元数据标准包括结构标准(即元数据包含哪些项目,都柏林核心集,MARC 元素集)、内容标准、取值标准、编码标准等。在南音资源整理之初,必须对其元数据进行标注。本文在借鉴“都柏林元数据集”的基础上,针对南音资源的特点进行了系列扩展。

表1 都柏林元数据集包括的15 种元数据元素

续表

南音资源元数据的创建是一项繁复的工作,本文由于篇幅的原因,着重介绍文本(会议、论文、专著)、乐人、乐器、作品、歌曲、录音、口述史等几个部分的元数据创建。

(二)南音文本元数据的创建

关于文本元数据的创建,本文包括举办的各类会议、各类活动、论文、专著、论文集、教材等文本性的元数据创建。对于会议元数据的创建,笔者借用朱江等人合写的《开放会议文献资源的采集和跟踪》,这篇论文介绍了采录会议记录信息元数据集,其中元数据项包括会议的名称、名称缩写、日期、地点、主办者、学科分类、地域范围、会议录名称、会议录出版/发布机构等内容,向下与该届会议的每篇论文形成链接,向上与该届会议的会议系列形成链接。同时,元数据项还包括:去掉届次或年代的会议名称及缩写、会议论文的题名、责任者机构、会议沿革、主办者、已举办届次、会议频率、下届会议预计举办时间及网址等内容,向下与该会议系列的各届会议及会议录信息形成链接。

表2 南音会议基本元数据元素

续表

对论文与专著的元数据而言,可以根据研究范围进行划分,比如南音史学、南音乐学、南音文学、南音美学、南音哲学、南音社会学、南音民俗学、南音方言学等不同学科和领域的元数据创建与著录。对南音论文的元数据也可以根据论文类型进行划分,比如毕业论文/学位论文、学期论文、课题论文、会议论文、科技报告等。关于南音书目的元数据的采集,可以根据国籍、作者(著者、译者、编者等)、书目名称、出版地、出版社名称、出版时间、ISBN、版式、是否有光盘、总页数等进行划分。针对南音各类活动而言,可以根据“拼馆”仪式、“祭郎君”活动、“祀先贤”活动、婚丧礼仪、迎神会、正月闹元宵、南音大会唱等进行划分。可以根据不同的南音活动进行划分,比如可以根据南音活动形式划分为报告/讲座、研讨会、比赛、南音大会唱、仪式活动、生日活动、丧葬活动、节日活动、宗教仪式、庆典活动、婚丧嫁娶等。还可以根据活动的周期划分为日常性活动、周期性活动、临时性活动。周期性活动包括郎君祭仪式活动(又称为“郎君大仙”“孟郎君”“孟府郎君”)、宗教活动、设宴聚餐活动等;临时性活动包括交流活动(包括拜馆、南音庆典活动等)、三奠酒仪式活动、社会活动等。

(三)南音乐人元数据的创建

关于南音乐人的界定,主要涵盖与南音相关的系列人物。比如南音传承人(国家级、省级、市级、县级等)、南音创作者、南音教育者、南音爱好者等。南音乐人元数据的创建,其内容主要包括姓名、曾用名、性别、民族(国籍)、年龄、职业、籍贯(出生地)、现居住地、宗教信仰、文化程度、掌握的语言等基本元数据元素。通过对南音乐人不同元数据的采集与描述,可以清楚便捷地获得乐人们的历史时期、传承谱系、代际传承、乐人世家、乐人乐社以及相关联的各类活动,以此来洞悉南音传承与发展的生态环境,进而反观南音发展的整体脉络。

表3 南音乐人基本元数据元素

(四)南音演奏乐器元数据的创建

南音的演奏形式按使用乐器的不同分“上四管”“下四管”两种。“上四管”中以洞箫为主的称为“洞管”,以品箫(笛)为主的称为“品管”。“洞管”所用乐器有洞箫、二弦、琵琶、三弦、拍板等;“品管”则以品箫代替洞箫,定调比“洞管”高小三度。“下四管”的乐器有嗳仔、琵琶、二弦、三弦及响盏、狗叫(小铛锣)、铎(木鱼)、四宝、铜铃、扁鼓等,在惠安一带还用云锣、乳锣、小钹。其基本元数据创建的划分见表4。

表4 南音演奏乐器的基本元数据元素

(五)南音作品元数据的创建

每一部南音作品通常具有多种表现形式,一首作品的录制品包括以下几个层面。第一,演奏家不同,出版商不同;第二,演奏家不同,出版商相同,印刷乐谱的版本不同;第三,演奏家不同,出版商相同,数字乐谱格式不同等诸如此类的特性。对于南音作品的描述而言,这些包含共性与个性、微观与宏观等诸多的表现形式也必须囊括其中。因此,通过南音作品元数据的创建,既可以建立、呈现南音作品之间的有机联系,又可以记录南音作品在不同时期、不同地域的作品形式,还可以记录南音作品的结构、形成、处理、存储、检索、使用过程的整体。南音作品基本元数据元素见表5。

表5 南音作品描述与示例基本元数据元素

续表

(六)南音唱片与光盘元数据的创建

南音由“大谱”“散曲”和“指套”三大部分(俗称“指”“谱”“曲”)组成,既有用于歌唱的声乐曲,又有用于演奏的器乐曲,是内容丰富完整的音乐体系。随着整理工作的深入,指、谱的套数日益增多。因此,南音唱片的元数据创建可以根据南音曲目的类型划分为传统曲目、创作曲目、唐诗宋词南音曲目以及老唱片(老唱腔)等,然后再根据南音唱片元数据的识别信息(也被称作MP3 文件的ID3 标签)进行划分(见表6)。

表6 南音专辑曲目基本元数据元素

与此同时,针对某一个南音光盘的元数据元素的创建也要进行标注,比如:光盘编号、光盘名称、光盘类型(CD/VCD/DVD)、专辑名称、光盘出版社、出品单位、ISRC 号码、演奏单位、演奏乐器、演出人员信息、曲目信息、出品人、策划者、录音、艺术指导、封面摄影、题字者以及ISBN 号码等元数据信息(见表7)。

表7 南音光盘基本元数据元素例表

续表

(七)南音音视频元数据的创建

南音音视频资源的来源包括南音演出、田野调查、学术报告、讲座、研讨会、课堂等。资源可根据体裁、题材、风格、唱法、演唱形式、地域特色、乐器等来著录。表8 以录音元数据为例。

表8 两种录音元数据登记信息

续表

(八)南音口述史元数据的创建

关于南音口述史元数据的创建,可以根据采访的基本信息进行创建,比如采访者、受访者、受访时间、受访地点、采访主题、采访时长、访问次数、访问内容名称等,也可以根据口述史分类的不同标准,按照学科范围、人物身份、单位团体、历史时间等进行划分。根据音乐口述历史学科门类,可以划分为音乐学、音乐史、音乐人等口述历史。按照学科范围划分,可分为音乐教育、音乐创作与表演、音乐史等口述历史。按照音乐人的学术身份,可划分为音乐表演艺术家、音乐教育家、音乐学家、音乐评论家、民间歌师、民间乐史等口述历史。根据单位机构划分,可划分为院团、学校、院系、家庭等口述历史。另外,还可按不同的历史时期进行划分,可分为中国抗日战争时期、中国解放战争时期、中国社会主义建设十七年、“文革”时期、改革开放三十五年等音乐口述历史研究。同时,对于某一个人物的口述史还可以根据这个人物研究的发展脉络进行划分。比如“孙中山研究口述史”,可以包含:有关孙中山研究的研讨缘起、发展脉络、时代背景、研究领域、研究方法、学术思想、学术传承、学术机构、学术活动、学术流派、学术成果、学术名家、学术地位和社会影响等学术史研究的重要问题。

南音资源元数据的创建是为了帮助查找、存取、使用和管理信息资源的信息,元数据著录的规范与全面,对资源的查找和使用有很大的帮助。对于图书、期刊论文、会议论文、音频、视频等资源CALIS 都根据DC 元数据标准设置了相关的录入规范。乐谱作为南音的重要资源,目前还没有可以直接借鉴的元数据标准和规范。南音现有的传统曲目大多是通过南音研究者从民间艺人处进行采集、录制、整理出来的。多数曲目的创作人及改编人无据可循,乐器组合更是多种多样。一份乐谱包含的信息量很少,一般包含曲名、乐谱正文、流传地区、演奏人员、采录人、记谱人、演奏乐器等信息,而关于日期方面的记载很少,有一些甚至只有曲名和乐谱正文,没有其他任何信息。曲名相同而乐谱版本众多的情况普遍存在。因此在乐谱元数据著录规范中设置了曲名和乐谱正文必备以外,其他均为“有则必备”。另外,根据南音的特点,在乐谱元数据录入字段中,除了题名、主要责任者、信息来源等核心元素之外,还设置了个别元素如流传地区、演奏人员、演奏乐器、采录人、记谱人等字段。

综上所述,我们可以对南音资源收集与整理的关键问题与存在的问题进行剖析,根据各类不同方面、不同标准、不同对象、不同资源,进行多维层面的元数据创建。笔者在文中仅对南音元数据创建的几个主要方面进行了描述,还有更多南音元数据等着我们去开发与著录。再回到本文开头提出的问题,为什么要进行元数据的创建?(以南音传承人元数据的创建为例,见下图)答案是,为了让计算机能够了解和解释各个资源、信息、对象、元数据之间的关联、所属与相关关系,以及它们之间的文化谱系和历史脉络,从而进行南音资源各个对象以及对象间关系的保存和利用,使得南音研究者得以掌控南音资源的交叉性与整体性。同时,也为处理南音资源的信息描述、表现、组织和利用等实际问题,建设南音数据库奠定基础。

南音传承人的传承谱系

猜你喜欢
南音整理资源
弦管南音“固首”体系研究
庄丽芬 让南音流传得更远
我给资源分分类
李进杰的南音情
资源回收
FATE, PLAY, LOVE
做好绿色资源保护和开发
高一零碎知识整理
激活村庄内部治理资源
整理“房间”