李建伟(嘉应学院图书馆)
地方文化资源知识开放共享实现
——以广东梅州客家山歌为例
李建伟(嘉应学院图书馆)
摘要:广东梅州客家山歌特色文化资源共建共享的关键是山歌元数据模型的设计。文章通过对山歌进行资源属性分析、特征提炼、规范控制等过程,以国际都柏林核心元数据为基本设计原则,结合山歌个性元素,设计出与梅州传统客家山歌艺术特性相符的元数据方案,并将成果应用于实践,真正实现特色资源的开放性知识共享。
关键词:特色文化资源;知识共享;客家山歌;元数据设计
专题特色库是指具有资源特色、组织特色、风格特色和服务特色的数字资源集合体。[1]各专题库深入地组织、整合、展示具有鲜明特色的地方文献资源,在特定学科领域内提供专业的专题知识服务,在地方文化建设中发挥着重要作用。目前虽然特色库种类繁多、内容丰富,但建设中仍存在许多不完善的地方,如建设者着重突出地方资源的个性特征,而忽视制定具有标准性与兼容性的建设规范,造成资源数据交互共享困难;[2]资源建设仅满足于文献信息的简单整合,缺乏资源组织的系统科学性,知识服务水平不高等。
专题数据库是保存与发展地方优秀文化资源的重要信息基地,科学的资源元数据模型建设是打造高质量数据库、实现知识开放共享的必要条件。所谓元数据,是指关于数据、操纵数据的过程和应用程序的结构和意义的描述信息,它的目标是提供数据资源的全面指南。[2]应用元数据对信息资源进行粒度描述以及对数据项进行准确解释,实现元数据互操作,对外提供统一的资源获取接口,是提高地方文化资源利用价值的核心,也是特色数据库发展的必经之路。
1.1建设背景
广东梅州传统客家山歌是我国著名的民歌,2006 年5月20日经国务院批准列入第一批国家级非物质文化遗产名录。[3]梅州客家山歌是客家先民在生产生活实践中世代创造的,历来由民间口头传承。然而进入21世纪后,了解、喜爱山歌的人剧减,山歌发展日渐式微,数字化保护发展山歌文化迫在眉睫。信息社会,客家山歌特色数据库的建设目的是要永久保存经过系统全面、完善规范收集整理的原腔原版的梅州本地客家山歌原始资源,更要实现不同地区山歌资源的在线共建互享,扩大交流范围,提高传播速度,重现山歌文化的艺术本质。
1.2资源收集与分类定位
梅州客家山歌,唱腔与表现手法丰富,艺术特点鲜明,各地区山歌的口音、曲调又不尽相同。课题组成员在原始山歌资源的搜集过程中,重点收集具有鲜明特色的地区山歌文化资源,资源搜集的区域范围力求涵盖梅州各市、县(区)。对所收集数量庞大的原始材料的筛选整理以鼓励数字保存为原则,同时遵循“MSCW”策略进行分类定位。
M(Must)是必须保存的重点山歌艺术资源;S (Should)是应该保存的东西,并且在尽可能的情况下保存的资源;C(Could)是可以保存的资源,在它不影响其他资源的情况下;W(Won’t)是无需保存的资源。
上述原则适用于所有数字材料的归档和长期存储,为后续数据库资源的丰富补充提供方向依据。
1.3元数据标准规范的选择
元数据是专题数据库建设的核心,数字对象创建时嵌入科学的元数据结构,不仅利于复杂数字资源的组织与检索,而且在资源传播过程中可以最大程度地减少信息丢失。每个元数据元素对资源的组织、互操作、数字识别及归档保存都不可或缺,且功能同等重要。梅州客家山歌作为一种地方文化艺术,目前国内外尚无现成的完善规范的元数据著录规则可以直接借鉴,这成为制约山歌数字化平台建设的瓶颈。DC元数据是包含15个“核心元素”的集合,每个元素可选且可以重复,允许以任何次序出现,因此扩展性与互操作性强,适用于不同形式资源的描述。为实现传统客家山歌文化资源的标准化开放共享,课题组采用DC元数据为资源描述的标准规范,同时参照《国家图书馆专门元数据标准与著录规范——视频资源》《国家图书馆专门元数据标准与著录规范——音频资源》等国内外元数据规范及相关研究成果,从中初步遴选需要复用的元素及元素修饰词。
长期保存梅州地区山歌资源的山歌特色库,所属资源类型特点不尽相同,为满足今后与其他山歌资源建设单位进行数据互操作,课题组尽量按照DC基本元数据对山歌属性进行分析、归类,形成资源的属性并集,然后根据这些并集属性设计元数据。关键流程如图1所示。
2.1文献研究方法
图1 客家山歌元数据设计的关键流程图
为形成完善的山歌属性并集,课题组到梅州各县、乡镇进行广泛的原始山歌资源的收集整理工作,详细了解客家山歌的内容、结构、分类、演唱形式;从历史性的角度梳理客家山歌的创作、表演、传播规律;通过查阅山歌研究文献,详细了解学者们研究的主要对象。如梅州客家山歌的发音形式和行腔方法是学者所关注的重点对象,因此优先考虑将发音形式、行腔方法纳入山歌元数据方案的核心元素之一。
2.2客家山歌属性术语定义
山歌的属性主要划分为内容特征与外表特征。内容特征则是山歌所表达的艺术形式与内容形式;外表特征是山歌的实物存在特征,为实现山歌的存储与管理需要设置一些管理和保存元素。课题组以收集的具有鲜明特色的山歌资源为研究对象,参考山歌专业文献,认真比对梅州客家山歌与其他地区山歌及民歌的共性与个性特征,从而对山歌的主要属性做归纳定义。
表1 客家山歌的部分术语定义
2.3元素的归类扩展与复用
山歌属性特征初步提炼后,课题组组织音乐学者对每一个山歌元素、元素修饰词及必备性的设置进行权衡论证,不断提高元素选取的合理性和元素取值表达方式的科学度,依次扩展了体裁结构、类型、音乐形式3个客家山歌个性元素;针对都柏林元数据15个核心元素中,复用其中题名(title)、创建者(creator)、次要责任者(contributor)等13个元素,山歌元数据方案中共设置16个核心元素。
2.4山歌元数据模型的制定
以梅州客家山歌为主要研究对象,结合广东其他地区及其他省份客家山歌的特征,历经山歌采集整理、试验样本著录、学者意见征询、开放性测试等阶段,课题组逐步完善形成《梅州地区客家山歌元数据著录规则》,规则中逐个对每一元素的著录内容与取值范围均作详细的限定说明,同时建立标准文档对著录过程中可能遇到的特殊情况进行补充解释。各元素及元素修饰词见表2及表3。
表2 客家山歌元数据复用DC核心元素对照表
表3 客家山歌元数据个性元素
3.1山歌管理元数据
管理元数据的设置是为满足资源格式匹配转换、保存管理、访问权限控制等功能。课题组复用DC部分核心元素,补充修改元素修饰词,同时建立适用于不同资源子库的元数据模板,实现子库间的数据应用与互享。关键管理元数据复用创新表现在以下方面。
(1)题名(title)。客家山歌是一般民众之歌,由客家人口头创作、传唱,版本众多。为完整揭示客家山歌的题名特征,同时实现“题名”元素的唯一性,山歌核心元素“题名”补充“并列题名”与“交替题名”两类元素修饰词。具体著录格式为:演唱者+唱+创作者+题名。例:林钦英唱肖建兰《你系敢过妹敢连》。如果因同一首山歌的演唱者或创作者为多人,则按作者排序设置多种题名组合,确定其中一个为正题名,其余以“交替题名”著录。
(2)创作者(creator)。由于客家山歌原创者的平民化,山歌在传唱过程中会经过不断修改,但传唱歌手依据原曲调进行修改创新时,本身并没有给予它正式公开的名称。为更好地体现山歌词曲创新的传承性,方案定义了“辑词”、“编曲”两个元素修饰词,对为原创者定义的元素“创作者”进行修饰。
(3)次要责任者(contributor)。因客家山歌的原生态和草根性,传唱歌手众多,因此元素演唱者复用DC元素的“次要责任者”,元素“次要责任者”是指对山歌负次要责任的个人或团体,主要指山歌演唱者及表演者。
(4)日期(date)。元素日期指元素题名的正式演唱日期,此外基于数据著录的完备性,方案还析出山歌资源集包括CD、DVD等的正式出版日期、原始收录的山歌经过数字格式化后的资源收藏日期以及正式上线发布日期3类日期相关修饰词。原则上应严格按相应的日期匹配著录,如果演出日期不明确,允许选用出版日期替代。
(5)标识符(identifier)元素。元素标识符是所有录入数字资源的唯一标识,方案采用URI(统一资源标识符)或DOI(数字对象唯一标识符)或ISRC(音像制品国际标准编码)或ISBN(国际标准书号)模式。标识符元素是必备元素,对所标识的数字对象而言,相当于人拥有了唯一的身份证号码,可以实现多元网络环境下对数字化对象的准确提取,有效避免资源重复建设,同时有利于开放链接。
(6)馆藏(location)元素。在山歌数据库的建设过程中,共建共享就显得尤为重要。为如实反映所标注录入山歌的具体来源,课题组复用了馆藏元素,并为之定义了3个修饰词。“收藏单位”和“馆藏地点”用来著录山歌数字化加工时山歌资源的拥有者以及实际的保存地点,方便实物查找。“典藏标识”主要用于管理与组织山歌,各建设单位结合自身编码体系自定义保存标签。
3.2山歌描述元数据
合理的元数据是客家山歌资源检索、快速浏览定位的基础。客家山歌艺术特点鲜明,课题组对山歌音乐特征进行细致抽取,拓展3个核心个性元素,并定义相应元素修饰词,力求对资源艺术特性进行全面刻画。
(1)体裁结构(Genre)。传统客家山歌歌词不仅章句结构区别于其他民歌,而且音调韵律也相当考究,特别是歌词内容的修辞手法尤为丰富,如古代诗歌中的“赋、比、兴”表现手法以及歇后、双关、顶针、反复等,无所不用。体裁结构是体现梅州客家山歌艺术特点的关键元素,课题组为此定义“章句结构”、“韵律”和“修辞手法”三个元素修饰词,全面诠释山歌结构的个性特征。
(2)类型(Style)。山歌是反映劳动者在山野田间即兴抒发思想感情的一种民歌,节奏自由、抒情性强,梅州厚重的文化以及独特的生活风情如兴教育、讲伦理、重道义等在山歌中均有体现,因此“题材”是元素“类型”的关键修饰词。其次,客家山歌作为一种民间文艺形态,在不同历史阶段的表演形态也有所差异,如1920年以前梅州山歌基本上是传统山歌,1920~1949年时期的山歌虽然曲调变化不大,但唱词内容和展演形式以革命山歌为主,因此添加“时代”为元素修饰词反映山歌的时代特点。再次,客家话是客家山歌的基本特征,也是有别于其他山歌的主要体现,梅州地区虽同说客家话,但不同地方的语音相差甚远,而且不同地区受地理环境、生活习俗等影响,山歌风格各异,因此添加“地区”元素修饰词以区分山歌的地区特性。
(3)音乐形式(Music)。梅州客家山歌的腔调有100多种,在众多民歌中独树一帜。[4]在梅州山歌的众多曲调中,部分地方的山歌又是某些曲调运用的典型代表,如“松口山歌特出名”。梅县松口镇的客家山歌,不仅该地区的口音如糯米糕一样饶饶韧韧特别好听,而且是羽调山歌的典型代表,自古名扬海外。因此元素“音乐形式”除了设置“曲调”、“演唱形式”、“音阶”、“风格”作为元素修饰词,还添加了“地方特色”作为元素修饰词用于突出部分地区优秀的特色山歌。
4.1元数据的实践应用
在课题组主持的客家山歌文化资源数字化平台建设中,构建多媒体特色库,成体系收集加工梅州市6 县2区的客家山歌文化资源,内容涵盖视频资料、音频资料、多媒体资料、图像资料、文本资料共五种类型的数字资源;同时运用元数据研究成果研发山歌文化资源信息系统,搭建了一个有效的集山歌文化采集、检索、管理为一体的山歌文化传承保护资源共享平台,平台提供专业的资源检索、全文获取、分类导航、热点排行等服务,同时为山歌音乐教学与传播提供专题的知识检索服务,真正实现客家山歌特色资源的知识开放共享。平台系统管理后台如图2所示。
图2 梅州客家山歌文化信息系统管理后台
图3为系统中对梅县松口经典客家山歌《手攀花树问文名》FLV视频文件的著录实例。
4.2元数据记录的质量控制
元数据记录质量决定了元数据在地方专题特色库中能否有效发挥“查找、识别、选择、获取”的重要功能。在开放系统环境以及资源整合、资源互操作趋势下,如何保证元数据的质量成为一个越来越突出的问题。[5]为提高互操作度,课题组针对元数据记录的可用性、完整性、时效性以及合法性进行质量控制,要求质量评估贯穿于数字对象的整个生命周期。
(1)可用性。可用性是指元数据记录能否准确地被理解和利用。山歌资源描述标注时,应忠于山歌原貌照实著录,尽可能涵盖山歌的重要特征项;然后对于待录入的资源原始信息,要求著录规范,符合读者的现代检索习惯,促使检索结果更准确全面;其次元数据元素的修改应确保功能相对一致,语法与语义准确,元数据使用的不正确会直接造成数据不准确;最后努力提高数据互操作程度,只有互操作程度高的元数据才适合馆藏资料和用户当前的需求,更能适合数字对象未来的使用需求。
图3 梅州客家山歌文化资源元数据信息系统
(2)完整性。元数据完整性与数字对象的资源类型或者特性密切相关。对于不同类型山歌资源,实现元数据完整一致的措施具体包括:①明确参考信息。所创建的数字对象要求拥有特定的数据标识符,如ISBN号或统一资源标识符(URI),目的是保证数字对象的真实性和完整性。②明晰资源关联。元数据记录的上下文关系是影响数据库内容环境的关键元素,准确的包含与被包含关系是实现数据完整与一致性的必选条件。③采用数字认证机制。对部分核心资源主要利用数字证书的唯一性和可靠性进行数字签名和签名验证,确保资源网上共享传递的安全性、完整性。
(3)时效性。时效性亦称元数据的生命周期,指元数据从产生、更新直至不能完成准确、全面地表达目标资源功能所持续的时间跨度。[6]生命周期越长的元数据其质量越高,生命周期越短的元数据,其质量衰减得越快。针对客家山歌元数据的生命周期管理如发布、删除和状态变更等,严格按流程操作,实现版本的具体管理,保证后续使用元数据系统的可靠性。(4)合法性。元数据是信息共享和交换
的基础和前提,元数据文件本身是具体对象,优质的元数据对象应具备可证实性、权威性、合法性以及可持久性。在实际应用中,要求所著录的客家山歌资源应声明数字对象的使用条件和期限,同时应确保馆藏对象的长期管理。
实践证明,开放环境中基于元数据仓储结构的山歌特色库可以很好地满足各类型山歌文化资源的整合、建设、专题组织方面的要求,元数据互操作的实现则为共建共享资源服务体系的构建提供了必备条件。在未来的数据库平台完善建设中,课题组将不断提炼补充个性元素,丰富充实元数据,提高对其他地区山歌元数据的兼容性。期望通过梅州客家山歌的数字化建设促使梅州传统山歌尽快走出目前传承与保护所面临的困局,重新焕发客家山歌的活力,为传承保护梅州市艺术文化起到积极作用,为推动世界客家文化的多元性发展贡献力量。
[参考文献]
[1]王伟赟.基于元数据仓储的专题特色库建设实践[J].情报理论与实践,2012(9):109-111,119.
[2]宋琳琳,李海涛.大型文献数字化项目元数据互操作调查与启示[J].中国图书馆学报,2012 (5):27-38.
[3]刘晓春.客家山歌的传承方式——以梅州市与兴国县为对象[J].民族文学研究,2007(3):121-127.
[4]王耀华.客家山歌音调考源[J].音乐研究,1992(4):65-74.
[5]曹月珍,马建玲.国内外元数据质量控制的研究进展与发展趋势[J].图书与情报,2013(6):101-104.
[6]黄莺.元数据质量的定量评估方法综述[J].图书情报工作,2013(4):143-148.
Realization of Openness and Sharing of Local Cultural Resources——Taking Hakka Fork Songs of Guangdong Meizhou as Example
Li Jian-wei
Abstract:Design of metadata model is the core of co-construction and sharing of Hakka Fork Songs resources in Guangdong Meizhou. This article analyzes the property, characteristics and specification control of fork songs resources and designs the personality elements of fork songs by referring to International Berlin Core Metadata. Based on above research, this article designs a metadata scheme according to Meizhou Hakka Fork Songs and puts it into practice to realize the openness and sharing of special resources.
Keywords:Special Cultural Resources; Knowledge Sharing; Hakka Fork Songs; Metadata Design
[收稿日期]2015-07-09[责任编辑]王岗
[作者简介]李建伟(1981-),男,硕士,副研究馆员,广东省嘉应学院图书馆技术部主任。
[基金项目]本文系广东省普通高校人文社会科学省市共建重点研究基地、广东省非物质文化遗产研究基地——嘉应学院客家研究院资助科研项目“梅州地区客家山歌文化资源搜集整理与数字化建设”(项目编号:14KYKT03)研究成果之一。
中图分类号:G250.74;G253
文献标志码:B
文章编号:1005-8214(2016)03-0044-05