摘 要:本文基于《中国民歌集成·甘肃卷》中裕固族民歌的采集背景、具体内容和完成质量的分析,阐明了“集成”是裕固族民歌数据库建设中基础数据源的不二选择,并立足于大数据时代数据库的“数字人文”思维剖析了裕固族民歌数据库建成对其传统人文领域研究的可能性与意义。
关键词:裕固族民歌;数据库;数字人文
数据库在大数据与数字人文的助推下正悄无声息地成为传统音乐文化研究的新思路、新方法。这种“数理”优势正在强力驱动音乐文化领域的各类数据库建设及其数据信息技术的迅猛发展。在保护非物质文化遗产和弘扬中华传统文化的浪潮中,人口较少民族的传统音乐文化数据库建设更显得迫在眉睫。裕固族作为中国唯一且甘肃省独有的人口较少的民族,因其文字的缺失,一代代裕固人自觉或不自觉地将自己民族独特的文化基因符号深深地刻在了一首首民歌中,几百年来口耳相传得以延续。建立裕固族民歌数据库对其传统音乐文化储存、保护、传承与相关科研的意义是不言而喻的。
总体来讲,民歌数据库建设包含民歌数据内容与数据表达两大部分,一般情况下,音乐学者负责民歌数据的来源、质量和行业规范。而数据表达部分则多由信息技术领域的专家完成或主导。
1 裕固民歌的历史集成
音乐文本的基础数据源应该是裕固族民歌数据库建设的首要问题,它直接影响到数据库的准确性与可靠性。一般来讲,可靠性最高的是第一手资料,但是对于裕固族这样只有语言没有文字的人口较少的民族来讲,其民歌流传基本依靠口耳相传,没有了文字符号,语言几乎成了唯一的传续纽带。但随着现代文明对裕固人原有文化语境的“改造”,裕固后人的母语继承链条被不断消解,加之生活方式、审美取向、价值判断与其母语文化的渐行渐远,以至现在能用本民族语言演唱传统裕固族传统民歌的人越来越少,曲目的流失愈加严重。此种状况下,采集到的民歌资源不管是数量还是质量都与其黄金时代相去甚远。所以,裕固民歌数据中,音乐本体部分主要数据来源就不得不考虑其历史文献。对裕固民歌的系统搜集和整理工作始于20世纪50年代,笔者以为其中最优版本是1986年完成的《中国民间歌曲集成·甘肃卷》(下文简称《集成》)中收录的裕固民歌部分。《集成》完成于20纪80年代的改革开放伊始,当时对于西部经济欠发达地区的甘肃肃南裕固族自治县来讲,其生活习俗及包括民歌在内的文化生态都更接近其“原生”状态。更重要的是《集成》工作虽成于1986年,但却始于20世纪60年代,最终在集大成者杜亚雄先生的《裕固族民歌精选》246首的基础上完成。
1986完成的《集成》中共收录95首裕固族民歌,分西部(尧乎尔)和东部(恩格尔)两大部分,这种分法基于分布区域和演唱语言。实际上裕固族人讲西部裕固语、东部裕固语、汉语和藏语4种语言。从理论上来讲,裕固民歌也可用这4种演唱语言来分类。但事实上,除了单独用这4种语言演唱的民歌外,还有用其中的2种或3种语言混合演唱的情况,且这种现象变得越来越普遍。一般认为,纯粹用裕固语演唱的民歌属于本民族的传统民歌裕固民歌,与其他民族语言混合演唱的属于较晚出现的“新民歌”。从这个角度来讲,裕固民歌又可以分为传统民歌和新民歌两部分,这里又牵扯到现代裕固人的语言结构问题,要想直接区分传统民歌与新民歌已非易事。
再者,《集成》中将西部(尧乎尔)民歌按题材分叙事歌类、婚礼歌类等11类,共70首;东部(恩格尔)民歌分叙事歌类、赞颂歌类等7类,共25首(详见表1)。这些民歌在2017年出版的《甘肃民族民间歌曲全集》中再版,并将当时原班人马采集而未入编的32首民歌补录其中,使曲目达127首。前后两个版本区别有二:其一,原有题材分类的文字表述皆冠之以“长调”或“短调”民歌体裁形式加以区分,并整合了部分题材分类。例如,将“集成”中“催眠歌类”“学步歌类”“送葬歌类”“也赫哲歌类”这4类并为“短调·习俗歌”类,终使西部裕固民歌题材分类由原来的11类调整为7类,而裕固族东部民歌直接以长调、短调和少年这3类体裁区分。其二,1986年《集成》中对每一首民歌的唱词不但标注了汉语翻译,而且对演唱的裕固语言进行了国际音标注音。而2017《甘肃民族民间歌曲全集》中删去了演唱裕固语的国际音标注音部分,这样做的具体初衷是什么不得而知,但作为裕固族民歌数据库建设来讲,必是要将国际音标注音录入其中的,对于体裁与体裁的分类也理应如此,同一首民歌的两种甚至多种体裁表述或归属都应遵循历史文献原貌。因为如果不明了选取对象的多种表达方式,在提取数据时就会出现各种漏选,基于数据库研究的准确性自然会令人质疑。[1]
要补充的是,除1986版的《中国民间集成·甘肃卷》和2017年的《甘肃民族民间歌曲全集》之外,2000年的《中国歌谣集成·甘肃卷》中收录了55首裕固族民歌的汉语译词。值得注意的是,其中并没有按东部裕固族和西部裕固族进行区分,直接以“劳动歌”“时政歌”“婚礼歌”“情歌”“生活歌”“历史歌”这6个题材分类编录。虽然每首歌谣都没有乐谱,但从采录信息来看,当时都是留有录音的。所以对于数据库建设来说,这部歌谣集在提供汉译唱词和题材分类版本的同时,也提供了录音资源的宝贵线索,同时也是1986年民歌集成的重要旁证。
2 裕固民歌数据资源的收集和处理
系统收集处理不同来源的数据资源是裕固民歌数据库建设的重要环节。这一阶段要将裕固族民歌乐谱、图片、图书、论文、地方志等纸质资料,经整理、筛选、分类、汇总等程序后再通过翻拍、扫描、OCR、输入等手段形成电子文本。就乐谱来讲,以“集成”和《甘肃民族民间歌曲全集》为基础,搜集整理50年代至今已出版和未出版的各类裕固民歌曲词文本,如《裕固族民歌选》《中国少数民族民歌肃南裕固族自治县卷》《裕固之歌》《裕固族民间歌谣、谚语卷》《裕固族文艺作品选》等文献中的相关内容。通过筛选与甄别,按数据库对乐谱文献的标准进行规范修订。譬如,目前文献中的谱曲皆为简谱,这就需要在保留原稿的同时按照国际规范将所有曲谱译制线谱版本一并录入。此外,唱词部分也需按照1986年《集成》的思路,保留国际音标注音与汉语翻译两部分内容,除了原件扫描,国际音标部分可由语言学者校对后再行录入。再者,《集成》中民歌演唱者的个人信息仅有姓名一项,其他信息记录不全,那些缺失的身份信息对裕固民歌数据库和相关的人文研究来说是极具价值的,所以对有处落实的此类信息要做到最大限度的考证和追加。乐谱之外,相关的歷史文献、专著及各类学术成果等文献的搜集整理和录入也要做到详尽、客观和准确,已出版和发表的可实现与相关文献数据平台的合作共享,如超星图书、中国知网、万方数据等。要强调的是,除对历史文献的查漏补缺外,更重要的是当下的第一手数据资料的获取,尤其是现有传承人及民歌手的个人及演唱资料的多媒体录存。总的来讲,数据的录入要做到现有资料能力和手段范围内的“穷尽”。
作为民歌数据库建设,音像是最能体现音乐数据库本质与特色的资源类型,这种重要性来自两个方面:一是对于像裕固族民歌这样没有文字的民族的“歌声”来讲,音像留存的价值远远高于乐谱;二是音乐数据库的信息技术已经逐步实现基于“声音”的高级分析、比对和检索,这就要求数据库中音像格式资源的完整和准确。庆幸的是,虽然60年代民歌《集成》工作开展初期,录音设备的匮乏使相当数量的民歌采集都未曾录音,但80年代对裕固民歌进行系统采集时,录音机已经基本可以满足采录的需要。尽管硬件、操作以及“机器”对民歌手带来的额外压力等因素造成了不少录音效果的缺憾,但这些录音却已是裕固民歌数据库建设及相关人文研究最珍贵的声音史料。
3 裕固族民歌数据库的人文应用
民歌数据库的建成必然会干预传统音乐人文研究领域的理论与方法,改变传统音乐保护、传承和研究的思维范式。数据信息技术的不断进步扭转了传统音乐人文研究中取证数据的搜集与处理方式,促使传统音乐人文领域研究中数据归纳演绎的“多点”型人工筛查、分析、对比等操作范式向大数据时代“密集”型数据取证的数字人文(Digital Humanities)自动勘探与量化分析的靠拢与转变。这种数据手段在引发传统人文研究更多可能性的同时,回过头来可在定性与定量基础之上实现对已有研究成果的印证与扩充。
裕固民歌数据库建设对其不同来源资料高度集合的数字典藏(Digital Archive)过程本身就是驱动其史料积累和相关问题研究的内在动力。数据库中来自不同的时空的声音与文字,不断地累积形成的历史文献“堆”,以什么样的标准和方式来甄别,以什么样的逻辑方式来架构,这个过程本身就需要严谨的论证。通过数据资料的勘探(Date Mining)处理,历史文献之间潜在的关联逐渐浮现。这样的数据资料就不再是简单的“堆放”式储存,而是可以进行高级检索的活态数字人文资源。
传统音乐人文研究的主要动机来自某些偶然的发现,学者们通常会将这些偶然的暗示进行“大胆假设”,然后根据论证的需要来搜寻有力证据进行“小心求证”。这些用来验证假设的支撑材料的搜集与取舍不可避免地掺杂了主观成分,如此的操作流程难免会有损论证的客观性。而基于数据库的数字人文可以有效规避这种主观因素,它可以将研究对象所有能搜集到的材料不分“你我”进行分析、比对,最终以数据关系呈现客觀事实。譬如,不少学者试图通过裕固族民歌来考证其族源,恰好《西志哈志》《我们来自西志哈志》《路上的歌》等裕固叙述民歌中似乎隐含着某些有价值的信息。直接的有用信息来自唱词,所以主要学术成果大多来自语言学和历史学的相关领域。诚然,借助语义的明确指向,语言学的研究似乎更直接,但作为民歌的研究离开了音乐部分的话语总是所有缺失的。音乐学家杜亚雄先生2006年发表于《新疆艺术学院学报》的《裕固西部民歌和维吾尔南疆木卡姆比较研究》,是从音乐角度论证此问题的重要学术文章。全文从两地民歌典型的调式、体裁、篇幅、节奏节拍、旋律发展手法等几个方面论证了二者“差异点远远超过它们之间的共同点”的事实,[2] 并借助相关史料剖析了造成这种结果的历史原因。类似的研究成果可利用数据库进行佐证,借助数字人文的数据库可以在更大范围内回避取证的典型性问题,因为不典型情形的发现必须保证对数据资源的最大化占有和对海量数据的分析手段和能力。如果已经实现裕固族、维吾尔族、蒙古族甚至藏族民歌数据的建成和对接,利用数据库与数字人文就可能按需实现共享数据库内音乐形态、结构、时空分布等方面的量化分析与比对。再通过对量化结果的客观描述来呈现两种或多种民歌文化之间的真实状态。而这样规模庞大、关系复杂的数据分析不借助数据库和数字人文手段是很难实现的。
再如,学界对裕固民歌与匈牙利民歌关系考证的相关课题,也可运用数据库与数字人文。因为作为史实判断的数据支撑须有一定数量的积累,尤其是在实证手段很难施展或者有可能失效的人文领域,更要尽可能在考察对象所在范围之内甚至周边,做到举证数量的足够多和足够广。离开了因果关系的必然性,举证数量的多少或许直接决定了论证结果的可靠性。如果为数不多的裕固族和匈牙利民歌有某些相似或者相近特征,是不能充分说明二者联系的必然性的。因为这种相似性除了“同根相似”的可能性之外,或许是“不谋而合”的“独立成长的结果”。[3]但如果借助数据库的手段与方法进行“密集”数据信息的数字人文分析与提取的话,得出的结论就会更加可靠。笔者以为,多数情况下,数据和论证结果之间的关系正如马赛克和成像清晰度之间的关系一样,单位面积内马赛克数量越密集,所集成的图像显现就越清晰。理虽如此,但具体操作过程中如何应用数据库设计提取论证所需要的数据信息是有一定难度的。蔡际洲和向文的《长江流域“巴蜀—荆楚”音乐文化区划问题——运用音乐数据库资料进行实证性研究的尝试》一文,尝试“运用数据库中的音调数据进行地理分布状态的考察”,并应用地理学界GIS技术生成田哥音调的地理分布专题图,最终得出“重庆—鄂西”田歌音调的共性与差异性规律。[4]文章对220首田歌音调中的10种三音列各自的总时值进行了分类统计与分析比对,涉及113个市、县、区、乡行政区划范围,如此繁复的数据分析离开了数据库是很难完成的。基于数据库的大数据实现了对远超个人能力范围的海量数据的全样本的分析处理,“全面、完整、客观地刻画了研究对象,较之以往更有庞大的数据支撑,大数据具有大而全的超凡特性,缩小了人文学科研究中的不确定性”。[5]
4 结语
裕固族民歌数据库的建设可最大限度地将不同时空中有关裕固族民歌的历史文献、乐谱、音像、图书、期刊论文等资源高度集合成结构化的数字典藏。在数据库建设过程中,对于数据来源、版本和质量的甄别、选取与架构直接决定着数据库的准确性与全面性。数据库的质量又直接影响基于数据库内容研究成果的可靠性。
大数据和云计算时代的来临,使得裕固民歌数据库的建设直接与“大规模数据分析”和“人文计算”相融合,并以“后来者”的姿态规避之前同类数据库建设的“前车之鉴”。它的建成将引发裕固民歌研究领域有更多可能性的同时,对其传统人文研究进行“旁敲侧击”,为音乐人文研究增添量化色彩。
需要注意的是,在大多情况下,依托于数据库的大数据手段介入音乐人文研究中,只能是传统人文研究的辅助与拓展,数据本属“理”的范畴,而人文永远离不开“情”的左右,人文研究中不乏合情而又不合理的人文关怀。
参考文献:
[1] 陈佩辉.人文数据库建设中人文学者何为——以《全宋文》墓志铭亲属信息提取为例[J].图书馆论坛,2019.
[2] 杜亚雄.裕固族西部民歌和维吾尔族南疆木卡姆比较研究[J].新疆艺术学院报,2006(4):1-5.
[3] 冯文慈.中外音乐交流史[M].人民音乐出版社,2013:8.
[4] 蔡际洲,向文.长江流域“巴蜀—荆楚”音乐文化区划问题——运用音乐数据库进行实证性研究的尝试 [J].中国音乐学,2017(1):100-109.
[5] 欧阳剑.大数据视域下人文学科的数字人文研究[J].图书馆杂志,2018(10):61-69.
[6] 甘肃省民族音乐集成编辑办公室.中国民间歌曲集成·甘肃卷 裕固、东乡、保安、撒拉、土族卷[Z]. 1986.
[7] 甘肃省文化艺术档案馆,周永利.甘肃民族民间歌曲全集(第3卷)[M].甘肃文化出版社,2017.
[8] 周鸿德,贺卫光,候晓琴.裕固族传统民歌研究现状及发展问题[J].西北民族大学学报(哲学社会科学版),2009(06):115-121.
[9] 中国民间文学集成全国编辑委员会,中国民间文学集成甘肃卷编辑委员会.中国民谣集(甘肃卷)[M].中国ISBN中心出版社,2000.
作者简介:张鹏远(1979—),男,甘肃陇南人,硕士,副教授,研究方向:声乐演唱与教学,中国传统音乐。