中外文数据库非遗文献检索研究

2024-04-14 13:26
传媒论坛 2024年2期
关键词:检索数据库数字化

高 音

目前,国内学者对于非遗的保护与传承进行了较多研究,而对于非遗在中外文数据库资源中的文献检索研究相对较少。 传统的文献查询需要手动查找相关文献,效率较低且易出现错误。而经过数字化处理后的非遗文献可以通过各种检索工具进行多角度、多层次地检索和分析,支持高精度筛选和专题图谱生成,为文献管理和研究提供了便捷的支持, 有助于更好地挖掘非遗文化,推进我国传统文化的传承和发展。

一、非遗文献分类

非遗文献分类是非遗文献检索和管理的重要基础。根据文献的性质、文献所涉及的非遗项目、文献所属的学科领域等方面分类。目前常见的非遗文献分类方法主要有以下几种:

(一)按照文献性质分类

根据非遗文献的性质进行分类, 可以分为研究报告、案例分析、论文、题录、法规文件、学位论文、学术史料和非正式文献等几类。其中,研究报告是对非遗项目进行实证研究和分析的报告或调查研究结果的记录。案例分析主要介绍非遗项目传承中的典型案例。论文是对非遗项目传承、保护、开发等各个方面展开深入探讨和分析的学术文章。题录是对某一领域内非遗相关文献的汇编。 法规文件是列明与非遗资源相关的国家法规、行政法规、地方法规等文件。论文是对非遗项目深入研究的文章。而学术史料和非正式文献则包括了非遗项目的历史发展、民间传说、口述历史等文献种类。

(二)按照非遗项目分类

根据非遗项目的类别进行文献分类,可以分为传统音乐、传统舞蹈、传统戏曲、传统技艺、传统美术等几大类。其中,传统音乐包括民间音乐、宗教音乐、婚礼音乐等类型;传统舞蹈包括广场舞、舞龙舞狮、舞鼓舞钹等类型;传统戏曲包括昆曲、京剧、豫剧、越剧等类型;传统技艺包括瓷器制作、漆器制作、银器制作等类型;传统美术包括国画、油画、雕塑等类型。

(三)按照学科领域分类

根据非遗文献所属的学科领域进行分类,可以分为社会学、人类学、教育学、艺术学等几大类。在社会学、人类学领域,非遗项目被视为个体与社会、文化之间互动的产物。因此,非遗文献在社会学、人类学领域研究深入;在教育学领域,非遗教育得到广泛关注,成为教育研究的热点之一;在艺术学领域,非遗项目被视为一种特殊的艺术形式,因此,非遗文献在艺术学领域得到广泛研究。

总之,对非遗文献进行合理的分类,有利于非遗文献资料整合,进而方便检索。

三、非遗文献的数字化

非遗文献不能简单地将其放在数据库中进行检索,而需要对其进行专业化的标注和结构化处理。但是非遗文献具有多样性,涉及到的领域较为广泛,数据的收集和整理也是项繁琐的工作。因此,在标注和结构化处理时需要考虑各个方面的因素,需要制定完备的数字化处理方案和标准化的标注方法[1]。

(一)数字化处理的方法

数字化处理的方法包括扫描数字化、录入数字化和光学字符识别数字化等。 扫描数字化是一种直接将图书、报纸、文献等文物资源扫描成数字化图像进行保存和利用的方法,适用于仅含有文字、图片或少量元数据的非遗文献资源。录入数字化是指通过人工打字或录入软件将文物资源转换成电子化资源,适用于无法直接数字化的文物资源,如声音、视频、手写文字等。光学字符识别数字化则是指通过光学技术将纸质文献转换成电子文本, 适用于文字量大且文字较规范的文献资源[2]。数字化之后的非遗文献资源通过多种方式进行再现,如网站图文展览、数据库检索、数字展览等[3]。

(二)数字化面临的问题

首先,非遗文献的特殊性质使得其数字化处理相对复杂。非遗文献所记录的是非物质文化遗产的相关知识信息,包括非遗的传承经验、技艺要领、文化背景等。这些信息的非线性特征和语义关联的复杂性,使得非遗文献的数字化处理需要考虑多个因素, 如数据结构设计、语义分析、信息存储和检索等。

其次,非遗文献的形式多样。因此,数字化处理需要结合实际情况,采取不同的方法和技术,对不同载体的文献数据进行处理。 如果非遗文献以口传的形式展现,则会表现出极具地域和行业化的语言特点。这样的语言特点在数字化处理过程中很难准确体现出来,因此需要通过自然语言处理等技术手段, 对数据进行预处理、标注和分析,以达到有效数字化的目的[4]。

四、中外文数据库资源中的非遗文献检索方式

(一)基于传统编目MARC数据的检索方式

优点:目前非遗文献种类多样,有些资源不易检索,如口述资料检索仍处于探索阶段,而且在图书馆人力、财力等有限的情况下,采用MARC著录是比较可行的方式。其技术门槛较低,不需要对操作人员进行专门的培训,便于实现同其他馆藏资源的有效链接,在美国的许多图书馆中得以采用。美国阿拉斯加大学费尔班克斯分校(University of Alaska-Fairbanks) 在口述资料著录中使用MARC取得了很好的效果,“使用MARC著录并将口述历史融入图书馆数据系统中, 并且对手稿和磁带开展了馆际互借后,流通数据显示,口述收藏的利用显著提高”[5]。

缺点:MARC在提供全文检索、 与网络检索工具以及数字抄本的元数据的融合方面存在缺陷。

(二)非遗文献主要的检索方式

1.关键词检索

优点:操作简单、应用广。如《人民日报》图文数据库采用关键词检索,以《人民日报》图文数据库为数据来源,通过在“标题+正文”中检索“传统美术”为标题的报道,并对检索结果在发布时间顺序上进行了分类整理。

缺点:由于传统名词与科技名词、学名与传统名称等之间的复杂性,非遗文献在数据库的检索语言存在很大的问题。

2.分类检索方式

优点:界面简单易操作,如中国非遗文化遗产数字博物馆、《人民日报》 图文数据库中非遗报道的检索等。《中国非遗文化遗产数字博物馆》采用分类检索,在“影音”“图集”模块下点击直接跳转到文献,在“影音”中包括二级的分类检索的目录“类型”,可以进一步筛选“全部”“展演”“讲座”“其他”相关的文献。

缺点: 由于现有的非遗项目分类体系存在较大争议,所以,目前的分类检索在数据库运行中存在较多问题,许多项目归属类别不清,使得大量项目的类别归属需要依赖人为判定,查找困难[7]。

除此之外,利用地理信息系统GIS定位技术,建立非遗项目分布地图系统检索,也是目前在许多领域较为普及的可视化访问工具。 如在印第安纳州传统艺术网站上,“民间传统门户”(Folk Traditions Portal)就是一个集合该州所有传统艺术家信息的互动地图,可通过直接点击地图链接点,或通过门类、地域、全文三种途径进行检索,提供的传统项目数字资源包括文字、静止图像和音频等。

(三)非遗文献数据库检索方式

非遗文献专业的数据库检索方式主要是分析所要检索的内容,选择与内容相匹配的数据库,确定检索涉及的检索词,编写检索策略和分析检索结果。优点:可以粗略分析检索内容,确定所需文献的时间或类别等大致范围。缺点:这种的检索方式具有很大的难度和挑战,需要专业的检索知识和合适的检索策略以及选择合适的数据库。

1.数据库选择

首先,可以选择国内知名的数据库,如万方、维普、中国国家图书馆数字资源库,以及各个省建设的非遗数据库,如浙江省非物质文化遗产数据库、陕西非物质文化遗产数据库等。由于这些数据库均具有较高的文献覆盖率和检索准确率,适合用于检索涉及中国范围内的非遗文献。同时,这些数据库提供了多种检索方式,包括作者、标题、关键词等,极大地方便检索工作。

其次, 可以选择国际知名的数据库, 如ScienceDirect、JSTOR等,这些数据库尤其适合用于检索国外的非遗文献。这些数据库覆盖范围广泛,涵盖不同的学术领域和文化范畴,适合于进行跨学科、跨文化的研究,为研究提供了更加精准、专业的文献检索和下载服务[7]。

2.确定检索策略

对于非遗领域的研究,可采用多个中外文数据库进行文献检索。首先,可以选择中文数据库,如CNKI数据库,使用“非物质文化遗产”“非遗”“ICH”等关键词进行检索,同时,按照分类号(K892.3)和文献类型(期刊、学位论文等)进行筛选,以减少不相关文献的干扰。

其次,选择国外的ProQuest 和Web of Science 数据库。在ProQuest数据库中,采用了“intangible cultural heritage”“ICH”等关键词进行检索。而在Web of Science数据库中,使用了“intangible cultural heritage”“ICH”等关键词配合高级检索进行检索, 其中设置了时间范围,并按照研究领域(如人类学、艺术、社会学等)进行筛选。

最后,利用Google学术进行检索, 使用“intangible cultural heritage”“ICH”“non-material cultural heritage”等关键词进行检索,并设置时间范围和语言限定[8]。

综合以上检索结果,可以筛选出与非遗相关的学位论文、期刊论文、会议论文、专著等多种文献,为日后研究提供丰富的数据支持。

3.检索结果分析

通过对多个数据库进行检索,发现大部分文献都是以非遗项目名称作为检索关键词,这与非遗项目在中国的受关注程度有很大关系。在检索结果分析中,检索所用的语言类型对检索结果具有一定的影响。在中文数据库中,检索到大量相关的文献,而在英文数据库中,相关文献数量明显较少。这可能与中文数据库资源中较多地涉及到了中国的非遗项目有关。

四、总结

中外文数据库资源中非遗文献检索方式有很多种,需要注重非遗文献检索的非线性和多模式特点,通过多样化的检索方法,能够获取到更加全面、精准、有价值的文献信息。目前基于地图的检索方式相对较为先进和有效。因此,在选择数据库时,结合自身研究需要和检索策略进行选择,有效利用数据库检索技巧,建立合理的搜索语句和搜索策略, 采用筛选算法对大量文献进行分类、去重、筛选,优化文献筛选结果的精准度和覆盖度,同时也可借助文献计量学分析工具,对筛选出的文献进行关键词共现分析、 文献引用分析和主题演化分析,进而探究非遗文化遗产保护的研究热点、论文主题和作者影响力等因素。

猜你喜欢
检索数据库数字化
家纺业亟待数字化赋能
高中数学“一对一”数字化学习实践探索
2019年第4-6期便捷检索目录
高中数学“一对一”数字化学习实践探索
数据库
数字化制胜
数据库
专利检索中“语义”的表现
数据库
数据库