大众标注在非物质文化遗产数据库中的应用*

2014-12-31 09:14刘向红承德石油高等专科学校信息中心河北承德067000
图书馆建设 2014年12期
关键词:类目课题组检索

刘向红(承德石油高等专科学校信息中心 河北 承德 067000)

当今,非物质文化遗产已经进入大众的视野,各地都在开展较大规模的非物质文化遗产(以下简称非遗)保护运动,数字化是保护和传承非遗资源的重要手段。而建设国家级及各地区、各专题的非遗数据库,必须要解决非遗资源的分类存储和管理问题,并提供较为完整的检索服务,所以,如何建立适合于非遗数字化保护与传承的分类体系是当前非遗工作者的首要任务。

本课题组正在建设承德地区非遗数据库。承德为多民族聚居地区,特殊的地理位置与人口结构在这里形成了独特的民风、民俗,使其积淀了较为厚重的非遗资源,承德地区现共有国家级非遗7项,省级非遗42项,市级非遗98项[1]。本课题组旨在建设网络数字平台,实现这些具有地域色彩的非遗资源的数字化保存、传播及申报。本文以承德地区非遗数据库为例,试图将大众标注这种在Web2.0环境下发展起来的分类模式应用于非遗数字平台,构筑一种全新的非遗数据库的分类体系。

1 我国非遗资源的分类现状及存在的问题

1.1 现 状

目前,我国的非遗分类方法主要有四类法、六类法、八类法、十类法、十三类法和十六类法,其中,以我国 2006年公布的《第一批国家级非物质文化遗产名录》 ( 以下简称《名录》) 的十类法较为权威,以《中国民族民间文化保护工程普查工作手册》(以下简称《手册》) 的十六类法较为精细。《名录》将非遗分为十大类:民间文学、民间音乐、民间舞蹈、传统戏剧、曲艺、杂技与竞技(第二批时更名为“传统体育、游艺与杂技”)、民间美术、传统手工技艺、传统医药、民俗[2]。我国在非遗申报和审批时一般都采取十类法分类。

课题组在调研阶段考查了国内现有的非遗网站和非遗专题数据库(如中国非物质文化遗产网·中国非物质文化遗产数字博物馆[3],成都图书馆的蜀风雅韵非物质文化遗产网[4],山东省非物质文化遗产保护中心的非物质文化遗产展览[5]等),发现这些网站和数据库对非遗资源的分类也多采用《名录》中的十类法,同时也使用网站自编的一些类目,这些类目一般根据非遗资源的外部特征划分,如传承人、地域、级别、民族等[1]。这样的分类体系在类目的设置上以艺术学、社会学的分类思路为借鉴,同时参考了档案资源、文物资源和旅游资源的分类方法,反映了非遗的内涵及本质[6],但其作为网络资源分类仍存在一些问题,以至于无法多层面展示非遗资源,缺乏用户体验。

1.2 存在的问题

1.2.1 列类简单,无二级类目,可操作性欠缺[1]。

十类法虽然具有较强的归纳性和总结性,然而从数字化保护的角度来看,目前的一级分类体系太过单薄,甚至有归纳不完善的地方,而且未设二级类目,这就造成一些门类的非遗数量庞多而又无其他类目可归。以承德地区民俗类非遗为例,这类非遗数量较多,各种民俗内容属性多有不同,但只能归入一级类目——民俗类。另外,课题组在分类时还发现,民俗类非遗和民间信仰类非遗难以区分,有的非遗(如兴隆山敖龙寺庙会、火神圣会)既可归入民俗类,也可归入民间信仰类。

1.2.2 立类面不全,无法多维度揭示非遗资源。

现有的非遗网站和数据库除了按照非遗的内容属性分类,同时还按照非遗的外在特征进行划分(如根据资源的主题、级别、民族、地域等特征),但还是无法完整表达非遗的多面性特征。以剪纸为例,在承德地区的非遗项目中,剪纸申报了三项非遗,因其地域不同,各具特色,有的注重剪的技艺,有的在纸的图案上特色突出,因此在“手工技艺”和“民间美术”两方面的归属问题上产生了矛盾,一般在申报时会把剪纸归到美术类,承德地区亦如此,但这样归类就无法揭示剪纸在民间手工技艺方面的独特性与特色。这种列类方式使非遗资源在数字化过程中呈碎片化,彼此之间缺乏联系。

1.2.3 非遗的分类标识中,缺少文化空间的表述。

文化空间为非遗的载体和场所,非遗文化表现形式与之息息相关,它是非遗生存的土壤,缺少文化空间的非遗很有可能变为无水之木,其生存状况自然无法保证。由于文化空间的定义和表述存在模糊和隐晦的特征,所以在对其鉴别、认定和实际可操作性上都存在难度,故而在国内外的分类体系中经常会忽略文化空间[6]。

2 大众标注的特点及优势

大众标注和以其为基础的大众分类法(Folksonomy)是近几年流行于互联网的一种用户信息自组织方式,这种方法允许用户使用标签(Tag)存储和管理自己的信息资源,并通过标签实现信息的分享和交流。国内外许多网站都在使用这种分类方式,如美味书签(Del1icio1us)、闪亮图片夹(Flickr)、CiteULike、豆瓣、淘宝等。这些数字资源系统都采取了用户参与、协同分类的方式,标签参与了信息的组织、浏览和检索[7]。

大众标注的优势在于:①大众分类法产生的分类是一种扁平化的、用户生成的分类结构,能够多维度揭示信息资源,比传统分类有更好的实时性和灵活性,是传统分类形式有效的补充。它摆脱了传统分类法固化的现象,与大众的认知程度密切地结合起来,为群体用户和信息资源之间建立了一座联系桥梁[8]。例如,承德地区的国家级非遗“隆化二贵摔跤”,在专家用户代表的传统列类中会将其标注为“民间舞蹈”、“王大中”、“隆化县”、及“满族”等,而用户加注的标签可以是“二鬼摔跤”、“乔相扑”、“道具表演”、“单人表演”、“康熙与鳌拜”等,从而可以多维度描述“隆化二贵摔跤”这种民间艺术形式,甚至可以描述其生存的文化空间,如“民间花会”等。②成本低,简单易用,体现用户需求,共享度高,信息更新及时,可操作性强。③用户体验度高。由于非遗的分类具有一定专业性,其资源的描述语言固化,普通用户对该领域内术语的了解、掌握程度不尽相同,无法提供准确的查询关键字,大众标注可以从用户的角度建立一套面向普通用户的非遗资源的通俗术语标签集,从而降低大众对非遗数字平台的访问门槛;其能描述传统分类无法揭示的内容,从而提高用户对数字非遗资源的利用效率[9]。

3 大众标注应用于非遗数据库的设计方案

3.1 构建资源分类框架

传统的非遗分类方法和大众分类法具有各自的优势和劣势。例如,在“隆化二贵摔跤”的案例中,专家用户代表了非遗的传统分类体系,分别从传承人、地域、民族、类别等角度对“隆化二贵摔跤”进行了专业性的描述,描述语言规范而且准确,但表现形式单一,列类面不全;普通用户代表的是大众对“隆肥二贵摔跤”所做的标注,分别从表演形式、别名、俗名、源起、表演的文化空间等角度做了大众化的描述,描述语言更为具体、详尽、多层面,但标注过于松散、自由,用词不规范,容易产生检索歧异和信息漏检、错检等问题。我国在建设非遗数据库时,可以将两种分类法结合,克服各自的不足,构建符合用户需求的非遗资源分类体系。因此,课题组制定了将大众标注应用于非遗资源数据库分类体系的设计方案(见下页图1)。

3.1.1 基本框架

如图1所示,基于非遗资源的内容属性、外部特征,按照分面组配法和传统列类方式,课题组先构建起非遗资源基本分类框架[1]。横向框架按照外部属性可以划分为8个分面:非遗类别、地域、级别、传承人、审批时间、民族、相关资源、相关机构;纵向框架按照每个分面的特征,以体系分类法的树状结构确定每一级的类目;在非遗类别分面,需将十类法和十六类法综合,加入“文化空间”等十类法缺失的分类,同时借鉴十六类法的二级分类类目。每个分类的类目可与其他分面的类目组配,形成许多组配类目,实现同一内容的多种途径检索。以剪纸为例,用户可从类别、地域、传承人、级别、民族等多角度进行检索。

图1 非遗资源数据库分类框架

3.1.2 基础标签库

如图1所示,对每一种非遗资源,课题组需预定义一些基础标签,即受控词,这一工作至关重要,因为使用大众标注的数据库平台,必须吸引足够多的用户参与,才能贡献有价值的标签,否则就失去了大众标注的意义。非遗数据库平台初建时,难以吸引大量用户,而且由于用户对标签的不了解,标签的贡献度也较低。所以需要预设一些基础标签,这一工作可由四部分人员完成,一是课题组在建数据库平台之初可预设部分标签,二是要求非遗申报者申报项目时预设或补设标签,三是通过授权高级用户(如相关方面的专家、工作者)的方式预设部分标签,四是邀请一些志愿者参与、加注一些标签。这样,一方面可利用这四部分人员的学科知识开发受控的、相对规范的标签信息,另一方面也促使这些人员将自己了解和搜集的相关非遗网络资源添加进去,构筑一个开放的初始非遗信息库。

3.1.3 基于用户贡献,构建自由用户标签库。

基于用户贡献,构建自由用户标签库是非遗网站运行后才能建立起来的,是对基础标签库的有力补充。尤其当非遗数据库平台积累到足够的用户量,大众标注就可以发挥其优势,甚至如图1所示,非遗数据库平台可以根据用户使用标签的频率修正和补充基础标签库,使标签更符合大众的分类习惯。为了鼓励用户参与,课题组设计了便于用户参与的多种形式。首先是数据库平台注册用户。注册用户享受多种权利,如系统推送其感兴趣的非遗资源、免费获取高级用户才能浏览的文献等,注册用户可以在收藏、浏览文献时加注标签,还可以在本数据库平台建立网络收藏夹,收藏其感兴趣的非遗文献。其次,为了增加用户体验度,用户可以在不注册或不登录的情况下加注标签。例如,用户浏览某一种非遗资源或某一标题时,系统会推送出弹窗,用户根据个人意愿自由加注标签。

3.1.4 形成基础分类与大众标注相辅相承的分类格局

课题组建设的非遗数据库分类框架中的传统列类与大众标注相辅相成,其基础分类(即图1的预设分类)结构是分面组配分类与体系结构分类相结合,是一种先组式的分类语言,用词规范、统一,互通性高,可以揭示类目间的层次关系,但其使用门槛高,与用户的互动性差;大众分类是该框架的辅助分类,大众标注是一种后组式的、扁平结构的自由分类语言,用词自由,使用门槛低,用户体验度高,但无法揭示事物间的等级关系,而且容易产生检索歧异和信息漏检、错检。所以,两种分类方式同时使用,能够相互补充,在保持非遗知识结构的同时,增强用户体验。非遗数据库平台结合用户对资源的标注次数给出每个具体资源的分值,将使用频率高的标签进行排名、展示,并与传统分类结合,多角度展示非遗资源,形成动态非遗资源库[7]。

3.2 功能实现

为了直观体现大众标注应用于非遗数据库的资源组织特色,非遗数据库需包含6个模块[10]。

3.2.1 基于传统列类和大众标注的资源浏览模块

资源浏览模块支持按照传统列类和用户列类两个序列展示资源,即用户既可以按照非遗资源类型、传承人、非遗级别、申请时间等分类体系浏览资源,也可以按照预设和用户加注的标签分类浏览资源。非遗数据库平台首页可按照用户使用标签和标注资源的综合指标更新最新和最热门资源,按用户对资源的点击率和标注的次数展示热门资源,从而保证在首页始终能体现非遗资源的最新动态。

3.2.2 支持标签检索的资源检索模块

非遗数据库的检索模块应该支持网络检索技术(如字段检索、布尔逻辑检索、模糊检索、截词检索等),同时还要支持标签检索途径。因为标签是用户用自己的语言组织的,可以是传统列类无法表达的关键词,往往更切合用户的需要。

3.2.3 管理员与用户管理模块

该模块主要功能是注册新用户、用户登录、编辑个人信息、修改密码及通过管理员设置用户权限。只有注册用户才可添加和管理相关资源,而且管理员模块可设置多级用户权限,非遗数据库平台聘请的专家、项目申报者、志愿者都可以设置为高级用户,享受较高级别的权利。

3.2.4 标签管理模块

该模块主要提供标签的创建、编辑、管理、发布、排行、移动、搜索等功能,并能够根据用户使用标签的频率形成标签云(Tag Cloud)。

3.2.5 链接收藏与共享管理模块

课题组设计非遗数据库时提供链接收藏与共享功能,这是使用大众标注的目的之一,即用户收藏资源的同时共享资源。每个用户注册后,都会有一个账户,这个账户其实就是个人网络收藏夹,它允许用户使用标签对收集的非遗网络资源链接进行简单的标引,用户收集的资源可以是本数据库平台采集的资源,也可以是其他网站的资源。而且用户在加注标签时,系统会推荐标签供用户选择,即其他用户标注这条资源时使用最多的标签和预设标签。这样,资源可以通过标签聚集、分类。同时,其他用户可以根据标签查找到相关的网页,达到信息共享的目的。

3.2.6 项目申报管理模块

非遗数据库平台设置了网上申报和审批非遗资源的功能,并且申报者作为高级用户,必须为所申报的资源预加标签,课题组尤其强调申报者要预加文化空间标签,以弥补文化空间类目的欠缺。

3.3 工具选择

课题组选择Drupal技术来开发非遗数据库,采用最新的Drupal7版本。Drupal是在Web2.0时代以开源方式发展壮大的CMS(Content Management System,内容管理系统),具备明显的面向对象思想和Web2.0特征。Drupal基于XAMPP技术架构,对于应用人员,它是一个功能强大的内容管理系统;对于开发人员,它还是一个强大的软件开发平台。Drupal支持自定义标签和预定义标签,自定义标签即用户自由标签,预定义标签即由具有权限的管理员和用户预先导入的基础标签。

课题组使用的网站服务器环境是windows,采用XAMPP集成环境,它包含了MYSQL数据库和Apache Web服务器。

3.4 关键技术

在非遗数据库平台中,系统实现的关键技术是对标签的各种相关操作,如标签的管理、浏览、排行等,以下为系统实现的几个关键技术。

3.4.1 标签的管理

课题组、专家、非遗申报者预定义的分类类目和标签(受控词)以及注册用户的自定义标签(自由标签)都可以成为用户检索的标签。管理员和授权用户登录后,可以实现对标签的获取、添加、修改和删除,并可以根据用户使用标签的频率对基础标签库进行修正和补充,普通用户可以对数据库资源和收藏的资源做任意标注。当用户进行检索时,将其检索关键词分别与自由标签和基础标签以及预设分类相比较并返回结果。

3.4.2 标签的浏览

查看标签是本系统重要功能之一,用户通过选择自己感兴趣的标签即可对其标引的相关内容进行查看。该功能的实现首先通过调用类标签的方法在标签分类表(Tag Catalog)中获取标签,然后在标签链接表(TagUrl)中获取标签指向的链接地址,在用户页面显示标签对应的资源和链接。

3.4.3 标签云的形成

标签云代表了标签的使用频率,可以表现为云的形式,也可以转换为热门标签排行。系统结合用户对资源的标注次数给出每个具体资源的分值,利用自动化工具即时抽取标引资源的标签,生成标签云,越是热门的标签在标签云中显示的字体越大且颜色越深,并提取出用户使用次数排行前10名或20名的热门标签数据,形成热门标签排行,显示标签名称和使用次数。这样课题组可将热点术语和主题集中展示,与传统非遗类目标引的资源共同组成动态资源库,热门标签所指向的资源可能是非遗业界最近的关注热点,也可能是用户最感兴趣的资源。

4 结 语

课题组建设承德地区非遗数据库是为了保护、传承这些具有地域特色的人类文化遗产,而资源分类是建设数据库的重要环节,课题组在建设数据库时,试图将大众标注这种平民化的分类形式引入数据库,与非遗的传统列类方式相结合,共同构建数据库的分类体系,以便尽量多层面地向公众展示、传播这些非遗资源,同时增强用户体验。笔者希望本课题的研究能够为非遗专题数据库分类体系的构建提供有价值的参考。

[1]董永梅. 非物质文化遗产资源分类探析[J]. 图书馆建设, 2012(9):35-38.

[2]黄永林, 王伟杰. 数字化传承视域下我国非物质文化遗产分类体系的重构[J]. 西南民族大学学报: 人文社会科学版, 2013(8):165-171.

[3]中国非物质文化遗产网[EB/OL]. [2014-08-11]. http://www.chinaich.com.cn/.

[4]成都非物质文化遗产数字博物馆[EB/OL]. [2014-08-11]. http://www.ichchengdu.cn/immaterial/.

[5]第二届非物质文化遗产博览会[EB/OL]. [2014-08-11].http://www.iqilu.com/html/zt/shandong/feiyibolanhui.

[6]宋丽华, 董 涛, 李万社. 非物质文化遗产分类的问题解析与体系重构[J]. 国家图书馆学刊, 2014(3):86-92.

[7]刘向红. 基于用户自组织的学科网摘门户的设计[J]. 情报理论与实践, 2011(6):102-106.

[8]傅青苗. 基于超网络的社会化标签使用特性[J]. 经营与管理, 2014(4):129-131.

[9]李志云, 徐士进, 武港山,等. 协同标注研究及其在数字博物馆中的应用[J]. 计算机工程, 2008(6):221-223.

[10]张妮佳. 数字博物馆的开发与教育应用研究[D]. 金 华:浙江师范大学教育学院, 2007:27-33.

猜你喜欢
类目课题组检索
天津大学环境科学与工程学院iSoil课题组
中国地质大学(北京)土地利用与生态修复课题组
本期练习题类目参考答案及提示
原科技大学新能源开发与应用课题组介绍
CLC与LCC类目同现映射方法研究
——以图情领域为例*
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
《中图法》(5版)“K历史、地理”大类的修订
专利检索中“语义”的表现
课题组成员