西北民族音乐数字化学习资源库构建研究

2022-11-14 06:06岳晓融张立国
交响-西安音乐学院学报 2022年3期
关键词:西北资源库图谱

●岳晓融 张立国

(陕西师范大学,陕西·西安,710062)

一、研究现状

我国地方民间音乐具有鲜明的民族特征,体现着各民族特有的性格特点、民族习惯、审美情趣等,在民族表征、民族文化传承、区域经济发展中都发挥着重要作用。尤其是西北民间音乐形式多样、体裁丰富,可谓我国传统民间音乐博大的宝库,[1](P43-55)西北民间音乐在漫长的历史洪流中,不断发展、演进,形成了各自不同的音乐发展历史、鲜明的音乐特点和典型的艺术特征,其独特的艺术魅力,吸引了诸多学者学习和研究,越来越多的国内外学习者通过音乐学习资源库主动学习和了解我国地方民间音乐文化,民间音乐数字化学习资源库的研究者和用户数量也不断攀升。[2](P60-63)对中国知网(CNKI)数据库中有关民间音乐数据库设计方面的文献进行分类统计发现(检索时间截止2021年12月),1990年以来30多年时间里,音乐数据库建设方面的研究文献共有150篇,其中外文文献62篇,中文文献88篇,其中《人民音乐》《中国音乐学》各刊发相关文献1 篇;2000年之前的研究文献有2篇,2000年之后,相关研究呈逐年上升趋势。但是对民间音乐数据库建设方面研究文献仅有1篇,即2013年6月发表于武汉理工大学主办的全国性学术刊物《设计艺术研究》的《数字技术对中国民族舞蹈音乐数据库建设的价值》一文。

总体上看,学界对地方民间音乐学习资源库设计方面的研究,无论从研究数量、研究深入程度和研究宽泛程度上都略显不足,导致在地方民间音乐学习数字化资源库建设工作中缺乏相关研究借鉴。因此研究针对西北民间音乐数字化学习资源用户需求现状及存在问题进行精准分析,提出西北民间音乐数字化学习资源构建策略,能够填补民间音乐学习资源库数字化的理论研究空白,给后续民间音乐学习资源库建设工作带来一定的启发,并起到一定的实践指向作用。[3](P226-234)

二、研究设计

(一)研究方法

本文用到文献研究法、调查法(问卷法和访谈法)、归纳分析法等研究方法。知识图谱技术与音乐数据库两部分内容,运用文献研究法,查阅大量相关文献获得了充足的资料,以期能够全面了解本课题的研究现状、存在问题、研究价值和意义。研究过程中采用微信问卷调查法和访谈法,就西北民间音乐数字化资源库的设计及其分类方式进行了深入调查,为西北民间音乐数字化资源库构建提供了基本思路。运用归纳分析法,分析现有音乐数据库建设存在问题,为基于用户需求的西北民间音乐数字化学习资源的构建提供问题导向,从而实现理论与实践的结合。

(二)研究过程

1.数据的收集方法

(1)问卷设计

本文分析的重点是调查使用者对西北民间音乐数字化学习资源库的信息需求、处理需求、完整性、安全性等方面的需求。通过对用户的需求信息进行调查,对调查结果进行分析统计,得出数字化学习资源库用户需求,即资源库中存放的数据类型、用户需要对数据进行的处理、数据分类等。研究为了尽可能广泛地进行需求信息收集,采用了微信问卷的形式进行用户需求信息收集与分析调查研究。

(2)数据收集

本项调查最终回收有效问卷348份,参与问卷调查的人员来自12个地区,其中研究院(所)、高校教师与教育管理工作者、高校本硕博学生共计273人,占参调人员总数的84.8%(见图1);艺术学和教育学专业的参与人员共230人,占参调人员总数的71.4%(见图2)。

图1.参与问卷调查人员的职业构成柱状图①

图2.参与问卷调查人员的专业构成柱状图

2.数据的统计分析方法

使用SPSS25软件对本次问卷进行了效度检验,本次问卷的KMO效度分数为0.475,p〈0.05;用最为常见的柯隆巴哈Cronbach’s Alpha模型对量表的信度进行测量,本次问卷的Cronbach’s Alpha系数也未达到0.7以上,可以视为信度良好的标准,KMO和巴特利特检验结果(见图3)。

图3.分析问卷调查KMO和巴特利特检验结果

由于本问卷旨在全面真实地调查收集用户的需求,其中涉及到的调查题目共计20题,有9道题目为多项选择题,2道题目为问答题。例如您在使用数据库时,习惯根据什么对音乐作品进行检索?(可多选)答案选项有:A.作者 B.作品名称 C.作品年代 D.作品所属民族E.作品体裁形式 F.作品所属地域 G.作品内容(旋律、节奏、特征等)H.旋律哼唱。再如您使用过的数据库/音乐资源库,有什么地方可以改进?……这些题目在设计上属于非量表题,因此用SPSS25分析不能很好地代表问卷所测真实情况。

鉴于此,本课题通过专家审议的方法进行了信效度判断,专家一致认为本问卷题目设计合理,问卷投放方式科学及收回样本数量充足,因此问卷有足够的稳定性,对西北民间音乐学习资源库构建中的需求分析能够起到积极准确的参考作用,从“内容效度”来评判,该问卷设计合理有效。

三、研究过程

(一)基于用户需求分析的西北民间音乐数字化学习数据库构建思路

通过图4,首先可看出用户对西北民间音乐数据库最高的需求功能是数据下载,有86.3%的用户需要对数据库进行数据下载操作;其次是数据上传,有74.2%的用户需要对数据库进行数据上传操作;再次是数据管理,有58.1%的用户希望能够对数据库进行数据管理操作。

图4.用户对数据库功能的调查统计结果

调查统计还发现用户对西北民间音乐音视频资源的码流并无太高的要求;对西北民间音乐视频数据资源,比较倾向于使用MP4、AVI、MOV等视频格式资源;对于音频数据资源,比较倾向于使用MP3、WAV、MIDI等音频格式资源;对于图片资源,比较倾向于使用JPEG、GIF、PNG等图片格式资源。调查发现用户使用数据库时最大的关注点和期望就是资料齐全、检索内容准确(见图5),由此可见,资源单一、平台零散化、整合程度不高的音乐资源数据库,并不是学习者所热衷的学习资源库,不会受到用户的青睐。因此,基于用户需求的西北民间音乐数字化学习资源库的构建是一个需要按照一定的方式和规则对西北民间音乐数据进行整理、归类、存储、处理的过程,并且需要一个动态迭代性的扩充和完善。构建研究的关键步骤:一是进行用户的需求分析,包括数据、功能和性能需求;二是应对西北民间音乐学习资源进行知识获取与知识融合,对相关资源进行合理完善的类别划分;三是进行学习资源库的概念结构设计进行知识建模和知识计算。

图5.用户对数据库关注度调查结果饼

(二)西北民间音乐学习资源现状及存在问题透析

工业化、信息化、全球化时代的接踵而来,受社会经济发展及多元文化发展的强烈冲击和影响,有些西北民间音乐在流传中逐渐发生变异,呈现出特征弱化的现象;有些甚至已经濒临失传和绝迹的境况,民间音乐的社会功能和生存空间也明显弱化,有些原生态的西北民间音乐已经逐渐远离我们的视听。通过文献研究、归纳分析出西北民间音乐学习资源现状及存在问题如下:

1.现有的民间音乐资源库不能满足学习者需要

21世纪以来为了更好地保护和传承民族音乐文化,许多音乐学习和研究者怀着强烈的历史责任感和执着的音乐人精神,投入了大量精力和智慧,为保护民间音乐做了大量工作,其中新疆著名乐器研究和音乐理论家段蔷先生,一生致力于新疆民间音乐和西域古典音乐的整理收集;民族音乐学家、中国音乐史学家李石根先生在保护、传承和研究西安鼓乐取得了开拓性成果;基层民间音乐的守护者霍向贵先生,用一生的心血和精力完成了陕北民间音乐的采集和整理,彰显了对民间音乐传承的责任和情怀。[4](P43-44)

除此之外,为了研究、学习和传承民间音乐,以各专业院校为主力的音乐数据库建设群体建成了诸多音乐资源数据库,使民间音乐保护走上了数字化发展路径。[5](P118-125)但是建成的资源库一般为静态的数据库形式,并没有完全基于用户需求构建,且受彼时信息技术发展条件影响,其存储和利用都受到了一定程度制约,加之音乐资源本身所具备的形式丰富、异质多元等特点,给学习者高效精准获取知识带来了不便。由于静态资源库的智能程度不高,导致西北民间音乐学习资源的发展和传播的效度不高,制约了民间音乐的发展和创新。[6](P85-92)

2.现存民间音乐资源库不利于资源整合和利用

西安音乐学院图书馆研究员景月亲曾就音乐数据库的建设情况进行过专项调查研究,研究成果《我国音乐特色数据库建设的回顾与反思》一文发表于西安音乐学院学报《交响》2019年第2期。[5](P118-125)在该项研究中,景月亲对我国音乐数据库建设历程进行了回顾,对音乐特色数据库建设现状进行了调查统计。据调研,截止2019年,全国共建设有音乐数据库123个,各专业院校建设的数据库有93个;各类公共图书馆和综合大学图书馆也建设了一些音乐类数据库,主要包括音乐文献资源库、电子乐谱库、音乐期刊全文库、音视频音乐资源库、音乐教学辅助库、专题资源库等等。经调查研究发现,虽然现存各种类型音乐数据库数量不少,但数据库的品质良莠不齐,整体上存在以下问题:一是数据库构建缺乏整体性的行业规划;二是数据库建设规范与标准不统一;三是个体数据库的音乐资源形式比较单一;四是目前的音乐数据库平台零散化现象严重。这些现状与问题的存在不利于音乐数据资源的整合与共享,而且有些数据库建设完成之后,由于缺乏建库技术人员的持续跟进与技术支持,因此数据库缺乏维护与更新,导致访问量和使用率非常低,几乎变成了闲置数据库,利用价值不高。[7](P67-71)

3.现有民间音乐资源库的知识体系结构不完整

现有资源库的知识体系结构不完整,表现为以下几点:一是各零散数据库中音乐知识之间相关性表现不足,表现为零散性、缺乏关联,因而知识相对匮乏。[8](P55-62)二是在音乐知识范畴方面,现有的资源库建设所依据的知识范畴局限于现有条件下所能获取的资源数量和种类,不能完整呈现该知识体系的所有资源,因此现有资源库构建的知识体系已经不能满足“智能+”环境下学习者对学习资源的需求。[9](P1-12)三是知识之间的关系仅能呈现不同知识点之间的线性关系,或者关系不明确,导致知识获取障碍。[10](P23-28)以上几点导致现有音乐学习资源库无法满足智能、灵活、多样、开放的个性化学习需求。

(三)西北民间音乐数字化学习资源分类研究

通过对中国艺术研究院民族音乐学教授辛雪峰博士进行访谈②,得出构建西北民间音乐数字化学习资源库,科学、规范、严格、精确的资源分类是首要的前提和基础,学科基本概念模糊、分类不精准、不严谨的数据库,不但不能为西北民间音乐学习和研究工作提供良好的资源及应用服务,而且还会牵制音乐学习资源库的实现,更无法满足用户需求。对资源的形式和内容进行以下分类研究:

1.西北民间音乐学习资源形式分类

从调查问卷结果可以看出,用户在数据检索时,最习惯于根据作品名称和作者检索数据;其次是作品所属民族、作品的内容(旋律、节奏等特征);基于内容的旋律哼唱检索大众还并不太熟悉,因此表示习惯于用旋律哼唱进行检索的只有26.7%。作者、作品名称、作品所属民族等字段属于高频检索项(见图6)。因此,构建西北民间音乐学习数字化资源库,须从用户需求出发,按照检索习惯设置检索项。同时从数据存储类型上可分为文字、乐谱、音频、视频等超文本资源,如何将各类型数据资源按照知识标识、归属、类目进行分类,是构建基于知识图谱的学习资源库的关键。

2.西北民间音乐学习资源内容分类

西北民间音乐分类方式列表

我国西北地区是指陕西省、甘肃省、青海省、宁夏回族自治区、新疆维吾尔族自治区5个行政区域,具体可划定为陕西省中到北部、青海省东部、内蒙古自治区西部等等。西北地区主要聚居着汉族、回族、蒙族、藏族、维吾尔族、哈萨克族、俄罗斯族、土族、羌族等20多个民族,是我国少数民族主要聚居区之一,少数民族人口约占全国少数民族总人口的1/3。西北地区位于我国的高原地区,西北地区各族人民在漫长的历史演进中,受传统文化、自然环境、宗教信仰、风俗习惯等多种因素影响,在长期的生产生活和社会劳动中逐渐形成了具有强烈地域特色的民间音乐。从音乐体裁形式上看民间音乐可以分为:民间歌曲、歌舞音乐、民间器乐、曲艺音乐、戏曲音乐等。[11](P55-75)结合需求分析问卷调查结果,辛雪峰教授指明在构建基于知识图谱技术的西北民间音乐学习资源库时,应参照中华人民共和国文化部、中国国家民族事务委员会、中国音乐家协会编写的《中国音乐集成》,本课题试将西北民间音乐按以下方式进行分类(见上页表格)。

(四)基于知识图谱技术的西北民间音乐数字化学习资源库的构建

1.数字化路径选择

西北民间音乐作品常见的存储形式主要包括乐谱、音频、视频、图片、文字等非结构化数据。用户对资源库的需求是一个动态性不断发展和完善的智能化资源库,能够满足学习者“终身学习”的开放性资源库。因此在构建西北民间音乐学习资源库时,应以学习者为主体,选择“智能+”的数字化路径,对相关学习知识进行资源聚合,构建自主学习环境。[12](P1254-1266)知识图谱技术是近年来人工智能领域研究的热点,知识图谱技术有超强的自然语言处理能力,对语义的理解准确;支持非结构化、半结构化和结构化数据等多种数据类型的接入和处理;能够进行大规模数据处理,支持百亿以上级别的实体和关系的高效导入,同时知识图谱构建是一种动态扩充不断迭代和完善的过程。[13](P28-32)因此,基于用户需求利用知识图谱技术构建西北民间音乐数字化学习资源库,能够使西北民间音乐的整理、归类、存储、利用及传播更趋于规范,也更加完备和便捷,能够降低网络环境下西北民间音乐学习者的“知识迷航”,能够帮助学习者高效获取高质量知识,形成清晰知识体系,知识图谱是人工智能与开放式教育资源有机互融的有效载体,也是智能教育的丰富。[14](P25-28)

2.数字化系统架构设计

基于知识图谱的西北民间音乐数字化学习资源库的系统架构设计流程(见图7)。

图7.知识图谱构建系统架构

3.数字化音乐资源的采集和提取

利用网络爬虫工具按照一定语义规则对网络现有相关西北民间音乐的数字化音乐资源数据进行采集和提取,并对提取到的知识进行预处理,为搜索引擎提供知识来源。网络爬虫的工作流程是:首先选取一部分关键词,也称统一资源定位符(Uniform Resource Locator,简称URL);然后将这些URL放入待抓取URL队列;再从待抓取URL队列中取出待抓取URL,通过DNS解析,将URL对应的网页进行下载,存储至指定的网页库中;[15](P123-127)最后分析已抓取URL队列中的URL;筛选出其他还未抓取的URL,放入待抓取URL队列,进入下一个循环。

4.数字化音乐资源合并与融合

西北民间音乐数字化资源合并与融合是将网络爬虫采集和提取到的来自不同资源库的西北民间音乐知识实体合并与融合在一起。目前知识融合的主要技术挑战有两点:一是数据质量的挑战,如数据命名模糊、数据输入错误、数据丢失、数据格式不一致等;二是数据规模的挑战,如数据量过大、并行计算复杂、数据类型多、数据关系复杂等。[16](P23-28)数字化音乐资源合并与融合的基本技术流程(见图8)。

图8.知识图谱的知识融合技术基本流程图

该流程主要是对经过采集提取、合并融合的西北民间音乐知识数据,进行数据计算,通过本体或相应的规则进行推理,从而获取数据中的隐含知识;再通过数据链接映射出数据实体间的关联;通过计算在网络上获取知识图谱上的知识单元之间的路径联系。[17](P48-54)

5.西北民间音乐数字化学习资源库知识图谱呈现

本文的最终阶段是将以上采集提取并加工处理过的数据呈现在图数据库中,也是最终知识图谱呈现的重要环节。Java具有简单、可移植、稳健、安全等良好性能,可以利用Java面向对象语言设计与实现可视化学习者前端界面。[18](P107-110)Django是一个开放源代码的Web应用框架,用于创建模型的对象关系映射,为最终用户设计的完美管理界面,具备一流的URL设计、设计者友好的模板语言及缓存系统;[19](P1924-1928、1942)因此可以利用D j a n g o 实现将前端学习者界面与后台数据库交互连接,从而实现利用知识图谱查询各知识点以及各点之间的相互关联。知识图谱显现(见图9、10)。

图9.陕西地区知识图谱

四、研究总结

(一)研究创新

信息技术、人工智能技术的应用给各行各业带来了机遇和挑战,其在教育中的应用也十分广泛深入。信息技术、人工智能技术为构建一个全感知、全联接、全智能的数字化、共享共建的学习环境提供了技术支点,在信息技术驱动下也促进了数字化的发展和转型。[20](P61-67)为了做好西北民间音乐传承与保护走上数字化学习资源库建设路径也是信息时代发展的应然之需。数字化学习资源库建设有多种策略值得研究,例如:基于对象存储技术的数据库构建、基于云平台的数字资源构建、基于云计算的数字服务平台建设、异构数据库集成网络资源库等,知识图谱技术的应用是众多数字化路径中的一种新的“智能+”构建策略,[21](P89-91+97)将知识图谱信息技术应用到西北民间音乐学习资源库的构建研究,为推动民间珍贵音乐资源保护及促进我国音乐事业的发展扩宽了路径管道,对数据的规范整合、利用与传播起到了积极作用。

(二)研究价值

图10.新疆地区知识图谱

本文通过对西北民间音乐学习资源库的用户需求进行问卷调查并对结果进行分析,针对现存民间音乐资源库的三个突出问题,深入研究了西北民间音乐数字化学习资源库的构建策略。研究结果基本能够满足西北民间音乐学习资源库的用户需求,有利于资源整合和利用,并且能够迭代性完善和扩展学习资源,同时完备了西北民间音乐学习资源库的知识分类体系,有利于满足学习者的精准化、个性化学习。本课题具有一定的现实价值和理论价值。

(三)研究不足

一般来说,从事音乐艺术的学习者和研究者,对信息化技术手段并不是非常熟悉,而精通信息化技术手段的专业人士又并非音乐领域的专家。学科壁垒造成了该领域的研究成果较少的现状和创新不足的现实困境。《中国教育现代化2035》于2019年2月正式颁布,提出要大力推进教育现代化、加快信息化时代教育变革;[22]2020年7月29日全国研究生教育会议在北京召开,这次会议决定将交叉学科设立为我国第十四个学科门类,此举将推动我国高等教育格局性、深层次的变革。今后我们应该进一步整合优质资源,努力突破学科壁垒,促进艺术与科技的融合,在艺术与科技两个交叉学科中发现问题,并学会用学科交叉融合的方法解决问题,最终实现以融合促进学科发展,从而获得多维探究能力。

注释:

①文中图1、2为腾讯问卷导出图,图3、4、5、6、7、8、9、10为自制图。

②采访时间:2020年10月5日;采访地点:西安;被采访者:辛雪峰,中国艺术研究院教授、博士生导师;采访者:岳晓融。

猜你喜欢
西北资源库图谱
健身气功开放课程资源库建设研究
绘一张成长图谱
一座西北小城
贵州●石斛种质资源库
西北不惑
黔西北行吟
补肾强身片UPLC指纹图谱
高中历史信息化教育资源库应用探索
福建基础教育教学资源库建设研究——以福建基础教育网资源库为例
主动对接你思维的知识图谱