马福祥,马秀娟,2
(1.青海师范大学 计算机学院,青海 西宁 810016; 2.青海师范大学 藏语智能信息处理及应用国家重点实验室,青海 西宁 810008)
撒拉族是分布在甘青两省的一个非常有特色的少数民族,该民族人口稀少、分布集中、只有语言没有文字[1].因此,撒拉族非物质文化遗产的传播大多依赖于口头传承.一些对撒拉族非遗文化感兴趣的研究者选择用文献的方式记录撒拉族宝贵的非物质文化遗产,并旨在通过文献向世人传播这一特色鲜明的非遗文化.根据资料显示[2-5],许多撒拉族非遗文化研究者同时也是撒拉族非遗文化传承人,他们通过各类文献资料向人们展示了丰富的撒拉族文化,同时也通过文献传播了撒拉族非遗文化,成为了撒拉族文化传播的中坚力量.
近年来,超网络理论在现实复杂系统的表示上显示出了突出的优越性,有效表示了普通网络无法表示的网络特性[6-18],为研究者进一步认识复杂系统网络的特性提供了有效的方法和工具.利用超网络理论可以深入分析数据之间存在的隐含关系,把数据建模成超网络,通过对超网络拓扑性质的分析,可以挖掘出更有意义和价值的信息.目前,通过对相关文献的分析,还没有看到超网络理论在非物质文化遗产领域的应用和相关研究结果.而基于超网络理论对撒拉族非遗文献进行建模研究,既可以有效分析撒拉族非遗文化研究中,研究者、研究内容、研究领域间的复杂关系,同时也能发现撒拉族非遗文化研究的专家和传承人,进一步掌握撒拉族非遗文化研究中的热点研究内容、热点非遗文化和急需保护的濒危非遗文化等.
本文基于超网络理论,根据收集的撒拉族非遗文献资料,提出了基于撒拉族非遗文献的三层混合超网络,并通过MATLAB进行了仿真实验,对所构建的撒拉族非遗文献混合超网络的节点超度、出度、入度进行了统计分析,获得了撒拉族非遗文化研究中影响力较大的非遗研究者、热点的非遗研究内容、热门的非遗文化领域以及濒危的非遗文化.通过本文的研究,挖掘出了撒拉族丰富的文化资源,同时也发现了撒拉族文化传播的中坚力量.此外,本文的研究结果为进一步认识撒拉族非遗研究的现状提供了参考,对撒拉族文化的有效传播和保护提供了有价值的应对策略.同时,本文的研究方法可以为其他非遗文化的研究提供借鉴,对推进我国非物质文化遗产的发展有积极的意义和重要的促进作用.
为了挖掘撒拉族非遗文化的研究文献、研究者、研究内容及研究领域之间的相关关系,本文从知网收集了近30年内有关撒拉族非遗文化的相关文献数据近800条,研究领域涉及撒拉族的婚礼、篱笆楼建造技艺、服饰、谚语、歇后语、寺院古建筑技艺、皮筏子技艺、骆驼泉的传说、民歌等文化.通过对数据的清洗和去噪,保留了文献数据的文献名称、作者、关键词、研究领域、出版时间等重要特征.通过对数据的整理,提取有效文献400篇,作者277人,关键词1200个,涉及的非遗研究领域12类,整理形成原始数据表.
为网络建模需要,本文从原始数据表中提取文献编号、作者、关键词、研究领域四个字段,并对作者、研究领域、关键词进行了去重和编号;并利用超图理论构建了基于撒拉族非遗文献的多层混合超网络,文中涉及的概念定义如下:
节点定义:混合超网络中的节点被抽象为三类,分别是作者节点集AU={a1,a2,…,a277},关键词节点集KW={kw1,kw2,…,kw1200},研究领域节点集RA={ra1,ra2,…,ra12}.
超边定义:混合超网络中的超边也被抽象为三类.第一类是作者超网络Hau中的超边HEAU={hea(1),hea(2),…,hea(m)},在作者超网络Hau中,若多个撒拉族非遗文献研究者有合作关系,则用超边hea(x)包含这些研究者.第二类超边是关键词超网络Hkw中的超边HEKW={hekw(1),hekw(2),…,hekw(n)},在关键词超网络Hkw中,若多个关键词出现在一篇非遗文献中,则用超边hekw(y)包含这些关键词.第三类超边是研究领域超网络Hra中的超边HERA={hera(1),hera(2),…,hera(p)},在研究领域超网络Hra中,若一篇文献涉及多个研究领域,则用超边hera(z)包含所有的研究领域.
普通边定义:混合超网络中的普通边定义为两类.第一类是连接作者节点ai与关键词节点kwj之间的有向边eij,表示了作者ai研究内容的广泛性.第二类是连接关键词kwj与研究领域rk之间的有向边ejk,表示关键词kwj所属的研究领域rk.
混合超网络定义:设MH(Hau,Hkw,Hra)表示了一个三层撒拉族非遗文化混合网络,其中Hau,Hkw和Hra是基于超图结构的超网络,三层超网络之间通过普通的有向边连接形成一个三层的混合超网络模型MH.其中超网络Hau(AU,HEAU)表示了撒拉族非遗文化研究者之间的合作关系;超网络Hkw(KW,HEKW)表示了撒拉族非遗文献之间的相关关系;超网络Hra(RA,HERA)表示了撒拉族非遗文化各研究领域间的相关关系.
为了进一步分析非遗文献混合超网络的拓扑性质,本文利用MATLAB编写仿真程序,根据收集的数据,构建了基于撒拉族非遗文献的三层混合超网络,构建过程中的参数及取值如表1所示.
表1 撒拉族非遗文献超网络仿真参数及取值
续表
基于数据挖掘的需求,本文结合表1中的各项参数,提出了撒拉族非遗文献超网络中各层超网络建模算法如2.2.1所述,并在此基础上提出了三层混合超网络的建模算法如2.2.2所述.
2.2.1 基于非遗文献的各层超网络建模算法
(1)作者层超网络建模算法
step 1:定义二维数组IncMatrix_Ha(N1,N2),用于存储撒拉族非遗文献作者之间的合作关系,初始将该二维数组中的所有元素置为0.
step 2:若多个作者合作发表一篇非遗文献,则用超边hea(i)连接文献i对应的所有作者,并在二维数组IncMatrix_Ha(N1,N2)中将文献i中的作者号对应的列元素置为1.
step 3:重复step2,直到将所有文献处理完毕,就构建了作者超网络Hau,图1是作者层超网络的示意图.
图1 作者层超网络示意图
图2 关键词超网络示意图
(2)关键词超网络建模算法
step 1:定义二维数组IncMatrix_Hkw(N2,N4),用于存储撒拉族非遗文献关键词之间的相关关系,初始将该二维数组中的所有元素置为0.
step 2:用超边hekw(j)包含了非遗文献j中出现的所有关键词,在二维数组IncMatrix_Hkw(N2,N4)中将文献j中的关键词对应的列元素置为1.
step 3:重复step2,直到将所有文献处理完毕,就构建了关键词超网络Hkw,图2是关键词超网络的示意图.
(3)研究领域超网络建模算法
step 1:定义二维数组IncMatrix_Hra(N2,N3),用于存储撒拉族非遗文献研究领域的相关关系,初始将该二维数组中的所有元素置为0.
step 2:用超边hera(k)包含了非遗文献涉及的所有研究领域,在二维数组IncMatrix_Hra(N2,N3)中将文献j中的研究领域对应的列元素置为1.
step 3:重复step2,直到将所有文献处理完毕,就构建了关键词研究领域超网络Hra,图3是研究领域超网络示意图.
图3 研究领域超网络示意图
2.2.2 三层混合网络建模算法
step1:初始化,定义二维数组AdjMatrix_H12(N1×N4),用于存储作者和关键词之间的相关关系;再定义二维数组AdjMatrix_H23(N4×N3),用于存储关键词和研究领域之间的相关关系.初始将这两个二维数组中的元素都置为0.
step2:在作者超网络和关键词超网络之间用普通有向边进行连接;遍历数据表,找出编号为i的作者发表的所有文献的关键词j(j∈KW),用有向边〈i,j〉连接作者i和关键词j,并将二维数组AdjMatrix_H12(N1×N4)中对应的(i,j)位置上的元素置为1.完成该步骤,就在作者超网络和关键词超网络之间建立了连接.
step3:在关键词超网络和研究领域超网络之间用普通有向边进行连接;遍历数据表,找出关键词j对应的所有的研究领域k(k∈RA),用有向边〈j,k〉连接关键词j和研究领域k;并将二维数组AdjMatrix_H23(N4×N3)中对应的(j,k)位置上的元素置为1.完成该步骤,就在关键词超网络和研究领域超网络之间建立了连接.
完成step2和step3就建立了如图4所示的基于撒拉族非遗文献的三层混合超网络.
本文利用统计分析的方法,对撒拉族非遗文献混合超网络的各类度性质进行了分析,包括各类节点的超度、出度、入度等.
本文通过对作者超网络的关联矩阵进行分析,获得了作者超网络中作者节点的超度序列,通过对作者节点的超度序列进行排序,获得了撒拉族非遗文献作者中的活跃者.表2列出了排名位居前20的作者.
表2 撒拉族非遗文献作者超度排名
从表2中的结果可知,撒拉族非遗文化研究者的超度都比较小,这表明对撒拉族非遗文化的研究成果比较少,说明研究者对这一宝贵的非物质文化遗产的关注度不高.此外,图5是撒拉族非遗文献研究者的超度分布.图中结果表明撒拉族非遗文献研究者的超度近似为幂律分布,说明在撒拉族的文化研究者中,存在领袖研究者,他们具有较大的超度;这表明,这些作者长期从事撒拉族非遗文化的研究,对撒拉族非遗文化有着浓厚的研究兴趣,并发表了相对较多的研究成果,对撒拉族非遗文化的传播有较大的贡献,但这样的研究者数量较少.在该超网络中,大量作者的超度非常小,这个结果一方面表明大量从事撒拉族非遗文化研究的作者对撒拉族非遗文化没有持续的研究兴趣;另一方面,说明撒拉族非遗文化作为一种非物质文化遗产,还没有引起研究者的足够重视.
图5 撒拉族非遗文献研究者超度分布图
图6 撒拉族非遗文献关键词超度分布
在关键词超网络中,节点的超度代表了关键词被关注的程度,也反映了非遗文化研究的热点内容.图6显示了撒拉族非遗文献超网络中,关键词节点的超度分布.图中结果表明:撒拉族非遗文献关键词超网络中的关键词节点的超度服从幂律分布,说明关键词超网络具有无标度特性.表明在撒拉族非遗文化的研究中,存在超度比较大的关键词节点,但大量关键词的超度比较小,说明在撒拉族非遗文化的研究中,出现了研究者广泛关注的研究热点,但这样的研究热点较少.同时,也表明撒拉族非遗文化的研究内容比较分散,且大部分研究内容不能引起研究者的共同兴趣.表3显示了撒拉族非遗文献中关注程度较高的20个关键词.
表3 关注度较高的撒拉族非遗文化关键词
在研究领域超网络中,节点为研究领域,节点的超度代表了研究领域被关注的程度,也反映了在撒拉族非遗文化的研究中,哪种文化更能引起研究者的关注.表4显示了撒拉族非遗文化的超度.
表4 撒拉族非遗文化研究领域的超度
从表4反映的数据可以看出,在撒拉族非遗文化的研究中,研究者关注较多的是民俗文化,其次是民间文化和民族文化,而对民间舞蹈和民间技艺的研究文献较少.主要原因如下:
(1)民俗文化和民间文化有着几千年的发展历史,并广泛存在于撒拉族人民的生活中,长期影响着撒拉族人们的生产和生活.研究民俗文化和民间文化有更广泛的意义和实际研究价值,因此这两类文化更易引起研究者兴趣.
(2)表4数据显示民族文化是撒拉族非遗文化中被众多研究者关注的一项文化内容.撒拉族的民族文化渗透到撒拉族生活的方方面面,研究撒拉族的民族文化,可以更好的了解撒拉族人民的思想形态、生活方式等.
(3)数据显示,撒拉族非遗文献中对撒拉族民间音乐的研究结果也相对较多,这一结果也表明,音乐在撒拉族人民的生活中占有着重要的作用,表明撒拉族人民是一个热爱音乐的民族.但撒拉族人民对舞蹈没有太大的兴趣.因此,在撒拉族非遗文献的研究中,涉及民间舞蹈的文献最少.
(4)此外,从表4中的数据可以看出,对撒拉族非遗文化中的民间技艺的研究结果也很少,这从侧面反映出,随着时代的发展,撒拉族的很多珍贵的民间技艺正在逐渐被人们遗忘.例如,本文收集到的数据中就缺乏对撒拉族口弦、螭鼓舞等技艺的相关研究结果.
为了进一步分析撒拉族非遗文献超网络中各层超网络之间的相关关系,本文抽取了能反映撒拉族非遗文化的关键词,关键词也反映了撒拉族非遗文化研究的聚焦点,因此通过研究者和关键词之间的关系,可以获得研究者的研究兴趣,同时也能获得撒拉族非遗文化的研究热点.
本文在作者和关键词之间建立了有向边,通过作者的出度反映了作者i所关注的非遗研究内容,也反映了非遗研究者的研究兴趣.同时通过关键词j的入度反映了非遗文化的热点研究内容.此外,本文在关键词和研究领域间也建立了有向边,通过研究领域层节点的入度反映了某一项非遗研究领域的关注热度.表5中的数据显示了各层超网络中出度和入度排名前10的节点.
表5 非遗超网络出度和入度排名前10的节点
通过分析表5中的数据,本文获得了以下结果:
(1)表5中所示的作者(马伟、马成俊、王海龙、韩建业、王军、张连葵、宋卫哲、毕艳君、韩得福、李臣玲)对撒拉族非遗文化有着较为浓厚的兴趣,同时这些作者涉及的关键词较多,说明他们对撒拉族文化的研究内容涉及面广泛,是撒拉族非遗文化传播的中坚力量,对推动撒拉族非遗文化的传播起到了关键作用.而根据分析数据可知,作者出度值为1和2的作者较多,约有68位,这些作者对撒拉族非遗文化的研究兴趣比较单一,但这些作者也应是撒拉族非遗文化的潜在研究者,应该对这一部分作者予以一定的关注,让这些作者继续开展撒拉族非遗文化的研究,壮大撒拉族非遗文化研究者的队伍.
(2)表5中关键词的入度数据表明,排名前10的关键词所表示的研究内容是被撒拉族非遗文化研究者广泛关注的非遗文化,主要涉及的是关键词有宗教、寺院、村落、民歌、传统文化、民间文学、花儿等,这些关键词代表的是热点研究内容.
(3)表5中研究领域的入度数据表明,入度排名靠前的研究领域有民间文化、建筑文化、民俗文化、民族文化、民间音乐、语言文化等,这表明这些非遗文化受到了研究者的广泛关注,也是撒拉族非遗文化中被重点传播和保护的文化.但此外,通过数据分析可知,在本文所统计的12类撒拉族非遗文化中,婚丧文化、民间技艺和民间舞蹈这三类文化的入度较少,表明这三类文化没有被广泛研究,是撒拉族非遗文化传播中的濒危文化.实际上,这三类文化也是撒拉族非遗文化中特色鲜明的非物质文化遗产,特别是撒拉族的民间技艺文化,更是撒拉族人民世代传承下来的宝贵财富,应加大对这些文化的研究力度,用文献记录并传承这些文化.
本文通过分析撒拉族非遗文化的研究文献,将文献的作者、关键词、研究领域抽象为节点,并将文献抽象为超边建立了三个超网络,并通过作者和关键词、关键词和研究领域之间的相关关系将三个超网络进行关联,建立了撒拉族非遗文献的多层混合超网络.通过分析该多层混合超网络中节点的超度、入度、出度等拓扑性质,获得了撒拉族非遗文献研究中贡献较大的研究者,同时也发现了撒拉族非遗文献研究中的热点研究内容、热点研究领域以及没有被关注的濒危非遗文化.本文的研究结果为进一步深入了解撒拉族非遗文化的研究现状提供了参考,为制定有效的撒拉族非遗文化保护策略提供了依据.同时,本文的研究方法为我国其他非物质文化遗产的研究提供了新的研究思路.此外,本文提出的基于超图的多层混合超网络的建模思想及建模方法可有效挖掘出复杂系统中数据间的相关关系.该方法也可用于分析其他复杂系统的相关性质.