藏族民间故事《尸语》的词汇及内容计量解析

2020-12-18 00:44多杰卓玛
西藏研究 2020年5期
关键词:语料排序计量

多杰卓玛

(西北民族大学社会科学研究院,甘肃 兰州 730030)

一、引言

在国外,有多国学者从不同角度对《尸语》故事进行研究,如世界著名蒙古史学家鲍里斯·雅科夫列维奇·符拉基米尔佐夫从蒙文《尸语》故事出发,研究了《尸语》故事及其与佛经文学间的关联;法国著名藏学家石泰安(R.A.Stein)从《尸语》故事某些章节出发与《格萨尔》史诗进行比较研究[3];除德国梵文学家西奥多·本菲对蒙文《尸语》故事与印度《僵死鬼故事25则》渊源关系进行研究外,伊曼纽·考斯金、君岛久子(日本)、汤普森(美国)、丁乃通(美国)[4]等诸多学者也从《尸语》故事的不同侧面进行了比较民俗学、翻译、故事母题、故事类型分类等的研究。在国内,由中央民族学院组织编写的《藏族文学史》(四川民族出版社,1985年),第一次比较系统地论述了《尸语》故事的内容、艺术特点、渊源问题,肯定了《尸语》故事在藏族文学史上的地位[5]。还有王尧、李朝群,孙纪刚、汤池安、宁世群等著名学者对藏文《尸语》故事内容进行了翻译及比较系统研究。

《尸语》故事是龙树大师所著,并由一些连续性的短篇故事串联而成,但可以独立成篇[6-8]。该故事在涉藏地区广泛流传,被视为一种“藏文化的遗存”,是前人生活、习俗、心理、信仰的遗留,也是一部最富盛名的民间故事经典。同时,也是中华文化中的一个重要组成部分[9]。《尸语》故事的内容、情节、词汇等不仅反映了当时藏族民众的社会生活状态,也反映了人们思想信仰的某一个侧面。其实,故事的内容和情节是由词汇组织起来叙述的,尤其是词汇的准确应用才能更加生动地刻画人物性格及故事的内容。因此,本文将运用语料库,按故事中人物的生活环境、使用工具、衣、食、住等实体对《尸语》故事的词汇进行频率和频次的分析,并对故事的内容进行定性或定量的数据分析。

二、《尸语》故事词汇的计量分析

何谓计量研究?苏新春认为:“计量研究,又叫定量研究,通过对语料进行数的反映,以达到认识语言规律和特点的目的。”[10]赵家祥等认为:“在科学研究中,对事物进行数量分析,称作定量研究。”[11]唐钰明则认为:“所谓定量方法,就是将处于随机状态的某种语言现象给予一定的数量统计,然后通过频率、频度、频度链等量化形式来揭示这类随机现象背后所隐藏的规律性。”[12]综上,词汇的计量分析实质上指词汇的定量研究或计量研究。

词汇作为句子最基本的构成单位在语言应用中有着举足轻重的作用,词汇、句子、文章之间是点、线、面的关系[13]。因此,对《尸语》故事词汇的计量研究,有助于我们考察藏语词汇的时代特点。我们主要以《尸语》故事为封闭的语料从词汇的类别、使用的频率词汇的分词、词性标记、词频统计、频率统计等方面全方位对藏语《尸语》故事的整体词汇进行分析。

(一)《尸语》故事词汇的频率

在《尸语》文本统计中,总词汇量为3815个。其中,动词词汇总量为1247个,名词词汇总量为1733个,形容词词汇总量为394个,副词词汇总量为88个,虚词及其他词汇总量为353个。它们分别占语料统计的词汇总量的32.7%、45.4%、10.3%、2.3%、9.3%。

从文本语料的统计结果来看,出现频率在前30位的文本高频词汇排序如表1所示。

表1:排序前30位的词汇频次表

《尸语》故事共有25个短篇,将其作为文本,主要从人物、生活环境、生产工具和劳动工具、饮食、服饰等方面对故事中的词汇进行一一统计及分析。

(二)《尸语》故事中的生活环境

《尸语》故事中出现的动物名、植物名以及住所名共计505频次,其中动物类词汇为406个频次、植物类词汇为35个频次、建筑类为64个频次,用这些出现频率较高的词汇来大致地勾勒出故事中人物所处的自然环境和生活环境。

1.动物类

经统计《尸语》中动物类词汇共85个,出现的次数为406频次,只出现一次的词汇项有25项。其中,出现频率在8次以上的前21位的词汇排序如表2所示。

表2:排序前21位的动物类词汇频次表

2.植物类

据统计,《尸语》中植物类词汇的数量相比其他类别词汇而言比较少。植物类共出现23个词汇,出现的频次为35次。其中,频次排在前12位的植物类词汇如表3所示。

表3:排序前12位的植物类词汇频次表

3.处所类

《尸语》故事中处所类的词汇也不是很多,频次排在前12位的词汇表如表4所示。

表4:排序前12位的住所类词汇频次表

(三)《尸语》故事中的工具类

1.生产工具

在语料中,生产工具类词汇共统计了12个,出现次数为78频次,只出现1次的词汇项为2项。具体的词汇排序如表5所示。

表5:生产工具词汇排序频次表

2.生活用具

在语料中,生活工具类词汇共统计了68个,出现次数为288频次,只出现一次的词汇项为26项。具体的词汇排序如表6所示。

表6:排序前21位的生活用具类词汇频次表

(四)《尸语》故事中的饮食类

从语料的统计结果来看,以藏族的牧区饮食为主的词汇,共出现了142频次,只出现1次的词汇项为10项。具体统计结果如表7所示。

表7:排序前15位的饮食类词汇频次表

(五)《尸语》故事中的服饰类

服饰类包括服装类和装饰类两种。

1.服装

根据统计,排序在前12位的词汇项如表8所示。

表8:排序前12位的服装类词汇频次表

2.装饰

装饰有头饰、颈饰和腕饰等,装饰物的主要材料以华贵的金银、珠玉、珊瑚、松石等天然珠宝为主。具体情况见表9。

综上所述,本文运用计算语言学中的统计方法对该故事中的藏文词汇进行大致的分类,主要分为7大类,从人物、生活环境、生产工具和生活工具、饮食、服饰等多方面对词汇作了定量的统计与分析。从结果来看,大多数词汇用词简炼、准确、生动,具有鲜明的民族特色,还有一部分反映人们衣、食、住、行日常生活的基本词汇,这些词汇大多数都带有古朴的色彩。可见,故事中应用的词汇真实地反映了这一时代藏语词汇的基本概貌,同时,也是研究这个时期语言极为难得而珍贵的重要材料。

三、《尸语》故事内容的计量解析

(一)人物的计量解析

从故事中的人物统计情况来看,《尸语》故事出现频率较高的前21个人物列表如表10所示。

同样,依据表10中出现的人物频次,我们可以建构《尸语》故事中人物的词云图(见图1)。

图1:《尸语》故事人物词云图

(二)故事情节的解析

图2:“”作为关键词检索

图3:“”作为关键词检索

图4:“”的部分上下文语义检索图

四、结语

我们以统计的词汇数据分析为依据,充分说明了《尸语》故事是“藏文化的遗存”和“中华文化中的一个重要组成部分”这一观点。同时,本文不仅用计算语言学中的统计方法对该故事语料库中的藏文词汇语料进行分类及频率分析,而且用统计分析更深入地对故事中的人物及故事情节进行了剖析,从另一角度印证了使用语料库并用统计方法分析文学作品研究的可行性。

猜你喜欢
语料排序计量
高速公路合同计量变更管理策略
计量检定在食品行业中的重要性
面向低资源神经机器翻译的回译方法
作者简介
恐怖排序
可比语料库构建与可比度计算研究综述
节日排序
基于因子分析的人力资本计量研究
国内外语用学实证研究比较:语料类型与收集方法
英语教学中真实语料的运用