土家语词汇计量研究分析

2021-09-10 12:10刘冬亚
文学天地 2021年4期
关键词:词汇

摘要:土家语作为我国少数民族语言的一支,有着自己独特的语言系统与研究价值,一直以来对土家语词汇领域的研究成果丰富,本论文也旨在运用词汇计量研究方法对土家语词汇进行统计研究,为土家语词汇研究注入新的活力,为未来的土家语词汇领域的研究提供参考示例。

关键词:土家语;Access;词汇;计量研究

前言

词汇计量研究是语言学里研究词汇的重要方法,将数据库技术引进语言学研究尤其是词汇领域的研究,是追求定量研究与定性分析相结合,探求更深层次词法规律的重要一步。“计量方法的引进,特别是数据库技术引进到汉语语言学,引进到汉语词汇学,有着特别的意义。”[1]根据苏新春先生在《词汇计量及实现》一书中的概括,将计量方法引入词汇研究有着以下的优势:

首先是詞汇作为语言最重要的基本要素之一,其数量也最为庞大,庞大的词汇量使得对词法的研究分析,对其背后规律的探索需要投入大量的人力、时间,而将数据库方法引入语言学研究,运用数据统计工具对其进行分析,可以大大节省我们的时间和成本。

其次是对于计量研究而言,词语词形辨认方便,这样就更便于统计,得出的结果也更为精确客观。

最后是方便进行查询和对比分析。相比于传统的词典查询,这种方式更易于查询,且能够有效进行各种对比分析,如通过对一个词在不同时代收录的例子进行对比分析进而得出其背后更为广阔的社会意义与时代背景等。

而土家语作为我国重要的民族语言之一,因其只有语音无文字,且其词汇、句子等都是以国际音标的形式记音标注保存,将词汇计量方法引入土家语词汇研究,可以更有效地对土家语词汇进行历时对比研究与共时对比研究,这不仅可以更为直接地看出土家语语音语调的发展变化,其词性与意义的改变也会得到一个更为直观的展示。

本论文通过Access建立一个简单的土家语词库,在此基础上运用Access数据库中的查询重复选项对词表中的词汇进行重复查询筛选,将筛选出的结果进行对比分析,力求为土家语词汇计量研究提供一个示例,为未来的土家语词汇研究提供一些参考思路。

基于Access建立土家语词库

“Microsoft Access是小型桌面关系数据库,主宰着整个桌面数据库市场,与Word、Excel、PowerPoint、Outlook等一起构成了Microsoft Office 系列办公室软件。”[1]与其他的数据库软件相比,Access的优点非常明显:首先是它的建库、查询等常用功能无需编程,非常直观,可操作性强;其次是与其他office系列软件相互兼容,格式转换方便;再次是潜在开发能力强,数据存储方便,单表可处理的数据量大;最后是安全可靠,管理方便,操作容易。

本文利用Access建立土家语词库主要是以导入表的方式完成数据库的建库。首先需要确认的是词表,为了更方便进行对比研究,本文分别从田德生、何天贞等编著的《土家语简志》(1986版)、叶德书所著的《土家语研究》(1995版)和陈康所著的《土家语研究》(2006版)中选取部分基本核心词汇进行对比,本文所选取的词汇量不多,旨在呈现出整个计量研究的方向与过程。

为了方便研究,本文首先利用Excel建立好词表,再将词表导入Access数据库。本文中数据库操作所使用的版本为Access2016版本,词表及其导入流程如下图所示:

如图所示,词表导入首先需要点开Access,点击新建空白数据库,根据出现的界面,点击外部数据,选择新数据源,从出现的选项中选择文件并从文件中选择Excel表格进行导入,选择将源数据导入当前数据库的新表中,可以对导入的词表的字段信息如字段名称、数据类型等进行修改,并且还可以根据提示操作选择定义主键,最后对表格进行命名,完成表的数据导入与建立。

该表有5个字段如下图所示:

主键是tjid,5个字段的内容与数据类型如下:

由于土家语的特殊性,在设置字段的时候我们主要根据汉语词汇条目去进行设置,这样在进行对比研究时我们也可以更为直观地得出它们语音上的不同,进而分析其背后可能存在的原因,从而实现我们的研究目的。

最后是窗体的设置,“数据库里的数据信息都是储存在‘表’中,‘窗体’是数据库的显示窗口,它能对表中的数据起到显示、录入、屏蔽、分类的作用。”[1]本文中所建立的窗体较为简单,由于没有更多的复杂应用的需要,本文中也仅做一个展示。

基于Access建立土家语词库,将计量研究方法引入土家语词汇研究,不仅有助于我们在对土家语词汇进行整体上的定量分析,也更方便我们对其进行历时性研究与共时性对比分析,这也是我们建库的重要目的。

词库统计结果分析

基于上文中所建成的土家语词库,本部分内容将对其进行简要统计分析,由于词库中所选取的样本数量有限,本文也仅根据所选取的部分进行归纳总结,所得出的结果的依据为本次统计分析以及所选取的语料的背景。

首先打开“土家语词库”,点击“创建”中的“查询向导”,选择查找重复项查询向导,设定“重复值字段”,有需要的话可以根据提示对“查询设计”进行修改,本文主要目的是对拥有同样汉语释义的土家语词汇进行对比分析,所以主要选择对词目、国际音标等进行重复查询,将所得出的结果保存至数据库,命名为“tujiayu的重复项”,所得出的结果如下图所示:

如图所示,通过对表进行重复项查询后可以获得在本表中所有重复汉语释义的土家语词汇及其来源,根据重复项查询得出的结果,结合本文中所选择的土家语词汇来源背景,我们可以做出如下的判断:

首先,我们可以从上述结果中非常明显地看出不同词汇在不同著述中语音语调上的明显区别,本文所选择的词分别来自田德生、何天贞等编著的《土家语简志》(1986版)、叶德书所著的《土家语研究》(1995版)和陈康所著的《土家语研究》(2006版),其中《土家语简志》中的语言描写主要是以湖南湘西土家族苗族自治州龙山县靛房乡(今为靛房镇)为田野调查点[2],叶德书版的《土家语研究》则是以龙山县苗市公社(现苗儿摊镇)星火大队(现星火村)的土家语为代表[3],而陈康版的《土家语研究》则是对其于上世纪八十年代初进行调查研究所写出的《土家语简志》(草稿)作进一步的修改进而成书,语音描写也是北部方言龙山土语的语音系统[4],三本著作都是以土家语北部方言区龙山县为语音点。

从上面重复项查询结果中我们可以非常明显地看出陈版的《土家语研究》与《土家语简志》中的基本词汇重复较多,除了极少数的语调与元音略有区别外,其余发音大都相同,考虑到陈康老师也曾参与《土家语简志》编写调查工作,以《土家语简志》里面所记载的语音为基础也不足为奇,但有意思的是陈康老师在近二十年后的著述中对声调和部分记音所做的修改,以“太阳”为例,陈版中“太阳”的发音为“lau²¹tshi²¹”,而《土家语简志》中则是记为“ȵau²¹tshi²¹”,将鼻音变成了边音,陈版中“鱼”的发音为“soŋ³⁵”,《土家语简志》中则为“su³⁵”,以及一些音调上的变化。

其次,根据重复选项的统计结果我们可以更易分辨出叶版的《土家语研究》与《土家语简志》中汉语释义相同的词汇在语音上的差别,二者所选取的语音点在同一县的不同乡镇,从对比中我们可以看出二者在语音语调上略有区别,如“天”的发音在《土家语简志》中为“ne⁵⁵”,而在叶版的《土家语研究》中为“me³⁵”,将这二者进行对比研究可以很清楚地看到一些词汇在不同地域间发音的差别,对于我们进行不同地域的同一语言的对比研究提供范例。

最后,计量研究的优势就在于可以对大量的词汇进行统计分析,于土家语而言,这种统计分析更方便进行一定数量的对比研究,在定量研究的基础上对其作出定性判断,本文所选取的词汇量有限,若是在词汇量充足的基础上进行此项研究,可以得出非常直观的对比结果,从而对不同著述中所记载的土家语语音、词义的变化进行概括总结,探究这种变化背后折射出的社会背景及时代變迁。

土家语词汇计量研究的难点分析

将词汇计量研究方法应用于土家语词汇研究,可以方便我们对土家语词汇进行统计分析,发掘其背后更深层次的规律,尤其对于土家语历时性研究和共时性研究而言,这种方法会为其提供更为客观、科学的结果。但在土家语研究中应用这种方法也有着自己的难点,并且这些难点会对我们最终的统计结果造成一定的影响,是我们最后进行分析作出判断时需要特别去注意的点。

第一个难点就是土家语记音有着一定的主观性,这种主观性会对我们最终分析出来的结果的客观性造成一定的影响。由于土家语只有语音无文字,所有的词汇都是以国际音标的形式保存,不同的田野调查人员的记音会存在着一定的主观性偏差,这种主观性偏差也会对我们最终的分析结果造成一定的影响。而目前所能想到的最好的解决办法就是尽可能多地去分析词语数量,尽量减少这种偏差。

其次是计量研究是我们进行词汇研究的一种手段,它只能为我们提供统计的结果,是我们实现研究目的过程中的重要一环,而要想实现最终的研究目的仍然需要依靠我们自身对结果进行思索与判断。像土家语这种以国际音标形式保存的语言在进行分析研究时相比较汉语而言更具有难度,尤其是在对于具体词汇做分析时,对除本身的统计结果外的其他背景信息依赖较高,这种依赖性也意味着单纯从量的统计分析去实现研究目的是比较难以达到的,必须进行综合考量。

最后需要注意的是对土家语进行词汇计量研究更需要以研究目的为导向。研究目的决定了我们以何种方式统计得出结果,进而也决定了结果的指向性,这是我们在分析研究前就需要着重思考的问题,也是我们在对土家语进行词汇计量研究时需要关注的地方。

对土家语进行词汇计量研究的成果还较少,总的来说这种方式对土家语研究来说还较为新颖,新的事物的尝试总是伴随着失败与挑战,但是依然拥有着巨大的可发掘的空间,逐步解决研究过程中碰上的难点,更好地将词汇计量方法与土家语词汇研究相结合,推动土家语词汇研究向前发展,也是我们未来面临的挑战。

结语

随着计算机技术的迅速发展,很多的软件技术可以应用于我们的语言学研究,这也是学术研究跟上时代发展的必然选择。将计量研究方法引入土家语词汇研究领域,是对土家语词汇研究领域的进一步拓展,为土家语词汇研究尤其是词汇对比研究提供了莫大的助力,本文也仅对这种研究范式作了新的尝试,更为深入的探索仍需要后续的不断跟进摸索。土家语研究任重道远,在新的时代背景下探索新的方式也是推进土家语研究的必要选择。

本论文为“四川省高校重点实验室-民族语言文字信息处理实验室建设项目”的阶段性研究成果

参考文献:

[1]苏新春.词汇计量及实现[M].北京:商务印书馆,2010.

[2]田德生,何天贞.土家语简志[M].北京:民族出版社,1986.

[3]叶德书.土家语研究[M].吉首:吉首大学湘楚文化研究所,1995.

[4]陈康.土家语研究[M].北京:中央民族大学出版社,2006.

作者简介:刘冬亚(1992-),女,土家族,湖北利川人,西南民族大学中国少数民族语言文学2019级硕士,研究方向:语言文字信息处理

猜你喜欢
词汇
读后续写词汇锦囊之“行”
运用高级词汇,提高作文得分
图辨词汇
词汇小达人
词汇小达人
词汇小达人
词汇小达人
带“HAVE”的表达
所暴力行为
面部词汇