方雯鑫,韦爱云
(广西师范大学 外国语学院,广西 桂林 541000)
词汇作为一种语言中所有的词和成语等固定用语的总汇[1]13,是语言的要素之一,是语言的重要组成部分。“没有词汇,任何语言都是不可想象的”[2]69。因此,词汇研究是语言研究的基础和中心。壮语,亦称“壮话”,是我国使用人口最多的少数民族语言。对壮语的研究已有近100年的历史,词汇也是其研究热点之一。壮语研究者如覃凤余对壮语的各种词类进行探究,其中涉及壮语量词[3][4]、定语[5]、方位词[6]、动词[7]等。蓝庆元[8][9][10]聚焦壮语中的借词,对壮语中的汉语同源词与借词进行了区分,细究了壮语中古汉语借词及汉越语与平话的关系,又对壮语方言的八种颜色词追踪溯源。为厘清壮语词汇的研究现状,找准今后研究的方向,对迄今为止的壮语词汇研究相关文献进行综述是非常有必要的。
文献综述是了解一个领域研究发展史及其研究现状的必经之路。国内壮语研究复苏于20世纪70年代末,韦以强[11]1-85、梁庭望[12]57-90、李锦芳[13]67-85、蓝明生[14]、韦爱云[15]等壮语研究者们相继对壮语研究进行了综述尝试,涉及壮语语音、语法、语义、词汇等方面。对于壮语词汇研究的综述始于壮学泰斗梁庭望的《壮族语言文字》,此著述对壮语的词汇特点进行了基本的介绍。蓝明生的《壮语文研究著述目录索引》是壮语文研究检索的重要工具书,系统而全面地收集了百年来国内外关于壮语文的研究成果2 238篇(部),其中涉及壮语词汇研究的成果占其中的1/10。李金阳对壮语形容词、动词后附音节进行了梳理[16],但严格意义上说其研究对象隶属于语音学范畴。总体而言,目前有关壮语词汇的综述性研究成果不多,且仅停留在描述性的罗列层面,少见关于壮语词汇研究的系统评述类文章,而采用量化手段进行综合统计分析的研究更是稀少。
文献计量分析法(bibliometrics)以各种文献的外部特征为研究对象,使用各种量化工具,对文献数据进行描述、分析、评估与预测[17]。随着社会环境和科技条件的迅猛发展,文献计量法开始往信息计量法方向发展,开始深入到文献内部如篇名、关键词、摘要、发表期刊、发表时间等方面。文献计量分析因其科学性而受到了各领域研究者们的广泛运用。张腊娥采用文献计量统计的方法考察了《民族语文》自1979年创刊以来所刊登与词汇研究相关的672篇论文,指出在该期刊上发表的壮语研究虽然不少(共19篇),但主要聚焦在语音与语法上[18],在词汇的研究上还有待挖掘。这应该是最早使用文献计量的方法对壮语词汇研究进行概述的文章,对于我们把握壮语研究现状尤其是壮语词汇研究现状具有重要参考价值。
据此,本文基于国内外关于壮语词汇研究文献,采用文献计量分析法,拟探讨以下几个问题:(1)过去40多年里壮语词汇研究的总体趋势如何?(2)哪些学者、国家(或地区)和机构致力于壮语词汇研究?(3)壮语词汇研究有哪些主题?(4)被引用最多的文献有哪些?
基于CNKI和Google Scholar数据库,我们分别以“壮语词汇”“壮语”“Zhuang word(s)”“Zhuang vocabulary”“Zhang language”作为关键词进行模糊检索。经过仔细对比发现并不是所有与“壮语词汇”相关的文章都能为我们所用,有些文章涉及壮语的语音研究,有些是对广西地区其他方言的研究,还有些与壮语词汇毫无关联。我们经过层层筛选之后,共选定270篇文章作为本文语料来源,其中国内研究245篇(183篇期刊论文和62篇硕博论文),国外研究25篇。
通过自写Python程序,笔者爬取到所需语料信息,使用jieba对中文文本精确分词,Antcoc和QUITA进行词频排序和h点计算。
在趋势走向上,分为5个时间段以方便进一步讨论,即:第一阶段(1980年以前)、第二阶段(1980-1989)、第三阶段(1990-1999)、第四阶段(2000-2009)和第五阶段(2010至今)。对于各个时间段国内外壮语词汇研究论文发表情况进行统计,并绘制趋势图。
壮语投入研究的四个维度研究中,统计学者姓名并进行词频排序;对作者机构所属进行统计和排序,并进一步收集其国家或地区信息;对发文期刊和基金资助情况均分别制表。
提取“标题和关键词”以及“摘要”信息,分别建立语料库,检索到“标题和关键词”语料库中的高频词,以了解壮语词汇研究在整个时间段以及不同时期的研究重点。接着使用同样的方法分析“摘要”的语料库。
同时,我们还统计引用文献在全球和本土情况,分析壮语词汇研究领域的权威文献。
从20世纪70年代末至今,国内壮语词汇研究成果发表总量如图1所示,国外壮语词汇研究发表情况见图2。
图1 不同时期国内刊发壮语词汇研究论文情况
图1的趋势图显示,前5个时期内,国内壮语词汇发文总量处于上升趋势。前3个时期内,上升的趋势较缓慢,2000年之后呈现陡坡式上升发展。卡方检验结果显示P值为0.000<0.05,进一步表明各个时期的发文量之间存在统计学意义上的显著性差异。壮语词汇研究期刊发文量与发文总量趋势十分相似,表明多数壮语词汇研究以期刊论文的形式呈现,期刊论文是壮语词汇研究的主力军。此外,硕博论文在前3个时期一直处于0发文量状态,直至2000年之后才出现将壮语词汇作为学位论文研究对象,直到第5个时期,学位论文的占比出现陡坡式增长趋势,在同期壮语词汇成果发表中占比增加到38.76%,而前一个时期学位论文只占17.86%。这说明壮语词汇研究作为基础性研究开始受到重视。这与韦爱云对壮语研究进行综述时发现的结果[15]相符,国内壮语词汇研究将继续呈现良好发展态势。
图2 不同时期国外刊发壮语词汇研究论文情况
相较于国内,国外对壮语词汇研究成果较少,因此本文不再区分硕博论文与期刊论文。从图2可知,国外在1990年以前没有任何壮语词汇研究相关的论文发表,直到第3个阶段(1990-1999年)才出现2篇,而第4个阶段(2000-2009年)发文量骤增,达到了11篇,同比增长900%。第5阶段比第4阶段增加了1篇,增长率为8%。
观察国内外发文量,发现21世纪初是壮语词汇研究的重大转折时期,自此壮语词汇研究获得学界越来越多的关注。这与壮语相关的语言政策的发布实施有很大关系。随着经济快速发展,汉语普通话的使用频率增加,流行范围迅速扩大,壮语在21世纪的首个10年里衰退滞后。保护传承壮语刻不容缓。广西壮族自治区各级少数民族语言文字工作的政府职能部门为此采取了更为有力的措施,深入贯彻落实少数民族语言相关政策法律法规,鼓励并组织力量进行壮语研究。由此国内壮语研究得到迅速的开展,壮语词汇作为壮语一个基础性研究,随着该热潮的推进,也得到了研究者们的重视[15]。同时,随着中国对外开放步伐的加快,壮语开始被世界所知晓,国外也开始出现了有关壮语词汇方面的研究。
1.壮语研究者
笔者筛选出在国内发文量大于等于3篇的壮语词汇研究者,并根据发文量进行降序排列,得到表1。
表1 国内壮语词汇研究者(发文量≥3)
由表1可知,覃凤余、覃晓航和吕蒿崧是壮语词汇研究的领军学者,分别为该领域研究贡献了11篇、10篇、9篇文章。韦景云、蒙元耀、蓝庆元、潘立慧在壮语词汇研究上也算多产。
同样,由于国外期刊相关研究数量有限,表2筛选结果为发文量大于等于2篇的研究者。
表2 在国外外文期刊发文的壮语词汇研究者(发文量≥2)
表2中David Holm(大卫·霍姆)在壮语词汇研究上发文最多。其余6位研究者均为2篇的发文量,其中Aiyun Wei(韦爱云)与Haitao Liu(刘海涛)是在国外外文期刊上发文的中国学者。外国学者对壮语词汇的关注度还远远不够。
2.作者机构所属
图3显示国内期刊论文作者机构所属频次大于等于3次的情况。
图3 国内期刊论文作者机构所属情况(频次≥3)
根据图3数据可知,多数壮语词汇研究者来自中央民族大学,该机构作者发文情况排名第一。其次是广西大学,署名为该机构的作者次数为23次。此外,百色学院和广西民族大学的壮语词汇研究者们也相当高产。广西师范大学和中国社会科学院民族研究所分别有9次和8次,这表明其开展壮语词汇研究的热度也不低。可以看出,当前国内壮语词汇研究主要集中在民族类学科发展较好的机构(多为广西区内高校),这是由壮语作为少数民族语言的地位和广西壮族自治区是最主要的壮语区的特性所决定的。
图4 国外期刊论文作者机构所属情况(频次≥2)
图4是在国外期刊上发文频次两次及以上的作者机构所属情况。我们发现名次出现在前3位的机构均为中国的大学,其中排名第一的是浙江大学,其次是广西师范大学和中央民族大学。
图5 国外期刊论文作者机构所属国家或地区
作者机构所属国家或地区可反映相应的国家或地区对壮语词汇研究的投入情况。在图4数据的基础上,我们进一步统计了发文机构所属的国家或地区,得到图5。图5显示,中国大陆是壮语词汇研究的主力军,其次是美国,但与中国大陆差距较大。之后分别是泰国、中国台湾、荷兰、澳大利亚、中国香港。
3.论文发表期刊
为全面了解壮语词汇研究的权威性,我们还对国内183篇期刊论文的载文期刊进行了统计,按照发文量多少进行排序,筛选出频次大于等于3次的期刊,如图6。
图6 国内期刊刊发壮语词汇研究论文情况(频次≥3)
图6显示,在《民族语文》上发表的壮语词汇研究论文数量最多,在筛选出的期刊中占比高达30.71%,《百色学院学报》《中央民族大学学报》《广西民族大学学报》《广西民族研究》分别以一到两篇的差距上下浮动,但在发文量上不及《民族语文》的一半。除《语言研究》有8篇发文量外,之后的期刊发文量都在3-4篇左右。这些数据说明,刊发壮语词汇研究的期刊载体,主要是主打“民族性”的期刊。高校学报中《百色学院学报》《中央民族学报》《广西民族大学学报》对这一研究较为重视。总体而言,壮语词汇研究的大范围关注还未出现。
对图6中的期刊进行进一步分析,统计其中的期刊级别,得到图7。
图7 刊发壮语词汇类研究的国内期刊类型
图7显示,国内刊发壮语词汇相关研究的期刊中有38%为CSSCI来源期刊。这说明壮语词汇的研究在国内得到了一定程度的关注,但相较于壮语研究的期刊文章所出自的核心期刊占发文总数的61.4%[15]而言,对于词汇的关注度还远远不够。
将刊登壮语词汇论文的国外外文期刊或平台进行统计(见图8),我们发现有3篇壮语词汇相关论文刊登在Cahiers de Linguistique Asie Orientale期刊,2篇出自国际论坛,其余文章则分散发表在不同的期刊上(每种期刊1篇)。其中Glottometrics、Journal of Quantitative Linguistics、Scientific and Social Research均为以推行科学研究方法为宗旨的期刊杂志。此外,Social&Cultural Geography主要收录地理学方向的文章。
图8 刊登壮语词汇论文的国外外文期刊或平台统计
1.标题+关键词
(1)国内研究
将国内相关文章按“标题+关键词”进行词频排序,选取h点前的名词实词制成高频词表,得到表3。
表3 国内壮语词汇研究论文“标题+关键词”高频词表
表3(续)
表3可反映过去40多年国内壮语词汇研究的主题。“壮语”和“壮”反映出词汇研究的语言本体限定为壮语,“词”与“词汇”表明研究主题为壮语的词汇而非其他方面。此外,“汉语”的出现表明壮汉对比或壮汉互译的研究较为热门。
同时,许多研究致力于探讨壮语中的“借词”。赵京武运用统计手段对壮语、泰语共有汉语借词进行分析,发现在人类生活基本动作、经济、人的抽象活动等方面壮语、泰语都从汉语借词[19]。除借词研究外,还有学者以方言为切入点,探究了粤方言对连山壮语词汇的渗透[20]。但是大部分的借词研究仍局限于汉语,在方言借词方面的探索还有待进一步加强。
高频词“语法”表明有不少研究涉及语法化。根据关键词索引追溯到原文标题可以发现,语法化的研究对象聚焦于具体的某个词,如梁敢研究aŋ5naŋ2由最初的动宾结构“使完所有的劲、力量”到“干脆、故意”义的转变,发现其词汇化的过程中贯穿了naŋ2“能”的语法化[21]。也有集中对某个词类的语法化研究,如覃晓航细究了壮语动词类语法化的主要因素[22]。在地域上,语法化研究论文有2篇为武鸣壮语,2篇忻城壮语,1篇都安壮语,1篇田阳壮语。这表明即使语法化研究已然是壮语词汇研究的一大热点,仍然有很大的研究空间,无论是在地域上还是在具体的词或某个词类选择上,都存在很大的潜力。
根据结构、组合及参考意义的不同,壮语词汇可被划分为13小类:名词、量词、代词、动词、形容词、指示词、数词、副词、连词、介词、助词、语气词和声貌词[23]54。而高频词表中仅出现“量词”,说明可研究的词类尚多,至少还有12种词类未得到深入挖掘。而在壮语词汇大类上,量词属于实词研究,这说明国内壮语词汇的研究还处于初级阶段,至少在第一大词类划分上,壮语词汇的实词(名词、量词、代词、动词和形容词)、半实词(指示词、数词和副词)和虚词(连词、介词、助词、语气词和声貌词)研究存在失衡现象。
高频词“泰语”说明壮语、泰语对比研究也是壮语词汇研究的一大热点,其中包括壮语、泰语借词研究、词义比较研究、构词法对比、不同词类对比等方面。泰语和壮语同属于壮侗语系,有着同源的关系,不少壮语词汇与泰语词相同或相似。因此,壮语、泰语词汇的对比研究有利于人们了解两种语言的共性和个性。
高频词“比较”和“对比”则反映出壮语词汇的研究方向、方法方面的特点。
为了解这些高频词反映的研究重点在过去40多年内的变化,我们对这些高频词在5个阶段出现的词频进行了统计。由于5个阶段的文章数量存在巨大差异,我们将词频做标准化处理,处理模式为将关键词在特定阶段中出现的频次除以该阶段的发文量,以保证各个阶段数据之间对比的效度。鉴于标准化处理后大量数据值小于1或为0,卡方检验失效,本文不再进行统计检验。表4为标准化后各个时期国内壮语词汇文章“标题+关键词”高频词表。
表4 5个阶段国内壮语词汇研究论文“标题+关键词”高频词表(标准化后)
分析表4可知,除了在第2阶段和第3阶段出现短暂回落,“壮语”总体保持较稳定趋势。“词汇”的波动也很小。“汉语”一直处于下降状态,第4阶段出现短暂回升,到第5阶段继续回落。“借词”研究从第2个时期才出现,但之后呈下降趋势。前两个时期没有出现“语法”研究,第3个时期出现后又表现出下降趋势。“量词”在5个时期内稳步回跌,到第5时期相关研究接近消失。1980年以前尚未出现“对比”的研究,到第2个时期出现后总体呈现上升趋势。壮语与泰语的对比研究直至第4阶段才出现。这些数据表明当前壮语词汇研究的总体情况并不乐观。
研究主题在各个阶段的统计数据能让我们从宏观层面了解壮语词汇研究主题的变化情况,而对每个时期的高频实词提取能更清晰地了解各时期研究的焦点及侧重点,便于我们梳理国内壮语词汇研究发展的动态脉络。同样,基于各个时期h点的值,筛选出h点前的高频名词实词制表(见表5)。
表5 5个阶段国内壮语词汇研究论文“标题+关键词”高频词表(h点前)
表5显示,由于研究对象的受限,“壮语”稳定为每一阶段的首位高频词。第1阶段无法得知其他信息。第2阶段开始出现“量词”研究以及壮汉对比方面的研究。在第3阶段,“语法”受到关注,并开始探究壮语与其他壮侗语语支词汇的共性和差异。第4个阶段,壮语汉语对比重新成为该阶段研究热点,注重运用“比较”的研究方法,“泰语”和“借词”研究均受到关注。除壮语汉语对比、语法和借词研究外,第5阶段开始出现“类型学”角度的壮语词汇研究。
(2)国外研究
同样,我们提取了25篇发表在国外外文期刊上的论文的“标题+关键词”的词频,如表6。
表6 国外外文期刊有关壮语词汇研究论文“标题+关键词”高频词表
为便于统计,我们将国外外文文献的关键词和重要词频进行了翻译。“Zhuang”(壮)以27的频次处于词频表首位。与“Chinese”(汉语)相关的3篇研究论文中,有两篇是壮汉语书写系统的异同对比,一篇对比了中古汉语与原始台语的温度词。
“sawndip”(方块壮字)表明研究对象限定为方块壮字而非拼音壮文。有1篇文章从壮文的语义成分探究壮族人民的认知状况。“character”(符号)、“script”(字母表)和“writing system”(书写系统)也位于高频词行列。1篇从中文拼音系统对壮文拼音系统中的符号变体进行研究,另1篇为研究基于汉语的壮语书写系统。
2.摘要
(1)国内研究
摘要可进一步反映研究与内容主题相关的话题。随后对于国内壮语词汇研究文章的“摘要”进行了高频词提取,得到高频词:壮语、词、汉语、语言、方言、语法、语气词、结构、借词、语义、动词、量词、词汇、文化、功能、比较、副词、泰语、壮族、演变、语音、来源、壮、对比、民族、形容词。
可以看出,“摘要”部分的高频词中涵盖了“标题+关键词”中所有的高频词,此外还出现了许多新的关注点,本文将其归纳为5类。
方言。探讨南北部方言的差异或北部方言内部、南部方言内部的一致性和普遍性。
词汇。包括“语气词”“动词”“副词”和“形容词”。从摘要中的实词(形容词和动词)、半实词(副词)和虚词(语气词)可以窥探第一大类词性分类的研究现状,总体上看实词研究占主导,半实词和虚词研究可挖掘性更强。
文化。包括“文化”“壮族”和“民族”等词。研究壮语与其他文化接触过程中产生的壮语词汇,或在壮语词汇研究中揭示壮族文化的特点及渊源,又或者从跨文化的视角以词汇为切入点对比分析壮文化与其他文化的异同。有学者对广西马山县的壮语稻作词汇进行研究,解读了壮族的稻作文化[24];也有研究比较分析了壮泰民族早期共同稻作文化形态[13]23-46。
历史。包括“演变”“来源”等词。研究壮语词汇的历史变化,某一词汇的演变或某类词的来源,对壮语语源以及语源学理论进行探究。
传统语言学分支。包括“语义”“语音”等词。涉及本体研究,对壮语词汇语义和语音这两个基本语言学要素进行探究。
接下来,我们考察上述高频词在不同时期的出现频率和趋势(见表7、表8)。
表7 5个阶段国内期刊壮语词汇研究论文“摘要”高频词表(标准化后)
表7显示,“汉语”“语法”和“民族”在5个时期内的趋势变化不大,这说明壮汉对比、壮语语法一直是壮语词汇研究者们关注的重点。除“量词”下降外,其余的高频词在5个时期内呈现增长趋势。摘要中高频词的变化趋势或说明今后的壮语词汇研究存在巨大潜力。
表8 5个阶段国内期刊壮语词汇研究论文“摘要”高频词表(h点前)
表8清晰地展现出壮语词汇研究在内容、方向等方面的变化。由于1980年之前的文章没有摘要,故没有词表生成。第2阶段出现了量词和词汇结构方面的研究。第3阶段中,壮语汉语对比和语法成为高频研究点。第4阶段增加了语气词、壮泰对比、借词研究,并开始从认知角度探识壮语词汇中的隐喻。第5阶段是壮语词汇研究的爆发期,各种研究角度、研究对象都有涉及,几乎涵盖了“摘要”语料库中所有高频词。
(2)国外研究
对刊登在国外外文期刊中的25篇文章提取高频词,生成表9。
表9 国外外文期刊壮语词汇研究论文“摘要”高频词表
这些文章的摘要,除去与“标题+关键词”重叠的高频词,出现了“word”(词)。“idiom”(习语)、“Tai”(泰语)、“term”(术语)、“Han”(汉族)、“toponym”(地名)、“China”(中国)、“dialect”(方言)、“distribution”(分布)、“English”(英语),频次均大于等于9。
我们仅以摘要中的高频词“idiom”(习语)、“term”(术语)、“toponym”(地名)、“dialect”(方言)为例简单讨论相关的一些研究。
“Distribution”(分布)一词在词频表中共出现9次。然而2篇出现“distribution”(分布)的论文其实都出自国内壮语研究者[25][26],文章先从词频分布的角度研究了壮语的类型学特征,随后探究了壮语的词长分布的计量特征。这两篇文章均系统地采用了量化研究手段,从计量语言学的角度出发,对于壮语词汇进行客观的统计分析。
“Han”(汉族)与“China”(中国)的出现是由于有2篇文章分别探讨汉族与壮族人民的认知以及强调壮语是中国少数民族语言之一的语言地位。
国外的壮语研究代表为罗永现和波多莫(Bodomo)。但是就我们收集到的资料来看,他们对于壮语词汇的研究也并不多。罗氏(Luo)研究了壮语中的“放置”类动词,并对该语义域中的致使动作进行了类型学描述[27]。波多莫(Bodomo)经过田野调查,对壮语的代词系统做出了描述,并以马山壮语为例,探讨了壮语中无明显标记的自反现象[28-30]。由此可见,国外为数不多的壮语词汇研究多数是描述性研究,缺乏量化统计手段的运用。
3.文献引用
文献被引用次数可反映该文章在特定领域的地位和重要性。本文统计了共引文献的全球和本地引用情况(见表10),以便我们从微观和宏观层面上准确了解壮语词汇研究领域的权威性文献。
表10 壮语词汇研究论著高共引文献信息
表10中的高共引文献包括学位论文、专著和期刊论文。前4个高共引文献均为学位论文,其中有2篇出自广西大学,且研究主题均为分类词。专著更能反映出特定领域研究成果的重要性。《现代壮汉语比较语法》《壮语简志》《侗台语族概论》和《壮侗语族语言简志》是国内壮语词汇研究方面较为有影响力的专著。高频引文献中期刊论文数量只有1篇。
同时,我们统计了壮语词汇研究论文中所有引用文献的被引频次(见表11、12),并分期刊论文和学位论文予以讨论。
表11 壮语词汇研究论文中被引文献信息(期刊论文)
表11(续)
表11期刊论文的引用文献中,选取阈值大于500的被引文献制表。表中所列文献均为专著,且几乎都是汉语研究成果。其中涉及汉语语法的有5本专著,汉语词汇3本,汉语语音3本。与壮语相关的专著只有《侗台语族概论》,被引用数也为表中所列专著最少。此外没有找到以壮语为直接研究对象的高被引文献。期刊论文通常是一个研究领域前沿的体现,但我们在期刊论文的参考文献中却没有发现高频被引的壮语词汇或壮语相关文献,这表明目前壮语词汇研究亟待深入。
表12 壮语词汇研究论文中被引文献信息(学位论文)
在学位论文的引用文献中,我们选取阈值大于10的被引文献制表。表12显示,学位论文引用的文献中,被引频次靠前的均为期刊论文。所有文献均为与壮语相关的研究成果,其中3篇研究对象为语法,其余均为壮语词汇。学位论文的高频被引文献中没有专著,这或许从侧面说明当前壮语的基础性研究还很薄弱。
本文以CNKI和Google Scholar为搜索平台,以壮语词汇为搜索对象,对40多年来国内外刊发的壮语词汇研究论文的发文量、研究投入、研究热点以及文献引用等信息进行了考察,勾勒了壮语词汇研究的概况。
(1)国内的壮语词汇研究成果在数量上保持阶段性增长的态势。国外的研究起步较晚,直到21世纪初才开始有相关研究论文出现,但研究增长趋势与国内类似。以2000年为界,国内外的相关研究在2000年之前进展缓慢,2000年之后出现了陡坡式激增的趋势。这表明壮语词汇研究越来越受到研究者们的重视。同时,这种趋势的出现也与社会发展、国家民族语言政策的出台并实施等因素有关。
(2)本文从壮语词汇研究者、刊发相关论文的机构、刊发相关论文的期刊或平台等角度考察国内外壮语词汇研究的情况。国内覃凤余、覃晓航和吕蒿崧这3位学者为高产的壮语词汇研究者,国外则是David Holm(大卫·霍姆)投入产出最多。从作者所属机构上看,来自中央民族大学的研究者最多,来自民族地区的广西大学、百色学院、广西民族大学等高校的作者也不少。在国外平台发表相关论文的作者中,来自浙江大学的最多。在发文期刊的统计方面,发表相关论文的国内期刊——主要是凸显民族特色研究的期刊的刊文量最大,而广西的期刊又是其中的主力军。刊发相关论文的国外期刊(平台)不乏语言学类名刊,但总体发文量稀少,其影响力远低于国内期刊。
(3)对相关论文的“标题+关键词” “摘要”作词频统计。结果显示国内外学者共同的关注点是壮语汉语的对比研究和壮语方言的研究。对不同时间阶段国内相关论文的研究内容进行分析,发现壮语词汇研究滞后,仅处于初级阶段,但也存在着相当大的潜力。
(4)通过文献引用情况的统计。我们发现: 期刊论文引用的文献多为专著,其中与壮语相关的专著稀少。而在学位论文中,被引用次数最多的则是数篇期刊论文。这两种情况表明包括壮语词汇研究在内的壮语基础性研究尚属薄弱,壮语词汇研究的广度和深度尚有较大拓展空间。