中华民族共同体视域下黄河流域民歌语言特征计量研究

2024-04-08 01:13张晓瑾刘海涛
北方民族大学学报 2024年2期
关键词:省区语序支配

张晓瑾,刘海涛

(1.北方民族大学 外国语学院,宁夏 银川 750021;2.浙江大学 外国语学院,浙江 杭州 310058)

一、引 言

以文学研究为本位的民歌理论创新和多学科交叉互动的方法创新,成为近年来民歌研究的新趋势[1]。语言生态属于人类精神文化范畴,与自然生态相区别。1971 年豪根提出了语言生态概念,认为“特定语言与环境之间的相互作用关系”[2]17即为语言生态,特别强调语言与环境的互动关系。豪根所提出的语言生态中的语言与其所处的环境主要指社会环境或者人文环境,我们将其类比为语言的社会生态,主要是社会的政治、经济、文化、文明等方面的状况和氛围[3]。

作为各种地域文化的载体,民歌的语言生态与现实世界的生态之间存在关联,民歌内部的语言系统及其语言使用也必然通过一定的形式反映其与现实世界的相互作用。已有黄河流域民歌研究多是对某一地域、某一类型的民歌语言特征的研究,而将多地域民歌的词汇、句法、语义特征纳入其中,采用数学、概率和模型等跨学科方法,对民歌语言特征与黄河流域生态特征、文化特征进行综合分析的还较少。

为探究黄河流域民歌语言生态特征的词汇、句法结构及其语义主题的总体面貌所呈现的语言规律,本文以黄河流域文化为背景,观照中国语言事实,借鉴多学科方法,全方位展开黄河流域九省区民歌语言生态特征研究,将黄河流域民歌置于中华民族共同体视域下,分析不同省区民歌语言特征,以及民歌一般语言规律与黄河流域自然环境、人文社会之间的关联,及其在中华民族发展壮大过程中的当代价值。

二、黄河流域民歌词汇计量特征

民俗数据与跨学科方法的融合和发展,成为民间文学作品形式主义研究范式的开端。在词汇研究方面,黄河流域民歌语言研究主要围绕具体地域的不同民歌语言特征展开。在研究对象上,通过语言特征的对比,研究者在纷繁复杂的语言现象中找到特殊规律[4]。在研究方法上,国内外已有一些从计量角度对民歌语言特征展开的研究。例如,波佩斯(Popescu)等人在分析141 首罗马尼亚艾弥涅斯库民歌时发现,艾弥涅斯库(Eminescu)民歌词汇的秩频可以用泊松函数、正泊松函数、右截Zeta 函数、Zeta 函数、平田泊松函数拟合[5]75~84。在国内,中国民歌“花儿”词频分布符合奇普夫定律,表明“花儿”文本具有“自组织”的规律,这一内在的语言规律不受创造者对文本的控制力影响[6];“壮欢”民歌的词频统计结果也从量化的角度突出反映了民歌研究定性和定量的跨学科范式[7]。

20世纪20年代,哈佛大学语言学家奇普夫(Zipf)在研究人类语言的真实文本时,发现词出现的频数与其频数秩(序号)之间存在反比例关系,这一关系被称为奇普夫定律,也是计量语言学中一个重要的定律。语言学定律奇普夫-阿列克谢耶夫函数(Zipf-Alekseev)可以拟合节奏单位长度,说明节奏单位可以作为文本韵律结构。在表1 中,黄河流域民歌词汇不同秩频分布水平上的拟合结果R2>85%,说明奇普夫-阿列克谢耶夫函数可以对所拟合的文本秩频分布特征解释85%的拟合结果,黄河流域民歌词汇体现出语言的一般属性“自组织”,这一机制可以解释语言中词语用法的统一性和多样性。民歌创作主体的集体意识凸显出中华民族文化交流和社会发展的历史记忆,黄河流域民歌是中华民族取之不尽、用之不竭的艺术宝库。

表1:黄河流域民歌秩频拟合结果

三、黄河流域民歌语序趋同特征

语言的普遍性是语言的内在特征,语言的多样性受语言的外部动因影响。语言区域类型学着眼于某地域内各种语言的地理类型格局所反映出的语言接触导致的区域趋同现象,黄河流域民歌的语序类型或许是审视汉语口语VO-OV(动宾-宾动)语序类型的有效切入点。

(一)黄河流域九省区民歌依存方向分布情况

汉语是SOV 语言,同时汉语经历了由SVO 语序向SOV 语序的缓慢演变[8]166~168。格林伯格(Greenberg)采用30 多种语言的抽样语料归纳基本语序,VO 语序和OV 语序的参数包含:主谓宾/前置词/所有者—中心名词/中心名词—形容词;主宾谓/后置词/所有者—中心名词/形容词—中心名词;主宾谓/后置词/所有者—中心名词/中心名词—形容词[9]。以上这三种参数分类的含义是:VO 语言类型,其中心语位于修饰、限制成分的前边;OV 语言类型与此相反,中心语位于修饰、限制成分的后边。在本质上,OV语序和VO语序仍然是支配动词居前或支配动词居后的语序。

法国语言学家泰尼埃(Tesnière)在《句法结构基础》中提出依存句法的概念,核心观点是句子中各个成分(词)的地位是不平等的,有些词起支配作用而另一些词属于被支配的从属关系[10]83。依存句法中的依存关系和依存方向在语言研究中得到广泛应用。为了从宏观角度比较黄河流域民歌的语序类型特征,首先需要计算民歌的依存方向。

以黄河流域九省区为民歌分类的标准,从《中国歌谣集成》系列丛书中选取青海、四川、甘肃、宁夏、内蒙古、山西、陕西、河南、山东九省区每个省区100首汉语民歌,共计900首。清洗民歌语料后,以图1“石榴花开,籽籽同心”例句为例,首先把“石榴花开,籽籽同心”例句进行分词,分词后的句子通过标记有向弧连接“石榴花”“开”“籽籽”“同”“心”这5 个词,一般来说,有向弧从支配成分指向从属成分,反映了一个依存关系中两个词之间的句法关系。例如,“同”支配“心”“籽籽”“开”“石榴花”。图1 例句的依存方向的计算方法为:(4-1)+(4-2)+(4-3)+(5-4)=7,该计算结果7>0,表明是支配词居后的依存关系(Governor-Final Dependency);若计算结果为负值,则表明是支配词居前的依存关系(Govern-Initial Dependency)。依存方向已经成为语言类型学研究中一个可靠的计量参数。

图1:民歌依存方向示例

图2 是黄河流域九省区民歌依存方向的计算结果,深色长方形方块代表支配词居前,浅色长方形方块代表支配词居后。九省区民歌的依存方向包含两种依存方向的类型:支配词居前和支配词居后。其中,山东、陕西、河南、内蒙古四省区的优势语序表现为支配词居后;山西、青海、宁夏、甘肃、四川五省区优势语序表现为支配词居前。

图2:黄河流域九省区民歌依存方向分布

(二)黄河流域民歌VO-OV混合语序特征的内部动因

语序之争在学界从未停止,很多学者已经关注汉语的类型特征与语言接触的关系。刘海涛基于20 种语言依存方向发现的语序类型特征定量研究结果表明,所有语言都含有支配词居前和支配词居后的依存关系,只不过有些语言的支配词居前或支配词居后依存关系比例大于其他语言[11]。本文研究结果也表明,黄河流域九省区民歌均包含支配词居前和支配词居后两种语序特征,如图2 所示,四省区民歌呈现出OV语序优势,五省区民歌呈现出VO语序优势。黄河流域民歌在长期发展演变过程中,兼具OV和VO两种语序,具有典型的混合语序特征。

汉语语序由VO 向OV 的变化,其中一个重要依据就是“把”字句的出现[7]。通常,“把”字句位于谓语中心词,主要标志是用介词“把”组成介词短语。“把”字句的语法意义是:通过动词发出的动作使行为主体代表的人或事物因动作发生而产生变化或受到某种影响或相应产生某种结果。公元前4世纪左右,“把”还是动词,至公元9世纪左右,“把”演变为介词,承担引入受事功能。几乎所有的介词都是从动词中衍生出来的[12]。基于语料库相关研究发现,“把”字由动词经过历史的演变逐渐虚化成介词,加上人们的长期使用,最后成为一种固定句式[13]。

图3是九省区民歌“把”字在句中的词性和语序分布,九省区民歌“把”字句的词性频率分布对比很明显,“把”作为动词在民歌中的用法已经很少见,更多是用作名词和量词。“把”字句的结构变化本质上是VP 的变化,现代汉语确实在应用“把”字句的频率上有大幅度增长,这也使得OV语序的句子相应增加。严格讲,汉语是典型的非形态语言,表达语法手段的方法是语序变化,缺乏形态标志和形态变化,故而语序和虚词是汉语表达的重要语法手段。可见,无论是语序类型的依存方向分布,还是“把”字大量以量词出现的频率分布,黄河流域民歌的语序和虚词使用特点都符合汉语非形态语言的典型特征。

图3:黄河流域九省区民歌“把”字的词性和语序分布

关于语序的语法作用的讨论,最早见于世界比较语言学之父冯·洪堡特《论人类语言结构的差异及其对人类精神发展的影响》第13章,他按照词在句中的语法形式把各种语言的词划分为“孤立”“屈折”与“黏着”三大类[14]129。在确立句子的统一性时,非语音手段,如词序或某些特殊的被分离出来的词即虚词开始发挥作用。汉语史家研究发现,在我国历史上,与现代汉语相对接近的书面语都必然与当时的口语相一致,先秦时期书面记载的民歌与当时的口语具有一致性。自汉魏以来,大部分民歌以及唐宋后的古白话小说故事等表现出与现代汉语用词、句法较强的一致性。例如,用依存语法计算依存方向的方法,对汉乐府民歌《江南》进行分析。“江南可采莲,莲叶何田田,鱼戏莲叶间,鱼戏莲叶东,鱼戏莲叶西,鱼戏莲叶南,鱼戏莲叶北。”这首民歌的依存方向值为7.407,这表明是支配词居后的依存关系。

目前,对古代汉语和现代汉语语序的结论主要有VO 语序、OV 语序、VO-OV 混合语序。比较前置词和后置词、介词短语、领属语、关系从句的位置,有学者认为,VO 是古代汉语的主要语序,同时上古汉语也是VO 和OV 的混合语序类型[15]。与此相对的观点是,古汉语是VO 语序,现代汉语则是OV 语序[8]。尽管这些对比研究侧重的研究对象不同,但至少说明OV 和VO 的语序变化并不是某一固定时间突发的结果,而是经历了从上古时代就开始的交融混合的动态过程。

(三)黄河流域民歌语序趋同现象的外部动因

汉语普通话出现VO 和OV 混合语序的外部动因主要有三个:地理位置、民族迁徙、语言接触。这三个因素是相互联系的,因为只有适合的地理位置才可能形成长期不断的频繁民族迁徙,只有长期不断的频繁民族迁徙才可能造成不同语言的接触,只有大量的语言接触才可能造成语言的融合或混合现象[16]。

从民歌句法的内部语序分布状况看,民歌在多民族聚居地区的黄河流域表现出语序的趋同性,兼具支配词居前和支配词居后两种语序,如河南、陕西、山东、内蒙古等区域的民歌,支配词居前或支配词居后依存关系比例大于其他区域。从地理位置上看,中国处在OV 语序与VO 语序的中间地带,西北地区是OV 语序的主要分布区[17],那里地势多平坦,具有人口流动的客观便利条件。从公元前221 年至公元1368 年,来自北方蒙古高原、西北牧业和半牧业区以OV 语序语言为主的人口不断进入黄河流域,与此同时,黄河流域的人口南迁至长江流域及更远的地方[16]。人口迁徙不可避免地伴随着语言接触,黄河流域民歌混合语序特征也从语言接触角度说明,OV 和VO 的混合特征与历史上的民族迁徙带来的语言接触之间存在联系。

从黄河流域民歌的语序特点看,事实已无可辩驳地说明,VO 语序和OV 语序的发展离不开语言内部要素和外部因素,和谐语言生态的主要特征表现为语言内部各要素之间的和谐以及语言与外部诸因素之间的和谐[18]2。格林伯格用语序“优势”(dominance)和语序“和谐”(harmony)这两个概念去解释语序的蕴涵共性。语言和谐本质上是语义性的一种对称现象,语序优势是不对称的,本质是语用性的[19]。真实语言内部各核心成分有趋向和谐一致的倾向性,稳定的社会需要和谐的语言生态和语言生活。

黄河流域的青海、四川、甘肃、宁夏、内蒙古、山西、陕西、河南、山东九省区汉语民歌,均选自有“世纪经典”和“文化长城”之称的“中国民间文学三套集成”之一的《中国歌谣集成》,该丛书所收纳的是黄河流域千百年流传下来的民众口头文艺作品,也是黄河流域民间文化记忆的书面记录。费孝通先生在《中华民族多元一体格局》一书中指出:“中华文明首先在黄河中下游发达,出现了中华最早的国家制度、青铜文化和文字制度。”[20]71黄河流域语言生态是在各民族交往交流交融推动下形成的,九省区民歌的语言内部VO-OV 混合语序特征,从语言内部来讲发挥着遣词造句、构建意义的功能,在“诗言志,歌咏言”的信息功能意义上记录了黄河流域已有的文化世界,发挥了文化记忆的纽带作用,构筑了中华民族共有精神家园。

四、黄河流域民歌语义主题特征

汉语是主题显著性语言,从语言对比角度来讲,在主语凸显的英语语言中,SVO 和SOV 语序的主语并不一定是汉语的主语。对汉语这样主题突显的语言来说,仅仅通过S(主语)、V(谓语)与O(宾语)作为参数来分析语序类型是不够的。赵元任指出,通过主题对汉语句子进行分析具有优越性,因为在传统两个主题的分析之外,一个汉语句子还可能同时出现第三个主题[21]45。语序作为语言在句法层面的重要组成部分,与主题的关联和形式,通常与这一语序和主题的特定语境有关。

汉语句子语序变化不仅体现在句法结构上,还可以在更大的范围内考察语序在语义、语用使用上的特征。利用LDA模型获取黄河流域的青海、四川、甘肃、宁夏、内蒙古、山西、陕西、河南、山东九省区1 764句民歌的词汇概率分布,计算句间相似性,并利用概率分布值提取不同区域民歌主题,从而获得全文中心主题词,利用词汇聚类产生的主题联想大幅度提高主题词提取的准确性,实现了从整体上、语义上理解九省区民歌文本之间的内在主题联系。依据主题性越高、困惑度越低的文本主题最佳的判断标准,图4和图5中的主题一致性评价和主题困惑度评价显示,最佳主题为第17主题。利用主体模型评估黄河流域民歌的主题分布,选择最佳主题信息特征,分析主题词汇和边界词汇,发现民歌语序特征的共有特征,得到黄河流域民歌文本在主题空间上的特征向量,融入文本语义信息,有效挖掘民歌语义信息隐含的黄河流域文化相关语义主题。

图4:黄河流域民歌主题一致性评价分布

图5:黄河流域民歌主题困惑度评价分布

图6 反映的是黄河流域与农耕文明村社生活相关主题词的分布,例如,“掌柜”“长工”反映的是中国特定历史时期“人”的主体身份;“儿女”“妹妹”是中国以血缘关系结成的家庭单位的社会关系称谓词;“庄稼”则表明在这一主题下与之相关的春种、夏耘、秋收、冬藏模式的农耕文明。黄河流域民歌的语言生态指民歌语言与民歌传唱者所在地域、社会、文化相互依存和相互作用的特定状态。寻找黄河流域语言生态与语言和谐、语言认同之间的联系,需要深入分析与之相联系的黄河流域民歌的语义表征,汉语因语言接触引起的演变主要体现在词汇借用上。例如,先秦民歌《击壤歌》中所描绘的“日出而作,日入而息,凿井而饮,耕田而食”,就是典型农耕文明的生活情景。

1 764 句黄河流域民歌再现了农耕文明生活场景的词汇,具体包含:与田间耕作相关的农事词汇,如“庄稼”“镰刀”“打场”“毛驴”“犁头”“耕牛”“六畜”等;饮食类,如“白面”“烙馍馍”“荞面”“小麦”“白米”“豆腐”“油饼”“白菜”“五谷”等;凸显黄河流域区域特色的主题词汇,如“牛”“羊”“樱桃”“冰糖”“石榴”“葡萄”“核桃”“白杨”“棉花”“雄鹰”等;反映中国人民争取独立和自由的“红色”词汇,如“共产党”“红军”“刘志丹”“革命”“长征”等。这些典型词汇反映了黄河流域农业生产、日常饮食及中国革命等地域特色和时代特色。

语言是一个动态的自适应系统,民歌主题词的发展离不开黄河流域语言生态系统与黄河流域社会环境之间的相互作用。民歌是人民群众熟悉并可以找到情感共鸣点的口头表达形式,从语言的文化传播角度发挥着各民族共同吟唱、共同传播黄河流域文化精神的重要作用,表现出中华民族顽强不息的生命活力,孕育出辉煌灿烂的中华文化。

中华民族身份是中华文化的形象标识,是民族精神与民族身份的结合体。作为中华文化的认同主体,中华民族是中华各族儿女的血肉肌体,由血缘关系、地缘关系、政治关系等多元力量共同“黏合”而成的民族共同体[22]。国家认同在语言规划中的作用,主要体现为语言具有在同一群体范围内加强凝聚力的功能。“礼节民心,乐和民声”,在《礼记·乐记》中,最初的民歌可以解释为“调和民声”,其作用与现代汉语正音字典相一致。中国自秦以来就推行统一的语言文字,汉字在促进中国各地的口头交流和文字趋同方面发挥了重要的历史作用。

由于特定地域内语言的地理类型格局的客观存在和影响,语言接触极有可能导致语言特征的区域趋同现象。例如,“葡萄”“石榴”就是典型的西亚借词,植物在西汉时引入中国,现在河北、河南、山西、陕西、山东、四川等各省均有分布,这一借词的语言接触现象在黄河流域民歌的抽样词汇中也有体现。黄河流域九省区民歌的主题词汇和语言接触从侧面说明,跨区域文化接触和交融伴随着语言的传播和交融,在黄河流域各民族交往交流交融的历史进程中,文化接触和交融对语言的影响真实反映在民歌的主题词汇上。

人民群众是延续历史文脉和民族根脉的主体,民歌这种最为平常的民间文学歌唱形式,其主题的一致性恰恰反映了黄河文化的厚重历史和时代价值,具有直观可见的中华民族多元纷呈、和谐发展的黄河流域文化标识度。

五、结 语

民歌是劳动人民群体和个体经验感性的艺术表现形式,在长期的历史发展中积淀了纷繁复杂的饮食、婚姻、丧葬、语言和服饰等社会生活习俗,具有集体、抒情、隐喻和口头传统的特征,既是一种艺术形式,也是一种文化现象,更是一种传承方式。洪堡特语言观强调,语言从不是个人或者家庭的产物,只有在具有足够丰富多样的形式思维感觉方式的民族中才能造就[14]。作为民歌创作和传唱主体的“民”,已经不是简单意义上自我封闭的书面符号,而是融入服务社会的系统的演化过程中的历史主体。在铸牢中华民族共同体意识成为新时代党的民族工作和民族地区各项工作的主线背景下,中华文化精神蕴藏在流传于民众口头的民间文学、民间文化之中,在这个重要意义上,运用跨学科知识挖掘民歌内部语序特点及其与外部地域、语言接触等因素的关系,发现黄河流域民歌呈现出VO-OV 混合语序的趋同性与主题的一致性特征,这些难得而真实的语言样本为语言学、类型学研究提供了一种新的文体类型,具有极高的民间文学文化标识度,凸显了黄河流域民间文学跨学科研究的当代价值。

猜你喜欢
省区语序支配
我校成功举办第四届沿黄九省区黄河论坛
被贫穷生活支配的恐惧
跟踪导练(四)4
真抓实干,为这26省区点赞!
基于决策空间变换最近邻方法的Pareto支配性预测
汉韩“在”字句的语序类型及习得研究
随心支配的清迈美食探店记
我国沿海省区海洋产业集聚水平比较研究
中国行政区域之最