粤语惯用语语义性质及其内部关系研究
——兼与汉语惯用语对比

2021-06-11 01:16马利军
关键词:惯用语字面粤语

马利军,黄 琳

(广州中医药大学 a.心理学系,b.公共卫生与管理学院, 广东 广州 510006)

一、引 言

社会交往促进了人类意识的抽象发展, 形成了个体隐喻性的、非字面的交流方式。惯用语(idioms)是一种概括化的隐喻表达形式, 是个体隐含思维的显性表述。它结构简单固定, 意义隽永丰富, 深受大众喜爱。同时, 惯用语产生性好, 使用频率高, 用处广, 意义表达富有幽默色彩。语义的双层性是惯用语的基本特征。通常, 字面意义是虚指, 比喻意义是实指。由于语义加工和句法分析常常矛盾, 虚指与实指存在“偏离”, 形成意义激活的双层性, 致使惯用语的语义通达机制成为近年来研究的热点。惯用语理解存在多种机制, 主要包括非建构观点、建构观点、混合加工模型和超词条理论。这些理论从语言理解的概念驱动加工和材料驱动加工入手, 形成自上而下和自下而上相结合的混合加工机制, 尝试化解固定表达句法加工和语义通达的矛盾。同时, 语义性质如预测度(Predictability)、熟悉度(Familiarity)、表象度(Imaginability)、可理解度(Intelligibility)、习得年龄(Age of Acquisition, AOA)等均在惯用语理解中发挥重要作用。Libben等研究表明, 熟悉度是影响英语惯用语理解的稳定因素。[1]Zwaan和Madden发现, 视觉表象参与到语言理解的过程中。[2]马利军等对汉语惯用语、歇后语、成语、谚语及粤语歇后语的研究均表明, 熟悉度影响所有语料的加工, 并常常与其他因素存在交互作用。熟悉度、可表象度和字面意义合理度影响惯用语的通达。[3-7]

粤方言是我国重要的汉语方言, 分布于广东中部、西南部和广西的东南部, 是中国七大方言之一, 继承和保留了古汉语的特点, 具有自身独特的语音体系。由于历史和经济发展的原因, 港澳同胞和海外华侨也多讲粤语, 粤语成为海内外汉语学者关注的一种语言, 具有重要的文化意义。张积家等发现广东大学生对粤语和普通话的态度无显著差异, 指出粤语是一种强势方言。[8]唐叶调查表明, 广州市中学生对粤语在语言的情感层面及价值地位层面的评价优于普通话, 也暗示粤语是强势方言。[9]王海兰和何文晓指出, 香港和澳门历次人口普查情况表明, 近20年来, 粤方言在两地日常用语中始终居于主导地位, 近90%个体主要使用粤方言进行交流。[10]同时, 粤语凭借独特的社会文化背景以及语音系统, 产生出了各色各样富含寓意而又琅琅上口的惯用语。[11]作为传统粤文化传承和社会网络的载体, 粤语具有重要的社会文化内涵。因此, 粤语惯用语具有很强的民族文化色彩, 在一定程度上展现了其产生过程中的社会历史文化背景, 对于初学粤语的学习者来说, 理解、掌握惯用语具有一定的难度。

粤港澳大湾区有着丰富的语言资源和独特的语言格局, 语言障碍和语言资源并存。屈哨兵认为, 粤港澳大湾区的优势要长期保持, 语言问题的梳理和语言建设的实施是不可缺少的基础性组成部分。[12]随着外来人口的增加、普通话的推广和粤语流行文化的式微, 粤语正逐渐呈现出衰落趋势, 而作为文化的典型语料, 惯用语必然首当其冲, 出现语言磨蚀现象。本文采用语义评定法调查不同类型的粤语惯用语的语义性质并探究其互相作用的关系。同时, 对比汉语惯用语的评定数据, 寻找两类语料语义性质的差异, 方便为日后文化语言学和语言类型学的共性研究收集部分证据。

二、方 法

(一)被试

433名大学生, 男165人, 女268人, 均为普—粤双言使用者, 在粤语环境中成长。

(二)材料

从《广州话俗语词典》[13]中选取190个三字格惯用语, 其中38个整词, 84个动宾结构, 20个“1+2”偏正结构, 48个“2+1”偏正结构。

(三)程序

语义性质评定采用5点量表, 从低至高遵循从1~5的顺序。按照测试性质汇编成册, 有3类评定问卷。问卷一用于评定习得年龄, 共有47名大学生参加评定。将习得年龄分为六个受教育阶段: 幼儿园、小学一到三年级、小学四到六年级、初中、高中、大学。被试根据自己的主观记忆判断惯用语的习得阶段。问卷二用于评定语义分解性和预测度, 共有66名大学生参加评定, 分成3组, 每组22人。将190个惯用语分成3个分问卷, 第一组70个, 后面两组各60个。在每个分问卷中, 只出现两组惯用语, 要求被试评定其中一组惯用语的分解性, 另一组惯用语的预测度, 语料不予重复。分解性指惯用语中语素是否对其比喻义有贡献。预测度是将惯用语的最后一个汉字空缺, 根据被试对其补充的比例进行评定。问卷三用于评定熟悉度、可理解度、可表象度、字面意义合理度和词素贡献, 共有320名大学生参加评定, 每组32人, 每人完成一组问卷评定。将190个惯用语设成10个分问卷, 采用问卷二中同样的结合方式,令同一问卷不会出现相同的惯用语。可理解度指仅看惯用语整词时是否容易理解其含义; 可表象度指看到惯用语时是否容易形成形象表征; 字面意义合理度指惯用语是否有合理的字面意义解释; 词素贡献包括单字词素贡献和双字词素贡献, 即处于“1”和“2”位置的词素对惯用语理解的贡献, 通常做法为判断惯用语中给予标记的词素对惯用语比喻意义的贡献。数据录入计算机, 采用SPSS24.0进行统计分析。

三、结果与分析

(一)粤语三字格惯用语语义性质描述统计分析

对粤语三字格惯用语的语义性质进行描述性统计, 同时对比汉语惯用语的评定数据,[3]结果见表1。

由表1可知, 除语义分解性与预测度外, 其他语义性质判断的平均得分都处于总分60%到80%之间, 属于中等偏上水平。熟悉度得分低于3的惯用语有45个, 占总数的21.43%; 可表象度低于3的惯用语有49个, 占总数的23.33%; 字面意义合理度低于3的惯用语有40个, 占总数的19.05%。上述语义性质评分较低的语料较多集中在如“大天二”“老奀茄”“卖大包”等生僻惯用语表达。调查结果表明, 大学生对多数粤语惯用语均熟悉, 但鉴于地方特点或生活习惯等对部分粤语惯用语少有接触, 同时也暗示部分语料已不适应当代环境, 正逐渐淡出粤语使用者的生活。另外, 词素贡献得分低于3的惯用语有30个, 得分高于4的惯用语有49个, 综合发现上述提到的生僻词类惯用语表现出词素贡献判断得分两极化的情况, 如“大天二”(2.73)和“老奀茄”(3.93)。大学生对不甚理解词汇的关键语素给出了极高或极低的评价, 暗示大学生对语料的原义和典故缺乏认识和了解, 致使对其他语义性质如熟悉度、字面理解性、可表象度的判断得分偏低。另外, 可理解度得分低于3的惯用语有84个, 占总数的40%, 得分高于4以上的仅25个, 占总数的11.90%, 表明多数大学生对惯用语是否容易理解评分较低。语义分解性评定得分低于3的惯用语是112个, 占总数的53.33%。同时, 粤语惯用语预测度得分较低, 得分低于0.5的有142个, 占总数的67.62%, 得分低于0.1的有55个, 有19个惯用语得分为0, 没有一个被试可以补充完全。一方面, 由于粤语惯用语多为整体认读, 难以实现由部分预测出整体, 如“撞手神”“饮水尾”等词汇的预测度均为0; 另一方面, 粤语惯用语也存在固定词组和不同形容词或动词的搭配如“一嚿饭”“一嚿云”等, 此类惯用语同样具有不可预测性。对离散程度分析可知, 除预测度外其他各项语义性质皆呈现出较低的变异性, 暗示大学生对各项语义性质的判断较为一致, 而预测度较高的变异度可能是由熟悉度、词素贡献和分解性共同作用造成。另外, 大多数惯用语的习得年龄处于小学四到六年级, 占总数的76.67%, 即大学生主观认为小学高年级阶段已经掌握了大量的惯用语; 而生僻或带有典故的惯用语如“撞口卦”, 平均习得年龄为高中。习得年龄的数据表明粤语惯用语在日常生活中较为常用。

表1 粤语和汉语惯用语语义性质判断得分

结合汉语惯用语数据对比可以发现, 除熟悉度外, 汉语惯用语的其他语义性质(分解性计量方式不同, 不比较)得分均值都较粤语惯用语高且得分的离散程度更低, 但是, 习得年龄比粤语晚。其中差距最大的评分为可理解度和预测度, 表明相对于粤语, 汉语表达更普遍, 使用频率高, 更容易通过前面词素补全整词, 也更容易理解其意义。同时, 语义性质较低的离散程度也证实,汉语表达相较于粤语表达更完善且更普遍、更贴近大众的文化生活。从结构来看, 除了与汉语惯用语相同的“动宾、1+2、2+1偏正”结构外, 粤语中还出现了大量的整词惯用语, 如“二五仔”“化骨龙”等, 凸显其文化内涵。同时, 从熟悉度和习得年龄评分可以发现,普通话作为官方语言, 其更多来自书面语言的学习, 按照教学大纲开展教学工作, 习得年龄较为一致, 也表现出比粤语惯用语更晚的习得年龄。而粤语惯用语的习得更多是口口相传(各地均缺乏规范的书面语言学习历程), 表现出更早的习得年龄判断和较高的离散程度。两类语言的对比结果表明,规范的书面学习是语言流传和保持一致的关键。

(二)粤语惯用语语义性质相关关系

对粤语惯用语的语义性质进行相关分析, 同时对比汉语惯用语的各项语义性质, 结果见表2。

表2 粤语和汉语惯用语语义性质相关分析

由表2可知, 在粤语惯用语中, 熟悉度与其他语义性质的判断得分呈显著正相关; 而习得年龄与其他语义性质判断得分呈显著负相关。惯用语的熟悉度评分高意味着在生活中有更高的使用频率, 加强使用者对惯用语的语义与表象加工。因此, 熟悉度、可理解度、可表象度三者高度相关。而字面意义合理度、词素贡献与语义分解性与可理解度相关最高, 表明当粤语惯用语中的地方文化较少时, 如“博出位”和“玩出火”中“出位”和“火”, 在普通话中也有相似的用法与解释, 更易于分解出关键语素或由字面义对惯用语进行内涵理解。而对于可理解度较低的惯用语, 则会伴随字面理解性、词素贡献、语义分解性评分的共同降低, 对其理解则要求粤语使用者拥有更高的语用水平和文化底蕴。预测度和习得年龄与熟悉度呈现出高相关, 符合语言学习中回忆与再认的特点。

与汉语惯用语相关性数据对比发现, 粤语惯用语的所有语义性质相关得分都比汉语高, 充分显示出粤语有其自身的深刻文化内涵, 尤其见于词素贡献与其他语义性质的相关性中, 简短的关键语素是生活文化的浓缩。同时, 粤语在其体系中更出现了大量的整词惯用语, 在评定时对可理解度、可表象度等具有更大的影响。汉语惯用语中的习得年龄与语义性质的相关性整体高于粤语惯用语, 符合其作为第二语言被学习、使用进而熟练的事实。另外, 两类惯用语各语义性质较高的相关性以及同样的趋势暗示,语言习得和产生具有认知加工的一致性, 即使两类语言的“句法和表层结构”差异较大, 其在认知系统的表现也较为一致。

(三)粤语三字格惯用语语义性质回归分析

理解和识别惯用语是语料加工的最终目的, 故以预测度和可理解度作为因变量对各语义性质进行逐步回归分析, 结果见表3和表4。

表4 以可理解度作为因变量的回归分析

表3 以预测度作为因变量的回归分析

在以可理解度为因变量的模型中, 对于给出完整材料的粤语惯用语, 熟悉度、字面意义合理度、可表象度、习得年龄和语义分解性5个因素效应显著, 可解释83.6%的变异量。而汉语惯用语可理解度的影响因素共有3个, 分别是字面意义合理度、熟悉度以及可表象度, 可解释75.4%的变异量。可见, 前3个因素对两类惯用语的可理解度均发挥主要作用。对于粤语惯用语, 熟悉度的作用最大, 字面意义合理度的作用最小; 对于汉语惯用语, 字面意义合理度的作用最大, 可表象度的作用最小。对于熟悉度较高的词汇, 语用频率有助于个体在日常语境中理解词汇的比喻义。

(四)不同结构粤语惯用语语义性质回归分析

本研究共有4类粤语惯用语, 以可理解度和预测度为因变量, 分别对4类惯用语语义性质作逐步回归分析, 结果见表5和表6。

表6 以不同结构惯用语的可理解度作为因变量的回归分析

表5 以不同结构惯用语的预测度作为因变量的回归分析

在以预测度为因变量的模型中, “2+1”偏正结构惯用语语义分解性效应显著,动宾结构惯用语熟悉度效应显著,整词惯用语可表象度效应显著。经散点图检验, “1+2”偏正结构惯用语的预测度与其他语义性质不存在线性关系, 因此未有语义性质因素进入模型。马利军等对汉语惯用语的研究表明, 偏正结构惯用语语素语义启动显著, 词素在惯用语整词理解中存在激活。[4]“2+1”偏正结构惯用语, 如“盲公竹”“为食猫”等, 前两个语素的出现, 会易化后一词素的提取。粤语的整词惯用语不同于另外3种结构, 通常以“固定搭配”的形式出现或采用粤语语料“冇”“唔”, 如“大天二”“鸡噉脚”“糖黐豆”“化骨龙”“冇口齿”等, 指代特定的人或是对行为的评价。此类语料, 通常只具有整词语义, 难以形成表象。但是, 由于使用频率的增加, 个体会对意义进行“表象化”以促进语义的快速激活, 对语料进行加工时只需再次激活既存映射图式。

以可理解度为因变量的模型中, 熟悉度在4类惯用语中的效应均显著。熟悉度作用已受到许多研究证实。除熟悉度之外, 字面意义合理度对“2+1”偏正结构惯用语、“1+2”偏正结构惯用语、动宾结构惯用语的理解也发挥重要作用, 合理的字面义能够强化个体对惯用语的记忆。而对于整词惯用语, 可理解度的影响因素还包括可表象度和语义分解性。表象在理解惯用语中发挥重要作用; 整词惯用语中有比喻义贡献的词素, 能进一步帮助个体理解和激活该比喻义语汇。当然, 由于整词惯用语构词模式的“特殊”性, 其很难形成有效的字面意义, 无法发挥作用。

四、讨 论

当前对粤语的研究多为将其与其他语言进行联系、对比或对粤语文化、起源的探究, 而相对缺乏对粤语自身性质的探索。本研究立足粤语惯用语本体, 探索词汇语义性质及其互相作用的关系。

(一)粤语惯用语语义性质特点

首先, 粤语以其源远流长的文化内涵、大量的使用者和大范围的语用地区造就了强大的方言体系。粤语靠口口相传, 语用频率(熟悉度)是重要的语义性质。当从语用角度来认识惯用语时, 可理解度与预测度意味着固定表达的“理解和产生”。粤语虽然是“强势”方言, 但是流传方式决定了其所内含的特殊的语义性质关系: 一切语义性质以口语语用的熟悉度为基底。粤语有着一套独立的发音系统, 包含56个韵母、20个声母和9个声调, 除此之外还有6个辅音韵尾, 皆来自于中古汉语的完整保留。[15]同时, 粤语习得过程中缺乏系统规范学习, 用字生僻, 造成了普遍的读写分离。如表示“给”时, 粤语读音表达为“bei2”, 但在书写时, 则会因地域不同或习惯不同而写成“俾”“比”甚至普通话“给”。调查发现, 由于粤语惯用语更多以口语流传, 在完成预测度评定时很多被试存在会说而不会写的现象。而在内涵方面, 粤语惯用语隐喻水平高, 其表象难度和理解难度也由此攀升。此外, 语义分解性高, 意味着惯用语包含着理解比喻义的关键语素, 却又通常无法通过字面义而直接理解语素意义。因此, 由于语用的口语化, 缺乏系统的书面语言学习经历, 使得粤语惯用语语用直接激活其比喻意义,而对背后的历史文化典故缺乏考究。这一事实使得熟悉度成为了统筹其他各项语义性质的关键成分。

另外, 熟悉度并不仅仅反映出材料的常用、常见程度, 还更多地展示出个体对材料的学习程度。个体对材料的熟悉度评定得分高, 暗示着被试对材料的学习程度高, 惯用语作为整体出现的频率高, 语料易理解, 易表象。同时, 熟悉度低的惯用语预测度低, 但熟悉度高的惯用语,由于“听写分离”,却未必呈现出高预测度。另外, 结构也影响对惯用语的预测度判断。在对“2+1”偏正结构的惯用语理解中, 个体可以通过关键语素启动激活尾字。梁逸云和邱春安指出, 如“败家仔”等“2+1”结构惯用语通常被视为词根加后缀的复合词—后加式。[16]此类固定的表示人的后缀常见为“仔”“佬”等, 意义明确、便于理解, 与汉语中的“家伙”相近, 而后来汉语中所用的带“仔”“佬”的词汇亦都可看做粤语词素的迁移, 颇具方言文化特色。

另外, 粤语惯用语中还出现了其他语言中少有的整词结构, 它们隐喻程度高, 分解性低, 但更易在结构和意义之间建立联系, 易化加工。这些整词不具有造词成分, 有时甚至不具有内在造词逻辑。如代表“土匪、恶霸”意义的“大天二”, 相传原本是“大丁二”, 因为土匪恶霸通常自称大王, 而当时书写是由上至下的, 大王就可能被看成“丁”“二”。再后来民口相传, 传成了“大天二”。还有“二五仔”, 指中国清代秘密会社的切口, 二五仔即“义忤仔”, 意指告密者、叛徒、出卖组织的内奸和专门在人后说是非的人。“义忤”与“二五”的粤语发音相似, 在不了解原词历史的基础上,“二五仔”是整词表达, 不可拆分。另外, 粤语在常用表达中会经常呈现出其部分倒装的特点, 如“你去先”“对你唔住”, 但在粤语惯用语的构造中未发现类似的迹象, 结合粤语惯用语各语义性质相互影响的特点,这在一定程度上反映出粤语在隐喻和概念构造上的特异性。[17]

(二)粤语惯用语与汉语惯用语的语义性质比较

陈栩茜和张积家指出, 粤语和普通话在双言者心理词典中共享同一语义表征, 语言间联系属于多通道联结模式,一种语言的词汇表征既能直接联系语义表征,也可通过另一种语言的词汇表征进行联系。[18]张积家和张凤玲认为, 粤语和汉语尽管所用词汇不同, 但是两种语言的语义共同表征, 具有双向联系, 只是联系强度不同, 从由粤语词到汉语词的联系比由汉语词到粤语词弱。[19]这是认识粤语和汉语间差异的基础。普通话作为国家推广语言, 易表达、易理解, 因此, 汉语惯用语的可理解度、可表象度、字面意义合理度都比粤语要高, 且这些语义性质与熟悉度的联系远不如粤语紧密。同时, 由于书面学习经历, 汉语惯用语词素通常会表征丰富的语义信息, 使用者往往只需要凭借字面意义合理度或可表象度等语义性质就能进行较完整的语义加工, 这也导致汉语惯用语的隐喻程度较低。

粤语惯用语的熟悉度对其他语义性质具有易化作用, 并促进语义加工的完成。唐启运认为,粤语惯用语是一种现成且定型了的固定词组, 其内部组合不自由。[20]但汉语惯用语却可以随语言文化的融合甚至流行说法而不断进行发展、变化、创新。粤语惯用语中的“固定”特性, 在带量词的语料中尤其明显。粤语中有“一嚿饭”“一嚿泥”“一嚿石”等众多用相同量词的表达, 但是其中只有“一嚿饭”是惯用语, 倘若说成“一煲饭”“一碗饭”, 均不可。此外, 对于发音相同的字, 有时人们会为了避讳而改为别的字。如“杠”和“降”两字, 在粤语中读音相同, 但“降”表示消极意义, 所以粤语中就把“竹杠”改叫“竹升”, 不仅避讳, 还要创作出相对应的积极词。[21]这些改变虽提高了粤语的灵活性和可辨认度, 却也牺牲了粤语的可理解性。另外, 粤语惯用语为了获得长久的流传, 在一定程度上摈弃了严格的表达规则。它作为一种文化产物, 其表达中绕不开经验因素、文化因素上的以物比类, 其隐喻的理解具有文化指向性, 这也增加了可理解性的难度。而汉语是文化的一种集合, 它需要不断地向其他语言和文化寻求融合, 更具有时代性且非地域性。由于粤语和普通话之间的联系强度不同, 当用粤语指向普通话时,可激活的语义信息较少, 使得粤语语料语义性质之间的联系也更为紧密。另外, 粤语的习得通常是累积效应, 且习得者年龄较小, 对语言的语用能力还处于较贫乏阶段; 而汉语的习得具有规范的学习过程和学习时间优势。同时, 粤语还存在地域的变异性、文化传承带来的限制性等, 这些因素都会对粤语和汉语惯用语的理解带来了不同的影响。

詹伯慧指出, 粤语研究内容在20世纪80年代进入鼎盛期, 并在之后的一二十年间突飞猛进, 全面发展, 研究者对粤语文化的重视程度不断提高。[22]粤语的前身可追溯到春秋战国时期的民族共同语雅言, 发展至今已成为岭南地区传统文化的载体。[23]因此, 粤语并不是单纯的一种交流工具, 其传统文化承载者的身份无疑令粤语群体为之自豪。张积家、杨卓华和朱诗敏认为, 广东的大学生对普通话的态度是矛盾的, 态度中的认知成分到位了, 但情感和行为成分上却有明显的滞后。[8]这不仅表明了态度差异确实存在, 还指明态度差异的根源是感性的、文化性的。同时, 由于粤语的学习、交流随时代发生了改变, 现今多数的粤语使用者都是粤—普双言者甚至粤—普—英三言熟练者, 当粤语语用受自身粤语水平的表达或语境限制时, 他们转而使用其他语言来弥补交流的不足, 出现语言磨蚀现象, 即方言词汇使用的减少以及方言运用能力的下降。作为汉语方言的重要分支, 粤语学习、粤文化传承和认同无疑是重要命题, 其本质都是对粤语作为一种语言与文化存在的重视, 同时也是保持民族文化多样性的保障。粤语惯用语是隐喻认知思维在语言中的典型表现, 也是其作为岭南传统文化载体的体现。研究者需要对粤语惯用语进行更详尽的剖析, 分析其理解机制, 了解其背后的文化驱动, 以增加文化多样性并规避语言磨蚀。

(感谢朱睿和林绮文同学收集整理数据)

猜你喜欢
惯用语字面粤语
在湾区时代下粤语的传承与保护
Fun Idioms趣味惯用语
Fun Idioms趣味惯用语
金缕衣
《讯飞输入法》粤语直接翻译为普通话
别误会这些英语
粤语对话庄文强 如何平衡双雄故事
韩语惯用语的特点及教学方法浅析
别误会这些英语
陈小春发长文怼后辈不尊重粤语