华东师范大学外语学院 华东师范大学国家话语生态研究中心 邹 航
华东师范大学外语学院 杨延宁
提 要:针对语言性别差异这一特殊语言现象,基于系统功能语言学话语分析方法,建立一个适用于语言性别差异分析的人际功能特征框架。采用特定人物话语语料,结合语用学相关理论,并借助于计算机科学领域中的机器学习方法——支持向量机,对所选取语料进行定量及定性分析,探究男女人物的话语风格差异,揭示人际功能特征与语言性别特征之间的联系,为语言性别差异的研究提供一个系统功能语言学视角下的新途径。研究结果表明:不同性别人物使用的语言存在一些显著的人际功能特征,这些显著特征与语言使用的社会文化语境一致性较高。因此,人际功能特征能为语言性别差异的研究提供一种极为有效的理论方法。
语言是人类特有的一种交际工具,是人们进行交流的主要表达方式,其依赖于社会而存在,同时又是社会成员之间最重要的联系纽带,因此,社会性是语言最本质的特征。性别差异作为一种客观存在的社会现象,必然会引起语言使用方式的差异。语言性别差异是社会语言学研究的重要组成部分,其在心理学、社会学、人类学等众多领域都受到了国内外学者的广泛关注。
有关语言性别差异的研究,最早可以追溯到上世纪20年代,Jespersen(1922)在其所著的《语言》一书中首次关注到语言性别差异现象,并讨论了两性语言的不同之处。随后Lakoff(1975)在其所著的《语言与妇女地位》中第一次运用语言学术语,对语言性别差异问题进行了详细讨论,并提出男女在语言使用上所反映出的性别差异是男女社会地位不平等的体现,同时总结了“女性用语”的主要特征,揭示了女性话语中的弱势特点。该研究在给人们带来启示的同时,也引起了激烈的争论。一方面,Cameron et al(1989)与Holmes(1986)的研究表明语境在话语差异中具有重要作用,“女性用语”的话语意义随语境的不同而异,性别与形式的使用频率、性别与形式表达的功能之间并不是简单的一一对应关系。另一方面,反对者争相提出不同的理论模式,如差异论、礼貌论及建构论。在国内语言学界,陈原(1999)所著的《语言与社会生活:社会语言学札记》是国内第一部社会语言学专著,其中“语言与社会”一章围绕女权运动和词汇的变化专门探讨了性别语言和文化之间的关系。随后,出现了一些关于语言性别研究的理论综述,李经伟(2002)在其综述中指出:性别是在交际活动中建构的,而不是事先存在的,也不是固定不变的,性别的建构同时受其他因素制约。
国内外研究者也尝试从神经认知科学及行为学角度,对语言认知的性别差异表现及成因进行了探索。依托行为学层面上呈现出的语言认知性别差异特点,神经认知语言学家借助功能性核磁共振等技术对男女的语言相关大脑皮层区及语言优势半球进行了确认。一些研究者认为男女在语言认知的神经机制方面存在差异(Shaywitz et al., 1995; Pugh et al., 1996; Baxter et al., 2003; Chen et al., 2007),另一些研究者认为男女在语言认知的神经机制方面不存在显著性差异(Frost et al., 1999; Plante et al., 2006)。随后,部分研究者借助荟萃分析对使用功能性磁共振成像技术研究男女语言认知神经机制差异的文献进行了量化统计,结果显示男女在语言认知的神经机制上差异不显著(Sommer, 2008;施珊珊、倪传斌,2009;施珊珊,2012)。
近年来,语料库及计算语言学的兴起,为语言学研究和发展注入了新的活力,也为语言性别差异研究提供了一条崭新的途径。Herring & Paolillo(2006)力图通过实证研究方法从大规模语料中获取话语差异及规律。通过选取相同数量男性和女性作者的日志型微博语篇及信息型微博语篇作为研究对象来探究语言、性别及语篇体裁之间的关系。研究发现日志型微博语篇更能体现女性语体特点,而信息型微博语篇则更能突显男性语体特点。Bamman, Eisenstein & Schnoebelen(2014)建立了一个包含14 000名推特用户的网络话语语料库,分析了性别及语言风格之间的关系,为探究性别因素在个人选择话题、遵守会话规则过程中的作用提供了新的视角。Park & Yaden(2016)利用大型社交媒体数据库中的开放性词汇,探讨了由性别、社会隶属关系等因素引起的语言差异。许家金、李潇辰(2014)利用一亿词次的 BNC语料库,分析了子女、夫妻、父母及祖父母4组家庭角色在话语中的典型搭配,发现英国家庭角色存在明显的语言性别差异。
虽然目前基于语料库及计算语言学的性别差异研究取得了较大进展,但其主要手段是建立具体词汇特征与某些语言特征之间的联系,很少涉及语言所暗含的深层次意义。系统功能语言学理论认为语言是一个多功能语义系统,语言的形式在于构建意义,语法和语义相互体现(Halliday, 1978)。Halliday将语言功能分为概念功能、人际功能及语篇功能,三者是语篇建构的基础,合理利用这三大元功能可为话语分析提供一个极具解释力的基于语言形式的理论方法(刘立华、刘世生,2006;黄国文,2002;杨雪燕,2012)。由于人际功能具有表达交际双方身份、地位、动机、态度等方面的独特功能,因此,本文拟从人际功能视角出发,建立一个适用于语言性别差异研究的人际功能特征分析框架,并借助于计算机科学领域中的机器学习方法——支持向量机,对所选取语料进行定量及定性分析,探究男女人物的话语风格差异,从而揭示人际功能特征与语言性别特征之间的联系,为语言性别差异的研究提供一个系统功能语言学视角下的新途径。
人际功能主要反映人与人之间的关系,如或是对话轮的选择做出规定,或是对事物的可能性和出现的频率表示自己的判断和估测,或是反映说话人与听话人之间的社会地位和亲疏关系(胡壮麟,1990)。人际功能主要通过语气系统和情态系统得以体现:语气系统体现对话中言语功能的选择,不同语气的选择能够反映说话者的性格特点、情感、态度,使语篇凝聚作/言者的所思所想;情态系统反映说话者的意识形态、社会地位、价值评判,体现交际双方的社会距离、权势关系。
语气特指说话人在交际中对所谈事物所持有的态度,表示说话人陈述事实、发起提问或施发命令。根据系统功能语法,主语和限定成分的不同排列方式决定了不同的小句语气类型,其包括:陈述语气、疑问语气、祈使语气和感叹语气(见图1)。陈述语气体现陈述,用于言者陈述观点、事实和提供信息;疑问语气体现提问,用于言者提出问题以寻求信息,常用的形式有:一般疑问和特殊疑问;祈使语气体现命令,用于言者发出要求、请求,表示禁止、许可或任何其他类的劝告等;感叹语气体现情感,也可用于言者提供信息和陈述事实,表达强烈的语气和感情。
图1.语气系统中的小句语气类型(Halliday & Matthiessen, 2004:78)
图2.情态系统的分类(adapted from Halliday, 1985, 1994/2000, 2004)
限定成分虽然在形式上有肯定和否定两种可能性,但是在语义上具有位于肯定和否定之间的中间状态,这些中间状态由情态系统表达。Halliday(1985,1994/2000)将情态系统主要分为:类型、量值和取向(见图2)。类型包括情态化和意态化两个子系统:情态化主要指说话人对命题的判断,包括可能性和经常性;意态化主要指说话人对提议的态度,包括义务和意愿(Halliday,1994:89)。此外,类型中还应加入能力/潜力性情态,用于表示小句中主体具有的某项能力(Halliday, 2004:621)。量值是指情态值的高低,Halliday(1994:362)将情态动词按照高、中等、低三个值进行了分类。取向有主观和客观之分,同时又有显性和隐性之分,实现形式可分为语气附加语和评论附加语两类。
本研究以系统功能语言学中的人际功能为理论依据,从语气系统和情态系统角度对所选取语料进行定量、定性分析,探究男女人物的话语风格差异。
通过研究和分析,我们拟回答以下两个问题:1)不同性别人物使用的语言存在哪些显著的人际功能特征差异?2)从社会文化语境出发,如何合理解释这些人际功能特征差异?
本研究所使用的语料是《水浒传》中四位广为熟知的人物角色话语,即吴用、武松、潘金莲和王婆。按章节顺序采集四位主要人物的个人话语,每人抽取五十条,即总共两百条语料构成一个小型语料库,并人工提取与2.1小节和2.2小节对应的语气系统特征和情态系统特征。
根据系统功能语言学的相关论述,笔者选取图1和图2中所有的特征量,对语料库中三百条话语在EXCEL中进行手动标记,并统计出各小句符合每一项参照标准的总次数。数据统计完成之后,借助于机器学习方法——支持向量机,对数据进行统计分析。支持向量机属于监督式分类器,不同于经典的统计方法,其避开了从归纳到演绎的传统过程,利用训练样本(现有语料)寻求结构化风险最小来优化分类器性能,实现经验风险和置信范围的最小化,即使在统计样本量较少的情况下,也能获取较好的统计规律及其分类特征。支持向量机是机器学习研究的一个热点方向,在许多领域中有着广泛的应用。本研究引入支持向量机的主要目的是在区别男女人物话语时,从所有特征量中提取出决定男女话语风格差异的关键特征量。整个数据处理过程包括以下几个步骤:特征筛选和归一化;支持向量机的训练;男女间话语对比试验;人物间话语对比及交叉验证。
3.3.1 特征筛选和归一化
在对语料库中的语料进行统计后,发现一些特征量出现次数过少(例如:经常性和义务),而另一些特征量在每组数据中均频繁出现(例如:陈述语气)。较少出现的特征量和大面积频繁出现的特征量在支持向量机训练过程中很可能会造成过拟合现象,这将带来较大的训练误差。为了避免过拟合现象,常规做法是直接排除较少出现的特征量和大面积频繁出现的特征。因此,在任意两组数据输入支持向量机之前,我们将特征量经常性、义务和陈述语气去除,其所对应的权值设为0。
此外,不同特征量在数值上不可避免地存在数量级上的差别,为了减少数量级差别带来的影响,同时加快支持向量机训练的收敛速度,我们将采用下述方法对数据进行归一化处理:对每一个特征向量,先将其均值归一化为0,随后再将其方差归一化为1。
3.3.2 支持向量机的训练
本文采用的编程软件为Matlab 8.3.0.532,通过调用CVX 2.1工具包(1)Michael Grant and Stephen Boyd.CVX:Matlab software for disciplined convex programming, version 2.1.http://cvxr.com/cvx, March, 2014.,直接求解训练支持向量机的对偶优化问题:
表1.求解训练支持向量机对偶优化问题的Matlab程序
其中w的第i个元素wi表示与第i个特征的权值。由于原始数据都为非负值,并且我们在使用支持向量机时默认男性类别标识为正1,而女性类别标识为负1,因此,支持向量机训练获得的特征权值的正负极性与男女是否显著使用该特征关系密切相关,即:wi若为正值,其值越大,表明男性越显著地使用第i个特征;wi若为负值,其值越小,表明女性越显著地使用第i个特征。
3.3.3 男女间话语对比试验
为了能在总体上分析语言的性别差异,笔者首先做了男女间话语对比试验。将所有数据分为男女两类,第一类数据包括武松和吴用;第二类数据包括潘金莲和王婆。男女的特征使用情况分布如表2所示,其中各数值表示所使用的总次数,最后一行表示各类数据的总单词数。将上述数据代入到支持向量机进行训练,获得的分类误差如表4所示,其对应的各个特征权值如表6中的第一列“男性/女性”所示。
表2.男女间特征使用次数统计
3.3.4 人物间话语对比及交叉验证
为了验证男女间话语对比试验的正确性和有效性,笔者进一步做了人物间话语对比和交叉验证。将各个人物进行两两组合,共可获得六组不同的组合,即:武松/吴用、武松/潘金莲、武松/王婆、吴用/潘金莲、吴用/王婆、潘金莲/王婆。各人物的特征使用情况分布如表3所示,其中各数值的含义与表2一致。将这六组数据代入到支持向量机进行训练,获得的分类误差如表5所示,男女人物组对应的各个特征权值如表6中的第2—4列所示。
表3.人物间特征使用次数统计
表4.支持向量机训练后的男女分类误差
表5.支持向量机训练后的人物分类误差
表6.支持向量机训练后的各特征权值
通过上述男女间话语对比试验和人物间话语对比及交叉验证,我们获得了较多数据,下面我们将详细对其进行数值分析,提取出决定男女话语风格差异的关键特征量。
3.4.1 男女间话语对比的数据分析
从男女特征使用次数统计情况看(表2),男性较为显著使用的特征量有祈使语气和高量值类情态动词,其中祈使语气男性使用了83次,而女性只使用了12 次;高量值类情态动词男性使用了45次,而女性只使用了10次。女性较为显著地使用了感叹语气,共使用了64 次,而男性只使用了10次。此外,其它特征的使用次数在男女间的差异性不明显。
将该组数据代入到支持向量机进行训练后,表6中的第一列“男性/女性”的特征权值显示:男性较为显著地使用的特征量有祈使语气、高量值类情态动词、可能性情态、能力/潜力性情态及语气附加语;女性较为显著地使用的特征量有感叹语气、低量值类情态动词及疑问语气:一般疑问。上述结论中的祈使语气、高量值类情态动词及感叹语气与表2给出的结果相一致,同时提供了更多可以区分男女话语差异的特征:可能性情态、能力/潜力性情态、低量值类情态动词及疑问语气:一般疑问。表4 中的分类误差显示,根据支持向量机提取的特征量,可以将男女话语进行较好地区分,其准确率可高达89%。
3.4.2 人物间话语对比及交叉验证的数据分析
从人物特征使用次数统计情况看(表3),武松较为显著地使用的特征量是祈使语气;吴用较为显著地使用的特征量有祈使语气和高量值类情态动词;潘金莲和王婆共同显著地使用了感叹语气。该结论与表2 结论大体一致。
将这六组数据分别代入到支持向量机进行训练,交叉验证数据(表6)表明:在男女间话语对比实验中提取的特征在单个男女人物话语对比结果高度一致。以祈使语气为例,男女间对比实验中其值为1.6187;在男女人物话语对比的交叉实验中,“武松/潘金莲”对比值为2.6054,“武松/王婆”对比值为1.5098,“吴用/潘金莲”对比值为2.4437,“吴用/王婆”对比值为1.3262。
表5中的分类误差显示,根据支持向量机提取的特征量可以将男女话语进行较好地区分,其中“武松/潘金莲”的区分准确率为90.9%,“武松/王婆”的区分准确率为86.4%,“吴用/潘金莲”的区分准确率为94.3%,“吴用/王婆”的区分准确率为92.9%。男男或女女之间的区分度较差,如:“武松/吴用”的区分准确率为73.6%,“潘金莲/王婆”的区分准确率为64%。上述结果进一步验证了支持向量机提取的特征能较好地刻画男女话语风格的差异。
从上述研究数据可以发现,《水浒传》中男女人物间话语风格呈现出了明显的人际功能差异。结合当时社会文化语境,本节将具体诠释人际功能视域下两性语言运用的核心规律并追述差异形成的原因。
在语气系统语气选择方面,数据结果表明男性更倾向于选择使用祈使语气,而女性则更倾向于使用疑问语气和感叹语气,该结论与之前研究文献相一致。不同语气类型选择差异形成的原因可进一步分析如下。
祈使语气通常用于发号施令、发出威胁或劝诫、提出警告或提供建议。说话人通过祈使语气的使用,意欲向听话人提供或索取信息,让听话人实施祈使话语所述行为的指令性言语行为(Wilson & Sperber, 2012; Kissine, 2013; Jary & Kissine, 2014)。在《水浒传》描述的中国封建社会背景下,男性占据主导地位,掌握着绝对的话语权,因此在语言交流中,他们的主导地位意识较强,常常通过发布命令,实施指令性言语行为来突显自身作为强者的身份。此外,绝大多数“水浒”英雄们的价值观取值在低层次,处于稳定、执着的状态,而在高层次是连动荡和模糊也没有的缺失和空荡,这种价值观的性质属于严重的自我中心型(邵子华,2013),这类型的人更热衷于凌驾于他人之上,发号施令。
疑问语气通常用于表达请求、建议等,同时体现说话人的存疑及对听话人就询问信息作出回答的期望。在《水浒传》中,女性整体呈现出一种弱势状态,其往往通过提问来推动会话的进行,在和谐的氛围中顺利实现交际目的。此外,处于社会底层的女性常常具有一种急于寻求生存依靠的攀附心理,在言语交际中会将更多地回答机会赋予对方,充分提供给受话人表达自我的机会。
感叹语气通常用于表达情感,在传递信息同时,有效地体现说话人内心喜怒哀乐的强烈感情。由于两性心理特征存在明显差异,较之于男性,女性情感更加细腻、深厚,更容易动情,因此女性在言语表达中较常使用感叹语气,这一点在《水浒传》女性人物话语中表现的淋漓尽致。小说中的女性人物处于孤立无援的生活困境中,饱尝世态炎凉、人情冷暖之后也更容易对任何一丝丝情感慰藉表达自身的强烈渴望,反映在言语行为中,亦或是感激的赞扬,亦或是动情的共鸣。此外,从语用学角度分析,感叹语气与礼貌原则中的赞扬原则、谦虚准则、赞同准则和同情原则的使用在一定程度上存在语用关联。身处封建社会时期的女性地位卑微,更倾向于在交际中运用积极礼貌策略,如:将感叹语气用于赞扬及自谦以示尊重,或用于同情以表与对方情感的共鸣,从而拉近彼此间的距离。
在情态类型选择方面,数据结果表明男性对可能性情态、能力/潜力性情态及语气附加语的使用较为显著,而女性未呈现出显著倾向,该结果与之前文献结果相一致的同时对其进行了补充。不同情态类型选择差异形成的原因可进一步分析如下:
可能性情态相当于传统语法的认知情态,通常与说话人的知识信念有关,涉及其主观看法及判断,即说话人可以表明自己对信息在认知上采取的态度、立场、认可程度。在《水浒传》描述的封建社会中,男性不仅掌握经济权、政权,更拥有附会意义之权,及对事物的评判权,这使得男性更易于使用认知型情态。另外,由于男性和女性的社会化路径是不一样:女性的社会化是以关注他人为导向的,而男性的社会化是以关注公平公正为导向(Karniol et al., 2003),因此在这一过程中,男性更愿意表达自己的看法和立场,体现自身“替天行道”、“打抱不平”的侠客精神。
能力/潜力性情态相当于传统语法中的动力情态,通常用于明确表达说话人的愿望、能力、自信等,有感染听话人的语用效果。北宋末年,由于封建社会结构的需要,女性和男性在成长过程中形成了不同的性别角色倾向。具体来说,女性被鼓励更多的表达和关怀照顾他人,而男性则被鼓励更多的分析问题和动手操作(Lam et al., 2012),因此对于能力的关注,男性更胜于女性。此外,男性在社会分工中担当家庭生活资料的供应者,其个人能力关系着整个家庭的生计,“能力”这一要素必然成为男性关注的对象,也构成了男性角色的重要组成部分。
语气附加语作为一种人际附加语,可以有效表达说话人对命题的真实性、可靠性程度的判断,同时具有评价功能。《水浒传》中的男性英雄人物大多在心理上具有很强的主控性,语气附加语的使用可有效表达男性在交际过程中的意愿及其强硬的语气态度。这与社会新思潮影响下,“水浒”英雄们往往以居高临下的观察者身份自居,意欲表达对社会的不满及追求个性自由的愿望相契合。
最后,在情态量值选择方面,数据结果表明男性人物倾向于使用高量值类情态动词,而女性则更倾向于使用低量值类情态动词。该结果与之前研究文献相一致。情态量值能够体现言语交际过程中的权势关系,例如:权势大的一方在交谈中通过使用高量值类情态量值,语态上常表现出傲慢、自信、不容辩驳等;而弱势一方视听话人为伙伴关系,更倾向于使用低量值类情态量词,以示委婉间接。情态量值也可表明说话人对命题或提议有效性的承诺,表达说话人自身的话语态度。在《水浒传》描述的弱肉强食、以男权为中心的价值评价体系中,男性属于强势社会角色,而女性则被束缚于男权社会的罗网中,处于被奴役的无权状态(李新灿,2001),很难有机会坚定地表达自身的话语态度,只能选择委婉的说话方式。从语用视角来看,高量值类情态动词具有绝对态度的功能特征,容易产生命令口吻,对他人面子造成威胁,而低量值类情态动词的使用可给听话人留有余地,避免或减少交谈中不必要的冲突。小说中大多数具备“臣妾人格”的女性常常表现出依附顺从的人格特征,必然在言语选择中更加小心翼翼,更加礼貌,这与男性和女性的社会地位及男尊女卑的社会趋势紧密契合。
本研究针对语言性别差异这一特殊语言现象,基于系统功能语言学的话语分析方法,建立了一个适用于语言性别差异分析的人际功能特征框架。借助于机器学习方法——支持向量机,对《水浒传》中选取语料进行了定量及定性分析,探究了男女人物的话语风格差异,揭示人际功能特征与语言性别特征之间的联系,提出了一种新的系统功能语言学视角下语言性别差异分析手段。研究结果表明:语言性别差异存在一些显著的人际功能特征,从语气系统角度选择来看,男性人物更倾向于选择使用祈使语气,而女性人物则更倾向于选择使用疑问语气和感叹语气;情态系统选择方面,男性人物倾向于使用高量值类情态动词、可能性情态、能力/潜力性情态及语气附加语,而女性则只更倾向于使用低量值类情态动词。这些显著特征与相关理论分析、小说社会文化语境及语言实际运用情况具有高度一致性,可以表明人际功能特征能为语言性别差异的研究提供了一种极为有效的理论方法。本项研究的意义还在于,在系统功能语法的框架之内,基于文学作品中人物语言特征的描述,对人物性格特征进行解读,能够更好地帮助理解人物形象所展示的时代画卷和社会生活。