于 涛, 唐美华,2
(1.江苏师范大学 外国语学院,江苏 徐州 221116;2.北京外国语大学 中国外语与教育研究中心,北京 100089)
汉语小说中的词汇特征对比研究
于 涛1, 唐美华1,2
(1.江苏师范大学 外国语学院,江苏 徐州 221116;2.北京外国语大学 中国外语与教育研究中心,北京 100089)
语言的性别差异是社会语言学研究的热点。通过自建的女性与男性小说家作品语料库间的对比,可以揭示女性小说家词汇的使用特点。研究发现:在词汇丰富度和词汇密度方面,女性小说家均低于男性小说家,说明女性作品中传递的文本信息量少,阅读难度相应较低。通过主题词分析发现,在名词使用方面,女性小说家与男性小说家存在显著差异,女性偏爱使用与娱乐、学习等相关的名词,少用表人际关系及事业的名词和粗俗语;在人称代词和语气词使用方面,女性小说中的频数显著高于男性小说;在指示代词和形容词使用方面,女性小说中的频数显著低于男性小说。
汉语女性小说; 语料库; 词汇丰富度; 词汇密度; 主题词分析
语言的性别差异是社会语言学研究的热点话题。前人研究大多着眼于英语口语[1-3]和非正式语体[4-6],对正式语体中性别差异的研究较少,对英语之外语言中性别差异的探讨更为少见。当前,国内相关研究所引观点大都来自西方学者的研究成果,得出的结论未必适用于汉语。刘润清强调,我们引进、研究西方语言学的最终目的是要较好地研究中国本土的语言,我们的国土上有取之不尽、用之不竭的语言素材,我们要严肃认真地挖掘它们的特征,从而概括出具有普遍性的结论[7]。鉴于此,本文通过自建汉语女性和男性小说家作品语料库,对比分析词汇丰富度、词汇密度、主题词等,探究女性小说中词汇的使用特点。
(一)性别和语言关系的理论研究
“性别语言”(gender language)术语由Robin Fort于1665年首次提出[8],但真正从语言学视角对“性别语言”进行研究的首推丹麦语言学家O. Jespersen[9]。20世纪60年代,社会语言学的发展和女权运动的兴起大大推动了性别语言的系统研究。1975年,英国学者Robin Lakoff的LanguageandWoman’sPlace一书更是掀起了性别语言研究的高潮,书中不仅提出了“女性语言”的概念,而且指出在语言所反映的世界图景中男性居于中心地位,女性的形象则残缺不全[10]4,74-75。Lakoff的理论在西方引起了巨大的轰动和争议。作为社会语言学中的重要变量之一,性别语言得到了更为广泛的探究,出现了支配论、差异论和社会建构论等不同的理论阵营。Lakoff、Spender、Penelope等支配论者从社会权力的角度来看待性别和语言的关系,认为男性在语言中的支配地位和女性的被压迫地位导致了女性语言的某些特征,如模糊语和反意附加问句的频繁使用等[10]14-18[11-12];差异论者Tannen认为男女不同的语言策略和交际风格主要源于男女文化差异,女性更善于用语言来维系人际关系[13]10,18;社会建构论者Butler则认为性别这一变量与社会阶层、年龄、教育背景等其他变量密切相关,将性别看作是特定社会和文化环境中的社会建构[14]。
(二)性别和语言关系的实证研究
在西方,性别语言的实证研究主要针对英语,多集中于口语[1-3,15-17]和非正式语体[4-6,18],对正式语体中语言性别差异的研究较少。Argamon 等通过对英语国家语料库中566篇英语语篇(包括小说类和非小说类)的调查发现,女性语言呈现参与性(involved)特征,男性语言则呈现信息性(informational)特征[19]331。在国内,较早研究汉语语言中性别现象的是赵元任[20],他讨论了男女性别差异在语音、声调上可能造成的差异。出版性别语言研究专著的还有孙汝建[8]、白解红[21]、史耕山[22]、杨春[23]等。受西方理论的影响,国内对汉语性别差异进行实证研究的论文并不多见,多关注的是微博等网络语言[24-28]。
以上研究大多关注口语和非正式语体中的性别差异,对正式语体和汉语语言中的性别差异现象鲜有涉及。本研究运用基于语料库的方法,分析汉语女性和男性小说家作品中的词汇差异,主要针对词汇丰富度、词汇密度和主题词等方面进行实证描述,结合社会语言学相关理论进行定性分析,探讨女性小说中有别于男性的词汇特征。
(一)语料来源
本研究自建两个语料库:女性小说家作品语料库(FNC),由随机选取的20世纪汉语女性小说家作品组成;男性小说家作品语料库(MNC),由随机选取的同时期汉语男性小说家作品组成。为保证语料的代表性与均衡性,每位作家仅选取一部作品。经文本合并、语料清理后,FNC语料库为468 081词次,MNC语料库为1 561 073词次。
(二)研究问题
本研究尝试回答两个问题:一是在词汇丰富度和词汇密度方面,女性小说家作品与男性作品是否存在差异?若是,女性小说呈现怎样的特点?二是在主题词方面,女性小说家作品与男性作品是否存在差异?若是,这些差异具体体现在哪些方面,反映了女性小说怎样的特点?
(三)研究工具及步骤
本研究的目的在于考察女性小说家在词汇选择和使用上是否存在有别于男性作家的特征。为便于量化研究,本文主要涉及词汇丰富度、词汇密度和主题词的对比。首先,借助CorpusWordParser软件,对两个语料库中的文本进行切分和词性标注,为后续对比做准备。其次,利用语料库检索工具PowerGrep支持正则表达式的特点,将赋码语料中的相关词类准确高效地检索出来。再次,利用北京外国语大学语料库团队开发的BFSU PowerConc软件中的Keyness功能,对两个语料库中所有词的使用频率进行对比,析出所有主题词,以此考察女性小说语料库中的词汇特征。最后,通过BFSULL工具,检验两个语料库中相关语言现象是否存在显著性差异。
(一)词汇丰富度和词汇密度
计算结果显示,MNC的吉罗指数略高于FNC,说明男性小说家作品的词汇丰富度高于女性。BFSULL结果显示,FNC与MNC的词汇丰富度具有显著差异(LL=24.58,p<0.001),表明中文女性小说家作品的词语变化程度较低。这可能是因为女性小说家关注的焦点相对集中,导致某些领域内的词汇重复率较高,表达方式相对单一。
关于词汇密度(lexical density)的计算方法,本文采用Ure提出的计算公式:词汇密度=实词数量/词汇总量*100[33]。英语中的实词指具有稳定词汇意义的词语,包括名词、实义动词、形容词和副词四个词类,而对于汉语实词与虚词的分类标准,学界仍存在争议。鉴于本文主旨不是探讨汉语词类的划分,而是借助词汇密度来考察男性、女性文本在信息量和难度的差异,在具体统计中采取胡显耀的实词划分标准,将名词、实义动词、形容词和数量词归为实词[34]216。借助PowerGrep软件,提取所有实词,统计两个语料库的词汇密度。
词汇密度被公认为检测文本信息量大小的指标之一,文本中的实词越多、词汇密度越大,传递的信息量就越多,文本难度相应增加。统计结果表明,FNC的词汇密度低于MNC,即女性小说中的实词数量和频率较低,女性小说中所反映的信息量和文本难度相应低于男性作品。
(二)主题词分析
表1 女性小说家使用频率显著高于男性小说家的词
表2 男性小说家使用频率显著高于女性小说家的词
1.名词
一般认为,名词与文本的信息量成正比,名词使用越多,文本信息量越大。FNC语料库中名词使用频率显著低于MNC语料库(LL=1805.91,p<0.001),与前文得出的结论一致,即女性作品的文本信息要低于男性作品。对比表1和表2中的名词发现,女性小说与男性小说的差异主要体现在以下几个方面。
第一,在表达人际关系的名词上,女性小说家使用频率比男性要低(19<31)。这与Tannen和吕鸿礼曾指出的“女性比男性更关心人与人之间的交往,从而更多地使用表达人际关系的名词”[13]10[35]29相悖。进一步观察发现:家庭关系方面,女性主要关注家族中的近亲成员,如爸爸、妈妈、媳妇、孩子等;男性的关注面更广,涵盖了如大爷、大娘、表姐等家族中的外围成员。社会关系方面,男性较女性使用了更多表达阶层关系的词,如小姐、少爷、老太爷、姨太太、丫鬟等。另外,女性用词不如男性正式,更偏爱使用妈妈、妈、爸爸等词汇,而男性多用父亲、母亲等词汇。
第二,女性小说家更关注娱乐和学习,男性更关注事业。女性偏爱使用戏、歌、戏园子、舞台等与娱乐相关,以及大学、校园、教室、书桌、书橱、图书、俄语、外文等与学习相关的名词;男性则更多使用生意、事情、公司、钱等词汇。值得注意的是,前人研究指出“女性话语更关注日常生活,男性话语较多涉及政治时势”[13]18[35]29。但是本研究通过主题词分析发现,女性作品显著多用的名词中也存在少量描述政治时势的词汇,如毛主席、红卫兵、资产阶级、文化大革命、苏联等,这可能与部分作品描写的时代有关。
第三,“狗”一词被男性显著多用,且其搭配词多为粗俗语(profanity)。这和前人研究关于“女性比男性更礼貌,男性比女性更倾向于使用粗俗语”[9]245[10]10[36-37]的论断一致。索引行分析发现,与狗搭配的粗俗语在男性小说中频繁出现,且形式多样,有狗娘养的、狗日的、狗奴才、狗仗人势、狗咬吕洞宾、狗老板等;在女性作品中仅检索出80例与“狗”的搭配词,除了3例“嫁狗随狗”外,其余均表达狗的字面意思。Lakoff等前人研究曾指出,由于长期生活在男性世界中,女性所处的“无权地位”影响到她们的语言风格[10]7。这体现在粗俗语的使用上女性更具羞耻心,尽量避免使用粗俗语言,男性则表现得更为粗犷直白、毫不掩饰。
2.代词
前人研究曾指出女性在代词的使用上显著多于男性[19]326。本研究前200名正主题词中代词有7个,前200名负主题词中代词有6个,可见女性小说家并未在数量上占有显著优势。但是在具体代词的使用方面,女性和男性小说家之间确实存在差异,如表3所示:女性小说家更多使用人称代词(5个);男性小说家显著多用的6个代词中并无人称代词,指示代词却有5个。女性语言注重人与人之间的互动,男性语言更注重信息性[19]332。本研究可以为以上论断提供佐证,人称代词的频繁使用能够反映女性较男性更关注交际,而指示代词在男性小说中的显著多用恰好证明男性倾向于指明(specify)所说的事物,这或许也是男性文本信息量较大和正式程度较高的体现。
表3 女性小说家和男性小说家代词使用对比
3.形容词
前人研究指出,女性情感丰富细腻,形容词的使用较男性更多样、更丰富[10]11-12[38]9-10。但是本研究的发现与上述观点相悖。从正、负主题词表来看,女性和男性小说家频繁使用的形容词数目都为4;从整个形容词词类来看,FNC显著低于MNC(LL=167.46,p<0.001)。也就是说,汉语女性小说家在形容词的使用上显著低于男性,或许跟本研究聚焦的是小说这一特定语体有关。小说以刻画人物形象为中心,强调通过完整的故事情节和环境描写来反映社会生活,无论是男性还是女性作家,势必会运用大量的形容词来描写修饰的人或事物,表述其性质、状态或特征。
4.语气词
多愁善感、感情外露一向被认为是女人的天性,男性则被认为是谨言慎行,不轻易表露内心。不少研究已表明女性在言语交际中较男性更常借助语气词来抒发情感。祁淑玲、张金良认为女性选用语气词的数量多于男性,表现的情感也比男性丰富[39]。肖艳红通过对电视节目主持人语言性别差异的分析指出,较之男主持人,女主持人更容易表现出喜怒哀乐的情绪,更喜欢使用语气助词[38]10。我们的研究证实了上述论断。由表1和表2可见,女性小说家更善于借助语气词表现她们的内心世界,不仅在类符数的使用上高于男性(10>3),而且在上述语气词使用的型符数上高于男性。女性小说家喜欢使用吗、呀、吧、呢、啦、嗯、哦等词语,话语显得委婉、舒缓,既增加了言语的亲切感和感染力,又更容易和对方维持友好关系。比如在倾听别人讲话时,女性常常会使用一些语气词表示自己在认真倾听,或做出应答以鼓励对方继续;男性小说家常用的语气词仅限于么、哩、罢等,这些词伴随着男性短促的语音节奏,表现出说话利落、直白甚至强硬的特点。
本研究基于自建汉语女性与男性小说家作品语料库,通过对两个语料库在词汇丰富度、词汇密度和主题词方面的考察发现:女性小说在词汇丰富度和词汇密度上均低于男性小说;女性话题较多涉及娱乐和学习,但她们对政治时势也有关注;人称代词和语气词被女性小说家显著多用,而粗俗语、指示代词和形容词的使用频率则显著低于男性小说家。
尽管词汇系统是言语性别差异表现最为集中的方面之一,但性别差异可以体现在语言的方方面面。在今后的研究中,我们可以考虑从句法和语义等维度探究汉语女性小说有别于男性小说的其他特征。如果能够结合历时语料库考察女性语言的变异发展,将更进一步深化对汉语语言中性别差异现象的研究。
[1] HOLMES J.Hedges and boosters in women’s and men’s speech[J].Language & communication,1990,10(3):185-205.
[2] LABOV W.The intersection of sex and social class in the course of linguistic change[J].Language variation and change,1990,2(2):205-254.
[3] ECKERT P.Gender and sociolinguistic variation[M]//COATES J.Readings in language and gender.Blackwell:Oxford,1997:64-75.
[4] MULAC A,STUDLEY L,BLAU S.The gender-linked language effect in primary and secondary students’ impromptu essays[J].Sex roles,1990,23(9/10):439-470.
[5] MULAC A,LUNDELL T.Effects of gender-linked language differences in adults’ written discourse:multivariate tests of language effects[J].Language & communication,1994,14(3):299-309.
[6] HERRING S C.Two variants of an electronic message schema[M]//HERRING S C.Computer-mediated communication:linguistic,social and cross-cultural perspectives.Amsterdam:John Benjamins,1996:81-106.
[7] 刘润清.西方语言学流派[M].北京:北京外语教育与研究出版社,2013:479.
[8] 孙汝建.语言与性别[M].南京:江苏教育出版社,1997:187.
[9] JESPERSEN O.Language:its nature,development and origin[M].New York:Macmillan, 1922.
[10] LAKOFF R.Language and woman’s place:text and commentaries[M].Oxford:Oxford University Press,1975.
[11] SPENDER D.Man-made language[M].London:Routledge,1980.
[12] PENELOPE J.Speaking freely:unlearning the lies of the father’s tongue[M].New York:Pergamon Press,1990.
[13] TANNEN D.You just don’t understand:women and men in conversation[M].New York: Ballantine Books,1990.[14] BUTLER J.Gender trouble:feminism and the subversion of identity[M].New York: Routledge,1990.
[15] RAYSON P,LEECH G,HODGES M.Social differentiation in the use of English vocabulary:some analyses of the conversational component of the British national corpus[J].International journal of corpus linguistics,1997,2(1):133-152.
[16] CAMERON D,KULICK D.Language and sexuality[M].Cambridge:Cambridge University Press,2003.[17] BAKER P.Using corpora to analyze gender[M].London: Bloomsbury Publishing Plc, 2014.
[18] OLSSON L.A study of gender-related differences in introductory letters[EB/OL].(2000-02-14) [2016-10-25]. http://epubl.ltu.se/1402-1773/2000/62/LTU-CUPP-0062-SE.pdf.
[19] ARGAMON S,KOPPEL M,FINE J,et al.Gender,genre,and writing style in formal written texts[J].Text,2003(3):321-345.
[20] 赵元任.现代吴语的研究[M].北京:北京商务印书馆,2011.
[21] 白解红.性别语言文化与语用研究[M].长沙:湖南教育出版社,2000.
[22] 史耕山.汉语称赞语中的性别研究[M].北京:北京科学出版社,2008.
[23] 杨春.性别语言研究[M].北京:光明日报出版社,2010.
[24] 周炎.网络博客中的语言性别特征分析[D].杭州:浙江大学,2007.
[25] 毕翠翠.网络博客语言的性别差异[D].济南:山东师范大学,2009.
[26] 乙晓燕.中美网络博客中的语言性别差异对比研究[D].济南:山东师范大学,2011.
[27] 李璐璟.网络语言交流中性别差异的语用学研究[D].武汉:武汉理工大学,2012.
[28] 江锦强.微博语言性别差异研究:以大学生微博为例[D].福州:福建师范大学,2013.
[29] 梁茂成.什么是语料库语言学[M].上海:上海外语教育出版社,2016.
[30] DALLER H,VAN H R,TREFFERS-DALLER J.Lexical richness in the spontaneous speech of bilinguals[J].Applied linguistics,2003,24(2):197-222.
[31] YU G.Lexical diversity in writing and speaking task performances[J].Applied linguistics,2009,31(2):236-259.
[32] 施建刚,邵斌.基于语料库的汉语译文翻译共性研究:以《苏东坡传》汉译本为例[J]. 外国语言文学,2016,33(2):97-104.
[33] URE J.Lexical density and register differentiation[C]//PERREN G E,TRIMM J M. Applications of linguistics:selected papers of the 2nd international congress of applied linguists.London:Cambridge University Press,1971:443-452.
[34] 胡显耀.基于语料库的汉语翻译小说词语特征研究[J].外语教学与研究,2007,39(3): 214-220.
[35] 吕鸿礼.俄语中的性别语言变体及其成因探微[J].解放军外国语学院学报,2004, 27(5):26-29.
[36] HERRING S C.Gender differences in CMC:findings and implications[J/OL].Computer professionals for social responsibility journal,2000,18(1):179-210[2017-01-20]. http://cpsr.org/issues/womenintech/herring/.
[37] ECKERT P,MCCONNELL-GINET S.Language and gender[M].Cambridge:Cambridge University Press,2013.
[38] 肖艳红.电视节目主持人的语言性别差异研究[D].长沙:湖南大学,2013.
[39] 祁淑玲,张金良.感叹词语的性别差异研究[J].现代语文(语言研究版),2009(12):64-66.
(责任编辑:李晓梅)
Contrastive Study of Lexical Features in Chinese Novels
YU Tao1, TANG Meihua1,2
(1.School of Foreign Studies, Jiangsu Normal University, Xuzhou, Jiangsu 221116, China;2.National Research Center for Foreign Language Education, Beijing Foreign Studies University, Beijing 100089, China)
The lexical differences caused by the gender factor are described through empirical studies based on comparing the self-built corpus of Chinese novels of female writers with that of Chinese novels of male writers, with the purpose to discover the unique lexical features of female writers. The results show that the lexical richness and lexical density in female novels are lower than those in male novels. Thus, female novels are less informational and difficult than male novels. The result of keyword analyses shows that: nouns pertaining to entertainment and study, personal pronouns and auxiliary words of tone are more frequently used in female novels; nouns indicating interpersonal relations, business and profanity, deictic pronouns and adjectives are less frequently used by female.
Chinese novels of female writers; corpus; lexical richness; lexical density; keyword analysis
2017-04-20
于涛(1975—),男,江苏赣榆人,江苏师范大学外国语学院副教授,博士,研究方向:语料库语言学、应用语言学;唐美华(1981—),女,江苏东台人,北京外国语大学中国外语与教育研究中心博士研究生,江苏师范大学外国语学院讲师,研究方向:语料库语言学、应用语言学。
H146
A
1674-0297(2017)04-0117-06
分析是语料库间对比最常见的方法之一,可以有效地发现语料库的语言特征[29]84。借助主题词中的实词,可以推断观察语料库的主题和所言之事。主题词有正、负主题词之分。如果某词在观察语料库中的频率显著高于其在参照语料库中的频率,该词为正主题词;反之则为负主题词。本研究借助BFSU PowerConc软件,分别得出两个语料库的词表,通过Keyness功能对两个词表中的所有词穷尽比较,将主题性值达到显著水平的词全部抽取出来,生成主题词列表(Keyword list)。根据对数似然率排序,选出前200名正主题词和后200名负主题词。鉴于小说语体的特殊性,去除这400个主题词中的人名,将删选后的词汇按照它们所言之事分类。限于篇幅,本文主要讨论两个语料库中存在较大差异的词类(见表1和表2)。