名词MALE/FEMALE搭配模式分析
——基于Sketch Engine中BNC语料库

2016-12-22 08:04孙明珠韩江洪
重庆第二师范学院学报 2016年6期
关键词:形容词主语语料库

孙明珠,韩江洪

(合肥工业大学 外国语学院,合肥 230009)



名词MALE/FEMALE搭配模式分析
——基于Sketch Engine中BNC语料库

孙明珠,韩江洪

(合肥工业大学 外国语学院,合肥 230009)

本文基于语料库研究的方法,运用在线语料库检索工具Sketch Engine,根据英语国家语料库(BNC)中大量的事实语料,对MALE和FEMALE两个名词的词汇语法搭配行为和模式进行比较研究,从而为性别语言差异的研究提供更加有力的数据支持,使研究结果更加具有可信度和说服力。

Sketch Engine;英语国家语料库;男性和女性;搭配行为

一、引言

尽管人们很早以前就认识到了语言性别差异的存在,但对其的研究起步还是较晚。在20世纪,丹麦语言学家Jesperson首先从语言学的角度研究了语言的性别差异。1922年,他在《语言:本质、发展及起源》(Language:ItsNature,DevelopmentandOrigin)一书中详细描述了女性的语言特点。20世纪初,关于语言性别差异的研究非常零散,且杂乱无章,大多是个人的研究和非正式的讨论。在70年代,一些著名的语言学家,如Lakoff、Labov、Trudgil、Zimmerman&West、Thorne、Henley等,进一步发展了对语言性别差异的研究。他们不仅研究语言上的性别歧视和性别差异,而且还从社会语言学的角度探讨了导致语言性别差异存在的社会根源。从那以后,出现了大量相关的专著和论文。现如今,语料库分析技术在研究语言性别差异方面非常受欢迎,研究者(如Stubbs、Baker、Baker and Mc Enery、Piper、Johnson and Ensslin等)基于语料库使用电子语料来获得一些社会和文化信息。

在西方国家,已经有许多学者基于语料库对有关性别的词形进行研究,特别是有关性别的不对称和性别歧视方面。Kjellmer基于布朗语料库(Brown Corpus)、兰开斯特—奥斯陆/卑尔根语料库(LOB Corpus)研究了阴性代词和阳性代词,以及“man/men、woman/women”在这两个语料库中的分布和出现频率。他发现,总的来说,在两个语料库中,阳性的词形比阴性的词形要多,同时他指出,与英国LOB语料库相比,北美布朗语料库拥有更多的阳性词形。后来一些学者的频率研究也同样表明了类似的倾向性,但有趣的是,它有历时的变化。Caldas-Coulthard和Moon研究了在英国报纸文章的语料库中“man”和“women”的形容词搭配。研究发现,只有“woman”与指外貌的形容词(如“美丽的、漂亮的、可爱的”)搭配显著,而“man”则与表明重要性的形容词(如“关键的、大的、主要的”)搭配十分显著。这样的搭配模式可以体现词汇所要表达的内涵及联想意义。 语料库在语言和性别方面的研究并不仅仅局限于计算词汇项。研究者关注的中心是词的搭配,即某些词经常靠近出现的现象。 Romaine论述了如何用搭配行为来证明在语言中存在着性别歧视。她运用语料库研究了“man/woman,boy/girl”的搭配行为,发现相对于“man/boy”,带有消极寓意的词往往更倾向于与“woman/girl”搭配(见表1)[1]。

受西方研究的影响,我国从20世纪80年代末开始关注性别语言研究。在汉语界,有关专著如叶斐声、徐通锵的《语言学纲要》,陈原的《社会语言学》和《语言与社会生活》,陈松岑的《社会语言学导论》,刘宁生的《语言学概论》等都不同程度地涉及性别语言问题。[2]145

表1 基于BNC子语料库(词汇容量为300万)的man/woman的搭配情况

本文的研究是在前述关于搭配和性别的早期研究的基础之上,通过比较名词MALE和FEMALE在不同的语法关系下的搭配,分析它们各自的搭配模式,以一种新的视角来看待男女在社会、经济和政治方面的不平等。MALE和FEMALE既可以作形容词也可以作名词,本文研究的是作名词的情况,且专指男性和女性,对于动植物的雄雌不作分析。

二、研究工具和研究方法

(一)关于Sketch Engine和 BNC(British National Corpus)

Sketch Engine是语料库语言学专家 Adam Kilgarriff、Pavel Smrz 和 David Tugwell设计的“一种词典编撰辅助系统,是一个结合了庞大语料库、有效总结词汇的语法知识产生系统”[3]。Sketch Engine 是众多语料库检索工具中的一种,是由Lexical Computing公司推出的语料库查询系统。目前,该系统预装了汉、英、日、意、德等语种的多个语料库,总容量达数亿词,用户可以通过互联网访问语料库查询系统(CQS),进入Sketch Engine系统,从而访问大量的语料,包括BNC(British National Corpus,英国国家语料库)[4]。BNC是可以用于在线Sketch Engine检索的语料库之一,其总词容约1亿,收集的语料种类多样,基本代表了当代英语词汇,BNC收集的语料主要来自英国1970—1993年的英语出版物,其中包括90%的书面语文本(包括地区性和全国性报纸、专业期刊、学术书籍、流行小说、发表或未发表的信件和备忘录以及学校和大学论文中摘录的文本)和10%的口语文本(包括由来自不同年龄、地区和社会各阶层的志愿者记录下的不用底稿的非正式谈话,以及在不同的环境下所收集的口语,如正式的商业或政府会议、电台节目、听众来电直播节目)[5]。研究表明,被检索语料库需要足够的容量,“一般需要五千万词的语料库才能提取足够的有分析价值的词语搭配信息”[6],因此,本文用BNC来分析“male”和“female”的搭配模式,能满足权威性、代表性以及词容等多方面的要求。

(二)Sketch Engine的使用实例

Sketch Engine主要有三大功能:语料库检索(Concordance)、语料库管理(Corpus)和速描(Sketches)。运用Sketch Engine 语料库查询系统中的BNC语料库来分析“male”和“female”的搭配模式,就必然涉及Sketch Engine的操作。操作时,在进入Sketch Engine的主界面后,选择目标语料库BNC(British National Corpus),然后页面左侧会出现索引(Concordance)、词语速描(Word Sketch)、类义词功能(Thesaurus)和速描词语差异(Sketch-Diff)等功能选项。本文主要用到的是词语速描(Word Sketch)和速描词语差异(Sketch-Diff)这两个功能选项。

1.词语速描(Word Sketch)

在生成词语速描之前,用户需要对几种参数进行界定,这些参数包括输入基本词形(Lemma)、选择词性(Part of speech)等。在输入基本词形的文字输入框输入“MALE”,选择词性(Part of speech)框内选择词性“noun”后,点击“Show Word Sketch”可以得到MALE的搭配结果,共包括24类语法关系,其中又包含若干搭配词,按照搭配的显著性大小排列。这样,基于BNC语料库对MALE进行词语速描(Word Sketch),就可以全面地建立MALE这个词的搭配行为模式。表2显示了MALE在三类语法关系中各排名前十的搭配词。G1是MALE做主语时与动词的搭配情况(如:The male guards the nest),G2是MALE做宾语时与动词的搭配情况(如:They drive the male),G3是MALE与修饰它的定语形容词之间的搭配情况(如:He is a young male)。在BNC语料库中,名词词形MALE以动词主语的形式出现669次,以动词宾语的形式出现535次,以形容词中心语的形式出现1493次。词语速描(Word Sketch)计算出了名词MALE相对BNC语料库中的其他所有名词而言,在这些语法关系中出现的可能性。MALE在作动词主语方面,比BNC语料库中的其他名词高出3.2倍的可能性;在作动词宾语方面,比其他名词高出1.4倍的可能性;在作形容词中心语方面,比其他名词高出1.3倍的可能性。词语速描还显示了名词MALE在各类语法关系中与其他词语的搭配强度。从表2可以看出,当名词MALE作主语的时候,与它最显著的搭配词是“fertilize”(8.35);当名词MALE作宾语的时候,与它最显著的搭配词是“mate”(7.22);当名词MALE作形容词中心语的时候,与它最显著的搭配词是“adult”(8.84)。这些数值又叫显著值,测量的是两个词的搭配强度。

表2 名词MALE作为主语、宾语和形容词中心语的有语法关联的部分搭配词

2.速描词语差异(Sketch-Diff)

通过使用速描词语差异(Sketch-Diff)功能选项,Sketch Engine可以对两个目标词形进行比较。它显示了目标词形共同的搭配结构和搭配词(common patterns),以及它们各自的典型搭配结构甚至是特有搭配结构和搭配词(only patterns)。通过观察这些搭配结构,就可以很好地判断它们在用法上的区别。例如,从Sketch-Diff 的搜索结果来看,MALE和FEMALE都可以与“carry、mate、show、produce”等词搭配作主语,但MALE与“carry、mate”搭配的显著值要高于FEMALE,FEMALE与“produce”搭配的显著值要高于MALE,两者与“show”的搭配显著值相同。这说明“carry、mate”与MALE搭配的倾向更明显,“produce”与FEMALE搭配的倾向更明显。通过观察 MALE和FEMALE各自特有的搭配结构和搭配词(only patterns),可以清晰地看出它们各方面的差异。例如,从Sketch-Diff 的搜索结果来看,MALE作名词时特有的宾语搭配词有“select、identify、prevent”等,这些词与名词FEMALE搭配的显著值为0。而FEMALE作名词时特有的宾语搭配词有“attack、insult、entice”等,这些词与名词MALE搭配的显著值为0。在本文后面的章节中,将对MALE和FEMALE作名词时的具体搭配模式进行分析。

本文运用Sketch Engine系统将BNC作为一个整体进行了分析。尽管BNC语料库具有很强的权威性和说服力,但不可避免的是,不同的语料库可能会产生不同的结果。

三、名词MALE和FEMALE的搭配行为

在本文中,笔者主要探讨的是名词MALE和FEMALE在三种语法关系中的搭配行为,前面也已经提到了这三种语法关系,即名词 MALE和FEMALE作为主语、宾语和形容词中心语的有语法关联的搭配词以及搭配词出现的次数和频率。基于这些语法关系,本文提取了相关的数据,并从权力分配与社会行为角度、外向性与亲和性角度、外表与性角度来解读名词MALE和FEMALE 的搭配模式。

(一)权力分配与社会行为

在社会上,普遍存在着权力分配不平等的现象:某些社会参与者拥有并可以支配比其他人更多的权力,而男女之间的权力分配也是不对称的。一般来说,男性在生理上比女性要强壮(或者说至少人们所期待的是这样)。这种不对称可以通过数据来反映。通常,一些需要体力来执行的动词更多地或者仅仅与名词MALE进行搭配,是由名词MALE作主语的,如“guard、protect、hold、try、carry、take、assault”(表3),这样的模式符合人们对男女性别角色及行为的固定期待。男性的行为一般被认为是比较活跃、强烈、暴力而富有侵略性的。(当然,纵观历史,女性一直是辛勤劳作的,但女性的大部分劳作是家务活而且是没有报酬的,因此,女性的劳作常常不被男性认可)。

表3 名词MALE和FEMALE主语搭配的特有模式

人类发挥力量的另一种方式是参加暴力和异常活动。在BNC数据库中,男性比女性更具有犯罪和暴力倾向。当名词MALE作主语时,往往与表示暴力的动词搭配强烈,如动词“kill、insult、assault、abuse”等更倾向于作名词MALE的主语搭配,而名词MALE特有的主语搭配词有“compete、dominate、commit、hit”(表3)。前面提到MALE往往是暴力活动的施动者,而FEMALE则往往是暴力活动的受害者(有时是男性性侵的受害者),例如当名词FEMALE做宾语时,其特有的动词搭配有“assault、attack、abuse、trap、entice、insult、chase、grasp、shoot、kill、hold、grasp”(表4)。

表4 名词MALE和FEMAL宾语搭配的特有模式

人类跨入阶级社会以来,妇女一直处于附属地位,男性拥有更多可支配的权力。男性可以仰仗自己的所作所为谋求功名利禄,而女性却肩负着养育儿女的职责,需要依靠她们的容貌博得男人的欢心。这在BNC数据库中也可以反映出来。当名词MALE作主语时,与之搭配的许多动词都有着支配权利的意味,如动词“compete、dominate、defend、protect、lead、perform、survive”只能作名词MALE特有的主语搭配词。而与名词MALE搭配的表示所有关系的名词也多是与财产、成功等有关的,如“territory、success、presence、role、power”等,而与FEMALE相关的名词则多是与家庭、生活有关的,如“harem、view、children”等。当名词MALE作形容词中心语的时候,与MALE搭配的形容词多是与权利、主导、成熟、成功、积极等有关的词,如“powerful、individual、rogue、red-blooded、capable、particular、different、dominant、large、mature、healthy、largest、successful、aggressive、rival”(表5)。而与名词FEMALE搭配的形容词多是与生育、道德、性格、消极等相关的词,如“married、ready、unfortunate、helpless、subordinate、receptive、hysterical、sedentary、pregnant、moralistic、fanciable”(表5)。

表5 名词MALE和FEMAL定语形容词搭配的特有模式

(二) 外向性和亲和性

男性和女性有着不同的性格和心理特征,这在语料库中也可以得到反映。本节主要从 extraversion(外向性)和agreeableness(亲和性)角度来探讨MALE和FEMALE的性格差异和心理特征。

外向性通常与活动、交际、自信和健谈等方面有关。MALE似乎比FEMALE更易与那些跟活动、自信相关的词进行搭配。我们已经在MALE的典型或特有搭配模式中看到了这方面的证据,包括前面分析过的需要体力来执行的动词(如“guard、protect、hold、try、carry、take、assault”)。此外,前面分析过的一些MALE的定语形容词搭配,不仅与权力相关,也与外向性相关(如“powerful、successful、capable、dominant”)。FEMALE很少有外向性的行为和特征,而且与其搭配的少数外向性词带有性含义。例如,“fanciable”只与FEMALE进行搭配。

亲和性通常与信赖、温和、善良和情感等方面有关。这些词通常是用来形容女性的,这说明女性比男性更具亲和力,这在BNC语料库中也可以得到证明。FEMALE 与表示随和、漂亮、道德、安静等形容词的搭配力远远大于MALE,如“attractive、moralistic、receptive、fanciable、sedentary、ready”(表6)。MALE的搭配模式显示出男性具有强烈的非亲和性特征,包括“lose、dominate、compete、rude、dominant、rival、aggressive”。在前文所讨论的一些与MALE搭配的有关暴力和侵略性的动词,也反映了MALE的非亲和性(如“assault,、attack、kill、abuse、commit”)。

表6 与名词MALE和FEMALE搭配的有关(+/-)extraversion 和(+/-)agreeableness的形容词

(三)外表与性

在BNC语料库中,收录的关于名词MALE和FEMALE的外表的语料很少,但从少量的语料中我们也可以看到符合人们期望的男女外表特征,例如,形容词“attractive”倾向于与FEMALE进行搭配,而形容词“blonde、fanciable、beautiful”只与FEMALE进行搭配,在描述男性魅力的时候,往往用“good-look-ing、devastating-looking”来与MALE进行搭配。MALE和FEMALE的性和性吸引力同样在BNC数据库中可以得到体现。男性通常在性行为上处于主导的地位,其特有主语搭配动词如“fertilise、fertilize、copulate、mate”。而FEMALE在性行为中还肩负着生育的职责,其主语搭配动词“breed、produce”。形容词搭配也可以反映男性和女性的性取向问题,如“homosexual”多与MALE进行搭配,而“heterosexual”多与FEMALE进行搭配。

四、结语

利用在线语料库检索工具Sketch Engine,通过检索BNC语料库,能够更加直观、客观地归纳出词语的常用搭配和习惯用法,这对于研究词语的搭配行为具有重要意义。迄今为止,在世界范围内,已经有很多学者在两性关系的研究领域做出了贡献,但基于语料库的研究分析在此领域却是有限的。笔者通过检索MALE和FEMALE,比较两者在不同的语法关系下不同的搭配模式,归纳出MALE(男性)和FEMALE(女性)的差异:第一,从权力分配与社会行为角度解读MALE和FEMALE的搭配模式。从权力分配来看,女性一直处于附属地位,男性拥有更多可支配的权力。男性可以仰仗他们的所作所为谋求功名利禄,而女性却肩负着养育儿女,操持家务的职责。从社会行为来看,MALE比FEMALE更倾向于与代表体力动作的词搭配,且MALE常通过暴力和异常行为来展现自己的权力和力量。而FEMALE则往往是暴力活动和消极行为的受害者(有时是男性性侵的受害者)。第二,从外向性与亲和性角度解读MALE和FEMALE的搭配模式。研究表明MALE比FEMALE更具有外向性,它更倾向于与活动、交际、自信和健谈等方面的词搭配。而FEMALE比MALE更富有亲和性,它更倾向于与信赖、温和、善良和情感等方面有关的词搭配。第三,从外表与性的角度解读MALE和FEMALE的搭配模式。FEMALE更倾向于与身材、肤色等表现外貌的词相联系。MALE 更多为性行为的施动者,FEMALE 为受动者,而且FEMALE在性行为中还肩负着生育的重要职责。此外,关于性取向的问题,MALE多与同性恋进行搭配,而FEMALE多与异性恋进行搭配。

本文是基于BNC语料库进行的研究,相较其他名词而言,名词MALE和FEMALE在BNC语料库中出现的频次并不高,所以本文的研究也是有一定局限性的。另外,不同于早期版本,现在Sketch Engine工具上也出现了其他语种的语料库,所以未来关于两性关系的研究也可以在其他语料库的基础上进行。

[1]Romaine, S. Language in Society: An Introduction to Sociolinguistics (2nd edition)[M]. Oxford: Oxford University Press, 2000.

[2]祝畹瑾.新编社会语言学概论[M].北京:北京大学出版社,2013.

[3]张鸰.Sketch Engine工具在词汇搭配和同义词辨析教学上的应用[J].外语电化教学,2008(2):75-78.

[4]Sketch Engine [DB/MT]. [2015-05-07]. http:∥www.sketchengine.co.uk/.

[5]British National Corpus [DB/MT]. [2015-05-07]. http:∥www.natcorp.ox.ac.uk/.

[6]杨节之.语料库搭配检索与英语同义词辨析[J].外语电化教学,2007(4):41-46.

[责任编辑 亦 筱]

2016-06-02

孙明珠(1992— ),女,湖北荆州人,硕士研究生,研究方向:语言学及应用语言学;韩江洪(1967— ),男,安徽霍邱人,博士,教授,硕士生导师,研究方向:翻译学。

H313

A

1008-6390(2016)06-0051-05

猜你喜欢
形容词主语语料库
认识形容词
主语从句用法“大揭秘”
《语料库翻译文体学》评介
消除隔阂,呈现新面孔
基于COCA语料库的近义词辨析 ——以choose和select为例
基于JAVAEE的维吾尔中介语语料库开发与实现
形容词
英语中的虚主语“it”和汉语中的虚主语“他”异同之比较