孙佳莹
(江苏科技大学 外国语学院,江苏 镇江 212003)
自20世纪80年代以来,随着计算机的广泛应用,语料库语言学得到了蓬勃发展。作为一种强有力的文本分析工具,语料库不仅被广泛应用于语言学领域,近年来在文学作品的研究中也开始发挥独特作用。在文学作品研究中,我们可以对某个作家的一部或多部作品进行分析和对比研究,这种分析对研究作家某种语体风格的形成或主题的表达提供了可靠的量化依据[1]。
作为美国第一位获得诺贝尔文学奖的女作家,赛珍珠本人及其作品得到国内外的广泛关注。《大地》是其获得诺贝尔奖的代表作品之一,具有很高的研究价值。该作品跨越了东西文化间的鸿沟,改变了西方读者眼中中国那种“历史悠久而又软弱落后的神秘国度”印象。纵观国内文献,对该作品的研究大多是主题研究,尚未出现对该作品的语料库检索分析。本研究拟运用语料库检索工具Antconc 3.2.4w和词汇检索软件Range,结合检索结果数据,对赛珍珠的代表作《大地》的语言特征、主题、故事情节和人物刻画等方面的文体特征进行详细分析。
基于语料库的语言研究一般采取定性与定量相结合的研究方法,而要进行定量研究就要涉及文本的检索和数据的统计[2]。 用词汇分析软件Range统计The Good Earth的文本①,它提供了一些简略统计结果,如字节数(bytes)、形符数(tokens)、类符数(types)。 如表1所示:
表1 《大地》用Range软件检索的结果
整个文本的总字符数为114949,可见此作品篇幅较长,属长篇小说。一级词汇共有98489个,占了全文的85.68%;二级词汇共有8395个,占全文的7.30%;三级词汇共358个,占全文本的0.31%。文本的种类符数为5800个,占文本总字数的5.3%,表明小说的词形变化幅度不大。综上所述,这篇作品虽然篇幅较长,但是词汇难度不大,简单易懂的词汇较多,词形变化较少,给读者降低了阅读难度,总体来说易于理解,这符合赛珍珠作品平实易懂的语言特色。
词频表(word list)是一个语料库中所有词及其出现频数的列表,它可以按词语出现的频数排列,也可以按字母顺序排列。关键词表(Keyword list)是指某篇或某一批语篇中与其他参照语料库相比明显高频的词汇列表。它可以用来揭示语篇的内容大意、文体风格,也可以揭示主话题的情节发展。[3]
首先,通过使用语料库检索工具Antconc 3.2.4w中的word list(词频表),对小说的文本进行统计,取部分结果如图1所示:
图1 《大地》用word list检索出的结果
由图1可见,排在第一位的是and,第二位是定冠词the,这类词都属于虚词,无实际意义。排第三位的词是he,以及稍后出现的her,she,him都属于代词的范畴,可以推断都是指代文中的主人公。排在第15和16位的是一个名字Wang Lung,将该词置于文本中查看,发现这两个词基本都连着出现,且后面的代词都是he,由此推断Wang Lung是小说主角,为男性。从检索结果看,she和her排位靠前,分别为第13位和第18位,由此可以确定女主角的存在。此外,排在表中第44位的词son,暗示了文中出现父子关系。根据以上信息,可以大致推断小说是围绕主人公Wang Lung一家展开的。
然而,对这些词的初步分析仅可以帮助我们了解文本的大致内容,却无法进一步筛选重要信息。为进一步分析小说的主题和情节,本研究选取名著《简·爱》作为参照语料库,按照关键值(Keyness)生成关键词词表(keyword list)。 部分结果如图2所示:
图2 《大地》用keyword list统计的结果
从图2中可以看出,按照关键值排在前面并有实际意义的主题词分别是Wang Lung,O-Lan,house,land,uncle,son,silver,Cuckoo。这些词反映了这一作品的如下主要信息:
(1)主要人物:Wang Lung和O-Lan这两个词排在列表的第1位和第14位。由此推断,这两人是小说的主人公。从主人公的名字来看,我们不难发现此小说是以中国社会为大背景创作的,里面的人名都运用中国人的姓。根据中国的姓氏传承历史,儿子往往随父姓,所以小说中Wang出现的频率要略高于Lung。此外,从检索结果中还可以发现另外两个表示人物的词:uncle(第18位)和father(第32位),这说明二者为小说的次要人物,与王龙是亲属关系。
(2)小说的主题:house和land排于列表的第9位和第12位,可以看出小说把中国大环境下的农村作为故事的小背景,围绕主人公王龙、阿兰和他们的亲属、仆人展开描写了发生在依靠土地成长起来的一代人之间的故事。silver一词排在第14位,值得关注。查看这个词所在的语境,可以发现该词所组成的短语有 “silver dollars”,“silver earrings”,“silver money”,这一系列词为文本分析提供了重要线索。银元和银饰的出现暗示着王龙地位的改变,也间接反映了文章的主题:赛珍珠的《大地》以王龙的人生经历为主线,记叙了他从一个卑微、贫困、有头脑的农民转变成一个富有但有些庸俗的地主的过程,反映了当时中国社会农村的全貌,让读者从小人物身上折射出的种种看出整个大社会的变迁。
除此之外,从关键词表中还发现Wang Lung出现的次数相比O-Lan要多,说明小说对男主人公的描写多于女主人公,结合时代背景,我们可以发现当时社会重男轻女的思想还是比较严重。但是作者不惜笔墨,刻画了一个具有悲情色彩的女主角,从侧面反映了她作为女性的独特眼光和她所倡导的男女平等观念。
利用Antconc 3.2.4w中的concordance plot功能做出主题词图,可全方位观察主题词在小说篇章中的分部情况,从而了解小说主人公之间的相互关系,并且梳理出故事情节发展的脉络。部分结果如图3所示:
图3 《大地》用主题词图统计的结果
从图3可以看出,Wang Lung(王龙)一词在文本中频繁出现,几乎贯穿整个故事,推断其为小说的主人公。O-Lan(阿兰)一词从文章中间稍前部分才开始出现,集中出现在小说的中间部分,结尾部分出现次数开始明显减少,只是偶有提及。可以推断文章开头部分应主要描写王龙的生活背景,介绍他的基本情况。之后发生一些事情引入了阿兰这一角色,小说的中间部分应该围绕这两个人展开。小说后半部分阿兰的出现频率低暗示了她后来的遭遇。事实上,小说的前面几章主要叙写了王龙应父亲要求准备结婚的过程,特别侧重对王龙家庭情况的描述,把王龙作为农夫朴实、贫困的形象塑造得有血有肉,之后讲述了阿兰成为其妻后经历的艰苦生活,最后阿兰最后悲惨地死去,所以结尾部分她的名字出现得极少,这与词图所显示的结果完全吻合。son主要出现在小说的后半部,可见后来王龙有了儿子,后面是对其儿子的相关描述。Cuckoo是仆人的名字,出现在文章的中间至结尾部分。根据仆人的身份并结合社会背景,只有富有的地主家庭才可能有钱请奴隶(仆人),由此推断王龙的生活已经得到了很大的改善,他已经从一个穷困潦倒的农夫变成了一个有一定经济基础的地主。House和land的二词的分布几乎遍布整部小说,但比较而言,house所出现的频率更高,由此看出这两个事物对于中国农村而言具有极为重要的象征意义,同时也印证了小说的主题。
通过利用语料库检索工具中的语境共现(concordance)功能,输入关键词,进行带语境的关键词检索,列出相应人物出现时的上下文,能够检索出对于重要人物的描写,这对研究人物性格和作者对人物的刻画都有不可或缺的重要性。[4]结合Antconc 3.2.4w的检索结果,对小说的主人公王龙(Wang Lung)和阿兰(O-Lan)进行语料库检索分析。②
首先,从检索结果对主人公王龙(Wang Lung)的语境共现行进行分析。从王龙对土地的关系看,文本中偶有出现他恨骂土地的表现,但王龙和土地是不可分割的,他需要依赖土地才能生存,而土地又将他牢牢束缚住,但能给他的东西却是有限的。总体而言,王龙对土地怀揣着一种依赖感和眷恋之情。从王龙和阿兰的关系看,Wang Lung这个词所在语境共现行在小说前后区别很大。在小说的前半部分,他是一个勤劳、朴实、做事踏实的人。但从小说的后半部分看,他开始嫌弃自己的结发妻子阿兰,继而开始纳妾,变得有些冷酷。然而,在小说的字里行间,我们还是可以感受到王龙内心残存的愧疚之情。
阿兰(O-Lan)是小说中典型的女性形象。根据检索结果,“O-Lan”的语境共现行中大多是褒义词。这些词大多描绘了她不善于言辞,却是一个任劳任怨,吃苦耐劳,勤俭持家的女人。她有自己坚定的信念,用自己微薄的力量和命运做抗争。正是在她的帮助下,王龙才得以发家,成就自己的事业。但最终阿兰苦于封建婚姻制度的压迫,在丈夫面前只能逆来顺受,没有选择婚姻的权利,最后倒地不起,可怜地死去。[5]作者塑造这个形象凸显了当时女性在社会上低贱的地位,同时也反映了作者提高女性社会地位的愿望。
作为赛珍珠获诺贝尔文学奖的作品,《大地》以现实主义的手法,道出了中国社会的本质,促进了东西方文化的交流和沟通,是一部具有特殊意义的鸿篇巨制。[6]通过语料库检索工具对《大地》进行分析,可以看出赛珍珠用简单易懂的语言生动形象地描绘了中国近代社会农村生活的全貌,小说情节发展跌宕起伏,人物形象塑造鲜明,性格突出。
基于语料库的文学作品分析方法,虽然在语言特征判断方面无重大突破,但实施起来却快捷、准确,省时省力,而且证据充实,令人信服。[7]运用语料库检索工具对文学作品进行分析,可以准确清晰地把握小说的总体语言特征,也有助于对小说的主题、情节发展、人物性格塑造等方面进行客观分析,从而得到对文本更加理性的诠释。
注释:
①本研究用于语料库检索分析的文本为2005年由Simon&Schuster,Inc.出版的英文原著电子版,具体信息参见参考文献[8]。
②因检索结果内容较多,限于篇幅,本部分的检索结果省略。
[1]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002:11-14.
[2]肖普勤,黄凤枝.基于语料库的文学作品分析方法初探[J].美中外语,2005,14(8):41-43.
[3]何安平.语料库辅助英语教学入门[M].北京:外语教学与研究出版社,2010:44.
[4]任培红.基于语料库的《呼啸山庄》的检索分析[J].沈阳大学学报,2008,20(4);21-22.
[5]李铭.“大地”上的女人[J].黑龙江教育学院学报,2009(5):27-29.
[6][美]赛珍珠.大地[M].王逢振,译.上海:上海译文出版社,2002:13-16.
[7]何安平.《用语料库研究语言》导读[A].Thomas J,Short M.Using Corpora for Language Research.北京:外语教学与研究出版社,2001:2-4.
[8]Pearl S.Buck.The Good Earth.New York:Simon&Schuster,Inc.,2005.