麦卡锡小说《路》的语料库检索分析

2022-10-19 06:32:22王雪利
今古文创 2022年38期
关键词:第三人称词频主题词

◎王雪利

(桂林信息科技学院 广西 桂林 541004)

《路》是美国当代著名作家科马克·麦卡锡的第十部作品,于2006年出版,获得读者一致好评,并于次年获得普利策奖。小说讲述了世界末日情境中,一位父亲和幼子前往美国南海岸的艰难求生之旅。麦卡锡描绘了天灾和人祸共同酿造的末世景观,成为后“9·11”时代的寓言。知网检索结果显示,2008—2021年间国内关于麦卡锡小说《路》的研究共计80篇,学者们从存在主义、生态主义、人文主义等视角解读小说主题以及叙述方式,取得了丰富的研究成果,但诸多研究都属于定性研究,缺乏定量数据支撑,截至目前还没有学者结合语料库从定量的角度对小说进行全面的分析解读。

基于语料库的文学研究不仅可以促进文学研究方法的重要变革,而且可以在很大程度上深化文学研究。本文借助语料库语言学的研究方法,将定量研究和定性研究相结合,通过数据科学地分析解读麦卡锡的小说《路》。笔者通过使用语料库检索软件AntConc4.0.3和WordSmith Tools6.0对自建语料库“The Road by Cormac McCarthy_raw(60,397词)”(后文简称“The Road”)进行检索,同时以美国国家语料库(ANC)子语料库“Fiction (61,893词)”作为参照语料库,借助生成词表、主题词表、索引分布以及语境共现等检索功能,从语言特点、故事情节、角色刻画及叙述视角等方面,客观分析作者麦卡锡独特的语言表达艺术,辅助传统意义上定性的文学研究,有助于读者更好地理解小说,提高读者的语言意识。

一、语言特点

通过语料库检索软件WordSmith Tools6.0的生成词表功能可以得出语料库文本的总体统计信息。其中,形符数指文本总词数,类符数指去除词形变化后文本的总词数,标准类形符比可以表明词汇多样性,即文本的词汇密度。自建语料库“The Road”和参照语料库“Fiction”文本的总体统计信息如表1所示。

表1 自建语料库“The Road”和参照语料库“Fiction”的文本统计数据

由表1可知,自建语料库“The Road”和参照语料库“Fiction”文本总词数都为6万多,但二者在标准类形符比上存在较大差异。小说《路》的标准类形符比为37.85,远低于参照语料库文本标准类形符比51.76,说明小说文本词汇密度很小,词汇变化不大。小说《路》的平均词长为3.93,也远低于参照语料库平均词长4.72,表明小说文本词汇较为简单。此外,参照语料库文本平均句长18.28,几乎是小说文本平均句长9.24的两倍;参照语料库文本平均段落长39.60,也远高于小说文本平均段落长26.63。可见麦卡锡的小说《路》用词变化不大,句子和段落较短,阅读难度较低。

通过语料库检索软件AntConc4.0.3的生成词表功能,可以生成自建语料库“The Road”的词频统计数据如表2所示。

表2 自建语料库“The Road”词频统计数据(前30)

从表2可见,小说文本词频统计表前30位多为功能词,代词11个(he, it, they, you, i, his, we, that, him,what, them)、介词7个(of, to, in, on, with, out, at)、冠词2个(the, a)、连词2个(and, but)、动词2个(was, said)、名词2个(boy, road)、副词2个(there, up)、缩略形式2个(’t, ’s)。

从词频表里的代词来看,排在前三位的代词“he”“it”“they”都是第三人称代词,可见小说是以第三人称视角进行行文写作。表示第三人称男性的代词“he”“his”“him”分别排在第3、12、24位,词频总计高达3258次,可以推断男性是小说描写的重点,在小说中占主导地位。此外,第二人称代词“you”和第一人称代词“i”“we”的使用频率也很高,可以推断小说中存在大量人物对话。排在词频表前两位的动词“was”“said”都是过去式,可见小说主要使用过去时进行叙述,陈述的故事发生在过去。排在词频表前30位的名词只有2个,“boy”和“road”,前者为小说主人公之一,后者为小说主线。表示否定的“t(’t)”在词频表中处于第16位,再加上检索非缩略形式的“not”,小说中否定词“not/t”词频高达742次,可见小说中存在大量表示否定意义的句子,这也映射出小说悲观、绝望的末日情景和感情基调。

二、故事情节

通过语料库的主题词表可以了解文本的词语特征,更清楚地了解故事情节。主题词表是将观察语料文本的词语分布,和其他文本(参照语料库)的词语分布进行对比,把观察语料库文本中显著高频的词语析取出来生成的词表。

在此以自建语料库“The Road”为观察语料库,美国国家语料库(ANC)子语料库“Fiction”作为参照语料库,通过语料库检索软件AntConc4.0.3生成自建语料库“The Road”的主题词表如表3所示。

表3 自建语料库“The Road”主题词表(前20)

小说主题词表前20位的主题词大体可以分为4类:1. 指代人和/或物的名词和代词(he, boy, it, they, road,papa, cart, him);2. 指代动作的动词(looked, stood, sat,said, went);3. 表示肯定或否定的副词(okay, yes, t-not);4. 其他词(the, and, out, there)。

高频主题词“boy”和“papa”指代小说故事里的两个主人公,同时表明二者是父子关系。高频主题词“road”为小说主线,指两位主人公的求生之路。通过AntConc4.0.3的索引定位功能,可以得到“boy”和“road”在文本中的具体分布情况如图1、图2。

图1 “boy”在自建语料库“The Road”的索引分布图

图2 “road”在自建语料库“The Road”的索引分布图

图1、图2显示,高频词“boy”在文本中位置分布较为均匀,从始至终未有明显间断;“road”虽也贯穿全文,但是在小说中后段有很大一部分空白。小说主线为男孩和父亲的求生之路,从小说中后段高频主题词“road”的缺失可以推测此时父子两人遇到了难以逾越的困难或困惑,失去了前进的方向,前路未知,非常迷茫。小说最后“road”再次高频出现,可以推断男孩(父亲因病去世)找到了前进的方向,坚定地踏上了旅途。

高频主题词中的5个动词都以过去式的形式出现,进一步验证故事发生在过去的推断。同时这些动词都是表示实际动作的动词,展示了主人公在求生路上的一系列动作——“looked(看)”“stood(站)”“sat(坐)”“said(说)”和“went(走)”,从这些高频动作主题词可以推断主人公一路上持续前进,没有停歇,求生之路艰难且漫长。

此外,表示肯定的“okay”和“yes”高频主题词主要出现在父亲和男孩的对话中,是二人相互确认时所用。肯定的回答表明父亲和男孩相互之间给予对方信心、信任和依靠,支撑着彼此在艰难的求生之路上继续前行。否定词“t(’t)”贯穿整本小说,可见小说主人公的求生之路充满艰难险阻和各种不确定因素,父亲并不确定逃到南方是否就能存活下去,甚至不确定所走之路是否正确,但是因为求生的本能和至深的父爱,父亲带着儿子坚定不移地踏上了求生之路。

三、角色刻画

通过主题词表可知小说主要主人公是父亲和男孩,但是整部小说中都未提及两位主人公的具体姓名,也没有对其年龄、背景、外貌等的正面描写,而只是用“papa”和“boy”指代。姓名的缺失使得故事人物具有不确定性和普遍性,可以指灾难后幸存的任何人,因而更能引起读者共情。

指代故事主人公的两个主题词“boy”在文中出现595次,“papa”出现了136次。查阅包含“boy”和“papa”的索引行发现主要是男孩和父亲的互动,进一步检索包含“boy”的四字词簇,“looked at the boy”“he held the boy”“the boy didn't answer”分别出现了31、14、11次。高频四字词簇“looked at the boy”“he held the boy”充分展示出父亲对儿子的爱,也从侧面显示男孩在父亲的关怀和保护下成长,非常依赖父亲。四字词簇“the boy didn't answer”是父亲询问男孩或者下达指令时,男孩给出的反应,男孩并没有对父亲的话语做出直接回答或是回应,而是保持沉默。可见在逃亡求生的过程中男孩处于懵懂迷茫的状态,他不清楚到底发生了什么,为什么会发生这一切,以及该如何应对这一切,充分展现了男孩的无知、犹疑以及反抗。

通过查看统计“papa”所在的136条索引行发现,以问号“?”结尾的索引行高达65条,都是男孩对父亲的询问,可见男孩对外界事物和自身行为的不确定性,需要不断跟父亲确认和寻求答案,同时也表明男孩对父亲的无条件信任。检索包含“papa”的四字词簇,问句“what is it papa”出现了10次,充分展现出男孩对外界事物充满好奇,希望通过父亲的回答了解外界、认识世界。

查阅代词“i”的索引行也可以帮助分析父亲和孩子的人物特点。检索包含“i”的四字词簇,前三位都是表否定意义的词簇,分别是“i don t know”73次、“i don t think”15次、“i don t want”15次。这些高频否定词簇展现初父子俩求生之路上的无助、无赖以及恐惧,前路未知,充满不确定性。其中,高频词簇“i don t want”的15条索引中有13条均出自男孩之口,映射出男孩的畏缩和害怕,他还没有适应残酷的外界环境,不敢直面外界变化。

四.叙述视角

从小说文本的词频统计可知,人称代词在小说中占据非常大的比重。表4是对小说中人称代词的词频统计数据。

表4 自建语料库“The Road”中人称代词词频统计数据

由表4可知,第三人称代词(he, it, they, his, him,them, their)以非常高的频率(5741次)出现在小说文本中,约占总词数的9.51%,可见小说主要以第三人称作为叙事角度。第三人称叙述不受时间和空间限制,能够比较灵活的反映客观内容,使叙述更真实,更具有说服力。

在高频第三人称代词中,指代男性的第三人称单数代词“he”“his”“him”出现了3258次,占总词数的5.39%,可以推断小说是站在男性的视角审视问题,具有一定的男权主义倾向。经检索可知,指代女性的第三人称单数代词“she”“her”在小说文本中的出现频率较低,主要分布在小说的前、后两部分。小说前面部分出现的女性主要是指男孩的母亲,对母亲的描述主要出现在父亲的回忆之中,温柔而美丽,但是母亲因无法面对末日的绝望境遇,在父亲和男孩踏上求生之路前开枪自杀,所以文中对男孩母亲的描述是消极悲观的。小说后文出现了其他女性人物,一位母亲和一个小女孩,其中对这位母亲的描述集中出现在小说倒数第二段“The woman when she saw him put her arms around him and held him. Oh, she said, I am so glad to see you. She would talk to him sometimes about God…”文中描述了一位母亲对孩子的关爱和宽慰,展现出细腻的母爱。所有这些对女性的认知和描述都是站在男性视角,展现出男性在家庭、社会中的支配地位,突出男性的理性、控制权、竞争性、独立自主等;而将女性客体化,弱化女性的价值,将女性浪漫化,尤其是将母性浪漫化,用女性的柔弱美丽来衬托男性的刚毅坚强。

此外,第二人称代词“you”和第一人称代词“i”和“we”的使用频率也较高,可以推断出小说中存在大量人物对话。在对话中,小说主人公可以直接表达其内心情感和心理感受,以及主观意见和看法。采用第一人称和第二人称对话的叙述方式可以缩短叙述者与读者之间的距离,引发读者共鸣,身临其境的倾听主人公的对话。

五、结语

本文借助于语料库检索软件AntConc4.0.3和WordSmith Tools6.0对自建语料库“The Road”进行检索,从语言特征、故事情节、角色刻画和叙述视角四个方面对麦卡锡的小说《路》进行分析,以定量与定性相结合的方式进行解读。研究发现,小说文本篇幅较短,词汇变化不大,句子和段落偏短,阅读难度不大。小说站在第三人称视角讲述故事,描述了父亲和男孩在世界末日情境中的艰难逃亡求生之路。通过父子两人旅途中一系列的互动和对话刻画出真实丰满的父子形象,父亲勇敢坚毅、言行举止都是对孩子深深的父爱,男孩因为对未知世界的恐惧而表现出怯懦、犹疑以及对父亲的依赖,但也在危险艰难的旅途中慢慢成长起来。语料库语言学的研究方法,为文学作品分析提供了直观的数据,弥补了传统意义上定性的文学研究的主观性和抽象性,为文学研究提供了一个新的科学的研究视角。

猜你喜欢
第三人称词频主题词
基于词频分析法的社区公园归属感营建要素研究
园林科技(2021年3期)2022-01-19 03:17:48
谈谈英语教学中 第三人称单数及其后面动词的用法
用第三人称和自己说话能减压
幸福·悦读(2017年10期)2017-10-18 10:16:13
It’s Your Turn, Roger! (I)
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索
我校学报第32卷第5期(2014年10月)平均每篇有3.04个21世纪的Ei主题词
我校学报第32卷第6期(2014年12月)平均每篇有3.00个21世纪的Ei主题词
2014年第16卷第1~4期主题词索引
《疑难病杂志》2014年第13卷主题词索引