张恨水小说《啼笑因缘》的语料库检索分析

2020-03-12 07:26
牡丹江大学学报 2020年2期
关键词:因缘语料库检索

金 迪

(南京师范大学文学院,江苏 南京 210097)

一、引言

语料库语言学是一种以语料库为基础的语言研究方法,包括对自然语料进行加工标注,以及用已经标注好的语料进行语言研究。它自上世纪50 年代产生,在80年代崭露头角并开始引入我国,是一门集语言学、计算机科学、应用语言学和认知语言学等的交叉学科。[1]作为对传统定性式文本分析的一种有益补充和深化的手段,语料库语言学以真实的语言数据为研究对象,通过对文学文本进行量化分析,为基于个人阅读体验、以阐释性为主的传统文体学提供实证支持,并使分析结果变得更为客观、可靠。[2]

目前,国内对张恨水《啼笑因缘》这部小说的研究都是传统的文学赏析,笔者在中国知网上以“张恨水《啼笑因缘》”为检索关键词进行检索,共搜索到49篇。其中对小说中相关女性人物形象的赏析最多,此外还有对小说中的佛学思想、对传统章回小说体式的继承与创新、艺术成就等方面进行了描述性的分析。但是却缺少基于语料库的、以客观理性的角度对《啼笑因缘》进行的研究。因此本文采用语料库语言学的方法,基于AntConc软件对张恨水的作品《啼笑因缘》从小说的叙事视角、文章主题、主要人物形象分析、发展脉络、语言特色等角度进行相关检索统计,以期从新的研究角度对传统文本进行相应的补充分析。

二、基于语料库检索的《啼笑因缘》相关分析

(一)语料预处理

在进行语料库检索前需要对语料进行中文分词,使用Python编写分词程序,运用jieba中文分词包进行自动分词,接着对分词结果(主要是一些人名、称谓等的错误分词)进行人工校对。该语料库包含了 153,619个形符,16,586个类符。再使用AntConc3.2.4w软件中Word List、Concordance、Concordance Plot、Keyword List等功能对小说《啼笑因缘》进行相关统计分析。

(二)使用Word List 功能分析小说叙述视角和语言特色

通过Word List对词频进行排序,得出词频表,从而可以对文本的叙述视角、语言特色、主要人物等有一个基本了解。而Concordance功能可以帮助找到被检索词所在的所有句子,列出所有相关的句子片段,方便对被检索词所在的上下文语境进行分析。

运用AntConc3.2.4w软件中Word List功能对小说《啼笑因缘》进行词频检索排序,选取前45个高频词绘制成如下表格,详见表1。

表1 《啼笑因缘》中出现频率在前45位的高频词语

从表1中可以发现,首先,“我、你、他、她”四个人称代词均出现在高频词表中,其中“我”和“你”频率最高,分别是3085次和2523次。又通过Concordance功能检索发现,代词“我”和“你”一般都是出现在人物对话里,可见小说并不是以第一、二人称进行叙述的。接着代词“她”和“他”进行相关检索,发现这两个代词很少出现在对话内容当中,而是大量出现在旁白中,可见该小说是以第三人称这一上帝视角进行叙述的。用第三人称叙述的优势在于小说不受时空限制,能更客观地反映内容,并全方位地表现主题。从排名和频率上看,女性人称代词“她”比男性人称代词“他”排名更靠前,出现频率也更高,说明小说中的女性角色人数可能比男性角色多。

第二,在这些高频词中,“道”“说”是频率最高的两个动词,分别位列第四位和第十三位,说明小说中有大量的人物对话。另外,还存在一些高频语气词,例如“吗”“呢”“吧”,也验证了上述结论——作者比较注重对话描写。而通过大量的人物对话,从人物口中讲出亲身经历的事情或者心理活动,又在很大程度上弥补了第三人称叙述视角的不足,使读者更感亲切和真实。

(三)使用Word List 、Concordance Plot、Concordance、Collates功能分析小说主要人物形象和人物关系

使用Concordance Plot功能可以视觉化呈现被检索词在文本中出现的位置以及疏密程度分布,而Collates功能可以检索到被检索词的前后搭配词,从而进一步帮助了解相关文本内容。

从表1中可以发现,前63位高频词中,共出现了四个人物“家树”“凤喜”“秀姑”“何丽娜”。通过Concordance观察包含这四个人物的句子,发现这四个人物分别是一男(家树)三女(凤喜、秀姑、何丽娜),可见小说故事情节的发展与这四个主人公密切相关。

使用索引定位Concordance Plot,得到“家树”在小说《啼笑因缘》中的情节分布图,见图1:

图1 “家树”在小说《啼笑因缘》中的情节分布图

从图1可以看出,“家树”是小说至关重要的人物,贯穿文章始末,分布得十分密集。从Collate检索发现与其搭配的词有“凤喜”“何丽娜”“秀姑”“寿峰”“笑嘻嘻”“微笑”“酒杯”“赞成”等。结合Concordance分析可知,“家树”是一个有钱有地位的少爷,也是有些传统思想的知识分子,待人温和、善良且乐于助人,不嫌贫爱富,和“凤喜”“何丽娜”“秀姑”这三个女子都有过情感纠葛,与仗义的“寿峰”大叔也是忘年交的好友,一拍即合。

图2 “凤喜”在小说《啼笑因缘》中的情节分布图

从图2可以看出,“凤喜”也是小说的主要人物,在分布图上占了很大的篇幅,几乎贯穿了整个小说。

通过Collate检索可以发现与其搭配的关键词有“家树”“沈大娘”“沈三玄”“刘将军”“脸”“胡同”“笑”“眼睛”“相片”“病”“唱”“大鼓”等。结合Concordance可以推断凤喜是沈大娘的女儿,沈三玄的侄女,家境贫寒,靠唱大鼓为生,是一个平民女子,从“笑”这个词可以看出她是一个天真烂漫活泼的人,是家树的心上人,曾经送了家树一张自己的半身像照片,并受其恩惠,搬到大喜胡同居住,后来却受金钱迷惑虚荣心作祟做了刘将军的夫人,一次和家树私会被刘将军鞭打致疯,最后凄惨死去。

图3 “秀姑”在小说《啼笑因缘》中的情节分布图

从图3可知,“秀姑”出现的频率也较高,是小说另一个比较重要的人物。和凤喜相比,她出现的时间更早,但是出现的频率相对较少,只集中在部分章节。从Collate检索和其搭配的关键词有“家树”“寿峰”“凤喜”“姑娘”“何丽娜”“救命”“医院”“英雄”等,结合Concordance可知江湖侠女秀姑是“寿峰”的女儿,因家树帮助父亲入院治病一事而对家树暗生情愫,曾经救“凤喜”于水深火热之中,侠肝义胆,尽力撮合家树和何丽娜,最后在战争中为国捐躯。

图4 “何丽娜”在小说《啼笑因缘》中的情节分布图

从图4可知,“何丽娜”相对集中在小说后半段出现,前半部分出现的次数比较少,可见她在小说的后半部分起到了关键作用,是一个从次要到关键的循序发展的人物。从Collate检索与其搭配的关键词有“家树”“车子”“茶”“汽车”“密斯何”“凤喜”“音乐”等。结合Concordance可知,部长千金何丽娜刚开始生活奢侈,经常出入于跳舞场,和凤喜长相酷似,深深爱恋着家树,为了爱毅然改变自己奢靡的作风,后来与家树喜结良缘。

综上可知,《啼笑因缘》主要讲述的是一男三女之间的爱情故事,男主人公家树多金但不纨绔、乐于助人、平等待人、进步向上,另外三个女主人公——凤喜美丽纯真但拜金虚荣,秀姑淳朴豪爽且狭义、富家女何丽娜时髦活泼且爱情至上,一女三男之间上演了种种“啼笑姻缘”的爱情故事。

(四)使用 Keyword List、Concordance功能分析文本主题和故事情节发展

上文通过使用Word List、Concordance Plot、Concordance以及Collates功能简要地分析了小说的叙述视角、语言特色、人物形象与关系,对小说的内容有了大致的了解,但对于文本脉络的掌握并不完整细致,要想深入而详细地了解小说的精髓与核心思想,还必须结合使用Keyword List功能。Keyword List功能可以通过建立一个比目标语料库更大的参照语料库,并提取目标语料库中在词频方面具有显著性差异的词语,生成关键词词表。该功能有助于更加细致深入地分析文本主题和内容特色,从而准确把握文本的情节发展。

表2 《啼笑因缘》关键词分类表

本研究的目标语料库《啼笑因缘》,其语料库总字数为241,061字;参照语料库选取的是张恨水的另一部通俗小说《纸醉金迷》,共593,077字。

使用Keyword List功能生成小说《啼笑因缘》的关键词,选取了显著性排名在前72位、并具有研究价值的51个关键词进行多角度归类,具体见表2(表格中的数字表示关键词的显著性排名)。

从表2可知,前14个关键词中,除了第9位“姑娘”不是指具体的人物,指的是一种称谓以外,其余十三个都是指人物。通过concordance发现“何小姐”与“密斯何”,“樊先生”与“樊大爷”分别指的是小说的主要人物“何丽娜”“樊家树”。此外还有“何廉”“尚师长”“刘福”“雅琴”“李永胜”“夏云山”以及“沈统制”,共计20个人名。

再从这些名字特点上看,“凤喜”“秀姑”“寿峰”这样的名字比较传统,属于年代比较久远的名字,而“何丽娜”这个名字又比较欧化,更具现代性,而且文中还有“密斯何”即Miss He这种受西方文化影响的外来品,也有“少爷”这种传统文化的称谓,因此可以推断小说故事应该发生在一个新旧交替、传统文化与西洋文化碰撞激烈的年代——民国时期。又从“刘将军”“尚师长”“沈统制”这些名称中可以推断,故事发生背景可能还与军阀政治相关。

此外,还有各种称谓,比如“姑娘”“大叔”“女子”“叔叔”“父亲”“表嫂”“夫妇”“大夫”“少爷”。可见该小说涉及的人物众多,且关系复杂,各个年龄段、男女性皆有涉及。

从地名一栏可见,小说发生的地点主要有“北京”和“天津”两座城市,而具体到范围更小的地方有“院子”“胡同”“西山”“天桥”——这些都是老北京的特色,说明“北京”是小说情节设置最主要发生的地点。通过Concordance发现,小说一些重要故事情节都发生在“医院”,比如家树帮助寿峰大叔住院,凤喜被鞭打致疯后住院治疗,这两个场景都极大地推动了小说故事情节的发展。

从政治一栏可知,故事背景还涉及政治军事。结合前文所说从人名和称谓上推测故事发生的年代是在民国时期,又通过Concordance进一步分析可以推断小说发生的具体时期是军阀混战烽烟未息、列强侵华野心日显的年代。

最后,在其它这一栏中,结合Concordance功能,从“唱”和“大鼓”这两个词可以发现小说女主人公之一的凤喜是唱大鼓出身的平民女子,与家树相识时正是在天桥唱大鼓的时候。“汽车”一词说明小说也涉及上层人物,“书”也符合了家树作为知识分子的特质,来京是为了考取学位。另外“相片”是小说的一条重要发展线索,起因是凤喜赠送了家树自己的一张照片,而凤喜又和何丽娜长得很相像,后来被陶太太看到误以为家树喜欢何丽娜,就尽力撮合他俩,由此引发了一场“啼笑皆非”的爱情故事。

综上所述,通过对小说中人物、时间、地点、背景和情节的深入了解,可以归纳出小说中的三条爱情主线——①男主人公家树爱上了唱大鼓书的平民女子凤喜,尽自己的能力帮助凤喜走出贫困,但两人有缘无份,凤喜受到金钱的诱惑嫁给了刘将军,却被刘将军鞭打致疯,最后在思念与忏悔中病死;②家树在一次去天桥闲逛时结识了豪爽仗义的关寿峰,后与其女儿秀姑相识,因家树尽心帮助关寿峰入院医治,使得秀姑对其暗生情愫。虽然家树心有他属,侠肝义胆的江湖侠女秀姑依旧全心全意为家树付出,比如深入刘将军府解救凤喜。后来秀姑与其父参加了义勇军,并为国牺牲;③家树初见富家女何丽娜时并不心动,甚至觉得其生活放荡奢靡,后来因遭凤喜背叛,且何丽娜为爱情甘愿改变自己的生活作风,使得家树对其刮目相看,两人终成眷属。可见爱情是该小说最重要的主题,另外其中也穿插了关寿峰和秀姑父女俩除强扶弱的武侠传奇主题,以及最后众人为国奉献的爱国主题。

三、结语

本研究借助语料库检索软件AntConc3.2.4w,综合运用Word List、Concordance等功能,对张恨水小说《啼笑因缘》从叙述视角、语言特色、人物形象、人物关系、文本主题与情节发展六个角度进行了细致深入的分析。

采用Word List功能,从叙述视角和语言特色对小说进行分析,发现小说主要采用第三人称叙事视角,可以更加客观地反映小说内容,而且小说中存在大量的人物对话,又在一定程度上拉近与读者的距离。

采 用 Word List、Concordance Plot、Concordance、Collates功能,初步分析了小说四个主要人物的形象和关系。家树出身富家,但讲究平等,不嫌贫爱富,乐于助人;凤喜出身贫苦,美丽活泼但拜金虚荣,缺乏独立意识;秀姑侠肝义胆、古道热肠,具有牺牲奉献精神;何丽娜家境优越,美丽勇敢,勇于追求爱情。小说就是围绕着这一男三女之间的多角恋爱展开的。

采用Keyword List、Concordance功能,深入分析文本主题与情节发展。该小说发生在军阀混战烽烟未息、列强侵华野心日显的民国时期,地点主要在北京,涉及人物众多,且关系复杂,共有三个主题:爱情、武侠和爱国。其中爱情是最主要的主题,共涉及三条爱情线索——家树与凤喜、家树与秀姑、家树与何丽娜。小说沿着这三条主线发展了一系列故事情节。

基于相关语料库AntConc软件对小说《啼笑因缘》进行定量分析,虽然缺乏一定的感染力,但是具有层次清晰、数据量化等特点,有助于提高文本分析的准确度,对于传统文学鉴赏《啼笑因缘》起到了有益的补充作用。

猜你喜欢
因缘语料库检索
“三个女人一台戏”之《啼笑因缘》
《语料库翻译文体学》评介
Uneker torolkitu xani tuuji《因缘品》中的密教元素
高深知识与大学的因缘及其价值生成
敦煌因缘与佛教戏剧关系述考
专利检索中“语义”的表现
基于JAVAEE的维吾尔中介语语料库开发与实现
语篇元功能的语料库支撑范式介入
国际标准检索
国际标准检索