《哈克贝利·费恩历险记》词汇层面的计算文体学分析

2013-01-31 05:00
关键词:形符哈克文体学

王 静

(辽宁师范大学 外国语学院,辽宁 大连 116029)

马克·吐温,美国19世纪伟大的作家,其作品集盎然有趣的生活体验、秀丽的自然风光和丰富多彩的冒险经历为一体,同时充满了幽默和讽刺,并将其作为一种抨击当时美国社会不合理现实的手段。《哈克贝利·费恩历险记》(1884)是马克·吐温的代表作,也是美国文学史上一部影响深远的作品。故事的主人公是在《汤姆·索亚历险记》中就跟读者见面的哈克贝利·费恩。小说的中心情节是讲白人孩子哈克和黑奴吉姆如何结下深厚友谊的故事。哈克为了逃避酒鬼父亲的虐待,逃到一座小岛上,巧遇逃奴吉姆,两人结伴而行,企图从密西西比河上逃往北方的自由州。《哈克贝利·费恩历险记》历来备受学者的广泛关注,但研究出发点大多是基于定性的。本研究将从计算文体学的角度对其进行定量研究。

现在,许多畅销书籍出版的续篇,大多是基于商业利益,借助于已经积累的人气,而自身的可读性很低。那为什么马克·吐温的续篇《哈克贝利·费恩历险记》获得了很大的成功,甚至比《汤姆·索亚历险记》更受欢迎呢?本文试图从词汇层面对小说进行计算文体学的分析来寻求解析,通过对比《哈克贝利·费恩历险记》和《汤姆·索亚历险记》两篇文本的词长、词汇密度和关键词来揭示其词汇特点,从而为以后的英语写作提供一些可靠的参考建议。

一、计算文体学

哈特曼和斯托克在《语言与语言学词典》中指出:文体是个人或集体在谈话或写作中运用语言的方式[1]。文体学源自古代亚里士多德的修辞论,是一门结合文学和语言学的交叉学科,是运用语言学的理论去阐释文学内容和写作风格的一门学科。计算文体学是将计算机技术和计算主义思想应用到语篇分析中,试图给理论分析找出科学的数据证明[2]。Wales 将计算文体学定义为采用统计学和计算机辅助的分析方法来研究文体的各种问题[3]。通常文体学分为传统文体学和计算文体学,传统文体学研究的重心在文学或非文学文本的审美特性上,而Craig认为,通过计算技术才发现的语言现象是计算文体学主要的研究目标[4]。可见计算文体学是用统计的理念分析文体,通过机器全面而快速地查找文体标记,从而捕捉到一些连作者自己也没有意识到的写作习惯。因此,计算文体学借助于计算技术的应用补充了传统文体学的分析方法。

文体学家Crystal 和Davy 曾深入研究过语言系统的形式和意义,把文体特征按照语言层级划分为五大范畴。这五大范畴是:第一,句子间关系,它包括语义、语用、节律特征以及三者间的关系;第二,句子类型,它描写句子的形式和句子的复杂性;第三,从句类型,它指句子中各从句之间的作用和关系;第四,短语,它描写组成从句的各要素之间的作用和关系;第五,词汇,它描写句子中词的形式和语音特征。[5]

本文基于词汇层面,从词汇密度、词长和关键词的角度对《哈克贝利·费恩历险记》和《汤姆·索亚历险记》两文本进行比较探究。为了测量文本中词汇的丰富程度,采用类符/形符比(type/token ratio,TTR),即一个文本中出现的不同单词总数与实际出现的单词总数之比。Baker 指出类符/形符比值的高低与写作者词汇使用的丰富程度和多样性成正比。她还认为,当所比较的文本长度不同时,标准化的类符/形符比值(standardized TTR)更为可靠[6]。

二、研究方法

本研究主要采用定量技术。为了保证数据分析的客观可靠,采用语料分析软件Oxford Wordsmith Tools、社会科学统计软件SPSS、卡方检验和T 检验。Oxford Wordsmith Tools 包含多个高效的语料分析功能,主要有索引(concordance)、词频列表(wordlist)和关键词分析(keyword)。本文使用词频列表来分析文本单词的类型,使用关键词分析来列举文本中所有的关键词。SPSS 是世界上最早的统计分析软件,主要用于调查数据的处理,并且能建立、编辑和清理数据文件及对数据进行统计分析等。卡方检验是通过比较两篇文本单词的类符的频率来看是否存在显著性差异。T 检验用于测量两篇文本中由词频列表产生的数据,这样可以在一定程度上用科学的方法证明文本表层的差异。

三、数据分析和讨论

为研究《哈克贝利·费恩历险记》(以下简称《哈克》)的词汇特征,采用《汤姆·索亚历险记》(以下简称《汤姆》)做参照文本,通过比较两文本的差异来解释为什么《哈克》比《汤姆》更受欢迎。

1.词汇密度

《哈克》和《汤姆》两文本的词汇密度见表1。

表1 两文本的词汇密度

通过对比表1中的数据看到,《哈克》的形符比《汤姆》的形符多出42 783个,而前者的类符却比后者的类符少了1694个,从形符到类符的数量,《哈克》减少得比《汤姆》更显著。同时,《哈克》与《汤姆》的类符/形符比分别是5.23 和10.57,而标准化的类符/形符比分别是42.56 和35.55。众所周知,标准化的类符/形符比值越高,文本的词汇密度越低,可见,在《哈克》中词汇的重复度要高于《汤姆》。对于平均句长,《哈克》的平均句长3.63 要小于《汤姆》的4.05,如果与布朗语料库(世界上第一个根据系统性原则采集样本的标准语料库,选自美国人撰写出版的普通语体的文本)的平均句长4.66 相比,《哈克》的易读性显而易见。

为了知道《哈克》和《汤姆》在类符/形符比值中是否存在显著性差异,采用卡方检验。两文本的形符/类符比值的卡方检验结果如表2所示。从表2中可以看出,双尾的显著性差异检测低于0.05,这就表明《哈克》和《汤姆》在类符/形符比值中存在显著性差异。

表2 两文本的形符/类符比值的卡方检验结果

2.词长

词长是词汇分析的一个重要手段。文本中使用的单词越短越简单,语言就越简单、易懂。表3显示了两文本中包含1个到16个字母单词的频数。

表3 两文本中包含1个到16个字母单词的频数

从表3中可以看出2个、3个和4个字母的单词在《哈克》和《汤姆》中普遍使用,而对于10个及以上字母的单词,《哈克》的使用明显要少于《汤姆》,可见马克·吐温在写作中更加倾向于使用短单词。下面使用T 检验检测《哈克》和《汤姆》在词长的使用上是否存在显著性差异。表4为词长配对样本T检验结果。从表4可以看出,P 值为0.015,其值小于0.05,可见《哈克》和《汤姆》在词长使用上存在显著性差异。

表4 词长配对样本T 检验结果

3.关键词

通过使用Wordsmith 的关键词功能,《哈克》的30个关键词按词性列在表5中。

表5 《哈克》的30个关键词

由表5可知,其中关键词的非标准形式占了整个文本的20%,《哈克》文本中大量使用不规范的拼写和表达方式,是由于作者马克·吐温对美国南部地方方言和个人言语的偏好,这些使得语言更加地道、地方性和口语化。名词Jim,duke,king,nigger的使用暗含一种尖锐的社会和道德价值。所谓的“公爵”和“国王”到头来只不过是诈取别人钱财的骗子,而那个“忘恩负义出逃的”奴隶却是心地善良、体贴他人的朋友。通过对哈克贝利·费恩心理冲突和最后决定的生动描述,读者自身也能知道如何去辨别是非与对错。名词canoe,raft 的出现对于描写密西西比河美不胜收的景色起到了重要作用,宽广而未知的密西西比河使得哈克的冒险更加引人入胜。代词中关键词I,we,me,my 的出现,证明了《哈克》成功地使用了第一人称叙述故事,使读者对哈克的经历确信无疑,增加了小说的真实性,同时也为读者提供了一个感受小说叙述事件的最佳视角,使读者对主人公的心路历程、经历及当时美国社会的现实状况能感同身受,真实清晰地体验。

四、结 语

本文将《汤姆·索亚历险记》作为参照文本,研究了马克·吐温知名的续篇《哈克贝利·费恩历险记》的词汇特征,得到以下结论:首先,在词汇密度方面,《哈克》比《汤姆》有更多的形符,但是更少的类符,并且通过卡方检验,发现它们在类符/形符比值中存在显著性差异。其次,在词长方面,平均而言,《哈克》比《汤姆》少一个字母,并且通过T 检验,发现它们在词长使用上存在显著性差异。最后,《哈克》中关键词占用的比重较大,并且关键词的口语性充分体现在非标准形式的地方方言中。总之,这两篇小说非常适合低年级孩子阅读,故词长较短和类符/形符比值较低是有利于阅读理解的。

本研究对学生在英语写作中如何选词提供了更好的理据,同时也为他们对文学作品的深刻理解提供了平台,从而促进其写作实践能力的提高。但本研究使用的计算文体学分析方法,就本质而言是解释性的,并且没有涉及文学作品的语音、语法和语义层面。除此之外,在词汇层面,由于空间的限制,重叠词和特殊词没有考虑,这就为以后的研究提供了更多的空间。

[1]哈特曼,斯托克.语言与语言学词典[M].上海:上海辞书出版社,1981:335-336.

[2]胡壮麟.理论文体学[M].北京:外语教学与研究出版社,2000:138.

[3]WALES K.A dictionary of stylistics[M].2nd ed.London:Longman,2001:74.

[4]SCHREIBMAN S,SIEMENS R,UNSWORTH J.A companion to digital humanities[M].Oxford:Blackwell Publishing,2004:318.

[5]CRYSTAL D,DAVY D.Investigating English style[M].London:Longman,1969.

[6]BAKER M.Towards a methodology for investigating the style of a literary translator[J].Target,2000,12(2):241-266.

猜你喜欢
形符哈克文体学
从形符与字义的关系角度论《说文解字》中形声字分类
——以“人”“彳”字部为例
哈克出逃并找到一个朋友
文体学的学科特点和发展趋势研究
哈克寻宝记
真正的强者
留学生形声字教学实践研究
——以满洲里学院为例
《语料库翻译文体学》评介
“形符”在小学数学课堂中的教学困境、功能与应用策略
从文体学视角研究英诗《为国捐躯》的反战主题
如何利用《说文》中的形符教授留学生学习汉语