余华与莫言长篇小说的计量统计和分析

2019-04-02 03:08涂梦纯
中文信息学报 2019年2期
关键词:词类余华语料库

涂梦纯,刘 颖

(清华大学 人文学院 中国语言文学系,北京 100084)

0 引言

余华,1960年生于浙江杭州,先后创作了《在细雨中呼喊》、《活着》、《许三观卖血记》、《兄弟》、《第七天》等5部长篇小说和大量短篇、随笔、杂文;莫言,1955年出生于山东高密,先后发表了《红高粱家族》、《酒国》、《丰乳肥臀》、《生死疲劳》、《蛙》等11部长篇小说、27部中篇小说和若干短篇、散文和电影剧本。两人出生年代相近、创作主题相似,且都是当代风格鲜明、享誉中外的作家,莫言更于2012年荣获诺贝尔文学奖。

已经有很多学者对比过他们在创作上的同异,徐文明[1]指出,余华的暴力叙述冷静而职业化,准确而尖锐,而莫言的语言则富有感性和想象力,使文章整体呈现出一种宏大叙事和慷慨赴义的英雄主义情结;李艳军[2]对比余华的《活着》和莫言的《丰臀肥乳》,说前者饱含悲凉而痛苦,叙事方式又显得温和而淡定,而后者气势宏大、洋洋洒洒、浓墨重彩;毛冰[3]则说,余华内敛克制、朴素中饱含张力,莫言想象大胆乃至恣意妄为、爆发力强。除了主题思想以外,还有一些语言学方面的研究,如王清溪等人[4]、王委艳[5]都指出了余华在小说语言上的陌生化实验,季红珍[6]和杨连芬[7]也说明了莫言写作时在词汇、修辞等方面的陌生化特征。

检视前人的研究我们发现,对两人的对比研究主要集中在作品内容方面,对语言风格的描述或者是主观的、或者是独立的,对二者语言风格的客观对比目前还是一片空白。因此,本文希望从计量风格学的角度对两人的文学语言进行研究。

计量风格学区别于传统风格学,不以个人阅读体验为依据,而转向客观方法来分析写作风格。在中文文本领域,通常会提取文本层面的词长、分句长、句长、段长[8],词汇层面的标点、词类、词汇丰富度、虚词、高频词[9]等,语音层面的元音和辅音、 节奏等[10],以及n元文法等方面的特征。其中n元文法又可以选择标点、词汇、词类、语音[11]等多个方面的特征进行提取。再通过统计学方法来判断不同作者之间是否存在差异,最后分析这些数据体现了文本什么样的风格差异。

1 语料库和预处理

本文选择余华全部的5部长篇小说及莫言与余华作品发表年份相近的5部长篇小说为研究语料,并为了在图表中方便表示重新编号,具体文本及对应编号见表1。首先对文本进行预处理:删去章节号、标题、前言与后记及《蛙》后的同名剧本。再使用NLPIR汉语分词系统[注]又名ICTCLAS2016,下载网址http://ictclas.nlpir.org/对文本进行分词,并据此统计语料库中字、词、标点的数量和分句、句子和段落的长度,前者见表1,后者情况见表2。

表1 语料库字、词、标点情况

表2 语料库段落、句子及分句情况

我们选择10部小说按作者和时间编号为Y1-Y5和M1-M5,在之后的图表中也按此标注,不再重复说明。

2 段落、句子和分句

在预处理时已经统计所有10部小说的段落、句子和分句的数量及长度,现将其数量、均值、最大值和离散度(即标准差)列入表2。

通过数据能够发现,在最大值上,莫言小说不论是段落、句子还是分句都远超余华的;在均值上,莫言小说的平均段长大于余华的,而平均句长、分句长则小于余华的。莫言小说平均段长大于余华的原因是莫言小说段落中有更多的句子。莫言小说这种更长的段落降低了文本的易读性,需要读者花费更多的精力在文本阅读上,也给文本增加了更多可能性;但莫言文本的段落参差不齐,读起来长短不一、错落有致,能够有效地缓解读者长时间阅读长段落的疲惫感。

另一方面,将同一作者5部作品的长度分布列整合后,对余华和莫言的段长、句长和分句长进行K-S检验(Kolmogorov-Smirnov test)[12]159-167。该检验的核心思路是将原分布列转换为经验分布函数,再通过两条分布列差的上确界与参考值进行对比判断原分布是否相同。输出结果中段长和句长的p值小于0.05而分句长的p值大于0.05,即余华和莫言在段长和句长的分布列上存在显著差异。

3 标点

3.1 层次聚类

层次聚类可以对选定特征的整体进行比较,以n元文法对语料库中的标点信息进行聚类,结果如图1所示。

图1 语料库基于标点的1-4元聚类

本文在进行层次聚类时,文本间的距离使用欧氏距离计算,类与类之间的距离使用离差平方和(ward)计算,以下不再特意说明。可以看到在n=1-4时,10部小说按作者聚成两类,表示同一作者文本之间的距离均小于不同作者文本之间的距离。以最上方n=1时为例,莫言的文本在纵坐标1.5处聚成一类,余华的文本则在纵坐标2.0左右聚成一类,但余华和莫言的文本则在纵坐标3左右才相聚。以上结果说明,标点频率本身及标点的多元组合能够区分余华和莫言写作风格的特征量。而具体哪些标点的使用令余华和莫言的文本区分开来,则需要进一步的研究。

3.2 秩和检验

使用秩和检验来判断两位作者在哪些标点的使用上存在显著差异,且哪位在该标点上的频率占显著优势:检验结果小于等于17时,该标点莫言的使用频率显著大于余华,大于等于38时则相反。秩和检验的结果如图2,可见莫言在叹号、顿号、括号、破折号上的使用频率显著大于余华,在标点的使用上,不存在余华使用频率显著大于莫言的情况。

图2 余华、莫言10部小说标点的秩和检验

3.3 叹号、顿号、括号和破折号

感叹号用以表示强烈的感情。

例1余占鳌从劈柴堆里跳起来,手舞足蹈地大喊:“是老子的!哈哈!是老子的!”(摘自《红高粱家族》)

莫言多于余华的感叹号用量代表着前者文本中更为强烈而充沛的情绪。

顿号表示并列的词或词组之间的停顿。

例2桥洞、桥墩、钢梁、铁架、狗皮大衣狐皮帽子,杏黄爬犁蒙古马,铁路桥周围的一切都纤毫毕现,连一根毛掉在冰上都能看得清清楚楚。(摘自《丰乳肥臀》)

顿号不论是用在名词、形容词、动词还是其他词类之间,都代表了莫言对某一场景或事件更丰富的描述。

括号是文中注释部分所用的符号。

例3粮库保管员肖上唇的儿子肖下唇(后来改名为肖夏春)则说,中国的飞行员吃得比苏联飞行员还要好。(摘自《蛙》)

括号的整体用例比感叹号和顿号更少,在余华的文本中仅出现10例,而莫言的文本中共63例,这种用于解释和补充说明的符号的显著优势,体现了莫言小说中对于人物更加具体的刻画。

破折号的用法相对较多。首先是拉长语音的功能。

例4高粱红了——日本来了——同胞们准备好——开始开炮——

与同样表达强烈语气的感叹号相比,给人以更加嘹亮、开阔的感觉。破折号所表达的更具画面感,好像能听到长长的口号在广袤的红色高粱地里回荡。意象与语音一起延长,更能调动读者情绪和想象。

其次是与括号类似的解释说明的功能。

例5老县委书记金边——就是那位为我爹的黑驴挂过铁掌的小铁匠——升任市人大副主任,庞抗美接班已成定局。(摘自《生死疲劳》)

虽然功能类似,但破折号与括号仍有不同。被破折号夹在中间的文字属于正文,而括号中间的文字只是注释,因此从客观数据的角度来说,破折号造成了语气的停顿,将句子打断成几个分句,这一现象映射到主观的阅读体验上,就会因句子没有结束而让读者一直提着一口气,将目光继续移动下去,在另一种层面上达到了延展声音的效果。

最后是话题或对象的转化的功能。

例6嫂子,要想跟你亲个嘴,必须踏着梯子!——五官,你给我闭嘴! (摘自《蛙》)

在《蛙》中出现了大量不使用引号而用破折号转换说话人的方式,不使用正反引号来打断文字,而是用破折号来进行对话者的迁移,仍然隐约体现了其拉长语音的功能:两个人的对话紧紧连成一片,让“我母亲”的话音更大,去打断五官的调戏。这种丰富的修辞作用是简单的引号不能代替的——而破折号的这种使用方法也是仅存在于莫言的文本中。

4 词类和词汇的定量分析

4.1 层次聚类

同样首先使用层次聚类的方式对余华和莫言小说中的词类和词汇进行整体判断,结果见图3、图4。

图3 语料库基于词类的1-4元聚类

图4 语料库基于词汇的1-2元聚类

n=1-4时,10部小说按作者聚成两类,说明词类频率(n=1)及词类的2-4元组合是能够区分余华和莫言写作风格的特征量。而以词汇作为特征、在n=1和2时,10部小说按作者分成两类。说明两位作者在词汇和词汇的二元组合(可以认为是词组)上的确存在显著差异。

4.2 词汇丰富度

词汇丰富度是描述文本中作者用词的重要维度,主要用类符形符比(Type-Token Ratio,TTR)来表示。所谓类符(type)是文本中所有出现的词汇的类数,相同的词记为1个;形符(token)是文本总词数。但是,通常一个作者在写作时使用的不同词汇数量是一定的,而随着文本的增长,总词数一定在增加,所以文本越长、对TTR的结果影响越大。因此,本文采用Guitaud[13]提出的修正公式,取形符的平方根作为分布计算词汇丰富度,如式(1)所示。

(1)

为了便于观察,将由此得到的余华、莫言修正类符形符比绘入图5。可以看到两条折线完全分开,且莫言的词汇丰富度明显大于余华。因此,需要寻找余华和莫言具体的词汇差异,使用秩和检验进行。

图5 语料库的根号词汇丰富度

4.3 词类和词汇的秩和检验

图6 语料库词类的秩和检验

词类的使用频率差异能够反映两位作者写作风格的一些差异。例如,名词代表的是小说世界中出现的人或物,是被描写和记叙的对象,莫言明显大于余华的使用频率代表着前者小说世界中更加丰富的物象;而形容词、区别词和状态词都是修饰成分,用来描述小说中所提及的对象,两位作者之间显著差异的使用频率其实是与名词相辅相成的,当然也意味着莫言文本空间中更加丰富多彩的形象。

再对词汇进行秩和检验。首先,莫言使用而余华未使用的词汇,称为莫言的“独现词”;余华使用而莫言未使用的词汇,称为余华的“独现词。”其次,对于莫言和余华均使用的词汇,秩和检验又将之分为3类:

第1类,频率无显著差异的词汇,共有12 887个;

第2类,频率存在显著差异且余华的使用频率高于莫言的词汇,共257个;

第3类,频率存在显著差异且莫言的使用频率高于余华的词汇,共1 263个。

将第2类词与余华的独现词合并,可以认为这4 069个词是能够反映余华文本特征的特色词;同理,将第3类词语莫言的独现词合并,这22 610个词就是莫言的特色词。分类情况如图7所示。

图7 语料库的词表分类情况

第5节的具体风格分析,就围绕着以上词类和词性的秩和检验结果展开。

5 用词的风格分析

5.1 莫言丰富的类符和余华单调的类符

在秩和检验中表现出频率显著性的词类如名词(n)自不必说,即使在检验中两位作者频率无显著差异的词类上,莫言也表现出了丰富的词汇选择空间,如拟声词和量词,两者对比类符的结果详见表3。还需说明表3的几个表达方式:用下划线标注的词汇有重叠式,如“嗖”有“嗖”和“嗖嗖”两种形式;用斜杠标明的如“吱吱扭扭吜吜”则代表有“吱吱扭扭”和“吱吱吜吜”两种形式。

表3 余华、莫言特色词中量词和拟声词的对比

4.3节中的秩和检验显示,余华和莫言拟声词和量词的整体频率没有显著差异,但两者具体使用的类符数量却如此悬殊。例如拟声词中,莫言的“丁丁当当”和“叮叮当当”、“嘀嘀嗒嗒”和“滴滴嗒嗒”和“嘀嘀答答”、“嘁嘁嚓嚓”和“嘁嘁喳喳”、“吱吱扭扭”和“吱吱吜吜”、“劈里啪啦”和“劈哩啪啦”(以及作为无差异词的“噼里啪啦”)是同音的拟声词,但他在写作时也不会拘泥于一种——或者说,莫言在拟声词的选择上本没有什么定法,而是随心所欲地选择词汇或者字眼,体现出一种非常独特的随性与灵活,比起余华的“循规蹈矩”更加自由奔放。同时,更丰富的类符选择体现了莫言对于声音的细致描摹,这让他笔下的场面更加鲜活立体,仿佛近在眼前。

此外,在表示年份的时间词上,莫言表现出他的丰富性:独属于莫言的年份——将数字、汉字和缩写合并为一个(如1926年、一九二六年和二六年),仅统计小说中所涉及的年份——就有57个之多,横跨了1917年至2005年近一个世纪的时间;而独属于余华的年份词仅有4个。另一方面,“早晨”“晚上”“下午”“中午”等非常普通的时间词是余华的特色词,却在莫言的文本中很少出现。据此可以认为,莫言小说的时间跨度更长——或者说莫言在写作时有意无意地强调这种跨度,而余华则与之相反,强调的是一天之内的早晚变化:这类词汇频率最高的文本并不是余华仅跨度7天的小说《第七天》,可以在一定程度上排除文本时间本身的影响。

莫言更加丰富的词汇选择也出现在了名词上,尤其是人名和地名。

余华和莫言在文中对人名和地名的引用,很多时候并不是因为要叙述这个人物、这个地方,例如:

例7刘作家不愧是我们刘镇的文豪,他一句话就把古今中外的作家诗人全拉过去做了自己的垫背……“连鲁迅先生也跟着丢脸啦,还有李白杜甫先生,还有屈原先生,屈先生爱国而投江自尽,也跟着赵诗人丢脸……还有外国的,托尔斯泰先生,莎士比亚先生,更远的但丁先生,荷马先生……多少个英名先生啊,全跟着赵诗人丢脸啦!” (摘自《兄弟》)

这些作家的名字在富有时代感和乡土气的故事里表现出突兀的文化感,在因描写底层人物而较为粗鄙的小说空间格外显眼;同时又因为略显粗鄙的用法让这些伟大文学家们的组合带有一种奇妙的违和感,本应该凸显人物文化底蕴和高雅情操的言辞,反而把这些“作家”们拉下了神坛,表现出一种与粗鄙环境融为一体的和谐,寥寥数语的用典使或迂腐、或自视甚高的“知识分子”形象跃然纸上。而不能忽略的是,莫言所使用的这类名人(即人名)比余华更多,且这种差距在地名上更加明显。当然,这也并不是说莫言小说中的人物就能走遍祖国大江南北、五大洲四大洋,这些地名很多时候与之前所探讨的人名类似,起到形容性的作用,或者是角色的一种吹嘘,如表4所示。

表4 余华、莫言特色词中人名和地名的对比

例8内蒙古来的驼蹄,黑龙江来的飞龙,牡丹江来的熊掌,长白山来的鹿鞭,贵州来的娃娃鱼,威海来的梅花参,广东来的鲨鱼翅(摘自《生死疲劳》)

而不论莫言的地名中有多少是这样的形容、又有多少是实际的地理位置,这些名字的存在本身就拓展了读者的想象范围,因此能够肯定,莫言小说的文本空间一定是比余华笔下的更加广阔。

类似的情况还出现在重叠式的词汇上,如表5所示。

表5 余华、莫言特色词中重叠式的对比

不论是“一AA”式的量词,还是ABB和AABB式的形容词和动词,重叠式相比原型有加深程度、加强语气、增加感情色彩等表达效果,同时还添加了音韵感。莫言明显多于余华的重叠式类符表现出他文本中更加纷繁的物品、更加鲜明的形态和更加强烈的情感——这正是下一部分的内容。

5.2 莫言强烈的情感和余华克制的情感

以词汇所带有的情绪为标准,挑选余华和莫言词表中的形容词和动词。

表6 余华、莫言特色词中有感情色彩的形容词、动词对比

表6中直观的数量对比当然也表现出莫言丰富的词汇选择空间,但因为其自身带有强烈的情绪——反过来,莫言更多的词汇用量也加强了这种情绪——因此单列一部分专门说明。首先注意到,莫言大量的使用近义的形容词和动词,如表示正面形象中的“丰富”、“丰厚”、“丰腴”、“丰饶”、“富饶”,负面动作中的“哀叫”、“哀嚎”、“悲鸣”、“哀鸣”等等,与表3中同音的拟声词情况类似。于是,余华的用词相对则克制很多,例如“快乐”一词出现在他的特色词中,但莫言使用了意义相似但程度不一的“欣喜”、“愉悦”、“欢娱”、“欢喜”、“狂喜”。而若将其中的任何一个换成“快乐”,虽然仍表达喜悦之情,但读者的感受却完全不一样了。

例9他欣喜地听着锅里的水声,脸上绽开婴孩般的纯洁笑容。(摘自《红高粱家族》)

例9-改 他快乐地听着锅里的水声,脸上绽开婴孩般的纯洁笑容。

在例9中,“快乐”显得单纯,“欣喜”却让人感受到此人的内敛性格,莫言就这样用与“快乐”相近但不同的词汇表达了更加丰富的内涵。在莫言的文本中,这样的例子比比皆是,因此读者能够感受到层次更加丰富、程度更加激烈的情感波澜,看到更加细腻、鲜明的文本世界:更多的爱,更多的恨,更多的死亡;美丽的更加美丽,丑陋的更加丑陋——总之,我们也能够看到,莫言文本中所描绘的故事比余华更加浓墨重彩,这也是前人的研究里将莫言的作品形容为“浓墨重彩”的原因吧。

此外,还有一类表示颜色的词汇,兼具了5.1丰富的种类和5.2强烈的情感,将在第6节集中介绍。

5.3 莫言的文言化和乡土化与余华的白话

余华和莫言的特色词中有一些近义词对尤其能够凸显两位作者的风格差异。

通常认为,文言文向白话文的转变是单音节词双音节化的过程,那么音节数更多的余华——如“或者”对比“或”、“总的来说”对比“总之”,“这时候”对比“这时”,都表现出了更加白话的倾向,相对而言,莫言的用词就表现出文言化的特征。除此以外,还有一些典型词汇能够代表两者的这种差异,一并列入表7。

表7 莫言的文言化与余华的白话对比

词汇上的角标注释了词典中对该词辨析的页码。除了代词中的“吾”、“汝”,时间词中的干支纪年法和量词中的“宿”这种明显的文言词,其他词汇的文言化、书面化特征均能在词典中找到证据。如“似”和“般”这一组近义词,最先出现“一样、相同”这个义项的是“般”:元曲中出现了“高祖般性宽洪,文帝般心圣明”的用法[14]2192,“一般”也出现在了唐代诗歌“湖草青青三两家,门前桃杏一般花”中[16]6;而“似”最早只有“似的”能够表示同样的含义,出现在清朝的《官场现形记》中[16]237。因此可以认为,“般”比“似”更具文言性。

再来看例句:

例10到了中午的时候,他们终于把屋子收拾干净了(摘自《兄弟》)

例11天近正午,日头毒辣(摘自《红高粱家族》)

“到了中午的时候”和“天近正午”,是同一意思的不同表达。不仅是在“中午”和“正午”的词汇层面上,还能看到莫言在这一分句上的用词更少、音节更紧凑,这正是文言化的特征之一。类似的情况还出现在副词性语素(dg)上,这是一类修饰谓词性成分(形容词或动词)的语素,其功能与副词相同但不是独立的词汇,因此被命名为副词性语素。例如“狂叫”的“狂”、“尸体横陈”的“横”、“云团上俱镶着灼目金边”的“俱”等等。图6中,莫言在这一词类上表现出了显著性,虽然实际的使用频率不高、修饰的对象也主要是动词,但由于莫言和余华在动词的使用频率上无显著差异,可以认为在一些动词的使用上,前者附加了副词性语素而后者没有,这种以语素而非副词的形式进行修饰尽可能地减少了音节、增添了单位词汇的信息含量,表意更加饱满,有着文言化的倾向。

莫言用词的另一特点就是他的方言化、乡土化,例如他比余华使用了更多的后缀“儿”,以及相比余华的“那里”,莫言使用了更多的“那儿”,而儿化音是北方方言的典型特征——在本文开头就介绍过,莫言出生于山东省而余华出身在浙江,生活环境的差异在这一类词汇上体现得非常明显。

此外,“咋”、“俺”也是典型的方言词汇,而量词中的“袋子”、“股子”这样的双音节词看似是一种白话倾向、与上文所提到的文言化风格相反,但在体词后附加“子”的词汇也具有方言化特征[21],我们能从中读出人物言行中富含的乡土气息。词汇的对比详见表8。

表8 莫言的乡土化与余华的白话对比

需要说明的是,本章不以词类而以作者的特色来进行组织,是为了在更好地突出作者风格的同时不显凌乱。例如,形容词和动词等谓词具有强烈的情感,而以情感为标准来对名词进行分类并不合适,并且不同特征的名词——或其他体词,如代词、时间词等——也体现了作者的不同风格如文言化、方言化等,按词类分节可能导致行文的杂乱,因此组织成本文的模式。

6 颜色词

在检索两位作者的差异词汇时发现了很多颜色词,因此将其单列一节进行讨论。本文选择红、橙、黄、绿、青、蓝、紫、黑、白、灰、金、银、粉、棕共14种颜色进行层次聚类,发现颜色词的整体频率的确能够作为区分作者的特征量。

图8 语料库中颜色频率的层次聚类

两人的颜色词频率对比见图9。对每一个颜色词都进行构词情况分析,除了自身频率较少的棕色系、橙色系和粉色及构词种类较少可以忽略的紫、银等外,得到的数据见图10。

可以看到,不论是总频率还是构词种类,在每一个颜色词上均有莫言大于余华的情况。而在5.2节也提到,颜色词一类兼具了丰富的类符和强烈的情感两项特征。在此限于篇幅原因,仅以“蓝”为例分析两位作者的不同使用数量、构词和搭配情况,其中“蓝”的数量和构词见表9。

图9 余华、莫言的颜色词使用频率对比

图10 语料库的构词方式种类数量

表9 10部小说中“蓝”的构词情况

除“浅蓝”、“深蓝”、“蔚蓝”被余华使用外,其余“蓝”的词汇均仅有莫言使用,且“青蓝蓝”是莫言的自造词。

从莫言比余华更多地选用词汇“蓝”上,我们能看到莫言眼中比余华色彩更加丰富的世界。例如,同样是形容天空,余华只用“蓝”和“蔚蓝”,莫言却使用了“蓝蓝”“淡蓝”“湛蓝”“瓦蓝”“宝蓝”“灰蓝”“青蓝蓝”等。除了同样常用来形容天空,本就是纯粹蓝色的“淡蓝”“湛蓝”“瓦蓝”外,“蓝蓝”和“青蓝蓝”用重叠的形式加深了蓝的程度,“宝蓝”被用来描述夜晚的天空,“灰蓝”则代表着一头将死的驴子眼中的天空。因此,莫言比起余华更加强调天空的颜色——从所有颜色词中莫言更多的用例来看,可以说是更强调所有事物的颜色——并且会去区分不同天空的蓝,将小说中的世界描摹得更加细致,带给读者更加真实的体验。

莫言还喜欢赋予颜色特殊的情感。他常形容动物的眼睛为蓝色,如:

例12这是两只清澈如水的牛眼,黑蓝黑蓝的,在漆黑的瞳孔里,我看到了自己的倒影。(摘自《生死疲劳》)

显示出它们不同于人的纯真与无辜。更进一步,莫言还直接将无形的情绪形容为蓝色,这种描述在他的小说中多次出现,它代表着焦虑、愤怒、情欲、痛苦、恐惧种种激烈的情绪,不拘泥于一种。

例13上官来弟感到,有一道蓝色的电火,从脚踝骨那儿,飞蹿着爬升,并在瞬息间流遍了全身,她全身的皮肤都绷紧了,绷紧了,突然又堤坝决口般地松弛下来。(摘自《丰乳肥臀》)

当这些情绪在脑海中骤然爆发出来时,莫言赋予了它们幻觉般的蓝色,让它们出现在角色的心中,也出现在读者的眼前。其他未在文中列出的13种颜色,表现也与“蓝”类似。

莫言丰富的构词为读者展现出他小说世界中层次的丰富色彩,超常地表达出充沛的情感。同时,这些颜色不仅单独出现,还会一起组成丰富的意象群,尤其是对比色的聚集:

例14他想起那个翠绿的高粱地里的火红的中午。想起那匹陷在窗外泥土里的黑骡子,想起白净的肉体躺在黑眼的怀抱里。(摘自《红高粱家族》)

这些鲜明的颜色对比给人强烈的视觉冲击感,让整幅画面更加生动鲜活,不论是画面本身还是其背后蕴含的情绪,在给人带来超现实的魔幻体验的同时隐藏着作者渲染情绪的意图,给整个场景染上或悲壮或污浊或艳情或恐惧、种种不同的感觉。

7 结语

本文除了比较两位作者在段落、句子、分句和标点上的使用差异外,主要工作集中在词汇上。首先通过假设检验的方式对余华和莫言的词表进行分类,再通过寻找近义词对的方式比较两人的语言风格倾向,发现相比余华,莫言的用词表现出了文言化、方言化的特征,有更加丰富的词汇选择空间,更加充沛和细腻的情感表达和形象描摹,因此在文本中包含了更加丰富的信息量。另外,还选择颜色这一语义场作为对象,研究了两位作者不同构词和搭配的情况,发现了莫言在颜色词上更加多样的构词、更多的超常搭配和连用情况,及以此构筑的超现实文本世界和带给读者的强烈感官刺激。

因此,相比于莫言个人特色的浓烈,余华的文本风格则相对更加白话、冷静一些。一方面,正是这种冷静使两人同样具有的戏谑风格凸显出讽刺的感觉;另一方面,这也是文本风格学研究的重要特征:风格只有在对比中才能体现。因此,对本文所提方言化、文言化等特征,一方面很难穷尽地找到它们背后的代表词汇,另一方面其所描绘的作者风格还是相对的、必须要有其他文本对照才能确认。

最后,本文所使用的文本聚类属于无监督的学习方法,限于篇幅无法再运用有监督的文本分类进行风格预测工作——这将是我们下一步的研究方向。

猜你喜欢
词类余华语料库
一颗假糖的温暖
中文词类信息在副中央凹中的加工*
一颗假糖的温暖
平行语料库在翻译教学中的应用研究
《语料库翻译文体学》评介
用词类活用法扩充词汇量
大学英语词类教学研究及启示
从成语中学习词类活用
读与写(节选)
扩展阅读