卞慧君
(黑龙江大学,黑龙江哈尔滨150080)
契诃夫作为世界知名的三大短篇小说家之一,国内现有关于契诃夫创作的研究数量庞杂,研究对象多集中于其短篇小说及戏剧创作。关于契诃夫的短篇小说研究可以分为以下三类:一是关于人物形象的研究,以社会变革背景下人的异化为切入,集中对其作品中的“小人物”、知识分子及女性形象开展研究,一方面通过分析作品人物的心理、语言以及生活处境从而深刻揭露俄罗斯民族性格,分析对造成“小人物”悲惨生活处境的社会原因以及契诃夫对社会底层人民“哀其不幸、怒其不争、恨其不为”的态度和立场;另一方面重点关注其笔下的女性人物形象,通过分析契诃夫作品对女性人物性格及行为的塑造,结合女性主义理论分析男权话语模式对于女性形象的建构,探析契诃夫对于新旧世界之交女性出路的思考,如基于《跳来跳去的女人》《挂在脖子上的安娜》进行的人物形象分析等;二是从比较文学的角度入手,一方面通过契诃夫与世界另两位知名短篇小说家莫泊桑、欧·亨利进行对比,从而分析三者在语言风格、创作个性及风格等方面的特征,通过对比发现契诃夫是以现实主义创作为基础叙写“小人物”的悲惨生活,着眼于日常生活以朴实平淡的笔调实现对深刻意涵的揭示;另一方面是将契诃夫与我国著名作家鲁迅及剧作家曹禺进行对比,如通过对社会变革时期知识分子形象的塑造,展现出对不同历史背景下作家对社会问题的分析,以及研究契诃夫对曹禺在戏剧创作方面的影响及差异性分析,如对话、叙事者选取以及女性形象塑造等方面;三是重点针对小说文本艺术特色展开研究,如分析作品的修辞特色、叙事特征等。但目前基于数字手段对契诃夫作品乃至于俄罗斯文学创作进行的研究都为数不多,现有通过语料库对契诃夫作品的研究尚局限于针对其作品译本的对比分析,或基于其作品原文及译文进行的俄汉文学语料库设计创建。
正如并非所有简洁的作品都能够成为精品,也并非所有文学创作都能给读者以戏剧舞台效果。本文以AntConc检索工具作为辅助,以契诃夫的经典短篇小说《变色龙》《小公务员之死》《套中人》为基本语料,对作品的语言词汇展开数据分析统计,基于理性实证研究分析契诃夫短篇小说所呈现出的艺术特色,以及其作品何以能够展现出独特的戏剧舞台效果,并基于数据统计归纳总结契诃夫短篇小说创作的语言词汇、句型句式特征。
“数字人文,也称人文计算(Humanities Computing 或Computing in the Humanities),它是一个将现代计算机和网络技术深入应用于传统的人文研究与教学的新型跨学科研究领域,它的产生与发展得益于数字技术的进步及其在科学领域的普及应用。”普遍认为数字人文广义上是指将人文研究与信息技术相融合,基于大量的数字化、电子化文本文献,以各类信息技术软件,如SPSS、AntConc 等为辅助实现对人文学科的理性研究分析,以及信息的视觉化、图像化效果直观呈现。“20 世纪90 年代初期,人文计算作为一个独立的交叉学科逐渐成形。1999 年,Willard McCarty 讨论了人文计算作为一个独立的学科与其它学科的关系,以及如何在制度和学术层面来为人文计算活动提供切实的保障和支撑,90 年代后期,人文学者开始越来越频繁和深入地使用各种新型的数字技术处理人文资料。”
通过数字手段开展文学研究主要包括以下四个方面,一是通过文献数据库,结合特定的社会背景、历史环境特征开展关于作家生平或作品创作背景考证的研究;二是通过数据库对文献开展定性及定量的双重研究,从而深化对文学思潮、流派或文学思想史的谱系研究;三是开展文学文体学、修辞学、语言学等研究,基于数字化文献的可统计、可测量等特性,通过软件辅助对文学文本语言、词汇、句篇等方面进行统计分析,实现对作品创作的叙事特点、创作风格、人物情节功能等方面的研究;四是基于数据库、语料库开展比较文学或文学翻译研究,针对同一作品的历时历代或不同语种的译本进行比较分析,揭露在不同历史时期社会背景下同一作品文学译作在词汇使用等方面的变化,以及文学接受审美批评的变化等。
《变色龙》《小公务员之死》《套中人》作为契诃夫家喻户晓的三个经典短篇,具有研究的代表性,本文通过AntConc 检索工具对小说文本进行分析研究,重点使用concordance、concordance plot、file view 以及word list 等功能实现对文本的统计分析。其中,word list 功能可实现对文本中词汇的使用频率进行统计并排行,在文学文本研究中,通过词汇使用频率排序可通过出现的高频词初步判断作品的主人公、重点相关对象等,从而判断文本主体及主要人物形象。在性别研究方面,可以根据男女主人公及人称代词的出现频率等客观数据分析作者对人物形象的塑造,以基于理性主义的数据为实证深入分析作品内涵等。结合concordance 功能锁定所需查询的高频词在文本中出现的具体位置,根据高频词的词语搭配或句式使用,判断作者的创作风格等。并通过concordance plot 以直观的方式展示所需查询词语在文本中出现的大致位置及密度分布,可据此初步判断文本中各人物形象集中出现的大致位置以及情节变化,判断不同叙事阶段主人公或叙事角度的转换,从而推测文本的叙事特征等,如叙述主体、叙事角度、叙事顺序等。
AntConc 具有统计研究文本的形符(token)与类符(type)的功能,形符指文本中的词汇总数,类符则指不重复计算的的形符数,即文本中重复出现的形符仅算作一个类符。通过类符/形符比可计算得出形次比(Type token ratio, TTR),形次比是衡量文本词汇密度的常用方法,可辅助说明文本的词汇难度及词汇多样性程度。
通过数据统计得知,契诃夫的三个短篇小说形符数均值为1900,其中《变色龙》《小公务员之死》词汇数均小于1000,《套中人》为4000 多词,从总词数量上看,篇幅较短。通过计算,在未进行词形归化条件下,得出三篇作品的形次比都位于0.5 左右。由此可推断得出,一是契诃夫短篇小说的创作在词汇多样性方面属于中等偏下水平,即并不追求用词的复杂性、独特性,从而印证了先有研究中关于契诃夫创作语言以平实朴素为主的结论,亦如高尔基对契诃夫语言的评论:他的语言是以一种非常漂亮但却非常简单的形式表现出来,而这种简单的形式更加深了其话语的意义。二是形次比低,即说明词汇类符占比低、词汇重复度高;三是契诃夫三个短篇小说创作的平均词长为6.8,根据齐普夫定律可推断词长越短,用频越高;反之,词长越长,用频越低。
因此,从词汇多样性的角度可以分析得出契诃夫的短篇小说创作词汇多样性较低、用词重复度高、语言平实朴素的特征,据此推测得出作品可读性强,受众群体广泛。
通过AntConc 检索工具的word list 功能对三篇作品词汇用频进行统计,使用排名前十的单词按照使用频率排列如下:
通过上表进行分析发现,三篇作品中排名前十的词汇具有一定共性,一是都含有前置词、简单句连词、人称代词和否定词,且以上四类词语在三个作品排名前十单词中的占比为《变色龙》——90%,《小公务员之死》——70%,《套中人》——80%;二是排名位居首位的都是连词и,该特征与俄语国家语料库中公布的俄语高频词列表一致。
通过词频排序高的实词判断,可以确定作品中的主要角色、人物形象或叙述对象。如通过三篇作品中位于前十的专有名词(人名)可以判断出作品的主人公,如《变色龙》的主人公是奥楚美洛夫,即作品名称“变色龙”的代表,《小公务员之死》的主人公是小公务员切尔维亚科夫和上校,《套中人》在排名前十的单词中未出现人名,但综合看词频排序列表中排名第二、三、四的实词分别是“别里科夫”和“瓦莲卡”“柯瓦连科”,分别位于25、38、39 位,第一个实词是动词быть,此前的23 个单词均为前置词、代词以及连词等。根据词频排序《变色龙》中排名位于第三、第四的实词分别是手指和狗,因此可以推断故事情节将主要围绕这三者展开,其中排名第二的是благородие,根据concordance可知文中搭配均为ваше благородие 是指旧俄时期对十四至十九级文武官员及其夫人等的尊称。《小公务员之死》中除了切尔维亚科夫和上校,出现最多的是动词думать 的多种变位形式,可以推断作品中关于心理活动的书写内容较多。结合concordance plot 可以直观看到在《变色龙》及《小公务员之死》中主人公奥楚美洛夫以及切尔维亚科夫和上校在文本中的分布位置及密度,如图所示以上两部作品中的主人公都是贯穿作品始终的人物。由此可以判断,契诃夫短篇小说作品中人物数量较少且故事情节集中。
通过词频统计还可以分析出作品的句型特征。首先,通过word list 观察到契诃夫作品中大量使用前置词和简单句,如《变色龙》中排名前十的词语中有4 个是前置词,分别是 в、на、у、с, 如 в новой шинели、в руке、в ситцевой крахмальной рубахе;На площади、на свет、На полупьяном лице 等;《小公务员之死》中排名前十的单词中有2 个前置词,分别是в、на,如В один прекрасный вечер、В животе у Червякова;《套中人》——3 个,分别是в、на、с。如в последние десять лет、в очень хорошую погоду、На самом краю села、на этом свете 等。俄语中的前置词是虚词的一种,无形态变化,用以表示名词、代词等与句中其他词之间的语法联系及意义关系。俄语中的前置词有时可以代替动词或从句使用,如с 常表示带着、拿着,代替动词взять,或表原因的前置词可以代替原因从句。契诃夫在作品中大量使用前置词,同样具有实现文本简化的作用,一反陀思妥耶夫斯基和托尔斯泰鸿篇巨著的创作传统,避免使用复杂句造成作品冗杂,从而实现作品创作语言上的简洁性特征。
其次,再通过对三篇作品中的并列连接词和主从连接词进行统计,直接判断契诃夫短篇小说创作中复杂句及简单句的使用情况。根据word list 可知三篇作品中词频排在首位的都是联合连接词и,通过concordance 进行文本判断,发现и 在作品中主要发挥句间并列及句中并列的作用且句中并列居多,多用于表示句中动词或名词的并列。word list 中作为主从连接词的单词排名均较为靠后、使用数量较少,且三篇作品的叙事具有对话的共性特征。《变色龙》《小公务员之死》几乎以对话贯穿全文,亚里士多德在《诗学》中提到:“埃斯库罗斯最早把演员由一名增至两名,并削减了歌队的合唱,从而使话语成为戏剧的骨干成分。”可见,戏剧得以发展的基础正是对话,正是由此使得契诃夫的短篇小说创作具有一种独特的戏剧舞台效果。
《变色龙》词频排序前十的单词中不含有主从连接词,且鉴于《变色龙》文本中多为对话体,日常对话语言中多使用具有口语特征的短句、简单句,从句及复合句使用较少;《小公务员之死》排名前十的单词中有一个说明连接词即что,结合文本分析发现主要是由что 引导的说明从属句,说明主句中表示言语、思维的词语,如увидеть、узнать、подумать、объяснять 等;《套中人》排名前十的单词中含有连接词что,共计出现70 余次,但其中由统计显示主从连接词что 引导并非全部为从句,其中还包括部分感叹句及一般疑问句等,因此实际复合从句数量远低于70 句。
综合词频统计、分布及文体研究得知,契诃夫在短篇创作具有以下特点,一是大量使用前置词实现文本的简化;二是多使用具有日常口语性质的短句、简单句,复合句使用较少;三是作品多以对话形式展开,并由此创造一种独特的戏剧舞台效果。
基于数据统计方法进行文学文本研究是一种把定量统计与定性分析相结合的方法,旨在对文学文本的语言特征进行定量的统计,以统计数据为辅助,在文学和文化层面进行定性的分析和归纳。基于数据统计的方法研究有助于克服传统印象式点评方法的主观臆断,弥补由于通过纯粹主观叙述以及哲学思辨方法不足导致的客观性不强的问题。通过对契诃夫经典短篇小说《变色龙》《小公务员之死》《套中人》的词汇进行初步数据统计分析,总结发现契诃夫短篇小说创作在词汇及句型使用方面具有以下特征:一是其作品创作的词汇多样性较低、重复度高、语言平实朴素,易于理解、受众广泛;二是作品通过对话、简单句及广泛使用前置词实现作品的简化,并营造一种独特的戏剧舞台效果;三是作品的人物数量少、情节集中。
充分结合各类信息技术,对于文学研究在词汇数据分析统计方面具有重要意义,有助于实现文学的跨学科创新,通过当代信息技术能够突破原有的文学研究范式,不断利用数据化文献统计补充、完善、发展文学研究的方法,从而实现文学研究范式的革新与突破。