数据驱动的文学传播研究*

2023-09-19 02:44刘海涛
浙江社会科学 2023年9期
关键词:海明威文学文本

□ 邵 斌 刘海涛

内容提要 在考察作家作品的传播及其影响力时,之前研究多采用定性描写。但在大数据时代,数据驱动的文学传播研究正逐渐成形。本文以美国作家海明威的文学声誉在20世纪的传播为例,提出数据驱动的文学传播研究新范式。研究发现:(1)在大数据时代,远读和文化组学等宏观分析视角在文学传播研究中的作用日益凸显;(2)数据驱动的文学传播研究模型既包含基于远读和文化组学的定量考察,也包含基于文本细读和文学社会学理论的定性分析;(3)作家作品的传播通常会受到非文学因素的操控,这些因素会在传播数据上得以体现。

一、引言

文学研究通常关注作家和作品本身,但文学价值必须依托文学传播才能实现。因此,文学传播研究是文学研究的必要组成部分。20世纪末,学者们就呼吁,文学史研究应该由作家—作品的二维研究转向作家—作品—传播—接受的四维研究,因为文学作品从产生到其价值的最终实现,必须经过创作—传播—接受三个阶段。①当下,作家作品在异域的传播已成为文学研究的一个热点。有学者指出,“20世纪中国古代文化经典域外传播研究书系”(19卷)系统性地呈现了中国文化和文学经典在英、美、德、法、俄、意、日、韩以及东欧和东南亚等国家地区的传播现状。②“外国文学经典的生成与传播研究书系”(8卷)细致地描述了古代、近代、现代和当代的外国文学作品在全球范围的传播及其经典化的历程。③上述研究分别探究了中国文学和外国文学经典在世界范围内的传播。

需指出的是,文学传播是一个复杂的过程,其中往往涉及诸多非文学因素。比如,文学传播受制于传播过程的“把关人”(gatekeeper)。 “把关人”指的是信息传播过程中的信息控制者。把关过程不仅涉及信息的取舍,还涉及为了迎合最终消费者而可能做出的信息改变和加工。在跨语言跨文化的文学传播中,“把关人”可能是译者、出版社或赞助机构等。译者和出版商倾向于翻译出版对目的语文化的读者具有积极意义的作品。或者说,符合目的语文化需求和时代精神的作品更可能 (甚至是才可能)被介绍。④“把关人”如果是更具权威性的国家机构,则它对文学传播的作用是决定性的。是友是敌的国际关系、国家之间的相对权力会影响乃至决定一个作家及其作品能否在目标国得到传播,也决定了作品的传播方式、路径及效果。

然而,以往对文学传播的广度研究以及影响传播的非文学因素的归纳,常常都是基于定性分析,这些因素在文学传播中如何起作用以及起多大作用则不得而知。因此,文学界有学者试图对文学传播进行相对客观的量化研究。比如,王兆鹏等学者对唐诗百首名篇的定量分析、⑤对宋词经典名篇的定量考察,⑥皆属此类。他们统计了历代选本的选词、评点和唱和情况,从而对唐宋诗人和词人的传播度和影响力做出相对客观的判断。上述研究在一定程度上避免了评价的主观性,但其数据来源主要局限于文学领域,不足以呈现作家及其作品在文学圈外的广泛传播。或者说,此类研究呈现的只是局部数据,而非大数据。一旦涉及大规模的异域传播,此类定量研究则无能为力。简言之,现有的定量分析未能体现大数据时代数据驱动的研究特点,故其所发现的传播规律也有较大的局限性。

在全球化和大数据时代,文学传播的空间已扩至全球范围,传播时间可以延伸至千百年,所涉文本可拓展至十万、百万种乃至更大量级时,我们该如何革新文学史和文学传播研究?显然,一字一句细读的传统方法对于大规模文本的把控已经力不从心。有鉴于此,借助数字人文领域近些年提出的“远读”(distant reading) 和文化组学(Culturomics)的视角对文学传播进行量化分析,从而把握宏观传播趋势,已是当下文学传播研究中不可或缺的范式。本文拟构建数据驱动的文学传播研究新范式,该新范式既包含基于大数据的定量式远读,也包含针对具体文学传播现象的细读,并以美国作家海明威的文学声誉在20世纪的传播作为个案,归纳出影响其传播的因素及规律,论证数据驱动的文学传播研究范式。

二、远读、文化组学和文学传播

数据驱动的文学传播研究属于 “数字文学研究”(digital literary studies)的下位范畴。数字文学研究基于大规模数据和计算机算法来考察文学文本,此类研究肇始于20世纪中期。1949年,意大利神父罗伯托·布萨(Roberto Busa)在IBM公司协助之下使用计算机处理阿奎那全集,生成字词索引,被视为“人文计算”(humanities computing)的开端。早期文学领域的人文计算研究通常聚焦于单一文学作品风格的计量研究,即计量文体学(stylometry),以及由风格差异导致的作者归属问题(authorship attribution)。比如,20世纪 50年代,瑞典汉学家高本汉(Bernhard Karlgren)便已运用统计学方法研究《红楼梦》的作者问题。⑦

自21世纪以来,随着电子化文本的激增,加之日益先进的检索和数据分析工具的开发,对海量的文学文本进行宏观分析的条件已经成熟。出版物、档案和语料库三者之间原本是从大到小的套娃关系,但数字技术改变了这种关系,它们成了等同关系:语料库可以覆盖全部档案,而档案可覆盖所有出版物。以往的文学史研究只能涉及一些经典的作家作品,数字时代的文学史则是“全部文学史”(total history of literature),可考察所有的作家作品。⑧如果说人文计算还只是用计算机工具处理人文领域的问题,当下研究所面对的则是大规模的数字化文本,计算方法已经不可或缺,因此人文计算已发展为数字人文 (digital humanities),在文学领域则是“数字文学研究”。

对全部文学史的考察显然不能仅依赖于传统意义上的细读,因为文学批评家穷其一生也只能阅读全部文学作品的冰山一角。在此背景下,斯坦福大学的弗兰克·莫莱蒂(Franco Moretti)提出以“远读”作为数字文学研究的方法。莫莱蒂指出,要研究建立在全部文学文本基础之上的世界文学,只有依靠远读模式。远读可以让读者聚焦“比文本小很多或大很多的单位:手法、主题、修辞,或文类和体系”。⑨当下使用远读视角更强调其阅读和处理大规模文本的能力。“远读”被定义为“通过计算和定量的方法分析海量文本来研究文学史中逐渐显现的和长期的模式”⑩,可谓一语中的。

作为远读的试验田,莫莱蒂和马修·乔克思(Matthew L.Jockers)创立了斯坦福文学实验室,尝试用自然科学研究的形式来开展文学研究,通过量化的方法对庞大的文学文本体系中的形式元素作出解释,其研究成果以“小册子”(pamphlet)的形式公开发布,目前已经发布了17篇。其成果有《文体:对7000个小说标题的反思》《2958本19世纪英国小说的计量文学史:语义群方法》《经典/档案:文学场中的大规模动态》等,从其名称就可见其远读的特点。

乔克思指出,文学的考察方法可与经济学相类比,阐释性的细读对应于微观经济学,量化式的远读对应于宏观经济学。他更倾向于将远读称为“宏观分析”(macroanalysis),前缀 macro(宏观)更强调了此种数据分析的系统性以及方法的定量性。[11]乔克思在其著作中还列举了一些必须借助宏观分析方能处理的文学问题,诸如:

(1)某一作品、作家或文学文体在更宏观的文学语境中的历史地位。

(2)在某一时期、某一地域或某一社群中的文学生产的盛衰起伏。

(3)在某一时期或跨时段、在某一地域内或某一社群中所用的文学模式及其词汇。

(4)影响文学文体或文体演化的文化和社会力量。

(5)文化、历史以及社会的联系,这些联系使得单个作者、作品和文体结合为(或不能结合为)一个聚集性的文学文化。

(6)文学主题的此消彼长。

(7)文坛精英的品味,这些品味是否与大众的品味一致。[12]

由此可见,远读的重要之处不仅仅在于提供了一种针对大规模文本的阅读方法,还在于它可以提出并回答许多新的文学问题,诸如文学和社会的互动、文学主题的演变、文学文体的更新等。乔克思指出,尤其是在文学史和文体研究方面,宏观分析比起对代表性作品进行细读的传统做法具有明显的优势。宏观的视角让我们对作品所处的宏大的文学历史语境有更全面的认识和把控,而不至于见木不见林。[13]

远读在计量文体学方面有了诸多应用,但在文学传播方面的运用还较少。斯坦福文学实验室对此有所涉及。比如,为了对18世纪和19世纪文学经典进行量化研究,研究者设计了两个可供量化的标准:人气(popularity)和声望(prestige)。人气计算依据的是作家的作品在19世纪英国的重印次数和译成法语和德语的次数,声望则是依据作家在“美国现代语言协会”(MLA)参考文献数据库中被提及的次数以及在《牛津国家人物大辞典》中词条的长度。根据上述数据,研究者绘制出一个18世纪到19世纪英国小说场域图。研究发现,文学经典的判别可从人气和声望 (或市场和学院接受度)这两个要素来考察。而且声望与人气并不对立,声望似乎就是从人气中发展出来的。通过把文学经典的概念分解过后,可以看出文学经典并不是一个具有自主性的概念,而是两股合力的结果。[14]

基于大规模文本所做的远读大体可归为两类:一是揭示文本内在结构特征,二是描述文本整体统计特征。前者的典型是莫莱蒂用图表、地图、树结构分别来展示历史小说的文体变化、文学作品的地理特征和侦探故事的类型结构,后者的典型是米歇尔等人对数百万册谷歌数字化图书做的词汇统计,即“文化组学”研究。

“文化组学”可视为远读或宏观分析的一个子范畴,它指的是通过大规模词汇数据的量化分析对人类文化行为及其历史发展进行计算。[15]其英文术语 Culturomics为 culture(文化)和 genomics(基因组学)两词的缩合。显然,文化组学通过与基因组学类比而来:正如大规模基因组的DNA序列能够揭示生命信息一样,大规模的词语数据也能揭示人类思想和文化的演变及其发展趋势。米歇尔等人的研究以“谷歌图书语料库”为基础,该语料库包含英、法、德、西、俄、汉和希伯来语共7种语言的500万册电子图书文本,总计达5000亿词。语料库收录的是16世纪以来出版的图书,可用于人类文化演变研究。米歇尔开发了“谷歌图书词频查看器”(Google Books N-gram Viewer),将语料库中的单词或词组每年的使用频率以曲线图形式在网络(https://books.google.com/ngrams/)上进行直观呈现。词频变化的背后是其所指称的人、事、物的演变,词频查看器因此可用以探索名物的兴衰沿革、人物或群体的影响力变化。

词频查看器可用于测算人的声誉。《牛津英语词典》对fame(声誉)一词的定义就是“被人广泛提及的情形”。社会学家也认为,声誉就是“所有听过某人名字的人数总和。”[16]换言之,名字被越多人提及,声誉就越大。词频查看器测算理念就是将人名在谷歌图书中出现的频率近似等同于其声誉。书籍是承载人类知识、观念和思维的最主要的载体。只要语料库足够大,具有代表性,我们就可以认为某个词汇在书籍中出现的频率,能够近似地反映这个词汇所代表的人或事所具有的文化影响力。[17]研究表明,谷歌图书中人名频率形成的曲线有某种共性。比如,人的声誉变化过程都包含初次成名、快速增长、达到巅峰以及缓慢衰落这四个阶段。[18]基于类似的理念,有学者对过去200年间4169位科学家的声誉进行了排序,建构了“科学名人堂”。[19]还有学者依据人物在维基百科全书中的数据,并参照谷歌网页排序算法对历史人物影响力进行排序。[20]上述研究对作家及作品的传播研究具有启示作用。既然人名在谷歌图书中的频率可近似等同于声誉,那么作家作品在谷歌图书中的出现频率就可近似等同于其传播力。因此,文化组学视角可用于考察作家作品的传播。

由上可知,在大数据时代,文学传播的研究范式已发生深刻的变革,呈现出数字人文的特点。文学传播所涉的广度和深度须借助远读方能考察。就某一著名作家作品在各国传播而言,涉及的文献数以千计,靠细读难免挂一漏万。如果研究话题扩大为某国文学在全球的传播,则所涉文本可能是十万百万级,此时不通过远读则无计可施。尤其是涉及历时的传播规律,仅凭研究者的直觉和内省难以窥其堂奥。但只要语料库足够大,则文学传播的定量计算便有可能,因为传播所留下的痕迹最终都会在数据中体现,借助大规模语料库和计算机工具就能观其大略,宏观考察其整体的传播规律。而且,在大数据时代,文学传播方式有了本质改变,从最早的手稿到印刷的出现是传播的一大飞跃,而从纸媒体到电子媒体的转变则是另一革命,诸如网络、电子邮件、微博、微信、推特、脸书、照片墙、抖音等新兴传播媒介的出现,深刻地改变着出版业,也使得文学传播学进入了一个新时代。因此,今后要考察一个作家作品的传播力,应当把它在社交媒体上的传播也纳入其中。

当然,远读和细读并不相互排斥,事实上它们回答的是不同的文学问题。细读可以辨析字里行间的含义和逻辑,从而深入理解文本,并对文本做出深刻诠释,而远读则是鸟瞰俯察,通过宏观分析揭示文本具体内容背后的抽象模式。文学传播研究也应当采取宏观分析和微观分析相结合的 “混合方法”。宏观分析并不是对传统研究模式的挑战或替代,而是一种补充。[21]就本文所聚焦的文学传播而言,词频查看器所呈现作家名的曲线变化,反映了作家在某一阶段、某一地域的声誉及其变化,这是远读的作用。但对其声誉变化背后的影响因素,诸如意识形态、审查制度等非文学因素的解读则是细读的结果。换言之,文学传播学应当把握细读和远读两种研究样式之间的转换:从单一的词到上百万卷的资料,可以在细读和远读之间自由腾挪,在诠释学之类的传统定性研究和从大量数据中提取统计学意义上的显著模式之间来回交替。[22]因此,基于远读和文化组学的定量考察与基于文本细读和文学社会学理论的定性分析相结合,可能是大数据时代数据驱动的文学传播研究新范式,如图1所示:

图1 数据驱动的文学传播研究模型

由图1可知,数据驱动的文学传播范式包含远读和细读两个考察视角。远读是望远镜式的观其大略,考察的是文学传播中的宏观问题,诸如长达数百年乃至上千年的传播历史和传播轨迹、在全球范围的传播广度、渗透至非文学各个领域的传播深度、传播中呈现出的模式(pattern)以及各种变化情况。其研究的内容往往不局限于单个文本,而是数以万计的海量文本,或者是某一文体或语类中的所有文本,或者是某个历史阶段的所有文本。另一方面,文学传播研究也离不开显微镜式的细读,尤其是涉及传播基本要素的分析,诸如作者、作品内容、传播媒介、传播者(比如译者和出版社)、读者以及传播效果(即传播对人的行为产生的有效结果)等。而且,文学不是在真空中传播的。文学传播,尤其是在异域的文学传播必然涉及诸多非文学因素的影响。社会制度、政治制度、意识形态、国家关系、文化制度的差异所导致的审查制度、出版制度、文艺政策、译介政策等,都会对文学传播产生重大影响。现实中的文学传播,其传播语境与传播诸要素之间水乳交融,很难截然分开。比如,意识形态和国家关系会影响到传播者,即译者和出版机构会根据国家政策对原文及其译介策略做出选择。同样,远读与细读也难以截然分开,我们通常会借助远读对文学传播做出整体呈现,但具体到某时某地的特殊传播现象,则需对文学作品的各种传播要素及其所处的传播语境进行细致的定性考察。本文对海明威的传播研究便遵循此范式,先是通过词频查看器考察其传播整体情况,然后聚焦传播过程中的某些特殊历史时段,之后再借助微观的定性分析,探究其传播出现变动的非文学因素。

三、海明威的异域传播

选择海明威作为个案进行分析,一是因为海明威是美国作家中最具世界影响力的作家,《太阳照常升起》一出版就为他赢得了国际声誉;[23]二是因为在20世纪,美欧关系、美苏关系以及中美关系无疑是最为重要且复杂的国际关系。有鉴于此,选择海明威作为个案考察文学传播具有其典型性。《海明威在欧洲的文学声誉》一书细致地描写了海明威在欧洲的传播和接受,涉及他在英国、法国、德国、意大利、挪威、瑞典、苏联和西班牙的传播情况。[24]但上述描写尚为定性分析,下文则结合远读和文化组学的定量分析对海明威传播做出更综合的考察。

首先,本文考察美国英语谷歌图书语料库中Ernest Hemingway(海明威)的频率变化,如图2所示。由图2可知,海明威的声誉在美国英语图书中的频率持续上升,其传播大体可分为三个阶段。第一阶段是20年代初至30年代中期的迅速成名期。这一时期出版的《太阳照常升起》(1926)和《永别了,武器》(1929)受到读者和评论家的好评。第二阶段是持续增长期,从30年代中期至70年代中期,这与《丧钟为谁而鸣》(1940)以及《老人与海》(1952)的广受好评有关,1954年荣获诺贝尔文学奖又使其声誉持续上升。第三阶段为70年代中期之后,是其声誉稳定的阶段。简言之,海明威自成名之后,其重要作品的出版都引起美国文坛和广大读者的关注和评论,故其名字频率在英语谷歌图书中持续上升。图2准确地呈现了一位广为文坛和读者关注的作家成名的经历。

图2 20世纪美国英语图书中的“海明威”频率曲线

海明威在异域的传播与其在本国的传播有所不同。在英国,海明威的声誉也呈上升趋势,大体也可分为三个阶段:先是20年代中期至40年代中期的快速上升期,之后是40年代中期至50年代中期的相对停滞期,再是之后的再次上升期。第一阶段的声誉快速上升主要归功于英国文学批评家的评论。比如,D.H.劳伦斯、弗吉尼亚·伍尔夫和艾略特这些名作家对海明威作品的赞扬和批评使得他在英国学界引起关注。此外,海明威获得英国广大读者的青睐也与当时的社会背景和读者的阅读兴趣有关。《永别了,武器》受到欢迎是因为当时英国读者爱读一战的回忆录或故事,而且其女主人公凯瑟琳是一位英国女护士,这使得英国读者倍感亲切。《丧钟为谁而鸣》也符合当时英国读者的心理期待。一者,英国人对西班牙的反法西斯战争具有高度的同情;二者,处于二战中的英国人读着战争爱情故事也更有共鸣。[25]第二阶段停滞期则与这一期间海明威没有上乘作品出版有关,1950年出版的《过河入林》甚至遭到英国评论界的恶评。最后阶段的快速上升则与《老人与海》获诺贝尔奖息息相关。总体而言,海明威在英国的传播主要与英国文学评论界对其作品的评价以及诺贝尔文学奖等文学内因素有关。

在西班牙,海明威的声誉也持续上升,仅在少数时段略有波动。海明威在西班牙受到欢迎是因其热爱西班牙的传统和文化,其不少作品以西班牙为背景展开。比如,《太阳照常升起》描绘了西班牙圣费尔明节的斗牛活动,《丧钟为谁而鸣》也以西班牙内战为背景。海明威的声誉在40年代中后期略有停滞,那是因为海明威在西班牙内战中站在人民一边,反对佛朗哥和法西斯主义,因此其作品的评论在该时期遭到审查和压制。

在德国,海明威的传播也受制于审查和压制。海明威在德语里首次登场是在20年代中期,之后其声誉缓慢增长,但自30年代中期开始其声誉反而逐渐下降直至40年代初。究其原因,这一阶段是希特勒纳粹统治时期,而海明威具有反法西斯的进步倾向,因此其思想与纳粹德国的政治意识形态发生冲突,其作品受到了纳粹政府的审查和压制。海明威的反法西斯行为表现有三:一是他在1937年亲赴西班牙内战现场,做了大量战地报导,支持西班牙进步力量,反对佛朗哥的军事政变及其法西斯统治;二是他在1937年纽约举行的美国作家代表大会上作了《法西斯主义是个骗局》的报告;三是他在1938年出版《第五纵队》一剧,直接表达其反法西斯主义的政治立场。[26]事实上,30年代中期德国纳粹政府上台时,便关停了经常出版海明威作品的罗沃尔特出版社(Rowohlt),导致其在德语世界影响力下降,这种情况一直持续到二战将近结束。

在苏联,海明威的传播更是受到意识形态的影响。30年代,海明威在苏联大获流行,但40年代初至50年代初受到冷遇,这都与苏联在不同历史阶段的国家文艺政策息息相关。30年代的苏联在政治上贯彻“统一战线”政策,在文艺界推行社会主义现实主义文艺理论。海明威的反法西斯立场和他现实主义的写作风格使他成为最受苏联人欢迎的外国作家之一。然而,1940年却成了转折点,这与《丧钟为谁而鸣》的出版有关。该书对共产国际人物进行了公开指责,对法西斯军官却给予了人道主义描写。苏联文艺评论家认为该书象征着海明威进步思想的终结。之后,苏联不再出版海明威的作品。这种情况一直持续到1953年,苏联迎来了“解冻”时期,之后海明威在苏联的传播出现了迅速复苏和持续关注。纵观海明威在俄语中的声誉变化可知,其传播情况有别于其在本土的传播,而这多取决于苏联的文艺政策以及美苏之间的国际关系。美国文学史家指出,苏联对美国文学的翻译选择有别于其他欧洲国家对美国文学的翻译选择,其背后正是国家层面的操控。[27]

在中国,海明威的传播也历经波折,尤其体现在建国后至70年代初期,如图3所示。大体而言,在20世纪后半期,海明威在中国的传播可分为四个阶段,分别为“不予关注期”、“传播增长期”、“重归沉寂期”和“传播高潮期”。

图3 20世纪汉语图书中的“海明威”频率曲线

首先是50年代初期的“不予关注期”。新中国成立时,美国对中国采取封锁政策,中美两国属于不同的意识形态阵营,鉴于海明威的美国作家身份,中国学界对其不予关注。而且,当时我国介绍外国文学作品,主要看苏联有没有先介绍,而这一时期海明威在苏联处于封禁状态。紧接着是50年代中期至60年代中期的“传播增长期”。此时,中国对海明威有所关注,对其研究已不再是禁区。这与中国当时提出“百花齐放,百家争鸣”的双百方针有关。同时,1953年苏联迎来了文艺解冻,苏联对海明威的介绍增多,而当时中苏为盟友关系,苏联的文艺政策对中国造成影响。因此,这一阶段国内对海明威的宣传和报道增多。1957年,新文艺出版社再版了由林疑今翻译的《永别了,武器》,还出版了由海观翻译的《老人与海》。随后,60年代中期至70年代中期则是“重归沉寂期”。其原因是60年代初中苏关系恶化,这一阶段中国对西方文学的译介和传播与苏联形成逆向对应关系:海明威作品在当时成为苏联学生的必读书目,在中国却备受冷落。由以上分析可知,海明威在中国跌宕起伏的命运同中美以及中苏之间国际关系的变化密切相关。70年代中期之后是“传播高潮期”,尤其是1978年改革开放之后。其传播的扩大无疑与中美以及中苏关系正常化有很大关系。由此可知,海明威在中国的传播受到意识形态、政治制度、中美关系乃至中苏关系的影响。

海明威在各国的传播情况可用表1加以总结。由表1可知,在20世纪,海明威在各国的传播轨迹有所不同。他在美国本土是正常传播,符合一位作家的成名规律。但在英国和西班牙则有若干相对停滞的时段,这主要与其作品内容、传播者(如评论家)、读者等内部传播因素有关。海明威在德国、苏联和中国的传播则更多与传播的社会语境相关。比如由意识形态、政治模式、社会制度、国家关系带来的审查制度和文艺政策,导致了传播出现或大或小、或长或短的波动。表1中的“传播轨迹及变异”需通过远读计算而得,而“传播的影响因素”是通过细读分析而得,远读所获得信息是细读的基础,细读是远读数据的深化。因此,表1呈现了远读和细读相结合的数据驱动的文学传播研究新范式。

表1 海明威在各国的传播轨迹及影响因素

由上可知,数据驱动的文学传播研究离不开细读,包括对文本和对社会语境的定性分析。作家作品的传播是文学社会性的组成部分。文学社会学家、法兰克福学派的洛文塔尔将文学 “传播力场”理解成一个处于不断变化之中的各种“力”之间既冲突又融合的场域。洛文塔尔认为,文学传播力场至少应该包含两个层面活动要素的分析:一是把文学传播活动视为一个独立、完整的系统进行研究,这一点体现在对文学传播的基本要素(如传播者、信息、媒介、接受者、传播效果)的分析上;二是将文学传播系统置于社会系统中进行考察,这一点体现在对文学传播的社会语境,即文化制度、社会制度以及政治模式的批判性分析上。[28]纵观海明威在各国的传播可以发现,海明威在美国本土、英国和西班牙的传播更多的是涉及传播的内部因素,比如译者、出版机构、书商、评论家、读者等各种“力”在作品传播中所起的作用,尤其是作品内容与评论家和读者的心理期待是否一致。但海明威在德国、苏联和中国的传播则更多受到非文学因素的干扰,更多体现了传播力场的外圈内容,即意识形态对立下的政治制度、社会制度和文化制度的差异,这导致海明威在德语、俄语和汉语中某些时期出现不合常理的传播。可以说,海明威在异域的传播就像是一面镜子,折射出20世纪国与国之间的复杂关系。文学传播的背后是复杂的非文学现象,传播的最终效果是各方的合力结果。

四、结语

本文构建了数据驱动的文学传播研究模型,并以20世纪海明威的全球传播作为个案加以论证,本文结论如下。

第一,在大数据时代,大规模传播数据触手可及,当下的文学传播研究大有数据驱动的特点。数字化文本累积的海量数据已经成了细读的 “不能承受之重”。因此,远读和文化组学等宏观分析视角在文学传播研究中不可或缺。正是借助各种语料库数据、文本分析工具和算法,文学传播的轨迹才得以呈现,传播模式才得以揭示。定量的宏观分析提供了细读的着力点:宏观分析中呈现的不同寻常的传播变异和模式往往是细读所要解决的问题。更重要的是,诸多宏观的文学传播问题,尤其是跨越较长时间和较大地域的传播,必须借助于远读才能提出恰当的问题,并给予有力的回答。

第二,数据驱动的文学传播研究既包含基于远读和文化组学的定量考察,也包含基于文本细读和文学社会学理论的定性分析。细读自有其重要之处。海量文学传播数据所呈现的一般规律和模式仍需根据传播学理论加以解读,研究者需要对传播要素和语境进行细致考察才能做出一个合理的解释。因此,大数据时代文学传播研究新范式应是远读和细读的结合体。

第三,作家及作品的传播,尤其是在异域的传播,通常会受到“传播力场”的外圈,即非文学因素传播语境的操控,比如传播国家当时的政治制度、社会制度、意识形态、文化制度、国家关系、国际关系等因素,这些传播语境的重要性不亚于作品本身、传播媒介和译者等传播的基本要素。由此可见,文学的“传播力场”是一个处于不断变化之中的各种“力”之间既冲突又融合的复杂系统,需综合考虑各种影响因素才能做出描述。这些因素所导致的传播结果会在传播数据上得到体现。因此,数据驱动的文学传播研究需要在远读和细读之间不断转换、交替进行,只有这样才能更精准地把握文学传播的规律。

注释:

①王兆鹏:《传播与接受:文学史研究的另两个维度》,《江海学刊》1998年第3期。

②张西平:《中国古代文化经典域外传播研究的一个尝试》,《国际汉学》2015年第4期。

③吴笛主编:《外国文学经典生成与传播研究》(第1—8卷),北京大学出版社2019年版。

④ Lawrence Venuti,The Scandals of Translation:Towards an Ethics of Difference, London:Routledge,1998,p.67~68.

⑤王兆鹏、孙凯云:《寻找经典——唐诗百首名篇的定量分析》,《文学遗产》2008年第2期。

⑥王兆鹏、郁玉英:《宋词经典名篇的定量考察》,《文学评论》2008年第6期。

⑦ Bernhard Karlgren, “New Excursions in Chinese Grammar,” Bulletin of the Museum of Far Eastern Antiquities,No.24,1952,pp.51~80.

⑧[14]Mark Algee-Hewitt et al.,“Canon/Archive.Largescale Dynamics in the Literary Field,” in Pamphlets of the Stanford Literary Lab Pamphlet 11,2016, https://litlab.stanford.edu/LiteraryLabPamphlet11.pdf,June 1st,2022.

⑨ Franco Moretti, “Conjectures on World Literature,” New Left Review,No.1,2000,pp.54~68.

⑩Chad Wellmon,“Sacred Reading:From Augustine to the Digital Humanists,” The Hedgehog Review,Vol.17,No.3,2015,pp.70~84.

[11] [12] [13] [21] Matthew L.Jockers,Macroanalysis:Digital Methods and Literary History,Urbana,Chicago,Springfield:University of Illinois Press,2013,p.24,p.26,p.27,p.28,p.171.

[15]Jean-Baptiste Michel et al.,“Quantitative Analysis of Culture Using Millions of Digitized Books,” Science,Vol.331,No.6014,2011,pp.176~182.

[16]Elizabeth Currid-Halkett,Starstruck:The Business of Celebrity,New York:Faber and Faber,2010,p.66.

[17]陈云松:《大数据中的百年社会学——基于百万书籍的文化影响力研究》,《社会学研究》2015年第1期。

[18] Erez Aiden&Jean-Baptiste Michel,Uncharted:Big Data as a Lens on Human Culture,New York:Riverhead Books,2013.

[19] John Bohannon, “The Science Hall of Fame,” Science,Vol.331,No.6014,2011,p.143.

[20]Steven Skiena&Charles Ward,Who’s Bigger:Where Historical Figures Really Rank,Cambridge:Cambridge University Press,2013.

[22]Spencer Stewart等:《比较文学研究与数字基础设施:以建设中的“民国时期期刊语料库(1918-1949),基于PhiloLogic4”为例的探索》,《数字人文》2020年第1期。

[23] [27] Robert E.Spiller et al.,Literary History of the United States,Vol.II,New York:The Macmillan Company,1948,p.1264,p.1384.

[24]Roger Asselineau&Heinrich Straumann,The Literary Reputation of Hemingway in Europe,New York:New York University Press,1965,p.31.

[25]杨仁敬:《海明威学术史研究》,译林出版社2014年版,第98~100页。

[26]杨仁敬:《美国文学批评八十年》,上海外语教育出版社2012年版,第64页。

[28]甘锋:《洛文塔尔文学传播理论研究》,东南大学出版社2014年版,第23~24页。

猜你喜欢
海明威文学文本
我们需要文学
海明威名言
海明威:《雨中的猫》
在808DA上文本显示的改善
“太虚幻境”的文学溯源
基于doc2vec和TF-IDF的相似文本识别
《老人与海》与海明威
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻
海明威的那些女人们
如何快速走进文本