文本的距离：数字人文发展中的文学

2021-01-18 02:11陈永国

东疆学刊 2021年3期

陈永国

[关键词] 数字人文;算法分析;距离阅读

[中图分类号] ID-03 [文献标识码] A [文章编号] 1002-2007（2021）03-0001-08

数字人文是计算机技术应用于人文研究的前沿学科。之所以称其为学科，是因为以往的“数据化”时代已经接近尾声，即将为日益渗透到文化、制度和日常生活中的“计算化”所取代。按照世界经济论坛（World Economic Forum）近日发表的报告，到2025年，“机器人革命”将在全球创造9700万个工作岗位，目前工作任务已有三分之一由机器完成，到2025年将有半数以上由机器处理。这意味着数字作为知识或实践的一种形式已经广为社会所接受，而计算思维和计算技能已经成为信息社会一个知识广博的公民所不可或缺的基本教育内容。[1]（21）在数字媒介文化无处不在的时代，计算将成为一种必备的生存技能，就如同人们赖以进行各种日常交际的语言一样，必将作为一个学科而存在。

所谓数字人文就是计算思维、计算技术或计算方法在人文学科中的应用。其最早的关注点是数字工具的开发和档案数据库的建设，因其技术源自于人文学科之外，也因此而构成了对人文学科自身的一种威胁。但随着计算技术和计算机应用的普及，人文学者已经逐渐从人文素材的工具化和机械化处理（即对这些素材的整理、访问和传播）而转向如何在人文学科内部利用计算工具和技术解决实践问题，即如何处理电脑与人脑、技术与文化、机器与人的关系问题。迄今为止，人文学者对数字技术的参与依然停留在人文素材的工具化和自动处理的层面，但这显然不是其发展的最终结果。著名文学理论家斯坦利·费什认为，数字人文“属于神学的范畴，承诺可以在知识离散、不完整而且固定的背景下将我们从受时间限制的线性媒介中解放出来”。[1]（25）他所说的神当然不是基督教的上帝，其神学自然也不是对上帝的研究，而是说数字人文已经像宗教信仰一样渗透乃至指导着人们的社会生活，关系到行事行为、思维方式以及价值观的形成，其最终结果是把人类从传统的单一线性思维中解放出来，而进入一个既微观又宏观地看待世界的完整视野（如数字人文堆栈），打破以往在一定时间之内通过纸质空间获取知识的方式，通过数字技术显示通常“难以被人眼或大脑察觉和理解的东西”，[1]（25）也即把不可视性变为可视性，把过细的学科（或知识）分类统合起来，实现合理的跨越和交叉，以适合未来教育中“新文科”和交叉学科的发展。

一、从赛博空间到虚实相融

与近来人们侈谈的“内卷”（involution）相反，数字人文是一种外翻或反转（eversion），即通过外泄而悄然溜进物质世界，最终占据整个物质世界。这个概念源自美国当代科幻作家威廉·吉布森（William Gibson）。他在1984年出版的《神经漫游者》（Neuromancer）中生造了“赛博空间（cyberspace）”一词。吉布森随即于1986年发表《读数归零》（Count Zero），1988年发表《蒙娜丽莎加速挡》（Mona Lisa Overdrive），从而把赛博空间、因特网以及相关的虚拟现实（virtualreality）等术语和网络次文化推向社会，逐渐流行起来，并在学术界掀起了与“赛博空间”相关的研究高潮。①2007年，他发表《幽灵之国》（SpookCountry），故事中的一个人物宣布：其实从来没有什么赛博空间，有的只是理解文化与网络技术之间关系的一条途径，于是，出现了反转，即由一个游离于世界之外的赛博世界变成了作为世界之组成部分的领域（from a world apart to a partof the world），从一个超验的虚拟空间变成了我们每天都漫游于其间的一个无处不在的数据网格。《幽灵之国》中的艺术家把这一历史性反转追溯到2000年5月1日，即美国政府把原来只供军队使用的GPS卫星数据向大众公开的时刻。接着，在2005年6月，谷歌地图以及由此而开放的各种程序接口（API）使得自动漫游系统大大改进。在之后的十年里，各种移动设备、自动漫游器、传感器和处理器层出不穷，使得艺术家和黑客在其亚文化与主流文化之间开展了一系列数字或计算活动，将无线射频识别芯片和近场通讯芯片等技术广泛应用于日常生活中的物体，最终导致了普适计算（Ubicomp）和物联网（Internet of Things）的出现。用户无处不能或到处都能使用这些便利，这些便利给人的是一种能动的混合经验，而流动性是其最重要的特征。简单地说，这种混合经验就发生在计算数据不断接触物理现实的各个界面（接口）上。

科幻小说中的这种描写并不是纯虚构的。几乎在吉布森出版《幽灵之国》的同时，不同领域的媒介研究专家已经撰文论述控制论（Cybernetics）发展的最新阶段，即从虚拟空间向混合空间的转变，后者指的是虚拟空间与物理空间在天衣无缝的流动中的混合。亚当·格林菲尔德在《处处计算》（Everyware）中用这个新词指无处不在的充斥于每一个领域内的计算（computing）：计算创造了一个前所未有的信息空间，致使仅在几年前还是虚拟空间的各种算法已经成为了现实。内森·儒尔金森（Nathan Jurgensen）认为，数字世界與物理世界相分离的说法已是谬误，二者已经在无限增大的世界上交织在一起了。无独有偶，正是在“赛博空间”发生反转之时，数字人文开始进入公众视野。2004年，一本以“数字人文”为题的文集出版。2005年，著名比较文学研究者弗朗哥·莫莱蒂出版了影响巨大的《表、图、树：文学史的抽象模块》（ Graphs， Maps， Trees：Abstract Models for a Literary History）。同年，数字人文组织联盟创立（ADHO）;2007年，《数字人文季刊》（DHQ）创刊。翌年，马修·柯申鲍姆（Matthew Kirschenbaum）发表《机制：新媒体与取证想象》（Mechanisms： New Media and ForensicImagination）。至此，数字人文完成了从技术革命到科幻小说、再从科幻小说到数字理论的一个发展周期。许多与此相似的过渡性数字人文实践和实验，包括数字取证（digital forensics）、临界代码研究（critical code studies）、平台研究（platformstudies）、游戏研究（game studies）、语言数据、大型语料库、数据可视化和“距离阅读”（distantreading）等，都是数字人文群体对更大的或已经成为现实的文化倾向的一种反应，也就是对数字和数字媒介以更加世俗的方式融入一个多层面的混合经验之中，使得数字的虚拟现实更加直接地进入了物质世界，于是在旧的“数字”“人文”观念与新的混合现实和经验之间打开了缺口，前者是物理的、高雅的、固定不变的档案，后者是虚拟的、世俗的、流动变化的网络，它们通过不间断的覆盖（overlay）使艺术品像物一样在多层面的接口上相遇，构成了一种序列外围接口（spime：serial peripheral interfaces）。数字人文的使命就是要在这样一个关键的甚至“不亚于第二次文艺复兴”[2]（76）的历史变局中自觉地跟上发展形势，理解进而建构面向未来的机制转型。

二、从人文计算到数字人文

吉布森的科幻小说所描写的是数字人文得以发生的虚拟现实与现实语境的结合，但真正的数字人文其实来得更早，即从人文计算（humanitiescomputing）开始。一般认为，作为数字人文之基础的“人文计算”开始于1949年意大利耶稣会神父罗伯托·布萨提出并付诸实施的一个想法，即要为圣托马斯·阿奎那的《神学大全》及其相关著作中的古拉丁语词建立索引，总共1100万个。但他觉得只有在机器的帮助下才能完成这个设想，然后便去美国找IBM的托马斯·J.瓦森。有了瓦森的帮助，他开始把完整的文本变成打孔卡片（即在文本中选出一行文字，打在卡片上，再用机器复制与字数同样多的卡片，加入总堆栈中，并对堆栈进行排序），建立了词语索引，第一卷于1974年发表。布萨不满足于以字母顺序或简单词形排列，而要按词的曲折变化或异形排列（a lemmatized concordance）。他的团队编制了一个电脑软件，对1100万个单词进行了半自动化处理，完成了56卷本的《托马斯·阿奎那词汇索引》。1992年，一个阿奎那词汇索引光盘（CD-Rom）面世，配有拉丁语、英语和意大利语的用户指南。1998年，布萨本人因首次在人文领域应用计算机技术而接受布萨杰出成就奖时，曾设想用万维网（theWorld Wide Web）传播多媒体学术研究素材同时进行复杂分析的可能性。布萨的阿奎那索引对后续的人文计算发展产生了巨大影响，他的视野和想象力甚至超越了伴随因特网长大的一代人。[3]（4）

所谓“人文计算”，指的是利用计算、统计和量化等方法把历史或文学文献转化为数字档案或数据库，而仅就这一点而言，没有计算机技术的介入也是不可能的。苏珊·霍基（Susan Hockey）认为，运用量化方法进行风格和著者权的研究先于计算机而出现。早在1851年，奥古斯都·德·摩根（Augustus de Morgan）就建议用计量词汇的方法判断保罗书信的真实作者。到1963年，这项研究似乎有了结果，苏格兰神父安德鲁·莫顿（Andrew Morton）发文称，保罗书信的十三封信中只有四封出自保罗之手笔。19世纪末，T.C.门登哈尔（T. C. Mendenhall）也曾用一台计算器计算莎士比亚、马洛和培根信件中的词语，来判断究竟是谁写的莎士比亚戏剧（1901），最后结论是马洛。同样的方法也用于甄别美国联邦文献中12封作者身份不明的信（1964），研究者们基本上采用统计方法进行研究，结果证明麦迪逊是这12封信的作者，这个结论也被联邦政府所接受（1995;1996）。[3]（5）

实际上，词汇检索是数字人文领域的最强大工具之一，极其有利于计算思维（computationalthinking）的培养。何为计算思维？计算思维是将计算机编程和计算机科学的原理运用到“问题域”中来，被一致认为是未来几十年的关键技能，并将成为最有用的大学通识课之一。在没有自动化机器的情况下，词汇检索是靠手工完成的，如布萨及其团队使用卡片打孔的方法。莫莱蒂在《距离阅读》中也采用了类似的方法：他们在19世纪末的侦探故事中寻找线索，因为线索一般认为是侦探小说的最重要特征，结果在样本中发现线索的存在在那个时代的侦探小说中并不普遍。[4]在这两个例子中，承担检索和分类工作的人力实际上是在从事计算器或计算机的自动化工作，在这个过程中，所培养的是一种计算思维。这种计算思维是认知和思维的过程，能反映出抽象思维能力、分解思维能力、算法思维能力、评价思维能力和概括思维能力。

抽象思维能力是最基本的计算思维，比如用代码标记单词、段落、章节、标题和语义元素，使之利用自动布局规则打印或显示相同的存储数字文本，或用代码创建文本的抽象模型，以设置目录、计算字符的行数或同一个词的不同形式的使用次数。如用XLM（文件扩展名）对莎士比亚戏剧进行编码，是在对文本具有一般理论理解的基础上开发的工具和方法。这种编码和知识标识是数字人文的最重要组成部分。分解能力关乎计算素养。人文学者首先要对“问题域”进行定义，然后提出逐步逐层解决的方案。分解是一种有条理有逻辑的任务导向思维，具体而言，就是把“兴趣域”转化为明确的问题和解决问题的过程。而这个解决问题的过程就是“算法”，指在计算机编程过程中将分解、抽象和自动化结合在一起。比如研究者们用算法对乔叟的《坎特伯雷故事集》手稿的不同版本提出假设，然后绘制出丑角（Harlequin）出版社出版的爱情小说的常见特征。按照《不列颠百科全书》的定义，算法就是在有限的步骤中产生问题的答案或解决问题的方案。“计算思维是一套离散的方法和技能，是一种思维模式，可能会完全改变人们对知识和观点的思考方式。计算思维具有创造计算认识论的潜力。”[1]（74）

从人文计算到数字人文的过渡是理所当然的事。数字人文的一个定义就是将计算原理、过程和机制应用于人文学科各个领域。由于人文科学研究的对象是语言文本和图像，最终还是用语言或图像表示作为结果的知识，因此可以用计算机将其制成与原始文件一模一样的数字文件，其相较于纸质书本或胶片的优势有多种：容易保存、多次拷贝、发布和使用灵活。未来的人文学科教材以及教学过程均可采用这种数字化。但是，文本、图像、声音和影像并不是自然交织在一起的，必须建构一系列的模型。这些模型可以是词语、传真、数字照片，可以是作品的元数据，包括作者（性别、出身、家庭及教育背景等）、作品标题、出版年份、出版者、语种、媒体、展览历史等，也可以是声音，如录音、动态影像、动画、屏幕截图、视频、音频甚至游戏代码等。这就要求数字人文工作者必须学会设计，“一种利用文化、社会、经济和技术约束而进行的創造性实践”。[5]（12）数字人文的一个特点是跨学科、跨领域，因此需要有不同领域的团队合作，尤其是在数学和人文领域都训练有素、游刃有余的专家，这种结合有时被称作“大人文”，其未来发展将威胁到每一个从事独立研究的孤立学者。也就是说，“人文学是孤独天才的领地”这一传说将被打破，“未来的一部哲学著作、一项权威性历史研究、一份撼动学界思维范式的文学评论”将不会是某位孤独天才的成果，而是集体合作的产物，其做出贡献的“作者”可能有十几位：教授、专家、图书馆员、程序员、实习生、职员甚至社区成员等。[5]（52～53）鉴于此，“数字人文领域可能会出现无所不能的博学之人，他们会研究、写作、拍摄、编辑、编码、建模、设计、建立关系以及与用户对话，但是依然有专业化及合作的足够空间。”[5]（15）那么，这个专业化和合作的空间在哪里呢？

三、从数字人文到数字文学研究

人文学科的作品一旦可以从计算的视角来观照，那么只专注于人文问题而不诉诸于算法的孤立研究者就受到了威胁。这种威胁可能在目前还不算明显，但在未来的三年或五年至多十年中，数字人文必定大行其道，其发展速度是无法用保守的方法来预测的。西方的社交媒体只用了十年时间就改变了西方世界的日常媒体习惯，成为现代文化的重要组成部分，经济大权也因而转移到面书、谷歌、苹果、亚马逊等媒体新贵手中。[1]（64）鉴于此，独立的学者必须学会合作，走出原来的研究领域，跨入到数字人文领域中来。第一步是学习编程，确立一种底层思维，即建立（或至少学会使用现有的）数字化的研究数据库，继而是掌握计算思维所需要的必要技能，如自动化、抽象概念、分层建模、分解和算法，而所有这些最好通过某一种编程语言练习来掌握。这种技能不仅仅可用于数字人文研究，也是当代和未来时代人们日常生活所必备的，因为就本质而言，计算是一种环境，一种我们从未发现的但却久已置身于其中的环境。当旧的媒体转换成新的媒体，比如在手机取代了有线电话、快递取代了邮局、电子支付取代了纸币现付之当下，尤其是在PPT取代了粉笔板书的大学讲堂，文化本身已经转化为认知功能，而我们却仍然熟视无睹，顽固地坚守（比如有些人依旧用笔书写而不用笔记本、不用微信而只把智能手机当电话用），那就只能被呼啸而来的计算潮流所吞没。

那么，我们作为人文学者究竟该如何面对这一环境转变呢？人文学者在数字环境中并非没有用武之地，因为数字人文毕竟是由数字和人文两部分融合（不是相加）构成的。在计算的空间内，这两部分并不是可以分离开来的单一个体，而是相互作用的抽象和谐。计算思维作为一种思维模式虽然能改变人们对知识和观念的思考方式，但最终需要人文工作者从哲学层面来思考计算的局限性，进而通过数字環境的物质实践把文字的世界与数据化的世界连接起来，在二者所提供的创造性张力中，为知识和权力、民族命运、国家治理以及人文学科自身存在的价值，从反身性和人生哲学两个角度思考我们身处其中的文化，并以全新的态度走近文化。数字人文不再作为一个概念而存在，也不再是一个“支持性服务”的从属领域（机器翻译、创建索引、图书存储和检索等），而是作为一种“计算政治”（现今流行的统计和图表等方法正是产生于18世纪的“政治算法”）对人文学科乃至大学本身产生巨大影响。这种影响首先体现为高质量教学内容的设计与实施，各种教育手段的提供（如模块教育、大众教育和私人教育），各种非营利性的教育平台（如大型开放式网络课程MOOC），这些不仅构成了与大学课程的竞争，而且迫使大学做出积极反应，重新审视大学教育的功能和效用。大学教育需要考虑的问题是：大学除了能与政府联手为学习者提供文凭之外，是否能为学生提供更好、更多、更有用的知识、智慧和生存技能，以便在与技术和数字计算的竞争中求得生存？基于这一思考，很多大学已经开始“制订新的教学方案、开展新的研究项目、建设新的研究中心，发展新的学科建制”。[1]（18）

在这种情况下，传统的人文学科该如何接受“新文科”的挑战、进行改造？而在自然科学与人文社会科学之夹缝中生存的外语学科又该如何面对？从发展现状来看，外语的学习、教学和研究其实早已介入了数字人文的急遽发展之中。暂且抛却学和教不谈，在研究领域，与计算机科学融入最早且最广泛的领域是语言学（诉诸于计算机技术建立语料库、儿童语言认知研究、计算机理解自然语言等;反过来，语言学也在网络信息处理中扮演了重要角色，如文本分类、快速检索、信息抽取、信息过滤等）。其次是翻译领域，目前现存的翻译技术已经日新月异，如语料库翻译、机器翻译、机助翻译、网络翻译等。狭义上说，一切利用计算机技术把一种语言自动翻译成另一种语言的技术都可称为翻译技术;广义上说，在语言服务和跨语言文化活动中帮助解决和缓解障碍的信息技术也都是翻译技术。这些技术用途之广、普及之快、实用性之强，大有取代一切技能型的语言和翻译教学的趋势。仅就口译而言，华为手机MTJHE6自带软件“AI字幕”已经能够自动处理比较复杂的口译，准确率至少在85%以上。即使被视为当前翻译研究热点的“译者惯习”，即从译者习惯的角度考察译者行为和译本面貌，也可以通过文本分类和词语检索的方式抽取一切必要的信息。在文学领域，1949年就开始的布萨的阿奎那词语检索、2013年莫莱蒂总结的“距离阅读”（具体实验工作从1994年就开始了）及其对《坎特伯雷故事集》的分解算法，还都只是初步的数字人文实验。从事文学史、文学理论、文学批评和比较文学等研究的学者们目前依然心存侥幸，认为计算技术对于文学研究所能做到的也不外乎其对语言和翻译所能做的，即检索、分类、储存、文献整合和索引等，这些都能轻而易举地应用于文体学和修辞学研究，而对于涉及情感和思想因素的研究则无能为力。这种看法比较普遍，但也许是文学在未来广泛普及的数字人文中所能坚守的最后一片高地，而最终能坚守多久，实在难以预测。为什么呢？因为文学是一种语言艺术，其大部分构成是以文字为媒介的。文字自发明以来经历了“手写时代”和“印刷时代”，现已大踏步进入了“数字时代”，文学也随之进入了一个大变革时期，因此，我们也必须根据文学的现实来思考问题。那么，文学所面对的又是一个怎样变革的现实呢？

四、从算法批评到“距离阅读”

文学的第一个现实就是电子文学的出现。电子文学（electronic literature）不同于纸质文学（print literature），因此透过纸质文学的有色镜片看待电子文学毫无意义可言。一般认为，电子文学不包括已经被数字化的纸质文学，而是指产生于数字技术的文学，也即创作于计算机并于计算机上阅读的文学，其宗旨是促进网络媒介中文学的写作、发表与阅读。自上个世纪90年代中期“故事空间（Storyspace）”开始发表超文本虚构小说（hypertext fiction）①以来，在之后的二十多年里接连出现了网络小说（network fiction）②、交互小说（interactive fiction）③、定位小说（locative fiction）①、零件装置（installation pieces）②、“代码作品”（“codework”）③、生成艺术（generative art）④和闪诗（Flash poem）⑤等各种网络文学形式，足见这一新生领域的创造性和多样性，数字文学所采取的审美策略的复杂性，以及这种文学自身极高的完全可以与纸质文学相媲美的文学性。这意味着文学批评者必须以对待纸质文学的热情和专注对待网络文学，但却要求采用新的分析、教学、阐释甚或游戏模式。最重要的是采取“数字思维”方式，在依靠纸质文学及其批评的丰富传统的同时注意到网络文学和程序媒介的特殊性。[6]（212）

由此而涉及到文学在当下所面对的第二个现实，即文学批评。从事网络文学批评的批评者都试图在传统模式与网络数字之间搭建桥梁：一方面是理解语言、生成意义以及与文本的互动;另一方面是认识新媒体和数字技术的特殊性和重要性。这种批评实践首推马修·柯申鲍姆的《机制：新媒体与取证想象》（2012）。他认为有必要对电子物件进行详细检验，细致到磁盘基片（disk substrate）的位模式（bit patterns）的微观影像。他认为数字媒介的物质性包括两方面：取证物质性（forensic materiality）和形式物质性（formal materiality）。取证物质性建基于硬件的物理属性，即计算机是如何书写和阅读位模式的;而形式物质性则包括用户从一个软件移向另一个软件时产生的程序摩擦或可见差异。⑥这种摩擦或可见差异就仿佛指纹一样能把读者带到“犯罪”现场，带到19世纪侦探小说（如福尔摩斯）所见证的网络话语的现代性，正如格林布拉特在《莎士比亚谈判》的开头所说：“我想要与死者说话，……即便我所能听到的只是我自己的声音，但我自己的声音就是死者的声音，因为死者巧妙地留下了他们自己的文本踪迹，而这些踪迹在生者的声音中让人们听到。”[7]（1）这意味着死者的声音就储存在当下，而储存（storage）就是创造一个系统化空间，过去便通过现在的物体或遗物或铭文恢复过来，这就是柯申鲍姆所说的取证想象：“一旦过程消失而成为产品，取证想象便最明显地启动，即时空的一种挤塑（extrusion），其新的地图和时间表留下了冰槽，像地质层一样隐现出来。”[8]（253）取证想象是新媒介的一种形态，是对储存、铭文、工具、展品等的联合管理，能从看似毫无意义的实验数据中创立不可能最直接经验的复杂现实。“它开采或侵入的恰恰是文本介入的场所，试图找寻其介入时走过的路线和地方，将其作为意义、归属和意图的介体。”[9]（252）这种机制恰恰是新媒体时代所需要的，尤其是在新媒体正被积极地投入档案和博物馆之时，它能帮助我们寻回程序和变量、条件程序分支、函數调用和物体图书馆。“柯申鲍姆在《机制》中开创了一种方法，即有效地用脚本单元（此处指纸页上的文字）将深度纸质阅读策略与文本单元（此处指生成屏幕可视表面的代码）连接起来，于是开创了一种批评模式，既承认网络和编程媒介的特殊性，同时又没有放弃与纸质文学一起并通过纸质文学产生的阐释策略。”[9]（209）

在数字人文研究中，柯申鲍姆等人所开创的批评方法可统称为“算法批评”（algorithmiccriticism），也就是自布萨以来就以其对文本的改造、拆解和重组而被称为“文本分析”（text analysis）的方法。在文学批评中，传统的文本分析，即兴盛于20世纪四五十年代的新批评派的“细读”，注重文本内部的多层次结构，将文学作品视为一个自给自足而与外部世界几乎毫不相关的世界，因而留下了许多批评盲点。到了20世纪后半叶，结构主义和后结构主义诸批评方法一方面抛弃新批评而转向一种主观批评，即不顾作者意图和语言本体意义，而把读者自己“读进”对作品的阅读之中的批评，于是，文学批评阐释就完全成为了批评者主观参与的结果;另一方面，有些批评家显然依据各种实证主义哲学，着力寻找纯粹的经验事实，把已经证实的但仍有可能证伪的事实堆积作为阐释判断的基础（包括“大量未读的”数据）。这些立足文本、读者和经验事实的阅读都是拘泥于固定“范式”或“视角”的阅读，不能帮助读者或批评者展开多种阐释的可能性，更难以介入“世界文学”的宏大建构。于是，当数字技术于20世纪末21世纪初在人文领域站稳脚跟之后，文学批评也开始诉诸数字，出现了用网络分析代替文本分析、用“距离阅读”补充“细读”、用可视化图表分析代替观念阐释的“算法批评”。按迄今国内现有的相关评介，其代表人物是弗朗哥·莫莱蒂。

莫莱蒂的确对数字人文在21世纪的蓬勃发展起到了推波助澜的作用，在文学批评领域则尤甚。然而，莫莱蒂首先是一位比较研究学者，是从世界文学的宏观视野出发，试图用最多样和最大胆的方法，尽最大的集体努力，把握最好的机会，迎接最大的挑战，为文学史创造一个前所未有的空间，进而为十年后的文学研究尤其是新文学史的撰写铺垫道路。[10]（207～227）总而言之，莫莱蒂的所谓“距离阅读”并不是与“细读”相对立的“远读”（close reading与distant reading中的close和distant本来就不是反义词），其distance指的是“距离”，而就距离而言，也有远有近，因而也不单纯是细心的学者所说的“远距离阅读”。莫莱蒂本人把“距离”看作是知识获取的一个条件：阅读的距离可以小于文本，比如对小说中自由间接文体的研究;也可以大于文本，比如对1700年至1800年间英国小说标题的量化研究。文本本身或许就在这“大”与“小”之间消失了。这是为理论所付出的代价：现实是丰富的，概念是抽象的。从无限丰富的现实中抽象出少有的概念，这就是“少即多”的意思。数字人文中的“算法分析”恰恰是要从无限丰富的文本数据中抽象出一个概念，一个未知领域，这是传统文学批评诸方法所不能到达的一个历史空间。[11]（54～68）按照莫莱蒂的“猜想”，这或许可以通过牺牲大量细节而采用“算法”或大数据或视觉化的网络视图来获取，而一旦有所收获，那对文学史来说就是大贡献，因此也具有“小即大”的意味。然而，无论是柯南·道尔侦探小说中的“线索进化树”，还是哈姆雷特的空间和人物关系网，甚至《红楼梦》中人物的对白关系视觉化，虽然拥有更多信息维度，能使人对情节结构产生直观认识，同时也能观察到一些新现象，但这些仅限于与文学史相关的因素，就文学艺术之内在的文学性和艺术性而言，路途还很遥远。用莫莱蒂自己的经验之谈，那就是文学的数字研究需要有数学的智慧。

莫莱蒂的经验（抑或是教训）的确很重要，但却也为文学研究者留下了最后坚持的借口，这并不是说数字人文或文学的“算法分析”就因此而与我们保持了“远距离”，而是要求文学研究者尤其是从事世界文学研究的比较学者，必须学习和掌握数字算法和数学的智慧，并将其应用到数字文学的研究中来。从前述信息时代文学的发展来看，创作上，电子文学方兴未艾;批评上，算法批评（实验）仍在继续;理论上，各种范式和视角已是强弩之末。就计算机技术和AI技术的发展来看，未来文学批评面对的客体只有两种：一种是直接创作于计算机的电子文学;另一种是被录入计算机而被储存归档的数码-纸质文学。如果假以时日，甚至图书馆和博物馆也完全能够变成掌上电脑。这意味着，一切阅读，无论是电子文学的阅读还是纸质文学的阅读，都必须遵循时代发展的规律，跟上时代发展的步伐，因为“写作”就是遵循不同时代的规律和不同社会的发展完成的。如此，写作就是一种管理时空距离的技术，因此必然导致不同程度的成功和失败;而文学则是一种语言的艺术，它只强化语言和写作所选中的方面，以创造生成意义的模式（patterns，计算技术中的表达式），而就文学的时空观照而言，距离（distance）是文学的潜在物质，就如同节奏之于韵律学。[12]（3）

这个如此重要的“距离”是文化的产物，就仿佛在文化发展中，腐朽的东西总是新的意义得以产生的温床。于是，我们可以在这个意义上理解已经作为腐朽之物而被抛弃的新批评的closereading，不是解作“细读”，并将其视作极端偏颇的方法而取代之;而是开始于“细读”、转而成为不断接近于目标的“距离阅读”（distant reading）。我们在自己与作品之间、在作品自身与其背后的目标之间设定一段距离。我们在这段距离中行走，途经不同读者、不同读解、不同发表、不同接受的场所，它们承载着反应、记忆、应用和期待。这个距离产生于文化空间，渗透着教育机制和文化资本的经济;它产生于公共空间，规定着制度性科学和政治运动所要求的合法的知识获取;它产生于社会空间，描绘着一幅幅特殊的表示不同气候变化的地图。我们在这段距离中会遇到越来越多的读者：“与性歧视者、厌恶女人者和种族主义者一拍即合的读者;能孤立出一个命题并思考其与普通语言之逻辑关系的读者;惯于迅速同化作为精要总结之信息等级的冗长管理文献的读者;经受过文学阐释之复杂训练的读者;或是专业科学和技术语言的用户。” [12]（4）或许，随着时空距离的加长，新的读者也会不断加入这个行列，除了当下蜂拥而至的那些“专业科学和技术语言的用户”外，或许不久的将来就会拥挤着从事不同人文领域研究的数字人文工作者，他们代表着当下的文化、当下的技术，因此也必然左右着未来的阅读方向，规定着我们与文本之间的距离。

远见卓识的文本能够在现在证明它是过去所期待的未来，而迟钝的读者或批评者只是回顾过去的文本以期在未来理解它。真正的“距离阅读”应该是“在路上”的阅读，它只代表文本旅行的一个时刻，无数种阐释中的一种，一个非身份（non-identity）的时间维度，甚或是供数字“取证”的一次储存。“距离”的概念指的是文本在被阅读的旅行中接受的语言形式的改造，出于不同地点强调的政治需要而进行的不同读解的积累，同时也记录着文化社会交流中内嵌于相互协商之中的文本主体间性的形成。我们永远在路上。我们永远处于接近目标的距离之中。我们永远都在为过去的文本储存它所期待的未来发展的数据。或许，在数字人文迅速发展的今天，在已经渗透到日常生活之方方面面的数字文化中，我们正在与我们身处其中但又未曾清醒面对的技术和技术统治斡旋协商，但尚不知能否用过去的文本证明它所期待的未来。

参考文献：

[1] [英]大卫·M·贝里、[挪]安德森·费格约德：《数字人文：数字时代的知识与批判》，王晓光译，大连：东北财经大学出版社，2019年。

[2] [丹]荷尔·波茨坦：《“数字”太多，“人文”太少？试析很多人文学者不愿转向数字人文的原因》，杨铮译，孟建主编：《数字人文研究》，上海：复旦大学出版社，2020年。

[3] Susan Hockey.“The History of HumanitiesComputing”， A Companion to Digital Humanities， Editedby Susan Schreibman， Ray Siemens， John Unsworth，London： Blackwell Publishing Ltd， 2004.

[4] Franco Moretti. Distant Reading，London andNew York： Verso， 2013.

[5] [美]安妮·伯迪克等：《数字人文：改变知识创新与分享的游戏规则》，马林青、韩若画译，北京：中国人民大学出版社，2018年。

[6] N. Catherine Hayles. Electronic literature：What is it？ In doing digital humanities： practice，training， research， eds： Constance Crompton， RichardJ. Lane， Yay Siemens， London and New York：Routledge， 2016.

[7] Stephan Greenblatt. ShakespeareanNegotiations： The Circulation of Social Energy inRenaissance England， Berkeley： University ofCalifornia Press， 1988.

[8] Matthew G. Kirschenbaum. Mechanisms：New Media and the Forensic Imagination， London andCambridge： The MIT Press， 2012.

[9] Constance Crompton， Richard J. Lane， RaySiemens（eds）. In doing digital humanities： practice，training， research， London and New York： Routledge，2012.

[10] Franco Moretti. The Slaughterhouse ofLiterature. in Modern Language Quarterly， 2000， 61（1）.

[11] Franco Moretti. Conjectures on WorldLiterature.New Left Review，2000，1（4）.

[12] Peter Middleton. Distant Reading：Performance， Readership， and Consumption inContemporary Poetry. Tuscaloosa： The University ofAlabama Press， 2005.

[責任编辑张克军]